IT之家 12 月 2 日消息,今日,千问 App 官宣正式上线国内最强视频生成模型通义万相 Wan2.5 和全球最强开源模型 Qwen-Image 的独家满血特供版,用户们可在新升级的千问 App 中抢先免费体验。
IT之家附官方介绍如下:
通义万相 Wan2.5:是目前业界少数具备音画同步能力的视频模型之一,能生成和画面匹配的人声、音效和音乐 BGM。该模型首次采用原生多模态架构,只需一张照片和一段文字,无需模板,即可生成一段肢体动作自然、口型匹配准确的 1080P 高清唱跳视频,最长支持 10S。测试显示,无论是真人照片、萌宠、二次元角色,还是文物、卡通形象,千问 App 都支持。
Qwen-Image:该模型在图像编辑中维持了更高的一致性,并在多视角转换、多图像融合、多模态推理等方面取得突破进展。此次在千问 App 内上线的 Qwen-Image 新模型,可精准编辑、修改图片中的文字。支持双图“拼贴”与“融合”、基于参考图进行编辑。生成亚洲人像更真实,中文更稳定,海报设计达商用级别。

