2月25日,阿里云宣布其视觉生成基座模型万相2.1(Wan)已开源,采用Apache2.0协议。此次开源包括14B和1.3B两个参数规格的全部推理代码和权重,支持文字生成视频和图片生成视频任务。全球开发者可在Github、HuggingFace和魔搭社区下载体验。14B版本在指令遵循、复杂运动生成等方面表现突出,在Vbench评测中居榜首。1.3B版本则适用于二次模型开发和学术研究,仅需8.2GB显存即可生成480P视频。