阿里巴巴今晚将开源其先进的视频生成模型万相2.1。该模型通过自研的高效VAE与DiT架构,显著增强了时空上下文建模能力,支持无限长1080P视频的高效编解码。万相2.1突破了AI视频模型中的文字生成瓶颈,成为全球首个支持中英文文字视频生成的模型,并提供一键艺术字生成及多种视频特效选项。此外,该模型在VBench视频生成领域权威评测榜单中以总分84.7%的成绩登上榜首。