上海创智学院刘飞团队与Sand.ai合作开源国内首个“懂人”音视频联合生成模型 - AI

Just Quick Just Quality

热门话题

白天

搜索

资讯

上海创智学院刘飞团队与Sand.ai合作开源国内首个“懂人”音视频联合生成模型

17 小时前

2026年3月24日，上海创智学院刘鹏飞团队与Sand.ai联合宣布，正式开源全球首个号称最“懂人”的音视频联合生成基座模型——daVinci-MagiHuman。该模型采用150亿参数的单流Transformer架构，通过纯自注意力机制实现文本、视频、音频的联合建模，摒弃跨注意力与模态分支，解决了音视频不同步、架构设计复杂及生成速度慢的难题。模型支持多语言音视频生成，在消费级GPU上可实现近实时生成，已在GitHub与Hugging Face平台开源全部模型权重与推理代码。

上一篇：OpenAI推出ChatGPT“Library”功能，实现文件云端持久化存储

下一篇：苹果宣布WWDC26将于6月8日线上线下同步举行

返回列表

热文阅读

2 天前

刚刚，马斯克晶圆厂，正式发布

2 天前

又一笔记本厂商 Ninkear 陷入 CPU 虚标争议，官方承诺调查

1 天前

OpenAI又摊上事了，大英百科状告ChatGPT：查资料也算侵权

1 天前

撕开英伟达的算力围城