通义发布并开源支持影视级多场景配音的多模态大模型Fun-CineForge - AI

Just Quick Just Quality

热门话题

白天

搜索

资讯

通义发布并开源支持影视级多场景配音的多模态大模型Fun-CineForge

1 天前

2026年3月16日，通义实验室宣布发布并开源首个支持影视级多场景配音的多模态大模型Fun-CineForge，同时开放高质量数据集的构建方法。该模型通过“数据+模型”的一体化设计，旨在解决影视级AI配音面临的四大难题：口型同步、情绪表达、音色一致性和时间对齐。Fun-CineForge首次引入“时间模态”，结合视觉、文本和音频信息，实现了复杂场景下的精准配音，尤其在双人及多人对话场景中表现突出。目前，该模型已开源，支持30秒以内视频片段的中英文配音，开发者可在GitHub、HuggingFace和ModelScope平台体验。

上一篇：企业微信集成OpenClaw升级，推出扫码接入与文档自动化功能

下一篇：广东：到2028年将广东打造成为全国领先的人工智能OPC发展高地

返回列表

热文阅读

2 天前

被315点名的万亿隐秘生意：“污染”DeepSeek

2 天前

纽约时报：硅谷巨头淡化风险中东布局AI，如今成伊朗攻击目标

15 小时前

ASI决赛圈如今只剩三巨头，加速逃逸已启动，Meta与xAI命悬一线

2 天前

ISLE 2026成功引领智慧显示与系统集成新趋势