豆包音频生成模型 1. 0 发布，开启「音频导演」时代 - AI

Just Quick Just Quality

热门话题

白天

搜索

资讯

豆包音频生成模型 1. 0 发布，开启「音频导演」时代

5 小时前

豆包音频生成模型1.0正式发布，该模型拥有两大核心技术：多模态参考生成与长时音色一致性。用户只需输入包含角色台词、情绪语气、背景音乐及环境氛围的提示词，即可直接生成完整音频。在长音频创作中，该模型能稳定保持角色声音特性。此外，它还具备0样本多模态音频创造能力，支持文本描述或参考音频输入，无需额外训练就能生成高质量目标音频，实现音色与风格的深度解耦及一声多角演绎，有效降低了专业音频制作的门槛。

上一篇：智谱涨幅扩大至 13% 总市值重回 1 万亿港元

下一篇：美方官员：Anthropic 旗下 Mythos 模型发现美国涉密政府系统漏洞

返回列表

热文阅读

2 天前

长江存储市占率突破13%！韩国大厂发出警告：中国追兵杀到了

2 天前

马斯克又盯上AI基建：特斯拉要卖“算力积木”了

1 天前

车企营销不能再“乱吹”了，自动驾驶国标出台，明年7月实施

2 天前

美国新提案：「国有化」AI巨头，「全民持股」50%