阿里发布两款语音新模型，可定制角色及模拟背景音 - AI

Just Quick Just Quality

热门话题

白天

搜索

资讯

阿里发布两款语音新模型，可定制角色及模拟背景音

7 小时前

阿里推出了两款语音新模型：Fun - CosyVoice3.5和Fun - AudioGen - VD。前者是基于参考音频的声音克隆模型，后者是无参考音频的音色设计模型。两款模型都具备“指令遵循”能力，可应用于多种场景。Fun - CosyVoice3.5在Seed - TTS基准测试的中文“困难案例”指标上表现出色，降低了生僻字句的错误率，并支持自由风格模式指令控制，解决了传统克隆模型的痛点。Fun - AudioGen - VD则专注于“从无到有”的音色设计，能够定制音色和情感，并模拟复杂的听觉环境。编辑杨娟娟，校对陈荻雁。

上一篇：中国电信入股AI公司面壁智能

下一篇：AI.com卖7000万美元天价：10岁时偷刷妈妈信用卡入手 32年暴涨70万倍

返回列表

热文阅读

2 天前

刚刚，OpenAI狂揽7500亿元，英伟达、亚马逊、软银抢投

2 天前

【头条】深夜突发!AI巨头完成融资7500亿!英伟达等领投；全场景覆盖+高端突破,解码思特威车载CIS增长逻辑；台积电最大客户变动

2 天前

手握百亿现金的月之暗面，悄悄在C端赚了两个亿？

2 天前

消息称 OpenAI 将导入英伟达基于 Groq 技术的 AI 推理芯片