面壁智能发布语音生成基座“小钢炮”模型 VoxCPM：0.5B 参数号称媲美真人 - AI

Just Quick Just Quality

热门话题

白天

搜索

资讯

面壁智能发布语音生成基座“小钢炮”模型 VoxCPM：0.5B 参数号称媲美真人

2025-09-18 / 阅读约2分钟

来源：IT之家

面壁智能推出0.5B参数语音生成基座模型VoxCPM，与清华大学联合研发，在自然度、音色相似度及韵律表现力方面达SOTA水平，已在GitHub等平台开源。

感谢IT之家网友地板轰鸣的线索投递！

IT之家 9 月 18 日消息，今天下午，面壁智能宣布“小钢炮”系列迎新：推出 0.5B 参数尺寸的语音生成基座模型 VoxCPM。

该模型由面壁智能与清华大学深圳国际研究生院人机语音交互实验室（THUHCSI）联合研发。官方表示，VoxCPM 在合成语音的自然度、音色相似度及韵律表现力方面均达到了 SOTA 水平。目前，VoxCPM 已在 GitHub、Hugging Face 等平台开源。

根据介绍，在词错率方面，VoxCPM 在 Seed-TTS-EVAL 正常样本下达到极低水平，在困难样本上也取得不错表现。在音色相似度方面，尤其在 Zero-shot 音色克隆任务中，VoxCPM 同样展示出顶尖性能。

面壁智能表示，VoxCPM 无论是文本理解和表达、极少样本的声音复刻、公式及符号音频输出等能力，都展现了出色效果。实际听感上，VoxCPM 生成的语音号称在情绪、音色、口音、停顿、韵律等方面表现“与真人无异”。

VoxCPM 可根据对文本内容的超强理解，自主选择合适的声音、腔调、韵律风格生成音频，带来“声”临其境的听觉体验。

IT之家附模型有关链接如下：

Github：https://github.com/OpenBMB/VoxCPM/
Hugging Face：https://huggingface.co/openbmb/VoxCPM-0.5B
ModelScope：https://modelscope.cn/models/OpenBMB/VoxCPM-0.5B
PlayGround 体验：https://huggingface.co/spaces/OpenBMB/VoxCPM-Demo
音频样例页面地址：https://openbmb.github.io/VoxCPM-demopage

上一篇：以开创的超节点互联技术，引领AI基础设施新范式

下一篇：华为徐直军：Atlas 950超节点算力超越英伟达

返回列表

热文阅读

1 天前

长江存储市占率突破13%！韩国大厂发出警告：中国追兵杀到了

2 天前

强化学习之父Sutton联手毁灭战士之父Carmack：让机器人进入真实世界打游戏

2 天前

马斯克：Grok 语音控制特斯拉 FSD 功能将在 3 个月左右推出

2 天前

9600亿AI独角兽，又要融资了

2 天前

具身赛道现状素描：脑子灵，模型好，不是百亿，就是独角

2 天前

OpenAI“最开放”一次，Codex不再独宠GPT

2 天前

接连两位大咖出走，谷歌到底出了什么BUG？

2 天前

“现在的油车，就是当年的马车”

2 天前

卖掉公司，50位员工实现财富自由

2 天前

特斯拉 Cybercab 原型车现身新西兰，疑将开展冬季耐寒测试

上一篇：以开创的超节点互联技术，引领AI基础设施新范式

下一篇：华为徐直军：Atlas 950超节点算力超越英伟达

Just Quick Just Quality

发现

资讯话题

热门话题

7 x 24跟踪全球科技动态

快讯

资讯

视频

关于我们