Kyutai发布Pocket TTS：轻量级高保真语音合成模型 - AI

Just Quick Just Quality

热门话题

白天

搜索

资讯

Kyutai发布Pocket TTS：轻量级高保真语音合成模型

4 天前

AI初创公司Kyutai推出Pocket TTS模型，仅1亿参数，支持语音克隆。用户提供5秒音频样本，即可复现目标声音的音色、情感等。该模型可在普通笔记本CPU上实时运行，采用连续隐变量架构，结合Lagrangian自蒸馏等技术，在Word Error Rate和音频质量上优于多个大参数竞品，且是唯一能在CPU上实现超实时生成的高质量TTS系统。Pocket TTS已开源，采用MIT许可证，训练数据全部来自公开英文语料，总计88000小时。

上一篇：蚂蚁数科与杭州具身智能中试基地达成合作意向推动具身智能商业化落地

下一篇：ElevenLabs发布Scribe v2 Realtime，实现超低延迟语音转写

返回列表

热文阅读

2 天前

福特中国回应“正与比亚迪进行洽谈”传闻：在很多业务领域都与不同公司有会谈

2 天前

红魔 11 Air 手机官宣搭载骁龙 8 至尊版处理器，独家内置 PC 模拟器

2 天前

荣耀 Magic V Flip2 等机型开启 MagicOS 10 内测招募

2 天前

那个集齐所有风口的男人，要建晶圆厂