Apple与特拉维夫大学提出新型语音生成加速技术PCG - AI

Just Quick Just Quality

热门话题

白天

搜索

资讯

Apple与特拉维夫大学提出新型语音生成加速技术PCG

12 小时前

据9TO5GOOGLE报道，苹果与特拉维夫大学研究人员联合提出“原则性粗粒度”（PCG）方法，可显著提升自回归文本到语音（TTS）模型的生成速度。该技术将声学相似的语音令牌归为同一组，在解码阶段放宽严格匹配限制，提高推测性解码的接受率。实验表明，PCG在不重新训练模型的前提下，将语音生成速度提升约40%，同时保持低词错率、高说话人相似度及4.09分的自然度评分。该方案仅需额外37MB内存存储声学分组信息，适用于资源受限设备，有望为未来Apple平台的实时语音功能提供高效、高质量的技术支撑。

上一篇：中国移动旗下基金、北京人工智能产投基金等入股因时机器人公司

下一篇：浙江省：拟统筹规划全省算力资源，构建多层次算力服务体系

返回列表

热文阅读

2 天前

百度不想“掉队”：5亿红包“撞车”腾讯AI社交

2 天前

moltbook爆火背后：人类操控？伪造截图？Karpathy发风险提醒

2 天前

元宝带派，腾讯抢滩

2 天前

AI 社交元年：Moltbook 背后的机机交互革命与行业新机遇