苹果公布 PCG 技术:质量零妥协、AI 语音生成提速 40%
20 小时前

苹果公司与特拉维夫大学联合发表研究论文,提出“原则性粗粒度”(PCG)语音生成新方法,以解决AI文本转语音(TTS)技术的速度瓶颈。当前行业主流的自回归模型采用逐个预测方式,因验证标准严苛导致生成速度受限。PCG技术通过建立声学相似组,将单点验证升级为范围验证,并引入投机解码策略,构建双模型协作架构,实现了效率与准确性的平衡。应用PCG技术后,语音生成速度提升约40%,且未牺牲音频质量,在极限压力测试中表现稳定。PCG属于推理阶段优化方案,无需重新训练现有模型,仅需约37MB额外内存存储声学相似组。