VoxCPM 1.5 正式开源,语音生成能力全面升级
1 天前

2025年12月10日,面壁智能宣布VoxCPM 1.5版本正式上线并开源。该版本在音频质量、生成效率及稳定性上显著提升:AudioVAE采样率从16kHz提升至44.1kHz,实现高保真音频克隆;生成效率翻倍,仅需6.25个token即可生成1秒音频;新增LoRA及全量微调脚本,支持深度定制;同时优化长文本生成稳定性,减少音频伪影。模型已在GitHub与Hugging Face平台开源。