小米近日正式发布了MiMo-V2.5语音模型,该模型包含MiMo-V2.5-TTS系列与MiMo-V2.5-ASR等组件。其中,MiMo-V2.5-TTS-VoiceClone功能尤为突出,它具备强大的音色克隆能力。用户只需提供数秒的参考音频,无需进行额外的训练或微调,就能轻松复刻真人播客、配音演员、品牌代言人或用户本人的声音。目前,MiMo-V2.5-TTS、MiMo-V2.5-TTS-VoiceDesign以及MiMo-V2.5-TTS-VoiceClone已在Xiaomi MiMo API开放平台上限时免费开放。
