阶跃发布StepAudio 2.5 TTS语音生成模型:支持零样本复刻音色
9 小时前 / 阅读约1分钟
来源:凤凰网
阶跃4月16日推出新一代语音生成模型StepAudio 2.5 TTS,具备全局语境控制、文中语境控制、零样本复刻与全音色控制能力,适用于角色配音、有声内容创作及智能语音交互等场景。

凤凰网科技讯 4月16日,阶跃正式推出新一代语音生成模型StepAudio 2.5 TTS。该模型围绕全局语境控制、文中语境控制、零样本复刻与全音色控制三项核心能力,让语音合成更自然、灵活且富有表现力。

全局语境控制支持自定义整段语音的情绪基调、角色状态与场景氛围;文中语境控制可精细调节语气、节奏、停顿、轻重变化及角色感;零样本复刻与全音色控制则在保留目标音色的同时,灵活调整情感、风格与表达方式。用户仅需“说出需求”即可轻松调控,上手门槛大幅降低。

阶跃表示,StepAudio 2.5 TTS适用于角色配音、有声内容创作及智能语音交互等场景,目前已全量上线“阶跃星辰开放平台”和Step Plan。