人人都能是配音导演，阶跃星辰发布语音生成模型 StepAudio 2.5 TTS - AI

Just Quick Just Quality

热门话题

白天

搜索

资讯

人人都能是配音导演，阶跃星辰发布语音生成模型 StepAudio 2.5 TTS

2026-04-16 / 阅读约2分钟

来源：IT之家

阶跃星辰发布新一代语音生成模型StepAudio 2.5 TTS，首次将语境理解能力引入语音生成全流程，支持全局语境与文中语境双档控制，实现零样本音色复刻。

IT之家 4 月 16 日消息，阶跃星辰今日发布新一代语音生成模型 StepAudio 2.5 TTS，官方号称人人都能是配音导演。

阶跃星辰官方表示，该语音合成模型首次将语境理解能力引入语音生成全流程。通过 Global Context（全局语境）+ Inline Context（文中语境）双档控制，搭配 Zero-shot 音色复刻，让 AI 不是念文本，而是演文本。

StepAudio 2.5 TTS 支持以下核心能力：

全局语境控制：支持自定义整段语音的情绪基调、角色状态与场景氛围，使表达更统一、更连贯。

文中语境控制：不仅能控制一句话怎么说，还能进一步调节语气、节奏、停顿、轻重变化、角色感和场景感，让声音表达更有分寸。

零样本复刻与全音色控制：在保留目标音色特征的同时，支持对情感、风格和表达方式进行灵活调节，让同一种声音说出更多不同感觉。

IT之家附官方演示网址如下：

https://stepaudiollm.github.io/step-audio-2.5-tts/zh.html

上一篇：中国团队EvoMap指控硅谷明星AI项目抄袭，Hermes Agent两度否认

下一篇：美格智能拟投3亿元建AI研发及先进制造基地布局高算力模组与SIP封装

返回列表

热文阅读

2 天前

超前点映AMD Advancing AI 2026：AMD AI YES？

2 天前

Agent 赛马结束，超级工作台上位

2 天前

AI圈今天最大的瓜：GPT-6越狱攻击，被GLM 5.2揪出了

2 天前

头部自主品牌大幅下滑，德日系5年在华少卖500万辆

2 天前

消息称 OPPO、vivo 拒绝三星电子 2026Q3 存储报价

2 天前

我们让 Kimi K3、Qwen 3.8-Max 和 GLM 5.2 共同接管了一座屎山

2 天前

凯文·凯利WAIC演讲：未来5年，盯紧这3个赛道

1 天前

Claude Agent突然大更新，狂塞500个技能，网友直呼疯狂

2 天前

百度转板双重主要上市：一次“身份迭代”背后的资本与产业账

2 天前

英伟达公开 Rubin GPU 细节：3360 亿晶体管，智能体 AI 性能较 Blackwell 提升 10 倍

上一篇：中国团队EvoMap指控硅谷明星AI项目抄袭，Hermes Agent两度否认

下一篇：美格智能拟投3亿元建AI研发及先进制造基地布局高算力模组与SIP封装

Just Quick Just Quality

发现

资讯话题

热门话题

7 x 24跟踪全球科技动态

快讯

资讯

视频

关于我们