OpenAI发布三款实时语音模型,全面升级语音交互体验
2 小时前

2026年5月8日,OpenAI发布三款实时语音模型GPT-Realtime-2、GPT-Realtime-Translate和GPT-Realtime-Whisper,集成于Realtime API。GPT-Realtime-2具备GPT-5级推理能力,支持打断处理与工具调用;GPT-Realtime-Translate支持70种语言输入转13种输出,同步翻译;GPT-Realtime-Whisper实现低延迟流式转录。三者分别按Token或分钟计费。