2026年5月8日,OpenAI发布三款实时语音模型,分别用于推理对话、实时翻译和实时转录,为开发者解锁新一代语音应用形态。GPT-Realtime-2具备GPT-5级推理能力,支持复杂请求处理;GPT-实时翻译支持70多种输入语言和13种输出语言;GPT-Realtime-Whisper实现低延迟语音转文本。