OpenAI 推出三款实时语音模型 可边听边“思考”、翻译和转录
8 小时前

2026年5月8日,OpenAI发布三款实时语音模型,分别用于推理对话、实时翻译和实时转录,为开发者解锁新一代语音应用形态。GPT-Realtime-2具备GPT-5级推理能力,支持复杂请求处理;GPT-实时翻译支持70多种输入语言和13种输出语言;GPT-Realtime-Whisper实现低延迟语音转文本。