当地时间4月17日,xAI宣布正式推出Grok平台的语音转文本(STT)和文本转语音(TTS)API,并向开发者开放。此举旨在提供高保真、低延迟的语音交互服务,支持更自然的语音对话体验。新增的API覆盖了语音交互的关键环节,开发者可借此搭建相关功能,并与现有的文本对话能力结合,形成端到端的语音对话流程。此前,xAI已提供Grok相关API,此次新增的语音能力进一步扩展了Grok平台在多模态交互领域的应用。不过,xAI尚未公布STT与TTS API的具体计费标准、可用语种及模型版本覆盖范围。