6月9日,谷歌发布Gemini 3.5 Live Translate实时语音互译模型,该模型支持70多种语言的自动识别与翻译,能生成流畅自然的语音输出,并保留说话者的语调、语速和音高。该模型采用动态处理机制,平衡翻译质量与实时性,延迟控制在数秒内。开发者可通过Gemini Live API和Google AI Studio接入公开预览版,企业用户可在Google Meet平台体验私有预览服务,普通消费者则能直接在Android/iOS版谷歌翻译应用中使用。此外,Android设备还推出“聆听模式”,用户无需耳机即可通过手机听筒私密收听翻译内容。
