阿里通义千问发布原生全模态大模型Qwen3-Omni
4 天前

2025年9月26日,阿里通义千问正式发布原生全模态大模型Qwen3-Omni。该模型预训练全模态不降智,在36项音频及音视频基准测试中,斩获32项开源SOTA与22项总体SOTA,性能超越Gemini-2.5-Pro等闭源强模型。Qwen3-Omni采用Thinker-Talker架构,支持119种语言文本交互、19种语言语音理解及10种语言语音生成,纯音频对话延迟低至211ms,视频对话延迟低至507ms,并能理解长达30分钟的音频内容。