阿里通义发布“地表最强”模型Qwen3-Max:性能超GPT-5 数学推理直接满分
6 天前

2025年9月24日,2025云栖大会开幕,阿里通义旗舰模型Qwen3-Max正式发布。该模型性能超越GPT5、Claude Opus 4等,跻身全球前三。Qwen3-Max包含指令(Instruct)和推理(Thinking)两大版本,预览版已在Chatbot Arena排行榜上位列第三,正式版性能有望进一步提升。Qwen3-Max预训练数据量达36T tokens,总参数超过万亿,具备强大的编程和Agent工具调用能力。在SWE-Bench Verified测试中,Instruct版本以69.6分位居全球第一梯队;在Tau2-Bench测试中,取得74.8分,超越Claude Opus4和DeepSeek-V3.1。其推理增强版本Qwen3-Max-Thinking-Heavy在数学推理测试AIME 25和HMMT中均获满分100分,为国内首次。目前,用户可在通义千问QwenChat上免费体验Qwen3-Max,或通过阿里云百炼平台调用API服务。