阿里发布千问旗舰推理模型 Qwen3-Max-Thinking,性能媲美GPT-5.2、Gemini 3 Pro
2 天前

2026年1月26日,阿里巴巴发布千问旗舰推理模型Qwen3-Max-Thinking。该模型总参数量超万亿,预训练数据量达36T Tokens,在事实知识、复杂推理、指令遵循、人类偏好对齐及智能体能力等关键维度显著提升,在19项权威基准测试中性能可媲美GPT-5.2-Thinking、Claude-Opus-4.5和Gemini 3 Pro等顶尖模型。Qwen3-Max-Thinking引入两项核心创新:自适应工具调用能力,可按需调用搜索引擎和代码解释器,现已上线Qwen Chat;测试时扩展技术,显著提升推理性能。