4月3日,全球知名大模型盲测平台LMArena旗下聚焦AI编程能力的榜单CodeArena公布新一期排名,阿里巴巴新一代大语言模型Qwen3.6-Plus位列全球第二,超越OpenAI、Google、xAI等国际巨头,成为中国在该榜单上排名最高的大模型。该榜单采用真实用户盲测、实时对抗排名机制,被视为AI领域最公正权威的性能榜单之一。Qwen3.6-Plus在React专项榜单中表现尤为突出,该榜单考察模型在复杂Web开发场景下的自主编码能力,要求模型具备完整的工程思维和端到端开发能力。Qwen3.6-Plus以1452分位列第二,仅次于Anthropic的Claude-Opus-4.6-Thinking(1540分),领先OpenAI的GPT-5.0-High(1448分)和Google的Gemini 3.1 Pro Preview(1440分)。此外,Qwen3.6-Plus在全面评估AI编程能力的Code Arena榜单中同样位居国产模型之首。凭借这一成绩,阿里巴巴在全球AI实验室排名中升至第四,仅次于Anthropic、OpenAI和Google。Qwen3.6-Plus是阿里千问3.6系列的首款模型,后续还将开源其他尺寸模型,性能更强的旗舰模型Qwen3.6-Max也将于近期发布。
