阿里千问3.6登顶中国最强编程模型

2 小时前

4月3日，全球知名大模型盲测平台LMArena旗下聚焦AI编程能力的榜单CodeArena公布新一期排名，阿里巴巴新一代大语言模型Qwen3.6-Plus位列全球第二，超越OpenAI、Google、xAI等国际巨头，成为中国在该榜单上排名最高的大模型。该榜单采用真实用户盲测、实时对抗排名机制，被视为AI领域最公正权威的性能榜单之一。Qwen3.6-Plus在React专项榜单中表现尤为突出，该榜单考察模型在复杂Web开发场景下的自主编码能力，要求模型具备完整的工程思维和端到端开发能力。Qwen3.6-Plus以1452分位列第二，仅次于Anthropic的Claude-Opus-4.6-Thinking（1540分），领先OpenAI的GPT-5.0-High（1448分）和Google的Gemini 3.1 Pro Preview（1440分）。此外，Qwen3.6-Plus在全面评估AI编程能力的Code Arena榜单中同样位居国产模型之首。凭借这一成绩，阿里巴巴在全球AI实验室排名中升至第四，仅次于Anthropic、OpenAI和Google。Qwen3.6-Plus是阿里千问3.6系列的首款模型，后续还将开源其他尺寸模型，性能更强的旗舰模型Qwen3.6-Max也将于近期发布。

上一篇：谷歌发布Gemma 4开源模型采用Apache 2.0协议

下一篇：Anthropic发现AI模型内部存在功能性情绪表征

返回列表

热文阅读

2 天前

刚刚，OpenAI 创下史上最大融资纪录，估值逼近万亿

2 天前

DeepSeek三天两次故障，网友发现“蛛丝马迹”：V4要来了？

2 天前

四家机器人厂商，一起投了一家数据公司丨涌现新项目

2 天前

Sora跌倒，字节吃饱：国内大厂接管AI视频下半场？