开源大模型,进入中国时间。
10 月,公开数据显示,来自中国的开源大模型已经牢牢占据榜单前五。
阿里的 Qwen 系列和 DeepSeek,更是从 2024 年下半年起,就在开源社区构建起越来越深远的影响力。
这一结果正在引发热议。有不少网友指出:这种情况确实已经持续了很长一段时间。
比如半年前 Llama 4 翻车时的梗图,就又被挖了出来:
无论是模型质量还是开放程度,这一次,国产模型已经从追赶者,转变为引领潮流的一方。
更具体的情况,可以在 LMArena 公开榜单中窥见一二。
在文本排行榜中,顶级闭源模型如 GPT-5、Gemini-2.5-pro、Claude-Sonnet-4.5 等之后,紧随而来的就是智谱的 GLM-4.6 和 DeepSeek-v3.2。
而 Qwen3-max-preview 则跻身到了 TOP3,不过目前该版本模型并未开源。
前端开发排行榜中,国产开源模型更是实现了跟编程 SOTA Claude 的分庭抗礼,DeepSeek-R1 / V3.1、GLM-4.6 和 Qwen3-Coder 都排到了前 10。
视觉方面,腾讯的 Hunyuan-vision-1.5注和 Qwen3 同样紧跟闭源 SOTA,位列开源最强。
注:Hunyuan-vision-1.5 处于计划开源状态,技术报告和模型权重尚未公布。
视频模型方面,开源模型中 Wan-v2.2 表现最佳。
值得注意的是,在这个领域,国产闭源模型同样表现不俗,Kling-2.5、Seedance-v1-pro、Hailuo-02 等都位居榜单前列。
另一个角度,从 HuggingFace 的模型下载量和模型趋势上,也可以看出开源模型领域,中国力量越来越活跃、越来越强大了。
在趋势榜中,蚂蚁的 Ling-1T、智谱的 GLM-4.6,都是当下最受关注的开源模型。
最受欢迎模型,依然由 DeepSeek-R1 担当。
下载量方面,Qwen3 是下载量最高的模型之一。如果将参数规模具体到百亿级,Qwen3 更是领先包括 gpt-oss 在内的其他开源模型。
竞争推动创新,而开源已经被证明,是加速创新的重要力量。
有网友认为:现在,这股推动力来自中国。
还有人指出,开源模型领域主导地位的转变,不仅仅关乎谁将引领潮流,更重要的是,这或将重新定义全球创新格局。
Anyway,回到开头那张图片上,中国开源力量对大模型格局的冲击,一个重要的节点是“DeepSeek 时刻”。
而 Llama 4 的翻车,也不能说没有贡献一份力量(doge)。
最近小扎不是终于把 OpenAI 前 CTO Mira 的公司联创 Andrew Tulloch 挖走了嘛,传闻是给了一份 35 亿美元的 offer。
消息一出,又把大家对 Llama 5 的关注给勾起来了:挖了这么多人,花了这么多钱,Meta 超级智能实验室能搞出好东西来吧?
但这边刚期待,就有人冒出来泼冷水:Llama 5 无了。
爆料人说是 Meta 的数据集供应方。不过后来他又删掉了这个回复,表示以上并非官方消息,他只是从另一个获得 Meta 资金的团队那里得到了这个消息。
那么,被亚历山大・王动摇了开源决心的小扎,究竟会拿出点什么?
板凳,瓜子,长期准备吧~
参考链接:
[1]https://x.com/burkov/status/1977942735962206666
[2]https://lmarena.ai/
本文来自微信公众号:量子位(ID:QbitAI),作者:鱼羊,原标题《开源模型 TOP5,被中国厂商包圆了》