中文大模型测评出炉：豆包跻身全球第一梯队小米MiMo上榜

1 天前

中文大模型基准测评SuperCLUE公布2026年3月最新测评结果，共有22款国内外主流模型参与。在总分排名中，海外闭源模型表现优异，Anthropic、Google、OpenAI的模型位列前三。字节跳动旗下的豆包模型以71.53分获得国内第一，进入全球第一梯队，与GPT-5.4的总分差距仅为0.95分，并在智能体任务规划维度上跻身全球前五。小米的两款模型也榜上有名，其中MiMo-V2-Pro在闭源模型中表现突出，MiMo-V2-Flash在代码生成等场景展现出潜力。国产模型整体表现不俗，尤其在开源赛道上表现抢眼，国产开源模型包揽了开源榜前三名。

上一篇：智象未来与诺亦腾机器人达成战略合作

下一篇：Runway推出Multi-Shot App，实现AI视频“一键成片”

返回列表

热文阅读

2 天前

所有“联创”均离职，马斯克“彻底重组”xAI

2 天前

月之暗面冲刺IPO：大模型竞争进入“定价阶段”

2 天前

谷歌的龙虾，名叫“史密斯特工”，《黑客帝国》真降临了？

2 天前

光纤招标价格，炸了！