中文大模型测评出炉:豆包跻身全球第一梯队 小米MiMo上榜
1 天前

中文大模型基准测评SuperCLUE公布2026年3月最新测评结果,共有22款国内外主流模型参与。在总分排名中,海外闭源模型表现优异,Anthropic、Google、OpenAI的模型位列前三。字节跳动旗下的豆包模型以71.53分获得国内第一,进入全球第一梯队,与GPT-5.4的总分差距仅为0.95分,并在智能体任务规划维度上跻身全球前五。小米的两款模型也榜上有名,其中MiMo-V2-Pro在闭源模型中表现突出,MiMo-V2-Flash在代码生成等场景展现出潜力。国产模型整体表现不俗,尤其在开源赛道上表现抢眼,国产开源模型包揽了开源榜前三名。