xbench x UniPat联合发布新评测集BabyVision - AI

Just Quick Just Quality

热门话题

白天

搜索

资讯

xbench x UniPat联合发布新评测集BabyVision

2026-01-12

2026年1月12日，红杉中国旗下xbench与UniPat AI团队联合发布多模态理解评测集BabyVision，旨在评估大模型不依赖语言提示的纯视觉基础能力。结果显示，主流大模型表现落后于3岁幼儿水平。该评测集将视觉能力分为精细辨别、视觉追踪、空间感知、视觉模式识别四大类，共22项子任务、388道题。

上一篇：DeepSeek 将于春节前后发布新一代大模型 V4，主打代码生成能力

下一篇：OpenAI 要求合同工上传真实工作成果，引发知识产权担忧

返回列表

热文阅读

2 天前

斯坦福MIT天团出手，1美元养龙虾，图文视频全包，打工人神外挂

2 天前

TRAE SOLO“龙虾化”，字节正式上了Agent牌桌

2 天前

特斯拉Model 3发布十周年：历经“产能地狱”，今销量已超300万辆

1 天前

中国大模型的价格，究竟是怎么打下来的？