智谱开源千亿参数视觉大模型能区分麦当劳肯德基炸鸡 - AI

Just Quick Just Quality

热门话题

白天

搜索

资讯

智谱开源千亿参数视觉大模型能区分麦当劳肯德基炸鸡

4 周前

8月11日，智谱发布了其最新一代视觉理解模型GLM-4.5V，并宣布该模型已开源。GLM-4.5V基于智谱新一代旗舰文本基座模型GLM-4.5-Air进行训练，延续了GLM-4.1V-Thinking的技术路线。该模型拥有106B（即1060亿）总参数和12B（即120亿）激活参数，在41个公开视觉多模态榜单中综合效果达到同级别开源模型的SOTA性能，涵盖图像、视频、文档理解以及GUI Agent等常见任务。此外，GLM-4.5V还新增了思考模式的开关功能，用户可以根据需求自主控制模型是否进行深入思考。

上一篇：OpenAI内部神秘模型首次斩获信息学奥赛IOI 2025金牌碾压98%人类选手

下一篇：“派宝机器人”完成数千万元融资

返回列表

热文阅读

2 天前

记忆+分支，昨晚ChatGPT的一小步

1 天前

特斯拉自研芯片新进展 AI5芯片设计评审完成

2 天前

华为中国行2025落地重庆：以AI重构制造逻辑，共探AI+制造深水区！

2 天前

还得继续砸钱，OpenAI 预计到 2029 年总支出或超千亿美元