8月11日,智谱公司发布了开源视觉推理模型GLM-4.5V,该模型总参数达106B,激活参数为12B,已在魔搭社区和Hugging Face平台同步开源。GLM-4.5V基于智谱新一代旗舰文本基座模型GLM-4.5-Air,沿用了GLM-4.1V-Thinking的技术路线。据悉,该模型在41个公开视觉多模态榜单中,综合表现达到了同级别开源模型的SOTA性能,适用于图像、视频、文档理解以及GUI Agent等常见任务。