智谱正式发布并开源GLM-4.6V系列多模态大模型,该系列包含基础版GLM-4.6V(106B-A12B)和轻量版GLM-4.6V-Flash(9B)。新模型将训练时的上下文窗口扩展至128k tokens,视觉理解精度在同参数规模中达到SOTA水平。此外,该模型首次将Function Call能力原生集成至视觉模型中,实现了从“视觉感知”到“可执行行动”的完整链路。相较于GLM-4.5V,GLM-4.6V系列价格下降50%,API调用费用为输入每百万tokens 1元、输出每百万tokens 3元,GLM-4.6V-Flash版本则免费开放使用。同时,该系列模型还融入了GLM Coding Plan,并开发了专用MCP工具。
