谷歌推出Agentic Vision,Gemini 3 Flash实现主动式视觉推理
1 周前

谷歌近日在Gemini 3 Flash模型中上线“Agentic Vision”(智能体视觉)功能,将传统静态图像识别升级为主动调查式视觉理解。该功能通过“思考—行动—观察”闭环,结合视觉推理与代码执行,使模型能自主处理图像,提升复杂视觉任务准确率5%至10%。