2026年1月27日,谷歌DeepMind团队为Gemini 3 Flash模型推出“智能体视觉”功能。该功能通过“思考-行动-观察”的闭环,模仿人类处理图像,使模型能主动调查并理解视觉信息,减少猜测与错误,在多项测试中质量提升5-10%。