北京时间2025年11月19日凌晨,谷歌正式推出全新Gemini 3系列模型,并将其定位为迄今为止“最智能”“事实最可靠”的AI系统。所有用户均可在Gemini应用里直接使用新的旗舰模型Gemini 3 Pro,该模型也将同步引入搜索订阅服务。Gemini 3 Pro的核心能力是“原生多模态”,能一次性处理文字、图片与音频。在谷歌搜索的AI Mode中,Gemini 3 Pro会以更直观的方式呈现结果,包括图片、表格、网格甚至模拟内容。其推理与智能体能力也显著增强,更能应对复杂任务,并具备稳定的长期规划能力,目前排在广泛使用的评测平台LMArena榜首。Gemini 3 Pro已在Gemini应用内向所有用户开放,美国地区的Google AI Pro和Ultra订阅用户也可在搜索的AI Mode中选择“Thinking”使用这一模型。在性能方面,Gemini 3 Pro表现卓越。在Humanity’s Last Exam测试中,其得分37.5%(工具使用后45.8%),远超GPT-5.1的26.5%和Claude 4.5的13.7%;在超难数学测试MathArena Apex中,GPT-5.1仅得1分,而Gemini 3 Pro达23.4分,呈现断层式优势;在多模态GUI定位测试ScreenSpot-Pro中,其准确率72.7%,是Claude 4.5(36.2%)的两倍。此外,Gemini 3 Pro在前端开发领域也展现革命性突破。它可根据文字描述15秒生成交互式3D花园HTML文件,支持ES模块导入;还能通过网页截图直接生成可运行前端代码,布局还原度达走查验收水平;2分钟即可生成功能完整的Web OS(含终端/编辑器/游戏),突破“装饰性UI”局限。在交互方式上,Gemini 3 Pro增加了“生成式界面”(GenerativeUI)功能,可根据查询内容自动生成定制化的界面布局。例如,当用户询问量子计算相关问题时,系统可能生成包含概念解释、动态图表和相关论文链接的交互式界面。针对不同受众的同一问题,系统会生成不同的界面设计,如向儿童和成人解释同一概念时,会分别采用偏可爱和偏简洁明了的呈现方式。此次发布还包含了名为Gemini Agent的智能体系统,目前处于实验阶段。该系统可以执行多步骤任务,并连接到Gmail、Google Calendar和Reminders等谷歌服务。在收件箱管理场景中,系统可以自动筛选邮件、标记优先级和起草回复;旅行规划是另一个应用场景,用户只需提供目的地和大致时间,系统会查询日历、搜索航班和酒店选项,并添加行程安排。不过,这项功能目前仅向美国地区的Google AI Ultra订阅用户开放。在多模态处理方面,Gemini 3 Pro基于稀疏混合专家架构构建,支持文本、图像、音频和视频输入。模型的上下文窗口为100万token,意味着可以处理较长的文档或视频内容。加拿大劳瑞尔大学历史学教授Mark Humphries的测试显示,该模型在识别18世纪手写文稿时的字符错误率为0.56%,相比前代版本降低了50%到70%。谷歌还推出了名为Gemini 3 Deep Think的优化版本,专门用于复杂推理任务。该模式目前正在进行安全评估,计划在未来几周向Google AI Ultra订阅者开放。在Google Search的AI模式中,用户可以点击“thinking”选项卡查看该模式的推理过程。与标准模式相比,Deep Think模式会在生成回答前进行更多步骤的分析。
