奥特曼都点赞 Google Gemini 3 Pro到底强在哪？ - AI

Just Quick Just Quality

热门话题

白天

搜索

资讯

奥特曼都点赞 Google Gemini 3 Pro到底强在哪？

2 天前

北京时间2025年11月19日凌晨，谷歌正式推出全新Gemini 3系列模型，并将其定位为迄今为止“最智能”“事实最可靠”的AI系统。所有用户均可在Gemini应用里直接使用新的旗舰模型Gemini 3 Pro，该模型也将同步引入搜索订阅服务。Gemini 3 Pro的核心能力是“原生多模态”，能一次性处理文字、图片与音频。在谷歌搜索的AI Mode中，Gemini 3 Pro会以更直观的方式呈现结果，包括图片、表格、网格甚至模拟内容。其推理与智能体能力也显著增强，更能应对复杂任务，并具备稳定的长期规划能力，目前排在广泛使用的评测平台LMArena榜首。Gemini 3 Pro已在Gemini应用内向所有用户开放，美国地区的Google AI Pro和Ultra订阅用户也可在搜索的AI Mode中选择“Thinking”使用这一模型。在性能方面，Gemini 3 Pro表现卓越。在Humanity’s Last Exam测试中，其得分37.5%（工具使用后45.8%），远超GPT-5.1的26.5%和Claude 4.5的13.7%；在超难数学测试MathArena Apex中，GPT-5.1仅得1分，而Gemini 3 Pro达23.4分，呈现断层式优势；在多模态GUI定位测试ScreenSpot-Pro中，其准确率72.7%，是Claude 4.5（36.2%）的两倍。此外，Gemini 3 Pro在前端开发领域也展现革命性突破。它可根据文字描述15秒生成交互式3D花园HTML文件，支持ES模块导入；还能通过网页截图直接生成可运行前端代码，布局还原度达走查验收水平；2分钟即可生成功能完整的Web OS（含终端/编辑器/游戏），突破“装饰性UI”局限。在交互方式上，Gemini 3 Pro增加了“生成式界面”（GenerativeUI）功能，可根据查询内容自动生成定制化的界面布局。例如，当用户询问量子计算相关问题时，系统可能生成包含概念解释、动态图表和相关论文链接的交互式界面。针对不同受众的同一问题，系统会生成不同的界面设计，如向儿童和成人解释同一概念时，会分别采用偏可爱和偏简洁明了的呈现方式。此次发布还包含了名为Gemini Agent的智能体系统，目前处于实验阶段。该系统可以执行多步骤任务，并连接到Gmail、Google Calendar和Reminders等谷歌服务。在收件箱管理场景中，系统可以自动筛选邮件、标记优先级和起草回复；旅行规划是另一个应用场景，用户只需提供目的地和大致时间，系统会查询日历、搜索航班和酒店选项，并添加行程安排。不过，这项功能目前仅向美国地区的Google AI Ultra订阅用户开放。在多模态处理方面，Gemini 3 Pro基于稀疏混合专家架构构建，支持文本、图像、音频和视频输入。模型的上下文窗口为100万token，意味着可以处理较长的文档或视频内容。加拿大劳瑞尔大学历史学教授Mark Humphries的测试显示，该模型在识别18世纪手写文稿时的字符错误率为0.56%，相比前代版本降低了50%到70%。谷歌还推出了名为Gemini 3 Deep Think的优化版本，专门用于复杂推理任务。该模式目前正在进行安全评估，计划在未来几周向Google AI Ultra订阅者开放。在Google Search的AI模式中，用户可以点击“thinking”选项卡查看该模式的推理过程。与标准模式相比，Deep Think模式会在生成回答前进行更多步骤的分析。

上一篇：纽约时报：Meta反垄断胜诉撬动硅谷禁忌科技巨头或重启并购潮

下一篇：消息称印度首富下周访韩，与三星电子李在镕讨论网络和AI合作

返回列表

热文阅读

2 天前

英特尔高嵩：Panther Lake明年CES正式发布推动AI PC持续进化

2 天前

陈立武:打造更强大更聚焦更具执行力的英特尔

2 天前

何恺明团队新作：扩散模型可能被用错了

2 天前

猛贴 AI 讲故事，百度真有救吗？