Nano Banana Pro 之后,谷歌 CEO Pichai 要的不是“好看”,是好用
6 小时前 / 阅读约13分钟
来源:36kr
谷歌CEO桑达尔·皮查伊提出AI正从对话转向完成真实任务,以Nano Banana Pro为例,强调AI基建投资及解决能源、版权、信任问题,旨在让图像AI成为连接全线产品的入口。

谷歌CEO桑达尔·皮查伊关于人工智能未来的愿景,核心在于AI正从对话转向“完成真实任务”的智能体(agentic)体验。这一转变以谷歌DeepMind发布的Nano Banana Pro(即Gemini 3 Pro Image)为重要例证,它不再是简单的图像创作工具,而是能接入搜索、处理数据、完成工作任务的AI工作站。皮查伊同时强调,当前AI热潮并非泡沫,而是合理的、史无前例的“基建投资”期,谷歌和整个行业正在投入数万亿美元来构建底层设施。然而,要实现AI的真正“好用”,谷歌必须解决能源、版权和信任这三大关键挑战,并致力于将图像AI打造成连接其全线产品的入口,而非孤立的应用。

当图像 AI 开始能“干活”,游戏规则就变了。

Google CEO Sundar Pichai 在接受 BBC 采访时,反复提到一个词:任务。

接下来 12 个月,AI 会开始做更复杂的事情。

不是让你和它聊天,而是让它代你完成真实任务。

与此同时,2025 年 11 月 20 日 ,Google DeepMind 发布了 Nano Banana Pro(Gemini 3 Pro Image)。

这不是一次普通的模型升级。它标志着图像 AI 的角色转变: 不是 Midjourney 式的灵感激发,也不是 Canva 式的模板美学,而是一个能接入搜索、处理数据、完成工作任务的 AI 工作站。

Pichai 要的不是更美的图片,而是更有用的工具。

第一节|1万亿美元,一场基建耐力赛

“AI 要好用,钱要往哪投?”

在 BBC 的采访中,Pichai 给出了答案:一场前所未有的基建投资。

记者的第一问就很直接:这一轮 AI 热潮,会不会是泡沫?

Pichai 的回答没有回避。他承认,有些投资会冲得太快,但认为整体是理性的。市场看到了真实的客户需求,而他们满足需求的能力还跟不上。所以这波投资热潮,是合理的。

这种场景不是第一次出现。20 多年前,互联网热潮也曾被质疑过度投资。但 Pichai 说:

“当我们回顾互联网的时候,显然有很多过度投资。但它作为一项深刻的技术革命,已毋庸置疑。”

AI 将会和互联网一样,引发一场根本性的革命。而现在的阶段,不是泡沫,是提前下重注的时间点:

未来几年,我们会建成原本需要 10 到 20 年才能完成的东西。

他还透露了一组核心数据:

Google 今年在 AI 基建上的支出将超过 900 亿美元

全行业在 AI 相关基础建设上的投资,已经累计超过 1 万亿美元

这不是宣传口径,而是他作为 CEO 向资本市场传递的核心信息:整个行业都在投入资本建设 AI 基础设施,这是一场前所未有的建设期。

而这场建设期,最终要服务的是产品能不能真正“好用”。

Nano Banana Pro 正是在这个背景下发布的:它是这个 1 万亿美元投入周期的一个重要落点。

但 Pichai 也没有自信过头。

当被问到,那 Google 会不会比别的公司更安全,不怕泡沫破裂?他明确回应:所有公司都可能受影响,Google 也不例外。投多了,该承担的风险一样要承担

只是他强调,Google 走的是一条全链条路径:我们不是只做模型。我们是从底层的物理设施,到推动 AI 前进的研究,再到实际应用。我们走的是端到端的方法。

从芯片、数据中心、研究,再到最终出现在搜索、YouTube、Android 里的真实产品,Google 试图覆盖完整的价值链。

而这场耐力赛的终点,是让产品真正能用起来。

第二节|Nano Banana Pro:不是画图,是干活

在采访中,Pichai 多次提到:任务。

这恰好也是 Nano Banana Pro 与此前图像模型的最大不同。

✅AI 的方向:从对话到行动

Pichai 说,AI 的重心正从交流转向帮你做事。

“你现在可以和 AI 来回对话,在很多话题上进行交流。但接下来的 12 个月,你会看到它们开始做更复杂的事情。”

他举了一个很生活化的例子:比如我想买个生日礼物送给家人,我可以让 AI 去完成这件事。

这种从对话到行动的转变,正是 Pichai 口中的 agentic 体验,也就是让 AI 成为能完成任务的智能体。

而 Nano Banana Pro(Gemini 3 Pro Image)正在向这个方向发展,具体体现在官方公布的三大升级中:

第一,能看懂实时信息

它可以连接 Google 搜索,调取最新的数据:

你给出一个地点,它能生成天气图

你给出一堆财报数据截图,它能做出图表

你告诉它“做一张关于龟背竹的植物养护卡”,它就能拉取资料,自动设计出结构化图像

第二,能把内容直接变成图像

最关键的能力是:

生成文字正确、不乱码的图像(以前很多图像 AI 会出现文字错乱)

多语言支持,不只是英文,还能用中文、韩文、印地语、阿拉伯语直接输出

甚至可以把一段故事变成电影式的分镜图

比如用户只输入一句“讲圣诞老人变成说唱歌手的故事”,Nano Banana Pro 就能一步步生成巡演巴士、后台花絮、演出名单的图像内容。

它能理解你要做什么,然后自动展开。

第三,能微调、能控制,像摄影师一样创作

普通人可能没接触过色彩分级、景深控制、焦点调整,但 Nano Banana Pro 现在把这些功能做成了按钮级别的操作。

你可以:

改变图像的纵横比(比如 1:1 用于小红书,16:9 用于 PPT 封面)

修改画面焦点(让花朵清晰、背景虚化)

调整光线(把白天变成夜景,把光打在人物脸上)

一句话总结:Nano Banana Pro,正成为普通人也能用的图像工作站。

第三节|图像 AI 的新角色:入口,而非工具

前面提到,Pichai 强调 Google 走的是端到端的全链条路径。

那么在图像领域,这个战略如何落地?答案是:把图像做成入口,而不是独立应用。

✅Nano Banana Pro 并非孤例

从发布信息看,Nano Banana Pro 同时被部署到了:

Google Search(AI Mode)→ 抓取实时信息、做图表

Google Ads → 生成带文案的广告图片

Workspace(Slides、Vids)→ 做演示、短视频内容

Gemini App → 消费者随手生成视觉内容

API 和 AI Studio → 开发者直接用来做应用

这种全线铺开的方式,透露出 Google 的真正意图:让图像成为连接各个产品的一个入口。

✅为什么是图像?

在采访中,Pichai 用了一个很具体的场景来说明 AI 应该如何辅助工作: “放射科医生面对的扫描越来越多,每次扫描的图像也越来越复杂。AI 工具可以帮助他们应对这种增长的需求。”

他不是在讲抽象的生产力提升,而是在说:

医生怎么在大量图像中快速找出重点?

企业怎么用图表讲清一堆财报?

普通人怎么在十几秒内看懂天气、比赛、食谱?

这些任务,都需要图像。但旧的图像生成工具,只能出图,不能用。

而 Nano Banana Pro 要解决的问题是:能不能让 AI 生成的图,自己说清用意,还能引导下一步行动?

✅ Nano Banana Pro 的真正价值

三个场景可以说明它在做什么:

你想表达一个复杂信息,它能帮你排好结构、渲染清晰、翻译成多语种

你想让 AI 帮你开始干活,它先给你一个能理解的画面

你不懂提示词、也不懂设计,它用界面引导你选灯光、焦点、场景角度

Pichai 在回答 AI 会不会取代工作时,说过这样一段话:

“历史上很多工具,都是把人从重复劳动中解放出来。洗碗机、电冰箱都不是为了让人没事干,而是为了让人有时间干别的事。”

Nano Banana Pro 也是如此:不是让你变成艺术家,而是帮你省下表达和沟通的时间。

而这种把图像变成“入口”而非作品的思路, 会成为 Google 之后布局 AI 产品的关键逻辑。

第四节|能源、版权、信任:三道必过的关

Nano Banana Pro 展示了图像 AI 如何从“好看”变好用。但 Pichai 也清楚,要真正做到好用,还得过三道关。

第一关:能源,AI 在加速,电从哪来?

主持人问得很尖锐:到这个十年末,数据中心的耗电量可能会比整个印度还高,比所有电动车加起来还多 50%。Google 还坚持 2030 年净零碳排的目标吗?

他的回答是:目标还在,只是速度确实受影响。行业增长比预期更快,但 Google 正在通过投入新能源来应对。

他说了三个细节,显示 Google 已经行动:

签下了全球最大的商业核聚变能源采购协议(与 Commonwealth Fusion Systems)

投资小型核反应堆、地热能源、太阳能电池

2026 年,Google 在英国的数据中心将实现 95% 无碳电力覆盖

在他看来,这不该是一个此消彼长的选择题,AI 和绿色能源,可以一起推进。

第二关:版权,训练模型的内容,要不要付费?

主持人接着问了一个更敏感的问题:

“有人说你们用图书、音乐、新闻来训练模型,然后又把这些内容卖回给世界。你愿意为这些内容付费吗?”

Pichai 没有说愿意或不愿意,他强调的是机制:我们让用户可以选择退出被训练,并且在生成内容时尊重版权。我们也在跟行业一起更新这个框架。

他举了 YouTube 的例子: “在视频时代,我们就给创作者提供了变现方式。现在到了 AI,我们也会延续同样的做法。”

换句话说,Google 要走的仍然是和内容生态共赢的路

第三关:信任,AI 说的,到底能不能信?

主持人也提到了披萨配胶水、议员被误指控的例子,Pichai 承认问题确实存在:Google 为提供准确信息投入了很多努力,但目前最先进的 AI 仍然可能出错。

他的应对策略是把 AI 模型和 Google 搜索结合使用,让 Gemini 连接搜索来提高准确性。

同时他强调:不能盲信 AI,但应该有方法去理解它、验证它、使用它

而在 Nano Banana Pro 的发布中,Google 同步推出了应对措施:所有生成的图像都嵌入了 SynthID 数字水印,用户可以在 Gemini App 中上传图片,直接询问它是否由 Google AI 生成。

这三件事,Pichai 没有把它们当合规项或副议题来讲。

他认为,如果只靠 AI 技术本身,信息生态就会失衡。所以新闻业很重要,老师很重要,医生的建议也很重要。

Google 在这轮 AI 热潮里不只是追求快,而是在做一个慢功夫:把根扎在能源、内容、信任这三个基础上。

而这三道关,也会是 Google 之后所有 AI 产品必须跨越的门槛。

结语|入口思维:技术之外的那一步

Pichai 在采访的最后,讲了一个故事。

他让 80 多岁的父亲第一次坐进无人驾驶车。我坐在后座,他在前面。他惊讶,也兴奋。这帮我重新看清,我们今天认为理所当然的许多进步,其实已经在改变生活。

Nano Banana Pro 也在做同样的事。

它不是为了生成更好看的图片,而是为了让每个人在面对复杂信息时,有一张图可以看懂,有一个起点可以动手。

可视化、可操作、可理解。

这是 AI 走向下一阶段之前,最重要的一步。

入口,不是技术有多强,而是人们会不会真正用起来。

参考资料:

https://www.youtube.com/watch?v=edTTeY1Zx-0&t=2198s

https://www.youtube.com/watch?v=BYx63PKKPvg&t=1s

https://blog.google/technology/ai/nano-banana-pro/?utm_source=x&utm_medium=social&utm_campaign=&utm_content=

https://x.com/venturetwins/status/1991522541475954988

https://www.theverge.com/news/824785/google-nano-banana-pro-try-free-examples-prices

来源:官方媒体/网络新闻