Agent时代,大厂们“拆墙”又“筑墙”
3 小时前 / 阅读约12分钟
来源:36kr
微信推出插件接纳外部Agent,但仅开放消息通道。Agent能力受权限限制,大厂对外部Agent态度各异,本质是商业模式之争。未来中国难现通用Agent,平台内部统一入口将加速成熟。

向来以「克制」著称的微信,终究是向外部Agent低了头。

此前,用户翘首以盼腾讯版「龙虾」QClaw与WorkBuddy,重要原因之一便是只有它们可以通过微信调用。怎料微信选择亲自「拆墙」,推出「ClawBot」插件,接纳包括OpenClaw在内的一众外部Agent。

一夜之间,技术平权了。

不过,微信目前向外部Agent开放的仅是消息通道,并未像飞书、钉钉等企业协作平台一样开放各种内部能力——即便是腾讯版「龙虾」也无法接触微信聊天记录、公众号内容等核心数据。

看来「权限与操作」的能力,只能盼望微信正在研发的内部Agent来实现了。

放到更大视角来看,Agent时代,大厂这样「拆墙」又「建墙」正在成为常态,而第一批碰壁者已经出现了。

01 Agent撞上「权限之墙」

最近,AI创业圈有个论调:「MCP已死,CLI称王。」

原因是钉钉、飞书、企业微信等互联网大厂们纷纷选择开源了自家的CLI(命令行),而非MCP(模型上下文协议)。

▲MCP与CLI方案对比 图源:COBUS GREYLING & AI

简单说,CLI和MCP都是Agent与外部系统的「管道」。

不同于人类靠GUI(图形用户界面)与应用打交道,Agent可以通过「屏幕识别」和「模拟点击」等方式来完成任务。但这种方式低效且极易被系统识别为「非真人操作」而禁止使用——这正是豆包手机助手遭遇的困境。

更讲武德的方式是走API(应用程序接口),跳过繁琐的图形渲染,直接与应用后台对话一一这就需要应用供应商授权,而各家API接口协议不一样,为了让这种调用不各自为战,Anthropic推出MCP(Model ContextProtocol),是当前AI领域公认的统一接入标准,常被比作AI界的「type-C接口」。

换句话说:API 是业务能力,MCP 是 AI 接入业务能力的标准化插座。

而CLI算是「前朝遗老」,早期计算机交互的主要方式,用文字指令操作软件,因为其结构化、无冗余的特性,正在成为PC端Agent最顺手的操作方式。

但无论是MCP、CLI,还是API,它们都只是调用方式——是工具层的问题,能否真正实现,还要取决于双方的意愿。

开放决定着「龙虾」等Agent的技能上限。

目前来看,用户并非每次指使「龙虾」干活时都能找到解决方法,比如说「点外卖」「打车」这类基础需求,在阿里的AI应用「千问」、美团的AI应用「小美」中可以轻易完成,「龙虾」却苦于权限问题只能干瞪眼。

▲千问和小美的办事技能

而且「龙虾」与「龙虾」之间也有能力差异:阿里的B端AI应用 「悟空」将淘宝、天猫、1688、支付宝等阿里生态的B端能力统一封装为可被AI直接调用的Skill和技能包;字节的ArkClaw深度集成飞书办公套件,还能调用抖音、今日头条的独家插件,飞书也是OpenClaw官方默认的即时通讯(IM)应用;腾讯专注于打造「龙虾天团」和上线「龙虾池」SkillHub,暂未发现其Agent拥有独家Skill。

在大洋彼岸,国外的AI御三家虽未跟风推出「龙虾」产品,但也在逐步将「办事」的能力集成到已有的产品中:在OpenAI撤回直接购物功能的同时,Gemini正尝试帮用户订餐、买菜和打车(目前仅限于Pixel或三星手机的Gemini应用中),而Claude干脆像OpenClaw一样可以自动操控用户的电脑执行任务。

▲三星在新机发布会上演示的谷歌 Gemini 任务自动化功能

很明显,现阶段Agent的能力上限,不仅与所用的大模型有关,还取决于Agent的权限边界。

面对Agent「敲门」,各家应用厂商们也是各怀心思。比如相同的搜索业务,百度大门敞开欢迎外部AI工具调用——在OpenClaw的官方技能商店 ClawHub上,百度搜索Skill下载量超4.5万次;谷歌却早早地删除 num=100参数,使得AI工具一次只能抓取前10个结果。

那么问题来了,面对外部Agent,为什么有人「拆墙」,有人「筑墙」?

02 墙的本质是商业模式之争

起初,Agent代理商们信奉着「用户授权,即可操作」的原则,试图造出「AI大一统入口」。不过,现实很快给出了答案:墙,不是技术问题,而是利益问题。

在国内,家喻户晓的冲突便是豆包手机助手与腾讯、阿里系应用之间的纷争。前者与手机厂商合作,获得硬件层面系统级的调度与操作应用的权限。结果上线几天便被腾讯、阿里系应用封杀,银行APP也弹出了风险提示。

在国外,典型案例便是亚马逊起诉AI搜索公司Perplexity,前者指控后者的AI浏览器Comet伪装成谷歌用户访问网站并完成购物流程,认为这是「欺诈」「违反使用条款」「危害用户的数据安全」。

表面上看,豆包被封是风控问题,Perplexity被告是合规问题。但本质指向同一个问题:当Agent替用户完成操作时,平台的价值链被截断了。

Agent每替用户完成一次操作,平台就少了一次广告曝光、一次数据采集、一次用户触达。Perplexity在反击文章里指出:AI只是用户的工具,企业无权干涉用户如何使用自己的账号;亚马逊的真正意图是把用户数据牢牢握在手中,卖出更多广告,是「霸凌者」。

▲Perplexity在博客更新《霸凌不是创新》,称亚马逊为「霸凌者」

2026年3月,美国地方法院裁定支持亚马逊,后Perplexity提起上诉,请求撤销或暂停执行禁令,目前上诉法院暂时中止了该禁令。

这意味,在法律层面,Agent想要操作应用,尚未规定必须获得用户以及应用开发者的双重授权。

目前,苹果、小米、三星等硬件厂商在做Agent时都采用了「双重授权」这一策略,通过系统级接口封装和标准化协议,让智能体在规范、可控的路径下操作应用。

而软件大厂们即是应用供应商,又是Agent代理商,是否为外部Agent「筑墙」取决于它的「命门」在哪儿。

比如同样是电商平台,亚马逊和Shopify对待外部Agent的态度截然相反。亚马逊不惜与Agent代理商打官司,Shopify则与Google、Walmart推出通用商业协议(UCP),主动给外部Agent开放标准化接口。

因为亚马逊是平台,卖流量;Shopify是服务商,卖交易。前者主要的盈利来源于广告,依赖用户在平台上的每一次点击与停留;而后者主要依靠促成交易抽佣,从商家GMV增长中实现增收。

对比中美两国,大厂「筑墙」固然是商业本能,但墙的「高度」取决于生态结构。美国平台多为垂直分工、各守一方;中国的移动互联网生态则由多个超级APP主导,大厂通过横向扩张、纵向整合,把社交、支付、内容、电商、本地生活等多项功能放进同一体系。

在这种结构下,超级应用的「命门」不再是单一业务,而是整套用户关系与数据。外部Agent一旦介入,冲击的不只是广告流量或一次交易,可能改变整个生态内部的逻辑。这也使得国内大厂对外部Agent的防御更为系统性。

此前就有某知名日用消费品集团的消费者体验负责人告诉《降噪NoNoise》,他们在海外已经看到一个品牌Agent可以实现跨平台服务的案例,这是因为很多国外用户习惯购物前先上Google搜索;但中国市场,线上购物场景分散、用户的消费习惯是直接到各电商平台站内搜索,电商平台也更注重把控站内流量,所以很难出现一个品牌Agent跨平台服务用户。

站在品牌角度,该负责人认为,通过一个个品牌知识库接入平台Skill,是更现实的实现方式。

03 Agent的诸侯割据

在科幻电影里,贾维斯可以连接任意终端,操控斯塔克住宅的每一台设备,还能调度钢铁战甲内部系统。但在现实的商业版图中,这种跨平台、跨终端的Agent「大一统」的幻想正在让位于「诸侯割据」的现实。

可以判断,在未来的很长一段时间内,中国很难出现代表「个人操作系统」的通用Agent,倒是平台内部的「统一入口」会加速成熟。

从国内大厂的近期布局来看,这种趋势日渐清晰。

阿里发力C端的千问锚定「AI办事」,在集成购物、外卖、订票等能力之后,又与自家的高德合作,提供AI「打车」服务;发力B端的「悟空」,用AI将自家的钉钉重做了一遍,并将阿里的to B能力统一放进去。

字节的豆包仍是中国第一大AI原生应用、也是字节C端规模最大的Agent。豆包与抖音、剪映、今日头条等字节系应用深度打通,目前还在内测购物功能。而吃到这波「龙虾」很大一部分流量的飞书,也推出了AI助手aily,加速B端AI商业化。

▲飞书AI助手aily

腾讯则押注「龙虾」全家桶,连「元宝派」里也可以创建龙虾bot。在「龙虾赛马」的同时,腾讯内部正在开发的专属于微信场景的AI Agent,应该具有更大的想象力。

微信早已打通社交、内容和支付三大场景,又通过小程序和视频号发力电商,产品月活超过11亿。在此基础上,微信Agent计划调用平台内数百万个小程序,让用户在聊天框内就能丝滑完成网约车、外卖、酒店预订、生活缴费等全场景服务。这意味着,微信或将能成为AI时代最高频的超级入口。

百度已不再执着于在应用端争夺AI入口,而是侧重于通过AI解决方案和大模型平台调用,对外输出AI能力。在「龙虾潮」中,百度不仅端出全家桶,还将核心的百度搜索打造成OpenClaw官方技能商店上全球下载量最大的搜索Skill。

▲百度龙虾全家桶

这一路径选择同样基于现实:在这个字节、阿里与腾讯的年利润动辄以千亿计、AI资本开支同样以千亿计算的时代,百度不足200亿元的利润规模、十年千亿元AI投入的处境,已经被彻底挤出头部阵营。

落到AI应用层,打造一款好用的通用AI助手需要在应用场景、用户体验、投入资源上无短板,但文心一言基本都不占优势。所以外界会看到,百度正收拢此前分散的入口,将文心助手深度集成于百度App,并加强百度文库、网盘的资源投入,在B端则通过Token调用收费实现AI商业化。

这种战略选择有其合理性:当AI 迅速从「回答问题」走向「完成交易」,百度天然站在链路更靠后的位置,此时百度App可利用AI助手直接输出整合后的答案,自然嵌入符合筛选条件的商业服务,如用户搜机票后,可在搜索结果页完成机票的比价、预订、支付全流程。而百度此前的全栈AI投入亦可以在新到来的Token商业模式中发挥作用,因为自研芯片、框架与模型性能的配合度,将实际影响到每一个Token的价值高低。

在这些AI大厂之外,硬件厂商们也正在试图通过系统级AI Agent,重新定义AI时代的交互入口。相比软件大厂之间的剑拔弩张,掌握底层的硬件厂商们可能会有更多的跨应用、跨终端「办事」的优势。

近日就有市场传闻称,豆包二代AI手机暂定今年第二季度上新,目前TOP5手机厂商有两家在与豆包方面洽谈。

至于更进一步的Agent to Agent协作——即贾维斯式的Agent,主流大厂短期内不会放开这个口子,但注定会产生裂缝。

16世纪中叶,英国的一位剪绒工人发明了能够「代替手工」的起毛机,效率高到让同行恐慌。很快,英国国王就颁布了「起毛机禁令」。不过,随着第一次工业革命的到来,新机器如潮水般涌入纺织业,「起毛机禁令」也渐渐成了一纸空文。

「墙」,或许只能延缓冲击到来的时间,却无法阻止那个迟早会来的世界。