Agent 这个词,AI 行业喊了至少两年。2024 年起,每一场发布会都在谈 Agent,投资机构管它叫下一个万亿市场,创业公司一夜之间改了 slogan。但打开产品一看,还是一个对话框等你打字:你给指令,它给回答;你不提问,它就停在那儿。
概念跑得很快,产品形态没跟上。直到 OpenClaw 出来,这种错位才突然变得可见——不是因为它发明了什么新技术,而是它把那层一直缺失的交互前端拼对了。
OpenClaw 这个小龙虾的火热最终没有昙花一现,从一个周末项目起步,短时间冲到十万级 GitHub stars,单周两百万访问。但更能说明问题的是它迅速从极客玩具升级为 Agent 雏形:用户群从开发者扩散到各行各业,运营、创业者、普通人,讨论焦点也从技术实现转向日常使用。2 月 15 日,Sam Altman 宣布 OpenClaw 创始人 Peter Steinberger 加入 OpenAI,也给这轮“个人 Agent 形态”做了背书。而在各个技术社区、社交媒体、各个线下聚会上,人们还在蜂拥而至给自己部署着各种“龙虾”。
这股龙虾热逐渐演变出了一种行业共识:如果把AI 这事拉长来看,当作一整个独立的“产品”,那么ChatGPT们此前其实只是在构建“后端”,这一次它才真正有了“前端”。
ChatGPT 问世三年多,定义了一个近乎统一的交互范式:一个输入框,你打字,它回复。三年里,绝大多数 AI 产品都在复制这个模式。豆包、Kimi、Perplexity、Claude,换名字换皮肤换模型,底下还是同一套回合制界面。
对话框看起来很自然,但它把 AI 锁在了被动位置:你不打开它,它就不存在;你不提问,它就不行动。AI 的全部价值,依赖用户主动发起、主动拆解、主动盯过程、主动验收。对重度用户来说这只是习惯,但对多数普通人而言,“想到要用 AI”本身就是门槛。
还有一层更隐蔽的问题:对话框把能力限制在了“回答”里。你问一个问题,它给一段文字;你让它写代码,它给一段代码。交互结束,系统即停。它没法替你跑一个持续性任务,没法在你不在的时候盯住什么,没法在发现异常后主动来找你。
对话框是回合制游戏,但真正的助手应该是实时在线的。
Peter Steinberger 在 Lex Fridman 的访谈里把这个点说得更狠:我们现在给 Agent 的界面,本质上是在“复制 Google”——一个 prompt、一个聊天框,就像电视刚出现时人们把广播节目原封不动搬到屏幕上播。

换句话说,GenAI 的后端能力已经到了 2026 年的水平,前端界面还停在 2010 年。Agent 的推理与规划能力在变强,UI 层基本没变,反而拖住了体验。很多任务明明需要表单、预览、控制、分步反馈,产品却仍在用“聊天”硬扛。
当界面没进化,模型再强,用户体感也只是“聪明了一点”。这也是为什么行业会同时出现两种情绪:一边是能力暴涨,一边是“怎么还是用不起来”。
OpenClaw 接入了聊天软件,就这么简单。
它跑在飞书、iMessage、Telegram 里,能在本地运行、替用户执行动作。消息会弹出来找你,不用切换上下文。对话框是你得专门去打开的东西,聊天软件是你已经待着的地方。跟 AI 说句话,跟回复一条微信一样随意。
分发上的差距更大。ChatGPT 要注册、打开;飞书和 Telegram 早就装在手机上了。OpenClaw 接入这些平台,用户获取 AI 的门槛降到接近零。用户只有一直在用,才会真正体会到价值。
但入口只是一半。OpenClaw 真正的突破是主动性。

Peter 在访谈里提到,他给 Agent 加了定期触发机制,最初的提示词很粗暴:每隔一段时间 surprise me。你睡觉它在跑,开会它也在跑。一个等你来用,一个替你去做。喊了两年 Agent,直到 OpenClaw,大多数人才第一次摸到 Agent 该有的手感。
Claude Code 再强,用户心智被“编程工具”锁死了:打开终端、输入命令、盯输出。OpenClaw 更像一个长期在线的代理人,存在方式本身就不一样。
而Agent 产品面向用户可能本就该是黑盒。你说“帮我盯着这几个账号”,它去盯着,中间用了什么模型、烧了多少 token,不关用户的事。OpenClaw 的 token 消耗比传统对话式 AI 高一个数量级,但用户不在意——他们看不到过程,只看到结果。
Cowork 本来最有机会站在 OpenClaw 今天的位置,发布时甚至引发了一波软件股恐慌。但它差了两步:没进聊天软件,界面上暴露了太多配置项。Cowork 打开是文件夹选择、权限设置、任务进度面板;OpenClaw 打开是一个聊天窗口。一个像在操作软件,一个像在跟人说话。
很有代表的点是,很多人用 OpenClaw 用到现在,就没拿它像 AI IDE 那样编过程。这个本来跑在终端里的技术产品,用户拿它管邮件、盯热点、整理信息、安排日程、一句话开发。技术栈是程序员的,使用场景完全不是。
过去几年,从 GPT-3 到 GPT-5,从 Claude 到 Gemini,整个行业做的事情其实都是同一件:堆后端。更大的模型、更长的上下文、更好的推理——这些都是基础设施,是水电煤。
ChatGPT们这些GenAI 产品和模型,就是后端,负责生成文本、生成代码、调用工具、理解意图。
但后端再强,没有前端也触达不了普通人。互联网的后端是 TCP/IP,真正改变世界的是浏览器;移动互联网的后端是 3G/4G,真正改变世界的是 App Store。后端决定能力上限,前端决定谁能用到这些能力。
OpenClaw所呈现出来的agent 就是这一轮 AI 的前端。它接收意图,在真实环境里做决策、调工具,把结果交付给你。GenAI 的能力,不管是生成代码还是逻辑推理,都在后面撑着这个代理。
这也就是为什么 GPT-5 们发布时行业反应相对平淡:模型确实更强了,但体验在对话框里没有质的变化,用户觉得“好像聪明了一点”,然后继续用原来的方式。后端在进步,前端没变,用户感受到的提升就很有限。
反过来,OpenClaw 用的模型并不比别人强——它接的是 Claude、GPT、DeepSeek,跟所有人调用的 API 一样。但它换了前端,体验上像是跳了一代。

Peter 在 Lex 的访谈里用一句话把这个未来推到了极端:every app is just a very slow API now。Twitter/X 对访问设限,并没有真正让 Agent“不可能”读取内容——Agent 只需要打开浏览器去读,只是成本更高、速度更慢。
也就意味着,当 Agent 能替你跨越一堆界面完成工作,App 这层“为人类设计的 UI”就会逐渐退化为“为 Agent 提供的数据与动作接口”。用户不再“使用”你的产品,用户的 Agent 替他们“调用”你的产品。
越标准化的工具——App、邮件、日历、任务管理、文件存储——越可能先被改写。越复杂、越强权限的系统会更慢,但也更依赖“前端入口 + 权限 + 工作流编排”这个组合。
GenAI 和 Agent 不是两个时代,是同一个系统的两层。ChatGPT 的对话框定义了 GenAI 的交互模式,OpenClaw 的聊天软件定义了 Agent 的交互模式。前者最终会隐去,变成后端。OpenClaw这样的Agent成为一切的前端。
这股热潮没有褪去背后,另一个让人有些意外的地方是,OpenAI“收编”了OpenClaw后,人们的热情并没有减弱。
但这也因为,OpenAI 挖走了OpenClaw的创始人,但到现在也没推出类似的产品形态。
这可能因为ChatGPT 的对话框心智太强,三年多积累的用户习惯反而成了负担。而且 OpenAI 的商业模式建立在订阅和 API 调用上,让 Agent 跑在第三方聊天软件里,等于把用户入口拱手让人。
Anthropic 的处境同样特殊。Claude Code 增长很快,但“编程工具”标签一旦贴上就撕不掉。Cowork 是对的棋子,一月份发布即引发一波软件股恐慌,但它生在桌面端、不在聊天软件里,起步慢了半拍。
同一时期,Perplexity 推出了名为 Computer 的 super agent,走云端路线但定位类似——这说明“主动式 Agent 嵌入日常工具”已成行业共识,区别只在谁先拿到用户。
这些巨头面对的其实是同一个困境:现有产品太成功了,反而堵住了解决真正的需求的路。ChatGPT 的对话框、Claude Code 的终端、Office 的生产力套件、微信的社交生态——每一个都是护城河,但也是围墙。OpenClaw 没有这个包袱。巨头们被自己的成功困在原地,不是看不见新范式,而是动不了。
看起来,人们对OpenClaw和收了它的OpenAI的认知依然是分开的,OpenClaw代表的新的交互范式,没有对“自有入口”的执念反而把用户体验做好了,而一个好的“前端”从来都是自下而上建设起来的。
这也让OpenClaw成了这一轮越来越像是巨头之间的资源游戏的AI演进中,一次难得的自下而上的破局。它给了大批开发者和创业者一些新的信心:创新还可以发生,哪怕是从一个小团队、一个周末项目、一个“surprise me”的粗暴提示词开始,游戏还远远没有结束。
