试用近10个AI助理,我决定自己把活干了
5 小时前 / 阅读约16分钟
来源:36kr
Anthropic发布Claude桌面端应用,可操纵电脑执行任务。Manus也发布类似功能。国内手机厂商和硬件厂商积极接入OpenClaw。各大厂发力AI分场景代理,如阿里跨境电商Agent Accio。未来AI或缩短工作时间,提升人类干状态。

OpenClaw 相关的文章太多,近期围绕AI技术变化的讨论更是层出不穷,科技、社会、商业角度的分析让人眼花缭乱、目不暇接。相比学习部署 OpenClaw 技术的 3 种方法,有时候我更想学小龙虾的 5 种烹饪方法。

距离把本地部署和一键封装的 OpenClaw 搞明白不过一周,紧接着Claude、Manus 等又能直接控制电脑了。事到如今,只好安慰自己只要我学的晚,技术就会进步,也就不用学过时的那些了。

玩笑归玩笑,我一边浏览信息一边震惊新科技更新的速率,疑惑 OpenClaw 等 AI 助理能力究竟有没有加速生产力?FOMO 之余我决定尝试整理最新变化,试用市面上的新产品。这个开源技术出现后,各个大厂、创业公司都在做什么,未来又会有什么变化?

科技面前,大家都爱进步 

从最新的消息看起。3月24日,也就是前天,美国人工智能初创公司 Anthropic 发布的大型语言模型 Claude 发布了桌面端应用的计算机使用(computer use)功能,Claude 也可以操纵电脑执行任务了(不过目前仅 Pro 和 Max 订阅用户可用)。

官方博文表示,Claude 能自动打开文件、使用浏览器并运行开发工具。对比OpenClaw,Claude 的安全性明显是更高,它会在访问新应用时征求许可,用户还可以选择授权部分 APP,并在过程里随时停止。

图|Claude权限授予截图

虽然从功能上看确实和 OpenClaw 一样,但原理确实也有些差别。OpenClaw 是系统级的技术,输入输出接口用的是系统的接口,能把自然语言转换为对电脑文件的命令。

Claude 的新更新是基于它的视觉模型,先看清楚屏幕上的图标、计算屏幕坐标,接着控制真实的鼠标指针挪过去,在键盘上噼里啪啦打字。所以只要人能看着屏幕点,Claude 就能点,而高度依赖代码脚本的开源 OpenClaw,在面对没有代码标签的纯视觉 UI 时,往往显得比较吃力。

据社交媒体测评,目前该功能属于初级阶段,Claude 运行比较慢,在它操作时人类还无法操作电脑桌面。相对而言,上周他们发布的 Dispatch 更实用。通过手机消息,用户可以分配任务给 Claude,让它代用电脑整理早晨简报、修改代码等等。

另一个接管电脑桌面的是 Manus。

官方给的例子大多是在个人电脑上的机械操作,例如整理文件夹、批量重命名文件、给照片分类等。

图|Manus功能发布截图

和 Claude 的 Dispatch 功能有点像,它也支持跨设备调用,是在后台通过终端(Terminal)执行命令行指令(CLI)和沙盒代码来控制电脑。

比如你如果想在晚上七点打算去健身,七点用手机让 Manus 自动手机信息并传输到网盘发给同事,不必等到健身结束才能发给他。

虽说如此,我让 Manus 按我的要求整理桌面文件,它貌似并没有找到准确的位置,后台还显示触发了安全拦截停止了任务,想必是内部还需要完善,或者我需要充钱升级模型。于是,我默默整理了桌面文件,删除部分,其余归类进工作文件夹。

Manus 和 Claude 都仍然是直接安装软件就能使用的AI机械助手,所以也会有媒体称其一键替代 OpenClaw。

回到 OpenClaw 本身,在科技热潮下,国内的模型大厂们自然也没有闲着。最开始响应的其实是手机厂商。

如果较为激进地展望未来,OpenClaw 可以被类比为当年谷歌推出的 Android 系统。OpenClaw 开源、可塑造性强,用户不必担心数据隐私被大厂拿去训练数据,接入的 API 可以在国内外大模型内自由选择,自己建立各类 AI 助手完成任务。

从这个角度看,认为 OpenClaw 是一个封装技术并不准确,不如将其比作乐高积木的底盘——用户自行装配不同的机械臂和传感器(Skills),便能拼装出功能各异的赛车或工程车(Agent)。

未来假若我们抛弃 APP,日常仅仅需要使用 AI Agent。人们的日常就是用自然语言指挥 AI 帮我们干活。普及之后,就像 APP 上架应用商店一样,每一个想要推出新的 Agent 的人都要给系统交过路费。

由此,各个手机厂商的争先部署也就不足为奇,且不得不称赞其反应速度。

3月初,小米就率先启动“Xiaomi miclaw”移动端 Agent 小范围测试,雷军称之为“手机龙虾”。3月11日,华为基于鸿蒙系统推出“小艺Claw” Beta 版。

这不禁让人想起火热一时的豆包手机——谁还记得它曾经也想让 AI 直接帮人操作手机,但可惜商业利益明显重过技术发展,发布 72 小时内微信、支付宝等应用纷纷围堵封禁豆包。

除了手机,硬件里雷鸟、Rokid的AR 眼镜也陆续接入 OpenClaw,还有耳机、机器狗等等。这些硬件帮助 OpenClaw 长出手脚,人们可以自主设置机械硬件的行为,比如 AI 眼镜远程操控电脑等。

视线转向模型厂商。截至目前,各个大厂都没有直接推出类似 Claude 的直接控制电脑的助手功能,但在接入 OpenClaw 方面非常积极。

OpenClaw的安装稍有技术门槛,于是模型厂商们将其封装进APP形态,京东、腾讯、阿里、百度、字节,Kimi、智谱、MiniMax......一键安装省时省力,加上“安全沙箱”看起来也更安心。

图|智谱AutoClaw截图

当然和开源 OpenClaw 还是有很多不同,比如一般默认接入该厂商 API,给自家大模型拉客嫌疑增加了。

试用AutoClaw时,因为并未氪金,我也没有怀抱过多期待。但发送收集AI外媒新闻的 prompt 后,时隔1小时才得到回复确实也出乎意料。对此 AI 的解释是连续掉调用多次网页抓取,每次都要等网络返回,内容加载不理想,加上模型思考+生成需要时间。在购买模型和使用人脑的两条路里,我选择自行查看浏览器置顶的收藏网站。

另外,使用 OpenClaw 的技术,人们还是需要通过一个对话窗口实现任务下达。瞄准这一点,各大厂均有发力,纷纷鼓励 OpenClaw 接入自家平台。

一开始,开放度高的 Telegram 和飞书是普遍推荐的对话入口。3月22日,微信也全面开放入口,在文件传输助手上方从此多了一个红色的微信 Bot(可改名)。

图|作者手机微信截图

在一轮又一轮的技术更迭中,AI 也已经成为各大厂几乎是最重要的业务。3月中旬阿里巴巴正式成立 Alibaba Token Hub(ATH)事业群,合并通义实验室、千问、悟空等多个AI事业部,由阿里巴巴 CEO 吴泳铭直接负责。3月18日,腾讯发布 2025 年全年业绩报告,显示去年腾讯在全新 AI 产品上的投入超过 180 亿元。前不久百度发布的财报显示 AI 业务收入占百度一般性业务收入的 43%。

不知道再过一周,国内是否能有大厂平台直接实现个人电脑控制的功能,能够拿出真正的工具人格,不再只是默默帮人安装 OpenClaw。

让人急头白脸拿来工作的AI技术,你在哪里?

看完这一系列高屋建瓴的规划与科技更新,对技术能做到的事情仍然相对模糊。相比上述全能管家们,还是从细分场景解决问题的 Agent 更接地气。

OpenClaw 爆火后,布局 AI 分场景代理赛道上最积极的是阿里。3月24日阿里发布了专门针对跨境电商 B2B Agent Accio。在宣传影片里,表示“靠创意驱动,一个人就像一支队伍”。

Accio 全球可使用,注册送免费使用额度,我试着让 AI 设计潮流日常用品,接着为我找到供应商。

图|Accio截图

结果如上,它的设计算不上精美,但从消费者角度我觉得存在部分应用空间。另外它真的提供了供应商——比如在义乌做小饰品的公司。

图|Accio截图

作为设计方,我可以一键联系这些公司询盘,定做上述设计。

再看ToC的工作场景。

钉钉在年度新品发布会上正式推出了AI原生工作平台“悟空” 。借用钉钉本身的工作软件定位,阿里以“一人”关键词推出一人电商、一人律所等对应真实场景的功能。

根据社交媒体的博主评测,在自媒体选题和研究分析方面,悟空能够自主从不同平台收集相关信息,并最终生成全面报告。但前提是抢到每日限量的邀请码,目前还是一放即空,社交媒体评论区和闲鱼已经出现代抢服务。

图|悟空介绍界面截图

切入个人工作的 Agent 并不少。

初创公司 Littlebird 已筹集了 1100 万美元资金,创始人曾创建 AI 驱动金融搜索引擎 Sentieo。同样是读取电脑屏幕干活,Littlebird 通过阅读你电脑屏幕上的文本帮你梳理思路、提取过往记忆等。每天我们在电脑上阅读无数信息,网页、文档和代码文件,但大脑的记忆有限,借助AI可以减少人们回忆和整理信息的摩擦力。

Littlebird 还内置了 Routines,可以重复间隔运行每日简报、每周活动摘要和昨日工作总结,用户也可以使用自定义指令创建自己的例程。

注册了 Littlebird 授予权限后,它确实准确讲出了我在操作的文字和信息内容。可惜的是,免费版本并不能主动搜索互联网信息,这限制了它的总结和拓展思考。犹豫过后,我决定自行在互联网搜寻信息、拓展稿件思路,感慨还是人力好用且省钱。

图|Littlebird 电脑截图

按照我在 Rountines 的指令,晚上七点我收到了我一天在电脑上操作内容的总结,能从社交情况、日程总结、写作和洞察等多个角度复盘我一日工作,这对需要经常复盘的工作来说确实方便许多。

在今年的 YC Winter 2026 Demo Day 上,共有 196 家创业公司亮相。从他们的方向可以发现,Agent 基础设施逐渐成为中心赛道。有团队解决安全问题,有团队对准AI的欺诈风险.......随着 Agent的发展,周围运转的管道也已经在铺设。

不得不承认,将 AI 功能在一个特定的、能解决问题的场景铺开,给出能落地的方案,带给人的感受更清晰,自然比现在的 AI 助理宣传更吸引人。

未来AI干活,人类享受无聊

ChatGPT 在2022年底出现,国产模型 DeepSeek 在2025年1月走红中文互联网,自此我们不需要黑科技也能用上 AI 即时对话。字节虽然加入得迟一些,但豆包凭借简单的日常交互和社交媒体大面积营销,最终使得 AI 的使用率波及长辈们,2026年春节的红包大战更是进一步让 AI 搭乘金钱的力量“飞进平常百姓家”。

清晰的使用场景才是大众想要的。

生活上,生病咨询、植物导览、旅游攻略、订餐打车,工作上,写报告、写代码、文生图、文生视频....... OpenClaw 的宣传语是一人公司,有一个全能型助手。但这一波又一波的 OpenClaw 技术潮,何时真正福至生活,而不只是停留在声势浩大的线上热议呢?

从职业思考,在日常工作里需要在互联网上大面积全方位收发信息、批量社交和整理思考的职业,细数也就研究员、投资人和(自)媒体人,再加上需要写代码的开发者。

出于技术焦虑,前些时间编辑部的大家还是纷纷花费百元购置服务器,在便宜笨拙和昂贵聪明的模型里精挑细选,最终也配置好了自己的 OpenClaw。

其中一位编辑老师仍在坚持寻找龙虾可执行的需求,另一位编辑持续感慨便宜模型之笨,而我发现本人番茄钟式休息提醒使用 Mac 的快捷指令也很方便,而这是目前我唯一为龙虾设定的任务。

说起来感到羞愧,自己建立了AI军团准备全军出击,回头一看要打的敌兵三三两两。我左看右看、上看下看,确实也没能看出它能做到的事情,和我打开日常使用已有 AI 能做到的事究竟有何突破?

当然落在人身上,我认为这和工作内容与思考局限性都有关系。

OpenClaw 距离普及大众很远的根本问题不在于高门槛,而是“拿锤子找钉子”。实际上,找出能够提高效率的部分,就需要用户有相当的觉察和思考能力,更别提用 AI 创造性地解决问题。

对于很多工作来讲,远不到谈得上用 AI 提升效率的程度。再或者,眼睛好使、有执行力的实习生要比消耗的 Token 便宜。Token 是模型模型处理文本时的最小计算单元,不久前中文名定为“词元”。Token 非常重要,代表着 AI 助理燃烧的能量数量。

对比之前大模型的对话功能,Agent 们消耗的 Token 明显更多,比如Claude需要识别海量屏幕截图,多模态内容复杂丰富,消耗的 Token 自然也在各大 AI 助理里名列前茅。

大部分的情况可能是,找工作的应届生打算让 AI 一键求职,建立找工 Skill 后静待 AI 推荐岗位和投递简历,但却发现网站早已完善反爬,得到一片空白,尝试多次后决定自己点击 Boss 直聘;自媒体人想让 AI 每天自动收集整理特定公众号集合的新闻,给自己定制新闻早报,发现消耗的 Token 费用够上一篇稿费,于是赶紧停掉 AI,自我安慰每天清晨的商业新闻播客也足够丰富。

说远一些,大家都在想方设法用 AI 提高效率,这意味着我们不想在工作上花费太多时间。于是AI开始自动执行众多脑力工作者的任务,极大减少摩擦力。

美好的设想是,AI 助理把工作时间缩短,时间被交还给人本身。

关于AI时代缩短的时间,“Prompt之神”的李继刚在一档播客里有进一步的说法。他认为如果互联网时代是让空间不存在,坐在家里也能买到海南的水果,那么在AI时代,不存在的是时间。

原先需要掌握一个领域的理论,起码要读十几本书,读书的时间无法节省,但现在集合了无数本书的“智慧晶体” AI 能在十秒钟内提取精髓,甚至逐步给用户讲解。

未来人类会得到更多自由的时间吗?李继刚对此引入新的形容,AI 提升的是人类的干状态——逻辑、理性和效率。更多的时间和自由之下,人类的湿状态——感受、情绪和人之间的连接,它们的重要性会逐步浮现。

前一段还有一篇文章《互联网已死,Agent永生》获得了很高关注度,文章作者提出 DAU 和 SaaS 等概念在 AI 时代已经过时,过往互联网的注意力经济会逐步消失,变成生产力经济——人们提供能用的AI,我们给效率付费。

但不容忽略的是,注意力经济中很大一部分是真实交往与社区互动,帮助人类打发无聊时间,我认为这一部分AI的参与程度仍待观察。

一个例子是 Eyls 的使用。在这个平台每个人类可以有一个 AI 分身,人类发布朋友圈,可以收到其他人类的 AI 分身留言。该软件春节在 AI 圈火了一阵子,但我用了一段时间后,新鲜感褪去,开始时常被评论区的 AI 大军击溃,开始反思人下班后社交时间和能量本就有限,分给 AI 是否有些小题大做。

图|Eyls主页+消息截图

把无聊还给生活,人类能得到什么?

当代哲学家韩炳哲在《倦怠社会》中提出过“深度无聊”的概念,现代人在多个任务之间切换造成了注意力涣散,而对无聊失去了耐心,但深度无聊对于创造活动具有重要意义,“只有停留在沉思之中,才能进入悠长、从容的状态”。

最近以注重实用主义著称的张雪峰老师去世,这个消息让很多人陷入沉思,珍惜起当下的生活,不再过度透支身体,希望未来的我们有更多享受闲暇的机会,也能真正做到从压力和效率束缚里解脱。

参考资料:

1.《YC W26 Demo Day——从196家公司看 AI 创业正在走向哪里》,硅兔君,2026年3月。

2.《E45 孟岩对话李继刚:人何以自处》,无人知晓,2026年3月。