AI进群,已经不是什么新鲜事了。
Slack、钉钉、飞书、企业微信里,早就有各种AI bot、智能助手和企业Agent。它们在形态上也做了很多尝试,阿里的悟空偏企业级Agent工作平台,字节的飞书aily偏协同办公里的企业智能体,微信正在灰度测试的“小微”则更像超级App里的原生办事助手。
Anthropic当然不是现在才意识到这个方向。
早在去年,Anthropic就发布过Claude和Slack的整合。那时的Claude更像是一个接入工作流的AI助手,承担群聊问答、总结和协助沟通的角色。
但它最近更新的Claude Tag,把“AI同事”这个概念往前再推了一步。
只要在工作群里@Claude,它就能顺着授权上下文拆任务、调工具、跑流程、交结果。可以理解为,Claude Code和Claude Cowork那种工作型Agent能力,被Anthropic塞到了群里。

Karpathy直接说,Claude Tag代表了LLM UI/UX(用户界面/用户体验)的第三次重设计。
第一代是网站,第二代是App,第三代则开始变成一个自包含、持久、异步的组织实体。
LLM的形态从最初的聊天入口,到这里,真正变成了一个有身份、有权限、有上下文、有任务状态的AI同事。

AI同事进群并不稀奇,关键是它能怎么干活。
工作群里最让人崩溃的,往往不是没人做事,而是信息散得到处都是。
群里随口一提的工作,要翻很多地方才能拼凑出完整的信息——产品指标在数据看板里,客户反馈在工单系统里,技术问题在GitHub里,销售进展在CRM里,会议结论在纪要里,真正的讨论又散落在一条条群消息里。
你突然被老板或者同事@了,最麻烦的不是先判断“现在要干啥”,而是要花半天时间,搞清楚现在是什么状况。
Claude Tag接的就是这种活。
按照Anthropic的说法,管理员可以把Claude加进指定Slack频道,给它授权相关工具、数据,甚至代码库。之后,频道里任何人都可以直接@Claude,把任务交给它。
Claude会顺着已有上下文,把任务拆成阶段,再调用可用工具逐步完成,最后把结果交回同一个讨论串。

它有几个非常重要的功能,也是让它更像一个“真人AI同事”的点睛之处:
首先,它是多人协作的。任何人都可以看到Claude的工作内容,并且可以从上次中断的地方继续对话。
其次,它会随着时间推移不断学习。无需反复从头解释,随着Claude在工作中的参与,它会逐步构建更多关于工作的背景信息。

再次,它会主动出击(很有工作积极性)。如果启用了“ambient”行为,Claude会主动推送它认为你可能需要了解的任何信息,也能提醒那些长期无人跟进的任务。

最后,它是异步工作的。给Claude分配任务后,你就可以专注于其他优先事项,它会在一旁闷头干活,还能自行安排任务,自主地在数小时甚至数天内完成项目。

官方文档表示:如果你之前使用过Claude Code或Cowork,那么Claude Tag对你来说应该并不陌生。
可以粗暴理解为,它把Claude Code装了个群助手的壳子,然后塞到了工作群里——只要权限给够,Claude Code能干的,它也能干。
过去开发者在终端里使唤Claude,现在所有人都能在工作群里@Claude。

其中最基础的用法,是让Claude帮你“快速补课”。
一个工作群聊了半天,消息已经刷了几十上百条,你手上的活还没干完,突然被cue了一下,有个新活要交给你。以前你只能一条条往上翻,现在可以直接@Claude问它:“这里刚刚决定了什么?还有哪些问题没解决?”
Claude会把长长的讨论压缩成几件事:已经定下来的结论、还没解决的问题、相关负责人,以及下一步谁要做什么。

这项功能对我们打工人来说非常实用,谁要做什么,直接一目了然,省了很多麻烦。
你还可以让Claude直接帮你拉数据、或者做会前准备——任何需要翻看大量信息的事情,它都能帮你一键整理,给出清晰的回复。

另外还有一个特贴心的功能,值得专门一提:Claude Tag可以管理那些长期没有精力处理的工作群,筛出真正需要人类审核的步骤。
很多人手上都有这种被设置成免打扰的“半荒废群聊”:客服反馈、告警、工单、数据异常、线上事故……它们每天都有消息进来,但每条消息又不一定值得人立刻放下手头工作去处理,要是持续关注只会影响手头工作。
久而久之,低优先级事项越堆越多,真正需要解决的问题反而被埋没。
Claude Tag适合做第一层筛选,把明显紧急的内容挑出来,把需要人工判断的部分单独@给负责人。
对普通员工来说,这意味着少被无效信息打断;对老板来说,这意味着过去那些长期没人收口的碎活,有人帮你持续盯着。
我觉得这能算是Claude Tag最像“AI牛马”的地方:它可以守在那些犄角旮旯里,把真正需要人的工作捞出来。

毕竟,在工作场景里,AI助手被用得最多的地方,不就是处理信息么?
但要只是处理信息,未免太屈才了一些——这可是Claude啊!
官方页面里有一个很典型的例子:群里有人报了一个bug,说某个服务在token刷新时出现502,另一个人直接@Claude,让它“根据这条讨论修复bug,并打开一个draft PR”。
普通AI助手可能最多总结一下bug现象,或者给一个排查建议。但如果Claude拿到了代码库、工单和开发工具权限,它就可以顺着群里的bug描述去找相关代码,判断问题可能出在哪里,提出修复方案,甚至直接生成一个待审核的PR。

要是单看官方文档中列举的那些功能,能理解上下文、能规划任务、能调用工具、能异步执行……每一个似乎都不新鲜。但因为是Claude,所以很强。
并且它把这几个功能收敛到了同一个产品形态里——把强模型、上下文、工具调用、多阶段执行和团队协作,收敛成了一个@Claude。
这种形态才是最值得学习的地方。
此前我们讨论豆包时曾判断,AI App想从轻办公走向重办公,关键就是进入多人协作场景。人类负责讨论和判断,AI负责在讨论之后总结、查证和执行。
现在,Claude Tag先把这种协作方式做了出来。
Claude Code和Claude Cowork团队负责人之一Fiona Fung此前提到,Claude Code用久之后,工程师越来越多地和自己的agent单独工作,反而会变成一种孤独体验。个人Agent让单个人变强,但也可能让工作更孤岛化。
而Claude Tag的逻辑刚好反过来——它不是把人从团队里带走,让每个人都躲进自己的AI窗口里单兵作战;而是把Agent拉到公共讨论现场。
人类先讨论、争论、碰撞,形成方向;Claude再接住上下文,负责总结、查证、拆解和执行。
Karpathy说的“LLM UI/UX第三次重设计”,看起来是LLM的三种不同形态,背后其实也对应着LLM承接的不同任务。
第一代网站形态,LLM承接的是问答。用户打开聊天框,问一个问题,拿一个答案。
第二代App形态,LLM承接的是个人工作。它进入IDE、终端、桌面和浏览器,帮一个人写代码、改文件、查资料、生成内容。
到第三代组织实体形态,LLM承接的则是团队协作之后的执行。它不只是回答某个人的问题或者帮某个人完成任务,而是出现在团队讨论现场,把一群人刚刚形成的上下文、共识和待办,继续往前推进。
可以说,在第三种形态,当LLM开始从“工具”变成一个可以被@的实体角色,它的功能也需要顺应着进化、变得更符合它的“身份”。
很多企业Agent此前难落地的原因就在于此。它们看起来有企业级入口,也接了办公软件,但真正能承接的任务还停在第一代或第二代:要么只是问答和总结,要么只是个人效率工具。
但企业真正需要的是第三种能力——把团队讨论变成行动,把组织里的信息、决策和执行串起来。
Claude Tag的启发就在这里,可以认为,未来企业Agent至少要往三个方向走:从个人Agent走向群组Agent,从问答工具走向异步执行者,从功能堆叠走向能力收敛。
让Agent更像一个“高效率的人类员工”,成为团队里那个能接住上下文、推进流程、持续收口的万能同事,才是企业Agent真正有机会落地的形态。
不过,对于大部分的企业Agent而言,距离实现这种产品形态还是有一定距离,主要有两方面原因:
一方面,功能还不够好。很多产品能总结会议、能查知识库、能写文档,但一旦进入复杂工作流,就很难真正闭环。
另一方面,模型也确实不够强。企业Agent不是会聊天就够了,它要理解复杂上下文、企业黑话、模糊需求、跨系统信息,还要能拆任务、调工具、处理异常……很多Agent演示时很惊艳,真进公司之后就容易变成“能做,但只能做一点,多了就降智”。
模型做好了,哪怕自己不包装,也会有别的工具商帮你加壳,说到底,形态其实是锦上添花。
当然,AI同事进群以后,并不是老板终于捡到了免费牛马。
一个很现实的情况是:虽然Claude强,但它贵啊!

(图片由AI生成)
Anthropic官方说,Claude Tag目前运行在Opus 4.8上。按照公开API价格,Opus 4.8的起步价是每百万输入token 5美元、每百万输出token 25美元。
但普通聊天是你问一句它回一句,企业Agent可不是这样。它可能要先读完一个工作群的历史讨论,再查工单,再翻CRM,再看代码库,再跑数据分析,再写文档或生成PR。每一步都会产生新的输入、输出和工具调用,也会把更多上下文继续带进后续步骤。
复杂Agent任务的token消耗远高于普通代码问答,尤其是Claude Tag这种产品,官方强调它可以异步工作,任务可能持续数小时甚至数天。它越像一个真正的AI同事,就越不可能只是便宜的群聊机器人。
如果一个公司只是偶尔让Claude总结一下会议,费用可能还好,但如果每个工作群都有一个Claude,每个项目都让它长期盯着,对token的消耗简直如同开闸泄洪。
所以,AI同事不一定比人便宜。尤其是当这个AI同事足够聪明、足够勤快、足够愿意加班的时候。
未来企业用Agent,很可能不会把所有活都交给最强模型,更现实的做法是分层使用。
普通总结、分类、提醒,可以交给便宜模型;复杂分析、跨系统任务、关键客户、重要代码,可以交给Claude这样的强模型;涉及金钱、客户承诺、生产环境、权限变更的动作,则必须有人类确认。
你会让高薪聘来的指导专家帮忙搬桌子么?
这也是Claude Tag官方设计里很企业化的一点:管理员可以设置组织级和频道级的token花费上限,查看Claude执行过哪些任务,也能控制它能进哪些频道、用哪些工具、访问哪些数据。
换句话说,AI同事也要有预算啊。咱不能只看“它能不能干”,还得看“这件事值不值得让它干”。
除了价格,另一个更大的问题是权限。
Claude Tag最有吸引力的地方,是它能接入工具、数据,甚至代码库。可这也意味着,它不只是一个会聊天的Chatbot,而是一个可能触碰真实资产的执行者。
AI一旦进入公司工作流,能力问题很快就会变成治理问题。
过去很多自动化工具和AI coding agent被吐槽“删库跑路”,本质上不是模型突然有了坏心,而是权限边界没有设计好。一个Agent一旦拿到过大的权限,又缺少确认、回滚和审计机制,它的错误就不再只是生成一段废话,而会变成真实世界里的损失。
企业Agent的价值从来不是证明AI同事可以无限自治,而是把Agent放在一个相对可控的位置:工作群里、讨论串里、管理员权限下、团队成员都能看见。
企业Agent比较现实的落地方式是,先让AI进入协作层,帮人总结、查证、拆解、提醒;再逐步进入执行层,调用工具、生成文档、提交PR;最后才是更深的自动化。
AI同事如果手握太多权限,错误很容易从文本世界进入现实系统——但AI可没办法像人类员工那样担责。
