agent进驻工作群，我们给豆包支的招，Claude听进去了 - AI

Just Quick Just Quality

热门话题

白天

搜索

资讯

agent进驻工作群，我们给豆包支的招，Claude听进去了

9 小时前 / 阅读约13分钟

来源：36kr

Anthropic更新Claude Tag，将AI同事概念推进，可拆任务、调工具、跑流程、交结果，具多人协作、学习、主动、异步工作等功能，还探讨了LLM形态演变、企业Agent发展方向及使用成本与权限问题。

AI进群，已经不是什么新鲜事了。

Slack、钉钉、飞书、企业微信里，早就有各种AI bot、智能助手和企业Agent。它们在形态上也做了很多尝试，阿里的悟空偏企业级Agent工作平台，字节的飞书aily偏协同办公里的企业智能体，微信正在灰度测试的“小微”则更像超级App里的原生办事助手。

Anthropic当然不是现在才意识到这个方向。

早在去年，Anthropic就发布过Claude和Slack的整合。那时的Claude更像是一个接入工作流的AI助手，承担群聊问答、总结和协助沟通的角色。

但它最近更新的Claude Tag，把“AI同事”这个概念往前再推了一步。

只要在工作群里@Claude，它就能顺着授权上下文拆任务、调工具、跑流程、交结果。可以理解为，Claude Code和Claude Cowork那种工作型Agent能力，被Anthropic塞到了群里。

Karpathy直接说，Claude Tag代表了LLM UI/UX（用户界面/用户体验）的第三次重设计。

第一代是网站，第二代是App，第三代则开始变成一个自包含、持久、异步的组织实体。

LLM的形态从最初的聊天入口，到这里，真正变成了一个有身份、有权限、有上下文、有任务状态的AI同事。

AI同事进群并不稀奇，关键是它能怎么干活。

01 @Claude：告诉我你能干啥

工作群里最让人崩溃的，往往不是没人做事，而是信息散得到处都是。

群里随口一提的工作，要翻很多地方才能拼凑出完整的信息——产品指标在数据看板里，客户反馈在工单系统里，技术问题在GitHub里，销售进展在CRM里，会议结论在纪要里，真正的讨论又散落在一条条群消息里。

你突然被老板或者同事@了，最麻烦的不是先判断“现在要干啥”，而是要花半天时间，搞清楚现在是什么状况。

Claude Tag接的就是这种活。

按照Anthropic的说法，管理员可以把Claude加进指定Slack频道，给它授权相关工具、数据，甚至代码库。之后，频道里任何人都可以直接@Claude，把任务交给它。

Claude会顺着已有上下文，把任务拆成阶段，再调用可用工具逐步完成，最后把结果交回同一个讨论串。

它有几个非常重要的功能，也是让它更像一个“真人AI同事”的点睛之处：

首先，它是多人协作的。任何人都可以看到Claude的工作内容，并且可以从上次中断的地方继续对话。

其次，它会随着时间推移不断学习。无需反复从头解释，随着Claude在工作中的参与，它会逐步构建更多关于工作的背景信息。

再次，它会主动出击（很有工作积极性）。如果启用了“ambient”行为，Claude会主动推送它认为你可能需要了解的任何信息，也能提醒那些长期无人跟进的任务。

最后，它是异步工作的。给Claude分配任务后，你就可以专注于其他优先事项，它会在一旁闷头干活，还能自行安排任务，自主地在数小时甚至数天内完成项目。

官方文档表示：如果你之前使用过Claude Code或Cowork，那么Claude Tag对你来说应该并不陌生。

可以粗暴理解为，它把Claude Code装了个群助手的壳子，然后塞到了工作群里——只要权限给够，Claude Code能干的，它也能干。

过去开发者在终端里使唤Claude，现在所有人都能在工作群里@Claude。

其中最基础的用法，是让Claude帮你“快速补课”。

一个工作群聊了半天，消息已经刷了几十上百条，你手上的活还没干完，突然被cue了一下，有个新活要交给你。以前你只能一条条往上翻，现在可以直接@Claude问它：“这里刚刚决定了什么？还有哪些问题没解决？”

Claude会把长长的讨论压缩成几件事：已经定下来的结论、还没解决的问题、相关负责人，以及下一步谁要做什么。

这项功能对我们打工人来说非常实用，谁要做什么，直接一目了然，省了很多麻烦。

你还可以让Claude直接帮你拉数据、或者做会前准备——任何需要翻看大量信息的事情，它都能帮你一键整理，给出清晰的回复。

另外还有一个特贴心的功能，值得专门一提：Claude Tag可以管理那些长期没有精力处理的工作群，筛出真正需要人类审核的步骤。

很多人手上都有这种被设置成免打扰的“半荒废群聊”：客服反馈、告警、工单、数据异常、线上事故……它们每天都有消息进来，但每条消息又不一定值得人立刻放下手头工作去处理，要是持续关注只会影响手头工作。

久而久之，低优先级事项越堆越多，真正需要解决的问题反而被埋没。

Claude Tag适合做第一层筛选，把明显紧急的内容挑出来，把需要人工判断的部分单独@给负责人。

对普通员工来说，这意味着少被无效信息打断；对老板来说，这意味着过去那些长期没人收口的碎活，有人帮你持续盯着。

我觉得这能算是Claude Tag最像“AI牛马”的地方：它可以守在那些犄角旮旯里，把真正需要人的工作捞出来。

毕竟，在工作场景里，AI助手被用得最多的地方，不就是处理信息么？

但要只是处理信息，未免太屈才了一些——这可是Claude啊！

官方页面里有一个很典型的例子：群里有人报了一个bug，说某个服务在token刷新时出现502，另一个人直接@Claude，让它“根据这条讨论修复bug，并打开一个draft PR”。

普通AI助手可能最多总结一下bug现象，或者给一个排查建议。但如果Claude拿到了代码库、工单和开发工具权限，它就可以顺着群里的bug描述去找相关代码，判断问题可能出在哪里，提出修复方案，甚至直接生成一个待审核的PR。

要是单看官方文档中列举的那些功能，能理解上下文、能规划任务、能调用工具、能异步执行……每一个似乎都不新鲜。但因为是Claude，所以很强。

并且它把这几个功能收敛到了同一个产品形态里——把强模型、上下文、工具调用、多阶段执行和团队协作，收敛成了一个@Claude。

这种形态才是最值得学习的地方。

02 LLM的第三种形态

此前我们讨论豆包时曾判断，AI App想从轻办公走向重办公，关键就是进入多人协作场景。人类负责讨论和判断，AI负责在讨论之后总结、查证和执行。

现在，Claude Tag先把这种协作方式做了出来。

Claude Code和Claude Cowork团队负责人之一Fiona Fung此前提到，Claude Code用久之后，工程师越来越多地和自己的agent单独工作，反而会变成一种孤独体验。个人Agent让单个人变强，但也可能让工作更孤岛化。

而Claude Tag的逻辑刚好反过来——它不是把人从团队里带走，让每个人都躲进自己的AI窗口里单兵作战；而是把Agent拉到公共讨论现场。

人类先讨论、争论、碰撞，形成方向；Claude再接住上下文，负责总结、查证、拆解和执行。

Karpathy说的“LLM UI/UX第三次重设计”，看起来是LLM的三种不同形态，背后其实也对应着LLM承接的不同任务。

第一代网站形态，LLM承接的是问答。用户打开聊天框，问一个问题，拿一个答案。

第二代App形态，LLM承接的是个人工作。它进入IDE、终端、桌面和浏览器，帮一个人写代码、改文件、查资料、生成内容。

到第三代组织实体形态，LLM承接的则是团队协作之后的执行。它不只是回答某个人的问题或者帮某个人完成任务，而是出现在团队讨论现场，把一群人刚刚形成的上下文、共识和待办，继续往前推进。

可以说，在第三种形态，当LLM开始从“工具”变成一个可以被@的实体角色，它的功能也需要顺应着进化、变得更符合它的“身份”。

很多企业Agent此前难落地的原因就在于此。它们看起来有企业级入口，也接了办公软件，但真正能承接的任务还停在第一代或第二代：要么只是问答和总结，要么只是个人效率工具。

但企业真正需要的是第三种能力——把团队讨论变成行动，把组织里的信息、决策和执行串起来。

Claude Tag的启发就在这里，可以认为，未来企业Agent至少要往三个方向走：从个人Agent走向群组Agent，从问答工具走向异步执行者，从功能堆叠走向能力收敛。

让Agent更像一个“高效率的人类员工”，成为团队里那个能接住上下文、推进流程、持续收口的万能同事，才是企业Agent真正有机会落地的形态。

不过，对于大部分的企业Agent而言，距离实现这种产品形态还是有一定距离，主要有两方面原因：

一方面，功能还不够好。很多产品能总结会议、能查知识库、能写文档，但一旦进入复杂工作流，就很难真正闭环。

另一方面，模型也确实不够强。企业Agent不是会聊天就够了，它要理解复杂上下文、企业黑话、模糊需求、跨系统信息，还要能拆任务、调工具、处理异常……很多Agent演示时很惊艳，真进公司之后就容易变成“能做，但只能做一点，多了就降智”。

模型做好了，哪怕自己不包装，也会有别的工具商帮你加壳，说到底，形态其实是锦上添花。

03 虽然它强，但它贵啊

当然，AI同事进群以后，并不是老板终于捡到了免费牛马。

一个很现实的情况是：虽然Claude强，但它贵啊！

（图片由AI生成）

Anthropic官方说，Claude Tag目前运行在Opus 4.8上。按照公开API价格，Opus 4.8的起步价是每百万输入token 5美元、每百万输出token 25美元。

但普通聊天是你问一句它回一句，企业Agent可不是这样。它可能要先读完一个工作群的历史讨论，再查工单，再翻CRM，再看代码库，再跑数据分析，再写文档或生成PR。每一步都会产生新的输入、输出和工具调用，也会把更多上下文继续带进后续步骤。

复杂Agent任务的token消耗远高于普通代码问答，尤其是Claude Tag这种产品，官方强调它可以异步工作，任务可能持续数小时甚至数天。它越像一个真正的AI同事，就越不可能只是便宜的群聊机器人。

如果一个公司只是偶尔让Claude总结一下会议，费用可能还好，但如果每个工作群都有一个Claude，每个项目都让它长期盯着，对token的消耗简直如同开闸泄洪。

所以，AI同事不一定比人便宜。尤其是当这个AI同事足够聪明、足够勤快、足够愿意加班的时候。

未来企业用Agent，很可能不会把所有活都交给最强模型，更现实的做法是分层使用。

普通总结、分类、提醒，可以交给便宜模型；复杂分析、跨系统任务、关键客户、重要代码，可以交给Claude这样的强模型；涉及金钱、客户承诺、生产环境、权限变更的动作，则必须有人类确认。

你会让高薪聘来的指导专家帮忙搬桌子么？

这也是Claude Tag官方设计里很企业化的一点：管理员可以设置组织级和频道级的token花费上限，查看Claude执行过哪些任务，也能控制它能进哪些频道、用哪些工具、访问哪些数据。

换句话说，AI同事也要有预算啊。咱不能只看“它能不能干”，还得看“这件事值不值得让它干”。

除了价格，另一个更大的问题是权限。

Claude Tag最有吸引力的地方，是它能接入工具、数据，甚至代码库。可这也意味着，它不只是一个会聊天的Chatbot，而是一个可能触碰真实资产的执行者。

AI一旦进入公司工作流，能力问题很快就会变成治理问题。

过去很多自动化工具和AI coding agent被吐槽“删库跑路”，本质上不是模型突然有了坏心，而是权限边界没有设计好。一个Agent一旦拿到过大的权限，又缺少确认、回滚和审计机制，它的错误就不再只是生成一段废话，而会变成真实世界里的损失。

企业Agent的价值从来不是证明AI同事可以无限自治，而是把Agent放在一个相对可控的位置：工作群里、讨论串里、管理员权限下、团队成员都能看见。

企业Agent比较现实的落地方式是，先让AI进入协作层，帮人总结、查证、拆解、提醒；再逐步进入执行层，调用工具、生成文档、提交PR；最后才是更深的自动化。

AI同事如果手握太多权限，错误很容易从文本世界进入现实系统——但AI可没办法像人类员工那样担责。

上一篇：连接启智，知意即达：移动AI产业生态大会在上海MWC隆重召开，定义智能化发展新范式

下一篇：英伟达都在用的3D大模型Hyper3D再获数亿融资，背后是一群中国00后

返回列表

热文阅读

2 天前

车企营销不能再“乱吹”了，自动驾驶国标出台，明年7月实施

2 天前

修了30年车，他们最后败给了新能源

2 天前

DeepSeek急急急缺人，外国人也要

2 天前

「AI几小时攻破NSA」刷屏，真相竟是一场红队演习？

2 天前

中国团队拿下ICRA'26最佳论文：Agentic Coding驱动工业制造通往自主通用智能

1 天前

成立不到90天，阿里前高管创立的昆仑行机器人获数十亿元融资

1 天前

被骂了一年的Codex，怎么突然爆了？

2 天前

两万一套房的鹤壁，连夜给英伟达供货

1 天前

“新能源汽车第一省”，又多了一个挑战者

2 天前

大模型“倒爷”微软：GPT带到东方，DeepSeek卖给西方

上一篇：连接启智，知意即达：移动AI产业生态大会在上海MWC隆重召开，定义智能化发展新范式

下一篇：英伟达都在用的3D大模型Hyper3D再获数亿融资，背后是一群中国00后

Just Quick Just Quality

发现

资讯话题

热门话题

7 x 24跟踪全球科技动态

快讯

资讯

视频

关于我们