6月初的AI圈,有两件事值得放在一起看。
一件是OpenAI举办的Intelligence at Work发布会。OpenAI宣布,Codex的周活用户已经突破500万,较年初暴涨8倍,非开发者已经占到 Codex 整体用户的20%,包括分析师、营销人员、运营、设计师、研究员、投资人和银行从业者。
而且这部分用户的增长速度是开发者的3倍以上。更关键的是,OpenAI同时还宣布,未来几周会把更多Codex功能放进ChatGPT App里。
另一件事是豆包官方发了一篇公众号长文,正面澄清"豆包专业版"的传闻。明确说,要出专业版,覆盖软件开发、数据分析、专业设计、流程自动化、金融分析、科学研究六大领域。目前已经开通PC端内测,手机端尚未上线。
这两条消息几乎同步,也说明无论是ChatGPT还是豆包,都普遍认为,Agent全面走向大众的时机已经成熟。从对话到执行,帮助越来越多的人做事,成为AI助手下一步的目标。
ChatGPT和豆包都是用户量很庞大的AI助手,共同的问题是都不怎么赚钱。不过近几个月,OpenAI已经靠Codex获得一定的营收增长,豆包专业版想要堂堂正正赚钱,似乎也要Codex化。
尽管豆包月活用户国内第一,对很多用户来说它仍是个娱乐工具,很难成为真正的工作搭子。这一点从豆包收费的话题传出来之后,一些用户的反应是“笨还收费”能看出来。
眼下,豆包急需扭转自己在用户心中的形象。
声称能做大多数白领工作的豆包专业版,被寄予了厚望。据我们了解,本月底配合豆包专业付费版一起上线的,还有豆包即将更新的模型。新模型的能力有望提升豆包在工作流上的能力。
36氪最近报道,今年字节跳动有几个重要命题,其中之一是,进一步打好Coding的地基,做好Coding的Dogfooding(数据回流、评测,形成飞轮),提升Agent能力。另一个是,豆包强化商业化能力,重点场景是“办公”。
豆包专业版,覆盖软件开发、数据分析、专业设计、流程自动化、金融分析、科学研究六大领域。这也是OpenAI的Codex全面覆盖的领域。
今年6月的发布会上,Codex宣布六大岗位Agent插件,覆盖数据分析、销售、创意制作、产品设计、股权投资和投行。每个插件都内置了该岗位需要的工具连接、领域知识和操作流程,相当于你会拥有一个懂全流程的同事搭子。
相比于ChatGPT的写作、创作和对话,今年2月推出的Codex桌面版,已经能本地运行,可以直接读取电脑里的文件,甚至直接调用飞书等其他外部工具。在生产力服务上,Codex有更多的权限,看起来更像人在操作电脑。
Codex融入ChatGPT的野心,不只是成为超级应用,而是看到用户结构变化的拐点。要知道,Codex早已不只是编码工具,用户结构今年发生了很大变化,分析师、设计师、投行从业者等非开发者用户迅速增长,增速是开发者的3倍。
OpenAI似乎看到了另一种不同于Anthropic商业模式的可能。
目前Codex知识工作者占比已经达到20%。OpenAI称,2026年第一季度财报,实现营收约57亿美元。其中最主要的增长引擎就来自表现强劲的Codex。
和OpenAI相同的是,想要塑造自身在知识工作者圈层的专业形象,豆包的用户规模存在一定优势。不同的是,OpenAI的Codex已经运作一年才形成如今不错的口碑。
豆包想要实现六大领域的专业收费并不容易。尤其在软件开发能力上,要面对代码仓库、权限、安全、上下文窗口、测试、依赖、多人协作。豆包模型在Coding上的能力表现并不出众,名声似乎也不如Kimi和智谱。
不只软件开发,金融分析、科学研究等领域,每一项专业能力都会面对非常严苛的审视。日常中用户对AI出错率的包容度较大,但到了涉及到业务收入、合规等复杂场景,人们对AI出错的包容几乎为零。
在豆包专业版说明文章下,有用户说的就很直白,别只当个更聪明的聊天框,多花心思把专业软件的API和工作流真正打通,大家才会心甘情愿付费。
这场专业版的战场不容易,豆包免费打天下几年了,DAU已经做到国内AI助手的第一名,但一直没有清晰的变现路径。切入办公场景,推出付费专业版,只是豆包实现商业化落地的第一步。
如果,OpenAI通过组织架构调整和产品统一的方式能走通超级应用的模式,豆包也可以。ChatGPT有Codex,豆包背后还有字节的TRAE或者扣子。
从娱乐工具到实现办公搭子的形象改变,豆包也不是没有队友。
2026年3月底至4月初的信息,TRAE SOLO从原来纯粹的AI编程工具,升级为通用Agent工作台后。除了为开发者保留的Code Mode之外,新增的核心模式是Agent Mode(智能体模式),这个模式面向非开发相关的用户,包括产品经理、数据分析师、运营等,尤其适合处理文档、数据、演示稿等。
为了强调自己不再止于编码,TRAE界面也显示出几个醒目的大字:不止于码,大有可为。网页版底部还写着,双模式智能体,Work模式与 Code模式一键切换。
这意味着原本作为编程助手的TRAE ,如今已不甘于服务一小波开发者,而是想变成能被更多用户使用的通用Agent生产力平台。

除了TRAE之外,字节跳动另一个真正意义上的Agent产品是扣子。扣子(Coze)本身就是一个Agent平台,大家常说的编程(扣子编程)不过是它的一个分支能力。
6月1日,扣子3.0电脑端和App也迎来全面升级,官方称,把Agent带进了更完整的工作现场,用户可以在网页端创建和管理任务,在桌面端连接本地文件,也可以在手机上用扣子App推进任务、继续调度Agent,甚至“遥控”操作电脑。
这都是Agent的属性。新版扣子的最大亮点是,对于已经在本地使用 Claude Code、Codex CLI、OpenClaw 的朋友,现在也可以把它们接入扣子。接入后,这些本地Agent不再只是停留在各自的工具里,而是可以进入扣子的同一个项目空间,和其他Agent一起围绕同一个目标协作推进。
别人的Agent也可以运行在我的平台上,这意味着扣子有更大的野心,那就是争夺Agent平台层。
大胆假设一下。相比更偏代码执行层的TRAE,如果扣子的Agent底座能力接入豆包,或许是豆包专业版的最优解。扣子定位的流程自动化、多工具调用、低代码搭建、办公助手、插件、知识库、工作流等这些能力,都可以横向覆盖豆包专业版的多个方向。
当用户在豆包里提需求说“帮我分析这家公司”“生成一份投研报告”或者“把表格清洗后做PPT”时,背后实际上是由扣子式Agent拆任务、调工具、连知识库、跑流程。
这对扣子和豆包属于双赢。扣子短时间可以承接豆包庞大的规模优势,改变以往用户数据有限的困境。豆包也可以在办公场景,建立自己的用户心智。
当前最大问题就是,豆包和扣子这两个字节内部不同的组织,能否真正协同起来把这件事干了。
