对话火山引擎张鑫:Agent平台的主战场不在开发,在“用人”
6 小时前 / 阅读约10分钟
来源:凤凰网
火山引擎副总裁张鑫表示,企业Agent规模化落地复杂繁琐,需统一管理平台。火山引擎提出“1+N+X”体系,通过全生命周期管理形成差异化,并探索前沿部署工程师实践。

2026年中,一家中等以上规模且较早探索Agent的企业,内部有多少Agent在跑?平均值约为三百个。

厘清Agent的数量都是一个难以统计的答案,若继续追问,这些Agent具体是哪些人在用、烧了多少钱,效果具体如何,几乎没有企业能说清楚。这不是个例,而是现阶段的企业,并没有建立一个以Agent为核心的系统和组织。

换而言之,以前企业更多是单点的开发、使用Agent,随着Agent数量和质量的提升,企业越是深入使用Agent,就会越早发现另一重难题——Agent在企业的规模化落地,比预想中的复杂且繁琐。

火山引擎副总裁张鑫表示,Agent的效果绝对不是仅仅由开发态决定的,而是需要一个全域的、不断滚动的过程。“这些Agent烧了多少的Token,每天的绩效怎么样,哪些绩效不好该‘开除’,哪些绩效很好要‘升职’,企业需要一个统一管理的平台。”

这也是张鑫观察到的整个市场的根本性改变,多数人还在盯着怎么造Agent时,真正的战场已经转移了,Agent从一种尝鲜性质的创新产品,演变成深度融入企业所有核心生产和中长尾场景的数字员工,Agent平台的核心竞争力也随之变化。

今年以来,扣子3.0、TRAE企业版、HiAgent 3.0、AgentSphere四款产品的迭代和商业化落地明显提速,本质上就是为了应对这种趋势,火山引擎将如何回答企业Agent规模化落地的系统命题,时隔一年之后,钛媒体App和张鑫做了一次对话。

当造Agent不再是问题

过去一年,Agent开发平台的技术迭代速度超出所有人预期。工作流、Skills、Agentic Loop、Vibe Coding,新的构建方式层出不穷,零代码工具让搭建智能体变得越来越简单。

“企业里构建Agent已经不是门槛了,大家谁都能构建。”张鑫说,但“能造”和“造好”之间,隔着一道巨大的鸿沟。

张鑫走访大量企业后发现,企业的焦虑非但没有减少,反而加剧了。去年企业以为找到了路径,通过低代码、工作流去构建Agent,2026年春节开始,新的技术不断在推翻前面的范式,选择多了,企业反而更困惑,以前买的产品是不是过时,这是企业问得最多的问题。

焦虑的根源在于,企业发现真正的卡点不在“造”,而在“用”。大部分企业已经能做到局部提效,代码生成环节接一个TRAE或Claude Code,从一小时降到5分钟。但企业的端对端流程里,可能有十余个步骤,上下游的测试、发布、运维还是人工处理。

“如果你只解决其中一个AI步骤,上游下游还是卡着,中间缩短的那1小时没有任何意义,”张鑫说。这些端对端的系统集成,看起来是脏活累活,跟底层模型迭代相比没那么令人兴奋,但这确实就是真正做到大企业深水区,Agent落地绕不过的门槛。

更棘手的是,Agent造出来之后,没有一个清晰的管理工具。张鑫总结了三个具象的痛点:家底不清,企业到底有多少个Agent在跑,都是谁在用,回答不清楚;成本黑洞,每天烧了多少Token、产生了多少成本,很多企业内部没有统计;缺乏度量,怎么评估Agent的绩效,哪些该下架,哪些该加大投入。

这个判断直接影响了火山引擎的产品策略。去年提出的“1+N+X”体系里,“1”是想做统一交互入口,今年张鑫发现,每个产品都能部分承担AI工作台的入口角色,企业管理者依旧需要一个统一的管理入口,所以火山引擎对于“1”的定位,从统一交互入口变成了统一管理入口。

围绕“1”从统一交互入口变成统一管理入口的判断,可以看出,企业需要的从来不是几个孤立的Agent,而是一套面向不同角色和部门、彼此联动的产品矩阵。通过“1”的数字员工统一管理入口,将所有数字员工纳入统一体系经营与度量;“N”是多个开箱即用的智能化应用,承接企业通用需求;“X”是无限多个持续进化的业务智能应用,企业可基于TRAE、扣子、HiAgent持续创建、运行、观测、优化专属数字员工。

Agent开发之后的主战场

既然开发不再是壁垒,壁垒到底在哪?

张鑫把Agent的全生命周期拆成四个域:开发域搭建Agent;运行域通过Harness让Agent跑得更好,包括记忆管理、知识融合、上下文管理、Multi-Agent编排、意图识别;消费域通过好的交互和人机协同方式让员工使用Agent;管理域像管理数字员工一样管理Agent,做绩效考评、度量价值。

“Agent的效果绝对不仅仅由开发域决定,”他说,“在运行域,你的Harness做得够不够好,在消费域,人机协同的机制设计得好不好,Agent需设计好人在关键节点介入的机制,让最终效果达到100分。在管理域,能不能像管人一样管数字员工。”

由此可以看出,火山引擎已经不只在开发域和其他平台竞争,而是通过四个域的全生命周期管理形成差异化,这个判断的背后,是三个层面的竞争壁垒。

第一层壁垒是Harness。模型能力越来越强,会吃掉多少中间层,是一个被反复讨论的话题。

张鑫的判断是,Harness不会被吃掉。“Harness解决六个维度的问题:可控、可靠、可审计、可规模化、全生命周期管理、价值可度量。以当前Next Token Prediction的技术架构,总需要外部的交叉验证和行业知识。”

有些部分会被模型吸收,比如一步步控制Agent怎么走的机制,随着模型能力增强,会从Control转向“Context Not Control”,但那六个维度不会被替代。模型决定了智力的天花板,Harness决定了这个智力能不能在生产环境里安全、可控、可度量地发挥出来。

第二层壁垒是对运行范式的理解。很多人判断Workflow将被淘汰,Agentic Loop会成为主流。张鑫认为,两者需要共存,因其本质上都是对工作流流程的表达,只是载体不同。

企业内部里有“敏态”和“稳态”之分,强管控的任务需要Workflow保证可靠性,更发散的场景适合通过Agentic Loop探索,两者可以相互转化,一开始通过Agentic Loop探索,跑出最佳路径后沉淀为Workflow,效率更高、Token消耗更少。

第三层壁垒是对软件生态的重构,“软件日抛论有点脱离实际,”张鑫说,“企业Token成本在不断飙升,已有工具不去利用还要重新搞一套,非常不现实。”

譬如,CLI化不会吃掉软件,但会改变软件的交互入口,从给人用变成给Agent用,而软件背后的逻辑和数据不变,只是调用方式变了。

这三层壁垒加在一起,构成了开发域之外的竞争空间。与此同时,火山引擎也在探索前沿部署工程师(Forward Deployed Engineer,简称FDE)的实践,企业需要有人把Agent落地到具体业务之中。

张鑫表示,“FDE和传统交付有本质区别,传统交付追求一次性项目验收,FDE更追求可持续的Token消耗,打造AI Native产品,同时反哺产品。”

FDE最难的是把业务中的隐性知识提取出来,工程能力的门槛反而因AI Coding而降低,为此,火山引擎将离业务近的、有咨询能力的人员,转型为FDE,离实际业务场景效果比较近,FDE的价值才能更显性。

千亿市场,亟待爆发

对于AI软件市场,行业存在两种观点,一种是,大模型是如同互联网一般的基础设施,其上会长出繁荣的应用,另一种观点是,大模型本身会越来越多地“吃掉”软件本身。

按照IDC给出的数据来看,2024年Agent开发平台市场大约四五亿,2025年大约20亿,每年三四倍增速。火山引擎凭借HiAgent和扣子,分别以17.8%和19.3%的份额,位居2025年中国智能体开发平台私有化、公有云市场第一。

张鑫认为,Agent平台整体市场测算在500亿到千亿规模,真正爆发期可能在2026年底到2027年。

客观上,模型能力依旧有待突破,而且企业的组织没准备好、流程没打通、门槛尚不够低。

技术供应一侧不断降低门槛,企业的技术认知却没有同步跟上,零代码工具不等于实现零认知。以HiAgent为例,客户数是大几百家量级,和中国企业总量相比差得非常远。真正能搭建复杂业务场景工作流的企业还是少数。

张鑫表示,突破方向有三条,足够好的Baseline,让用户不必从零搭建;提供开箱即用的模板和Skills;通过Coding能力解决更复杂的任务,从大模型使用已有工具,变成大模型能按需创造新工具。

而一旦市场真正爆发,商业模式也会有所变化,第一层按资源收费(GPU卡时),第二层按Token收费,第三层按业务效果收费。目前行业主要还在第二层,但按Token收费存在一个“盲区”,同样100万Token,用来做纯聊天和用来做芯片设计,业务价值天差地别,目前按Token收费体现不出这种差别。

“到了第三层,看实际产出了多少可用代码、多少可用视频时长,就不需要纯看底层烧了多少Token,因为很多可能是无用Token。”张鑫说。

此外,一部分领先企业,开始将Agent从软件预算转向人力预算。衡量数字员工价值,最直观的是人力成本节省,更高维度是业务效果增值,审核从人工几小时变成秒级上线,客服质量标准化统一,这些维度共同构成了更高的Agent市场想象空间。

对于火山引擎的智能体平台产品和商业化目标,张鑫直言,“大原则不变,每一个产品都要做到市场占有率第一。但最终,大家还是会以拉动了多少Token来衡量产品是不是真正产生了价值。”