火山引擎正在批量生产Opus4.6
6 小时前 / 阅读约7分钟
来源:36kr
火山引擎发布豆包2.1 Pro等AI模型,专业版定价68元,提供企业级服务配置。其成本优势显著,但面临国内厂商追赶和海外巨头降价挑战。便宜只能赢一次,好用才能赢一辈子。

68块钱买到一个号称对齐Claude Opus的旗舰模型,听起来像割韭菜的PPT,也像某种我们还没习惯的新常态。

这或许就是国产AI互相竞争对于用户的福利。

昨天火山引擎在FORCE大会上,总裁谭待甩出了豆包2.1 Pro、Seedance 2.5、Seedream 5.0 Pro和音频模型1.0一堆牌。今天豆包专业版就上线了,标准套餐68元一个月。这不是国产模型第一次摸到Opus4.6的门槛,但风评清一色是:豆包也配收费?

事实上,豆包不仅配,它背后的火山引擎正在多个模态批量生产Opus级别的领先大模型。

这笔账不亏,却也没那么香

先算清楚68元到底买到什么。

谭待在会上的原话是:只有当模型能力跨越"质变点",才能真正满足生产场景需求。全球范围内,Coding与Agent领域第一个跨过这道门槛的是Claude Opus 4.6。而6月13日,智谱GLM-5.2已经先行一步,在Code Arena上拿下全球第二,官方口径称其与Claude Opus 4.8处于可比区间。豆包2.1 Pro则是又一个跨过这道门槛的国产玩家。

官方给出的评测数据里,Terminal Bench 2.1、SWE-Pro、SciCode等代码评测进入全球第一梯队,OSWorld、MobileWorld、MMMU-Pro等Agent与多模态评测也位居全球前列。在芯片设计RTL的实战测试中,豆包2.1 Pro连续运行近18小时,经历9轮迭代,跑通了仿真、测试、综合检查等完整工程流程。

这模型不会让人感叹"哇好聪明",只会让人惊觉"上周我干了两天,它十分钟就搞定了"。

68元专业版打包的能力很实在:操作本地电脑和浏览器、跑复杂Agent任务、内置Office套件、生成带后端数据库的在线应用。这些原本是企业级服务的配置,现在下放到个人订阅里。横向看,ChatGPT Plus和Claude Pro的基础订阅换算过来普遍在145元上下,而且那往往只是"入场券",真想调用Opus 4.6级别的满血能力,按Token另算,一个重度开发者或产品经理,每个月烧掉几百到上千美元不稀奇。豆包这边,68元标准版底层接的就是2.1 Pro,还把这些生产力工具一并打包。

但这68块的锁法有点诡异。免费用户只能体验Turbo版的办公任务模式,Pro模型被锁在专业版里。它先让你用免费版感受到"AI能帮我干活"的甜头,等你真打算拿它处理复杂项目时,发现Turbo不够用,自然就得掏更多钱。这更像是用户筛选,面向那些已经打算拿AI真干活的人,先把他们绑进来。对火山引擎来说,这些付费用户产生的真实任务数据,恰恰是在帮它打磨企业级Agent能力的边界。

字节做的未必好看,却极准

说它是烧钱补贴,这是最直觉的解读,大概率也是错的。

豆包2.1 Pro的综合使用成本只有Claude Opus 4.6的20%,这是量化、蒸馏、推理调度、自研芯片一层层压出来的结构性优势。卖68元,大概率还有利润空间,谈不上赔本赚吆喝。这属于成本本来就低,卖这个价是正常商业定价,甚至还能赚钱。

海外玩家在做单点突破定义规则,豆包在做全模态覆盖和落地速度。昨天五大模型齐发,没有"发布等半年适配"的空窗。Seed2.1当天就推到豆包App和TRAE,API同步走火山方舟全量开放。豆包音频生成模型1.0发布的同时,就明确要接入剪映、即梦、番茄。Seedance 2.5预计7月正式上线,主打30秒单段原生视频直出、50个全模态素材联合生成。Seedream 5.0 Pro也在同一天亮相,支持分图层编辑和14种语言图内文字精准排版。

真正的重点在于:流水线能把厉害的模型在24小时内变成你手机里的一个按钮。火山方舟平台日均Token调用量已经突破180万亿,过去一年增长超10倍。模型一上线就接触海量用户的真实场景,用户怎么提问、怎么纠错、怎么骂它笨,数据立刻回流,下一代模型迭代更快。从实验室到产品的链路,被压缩到最短。

这些高周转的Token,加上豆包、剪映、番茄、飞书几亿用户每天产生的真实数据,构成了火山引擎可以批量生产SOTA模型的根本。视频领域也是如此,Seedance 2.0至今仍是全球视频生成赛道的第一梯队,2.5紧接着就推出来了。这种迭代密度,靠的不是某个天才研究员的灵感,而是数据飞轮转起来后的惯性。

但硬币总有另一面。豆包音频模型"即将上线剪映、即梦、番茄",所有AI发布都服务于内容生态。模型迭代方向不可避免地被现有场景的需求牵引,优化越来越倾向"视频转码要快""小说润色要顺""办公自动化要稳",很少留给"边界探索"这种暂时看不到商业回报的方向。跑得快,有时也意味着抬头看路的时间变少了

工厂的噩梦

成本砍80%靠工程优化。这很了不起,但工程优化是可以被追赶的。

同一天,京东开源了JoyAI-VL-Interaction,百度开源了Unlimited-OCR,网易有道开源了Confucius4-TTS。国内厂商的工程化能力都在快速迭代,极致降本不是火山引擎独占。京东的JoyAI-VL-Interaction在58个真人盲评中,对比豆包视频通话助手胜率77.6%,对比Gemini视频通话助手胜率87.9%。这说明国内其他玩家也在快速逼近,甚至局部反超

字节在当全行业的超级工厂。工厂当然重要,没有量产就没有普及。但工厂的噩梦永远是:一旦技术扩散,比拼就回到谁的地基更深

OpenAI发布GPT-5.5-Cyber定义网络安全标准,Anthropic推出Claude Tag定义企业Agent协作范式。它们争的是"什么叫正确的Agent","谁更便宜"从来不是核心议题。字节在工厂里跑得再快,天花板还是别人画的。

一旦规则制定者也把成本打下来,把能力下沉,比拼的终局还是会回到底层能力的代差,而非生产效率的高低。当海外巨头完成推理成本下探,把顶级模型的价格打到大众消费区间,68元的价格锚点将面临直接挑战。

用户为68元涌进来不难,难的是让他们下个月还续。对手做到同价位只是时间问题,迁移成本没有想象中那么高。换个API key比换手机号容易多了。

结尾

火山引擎把Opus 4.6级别的能力干到了68块钱一个月,已经给国内大模型行业带来了实打实的价格压力。没有自研推理优化能力的厂商,会被加速挤出通用大模型的主赛道。

效率能赢下上半场,终局咬住用户的,不会是价格锚,只能是长进用户骨头里的workflow。剪映、飞书、火山引擎的协同网是个好篱笆,但篱笆挡不住对手也降价。真正让人留下来的是:你的项目文件存在飞书文档里,你的视频素材在剪映里做了AI配音,你的代码仓库接的是火山方舟的API,一旦抽离,整个工作流会断裂。

便宜只能赢一次,好用才能赢一辈子