GPT-6要来了,但AI行业早不跟 OpenAI玩了
2 小时前 / 阅读约11分钟
来源:36kr
OpenAI确认GPT-6即将发布,采用全新架构,性能大幅提升。同时关停Sora,转向企业级服务。全球AI行业形成路线分化,竞争焦点转向技术落地。GPT-6发布带来新变化,行业需务实前行。

最近这段时间,不管是硅谷的开发者邮件组,还是国内的技术社群,话题几乎都绕不开两个消息。

一个是OpenAI正式确认,代号Spud的新一代大模型GPT-6即将全球发布;另一个是这家公司在发布前,亲手关停了一年前引爆全网的视频生成产品Sora,连API都定了全面下线的时间表。

不少做AI开发的朋友,这两周都在调整手里的项目节奏,等着看GPT-6的发布文档,也有人在聊,OpenAI这步棋走得太急,毕竟Sora上线的时候,几乎重新定义了AI视频生成的标准,怎么说停就停了。

其实比起GPT-6到底能把参数堆到多少,推理能力提升了多少,更值得琢磨的,是OpenAI在这款模型发布前做的一系列选择,以及整个AI行业,在这场发布会到来之前,悄悄发生的那些变化。

GPT-6的底色与OpenAI的转身

前两天OpenAI的官方公告里,关于GPT-6的信息并不算多,只明确了预训练工作已在德克萨斯州的Stargate数据中心全部完成,目前进入最终的安全对齐与API调试阶段。

更多的细节,来自核心管理层对外的零星表述。

OpenAI总裁GregBrockman在近期的播客访谈中亲口确认了GPT-6的存在,他的表述里没有常见的参数堆砌,只留下一句关键的判断:这次不是增量改进,他们思考模型开发方式已经发生重大改变。

SamAltman则在给全体员工的内部信中,将这款模型定义为“一个非常强大的模型,可以真正加速经济发展”。

从行业渠道流出的测试信息来看,GPT-6的核心升级,确实跳出了过去几代模型的惯性路径。它采用全新的“Symphony”架构,首次实现了文本、图像、音频、视频的原生统一处理,而非行业内常见的多模态模块拼接。

这意味着,用户无需再通过插件跳转,就能用手绘草图直接生成前端代码,上传一段视频就能拆解动作细节并生成对应脚本,甚至用语音指令完成从创意构思到视频成片的全流程操作。

开发者最关注的编码、推理和AI智能体任务上,GPT-6较GPT-5.4实现了40%以上的性能提升,上下文窗口从100万token直接扩展至200万,单次可处理约150万字的文本,相当于两部中篇小说的体量。

公开的测试数据显示,其数学推理准确率达到92.5%,代码生成通过率96.8%,在44类职业测试中,83%的任务表现达到或接近人类专家水平。

更值得关注的,是OpenAI为这场发布做的一系列前置动作,尤其是对Sora的全面关停。我记得Sora刚出现的时候,被行业称为“重磅炸弹”,不少做视频创作的朋友,当初都为Sora的能力惊叹过。

但文本生成视频这件事,能成为真正意义上的商业项目的,确实少之又少。要么是生成的内容版权说不清,要么是成本太高,远不如人工制作可控。

这也是Sora最终走向关停的核心原因。《福布斯》杂志的估算数据显示,Sora项目每年的运行成本高达50多亿美元,而自上线以来,应用程序内总收入仅约210万美元,完全无法覆盖高昂的算力与运营成本。

和文本生成不同,AI视频生成对算力的消耗呈指数级增长,单段10秒的基础视频生成成本约1.3美元,复杂场景的成本甚至能达到33美元。

为了控制亏损,OpenAI不得不不断削减用户的免费生成额度,从最初的每日30条降到每日6条,进一步加剧了用户的流失。Appfigures的监测数据显示,Sora的30天留存率仅为1%,60天留存更是趋近于零,用户尝鲜过后,几乎没有持续使用的动力。

压垮Sora的还有版权与合规的重压。上线初期,Sora凭借生成迪士尼IP、名人形象的视频快速出圈,也随之引发了大量的版权诉讼与行业抵制。

OpenAI被迫将内容生成规则从“默认可用”收紧为“需明确授权”,直接砍掉了产品最核心的吸引力,与迪士尼的10亿美元合作也随之终止。而深度伪造内容的泛滥,更是让OpenAI持续面临监管层面的压力,美国非营利组织“捍卫公众利益组织”曾专门致信,要求其下架Sora。

当然,也有人判断,OpenAI冲刺IPO在即,这家公司在2026年2月底完成了新一轮1220亿美元的私募融资,估值达到8520亿美元,计划在2026年第四季度正式登陆资本市场。对华尔街的投资者而言,一个持续烧钱、看不到盈利前景的视频生成项目,远不如一个能带来稳定现金流的企业级生产力模型有吸引力。

而高盛则测算,2025年OpenAI全年收入超过200亿美元,但亏损仍高达140亿至150亿美元。想要满足上市的盈利预期,OpenAI必须把有限的资源投入到最具商业价值的业务上。

就现在来说,企业级服务正是当下AI行业最确定的现金牛,Anthropic的年度收入超过190亿美元,其中约80%来自企业客户,这给OpenAI带来了直接的竞争压力。

关停Sora,全力押注GPT-6,本质上是OpenAI在上市前夜,对自身商业叙事的一次重塑。

从过去用炫酷的生成能力吸引C端用户,转向用稳定、高效的生产力能力服务B端企业,从AI技术的探索者,转向AI商业化的落地者。而GPT-6的登场,正是这场转型的核心载体。

AI赛道,不是单线程的赛跑

就在OpenAI为GPT-6的发布紧锣密鼓筹备的同时,全球AI行业的其他玩家,并没有跟着它的节奏起舞,反而提前开启了新一轮的布局。

4月2日,谷歌DeepMind正式推出Gemma4系列大模型,以Apache2.0协议完全开源,四款模型覆盖从手机端侧到云端推理的全场景。

其中20亿参数的E2B模型,内存占用低至1.5GB,可在智能手机、树莓派上离线运行,性能却追平了上代270亿参数的模型;310亿参数的稠密模型,在ArenaAI排行榜上位列开源模型第三,直接碾压多个参数量是其20倍的竞品。

开源社区的反应很直接,发布当天,HuggingFace上相关的衍生模型就破了千个,很多做端侧AI开发的团队,直接把之前的模型方案换掉了。谷歌官方公布的数据显示,Gemma4发布24小时内,总下载量就突破4亿次,衍生模型超过10万个,在开源社区掀起了一场新的狂欢。

谷歌的这一步棋,恰好走在了OpenAI的反面,当OpenAI用闭源的GPT-6向AGI发起冲刺时,谷歌选择用开源的方式,把AI能力下放给全球的开发者和设备厂商,抢占端侧AI的入口。

Gemma4的核心突破,就是让大模型彻底摆脱了云端算力的束缚,手机、IoT设备、汽车都能在本地实现全功能的AI推理,未来的AI竞争,不再只是云端大模型的参数竞赛,更是端侧设备上的生态争夺战。

国内大厂的动作同样密集。就在谷歌发布Gemma4的同一天,阿里正式推出通义千问Qwen3.6-plus,在全球权威编程榜单CodeArena中表现亮眼,在考察复杂web开发自主编码能力的react专项榜单中位列全球第二,超越了OpenAI的GPT-5.0-high和谷歌的Gemini3.1pro,仅次于Anthropic的Claude-opus-4.6。

字节跳动则在今年推出豆包2.0,支持私有化部署,满足企业数据安全和合规需求,同时公布豆包系列产品跻身全球AI助手第一梯队。行业内流出的数据显示,豆包大模型的日均Token消耗已达120万亿,较初期增长了1000倍,三个月内实现了翻倍。

腾讯则在3月下旬为微信全量推送了ClawBot插件,原生接入OpenClaw开源AI智能体框架,让12亿用户的微信聊天框,直接变成了可自主拆解复杂任务的AI控制台。

微软的动作更值得玩味。前不久微软正式推出MAI-Transcribe-1、MAI-Voice-1与MAI-Image-2三款自研商用模型,覆盖语音转写、语音生成与图像生成三大核心场景。这三款模型由微软MAI超级智能团队开发,意味着在与OpenAI的合作之外,微软正在加速构建自研的AI模型体系,减少对外部技术的依赖。

整个AI行业,正在GPT-6即将掀起的浪潮前,形成了清晰的路线分化。

OpenAI沿着闭源的路线,全力向AGI的终点冲刺,试图用下一代模型重新定义行业的天花板;谷歌、阿里等厂商则用开源的方式,构建更广泛的开发者生态,抢占端侧AI的未来;微软、腾讯等巨头,则依托自身的产品生态,把AI能力深度融入现有的用户场景,实现技术的快速落地。

这场持续了三年多的AI竞赛,早已不是单线程的赛跑。

落地的修行,是比参数更重要的事

从2022年底ChatGPT发布至今,三年多的时间里,AI行业经历了一轮疯狂的参数军备竞赛,各家厂商争相发布更大参数、更高精度的模型,但事实上,却很少真正沉下心来解决AI如何落地的核心问题。

多数大模型仍停留在聊天机器人的阶段,除了少数科技企业和开发者,绝大多数普通用户和传统行业,并没有真正享受到AI技术带来的效率提升。

GPT-6的到来,单从当前的寥寥信息推断,似乎能够为这场竞赛重新划定赛点。整个行业的竞争焦点,从“能不能做出来”,转向“能不能用起来”。

无论是GPT-6对智能体能力的深度整合,还是Gemma4对端侧部署的极致优化,亦或是Qwen3.6-plus在编程场景的深度打磨,本质上都是在让AI技术走出实验室,真正融入到具体的工作场景中,变成能解决实际问题的工具。

对国内的大模型厂商而言,GPT-6的发布既是挑战,也是全新的机会。过去几年,国产大模型始终处在追赶者的位置,跟着海外厂商的节奏,在参数和精度上不断追赶。但随着AI行业的赛点转向落地与生态,国内厂商依托本土的场景优势、用户基础和产业链资源,反而有了实现差异化突围的可能。

从企业服务厂商从业者那里了解到,目前国内制造业、金融、零售等传统行业,对AI的需求正在快速爆发,但他们需要的不是一个无所不能的通用大模型,而是能解决行业具体痛点的垂直解决方案。

比如制造业的质检与生产流程优化,金融业的风险管控与客户服务,零售业的用户运营与供应链管理,这些场景都需要AI模型深度结合行业知识,而这正是国内厂商的优势所在。

而对普通的开发者和用户来说,的确不用过度焦虑GPT-6会不会带来行业颠覆,也不用执着于追逐最新的模型版本。

大家都能够意识到,真正有价值的,是学会把这些AI工具,变成自己工作里的帮手。AI的出现不应该是为了替代人,它能做的,是把人从重复繁琐的工作里解放出来,去做更有价值的事。

GPT-6的发布会再过几天就会到来,它也许真的会刷新我们对AI能力的认知,也会给行业带来新的变化。

但我们也认识到,即使SamAltman曾经说过,AGI会是人类文明史上最重要的事件之一,但在那个遥远的终点到来之前,整个行业,还有我们每一个人,都要先完成一场更务实的修行。