上个月,MIT NANDA项目发布了一份《2025年商业AI现状报告》。这份报告在业界引起了不小的震动,甚至一度导致AI概念股集体下跌。
报告揭示的现实令人惊讶,尽管企业在生成式AI上的投资已高达400亿美元,但其中95%的组织获得的实际回报几乎为0。
数字背后则是一个日渐鲜明的悖论,一方面,AI技术正以前所未有的速度发展,模型能力日新月异;另一方面,企业花重金采购的AI工具却被员工悄悄弃用,形成了一个庞大的“影子AI经济”——超过90%的员工宁愿使用个人版的ChatGPT等工具来完成工作。
这让我们不得不正视一个正在发生的转变,AI创业的底层逻辑,在2025年这个节点上,发生了根本性的改变。成功的关键不再仅仅是拥有更强大的模型,而是能否让AI在真实的业务场景中持续学习与进化。这听起来像是老生常谈,但问题的关键在于,怎么做永远比想更难。
如果说面向AI的95%的投资未能产生回报,那我们有必要回头看看,过去的路径到底哪里出了问题。
许多企业习惯于将软件视为即插即用的工具,他们以同样的逻辑对待AI:一次部署,永久生效。
但事实上,AI的本质相比一套标准化软件,更接近于一位专家。专家需要不断学习、接收反馈、积累经验,才能保持其专业水准。一个无法从使用中学习和改进的AI系统,就像一本多年未再版的教科书,其价值会随着时间持续折旧。
其次在“通用”与“专用”的选择上,MIT的数据同样反直觉。报告显示,在调研初期,有60%的企业考虑采用特定任务型GenAI。然而,从试点到成功实施,这个比例骤降至仅剩5%。与之相比,通用大语言模型的表现则稳健得多。
这说明,为特定任务量身定制的AI,反而面临着更严峻的落地挑战。它们往往需要复杂的场景适配、高昂的定制和维护成本,最终很可能因为无法灵活适应实际工作流,而沦为一个个“流程孤岛”,被员工绕道而行。
影子AI的盛行是员工最直接的无声投票。当公司提供的工具笨拙、僵化,无法理解具体的工作语境时,员工自然会选择用脚投票,转向那些更灵活、更懂他们的个人AI工具。这暴露了企业级AI工具的致命伤,顶层设计的产物,我那个我那个无法自然地适应“人”的工作习惯,也缺乏从用户侧收集反馈并即时改进的闭环。
从这样的视角来看,旧逻辑的核心是“交付即结束”,追求的是功能清单的完美勾选。而现实已经证明,AI的成功应用要求“交付即开始”,价值是在使用过程中通过持续学习和优化而不断累积的。
95%的失败阴云下,仍有5%的企业找到了方向,后者做对了什么,对于勾勒AI创业的新范式具有重要的启示作用。
接着上一部分提到,成功的组织首先改变了与AI的相处方式,将AI当作需要共同成长的外部专家。
比如一家设计公司采购AI助手时,相比选择了某个功能最全的系统,成功的案例往往是选择最能理解设计师需求、并能随着团队风格不断进化的那个。他们每周会与AI团队复盘:哪些建议被采纳了,哪些被忽略,设计师在使用过程中遇到了什么困惑。
这种关系下,商业模式或许也会改变。传统的软件许可证销售正在被“成长服务”取代——企业购买的不仅是当下的能力,更重要的是,他们获取了一套保证AI持续进步的机制。这就像聘请一位顾问,你支付的不仅在于他的现有知识,真正看重的是他未来在公司业务场景中的成长潜力。
另一方面,当大多数用户抱怨企业AI重复犯同样的错误时,我们意识到问题的核心不在模型大小,而在学习机制的缺失。
那些成功的5%,都把“如何让AI持续学习”作为技术架构的核心。这需要构建真正意义上的Online Learning系统——作为时下最热的AI概念,从技术内核看,它是模型与环境持续交互、通过奖励信号动态优化整个智能系统的能力。
简单来讲,他们不会简单依靠收集用户反馈来进行定期的训练,更重要的是让AI能在每一次交互中即时调整自己的策略。你可以把它理解成一种新的交互和推理范式,它要求模型在测试阶段仍能学习,如同人类在解决问题时实时调整策略——和传统强调预训练的AI有着本质区别。
我们看到三个关键特征在这些系统中显现:
首先是情境理解,优秀的AI能记住用户偏好,并在后续交互中应用这些知识。比如当一位市场专员第二次要求"制作社交媒体海报"时,AI会主动采用上次验证过的风格和色调,而不是重新开始。
其次是记忆管理,AI系统为用户建立了个性化的记忆档案,记录有效的工作模式和决策逻辑。这些记忆并非简单的聊天记录堆叠,而是让提炼的工作习惯,能在合适的场景被主动唤醒。
最重要的是反馈闭环的设计。那些失败的AI系统总是会把反馈变成了繁琐的"点赞/点踩"按钮,成功的系统其实是将学习机制无缝嵌入工作流程。
从功能清单,到对学习能力的评估,一定程度上体现了企业对于AI标准的改观。过去采购时最关心支持多少种功能,现在更看重学习新技能需要多久。一个能在一周内适应公司报告风格的AI,远比一个功能齐全但僵化的系统更有价值。
我们也看到了一些很有代表性的案例,比如某个电商企业选择客服AI时,放弃了功能更全面的方案,选择了那个能根据客户投诉数据快速调整应答策略的系统。数月后这个"不够完美但善于学习"的AI,在处理他们特定的退货问题时,效果远超那些功能更丰富的竞争对手。
站在这个转折点上,尤其对于AI创业者而言,几个关键的生存法则正在浮现。
随着场景的深度取代技术的广度,成为新的竞争壁垒,大模型确实正在成为水电煤般的基础设施,但真正创造价值的,永远是那些懂得如何用好稳定资源的人。就像拥有稳定的电力供应不等于能造出好电器,接入强大的基础模型也不等于能解决实际问题。
在医疗等专研领域,我们能够开始看到行业对于理解特定场景下的细微需求,一些创业团队放弃打造全科医生AI的野心,转而专注在皮肤病诊断、影像分析等细分领域,通过持续学习特定类型的病例数据,在这些垂直场景中达到了实用级的准确率。
另一方面,关于ROI的认知需要被刷新。报告显示,70%的AI预算流向了营销部门,这反映出企业普遍将AI视为增长工具。但现实中,“降本型AI”往往能带来更直接、更可衡量的回报。
问题来了,Online Learning崛起,究竟会对AI市场带来哪些影响呢?
答案可能是彻底的洗牌。
当OpenAI、Anthropic等头部玩家不断刷新模型能力的上限时,那些依赖传统静态数据训练的企业将面临巨大压力。模型的保鲜期正在缩短,实时学习能力将成为新的分水岭。
其次,AI产业落地逻辑被重构。在推荐系统领域,我们已经看到分钟级更新如何改变用户体验;在医疗诊断等高价值场景,如果AI能够通过持续的临床反馈不断优化判断标准,其价值将呈指数级增长。
这种越用越精准的特性,将颠覆现有的定制化模型商业模式。相应地,算力分配的权重也在发生变化。一次性的训练投入可能要让位于持续优化的推理算力池,模型更新频率将成为比参数规模更重要的指标。
这就意味着,AI创业的下半场,属于那些在最具体场景中,展现出最强适应力的团队。是时候放下对模型规模的执念,回归到创造真实价值的轨道上来了