数据战略无法缔造竞争优势,这四项举措才是破局关键
11 小时前 / 阅读约13分钟
来源:36kr
企业推进数据战略需构筑专属知识图谱、构建内外部数据融合链路、部署AI智能体治理数据质量,并部署预测与决策模型,捕捉误差数据反向迭代,形成复合竞争优势。

本文阅读时长约10分钟 

当问及高管们推进 “数据战略” 的核心举措时,得到的答案往往高度趋同:打破数据孤岛、清理遗留数据库、建立治理架构、任命首席数据官、确保合规运营。此类举措本身无可厚非,但本质上均属于基础运维工作,仅能维持企业的日常运转,却无法为企业构筑核心竞争壁垒。

在 AI 落地应用领域领跑的企业,采取了截然不同的破局路径。它们着力构建竞争对手无法复刻的核心资产矩阵:专属企业知识图谱体系、创新式融合内外部数据的处理链路、以及运算速度远超行业预期的 AI 智能体。上述三项举措协同发力,共同构筑了本文所定义的战略数据核心。在此基础上部署预测模型,捕捉模型失效场景,将误差数据反向回传迭代,进而形成第四类数据源,持续优化模型性能。集齐这四项核心举措,企业方可形成随时间复利增长的复合竞争优势。

举措一:构筑专属企业知识宝库。数据存量已足,关键在于如何显化

绝大多数企业,对自身沉淀的集体知识缺乏全域性认知。企业日常运营中,会产生海量非结构化知识资产:战略规划方案、客户合作提案、行业研究报告、内部工作备忘录、销售通话记录、客服工单数据、专利申请文件、监管申报材料等。此类资料承载了企业数十年的组织智慧,但在多数企业内部,这些资产要么散落在孤立的硬盘与邮件归档中,要么仅留存于资深员工的认知体系内,而此类核心员工的离职风险始终存在。

生成式 AI 时代,此类非结构化知识已成为企业最具战略价值的数据资产。借助检索增强生成技术(RAG),企业可构建专属 AI 系统,在业务答疑、文件撰写、决策辅助场景中全链路调用内部知识。通用 AI 助手与深度契合企业产品、客户、竞争格局及业务经验的定制化 AI 助手,二者的差距堪比普通工具与专属业务伙伴的分野。

然而,仅将文档简单导入向量数据库远未达到要求。行业头部企业均在构建知识图谱,即对非结构化数据中的主体、概念及关联关系进行结构化梳理与可视化呈现。知识图谱不仅存储客户提案,更能厘清客户、行业、产品、竞争对手及监管约束之间的多层级关联。融合知识图谱与 RAG 的 GraphRAG 技术,在高价值业务场景中,可将 AI 准确率提升至近 99%,而标准 RAG 的准确率仅为 70%-80%。

以 LinkedIn领英为例,企业在客服体系中构建知识图谱并与 RAG 技术深度融合,最终实现客服应答准确率提升 78%,单问题平均处理时长缩短 29%。该系统的成功并非源于使用更优质的大语言模型,而是模型能够精准调取企业结构化、可查询的自有知识资产。

构筑知识宝库的核心难点,并非技术瓶颈,而是管理阻力。知识往往对应内部话语权,员工普遍存在信息囤积倾向;各部门自建数据仓库,核心经验仅留存于高层认知中,且缺乏标准化的成文机制。此举亟需高管层牵头,通过调整激励机制强制推进:要求全链路转录客户沟通、系统化记录项目经验、在核心员工离职前完成知识沉淀归档。

能成功落地此举的企业,其 AI 系统将具备真正的差异化竞争优势。并非因为使用了独有模型,当下基础大模型已无壁垒,而是其 AI 依托了其他企业无法获取的专属知识资产。

当你清晰盘点出自身已有的知识,也能直观发现自身的知识盲区。

多数企业单纯依托内部数据构建 AI 体系,这显然不足以形成核心竞争力。

举措二:构建数据融合链路。跳出内部闭环,链接外部价值网络

多数企业单纯依托内部数据构建 AI 体系,这显然不足以形成核心竞争力。最具商业价值的 AI 应用,诞生于内外部数据的深度融合节点。零售商的销售数据,叠加气象规律、客流数据、本地活动信息后,其决策价值将呈指数级提升;制药企业的临床数据,融入基因组数据库及真实世界诊疗数据后,其预判能力将显著增强;保险公司的理赔数据,叠加卫星影像与物联网传感器数据后,可升级为全新的核心风险资产。行业生态已重构,Snowflake、Databricks、AWS Data Exchange 等数据交易市场,现已提供数千种标准化数据集,可直接接入企业分析系统。此类平台并非小众技术工具,已成为数据驱动型企业的标准基础设施。

沃尔玛是极具代表性的案例。其 AI 系统不仅接入数千家门店的交易数据,更整合了天气预报、本地活动日程、社交媒体趋势、供应商供货周期等多维信息,实现门店及单品级别的实时需求预测。当某地区发布风暴预警时,系统将提前预判应急物资需求激增,并在灾害来临前自动触发补货机制。最终成效显著:缺货率下降 16%,库存周转率提升 10%,物流成本降低 10%。其价值并非来源于更多的内部数据,而是打通了此前从未关联的多源数据壁垒。

当下行业的真正前沿是数据协作。数据安全舱允许多方企业联合分析数据,同时严格保障原始数据的隐私性。国际数据公司(IDC)预测,到 2028 年,60% 的企业将通过私有数据交换平台或安全舱开展合作。如今安全舱技术持续升级,AWS 已推出在安全舱内生成合成数据的能力 —— 此类人工数据保留真实数据的统计特性,却不包含任何真实业务记录。企业可在零隐私风险的前提下训练模型,模拟从未遇见过的业务场景。

因此,在制定数据战略时,企业管理者应反问:我们缺失哪些数据,能与现有资产结合后创造超额商业价值?

当企业拥有内部知识宝库与外部数据链路后,将面临海量格式各异、质量参差不齐的数据洪流。这正是第三项举措的核心意义所在。

该银行部署了人工智能驱动的数据质量工具,对自身金融数据资产进行持续监控,并在各部门自动建立关于数据完整性、准确性与一致性的规范。

举措三:部署 AI 智能体,实现数据质量的实时治理

数据从业者的大部分工作时长,耗费在数据清洗、标准化、校验等基础工作上,而非深度的数据分析与挖掘。AI 智能体正在彻底改变这一行业现状。新一代 AI 工具,可在海量数据集中精准识别重复项、排查异常、统一格式、标记偏差。行业的核心变革,在于部署智能体实现数据质量的实时、常态化监控,取代按季度的集中式清理。

国民西敏寺市场银行便是极具说服力的案例。该行部署 AI 驱动的数据质量工具,持续监控全行金融数据资产,自动在各部门建立完整性、准确性、一致性规则。此前,数据管理团队需耗时半年以上搭建数据提取、校验与上报流程;自动化系统上线后,搭建时长缩短至原来的三分之一,数据质量检测从定期人工核查转为每日按需自动报告。正如该行项目经理所言:“监管机构要求我们清晰掌握自身数据,我们需要最高效的数据监控机制。”

该模式彻底颠覆了推行数十年却收效甚微的传统治理模式。传统模式是自上而下定规、设岗,寄希望于员工自觉遵守;而智能体驱动模式完全逆向,由智能体自动、实时落实标准,且不影响业务流程效率。依托智能体技术,前两项举措方可实现规模化落地。

该流程会通过组织所欠缺的内容对其进行完善。

战略数据核心

上述三项举措,共同构建了一项核心战略资产:战略数据核心。知识宝库沉淀企业已有认知,数据链路补充企业缺失信息,智能体保障数据的洁净、整合与实时性。三者协同,打造出统一、持续维护的专属数据资产,具备不可复制的竞争壁垒,可直接供 AI 体系高效调用。绝大多数企业并不具备此类核心资产,仅有零散数据、部门级仓库与临时接口。战略数据核心则截然不同:它是经过精心规划、全企业共用的战略资产,其价值随时间持续复利增长。

但战略数据核心并非终点,只是基础。

预测模型可预测哪些客户会流失、哪些供应路线将面临中断,或哪些贷款申请人存在隐藏风险。

举措四:部署预测与决策模型,释放核心资产价值

战略数据核心的价值,在于为各类模型供给高质量、高整合度的数据燃料。模型的核心职能有二:预测未来态势,制定应对策略。预测模型可精准研判客户流失、供应链中断、贷款潜在风险;决策模型更进一步,可出具专属留存方案、规划供应链绕行路线、制定平衡风险与收益的贷款条款。数据核心越丰富、整合度越高,模型输出的结果便越精准、越具落地可行性。

这是战略数据核心兑现价值的关键环节。万事达卡是规模化落地的标杆案例。其决策智能专业版系统依托专属神经网络,基于每年约 1250 亿笔交易数据训练,分析商户、持卡人及交易模式的关联,在 50 毫秒内完成欺诈检测并给出建议。最终成效突出:欺诈检测率平均提升 20%,部分场景高达 300%,误报率下降 85%。系统高效运行的关键,并非在于更复杂的算法,而是其依托了全球网络中海量、实时、深度整合的数据资产,这是人工流程无法复刻的。

但模型部署并非最后一步,最具价值的数据恰恰从这里开始产生。

每一辆特斯拉汽车即便在人类驾驶时,也会以 “影子模式” 运行其自动驾驶神经网络。

飞轮效应:模型误差数据是迭代的核心燃料

几乎所有企业都在此环节犯错:部署模型、统计整体效果后便止步。它们忽略了企业能产生的最宝贵数据 ——模型具体失效的场景与根本原因。

当信贷审批人员推翻模型给出的建议时,这一推翻行为中包含着模型未能捕捉到的信息。当需求预测结果高出实际值 30% 时,这一偏差便揭示出模型尚未习得的某种规律。当规范性决策系统建议调整定价,而销量不升反降时,这一结果便是模型逻辑存在缺陷的直接证据。这些都属于模型误差数据,也是驱动这一良性循环运转的核心动力。能够系统性采集这类数据的企业,可以将修正信息重新输入模型。每一轮预测、误差采集与模型再训练的循环,都会让模型更加精准,从而进一步拉大与竞争对手的差距。

大多数企业并未开展此项工作。它们将部署视为项目终点,而非学习循环的起点,只评估模型整体 “可用性”,却未搭建捕捉、分析具体偏差的体系。

特斯拉的 “数据引擎” 是行业标杆。每辆车即便在人工驾驶模式下,自动驾驶神经网络也以 “影子模式” 运行。当 AI 预判与驾驶员操作不一致时,差异将被标记上传。特斯拉会在全车队中检索同类场景、完成数据标注、模型再训练,并将优化版本推送回影子模式。此前系统曾误将车顶自行车架识别为骑行者,通过该循环,仅用数天便收集了数千条精准标注样本。没有竞争对手能达到特斯拉的规模,且差距随每一次迭代不断扩大。

这正是将战略数据核心升级为AI 工厂的关键:它不是单一项目,而是持续自我进化的核心能力。搭建核心、部署模型、捕捉误差、反向迭代 —— 循环往复。

组织理论告诉我们,当变化幅度大且变化速度快于规划周期时,适应性每次都能胜过优化。

高管行动清单

核心问题从来不是这些举措是否重要,而是从何处切入。

若内部有答案却无人可寻:优先构筑知识宝库,投入数据转录、文档治理、检索基建及知识图谱建设。

若 AI 应用同质化、能力薄弱:向外链接价值,探索数据集市、寻找安全舱合作伙伴、调研合成数据,挖掘能最大化提升现有资产的外部数据。

若 AI 项目卡在数据准备阶段:部署 AI 智能体,从最混乱的链路入手,实现数据预处理自动化。

依托前三项举措搭建战略数据核心后,部署模型实现态势预判与决策指导。且自落地之初,必须构建模型误差捕捉体系。误差数据是 AI 迭代的核心燃料,缺失则 AI 停滞不前,拥有则 AI 每一次运行都实现优化。

能落地这套方案的企业,不仅将更擅长运用 AI,更具备超强的组织学习能力。归根结底,数据是企业智慧的核心原材料。核心命题在于:企业是否正在搭建能高效盘活数据资产的完整体系?

本文翻译自 I By IMD,中文版本仅供参考。

关于作者

Misiek Piskorski

数字战略、分析与创新学教授,高管教育院长

Mikołaj Jan Piskorski(常被称作 Misiek),现任 IMD 数字战略、分析与创新学教授,同时担任高管教育院长,负责学院定制课程与公开课程。Piskorski 教授是数字战略、平台战略及数字化业务转型领域的专家,也是人工智能战略与实施项目的联合主任。

关于瑞士IMD国际管理发展学院

瑞士IMD国际管理发展学院(International Institute for Management Development,IMD)近八十年来始终处于领导力发展的前沿。由企业创立并致力于服务企业发展,IMD是一所植根瑞士、辐射全球的独立教育机构。IMD总部位于洛桑,并在新加坡、深圳和开普敦设有战略中心,每年为来自120多个国家的超过20,000名高层管理人员提供培训。我们拥有超过145,000名校友,构建起一个影响深远的全球精英网络。​​

作为常年稳居全球顶尖商学院行列的教育机构,IMD致力于将最前沿的研究与商业实践相融合,协助领导者应对复杂挑战、拓展解决方案并实现可持续的实际影响。我们始终秉持“真实学习,真实影响力”的理念,推动学以致用、以用促效。