McKinsey 2025 年的全球AI调研给出了一个耐人寻味的数字:62%的企业已经在试验 AI Agent,但只有23%实现了规模化部署。试验容易,规模化难——因为试验可以绕过数据问题,规模化绕不过。Gartner 的数据更直接:仅有16%的企业将 Agentic AI 部署到了生产环境,55%仍停留在探索阶段。绝大多数企业卡在从"能跑"到"能跑通"之间的那道坎——而那道坎,几乎都是数据。
"The model is not your unique advantage. It is when you combine that model with what is uniquely yours, your data, which is your advantage, that things begin to shine."模型不是你的护城河,模型加上你独有的数据才是。但“独有的数据”前提是——你得先把数据理到AI能读懂的程度。
但整合只是第一步。Trinhard 坦言,整合碎片化数据之后,他们只得到了数千个 BI 报表——数据有了,但价值没有释放。真正的质变发生在AI工作流接入之后:采购、IT支持、HR、销售多模块效率全面提升。现场演示了一个面向医药销售代表的 AI concierge——从请求到生成邮件,全程不到一分钟。五年前埋下的数据种子,现在长出了AI的果实。
Anthropic 联合创始人 Daniela Amodei 在演讲中说:“Trust is an accelerant.”信任是加速器,不是减速带。但信任的前提是什么?是你的数据底座先立住了,你的AI动作可控了,你的团队不再争论“数据对不对”了——这些,正是前面三个案例验证过的事。到那时,信任自然会来,速度自然会快。
Snowflake Summit 26 现场观察
旧金山 Moscone 中心,Snowflake Summit 26主题演讲现场。台上轮番出场的是 Snowflake CEO Sridhar Ramaswamy、埃森哲首席战略与服务官 Manish Sharma、Anthropic 联合创始人 Daniela Amodei、赛诺菲(Sanofi)首席数字官 Emmanuel Trinhard——阵容本身就说明了一件事:这场演讲不是在谈技术,是在谈企业怎么把AI真正用起来。
但全场最有冲击力的一句话,不是来自任何产品发布,而是埃森哲首席战略与服务官 Mnish Sharma的一句判断:
这句话之所以有分量,不是因为它新鲜——“数据是 AI 的燃料”已经说了无数遍。而是因为它揭示了一个刺眼的行为悖论:所有人都知道数据重要,但绝大多数企业的实际行动是先选模型,后理数据。先挑发动机,后修加油站。顺序反了。
Gartner 的数据印证了这个悖论:88%的企业在 2026 年增加了 AI 资金投入,但只有11%的 CFO 表示企业已经从 AI 中获得了实际财务价值。投入热情高涨,价值兑现惨淡。钱花在了“看得见”的地方——选模型、搭 Agent 框架、做 POC;但真正卡住的那个"看不见"的东西——数据底座,很少有人愿意先动手。
为什么会这样?不是企业不聪明,而是三个认知陷阱在作祟。
陷阱一:模型选型有即时反馈感,数据治理是长期苦活
选模型这件事,天然带着快感。你输入一个 prompt,模型给你一段像模像样的回答,团队兴奋,老板点头,POC 报告写出来漂漂亮亮。这种即时反馈让人产生一种错觉——AI 落地正在推进。
数据治理呢?统一数据口径、打通语义标准、建立治理流程——没有哪一步能在一周内产出“成果”。它更像修地下管网:挖开路面,接好管道,再填回去,地面上看不出任何变化。但所有人都知道,没有管网,楼盖再高也住不了人。
McKinsey 2025 年的全球AI调研给出了一个耐人寻味的数字:62%的企业已经在试验 AI Agent,但只有23%实现了规模化部署。试验容易,规模化难——因为试验可以绕过数据问题,规模化绕不过。Gartner 的数据更直接:仅有16%的企业将 Agentic AI 部署到了生产环境,55%仍停留在探索阶段。绝大多数企业卡在从"能跑"到"能跑通"之间的那道坎——而那道坎,几乎都是数据。
陷阱二:把“数据问题”等同于“数据量不够”
这是最常见的误判。很多 CTO 跟我聊起来会说:“我们的数据量不是问题,我们有几TB的数据。”——但数据问题的本质从来不是“有没有”,而是“能不能用”。
Gartner 的调查显示,39%的企业高管担心缺少有用的数据——注意,不是“缺少数据”,而是“缺少有用的数据”。碎片化、语义不统一、治理缺失,这些才是真正的数据问题。你的 CRM 里客户叫“张三”,RP里叫“Zhang San”,数据湖里叫“客户A”——数据都在,但AI读不懂。
陷阱三:等模型成熟了再整理数据也不迟
这是最隐蔽的陷阱,因为它听起来很理性:“模型还在快速迭代,等 GPT-5/Claude 5出来了再整理数据也不迟,现在整理了可能白费。”
但这个逻辑忽略了一个关键事实:模型越强,好数据的回报率越高。
Anthropic 联合创始人 Daniela Amodei 在峰会现场说得很清楚——AI 模型遵循 scaling law,投入更多计算与数据就能持续提升能力,企业不应只着眼当前能力,要大胆规划远期目标。这句话的真正含义是:当模型能力指数级提升时,它能从高质量数据中榨出的价值也在指数级上升。今天你统一了数据语义、打通了数据孤岛,明天更强的模型就能直接把这些数据变成更精准的决策、更快的响应、更深的洞察。数据底座不是成本,是乘数——模型越强,乘数效应越大。
反过来想:如果你等到模型成熟了再整理数据,你丢掉的不是整理数据的成本,而是整个 scaling law周期里的复利。那些先修好数据底座的企业,每换一代模型就多赚一轮;而你每换一代模型,都在重复"数据还没准备好"的困局。
Gartner 有一个预测值得每个 CTO 认真看:到 2027 年,优先做 AI 就绪型数据准备而非优先做模型开发的企业,80%实现的业务价值将是同行的两倍。不是 1.2 倍,是两倍。这不是微弱优势,是量级差距——而量级差距的来源,正是模型能力提升对好数据的乘数效应。
先修数据底座的企业,AI 落地速度反而更快
认知陷阱说完了,但“数据先行”到底是不是一条走得通的路?我在 Snowflake Summit 26现场看到的三个案例,给出了相当有说服力的回答。
埃森哲:75万人岗位重构,数据底座先行
Manish 在台上说了一句话让我印象很深:“AI 只有以人类为主导才能创造真实价值,领导者必须亲自牵头 adoption,把AI落地和公司利润表绑定。”这不是场面话——埃森哲自己就是这么做的。两个月前,埃森哲调整了全球75万名员工的岗位架构,围绕7类核心高管角色重构组织,所有业务输出都基于统一的 Snowflake 数据底座。
Manish Sharma 补充了一个关键细节:一家欧洲传统公用事业客户,在统一数据底座之后,分析查询从数周缩短到2秒,项目从立项到交付从数月缩短到12周,计算成本下降85%。他反复强调一个原则:
赛诺菲:五年前就开始的数据赌注
赛诺菲首席数字官 Emmanuel Trinhard 的分享,可能是全场最能说明“数据先行”价值的案例。赛诺菲年采购金额达 180 亿欧元,五年前他们做了一个当时看来不那么“性感”的决定:整合多个分散的数据湖,统一到 Snowflake上。选择 Snowflake 的原因很简单——计算存储分离的架构,让数据整合不会成为新的孤岛。
但整合只是第一步。Trinhard 坦言,整合碎片化数据之后,他们只得到了数千个 BI 报表——数据有了,但价值没有释放。真正的质变发生在AI工作流接入之后:采购、IT支持、HR、销售多模块效率全面提升。现场演示了一个面向医药销售代表的 AI concierge——从请求到生成邮件,全程不到一分钟。五年前埋下的数据种子,现在长出了AI的果实。
制造业客户:不再争论“数据对不对”
Manish Sharma 还分享了一个未具名的美国制造业客户案例。这个案例没有宏大的数字,但有一个细节精准地击中了数据问题的要害:在统一数据底座之前,这个客户每次开会的前半小时都在争论“数据对不对”;统一数据源之后,会议直接进入“我们该做什么决策”。
这个细节之所以有力,是因为它揭示了数据碎片化最隐性的代价——不是技术问题,而是组织信任问题。当每个部门拿出的数据都不一样,决策就变成了博弈,而不是判断。统一数据源,重建的不只是数据架构,还有决策的信任基础——而信任,恰恰是AI落地最容易被忽视的加速器。
给 CTO 的三步顺序框架
回到那个行为悖论:为什么明知数据重要,还是先选模型?三个陷阱给出了诊断,三个案例给出了验证。现在的问题是:CTO 该怎么调顺序?
先说一个判断原则:数据底座的完成度,决定了模型层能跑多快。不是死记三步顺序,而是每次做决策时问自己一个问题——“我的数据底座能不能支撑我接下来要做的事?”如果能,继续;如果不能,先停下来补。这个标尺比任何清单都好用。
在这个原则下,具体操作是三步:
第一步:统一数据底座
不是“先把所有数据搬到一个地方”——那是数据搬家,不是数据统一。统一的核心是语义:同一份数据,所有人看到的是同一个定义,不同系统对同一份数据的理解一致,而不是简单地把数据搬到同一个地方。Snowflake 在峰会上推出的 OSI(Open Semantic Interoperability)开源标准,解决的正是这个问题——让数据语义对齐,而不是物理搬运。
第二步:模型自由
数据底座立住之后,选模型反而变得不那么重要了——因为你可以随时换。今天用 Claude,明天换GPT-5,后天试开源模型,底座不变,切换成本极低。这也是为什么数据底座先行的企业,反而更不纠结模型选型——底座不变,模型随时可换。模型是工具,不是战略。
第三步:搭管控平面
AI落地不是“接上模型就完了”。当 Agent 开始替人做决策、发邮件、调用系统,治理范围必须从数据扩展到AI的动作本身。Snowflake 在峰会上宣布 MCP 协议原生接入、宣布对 Natoma 的意向收购,就是在补这一层——让 AI 的每一个动作可观测、可审计、可回滚。
三个步骤,顺序不能反。先统一数据,再选模型,最后搭管控平面。反过来走——先选模型、再补数据、最后想治理——你会发现每一步都在为前一步的仓促买单。
Anthropic 联合创始人 Daniela Amodei 在演讲中说:“Trust is an accelerant.”信任是加速器,不是减速带。但信任的前提是什么?是你的数据底座先立住了,你的AI动作可控了,你的团队不再争论“数据对不对”了——这些,正是前面三个案例验证过的事。到那时,信任自然会来,速度自然会快。
坐在 Moscone 中心走出来的时候,我想起 Manish Sharma 那句话——85%的问题不是 AI,是数据。但更准确地说,85%的问题不是选错了模型,而是搞反了顺序。先修加油站,再挑发动机——这个顺序,才是真正的护城河。
🔍阅读原文:https://mp.weixin.qq.com/s/SiG6JK-G9kYlkc9jfUUSsQ"