首页信息技术 AI 动态

85%的企业 AI 落地卡在数据上，为什么你还在选模型？

小新正三品 (侍郎) 2026-06-03 03:24 31 0 返回 AI 动态

小

小新正三品 (侍郎) 楼主

2026-06-03 03:24

第1楼

AI摘要：台上轮番出场的是 Snowflake CEO Sridhar Ramaswamy、埃森哲首席战略与服务官 Manish Sharma、Anthropic 联合创始人 Daniela Amodei、赛诺菲（Sanofi）今天你统一了数据语义、打通了数据孤岛，明天更强的模型就能直接把这些数据变成更精准的决策、更快的响应、更深的洞察。今天用 Claude，明天换GPT-5，后天试开源模型，底座不变，切换成本极低。

Snowflake Summit 26 现场观察

旧金山 Moscone 中心，Snowflake Summit 26主题演讲现场。台上轮番出场的是 Snowflake CEO Sridhar Ramaswamy、埃森哲首席战略与服务官 Manish Sharma、Anthropic 联合创始人 Daniela Amodei、赛诺菲（Sanofi）首席数字官 Emmanuel Trinhard——阵容本身就说明了一件事：这场演讲不是在谈技术，是在谈企业怎么把AI真正用起来。

但全场最有冲击力的一句话，不是来自任何产品发布，而是埃森哲首席战略与服务官 Mnish Sharma的一句判断：

“ 85%的企业核心问题不是AI，是数据。”

这句话之所以有分量，不是因为它新鲜——“数据是 AI 的燃料”已经说了无数遍。而是因为它揭示了一个刺眼的行为悖论：所有人都知道数据重要，但绝大多数企业的实际行动是先选模型，后理数据。先挑发动机，后修加油站。顺序反了。

Gartner 的数据印证了这个悖论：88%的企业在 2026 年增加了 AI 资金投入，但只有11%的 CFO 表示企业已经从 AI 中获得了实际财务价值。投入热情高涨，价值兑现惨淡。钱花在了“看得见”的地方——选模型、搭 Agent 框架、做 POC；但真正卡住的那个"看不见"的东西——数据底座，很少有人愿意先动手。

为什么会这样？不是企业不聪明，而是三个认知陷阱在作祟。

陷阱一：模型选型有即时反馈感，数据治理是长期苦活

选模型这件事，天然带着快感。你输入一个 prompt，模型给你一段像模像样的回答，团队兴奋，老板点头，POC 报告写出来漂漂亮亮。这种即时反馈让人产生一种错觉——AI 落地正在推进。

数据治理呢？统一数据口径、打通语义标准、建立治理流程——没有哪一步能在一周内产出“成果”。它更像修地下管网：挖开路面，接好管道，再填回去，地面上看不出任何变化。但所有人都知道，没有管网，楼盖再高也住不了人。

McKinsey 2025 年的全球AI调研给出了一个耐人寻味的数字：62%的企业已经在试验 AI Agent，但只有23%实现了规模化部署。试验容易，规模化难——因为试验可以绕过数据问题，规模化绕不过。Gartner 的数据更直接：仅有16%的企业将 Agentic AI 部署到了生产环境，55%仍停留在探索阶段。绝大多数企业卡在从"能跑"到"能跑通"之间的那道坎——而那道坎，几乎都是数据。

陷阱二：把“数据问题”等同于“数据量不够”

这是最常见的误判。很多 CTO 跟我聊起来会说：“我们的数据量不是问题，我们有几TB的数据。”——但数据问题的本质从来不是“有没有”，而是“能不能用”。

Gartner 的调查显示，39%的企业高管担心缺少有用的数据——注意，不是“缺少数据”，而是“缺少有用的数据”。碎片化、语义不统一、治理缺失，这些才是真正的数据问题。你的 CRM 里客户叫“张三”，RP里叫“Zhang San”，数据湖里叫“客户A”——数据都在，但AI读不懂。

"The model is not your unique advantage. It is when you combine that model with what is uniquely yours, your data, which is your advantage, that things begin to shine."模型不是你的护城河，模型加上你独有的数据才是。但“独有的数据”前提是——你得先把数据理到AI能读懂的程度。

陷阱三：等模型成熟了再整理数据也不迟

这是最隐蔽的陷阱，因为它听起来很理性：“模型还在快速迭代，等 GPT-5/Claude 5出来了再整理数据也不迟，现在整理了可能白费。”

但这个逻辑忽略了一个关键事实：模型越强，好数据的回报率越高。

Anthropic 联合创始人 Daniela Amodei 在峰会现场说得很清楚——AI 模型遵循 scaling law，投入更多计算与数据就能持续提升能力，企业不应只着眼当前能力，要大胆规划远期目标。这句话的真正含义是：当模型能力指数级提升时，它能从高质量数据中榨出的价值也在指数级上升。今天你统一了数据语义、打通了数据孤岛，明天更强的模型就能直接把这些数据变成更精准的决策、更快的响应、更深的洞察。数据底座不是成本，是乘数——模型越强，乘数效应越大。

反过来想：如果你等到模型成熟了再整理数据，你丢掉的不是整理数据的成本，而是整个 scaling law周期里的复利。那些先修好数据底座的企业，每换一代模型就多赚一轮；而你每换一代模型，都在重复"数据还没准备好"的困局。

Gartner 有一个预测值得每个 CTO 认真看：到 2027 年，优先做 AI 就绪型数据准备而非优先做模型开发的企业，80%实现的业务价值将是同行的两倍。不是 1.2 倍，是两倍。这不是微弱优势，是量级差距——而量级差距的来源，正是模型能力提升对好数据的乘数效应。

先修数据底座的企业，AI 落地速度反而更快

认知陷阱说完了，但“数据先行”到底是不是一条走得通的路？我在 Snowflake Summit 26现场看到的三个案例，给出了相当有说服力的回答。

埃森哲：75万人岗位重构，数据底座先行

Manish 在台上说了一句话让我印象很深：“AI 只有以人类为主导才能创造真实价值，领导者必须亲自牵头 adoption，把AI落地和公司利润表绑定。”这不是场面话——埃森哲自己就是这么做的。两个月前，埃森哲调整了全球75万名员工的岗位架构，围绕7类核心高管角色重构组织，所有业务输出都基于统一的 Snowflake 数据底座。

Manish Sharma 补充了一个关键细节：一家欧洲传统公用事业客户，在统一数据底座之后，分析查询从数周缩短到2秒，项目从立项到交付从数月缩短到12周，计算成本下降85%。他反复强调一个原则：

"Don't do a project if you are not linking into business outcomes."不绑定业务成果的项目不值得做。——而绑定业务成果的前提，是你得先有一套数据能告诉你“成果是什么”。

赛诺菲：五年前就开始的数据赌注

赛诺菲首席数字官 Emmanuel Trinhard 的分享，可能是全场最能说明“数据先行”价值的案例。赛诺菲年采购金额达 180 亿欧元，五年前他们做了一个当时看来不那么“性感”的决定：整合多个分散的数据湖，统一到 Snowflake上。选择 Snowflake 的原因很简单——计算存储分离的架构，让数据整合不会成为新的孤岛。

但整合只是第一步。Trinhard 坦言，整合碎片化数据之后，他们只得到了数千个 BI 报表——数据有了，但价值没有释放。真正的质变发生在AI工作流接入之后：采购、IT支持、HR、销售多模块效率全面提升。现场演示了一个面向医药销售代表的 AI concierge——从请求到生成邮件，全程不到一分钟。五年前埋下的数据种子，现在长出了AI的果实。

制造业客户：不再争论“数据对不对”

Manish Sharma 还分享了一个未具名的美国制造业客户案例。这个案例没有宏大的数字，但有一个细节精准地击中了数据问题的要害：在统一数据底座之前，这个客户每次开会的前半小时都在争论“数据对不对”；统一数据源之后，会议直接进入“我们该做什么决策”。

这个细节之所以有力，是因为它揭示了数据碎片化最隐性的代价——不是技术问题，而是组织信任问题。当每个部门拿出的数据都不一样，决策就变成了博弈，而不是判断。统一数据源，重建的不只是数据架构，还有决策的信任基础——而信任，恰恰是AI落地最容易被忽视的加速器。

给 CTO 的三步顺序框架

回到那个行为悖论：为什么明知数据重要，还是先选模型？三个陷阱给出了诊断，三个案例给出了验证。现在的问题是：CTO 该怎么调顺序？

先说一个判断原则：数据底座的完成度，决定了模型层能跑多快。不是死记三步顺序，而是每次做决策时问自己一个问题——“我的数据底座能不能支撑我接下来要做的事？”如果能，继续；如果不能，先停下来补。这个标尺比任何清单都好用。

在这个原则下，具体操作是三步：

第一步：统一数据底座

不是“先把所有数据搬到一个地方”——那是数据搬家，不是数据统一。统一的核心是语义：同一份数据，所有人看到的是同一个定义，不同系统对同一份数据的理解一致，而不是简单地把数据搬到同一个地方。Snowflake 在峰会上推出的 OSI（Open Semantic Interoperability）开源标准，解决的正是这个问题——让数据语义对齐，而不是物理搬运。

第二步：模型自由

数据底座立住之后，选模型反而变得不那么重要了——因为你可以随时换。今天用 Claude，明天换GPT-5，后天试开源模型，底座不变，切换成本极低。这也是为什么数据底座先行的企业，反而更不纠结模型选型——底座不变，模型随时可换。模型是工具，不是战略。

第三步：搭管控平面

AI落地不是“接上模型就完了”。当 Agent 开始替人做决策、发邮件、调用系统，治理范围必须从数据扩展到AI的动作本身。Snowflake 在峰会上宣布 MCP 协议原生接入、宣布对 Natoma 的意向收购，就是在补这一层——让 AI 的每一个动作可观测、可审计、可回滚。

三个步骤，顺序不能反。先统一数据，再选模型，最后搭管控平面。反过来走——先选模型、再补数据、最后想治理——你会发现每一步都在为前一步的仓促买单。

Anthropic 联合创始人 Daniela Amodei 在演讲中说：“Trust is an accelerant.”信任是加速器，不是减速带。但信任的前提是什么？是你的数据底座先立住了，你的AI动作可控了，你的团队不再争论“数据对不对”了——这些，正是前面三个案例验证过的事。到那时，信任自然会来，速度自然会快。

坐在 Moscone 中心走出来的时候，我想起 Manish Sharma 那句话——85%的问题不是 AI，是数据。但更准确地说，85%的问题不是选错了模型，而是搞反了顺序。先修加油站，再挑发动机——这个顺序，才是真正的护城河。

🔍阅读原文：https://mp.weixin.qq.com/s/SiG6JK-G9kYlkc9jfUUSsQ"

赞 (0) 分享

暂无回复，快来抢沙发吧！

1 / 1 页

敬请注意：文中内容观点和各种评论不代表本网立场！若有违规侵权，请联系我们。

登录后参与讨论

新留园