摘要:今年1月8日,智谱登陆港交所,nbsp;据了解,在稍晚的智谱年度业绩发布电话会上,智谱CEO张鹏进一步提出了“Token架构力”(Token Architect)新概念,将 AI 生产力价值定义为“智能调用量 × 智能质量 × 经济转化效率”。人人都是“Token架构师”,告别App堆叠“智谱不是一家传统意义上的软件公司,我们是一个以AGI为信仰的原生智能实验室。”
整理|华卫
昨日,智谱交出了2025年度业绩报告,这是其上市近三个月后的首份年度财报。今年1月8日,智谱登陆港交所,股价从发行价116.2港元一度冲至近700港元,目前市值超3000亿港元。
这份业绩报告喜忧参半,其收入激增但亦被分析师评增长低于预期,且综合毛利率不佳。智谱表示,公司预计通过收入增长和提升运营效率实现盈利,但尚未给出具体时间表。智谱还在财报中传达了一个信号,将继续加大投资,增加国产芯片在训练模型中的使用。
财报显示,智谱2025年营收7.24亿元,同比增长131.9%;毛利2.97亿元,同比增长68.7%;毛利率为41.0%,较上年的56.3%下降15.3个百分点;年内亏损47.18亿元,同比扩大59.5%;经调整后净亏损31.82亿元,同比扩大29.1%;研发投入31.8亿元,同比增长44.9%。
从营收情况来看,智谱是一家典型的大模型公司:收入增长很快,但亏损巨大;研发投入仍然非常重,强度达营收的4.4倍。此外,智谱的毛利率下降明显,整体综合毛利率由2024年的56.3%降至41.0%。
收入结构上,智谱2025年以本地化部署服务为主。其中,本地化部署服务收入5.34亿元,同比增长102.3%,占总收入的73.7%;云端部署服务收入1.90亿元,同比增长292.6%,占比26.3%。需要注意的是,2025年智谱这两种服务模式的毛利率变化不一。云端部署毛利率从上年的3.3%提升到18.9%,改善不小;但本地化部署毛利率则从66.0%下降到48.8%。
财报中对此的解释是,云端部署业务主要由于模型推理效率提升、算力规模扩张导致边际成本递减,同时价格有所增加;即通过对推理侧的极致工程优化,在大幅度降低单位成本的同时,实现了毛利表现的稳健提升;本地化部署业务由于为满足客户需求而投入了更多的交付资源。
具体按业务形态与核心产品线来拆分,智谱2025年的企业级通用大模型收入3.66亿元,占比50.4%;开放平台及API收入1.90亿元,占比26.3%;企业级智能体收入1.66亿元,占比22.9%;技术服务及其他收入占比低。
值得一提的是,智谱所有业务收入相较2024年均同比增长。其中,企业级通用大模型收入增幅达70.5%,开放平台及API的收入增幅达292.6%,企业级智能体收入增幅达248.8%,技术服务及其他收入增幅达31.6%。
“‘智能上界的突破’是这个时代唯一的物理第一性。如果说智能上界决定了技术的定价权,那么Token的消耗规模则决定了商业价值的体量。”智谱在财报中称,其内部推导出了一个简洁的公式: AGI商业价值=智能上界×Token消耗规模。2025年,随着GLM在编程(Coding)与智能体(Agent)等元场景的深度渗透,智谱付费Token消耗量实现了指数级跃迁。凭借GLM系列,智谱实现了从开发者生态到全球化MaaS (Model-as-a-Service)平台的全面爆发。
据了解,在稍晚的智谱年度业绩发布电话会上,智谱CEO张鹏进一步提出了“Token架构力”(Token Architect)新概念,将 AI 生产力价值定义为“智能调用量 × 智能质量 × 经济转化效率”。并且,张鹏表示,“当模型足够强,API本身就是最好的商业模式。”
在业务模式上,智谱一直对标Anthropic。Anthropic 的 CEO Dario Amodei曾透露,公司60%至75%的收入来自API,且明确将编程作为核心用例,因为"企业用例为模型改进提供了更强的激励"。智谱此次发布的财报中,表演最亮眼的也来自API平台。
财报显示,截至报告期末,智谱API平台ARR实现17 亿元,过去一年提升60倍。2025年推出的GLM Coding Plan,付费开发者规模突破24.2万。GLM-5发布后24小时内即获得字节、阿里、腾讯等头部大厂官方接入,中国前10大互联网公司中已有9家深度集成GLM。2026年3月推出的Claw Plan上线仅两天订阅用户即破10万,上线20天订阅用户突破40万。截至2026年3月,智谱的平台注册企业及用户突破400万,服务全球超过218个国家及地区。
张鹏强调,智谱API价格在2026年一季度上调83%后,市场依然供不应求,调用量增长400%。在今年第一季度,智谱对API价格进行两次上调。2月,智谱主动上调价格30%并取消首购优惠。
“智谱不是一家传统意义上的软件公司,我们是一个以AGI为信仰的原生智能实验室。”在财报中,智谱预测道,2026年,智能范式将从轻量化的Vibe Coding(氛围编程)向工业级的Agentic Engineering(智能体工程)演变,再进化为具备自主规划、环境感知与自我迭代能力的数字工程师,最终实现跨越多步迭代、具备逻辑一致性的Long-horizon Task(长程任务)闭环执行,这将进一步带来智能上界的突破与Token调用的指数级增长。
而当大模型具备长程任务执行的闭环能力后,核心竞争力将重塑为TAC(Token Architecture Capability, Token架构能力)。TAC = 智能调用量×智能质量×经济转化效率。未来,衡量一个个体或组织价值的标准,不再是掌握了多少信息,而是其作为Token架构师,在给定预算下构建复杂Agent系统并驱动大模型完成复杂Agent系统的自主运行。“智谱的目标是成为提升全社会TAC的基础设施,让每一滴Token都能转化为可交付的经济增量。”
随着OpenClaw等应用驱动的Token消耗进入指数级轨道,一场智能输出革命正在发生。首先是推理再中心化:凭借超大规模集群的规模经济与极致的推理优化,云端大参数基模的效率将进一步提高。其次高质量Token出海。据了解,GLM-5的国产化适配已超越简单的算子移植,进入了Co-design(软硬协同设计)阶段。在底层内核层面,通过Lightning Indexer等定制化融合内核与FlashComm通信优化,最大限度隐藏了内存访问与通信延迟,这种深度调优让GLM系列在国产芯片上跑出了比肩国际顶级芯片的推理效率。
进入2026年,算力范式正在发生剧变,OpenClaw的爆发式应用提前引燃了 Token消耗狂潮。智谱称,他们将继续加大投入,尤其是深耕国产芯片的“Day 0”适配与软硬一体化调优。“我们将推理性能压榨至极限,不是为了短期盈利,而是为了支撑那条不断上扬的、高质量Token消耗的指数曲线。”
同时,智谱指出,大模型正在吞噬软件,未来的计算平台将不再是App的堆叠,而是API商店与Agent矩阵的协同。在LLM-OS架构下,模型直接理解模糊意图、拆解长程任务并调度全栈资源。谁的模型进入了系统内核,谁就掌握了下一代计算的定义权。
参考链接:
https://www1.hkexnews.hk/listedco/listconews/sehk/2026/0331/2026033101550_c.pdf"
暂无回复,快来抢沙发吧!
本次需消耗银元:
100
当前账户余额: 0 银元
整理|华卫
昨日,智谱交出了2025年度业绩报告,这是其上市近三个月后的首份年度财报。今年1月8日,智谱登陆港交所,股价从发行价116.2港元一度冲至近700港元,目前市值超3000亿港元。
这份业绩报告喜忧参半,其收入激增但亦被分析师评增长低于预期,且综合毛利率不佳。智谱表示,公司预计通过收入增长和提升运营效率实现盈利,但尚未给出具体时间表。智谱还在财报中传达了一个信号,将继续加大投资,增加国产芯片在训练模型中的使用。
营收翻倍增长,亏损同比扩大
财报显示,智谱2025年营收7.24亿元,同比增长131.9%;毛利2.97亿元,同比增长68.7%;毛利率为41.0%,较上年的56.3%下降15.3个百分点;年内亏损47.18亿元,同比扩大59.5%;经调整后净亏损31.82亿元,同比扩大29.1%;研发投入31.8亿元,同比增长44.9%。
从营收情况来看,智谱是一家典型的大模型公司:收入增长很快,但亏损巨大;研发投入仍然非常重,强度达营收的4.4倍。此外,智谱的毛利率下降明显,整体综合毛利率由2024年的56.3%降至41.0%。
收入结构上,智谱2025年以本地化部署服务为主。其中,本地化部署服务收入5.34亿元,同比增长102.3%,占总收入的73.7%;云端部署服务收入1.90亿元,同比增长292.6%,占比26.3%。需要注意的是,2025年智谱这两种服务模式的毛利率变化不一。云端部署毛利率从上年的3.3%提升到18.9%,改善不小;但本地化部署毛利率则从66.0%下降到48.8%。
财报中对此的解释是,云端部署业务主要由于模型推理效率提升、算力规模扩张导致边际成本递减,同时价格有所增加;即通过对推理侧的极致工程优化,在大幅度降低单位成本的同时,实现了毛利表现的稳健提升;本地化部署业务由于为满足客户需求而投入了更多的交付资源。
具体按业务形态与核心产品线来拆分,智谱2025年的企业级通用大模型收入3.66亿元,占比50.4%;开放平台及API收入1.90亿元,占比26.3%;企业级智能体收入1.66亿元,占比22.9%;技术服务及其他收入占比低。
值得一提的是,智谱所有业务收入相较2024年均同比增长。其中,企业级通用大模型收入增幅达70.5%,开放平台及API的收入增幅达292.6%,企业级智能体收入增幅达248.8%,技术服务及其他收入增幅达31.6%。
Token价值大增,核心指标直追Anthropic水平
“‘智能上界的突破’是这个时代唯一的物理第一性。如果说智能上界决定了技术的定价权,那么Token的消耗规模则决定了商业价值的体量。”智谱在财报中称,其内部推导出了一个简洁的公式: AGI商业价值=智能上界×Token消耗规模。2025年,随着GLM在编程(Coding)与智能体(Agent)等元场景的深度渗透,智谱付费Token消耗量实现了指数级跃迁。凭借GLM系列,智谱实现了从开发者生态到全球化MaaS (Model-as-a-Service)平台的全面爆发。
据了解,在稍晚的智谱年度业绩发布电话会上,智谱CEO张鹏进一步提出了“Token架构力”(Token Architect)新概念,将 AI 生产力价值定义为“智能调用量 × 智能质量 × 经济转化效率”。并且,张鹏表示,“当模型足够强,API本身就是最好的商业模式。”
在业务模式上,智谱一直对标Anthropic。Anthropic 的 CEO Dario Amodei曾透露,公司60%至75%的收入来自API,且明确将编程作为核心用例,因为"企业用例为模型改进提供了更强的激励"。智谱此次发布的财报中,表演最亮眼的也来自API平台。
财报显示,截至报告期末,智谱API平台ARR实现17 亿元,过去一年提升60倍。2025年推出的GLM Coding Plan,付费开发者规模突破24.2万。GLM-5发布后24小时内即获得字节、阿里、腾讯等头部大厂官方接入,中国前10大互联网公司中已有9家深度集成GLM。2026年3月推出的Claw Plan上线仅两天订阅用户即破10万,上线20天订阅用户突破40万。截至2026年3月,智谱的平台注册企业及用户突破400万,服务全球超过218个国家及地区。
张鹏强调,智谱API价格在2026年一季度上调83%后,市场依然供不应求,调用量增长400%。在今年第一季度,智谱对API价格进行两次上调。2月,智谱主动上调价格30%并取消首购优惠。
人人都是“Token架构师”,告别App堆叠
“智谱不是一家传统意义上的软件公司,我们是一个以AGI为信仰的原生智能实验室。”在财报中,智谱预测道,2026年,智能范式将从轻量化的Vibe Coding(氛围编程)向工业级的Agentic Engineering(智能体工程)演变,再进化为具备自主规划、环境感知与自我迭代能力的数字工程师,最终实现跨越多步迭代、具备逻辑一致性的Long-horizon Task(长程任务)闭环执行,这将进一步带来智能上界的突破与Token调用的指数级增长。
而当大模型具备长程任务执行的闭环能力后,核心竞争力将重塑为TAC(Token Architecture Capability, Token架构能力)。TAC = 智能调用量×智能质量×经济转化效率。未来,衡量一个个体或组织价值的标准,不再是掌握了多少信息,而是其作为Token架构师,在给定预算下构建复杂Agent系统并驱动大模型完成复杂Agent系统的自主运行。“智谱的目标是成为提升全社会TAC的基础设施,让每一滴Token都能转化为可交付的经济增量。”
随着OpenClaw等应用驱动的Token消耗进入指数级轨道,一场智能输出革命正在发生。首先是推理再中心化:凭借超大规模集群的规模经济与极致的推理优化,云端大参数基模的效率将进一步提高。其次高质量Token出海。据了解,GLM-5的国产化适配已超越简单的算子移植,进入了Co-design(软硬协同设计)阶段。在底层内核层面,通过Lightning Indexer等定制化融合内核与FlashComm通信优化,最大限度隐藏了内存访问与通信延迟,这种深度调优让GLM系列在国产芯片上跑出了比肩国际顶级芯片的推理效率。
进入2026年,算力范式正在发生剧变,OpenClaw的爆发式应用提前引燃了 Token消耗狂潮。智谱称,他们将继续加大投入,尤其是深耕国产芯片的“Day 0”适配与软硬一体化调优。“我们将推理性能压榨至极限,不是为了短期盈利,而是为了支撑那条不断上扬的、高质量Token消耗的指数曲线。”
同时,智谱指出,大模型正在吞噬软件,未来的计算平台将不再是App的堆叠,而是API商店与Agent矩阵的协同。在LLM-OS架构下,模型直接理解模糊意图、拆解长程任务并调度全栈资源。谁的模型进入了系统内核,谁就掌握了下一代计算的定义权。
参考链接:
https://www1.hkexnews.hk/listedco/listconews/sehk/2026/0331/2026033101550_c.pdf"