首页信息技术 AI 动态

利润腰斩也要卷AI！小米模型永久降价99%，雷军还要再砸600亿

小新正三品 (侍郎) 2026-06-01 03:14 29 0 返回 AI 动态

小

小新正三品 (侍郎) 楼主

2026-06-01 03:14

第1楼

摘要：此外，无论当前使用情况如何，所有已订阅代币计划且仍在有效期内的用户（包括参与Quadrillion代币创建者激励计划并获得代币计划的用户，涵盖Apache软件基金会独家福利的用户）的积分配额于北京时间5月27日0：00完全重置，并根据新的计费规则实施。4月26日，DeepSeek就宣布限时2.5折优惠，优惠期截至5月5日。有网友说道，“当前美国 AI 公司几乎没有机会收回哪怕一小部分估值。”

作者 | 华卫

近日，小米宣布永久性翻新整个模型定价体系。价格调整公告称，MiMo-V2.5系列API实施永久降价，最高降幅达99%，于北京时间5月27日0：00正式生效且全球同步。

继DeepSeek之后，小米成为又一家宣布API永久降价的大模型厂商。然而，在大方地向全球开放模型访问的同时，小米刚刚发布的2026年Q1财报却显示利润腰斩、营收下滑。

降价力度空前，不限上下文、Token额度翻至8倍

此次价格调整覆盖MiMo-V2.5和MiMo-V2.5 Pro两个版本，与原API定价相比，新定价最高可减少99%，且不再根据输入长度进行区分。

具体来看，MiMo-V2.5 Pro的输入缓存命中价格降至0.025元/百万tokens，相较于原价≤256k规格1.40元降幅达98%，对比256k-1M规格2.80元降幅更是触及99%；输入未命中缓存定价3.000元/百万tokens，较原价7.00元下降57%，对比长窗口原价14.00元降幅79%；输出定价6元/百万tokens，相较原价21元、42元分别下降71%与86%。

MiMo-V2.5的输入缓存命中价格降至0.02元/百万tokens，较≤256k原价0.56元降幅96%，较256k-1M原价1.12元降幅98%；输入未命中缓存定价1.000元/百万tokens，相比原价2.80元降幅64%，对比长窗口原价5.60元降幅82%；输出定价2元/百万tokens，较原价14元、28元分别下滑86%与93%。

除了API价格下调外，MiMo的Token Plan计费体系也同步迎来重大优化：增加数量但不涨价，使用量提升到原来的5-8倍。在公告中，小米列出了调整后的详细计费规则，如下：

此外，无论当前使用情况如何，所有已订阅代币计划且仍在有效期内的用户（包括参与Quadrillion代币创建者激励计划并获得代币计划的用户，涵盖Apache软件基金会独家福利的用户）的积分配额于北京时间5月27日0：00完全重置，并根据新的计费规则实施。对于代币计划已过期的历史付费用户，小米准备了惊喜礼物，将在下周内公布。

值得注意的是，本次调价主要聚焦MiMo-V2.5核心系列，MiMo-V2.5-TTS系列依旧保持限时免费接入政策，而MiMo-V2-Pro与MiMo-V2-Omni两款高阶模型API价格维持原价不变，同时其Token Plan套餐也不再参与调整并即将下线，引导开发者向高性价比的V2.5系列迁移。

据了解，MiMo-V2.5系列的迭代由曾任职DeepSeek的95后AI技术人才罗福莉负责。在整个MiMo大模型产品矩阵中，MiMo-V2.5-Pro主打高性能复杂推理，适配企业级智能体开发、深度业务分析等高阶商用场景；MiMo-V2.5聚焦轻量化通用需求，主打中小开发者日常调用与轻量化应用落地；MiMo-V2.5-TTS则瞄准语音合成赛道，以免费策略抢占音频生态入口。

营收利润都跌麻了，雷军：AI还得再投600亿

对于此次价格调整的原因，小米称，这背后是其技术团队对推理系统的持续优化。“我们完全支持基于SGLang HiCache的SWA（滑动窗口注意力），将KV缓存在GPU内存、CPU内存和SSD等多级存储之间的数据传输量减少到优化前的近7分之一，并将可缓存token数量提升到优化前近5倍，显著提升了缓存命中率和推理效率。同时，我们通过优化专家并行方案、输入长度分桶策略等，进一步提升了集群的输入吞吐量容量，持续降低每枚token的服务成本，同时确保服务质量。”

在公告中，小米还强调，“技术的价值最终在于其广泛的使用。让更多人使用更好的模型，这是MiMo坚定不移的使命。”

据了解，小米当前在AI方面的底层研发投入数额已然十分庞大。北京时间 5 月 26 日晚，小米发布了 2026 年第一季度财报（截止 2026 年 3 月）。在技术创新领域，小米本季度研发支出达90亿元，同比增长33.4%，研发团队规模扩大至26048人。不过相较从2025年第四季度96亿元的研发开支，这季度已经减少6.7%，小米称“主要是基于手机xAIoT相关的研发项目进度所致”。

然而，从整体财报数据来看，小米这季度的营收、毛利率、经营利润、经调整利润无论是同比还是环比都出现不同程度地下滑。一季度小米总收入录得991.4亿元，同比下跌10.9%；经调整净利润也从106.8亿元回落至60.7亿元，跌幅达43.1%；毛利为218.1亿元，同比下跌14.2%。经营利润承压更为严重，从去年同期的131.3亿元大跌59.5%至53.1亿元。

尽管如此，小米仍计划持续加大AI领域的资金投入。就在昨日，小米创始人雷军表示，“Xiaomi MiMo-V2.5-Pro跻身Artificial Analysis榜单综合智能指数、Agent指数全球开源模型并列第一。小米今年AI投入至少160亿元，未来三年在AI领域计划投入600亿元。”

国内外AI定价分化，海外网友：疑惑但“我选中国模型”

在小米宣布降价前不久，国内另一头部大模型公司DeepSeek已先一步开启“永久降价”。该公司宣布，DeepSeek-V4-Pro模型API价格在5月31日结束2.5折的限时优惠后，永久调整为原定价的1/4。调价后，这一模型的输入缓存命中0.025元/百万tokens、未命中缓存3元/百万tokens、输出6元/百万tokens，相较原价实现75%的降幅。

实际上，在4月24日上线并同步开源后，DeepSeek V4-Pro模型的原价只维持了两天。4月26日，DeepSeek就宣布限时2.5折优惠，优惠期截至5月5日。4月28日，该公司又宣布将优惠期延长至5月31日。现在，定价直接降至了原来的1/4。如今，DeepSeek V4-Pro的调用价格，已经低得有些“离谱”了，比GPT-5.5便宜34倍。

有海外网友表示，“我已经迫不及待想搭建一个大模型集群，用上百个 DeepSeek 和 Mimo 模型协同运行。如今真是技术狂飙的时代。”网友们表示，“在人工评测榜单上，小米 MiMo 仅比 Opus 低 3 分，价格便宜了百倍以上，性能差距却微乎其微。即便只是 DeepSeek V4 Flash（还不是Pro版），调到高性能档位后，能力基本比肩 Claude Opus 4.7，响应速度极快，成本还极低。连续对话数小时，花费也才几美分。”

还有人指出，“除了Deepseek和小米，现在很多AI实验室都会骗你缓存读取。如果你为缓存读取花了不少钱，实际上是在为几秒钟的显存时间付出高昂的代价。自回归语言建模的本质在于，每一个输出token都会读取缓存。所以原则上，缓存命中的价格下限是1个输出token的固定成本。但实际上，情况可能不止于此，因为你用缓存占用了显存，迫使其他用户退出。”

“所有美国公司（OpenAI、Anthropic、Google、MS Copilot）最近都涨价了，而中国公司则在降价。问题是，他们是怎么做到的？按理说，他们本应因芯片制裁更吃力才对。其次，为什么是现在？原本美国公司也被认为会通过补贴来维持竞争力，但现在他们已经跟不上了。大家都在转向按使用量计费的模式，这对他们来说似乎不可持续。毕竟他们的资金也很充足。如果真的存在能够降低算力需求的硬件突破，我相信这对全世界来说都是一件好事。“有海外网友发出疑问。

据了解，除小米与DeepSeek外，国内的阿里云通义千问、字节跳动豆包等通用型大模型相继下调API调用价格。

今年以来，全球在线 AI 托管平台OpenRouter上，中国大模型连续占据前列，包括小米MiMo 、阶跃星辰Step 3.5 Flash、MiniMax、DeepSeek、Kimi等。而OpenRouter的“霸榜”逻辑无非是，在API够用的情况下，调用成本越低廉，调用总量排名就越高。

“借助中国模型，谁都能用上高性价比的AI服务。”有网友说道，“当前美国 AI 公司几乎没有机会收回哪怕一小部分估值。”

参考链接：

https://platform.xiaomimimo.com/docs/en-US/news/v2.5-price-update"

https://ir.mi.com/static-files/8bf22346-dc4f-473c-bfac-a748db90f4d2"

https://news.ycombinator.com/item?id=48282814"

赞 (0) 分享

暂无回复，快来抢沙发吧！