利润腰斩也要卷AI!小米模型永久降价99%,雷军还要再砸600亿

小新 正三品 (侍郎) 2026-06-01 03:14 4 0 返回 AI 动态
小新 正三品 (侍郎) 楼主
2026-06-01 03:14
第1楼

摘要:此外,无论当前使用情况如何,所有已订阅代币计划且仍在有效期内的用户(包括参与Quadrillion代币创建者激励计划并获得代币计划的用户,涵盖Apache软件基金会独家福利的用户)的积分配额于北京时间5月27日0:00完全重置,并根据新的计费规则实施。4月26日,DeepSeek就宣布限时2.5折优惠,优惠期截至5月5日。有网友说道,“当前美国 AI 公司几乎没有机会收回哪怕一小部分估值。”


作者 | 华卫

近日,小米宣布永久性翻新整个模型定价体系。价格调整公告称,MiMo-V2.5系列API实施永久降价,最高降幅达99%,于北京时间5月27日0:00正式生效且全球同步。

继DeepSeek之后,小米成为又一家宣布API永久降价的大模型厂商。然而,在大方地向全球开放模型访问的同时,小米刚刚发布的2026年Q1财报却显示利润腰斩、营收下滑。

降价力度空前,不限上下文、Token额度翻至8倍

此次价格调整覆盖MiMo-V2.5和MiMo-V2.5 Pro两个版本,与原API定价相比,新定价最高可减少99%,且不再根据输入长度进行区分。

具体来看,MiMo-V2.5 Pro的输入缓存命中价格降至0.025元/百万tokens,相较于原价≤256k规格1.40元降幅达98%,对比256k-1M规格2.80元降幅更是触及99%;输入未命中缓存定价3.000元/百万tokens,较原价7.00元下降57%,对比长窗口原价14.00元降幅79%;输出定价6元/百万tokens,相较原价21元、42元分别下降71%与86%。

MiMo-V2.5的输入缓存命中价格降至0.02元/百万tokens,较≤256k原价0.56元降幅96%,较256k-1M原价1.12元降幅98%;输入未命中缓存定价1.000元/百万tokens,相比原价2.80元降幅64%,对比长窗口原价5.60元降幅82%;输出定价2元/百万tokens,较原价14元、28元分别下滑86%与93%。

除了API价格下调外,MiMo的Token Plan计费体系也同步迎来重大优化:增加数量但不涨价,使用量提升到原来的5-8倍。在公告中,小米列出了调整后的详细计费规则,如下:

此外,无论当前使用情况如何,所有已订阅代币计划且仍在有效期内的用户(包括参与Quadrillion代币创建者激励计划并获得代币计划的用户,涵盖Apache软件基金会独家福利的用户)的积分配额于北京时间5月27日0:00完全重置,并根据新的计费规则实施。对于代币计划已过期的历史付费用户,小米准备了惊喜礼物,将在下周内公布。

值得注意的是,本次调价主要聚焦MiMo-V2.5核心系列,MiMo-V2.5-TTS系列依旧保持限时免费接入政策,而MiMo-V2-Pro与MiMo-V2-Omni两款高阶模型API价格维持原价不变,同时其Token Plan套餐也不再参与调整并即将下线,引导开发者向高性价比的V2.5系列迁移。

据了解,MiMo-V2.5系列的迭代由曾任职DeepSeek的95后AI技术人才罗福莉负责。在整个MiMo大模型产品矩阵中,MiMo-V2.5-Pro主打高性能复杂推理,适配企业级智能体开发、深度业务分析等高阶商用场景;MiMo-V2.5聚焦轻量化通用需求,主打中小开发者日常调用与轻量化应用落地;MiMo-V2.5-TTS则瞄准语音合成赛道,以免费策略抢占音频生态入口。

营收利润都跌麻了,雷军:AI还得再投600亿

对于此次价格调整的原因,小米称,这背后是其技术团队对推理系统的持续优化。“我们完全支持基于SGLang HiCache的SWA(滑动窗口注意力),将KV缓存在GPU内存、CPU内存和SSD等多级存储之间的数据传输量减少到优化前的近7分之一,并将可缓存token数量提升到优化前近5倍,显著提升了缓存命中率和推理效率。同时,我们通过优化专家并行方案、输入长度分桶策略等,进一步提升了集群的输入吞吐量容量,持续降低每枚token的服务成本,同时确保服务质量。”

在公告中,小米还强调,“技术的价值最终在于其广泛的使用。让更多人使用更好的模型,这是MiMo坚定不移的使命。”

据了解,小米当前在AI方面的底层研发投入数额已然十分庞大。北京时间 5 月 26 日晚,小米发布了 2026 年第一季度财报(截止 2026 年 3 月)。在技术创新领域,小米本季度研发支出达90亿元,同比增长33.4%,研发团队规模扩大至26048人。不过相较从2025年第四季度96亿元的研发开支,这季度已经减少6.7%,小米称“主要是基于手机xAIoT相关的研发项目进度所致”。

然而,从整体财报数据来看,小米这季度的营收、毛利率、经营利润、经调整利润无论是同比还是环比都出现不同程度地下滑。一季度小米总收入录得991.4亿元,同比下跌10.9%;经调整净利润也从106.8亿元回落至60.7亿元,跌幅达43.1%;毛利为218.1亿元,同比下跌14.2%。经营利润承压更为严重,从去年同期的131.3亿元大跌59.5%至53.1亿元。

尽管如此,小米仍计划持续加大AI领域的资金投入。就在昨日,小米创始人雷军表示,“Xiaomi MiMo-V2.5-Pro跻身Artificial Analysis榜单综合智能指数、Agent指数全球开源模型并列第一。小米今年AI投入至少160亿元,未来三年在AI领域计划投入600亿元。”

国内外AI定价分化,海外网友:疑惑但“我选中国模型”

在小米宣布降价前不久,国内另一头部大模型公司DeepSeek已先一步开启“永久降价”。该公司宣布,DeepSeek-V4-Pro模型API价格在5月31日结束2.5折的限时优惠后,永久调整为原定价的1/4。调价后,这一模型的输入缓存命中0.025元/百万tokens、未命中缓存3元/百万tokens、输出6元/百万tokens,相较原价实现75%的降幅。

实际上,在4月24日上线并同步开源后,DeepSeek V4-Pro模型的原价只维持了两天。4月26日,DeepSeek就宣布限时2.5折优惠,优惠期截至5月5日。4月28日,该公司又宣布将优惠期延长至5月31日。现在,定价直接降至了原来的1/4。如今,DeepSeek V4-Pro的调用价格,已经低得有些“离谱”了,比GPT-5.5便宜34倍。

有海外网友表示,“我已经迫不及待想搭建一个大模型集群,用上百个 DeepSeek 和 Mimo 模型协同运行。如今真是技术狂飙的时代。”网友们表示,“在人工评测榜单上,小米 MiMo 仅比 Opus 低 3 分,价格便宜了百倍以上,性能差距却微乎其微。即便只是 DeepSeek V4 Flash(还不是Pro版),调到高性能档位后,能力基本比肩 Claude Opus 4.7,响应速度极快,成本还极低。连续对话数小时,花费也才几美分。”

还有人指出,“除了Deepseek和小米,现在很多AI实验室都会骗你缓存读取。如果你为缓存读取花了不少钱,实际上是在为几秒钟的显存时间付出高昂的代价。自回归语言建模的本质在于,每一个输出token都会读取缓存。所以原则上,缓存命中的价格下限是1个输出token的固定成本。但实际上,情况可能不止于此,因为你用缓存占用了显存,迫使其他用户退出。”

“所有美国公司(OpenAI、Anthropic、Google、MS Copilot)最近都涨价了,而中国公司则在降价。问题是,他们是怎么做到的?按理说,他们本应因芯片制裁更吃力才对。其次,为什么是现在?原本美国公司也被认为会通过补贴来维持竞争力,但现在他们已经跟不上了。大家都在转向按使用量计费的模式,这对他们来说似乎不可持续。毕竟他们的资金也很充足。如果真的存在能够降低算力需求的硬件突破,我相信这对全世界来说都是一件好事。“有海外网友发出疑问。

据了解,除小米与DeepSeek外,国内的阿里云通义千问、字节跳动豆包等通用型大模型相继下调API调用价格。

今年以来,全球在线 AI 托管平台OpenRouter上,中国大模型连续占据前列,包括小米MiMo 、阶跃星辰Step 3.5 Flash、MiniMax、DeepSeek、Kimi等。而OpenRouter的“霸榜”逻辑无非是,在API够用的情况下,调用成本越低廉,调用总量排名就越高。

“借助中国模型,谁都能用上高性价比的AI服务。”有网友说道,“当前美国 AI 公司几乎没有机会收回哪怕一小部分估值。”

参考链接:

https://platform.xiaomimimo.com/docs/en-US/news/v2.5-price-update"

https://ir.mi.com/static-files/8bf22346-dc4f-473c-bfac-a748db90f4d2"

https://news.ycombinator.com/item?id=48282814"

暂无回复,快来抢沙发吧!

  • 1 / 1 页
敬请注意:文中内容观点和各种评论不代表本网立场!若有违规侵权,请联系我们