开云kaiyun(中国) “价钱屠户”来了：小米MiMo大模子API持久降价最高达99%

发布时间：2026-05-29 来源：开云体育app 作者：admin 浏览：130

5 月 27 日，小米布告 MiMo-V2.5 系列大模子 API 价钱体系进行持久性调价，最高降幅度达 99%，且不再分辩高下文长度。

具体来看 MiMo-V2.5-Pro：

百万 tokens 输入（缓存掷中）只需要 0.025 元。

米兰体育官方网站 - MILAN

百万 tokens 输入（缓存未掷中）3 元。

百万 tokens 输出 6 元。

不仅如斯，Token Plan 方面，小米领受"加量不涨价"战略，用户在 Agent 或 Code 场景下的可用 Token 数目将晋升至原本的 5-8 倍，并把限定调理为"所见即所得"，简化了因换算导致的复杂计价逻辑。

这是继 DeepSeek 上周布告 V4-Pro 持久降价至原价 25% 之后，国内头部大模子在短短一周内的又一次重磅价钱调理。

国际比拟看，DeepSeek 与小米的最新订价已显贵低于主流国外厂商。

国际主流模子方面，OpenAI GPT-4o 的要领输入价钱为每百万 Tokens 2.5 好意思元，输出价钱为 10 好意思元；Claude Sonnet 4.6 的输入为每百万 Tokens 3 好意思元，输出为 15 好意思元。

与简短的"烧钱"不同，小米这次降价的逻辑指向工程层面的老本结构优化。

据小米解说，基于 SGLang HiCache 完竣营救 SWA（Sliding Window Attention），将 KV Cache 在 GPU 显存、CPU 内存、SSD 等多级存储之间的数据搬运量裁减至优化前的近 1/7，开云体育并将可缓存 token 数目晋升至优化前的近 5 倍，显贵晋升了缓存掷中率和推理后果。此外，小米还通过优化民众决策、输入长度分桶战略等技术，进一步晋升集群输入朦拢能力。

这与 DeepSeek 的降价逻辑前因后果，齐是通过架构转变以及推理系统的工程化优化，结构性地压低单元 Token 奇迹老本，再将红利让渡给修复者。

从行业情况来看，本轮国产大模子降价潮亦是伴跟着诓骗方需求的变化，跟着大模子正在从"聊天"进入"干活"的阶段，着实让修复者和企业用户惊惶的也不再仅仅一次问答金额，而是 Agent 在多轮推理、调用和自动化老本使命流等历程中捏续毁灭的 Token。

当百万 Tokens 价钱被握住压低，国内大模子的竞争也会陆续向下流传导。关于修复者来说，老本着落意味着更多 Agent 等诓骗供给会迎来井喷；关于厂商来说，廉价背后则是更高的推理后果、更强的算力逶迤能力，以及更长周期的生态参加。

价钱战偶而能径直决定谁的模子最强开云kaiyun(中国)，但不错激动其更快地被修复者调用，小米 MiMo 此时大幅降价恰是国内大模子走向"限制化使用"的又一个注脚。

上一篇：上一篇：开云kaiyun(中国) 时光在荏苒, 财气在汇注, 这三大生肖的收入会延续加多喽下一篇：下一篇：开云体育岛内业界条目民进党当局尽速根除“禁团令”

返回开云体育app