开云kaiyun(中国) “价钱屠户”来了:小米MiMo大模子API持久降价最高达99%

5 月 27 日,小米布告 MiMo-V2.5 系列大模子 API 价钱体系进行持久性调价,最高降幅度达 99%,且不再分辩高下文长度。
具体来看 MiMo-V2.5-Pro:
百万 tokens 输入(缓存掷中)只需要 0.025 元。
米兰体育官方网站 - MILAN百万 tokens 输入(缓存未掷中)3 元。
百万 tokens 输出 6 元。
不仅如斯,Token Plan 方面,小米领受"加量不涨价"战略,用户在 Agent 或 Code 场景下的可用 Token 数目将晋升至原本的 5-8 倍,并把限定调理为"所见即所得",简化了因换算导致的复杂计价逻辑。
这是继 DeepSeek 上周布告 V4-Pro 持久降价至原价 25% 之后,国内头部大模子在短短一周内的又一次重磅价钱调理。
国际比拟看,DeepSeek 与小米的最新订价已显贵低于主流国外厂商。
国际主流模子方面,OpenAI GPT-4o 的要领输入价钱为每百万 Tokens 2.5 好意思元,输出价钱为 10 好意思元;Claude Sonnet 4.6 的输入为每百万 Tokens 3 好意思元,输出为 15 好意思元。
与简短的"烧钱"不同,小米这次降价的逻辑指向工程层面的老本结构优化。
据小米解说,基于 SGLang HiCache 完竣营救 SWA(Sliding Window Attention),将 KV Cache 在 GPU 显存、CPU 内存、SSD 等多级存储之间的数据搬运量裁减至优化前的近 1/7,开云体育并将可缓存 token 数目晋升至优化前的近 5 倍,显贵晋升了缓存掷中率和推理后果。此外,小米还通过优化民众决策、输入长度分桶战略等技术,进一步晋升集群输入朦拢能力。
这与 DeepSeek 的降价逻辑前因后果,齐是通过架构转变以及推理系统的工程化优化,结构性地压低单元 Token 奇迹老本,再将红利让渡给修复者。
从行业情况来看,本轮国产大模子降价潮亦是伴跟着诓骗方需求的变化,跟着大模子正在从"聊天"进入"干活"的阶段,着实让修复者和企业用户惊惶的也不再仅仅一次问答金额,而是 Agent 在多轮推理、调用和自动化老本使命流等历程中捏续毁灭的 Token。
当百万 Tokens 价钱被握住压低,国内大模子的竞争也会陆续向下流传导。关于修复者来说,老本着落意味着更多 Agent 等诓骗供给会迎来井喷;关于厂商来说,廉价背后则是更高的推理后果、更强的算力逶迤能力,以及更长周期的生态参加。
价钱战偶而能径直决定谁的模子最强开云kaiyun(中国),但不错激动其更快地被修复者调用,小米 MiMo 此时大幅降价恰是国内大模子走向"限制化使用"的又一个注脚。