小米 MiMo 在 5 月 27 日的调价公告里,除了把 API 价格砍了个遍,Token Plan 的计费规则也重写了。最核心的变化是 Credits 与 Token 的换算关系——这个数字直接决定了你买的套餐能用多久。

我们先看对比。V2 系列和 V2.5 系列的换算倍数完全不同:
| 模型 | 命中缓存 | 未命中缓存 | 输出 |
|---|---|---|---|
| mimo-v2.5-pro | 2.5 Credits/token | 300 Credits/token | 600 Credits/token |
| mimo-v2.5 | 2 Credits/token | 100 Credits/token | 200 Credits/token |
| mimo-v2-pro | 140 Credits/token | 700 Credits/token | 2100 Credits/token |
| mimo-v2-omni | 56 Credits/token | 280 Credits/token | 1400 Credits/token |
几个数字摆在一起,差别就出来了。
缓存命中的差距最大
V2.5-Pro 命中缓存时,每 Token 只需要 2.5 个 Credits。而 V2-Pro 是 140 个——差了 56 倍。MiMo V2.5 更是只要 2 个 Credits,比 V2-Omni 的 56 倍低了 28 倍。
这个差距不是微调,是量级上的碾压。原因在于 SGLang HiCache 对 SWA(滑动窗口注意力机制)的完整支持,把 KV Cache 在 GPU、CPU、SSD 之间的搬运量压到了原来的七分之一,可缓存的 token 数量翻了近五倍。缓存命中率上去之后,每 Token 的 Credits 消耗自然跟着往下掉。
换句话说,V2.5 的定价策略在赌一件事:你的任务缓存命中率不会太低。只要缓存命,V2.5 就是目前市面上每 Token Credits 消耗最低的模型之一。
未命中缓存和输出也大幅降低
未命中缓存的情况下,V2.5 每 Token 消耗 100 Credits,比 V2-Pro 的 700 低了七倍,比 V2-Omni 的 280 也低了 2.8 倍。输出方面,V2.5 每 Token 200 Credits,V2-Pro 要 2100——差了十倍多。
也就是说,不管缓存命不命中,V2.5 的 Credits 消耗都比老模型低。只是缓存命中的优势更夸张而已。
套餐 Credits 额度升级后的实际用量
换算规则变了,套餐里的 Credits 总额也变了。四档套餐的 Credits 从几亿跳到几百亿:
| 套餐 | 定价 | 调整前 | 调整后 |
|---|---|---|---|
| Lite | ¥39 | 0.6 亿 | 41 亿 |
| Standard | ¥99 | 2 亿 | 110 亿 |
| Pro | ¥329 | 7 亿 | 380 亿 |
| Max | ¥659 | 16 亿 | 820 亿 |
Credits 多了,每 Token 消耗的 Credits 也少了。两个变化叠加之后,实际能用的 Token 数量涨到了原来的 5 到 8 倍。小米官方按 95%+ 缓存命中率的场景做了估算:
| 使用 MiMo-V2.5 | 使用 MiMo-V2.5-Pro | ||
|---|---|---|---|
| Lite ¥39 | 500M+ | Lite ¥39 | 190M+ |
| Standard ¥99 | 1300M+ | Standard ¥99 | 500M+ |
| Pro ¥329 | 4700M+ | Pro ¥329 | 1800M+ |
| Max ¥659 | 10000M+ | Max ¥659 | 3900M+ |
Lite 套餐用 V2.5 能跑 5 亿 Token,Max 套餐能跑 100 亿。这个量级放在当前国内模型市场里,已经是头部水平了。
两个需要留意的点
第一,"具体缓存命中率取决于实际任务"。小米在公告里加了这句话。Agent 和 Code 场景的缓存命中率会更高,但如果是每次输入都完全不同的对话场景,缓存命中的优势就发挥不出来。V2.5 的定价逻辑是鼓励你把任务做长、上下文做复用,不是一次性问完就走的那种用法。
第二,V2-Pro 和 V2-Omni 的 Token Plan 不参与调整,即将下线。也就是说,Credits 换算规则的全面更新只针对 V2.5 系列。还在用老模型的用户被明确建议尽快迁移。
换算规则变了,但套餐价格没变
Lite 还是 39 块,Max 还是 659。价格没涨,Credits 翻了近五十倍,每 Token 消耗的 Credits 又砍了一截。对已经在用 Token Plan 的用户来说,这次调整是纯利好。5 月 27 日零点,所有有效 Token Plan 用户的额度全量重置,按新规则执行——用量清零,按新的 Credits 上限重新计算。
另外,针对 Token Plan 已过期的历史付费用户,小米表示会在"未来一周"宣布额外安排。