39 块能跑 5 亿 Token:小米 MiMo V2.5 的 Credits 到底怎么算

小米 MiMo 在 5 月 27 日的调价公告里,除了把 API 价格砍了个遍,Token Plan 的计费规则也重写了。最核心的变化是 Credits 与 Token 的换算关系——这个数字直接决定了你买的套餐能用多久。

39 块能跑 5 亿 Token:小米 MiMo V2.5 的 Credits 到底怎么算

我们先看对比。V2 系列和 V2.5 系列的换算倍数完全不同:

模型 命中缓存 未命中缓存 输出
mimo-v2.5-pro 2.5 Credits/token 300 Credits/token 600 Credits/token
mimo-v2.5 2 Credits/token 100 Credits/token 200 Credits/token
mimo-v2-pro 140 Credits/token 700 Credits/token 2100 Credits/token
mimo-v2-omni 56 Credits/token 280 Credits/token 1400 Credits/token

几个数字摆在一起,差别就出来了。

缓存命中的差距最大

V2.5-Pro 命中缓存时,每 Token 只需要 2.5 个 Credits。而 V2-Pro 是 140 个——差了 56 倍。MiMo V2.5 更是只要 2 个 Credits,比 V2-Omni 的 56 倍低了 28 倍。

这个差距不是微调,是量级上的碾压。原因在于 SGLang HiCache 对 SWA(滑动窗口注意力机制)的完整支持,把 KV Cache 在 GPU、CPU、SSD 之间的搬运量压到了原来的七分之一,可缓存的 token 数量翻了近五倍。缓存命中率上去之后,每 Token 的 Credits 消耗自然跟着往下掉。

换句话说,V2.5 的定价策略在赌一件事:你的任务缓存命中率不会太低。只要缓存命,V2.5 就是目前市面上每 Token Credits 消耗最低的模型之一。

未命中缓存和输出也大幅降低

未命中缓存的情况下,V2.5 每 Token 消耗 100 Credits,比 V2-Pro 的 700 低了七倍,比 V2-Omni 的 280 也低了 2.8 倍。输出方面,V2.5 每 Token 200 Credits,V2-Pro 要 2100——差了十倍多。

也就是说,不管缓存命不命中,V2.5 的 Credits 消耗都比老模型低。只是缓存命中的优势更夸张而已。

套餐 Credits 额度升级后的实际用量

换算规则变了,套餐里的 Credits 总额也变了。四档套餐的 Credits 从几亿跳到几百亿:

套餐 定价 调整前 调整后
Lite ¥39 0.6 亿 41 亿
Standard ¥99 2 亿 110 亿
Pro ¥329 7 亿 380 亿
Max ¥659 16 亿 820 亿

Credits 多了,每 Token 消耗的 Credits 也少了。两个变化叠加之后,实际能用的 Token 数量涨到了原来的 5 到 8 倍。小米官方按 95%+ 缓存命中率的场景做了估算:

使用 MiMo-V2.5 使用 MiMo-V2.5-Pro
Lite ¥39 500M+ Lite ¥39 190M+
Standard ¥99 1300M+ Standard ¥99 500M+
Pro ¥329 4700M+ Pro ¥329 1800M+
Max ¥659 10000M+ Max ¥659 3900M+

Lite 套餐用 V2.5 能跑 5 亿 Token,Max 套餐能跑 100 亿。这个量级放在当前国内模型市场里,已经是头部水平了。

两个需要留意的点

第一,"具体缓存命中率取决于实际任务"。小米在公告里加了这句话。Agent 和 Code 场景的缓存命中率会更高,但如果是每次输入都完全不同的对话场景,缓存命中的优势就发挥不出来。V2.5 的定价逻辑是鼓励你把任务做长、上下文做复用,不是一次性问完就走的那种用法。

第二,V2-Pro 和 V2-Omni 的 Token Plan 不参与调整,即将下线。也就是说,Credits 换算规则的全面更新只针对 V2.5 系列。还在用老模型的用户被明确建议尽快迁移。

换算规则变了,但套餐价格没变

Lite 还是 39 块,Max 还是 659。价格没涨,Credits 翻了近五十倍,每 Token 消耗的 Credits 又砍了一截。对已经在用 Token Plan 的用户来说,这次调整是纯利好。5 月 27 日零点,所有有效 Token Plan 用户的额度全量重置,按新规则执行——用量清零,按新的 Credits 上限重新计算。

另外,针对 Token Plan 已过期的历史付费用户,小米表示会在"未来一周"宣布额外安排。