OpenClaw 创始人 Peter 一个月用掉 6030 亿 Token

OpenClaw 创始人 Peter Steinberger 在社交媒体上发布了一张 Token 使用量截图。最显眼的数字是:一个月消耗 6030 亿 Token。按截图里的预设费率估算,价值约 130 万美元。

另一条转述里还补了几个细节:约 760 万次请求,团队同时跑着大约 100 个 Codex Agent,用来推进 OpenClaw 项目。

OpenClaw 创始人 Peter 一个月用掉 6030 亿 Token

这几个数字放在一起,已经不像“某个人 AI 用得比较多”。它更像一间机器办公室的用电记录。有人在里面写代码,有人在检查代码,有人在跑测试,有人在等下一条指令。只是这些“人”都按 Token 计费。

这张账单为什么扎眼

如果只是普通聊天,6030 亿 Token 这个数字没有太多讨论价值。无非是一个极端用户,把模型当水龙头开了一个月。

OpenClaw 的语境不一样。它的官网把自己放在“个人 AI 助理”的位置上:清理邮箱、发送邮件、管理日历、处理登机、接入 WhatsApp 和 Telegram。官网上的用户评价也很明确,很多人把它当成一个长期在线的助手,而不是一个问答页面。

问题就出在这里。聊天机器人的成本是一次对话的成本,Agent 的成本是一次行动链条的成本。它要读上下文,要调用工具,要判断下一步,要失败重试。有时候还要同时开很多个 Agent,让它们各自处理一小块事情。

所以这张截图刺眼,不只是因为贵。它把一个平时藏在后台的东西摆出来了:AI 真正开始干活之后,账单会跟着工作流一起增长。

“省 Token”和“烧 Token”其实在同一件事里

有意思的是,围绕 OpenClaw 的英文教程,主线又是省钱。

Tech With Tim 有一个 OpenClaw 教程,标题就叫“Save 95% of Your Tokens”。配套指南里讲模型路由:默认用 Claude Haiku,复杂任务再切到 Sonnet;还讲 fallback、prompt caching、spending rules、session 初始化限制、本地 Ollama heartbeat。

这些做法听起来很精打细算。可另一边,大家看到的传播点却是 6030 亿 Token、130 万美元、100 个 Agent。

我觉得这不是矛盾,反而说明这个阶段已经开始成熟了。一个东西只有真的被大规模使用,才会有人认真做成本控制。没人会为一个玩具做 token audit,也没人会给一个偶尔打开的 demo 配缓存、限额和模型路由。

云计算也是这样走过来的。早期大家关心“服务器上云是不是浪费钱”,后来关心的是“每一笔云账单有没有对应业务价值”。AI Agent 大概率也会走到这一步。

以后公司看 AI 成本,不能只问“这个模型多少钱”。更实际的问题是:这一组 Agent 跑了一晚上,换回了什么?少了几小时人工?多快交付了一个版本?有没有减少返工?有没有制造新的错误?

机器员工也要算工资

OpenClaw 官网上有一句用户评价很有画面感:一个聪明模型,有眼睛、有手,坐在桌前,有键盘和鼠标。你像给同事发消息一样叫它做事。

这句话比“AI 助理”更准确。真正改变成本结构的,不是一个更聪明的聊天框,而是一个可以长期待命、能接工具、能记上下文、能自己继续推进任务的东西。

一个 Agent 很容易被当成工具。十个 Agent 同时跑起来,就开始像团队。一百个 Agent 长时间跑着,账单、权限、审计、失败处理、上下文管理都会变成管理问题。

这也是 6030 亿 Token 这个数字值得写的原因。它像是提前漏出来的一张工资表,只不过员工名字都叫 Agent。

普通人会在哪些地方感受到它

多数人不会在下个月收到一张 130 万美元的 API 账单,但这种成本变化会慢慢传到每个人身边。

开发者会先感受到。以前是自己写代码,后来是用 Copilot 补代码,再后来是让 Agent 开分支、读 issue、跑测试、提 PR。到这一步,能力差距不只来自会不会写代码,还来自会不会把任务拆给 Agent,怎么检查它,怎么控制它别乱花钱。

创业者也会感受到。很多 AI 产品现在看起来毛利很好,是因为用量还没真正上来。一旦用户开始把 Agent 当长期员工用,模型调用、浏览器操作、文件读取、队列重试都会变成成本。产品定价如果还停留在“每月几十美元随便用”,迟早要重新算。

普通职场人感受到的方式更隐蔽。你不会看到 Token 账单,但你会发现一些重复工作突然被拆走了:会议纪要、资料整理、客户跟进、表格核对、代码审查、内容排期。它们不一定被一个完整的软件替代,而是被一串小 Agent 慢慢吃掉。

这时候再问“AI 会不会替代我”,已经有点粗糙了。更应该问的是:我的工作里,有多少动作可以被连续执行、被检查、被复用?这些动作一旦被拆出去,我还剩下什么判断力?

真正的门槛会变成 Token 预算

过去讨论 AI,经常讨论模型能力:推理强不强,上下文长不长,写代码稳不稳。

这些当然重要。但 Agent 时代还有一个更朴素的门槛:你能不能让它一直跑。

偶尔问 AI 几个问题,和让一组 Agent 连续工作一周,不是同一种能力。后者需要预算,需要路由,需要缓存,需要日志,需要权限边界,也需要有人知道什么时候该停。

这会让 AI 使用出现新的分层。有些人把 AI 当搜索框,有些人把 AI 当外包,有些人开始把 AI 当组织结构的一部分。到了第三层,Token 就不再是技术细节,而是生产资料。

OpenClaw 这张账单真正提醒我的,是这个分层已经开始了。

最后

6030 亿 Token 听起来像一个夸张故事,但它可能只是未来几年里很普通的一类账单,被提前放大给我们看。

它提醒我们,AI Agent 的问题不能只从“能做什么”出发,也要从“持续做这些事要付多少钱”出发。

一个月 130 万美元当然极端。可一旦 Agent 真的进入工作流,每家公司、每个团队、每个重度使用者都会遇到自己的小号 6030 亿 Token。

那时候,AI 的竞争不只是谁提示词写得好。还包括谁能把机器员工用得起、管得住、算得清。