AI Agent 会让 token 爆炸 24 倍?高盛的数据和现实的落差

高盛最近发了一份研究报告,核心数字很吓人:到 2030 年,AI Agent 的 token 消耗量将是现在的 24 倍——每月 120 万亿亿(quadrillion)个 token。这个数字大到连报告里的分析师都承认,不知道 quadrillion 后面还有什么单位。

同一天,AI 研究员 Rohan Paul 在 X 上拆解了这个数字背后的逻辑:Agent 不是聊天机器人。聊天机器人回答一次就结束了,Agent 会规划、打电话、预订、检查结果、分析、再试——一个用户请求消耗的 token 可能是普通对话的 10 倍、50 倍,甚至更多。

AI Agent 会让 token 爆炸 24 倍?高盛的数据和现实的落差

这两件事放在一起,讲了一个完美的故事:Agent 普及→token 爆炸→用量增长远超成本下降→云厂商现金流改善→AI 投资终于有回报。逻辑链条严丝合缝。

但我不太相信。

先看看高盛的数据

高盛的核心模型建立在几个假设上:

第一,消费端 token 消耗增长 12 倍——在线购物、手机接管、邮箱整理这些场景会大量涌现。

第二,企业端 adoption 叠加——最终每月 120 万亿亿 token。

第三,推理成本每年下降 60-70%——芯片效率提升和数据中心架构优化。

第四,未来 3-12 个月会出现"利润率拐点"——成本下降速度快于价格下降速度,云厂商的毛利率会改善。

听起来很完整。但仔细看,这里面有几个问题。

Agent 确实更费 token,但不等于每个人都会用

Rohan Paul 的分析是对的——一个 Agent 任务消耗的 token 远多于一次聊天。问题在于,这个"远多于"的前提是有人真的在用。

高盛自己的报告里写了一句话,不太起眼:到 2030 年,预计只有 12% 的知识工作者会使用 agentic AI。到 2040 年,这个数字是 37%。

14 年后的渗透率才 37%。这不叫"爆炸式增长",这叫缓慢爬坡。

高盛说企业 adoption 会比消费端更慢,原因是企业应用更复杂——写代码比订机票难得多,客服比邮箱管理难得多。而且还要考虑合规、预算、测试、集成。这些都是对的。

但"对"和"能支撑 24 倍增长"是两码事。

成本下降的速度,可能比你想象的快

高盛假设推理成本每年降 60-70%。这个数字本身已经很快了——意味着 3 年后成本只有现在的 3-10%。

但高盛同时假设用量增长会远超成本下降,所以总费用还是在涨。这个判断的前提是:需求增长是指数级的。

我觉得这里有个认知偏差。高盛看的是"如果所有人都在用 Agent"的场景,而现实是大多数人连聊天机器人都没用明白。

中国市场已经有一些"always-on"的后台 Agent——帮你订机票、整理邮箱、过滤垃圾邮件。但这些功能的 token 消耗真的需要乘以 50 吗?订一张机票的对话,AI 规划-执行-确认,可能确实比问一个问题多几倍 token,但 50 倍?这个数字更像是理论上限,不是实际均值。

一个有趣的反例

高盛报告里提到一个细节:在某些实时语音 Agent 的场景中,人类成本实际上比 LLM 成本更低。原因是"时间依赖性"和"延迟特性"——AI 要做到实时响应,需要更多的计算资源和更复杂的架构,反而更贵。

这个细节很诚实,但也很致命。它说明 AI Agent 不是在所有场景下都比人便宜。高盛自己也承认,经济学不是对所有 AI 工作负载都有利。

这意味着什么?意味着 token 增长不会是均匀的。有些场景(比如编码)Agent 确实高效,有些场景(比如实时语音客服)可能长期不划算。24 倍的总量预测,是把所有场景混在一起算的平均值——但平均值会掩盖巨大的方差。

芯片短缺是另一个变量

高盛预测未来 12 个月芯片会短缺,两年后可能跟上。建一个新芯片厂需要三年,而需求的变化速度比这快得多。

短缺意味着什么?意味着云厂商拿不到足够的算力,即使想扩容也扩不了。这反过来会限制 Agent 的实际部署速度。需求曲线再陡,供给跟不上也是白搭。

微软的例子

Rohan Paul 还提到了微软——计划 6 月 30 日前将 OpenAI 集成到 Copilot 命令行,目标本财年实现约 700 亿美元 AI 收入,同比增长 60-70%。

700 亿美元。这个数字很大,但微软的总营收是 2000 多亿美元。AI 占三分之一。考虑到微软是最积极拥抱 AI 的科技巨头之一,这个占比说明 AI 还没有"接管"整个行业。

如果连微软的 AI 收入都只占总营收的三分之一,其他公司呢?

我的判断

高盛的报告不是错的——它的模型在假设成立的前提下是自洽的。问题在于假设本身。

24 倍增长需要三个条件同时成立:Agent 被大规模采用、每个 Agent 消耗大量 token、成本下降跟不上用量增长。我觉得第一个条件就存疑。

更可能的情况是:token 消耗会增长,但不会是 24 倍。Agent 会普及,但不会取代所有人类工作流。成本会下降,而且可能比高盛预计的更快——因为竞争太激烈了,芯片厂商和云厂商都在拼命降价抢市场。

利润率拐点可能确实会出现,但不是因为用量爆炸,而是因为成本降得太快,快到用量增长都追不上。

这和华尔街喜欢听的叙事不一样。华尔街要的是"指数级增长"的故事,不是"温和增长但成本大幅下降"的故事。后者不够性感。

但后者可能更真实。