Google I/O 2026 最大的发布不是 AI 搜索,不是硬件,甚至不是 Gemini App 的升级。是 Gemini 3.5 Flash。而且它不是"即将发布"——今天就能用。
我去翻了一下官方文档和几家媒体的评测,整理了一些信息。写下来,也给自己备忘。

数字
Gemini 3.5 Flash 的输出速度是 284 tokens/秒。Google 的说法是"比其他前沿模型快 4 倍"。这不是"更快了一点"的程度,是换了发动机。
Context window 是 1M tokens,跟 Pro 一样。输入支持文本、图片、语音、视频,输出只有文本。
智能排名
速度快不代表智能低。在 Artificial Analysis 的智能排行榜上,Gemini 3.5 Flash 排第 7 名(55.32 分)。排在它前面的只有这几个:
| 模型 | 分数 |
|---|---|
| GPT-5.5 | 60.24 |
| Claude Opus 4.7 | 57.28 |
| Gemini 3.1 Pro | 57.18 |
| GPT-5.4 | 56.80 |
| GPT-5.5 (medium) | 56.71 |
| Gemini 3.5 Flash | 55.33 |
一个 Flash 版本打到了旗舰级,这个排位确实不低。
具体 Benchmark 数据:
| 测试 | 得分 |
|---|---|
| Agent 能力(Terminal-Bench 2.1) | 76.2% |
| 编码能力(GDPval-AA) | 1656 Elo |
| MCP 工具调用(MCP Atlas) | 83.6% |
| 多模态推理(CharXiv Reasoning) | 84.2% |
定价
这部分我比较在意。输入 $1.50/1M tokens,输出 $9.00/1M tokens。
输出价格比 GPT-4.1 的 $8.00 还贵。速度快,但单价高。如果你的场景对延迟敏感、需要快速响应,它可能是个好选择。但如果你要批量处理大量数据,成本会是个问题。
缓存读取有优惠,低至 $0.15(-90%),这个倒是友好。
Agentic 能力
Google 在官方博客里展示了一些 Demo,配合 Antigravity 平台的效果:
6 小时从 AlphaZero 论文到可玩游戏。60 秒生成多个 UX 设计方案。自动把 legacy 代码库迁移到 Next.js。用两个 agent(builder + player)在自改进循环中开发游戏。
Demo 看着很猛。实际效果如何,等开发者上手用一段时间再说。
还没来的部分
有两个细节需要注意。
3.5 Pro 还没发布。Google 说下个月(6 月)推出,目前只有 Flash 版本可用。所以如果你需要更深的推理能力,得等。
输出只支持文本,不支持图片、音频等多模态输出。Google 把资源全押在了 agentic 和编码上。
我的判断
Gemini 3.5 Flash 不是来抢"最智能"头衔的。它的定位很明确:最快能干活的那个。
如果你需要 Agent 快速跑多步任务、写代码、调工具,它可能是现在性价比最高的选择。如果你需要深度推理,等下个月的 Pro。
Google 打的是速度牌,这个策略对不对,市场会给出答案。