OpenRouter 推出统一图像 API:一个接口,调用 30+ 图像生成模型

AI 图像生成领域正在经历一场混乱——不同模型有不同的参数格式,不同供应商有不同的计费逻辑,开发者为了支持多个模型往往要写一堆丑陋的适配代码。OpenRouter 最近推出的 统一图像 API(Unified Image API)​,正是为了终结这种混乱。

一个入口,覆盖主流玩家

这次发布的图像 API 统一接入了超过 30 个图像生成模型,阵容相当豪华:Google、OpenAI、Black Forest Labs(FLUX 系列的出品方)、Recraft、ByteDance(Seedream 系列)、Microsoft、xAI……几乎把当下最活跃的图像模型提供商一网打尽。

过去,如果你想在产品里支持多个图像模型,就得分别对接各家的 API,处理各自迥异的请求格式和响应结构。而现在,OpenRouter 把这一切抽象成了一个统一的接口层。

机器可读的能力描述,彻底告别 400 错误

这个 API 最值得关注的设计之一,是 /api/v1/images/models 端点。它会以结构化的方式返回每个模型的能力描述——支持哪些宽高比、最多能一次生成几张图、能接受几张参考图、是否支持 seed……

举个例子,ByteDance 的 Seedream 4.5 支持 18 种宽高比,而 Gemini 3.1 Flash Image 支持 14 种(两者有交集但并不完全相同)。不查文档你根本不知道,一个不小心就是一个 400 Bad Request。有了这个端点,你的代码可以动态读取模型能力、自动做参数校验,完全不需要硬编码每个模型的差异。

对于正在构建 AI Agent 的团队来说,这一点尤其实用——直接把 /api/v1/images/models 的返回结果喂给你的 Coding Agent,它就能自主选择合适的模型、验证输入参数、完成图像生成,不再需要反复试错。

一套请求结构,适配所有模型

统一的请求格式是这个 API 最直接的价值体现。无论你调用哪个模型,请求体的结构都是一致的:

curl -X POST "https://openrouter.ai/api/v1/images" \
-H "Authorization: Bearer $OPENROUTER_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "bytedance-seed/seedream-4.5",
"prompt": "a red panda astronaut floating in space, studio lighting",
"resolution": "2K",
"aspect_ratio": "16:9"
}'

分辨率、宽高比、输出质量、图片格式、背景透明度、参考图输入、流式输出……这些常见参数都经过了跨供应商的标准化处理。如果你需要用到某个供应商特有的参数(比如 Black Forest Labs 的 steps 或 guidance),可以通过 provider.options 字段透传,灵活度同样保留了。

定价终于透明了

图像生成的计费历来是一笔糊涂账。不同供应商的计费单位五花八门:Seedream 4.5 按张收费,每张 $0.04;FLUX.2 Pro 按像素收费,每 Megapixel $0.03(也就是说你选的分辨率越高,费用越高);而 GPT-5.4 Image 2 和 Gemini 3.1 Flash Image 则按 token 计费。

OpenRouter 通过 /api/v1/images/models/{id}/endpoints 端点,把每个供应商的定价结构以结构化方式暴露出来,每次 API 响应的 usage 字段里还会包含本次请求的精确美元成本。做产品的朋友应该深有感触——这对成本控制和用量分析来说,是不可或缺的基础能力。

GPT 图像模型支持流式预览

对于 OpenAI 的 GPT-5 Image、GPT-5 Image Mini、GPT-5.4 Image 2 这几个模型,OpenRouter 还支持了 SSE 流式传输。设置 "stream": true 后,用户在等待图片生成的过程中就能看到局部预览,而不是对着一个 Loading 状态发呆。这对 C 端产品的用户体验提升不小。

写在最后

OpenRouter 这次做的事情,本质上是在图像生成领域复制了它在 LLM 领域已经验证过的那套打法——统一接口、标准化参数、透明定价、动态能力发现。对开发者和产品团队来说,这意味着更低的接入成本、更灵活的模型切换能力,以及更清晰的成本核算链路。

值得注意的是,OpenRouter 已经宣布新的图像模型将只在专用图像 API 上线,不再走 Chat Completions 接口。如果你的项目还在用旧的方式调用图像模型,现在是时候考虑迁移了。