文生图(图片生成)
通过 LLMEasy 的 OpenAI 兼容接口调用 GPT Image2,根据文本提示词生成图片。
Documentation Index
Fetch the complete documentation index at: https://docs.llmeasy.ru/llms.txt
Use this file to discover all available pages before exploring further.
POST /v1/images/generations
文生图接口使用 application/json 请求体。你提交文本提示词后,接口会同步等待生成完成,并在同一个响应的 data[0].b64_json 中返回图片内容。
https://www.llmeasy.ru/v1 作为 Base URL。调用时通过 Authorization: Bearer YOUR_API_KEY 传入 LLMEasy API Key。推荐请求值
所有文生图请求建议显式传入这些字段:n > 1。
推荐尺寸
size | 比例 | 适用场景 |
|---|---|---|
auto | 自动 | 自动选择尺寸 |
1024x1024 | 1:1 | 方图,通用头像、封面、素材图 |
1536x1024 | 3:2 | 横图,海报、banner、场景图 |
1024x1536 | 2:3 | 竖图,移动端封面、人物海报 |
1536x1152 | 4:3 | 标准横图,商品图、内容配图、横版素材 |
1152x1536 | 3:4 | 标准竖图,移动端封面、竖版海报、人物图 |
2048x2048 | 1:1 | 高清方图 |
2048x1152 | 16:9 | 高清横图 |
3840x2160 | 16:9 | 4K 横图 |
2160x3840 | 9:16 | 4K 竖图 |
size 表示期望的图片比例和尺寸档位。实际返回图片像素可能由服务端映射或调整。客户端不应把返回图片强行裁切到请求值,建议以解码后的真实图片尺寸为准。
保存返回图片
成功响应为 OpenAI 兼容图片响应结构:data[0].b64_json 并将其作为 base64 图片内容保存。响应中可能出现额外字段,例如 revised_prompt,客户端应允许这些字段存在。
建议所有请求都显式指定 output_format: "png"。这样保存为 .png 即可,不需要再解析文件头判断格式。
响应流程
文生图接口是同步响应模式。客户端提交POST /images/generations 后,应保持当前 HTTP 请求连接并等待服务端返回。生成成功时,图片内容会直接出现在同一个响应的 data[0].b64_json 字段中。
文生图不会返回 task_id,也没有单独的状态查询接口或结果下载接口。不需要轮询任务状态,也不能通过额外的 /images/... URL 再获取结果。
超时和重试
- HTTP 客户端超时建议设置为数分钟级别。
- 对传输层异常、
408、409、425、429和5xx可以重试。 - 对
400、401、参数缺失、格式错误不要自动重试。 - 重试时使用指数退避,例如等待
3s、8s、15s。 - 如果业务不能接受重复图片,应用层应记录自己的请求 ID,避免用户重复提交。
错误处理
错误响应通常是 JSON。展示错误时,建议按顺序读取:error.messagemessage- HTTP status text
| HTTP 状态码 | 含义 | 建议处理 |
|---|---|---|
400 | 请求格式错误、缺少参数、JSON 解析失败、尺寸格式错误 | 检查请求体,不要自动重试。 |
401 | API Key 缺失或无效 | 检查 Authorization header。 |
402 | 额度或余额不足 | 提示用户充值或更换可用 key。 |
429 | 触发限速、并发限制或上游繁忙 | 等待后重试,建议指数退避。 |
5xx | 网关或上游服务异常 | 可重试,仍失败时记录 request id 和错误信息。 |
接入检查清单
- Base URL 是
https://www.llmeasy.ru/v1。 - Header 包含
Authorization: Bearer sk-...。 - 请求使用
application/json。 - 模型固定为
gpt-image-2。 response_format固定为b64_json。output_format固定为png。n固定为1。size使用推荐尺寸之一。- 客户端能处理数分钟级别的生成耗时。
- 日志和报错截图中不会泄露 API Key 或完整 base64 图片内容。
相关文档
授权
Используйте API Key LLMEasy как bearer token. Не публикуйте API keys во frontend-коде, скриншотах, логах, тикетах или Git-репозиториях.
请求体
Используйте фиксированное значение gpt-image-2.
gpt-image-2 "gpt-image-2"
Prompt для генерации изображения.
"Футуристичный постер AI-продукта на светлом фоне, стеклянная фактура, чистая композиция, премиальный технологичный стиль"
Рекомендуется фиксировать значение 1. Для нескольких изображений отправляйте несколько отдельных запросов.
1 <= x <= 11
Размеры и соотношения сторон изображения. auto выбирает размер автоматически; 1024x1024 и 2048x2048 — 1:1; 1536x1024 — 3:2; 1024x1536 — 2:3; 1536x1152 — 4:3; 1152x1536 — 3:4; 2048x1152 и 3840x2160 — 16:9; 2160x3840 — 9:16. Фактический размер может быть сопоставлен или скорректирован сервером, поэтому клиенту следует ориентироваться на реальные размеры декодированного изображения.
auto, 1024x1024, 1536x1024, 1024x1536, 1536x1152, 1152x1536, 2048x2048, 2048x1152, 3840x2160, 2160x3840 "1024x1024"
Рекомендуется фиксировать b64_json, чтобы стабильно сохранять изображение.
b64_json "b64_json"
Рекомендуется фиксировать png. Не рассчитывайте, что jpeg или webp всегда вернутся напрямую в выбранном формате.
png "png"