编辑图像

POST /v1/images/edits

说明

根据一个或多个源图像和提示词创建编辑或扩展后的图像。请求体使用 multipart/form-data。

请求头

名称位置类型必填说明
Authorizationheaderstring

请求体

字段类型必填说明
image[]string本地文件上传形式,对应官方 curl 示例中的 image[]=@file。GPT 图像模型最多支持 16 张图片输入,单图支持 PNG、WebP 或 JPG 格式。Swagger 2.0 不能标准表达同名多文件数组;如需上传多张本地图片,请在实际 multipart 请求中重复 image[] 字段。
promptstring描述期望图像编辑结果的文本提示词。GPT 图像模型最大 32000 字符;dall-e-2 最大 1000 字符。
backgroundstring输出图像的背景行为。可选 transparent、opaque 或 auto。仅 GPT 图像模型支持。
input_fidelitystring控制对原始输入图像的保真度。high 会更强地保留输入图像中的视觉细节。
maskstring遮罩图像引用。由于 Swagger 2.0 的 formData 不支持对象参数,这里使用字符串表示官方 mask 对象中的 image_url 或 file_id。值可以是完整图片 URL、base64 data URL 或 file_id。官方要求 image_url 与 file_id 二选一。
modelstring用于图像编辑的模型。官方页面说明支持 GPT Image 系列以及 dall-e-2。
moderationstringGPT 图像模型的内容审核级别。可选 low 或 auto。
nnumber需要生成的编辑后图像数量,范围 1 到 10。
output_compressionnumberjpeg 或 webp 输出格式的压缩级别,范围 0 到 100。
output_formatstring输出图像格式。仅 GPT 图像模型支持。
partial_imagesnumber流式响应中要生成的中间图数量,范围 0 到 3。为 0 时,最终图像会在单个流事件中返回。
qualitystring输出质量。 - GPT 图像模型支持 low、medium、high; - dall-e-2 仅支持 standard; - auto 让模型自动选择。
response_formatstring返回格式,仅 dall-e-2 edit 支持,可选 url 或 b64_json。GPT 图像模型不支持该参数。注意:OpenAI 官方实际响应始终为 base64 编码图像(b64_json),url 模式仅对 dall-e-2 历史兼容场景生效。
sizestring请求的输出图像尺寸。 - GPT 图像模型(gpt-image-1 / gpt-image-1-mini / gpt-image-1.5):auto、1024x1024、1536x1024、1024x1536 - dall-e-2:256x256、512x512、1024x1024 - gpt-image-2:1024x1024、1536x1024、1024x1536、2048x2048、2048x1152、3840x2160、2160x3840、auto
streamboolean是否以事件流形式返回部分图像结果。仅 GPT 图像模型支持。
userstring代表终端用户的唯一标识,可帮助 OpenAI 监控和检测滥用。

响应

字段类型必填说明
createdinteger
dataarray