GPT-Image-2
Geração de imagens GPT-Image-2 Canal Oficial
- Modelo oficial
gpt-image-2da OpenAI, baseado no protocolo compatível/v1/images/generations - Processamento assíncrono, retorna
task_idpara consultas posteriores - Texto para imagem / imagem para imagem / inpainting (máscara) — tudo em um
- Novo campo de nível
resolution— escolha entre 1K / 2K / 4K - 15 proporções suportadas nos níveis 1K / 2K / 4K
- Até 4 imagens por requisição, até 16 imagens de referência
- 95% de alinhamento de parâmetros com
gpt-image-1.5-official— migração requer apenas a alteração do nome do modelo
POST
Documentation Index
Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt
Use this file to discover all available pages before exploring further.
Autorizações
Todos os endpoints requerem autenticação por Bearer TokenObtenha sua chave de API:Acesse a página de gerenciamento de chaves de API para obter sua chave de APIInclua-a no cabeçalho da requisição:
Body
Nome do modelo de geração de imagensFixo em
gpt-image-2-official (modelo oficial gpt-image-2 da OpenAI)Descrição textual para a geração da imagem
- Suporta inglês e chinês, descrições detalhadas são recomendadas
- Moderação de conteúdo / revisão de segurança antes do envio — violações são rejeitadas imediatamente
Proporção da imagemExternamente, usa valores de proporção; internamente, é mapeada para pixels reais de acordo com
resolution.Proporções suportadas, além de auto para deixar o servidor escolher uma proporção adequada automaticamente:auto- Automático (o servidor escolhe uma proporção com base no prompt / imagens de referência)1:1- Quadrado (padrão, avatares de redes sociais / logos)3:2- Paisagem (proporção comum de DSLR)2:3- Retrato (pôsteres verticais)4:3- Paisagem (monitor clássico / apresentação de slides)3:4- Retrato5:4- Paisagem4:5- Retrato (post vertical do Instagram)16:9- Paisagem (miniatura de vídeo widescreen)9:16- Retrato (tela cheia do celular / capa de vídeo curto)2:1- Paisagem (banner web)1:2- Retrato3:1- Paisagem (banner ultrawide)1:3- Retrato (pôster extra alto)21:9- Paisagem (ultrawide cinematográfico)9:21- Retrato
1881x836 / 887x1774.Nível de resolução (novo campo)Controla a nitidez real da saída.
1k- Linha de base 1024, custo-eficiente para uso diário (padrão)2k- Linha de base 2048, adequado para pôsteres / necessidades de alta definição4k- Linha de base 3840, suporta as 15 proporções na tabela de mapeamento abaixo
Qualidade da imagem
auto- Automático (padrão, normalmente equivalente alow)low- Rápido e econômico, suficiente para esboçosmedium- Balanceadohigh- Precisão máxima (4K + high pode levar mais de 120s)
Modo de fundo
auto- Automático (padrão)opaque- Opacotransparent- ⚠️ gpt-image-2-official não suporta fundos transparentes; o sistema rebaixa silenciosamente paraauto
Intensidade da moderação
auto- Intensidade de moderação padrãolow- Moderação mais permissiva
Formato de saída
png- Padrãojpeg- Arquivos menoreswebp- Ideal para navegadores modernos
Nível de compressão de saída, intervalo
0-100- Eficaz apenas para
jpeg/webp
Número de imagens a serem geradasIntervalo:
1 ~ 4Array de URLs de imagens de referência
URL da imagem de máscara, usada para inpainting
- Deve ser usada em conjunto com
image_urls
Mapeamento Size × Resolution
size × resolution → pixels reais da OpenAI (15 proporções × 3 níveis):
| size | 1k | 2k | 4k |
|---|---|---|---|
1:1 | 1024×1024 | 2048×2048 | 2880×2880 |
3:2 | 1536×1024 | 2048×1360 | 3520×2336 |
2:3 | 1024×1536 | 1360×2048 | 2336×3520 |
4:3 | 1024×768 | 2048×1536 | 3312×2480 |
3:4 | 768×1024 | 1536×2048 | 2480×3312 |
5:4 | 1280×1024 | 2560×2048 | 3216×2576 |
4:5 | 1024×1280 | 2048×2560 | 2576×3216 |
16:9 | 1536×864 | 2048×1152 | 3840×2160 |
9:16 | 864×1536 | 1152×2048 | 2160×3840 |
2:1 | 2048×1024 | 2688×1344 | 3840×1920 |
1:2 | 1024×2048 | 1344×2688 | 1920×3840 |
3:1 | 1881×836 / 1536×512 | 3072×1024 | 3840×1280 |
1:3 | 887×1774 / 512×1536 | 1024×3072 | 1280×3840 |
21:9 | 2016×864 | 2688×1152 | 3840×1648 |
9:21 | 864×2016 | 1152×2688 | 1648×3840 |
Observação: Algumas dimensões são aproximadas com base em múltiplos de 16 e limites de pixel, como3:2/2:3@ 2K sendo 2048×1360 e21:9@ 4K sendo 3840×1648. Use os pixels reais da tabela como fonte da verdade.
Exemplos de uso
Texto para imagem (requisição mínima)Response
Código de status da resposta
Array de dados da resposta
Consulta de resultados da tarefa
Após o envio bem-sucedido, umtask_id é retornado. Consulte o status da tarefa via GET /v1/tasks/{task_id}, veja API de consulta de tarefas para mais detalhes.
Exemplo de resposta de sucesso
submitted → in_progress → completed / failed.
Acesso à imagem: data.result.images[0].url[0].
Recomendações de polling
- Atraso da consulta inicial: Aguarde 10~20 segundos após o envio antes da primeira consulta
- Intervalo de consulta: 3~5 segundos recomendados
- Referência de timeout: Combinações
high + 2k/4kpodem levar até 130 segundos; timeout do cliente ≥ 180 segundos recomendado - Consulta em lote: Para consultar várias tarefas de uma só vez, use
POST /v1/tasks/batch