GPT-Image-2
GPT-Image-2 Bildgenerierung (offizieller Kanal)
- OpenAI-offizielles Modell
gpt-image-2, basierend auf dem mit/v1/images/generationskompatiblen Protokoll - Asynchrone Verarbeitung, gibt
task_idfür nachfolgende Abfragen zurück - Text-zu-Bild / Bild-zu-Bild / Inpainting (Maske) — alles in einem
- Neues Feld
resolutionfür die Stufe — Auswahl 1K / 2K / 4K - 15 Seitenverhältnisse in den Stufen 1K / 2K / 4K verfügbar
- Bis zu 4 Bilder pro Anfrage, bis zu 16 Referenzbilder
- 95 % Parameter-Übereinstimmung mit
gpt-image-1.5-official— für die Migration genügt eine Änderung des Modellnamens
POST
Documentation Index
Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt
Use this file to discover all available pages before exploring further.
Autorisierung
Alle Endpunkte erfordern eine Authentifizierung per Bearer TokenAPI-Schlüssel erhalten:Besuchen Sie die Seite zur Verwaltung von API-Schlüsseln, um Ihren API-Schlüssel zu erhaltenFügen Sie ihn in den Anfrage-Header ein:
Body
Name des BildgenerierungsmodellsFest auf
gpt-image-2-official (offizielles OpenAI-Modell gpt-image-2) gesetztTextbeschreibung für die Bildgenerierung
- Unterstützt Englisch und Chinesisch, detaillierte Beschreibungen werden empfohlen
- Inhaltsmoderation / Sicherheitsprüfung vor dem Einreichen — Verstöße werden sofort abgelehnt
Seitenverhältnis des BildesExtern werden Verhältniswerte verwendet; intern werden sie gemäß
resolution automatisch auf tatsächliche Pixel abgebildet.Unterstützte Seitenverhältnisse, plus auto, damit der Server automatisch ein passendes Verhältnis auswählt:auto– Automatisch (Server wählt ein Verhältnis basierend auf Prompt / Referenzbildern)1:1– Quadrat (Standard, Social-Avatare / Logos)3:2– Querformat (gängiges DSLR-Verhältnis)2:3– Hochformat (vertikale Poster)4:3– Querformat (klassischer Monitor / Diashow)3:4– Hochformat5:4– Querformat4:5– Hochformat (Instagram-Hochformat-Post)16:9– Querformat (Breitbild-Video-Thumbnail)9:16– Hochformat (Telefon-Vollbild / Short-Video-Cover)2:1– Querformat (Web-Banner)1:2– Hochformat3:1– Querformat (ultrabreiter Banner)1:3– Hochformat (extra hohes Poster)21:9– Querformat (Kinoformat ultrabreit)9:21– Hochformat
1881x836 / 887x1774.Auflösungsstufe (neues Feld)Steuert die tatsächliche Ausgabeschärfe.
1k– Basis 1024, kosteneffizient für den täglichen Einsatz (Standard)2k– Basis 2048, geeignet für Poster / Anforderungen an hohe Auflösung4k– Basis 3840, unterstützt die 15 Verhältnisse in der Zuordnungstabelle unten
Bildqualität
auto– Automatisch (Standard, typischerweise gleichwertig mitlow)low– Schnell und sparsam, ausreichend für grobe Umrissemedium– Ausgewogenhigh– Höchste Präzision (4K + high kann über 120 s dauern)
Hintergrundmodus
auto– Automatisch (Standard)opaque– Undurchsichtigtransparent– ⚠️ gpt-image-2-official unterstützt keine transparenten Hintergründe; das System stuft stillschweigend aufautoherab
Moderationsstärke
auto– Standard-Moderationsstärkelow– Mildere Moderation
Ausgabeformat
png– Standardjpeg– Kleinere Dateienwebp– Optimal für moderne Browser
Ausgabe-Kompressionsstufe, Bereich
0–100- Nur für
jpeg/webpwirksam
Anzahl der zu generierenden BilderBereich:
1 ~ 4Array mit Referenzbild-URLs
Masken-Bild-URL, für Inpainting verwendet
- Muss zusammen mit
image_urlsverwendet werden
Size × Resolution Zuordnung
size × resolution → tatsächliche OpenAI-Pixel (15 Verhältnisse × 3 Stufen):
| size | 1k | 2k | 4k |
|---|---|---|---|
1:1 | 1024×1024 | 2048×2048 | 2880×2880 |
3:2 | 1536×1024 | 2048×1360 | 3520×2336 |
2:3 | 1024×1536 | 1360×2048 | 2336×3520 |
4:3 | 1024×768 | 2048×1536 | 3312×2480 |
3:4 | 768×1024 | 1536×2048 | 2480×3312 |
5:4 | 1280×1024 | 2560×2048 | 3216×2576 |
4:5 | 1024×1280 | 2048×2560 | 2576×3216 |
16:9 | 1536×864 | 2048×1152 | 3840×2160 |
9:16 | 864×1536 | 1152×2048 | 2160×3840 |
2:1 | 2048×1024 | 2688×1344 | 3840×1920 |
1:2 | 1024×2048 | 1344×2688 | 1920×3840 |
3:1 | 1881×836 / 1536×512 | 3072×1024 | 3840×1280 |
1:3 | 887×1774 / 512×1536 | 1024×3072 | 1280×3840 |
21:9 | 2016×864 | 2688×1152 | 3840×1648 |
9:21 | 864×2016 | 1152×2688 | 1648×3840 |
Hinweis: Einige Abmessungen sind auf Vielfache von 16 und Pixelgrenzen angenähert, z. B.3:2/2:3@ 2K mit 2048×1360 und21:9@ 4K mit 3840×1648. Als verbindliche Quelle gelten die tatsächlichen Pixel in der Tabelle.
Anwendungsbeispiele
Text-zu-Bild (minimale Anfrage)Response
Statuscode der Antwort
Array mit Antwortdaten
Abfrage der Aufgabenergebnisse
Nach erfolgreicher Einreichung wird einetask_id zurückgegeben. Pollen Sie den Aufgabenstatus über GET /v1/tasks/{task_id}, siehe API zur Aufgabenabfrage für Details.
Beispiel einer erfolgreichen Antwort
submitted → in_progress → completed / failed.
Bildzugriff: data.result.images[0].url[0].
Empfehlungen zum Polling
- Verzögerung der ersten Abfrage: Warten Sie nach dem Einreichen 10–20 Sekunden bis zur ersten Abfrage
- Abfrageintervall: Empfohlen werden 3–5 Sekunden
- Timeout-Referenz: Kombinationen aus
high + 2k/4kkönnen bis zu 130 Sekunden dauern; ein Client-Timeout von ≥ 180 Sekunden wird empfohlen - Sammelabfrage: Verwenden Sie zum gleichzeitigen Abfragen mehrerer Aufgaben
POST /v1/tasks/batch