OpenAI präsentiert GPT Image 1 API: KI-Bildgenerierung wird zugänglicher und leistungsstärker

Die neue GPT Image 1 API von OpenAI erreicht einen bedeutenden Meilenstein in der KI-gestützten Bildgenerierung, nachdem bereits 130 Millionen Nutzer über 700 Millionen Bilder in nur einer Woche erstellt haben.

Die neue API, die jetzt allen Entwicklern zur Verfügung steht, treibt dieselbe Funktion an, die in ChatGPT für Aufsehen sorgte und ermöglicht die nahtlose Integration von Bildgenerierungsfähigkeiten in verschiedene Anwendungen. Im Gegensatz zu früheren Modellen ist GPT Image 1 nativ multimodal konzipiert, was bedeutet, dass es Texte und Bilder in einer einheitlichen Architektur verarbeiten kann. Diese Fähigkeit ermöglicht es dem Modell, Anweisungen präzise zu befolgen, Realweltwissen zu nutzen und sogar Text innerhalb von Bildern korrekt darzustellen.

Namhafte Unternehmen wie AdobeFigmaAirtable und Wix haben bereits Partnerschaften mit OpenAI geschlossen, um die neue API in ihre Produkte zu integrieren. Bei Adobe hat die Integration zu einer Reduzierung der Produktionskosten für digitale Assets um beeindruckende 37% geführt.

Technische Details und Preisgestaltung

Die API bietet Entwicklern umfangreiche Kontrolle über die Bildgenerierung mit drei Hauptendpunkten: Generations (Erstellung neuer Bilder aus Text), Edits (Modifikation bestehender Bilder) und Variations (Stilistische Alternativen). Die Qualitäts- und Auflösungseinstellungen reichen von 512x512 Pixeln (niedrige Qualität) bis zu 1792x1024 Pixeln (hohe Qualität).

Die Preisgestaltung folgt einem token-basierten Modell:

Werbung

Ebook - ChatGPT for Work and Life - The Beginners Guide to getting more done

E-Book: ChatGPT für Job & Alltag – Dein praktischer Einstieg

Unser neues E-Book bietet eine leicht verständliche und strukturierte Einführung in die Nutzung von ChatGPT – sowohl im Beruf als auch im Privatleben.

  • Mit zahlreichen Beispielen und direkt anwendbaren Prompts
  • 8 spannende Anwendungsfälle, darunter als Übersetzer, Lernassistent oder Finanzrechner
  • Kompakt auf 40 Seiten, klar und auf das Wesentliche fokussiert

Jetzt ansehen & durchstarten

  • Texteingabe: 5 $ pro 1 Million Tokens
  • Bildeingabe: 10 $ pro 1 Million Tokens
  • Bildausgabe: 40 $ pro 1 Million Tokens

Dies führt zu Kosten von etwa 0,02 $ für ein Bild in niedriger Qualität, 0,04 $ für Standardqualität und 0,19 $ für hochwertige Bilder. Damit positioniert sich OpenAI preislich zwischen kostengünstigen Open-Source-Alternativen wie Stable Diffusion und teureren Optionen wie Googles Imagen 3.

Werbung

Rechtlicher Hinweis: Diese Website setzt Affiliate-Links zum Amazon-Partnerprogramm ein. Der Betreiber der Website verdient durch qualifizierte Käufe eine Provision. Dadurch finanzieren wir die Kosten dieser Website, wie z.B. für Server-Hosting und weitere Ausgaben.

Zusammenfassung

  • Native Multimodalität: GPT Image 1 verbindet Sprach- und Bildverständnis in einer einheitlichen Architektur.
  • Hohe Genauigkeit: 94,7% Präzision bei komplexen Anweisungen und 98,3% Lesbarkeit bei Textdarstellung.
  • Flexible API: Drei Hauptendpunkte für Generierung, Bearbeitung und Variationen mit umfangreichen Parametern.
  • Wettbewerbsfähige Preisgestaltung: Kostengünstiger als DALL-E 3 und Imagen 3 mit transparentem Token-basiertem Preismodell.
  • Umfassende Sicherheitsmaßnahmen: C2PA-Metadaten für Herkunftsnachweis und anpassbare Moderationseinstellungen.
  • Breite Branchenanwendung: Bereits erfolgreich in kreativen Tools, E-Commerce, Spielen und Unternehmensanwendungen integriert.

Quelle: OpenAI