OpenAIs 4o Bildgenerierung: Was das neue KI-System leisten kann

Die Integration von Bildgenerierung in GPT-4o markiert einen wichtigen Fortschritt für multimodale KI-Systeme und setzt neue Maßstäbe im Bereich der generativen KI.

OpenAI hat mit der Einführung von 4o image generation ein bedeutendes Upgrade ihrer Bildgenerierungsfähigkeiten vorgestellt. Diese neue Funktion ist nun in GPT-4o integriert und steht ChatGPT Pro-Abonnenten zur Verfügung. Die nahtlose Integration in das multimodale KI-Modell ermöglicht präzisere und detailliertere Bilderstellungen als frühere Versionen.

Die neue Technologie stellt eine Weiterentwicklung gegenüber DALL-E 3 dar und bietet nicht nur qualitativ hochwertigere Ergebnisse, sondern auch größere Bildformate und eine verbesserte Steuerung des generierten Inhalts. Besonders bemerkenswert ist die Fähigkeit, bestehende Bilder zu bearbeiten, einschließlich solcher mit Personen, durch Transformation oder „Inpainting“ von Details.

OpenAI ChatGPT 4o Image Generation - example
OpenAI ChatGPT 4o Image Generation – example ; source: openai.com

Erweiterte Funktionen und Sicherheitsmaßnahmen

4o image generation profitiert von OpenAIs bestehender Sicherheitsinfrastruktur und den Erkenntnissen aus früheren Modellen wie DALL-E und Sora. Die verbesserte Textverständnisfähigkeit des Systems ermöglicht es, komplexe Anweisungen zu befolgen und Text zuverlässig in Bilder zu integrieren – eine Funktion, die in früheren Generationen oft problematisch war.

Trotz der technologischen Fortschritte bleibt OpenAI wachsam gegenüber potenziellen Risiken. Das Unternehmen hat verschiedene Schutzmaßnahmen implementiert, darunter die Blockierung der Erstellung fotorealistischer Bilder von Minderjährigen und Richtlinien bezüglich gewaltverherrlichender oder hasserfüllter Inhalte. Öffentliche Persönlichkeiten haben zudem die Möglichkeit, sich gegen die Generierung ihres Abbilds zu entscheiden.

Die besten kostenlosen AI-Tools

Die besten kostenlosen KI-Tools
Alle KI-Tools ansehen

Werbung

Rechtlicher Hinweis: Diese Website setzt Affiliate-Links zum Amazon-Partnerprogramm ein. Der Betreiber der Website verdient durch qualifizierte Käufe eine Provision. Dadurch finanzieren wir die Kosten dieser Website, wie z.B. für Server-Hosting und weitere Ausgaben.

Zusammenfassung

  • GPT-4o integriert hochwertige Bildgenerierung direkt in das multimodale KI-Modell von OpenAI
  • Die neue Technologie bietet bessere Bildqualität und größere Formate im Vergleich zu DALL-E 3
  • Nutzer können bestehende Bilder bearbeiten und transformieren, auch solche mit Personen
  • Das System kann komplexe Anweisungen besser verstehen und Text zuverlässiger in Bilder einbetten
  • OpenAI hat Sicherheitsmaßnahmen implementiert, um Missbrauch zu verhindern
  • Die Technologie wird bald auch für Plus- und kostenlose Nutzer sowie Entwickler verfügbar sein

Quelle: OpenAI