Die Integration von Bildgenerierung in GPT-4o markiert einen wichtigen Fortschritt für multimodale KI-Systeme und setzt neue Maßstäbe im Bereich der generativen KI.
OpenAI hat mit der Einführung von 4o image generation ein bedeutendes Upgrade ihrer Bildgenerierungsfähigkeiten vorgestellt. Diese neue Funktion ist nun in GPT-4o integriert und steht ChatGPT Pro-Abonnenten zur Verfügung. Die nahtlose Integration in das multimodale KI-Modell ermöglicht präzisere und detailliertere Bilderstellungen als frühere Versionen.
Die neue Technologie stellt eine Weiterentwicklung gegenüber DALL-E 3 dar und bietet nicht nur qualitativ hochwertigere Ergebnisse, sondern auch größere Bildformate und eine verbesserte Steuerung des generierten Inhalts. Besonders bemerkenswert ist die Fähigkeit, bestehende Bilder zu bearbeiten, einschließlich solcher mit Personen, durch Transformation oder "Inpainting" von Details.

Erweiterte Funktionen und Sicherheitsmaßnahmen
4o image generation profitiert von OpenAIs bestehender Sicherheitsinfrastruktur und den Erkenntnissen aus früheren Modellen wie DALL-E und Sora. Die verbesserte Textverständnisfähigkeit des Systems ermöglicht es, komplexe Anweisungen zu befolgen und Text zuverlässig in Bilder zu integrieren – eine Funktion, die in früheren Generationen oft problematisch war.
Trotz der technologischen Fortschritte bleibt OpenAI wachsam gegenüber potenziellen Risiken. Das Unternehmen hat verschiedene Schutzmaßnahmen implementiert, darunter die Blockierung der Erstellung fotorealistischer Bilder von Minderjährigen und Richtlinien bezüglich gewaltverherrlichender oder hasserfüllter Inhalte. Öffentliche Persönlichkeiten haben zudem die Möglichkeit, sich gegen die Generierung ihres Abbilds zu entscheiden.
Werbung
E-Book: ChatGPT für Job & Alltag – Dein praktischer Einstieg
Unser neues E-Book bietet eine leicht verständliche und strukturierte Einführung in die Nutzung von ChatGPT – sowohl im Beruf als auch im Privatleben.
- ✔ Mit zahlreichen Beispielen und direkt anwendbaren Prompts
- ✔ 8 spannende Anwendungsfälle, darunter als Übersetzer, Lernassistent oder Finanzrechner
- ✔ Kompakt auf 40 Seiten, klar und auf das Wesentliche fokussiert
Werbung
Zusammenfassung
- GPT-4o integriert hochwertige Bildgenerierung direkt in das multimodale KI-Modell von OpenAI
- Die neue Technologie bietet bessere Bildqualität und größere Formate im Vergleich zu DALL-E 3
- Nutzer können bestehende Bilder bearbeiten und transformieren, auch solche mit Personen
- Das System kann komplexe Anweisungen besser verstehen und Text zuverlässiger in Bilder einbetten
- OpenAI hat Sicherheitsmaßnahmen implementiert, um Missbrauch zu verhindern
- Die Technologie wird bald auch für Plus- und kostenlose Nutzer sowie Entwickler verfügbar sein
Quelle: OpenAI

Florian Schröder ist Experte im Online-Marketing mit Schwerpunkt PPC (Pay-Per-Click) Kampagnen. Die revolutionären Möglichkeiten der KI erkennt er nicht nur, sondern hat sie bereits fest in seine tägliche Arbeit integriert, um innovative und effektive Marketingstrategien zu entwickeln.
Er ist überzeugt davon, dass die Zukunft des Marketings untrennbar mit der Weiterentwicklung und Nutzung von künstlicher Intelligenz verbunden ist und setzt sich dafür ein, stets am Puls dieser technologischen Entwicklungen zu bleiben.