AI News KW 07: Sora verändert die Bewegtbildindustrie & Gemini 1.5 das Kontextmonster

Die wahrscheinlich bahnbrechendste und interessanteste Woche im Bereich AI, seit der Veröffentlichung von ChatGPT, liegt hinter uns. Neben Sora und Google Gemini gibt es auch von Meta neue Enwicklungen in Sachen AI.

OpenAI präsentiert Sora: Revolution in der Videogenerierung

OpenAI präsentiert Sora Revolution in der Videogenerierung
DALL-E 3 promted by AI Rockstars - OpenAI präsentiert Sora Revolution in der Videogenerierung

OpenAI hat Sora vorgestellt, ein Modell, das aus Textbeschreibungen realistische und kreative Videos generieren kann. Sora zielt darauf ab, das Verständnis und die Simulation der physischen Welt in Bewegung zu verbessern. Es ermöglicht die Erstellung von Videos bis zu einer Minute Länge mit hoher visueller Qualität und Treue zu den Benutzervorgaben. Dieses Modell wird derzeit mit Red Teamern und kreativen Fachleuten getestet, um Feedback für weitere Verbesserungen zu sammeln. Weitere Informationen findet man auf der offiziellen Sora-Seite auf der OpenAI-Website.

Eigenschaft Beschreibung
Entwickler OpenAI
Funktion Generierung realistischer und kreativer Videos aus Textbeschreibungen
Länge Bis zu einer Minute
Qualität Hohe visuelle Qualität und Treue zu den Benutzervorgaben
Testphase Aktuell mit Red Teamern und kreativen Fachleuten

Link: https://openai.com/sora

 

Google stellt Gemini 1.5 vor: Das nächste Generation AI-Modell

Google Gemini 1.5
Google Gemini 1.5

Google führt Gemini 1.5 ein, ein fortschrittliches AI-Modell, das eine deutliche Leistungssteigerung und ein besseres Verständnis langer Kontexte über verschiedene Modalitäten hinweg bietet. Diese nächste Generation baut auf Forschungs- und Engineering-Innovationen auf, macht das Training und den Einsatz effizienter und erreicht eine beispiellose Verarbeitungskapazität von bis zu 1 Million Tokens. Gemini 1.5 markiert einen wichtigen Schritt in Googles Bestreben, AI noch nützlicher für Entwickler und Cloud-Kunden zu machen.

Eigenschaft Beschreibung
Modell Gemini 1.5
Verbesserungen Deutliche Leistungssteigerung, besseres Verständnis langer Kontexte
Kapazität Verarbeitung von bis zu 1 Million Tokens
Ziel Nützlicher für Entwickler und Cloud-Kunden

Link: https://blog.google/technology/ai/google-gemini-next-generation-model-february-2024/

 

Revolution in der Sprachsynthese: Amazons BASE TTS Modell setzt neue Maßstäbe

Revolution in der Sprachsynthese Amazons BASE TTS Modell setzt neue Maßstäbe
DALL-E 3 prompted by AI Rockstars - Revolution in der Sprachsynthese Amazons BASE TTS Modell setzt neue Maßstäbe

Amazons Forschungsteam hat mit BASE TTS das bisher größte Text-zu-Sprache-KI-Modell entwickelt, das durch seine emergenten Fähigkeiten besticht. Das Modell nutzt eine umfangreiche Datenbasis von 100.000 Stunden Sprachdaten, um komplexe Sätze, Emotionen und Fremdwörter auf natürliche Weise zu verarbeiten. Diese Innovation könnte die konversationelle KI signifikant verbessern, indem sie Interaktionen mit KI-Systemen deutlich lebensechter und natürlicher macht.

Eigenschaft Beschreibung
Modellname BASE TTS
Entwickler Amazon Forscher
Datenbasis 100.000 Stunden Sprachdaten
Fähigkeiten Natürliche Sprachproduktion, Umgang mit komplexen Sätzen und Emotionen, Aussprache von Fremdwörtern
Ziel Verbesserung der konversationellen KI durch lebensechtere Interaktionen

Link: https://techcrunch.com/2024/02/14/largest-text-to-speech-ai-model-yet-shows-emergent-abilities/

 

Apple beschleunigt KI-Entwicklung für Spotlight und Xcode

Apple beschleunigt KI-Entwicklung für Spotlight und Xcode
DALL-E 3 prompted by AI Rockstars - Apple beschleunigt KI-Entwicklung für Spotlight und Xcode

Apple verstärkt seine Bemühungen in der KI-Entwicklung, indem es neue generative KI-Funktionen für Xcode und Spotlight testet und plant, diese später im Jahr für Entwickler freizugeben. Diese Fortschritte zielen darauf ab, die Programmierung durch KI-gestützte Code-Vervollständigung zu vereinfachen und Verbraucherprodukte durch intelligente Funktionen wie automatische Playlist-Erstellung und KI-gestützte Suchfunktionen zu bereichern. Apple positioniert sich mit diesen Initiativen als ein vorsichtiger, aber innovativer Spieler im Bereich der generativen KI.

Eigenschaft Beschreibung
Entwicklung Apple verstärkt die Entwicklung von KI-basierten Code-Vervollständigungswerkzeugen für Xcode, ähnlich Microsofts GitHub Copilot.
Generative KI Neue generative KI-Funktionen werden in Xcode getestet und sollen später im Jahr für Drittanbieterentwickler verfügbar gemacht werden.
Verbraucherprodukte Potenzielle KI-Anwendungen in Verbraucherprodukten umfassen automatische Playlist-Erstellung in Apple Music und AI-Chatbot-ähnliche Suchfunktionen für Spotlight.
Technologische Fortschritte Apple hat kürzlich MLX, ein Open-Source-Machine-Learning-Framework, sowie MGIE und Keyframer, Modelle für Text-zu-Bild-Bearbeitung und Animation, veröffentlicht.
Zukünftige Ankündigungen Weitere Ankündigungen zu Apples KI-Plänen werden für die jährliche WWDC-Entwicklerveranstaltung später im Jahr erwartet.

Link: https://www.theverge.com/2024/2/15/24074455/apple-generative-ai-xcode-spotlight-testing

 

ChatGPT erhält Gedächtnis und neue Steuerungsoptionen

OpenAI_Logo
OpenAI

OpenAI führt neue Funktionen für ChatGPT ein, die es dem System ermöglichen, sich an frühere Gespräche zu erinnern, um die Relevanz und Nützlichkeit zukünftiger Interaktionen zu verbessern. Nutzer haben die volle Kontrolle über das Gedächtnis von ChatGPT, können spezifische Erinnerungen hinzufügen, abfragen und löschen. Diese Erweiterung wird zunächst einer begrenzten Anzahl von Benutzern zugänglich gemacht, um Feedback zu sammeln und die Funktionen weiter zu optimieren.

Eigenschaft Beschreibung
Funktion ChatGPT kann sich nun an frühere Gespräche erinnern.
Kontrolle Nutzer können das Gedächtnis von ChatGPT verwalten, einschließlich Erinnern und Vergessen.
Verfügbarkeit Zunächst für einen kleinen Nutzerkreis verfügbar.
Ziel Zukünftige Chats durch gespeichertes Wissen nützlicher gestalten.

Link: https://openai.com/blog/memory-and-new-controls-for-chatgpt

 

OpenAI entwickelt Such-App als Konkurrenz zu Google

OpenAI_Logo
OpenAI

OpenAI entwickelt eine eigene Such-App, um mit Google zu konkurrieren, möglicherweise unterstützt durch Microsoft Bing. Diese neue Initiative könnte eine signifikante Bedrohung für Google Search darstellen, da sie schneller als ChatGPT sein und dabei leistungsfähige Zusammenfassungsfähigkeiten beibehalten soll.

Eigenschaft Beschreibung
Entwicklung OpenAI arbeitet an einer Such-App, um mit Google zu konkurrieren.
Antrieb Möglicherweise durch Microsoft Bing unterstützt.
Potenzial Könnte eine ernsthafte Bedrohung für Google Search darstellen.
Merkmale Schneller als ChatGPT, ohne dessen Zusammenfassungsfähigkeiten zu opfern.

Link: https://qz.com/openai-chatgpt-search-google-1851261814

 

V-JEPA: Metas nächster Schritt zur fortgeschrittenen maschinellen Intelligenz

V-JEPA Metas nächster Schritt zur fortgeschrittenen maschinellen Intelligenz
DALL-E 3 prompted by AI Rockstars - V-JEPA Metas nächster Schritt zur fortgeschrittenen maschinellen Intelligenz

Meta präsentiert V-JEPA, ein innovatives KI-Modell, entwickelt unter der Leitung von Yann LeCun. Dieses Modell, spezialisiert auf Videoanalyse, lernt durch die Vorhersage fehlender Inhalte in Videos, um ein umfassendes Verständnis der Welt zu entwickeln. V-JEPA nutzt selbstüberwachtes Lernen und trainiert ausschließlich mit unbeschrifteten Daten, um Lerneffizienz und Aufgabenanpassung zu verbessern.

Eigenschaft Beschreibung
Entwickler Meta, unter Leitung von Yann LeCun
Modellname V-JEPA
Spezialisierung Videoanalyse
Lernmethode Selbstüberwachtes Lernen mit unbeschrifteten Daten
Ziel Verbesserung der Lerneffizienz und Anpassungsfähigkeit

Link: https://ai.meta.com/blog/v-jepa-yann-lecun-ai-model-video-joint-embedding-predictive-architecture

 

OpenAI CEO warnt vor "gesellschaftlichen Fehlausrichtungen" durch KI

OpenAI CEO warnt vor gesellschaftlichen Fehlausrichtungen durch KI
DALL-E 3 prompted by AI Rockstars - OpenAI CEO warnt vor gesellschaftlichen Fehlausrichtungen durch KI

OpenAI CEO Sam Altman äußerte auf dem World Governments Summit via Videokonferenz Bedenken über subtile gesellschaftliche Fehlausrichtungen, die durch KI-Systeme verursacht werden könnten. Er plädierte für die Schaffung einer Aufsichtsbehörde ähnlich der Internationalen Atomenergie-Organisation, um der schnell fortschreitenden KI-Entwicklung gerecht zu werden. Altman betonte die Notwendigkeit einer von der KI-Industrie unabhängigen Regulierung.

Eigenschaft Beschreibung
Bedenken Gesellschaftliche Fehlausrichtungen durch KI
Vorschlag Schaffung einer internationalen KI-Aufsichtsbehörde
Position KI-Industrie soll nicht regulierend tätig sein

Link: https://apnews.com/article/uae-openai-sam-altman-artificial-intelligence-9593a03830c0ef83fdef76c68bb87118

 

Technologieunternehmen unterzeichnen Abkommen zur Bekämpfung von KI-generierten Wahlmanipulationen

Technologieunternehmen unterzeichnen Abkommen zur Bekämpfung von KI-generierten Wahlmanipulationen
DALL-E 3 prompted by AI Rockstars -Technologieunternehmen unterzeichnen Abkommen zur Bekämpfung von KI-generierten Wahlmanipulationen

Führende Technologieunternehmen, darunter Adobe, Google, Meta, Microsoft, OpenAI, und TikTok, haben auf der Münchner Sicherheitskonferenz ein Abkommen unterzeichnet, um die Verwendung von KI-Tools zur Störung demokratischer Wahlen zu verhindern. Dieses freiwillige Rahmenwerk konzentriert sich auf den Umgang mit absichtlich irreführenden KI-generierten Deepfakes. Obwohl das Abkommen weitgehend symbolisch ist, umfasst es Maßnahmen zur Erkennung und Kennzeichnung täuschender KI-Inhalte.

Eigenschaft Beschreibung
Initiative Freiwilliges Abkommen zur Prävention von KI-Wahlbetrug
Teilnehmer Große Tech-Unternehmen inklusive Adobe, Google, Meta
Ziel Bekämpfung von KI-generierten Deepfakes, die Wähler täuschen

Link: https://apnews.com/article/ai-generated-election-deepfakes-munich-accord-meta-google-microsoft-tiktok-x-c40924ffc68c94fac74fa994c520fc06

 

Microsoft und OpenAI bekämpfen Bedrohungsakteure im Zeitalter der KI

Microsoft und OpenAI bekämpfen Bedrohungsakteure im Zeitalter der KI
DALL-E 3 prompted by AI Rockstars - Microsoft und OpenAI bekämpfen Bedrohungsakteure im Zeitalter der KI

Microsoft veröffentlicht in Zusammenarbeit mit OpenAI Forschungsergebnisse über aufkommende Bedrohungen durch KI. Der Fokus liegt auf der Nutzung von großen Sprachmodellen (LLMs) durch bekannte Bedrohungsakteure für prompt-injections, Missbrauch und Betrug. Obwohl bisher keine neuartigen KI-gestützten Angriffstechniken beobachtet wurden, betont Microsoft die Bedeutung sicherer und verantwortungsvoller KI-Nutzung und verstärkter Schutzmaßnahmen gegen potenziellen Missbrauch.

Eigenschaft Beschreibung
Forschung Zusammenarbeit mit OpenAI zur Identifikation von Bedrohungen durch KI
Ergebnisse Keine neuartigen Angriffstechniken beobachtet, aber kontinuierliche Überwachung erforderlich
Maßnahmen Stärkung der Schutzmechanismen und Förderung sicherer KI-Nutzung

Link: https://www.microsoft.com/en-us/security/blog/2024/02/14/staying-ahead-of-threat-actors-in-the-age-of-ai/

 

Jeder Staat benötigt souveräne KI, sagt NVIDIA CEO

Jeder Staat benötigt souveräne KI, sagt NVIDIA CEO
DALL-E 3 prompted by AI Rockstars - Jeder Staat benötigt souveräne KI, sagt NVIDIA CEO

NVIDIA CEO Jensen Huang betonte auf dem World Governments Summit die Notwendigkeit für Länder, eigene Intelligenz durch souveräne KI zu erzeugen, was kulturelle und gesellschaftliche Werte kodifiziert. Er diskutierte mit dem UAE Minister für KI die Bedeutung des Eigenbesitzes von Daten und Intelligenzproduktion für die globale Führung und Infrastrukturentwicklung.

Eigenschaft Beschreibung
Sprecher Jensen Huang, CEO von NVIDIA
Veranstaltung World Governments Summit in Dubai
Kernidee Betonung der Bedeutung souveräner KI für die Datenhoheit
Strategische Ziele Entwicklung eigener großer Sprachmodelle und Computinginfrastruktur

Link: https://blogs.nvidia.com/blog/world-governments-summit

 

Strategien zur Einführung von KI bei einer skeptischen Öffentlichkeit

Strategien zur Einführung von KI bei einer skeptischen Öffentlichkeit
DALL-E 3 prompted by AI Rockstars -Strategien zur Einführung von KI bei einer skeptischen Öffentlichkeit

Unternehmen wie Microsoft, Google und Etsy präsentierten während des Super Bowl KI-Werbungen, um die Technologie einem skeptischen Publikum näherzubringen. Mit dem Ziel, KI zu vermenschlichen, adressieren die Werbungen Bedenken, dass KI individuelles Denken überflüssig machen könnte. Trotz der Herausforderungen, KI positiv darzustellen, nutzen Firmen diese hochsichtbare Plattform, um die narrative zu ändern und die breite Öffentlichkeit von den Vorteilen der KI zu überzeugen.

Eigenschaft Beschreibung
Werbung Super Bowl als Plattform für KI-Werbungen
Öffentliche Wahrnehmung Skepsis gegenüber KI in der US-Bevölkerung
Strategie Vermenschlichung von KI zur Förderung der Akzeptanz

Link: https://www.cnbc.com/2024/02/13/the-way-ai-will-be-sold-to-a-skeptical-public-is-becoming-clear.html

 

Stability AI stellt Stable Cascade vor

Stability AI stellt Stable Cascade vor
DALL-E 3 prompted by AI Rockstars - Stability AI stellt Stable Cascade vor

Stability AI präsentiert Stable Cascade, ein neues Text-zu-Bild-Modell, das die Erstellung und Feinabstimmung auf Verbraucherhardware vereinfacht. Dieses effiziente, dreistufige Modell ermöglicht es Nutzern, mit der KI flexibel zu experimentieren und angepasste Ergebnisse zu erzielen.

Eigenschaft Beschreibung
Modell Stable Cascade
Besonderheit Einfache Trainierbarkeit und Anpassung
Plattform Verbraucherhardware
Effizienz Hoch
Flexibilität Ermöglicht individuelle Experimente

Link: https://stability.ai/news/introducing-stable-cascade