AI News KW 06: Bard heißt jetzt Gemini, OpenAIs AI Agenten und YouTubes Pläne für 2024

Eine weitere Woche voller Neuigkeiten, Updates und Neuerungen aus der Welt der AI für euch: Googles AI Projekte heißen jetzt Gemini, ein neuer Stern am Open-Source-KI-Himmel und YouTubes große Pläne für 2024.

Google setzt auf Gemini: Ein neues Zeitalter der AI

Google setzt auf Gemini Ein neues Zeitalter der KI
DALL-E 3 prompted by AI Rockstars - Google setzt auf Gemini Ein neues Zeitalter der AI

Google hat seine KI-Strategie vereinheitlicht, indem es alle bisherigen KI-Produkte unter dem neuen Namen "Gemini" zusammenfasst. Dies schließt die Umgestaltung des Bard-Chatbots zu Gemini, die Einführung einer dedizierten Android-App und die Integration der Duet-KI-Funktionen in Google Workspace ein. Gemini Ultra 1.0, das fortschrittlichste Modell, wird der Öffentlichkeit zugänglich gemacht. Gemini positioniert sich als zentraler Bestandteil von Googles Zukunft, mit der Absicht, eine umfassendere, multimodale und hilfreichere KI-Assistenz zu bieten.

Key Point Beschreibung
Neuer Name Google konsolidiert seine KI unter dem Namen Gemini.
Plattformen Android-App verfügbar; iOS-Zugriff über Google App.
Gemini Ultra 1.0 Öffentlichkeit erhält Zugang zum fortschrittlichsten Modell.
Abonnement Gemini Ultra über Google One AI Premium-Abonnement verfügbar.
Zukunftsvision Gemini als zentraler Bestandteil von Googles KI-Strategie und Vision für eine AI-Zukunft.

Link: https://www.theverge.com/2024/2/8/24065553/google-gemini-ios-android-app-duet-bard

 

Smaug-72B: Der neue Stern am Open-Source-KI-Himmel

Smaug-72B Der neue Stern am Open-Source-KI-Himmel
DALL-E3 prompted by AI Rockstars - Smaug-72B Der neue Stern am Open-Source-KI-Himmel

Smaug-72B, entwickelt von Abacus AI, setzt neue Maßstäbe in der Welt der Open-Source-KI. Dieses Modell, das auf Qwen-72B aufbaut, übertrifft nicht nur seine Vorgänger wie GPT-3.5 und Mistral Medium in mehreren Benchmarks, sondern etabliert sich auch als das erste Open-Source-Modell mit einem Durchschnittswert von über 80 auf der Hugging Face Open LLM-Rangliste. Seine Stärken liegen insbesondere in Logik- und Mathematikaufgaben, was durch spezielle Feinabstimmungstechniken erreicht wurde.

Key Point Beschreibung
Entwickler Abacus AI
Basismodell Verbesserung von Qwen-72B
Leistung Übertrifft GPT-3.5 und Mistral Medium
Bewertung Erstes Open-Source-Modell über 80 auf Hugging Face
Stärken Logik und Mathematik

Link: https://venturebeat.com/ai/meet-smaug-72b-the-new-king-of-open-source-ai/

 

YouTubes große Pläne für 2024: Ein Brief von CEO Neal Mohan

YouTube CEO enthüllt 4 strategische Schwerpunkte für 2024
YouTube Official Blog

YouTube-CEO Neal Mohan skizziert in einem offenen Brief vier strategische Schwerpunkte für 2024. Diese umfassen den Einsatz von KI zur Unterstützung kreativer Inhalte, die Anerkennung von Content-Erstellern als neue Medienmogule, die Erweiterung des YouTube-Erlebnisses ins Wohnzimmer und die Förderung von Abonnementdiensten sowie die Sicherung der Creator-Ökonomie durch verbesserten Schutz und Unterstützung für Ersteller.

Key Point Beschreibung
Generative KI zur Steigerung der Kreativität Neal Mohan betont, wie generative KI die Kreativität erweitern und neue Möglichkeiten für Schöpfer eröffnen wird.
Schöpfer als nächste Generation von Studios Anerkennung der Schöpfer als zentrale Akteure in der digitalen Content-Landschaft.
Expansion ins Wohnzimmer und Abonnements YouTube plant, seine Präsenz in Wohnzimmern zu verstärken und das Abonnementangebot zu erweitern.
Schutz der Schöpferwirtschaft Ein grundlegendes Engagement für die Sicherung der wirtschaftlichen Chancen für Schöpfer.

Link: https://blog.youtube/inside-youtube/2024-letter-from-neal/

 

Revolution in der Antikenforschung: KI ermöglicht Lesen antiker Schriftrollen

Revolution in der Antikenforschung KI ermöglicht Lesen antiker Schriftrollen
DALL-E3 prompted by AI Rockstars - Revolution in der Antikenforschung KI ermöglicht Lesen antiker Schriftrollen

Forscher haben mit Hilfe von KI-Technologie den Text einer beim Ausbruch des Vesuvs in 79 n. Chr. verkohlten Schriftrolle entschlüsselt. Ein internationales Team gewann den mit $700,000 dotierten Hauptpreis der Vesuv-Herausforderung, indem es mehr als 2000 griechische Buchstaben aus der Schriftrolle las. Diese Entdeckung markiert einen Wendepunkt im Verständnis antiker Texte und könnte das Feld der Papyrologie revolutionieren.

Key Point Beschreibung
Durchbruch dank KI Forscher nutzten KI, um den Text einer beim Vesuv-Ausbruch verkohlten Schriftrolle zu entziffern.
Herausforderung Vesuv Ein Wettbewerb mit einem Preisgeld von 1 Million Dollar führte zur Entzifferung des Textes.
Internationale Zusammenarbeit Ein Team aus Studenten aus Deutschland, den USA und der Schweiz gewann den Hauptpreis.
Bedeutung für die Wissenschaft Die Entdeckung könnte eine neue Ära im Verständnis antiker Texte einleiten.
Technologische Innovationen Die Entwicklung von Algorithmen zum digitalen Entrollen der Schriftrollen und zur Tintenerkennung.

Link: https://www.theguardian.com/science/2024/feb/05/ai-helps-scholars-read-scroll-buried-when-vesuvius-erupted-in-ad79

 

Erster Deepfake-Betrug in Hongkong: Firma verliert 25 Millionen Dollar

Erster Deepfake-Betrug in Hongkong Firma verliert 25 Millionen Dollar
DALL-E3 prompted by AI Rockstars - Erster Deepfake-Betrug in Hongkong Firma verliert 25 Millionen Dollar

Ein Unternehmen in Hongkong wurde Opfer eines Deepfake-Betrugs und verlor dabei 25 Millionen Dollar. Betrüger nutzten Deepfake-Technologie, um in einer Videokonferenz den Finanzvorstand und andere Mitarbeiter zu simulieren und veranlassten einen Angestellten zur Überweisung der Gelder. Dieser Vorfall ist der erste seiner Art in Hongkong, der Deepfake-Technologie in einem solchen Umfang einsetzt.

Key Point Beschreibung
Einzigartiger Betrugsfall Ein Hongkonger Unternehmen verlor durch einen Deepfake-Betrug 25 Millionen Dollar.
Technologie hinter dem Betrug Betrüger nutzten Deepfake, um den CFO und andere Mitarbeiter in einer Videokonferenz zu simulieren.
Entdeckung und Ermittlung Der Betrug wurde nach einer Woche entdeckt, die Hongkonger Polizei ermittelt.
Präventionstipps Die Polizei empfiehlt Methoden zur Überprüfung der Echtheit von Personen in Videokonferenzen.

Link: https://arstechnica.com/information-technology/2024/02/deepfake-scammer-walks-off-with-25-million-in-first-of-its-kind-ai-heist/

 

Sam Altman von OpenAI sucht bis zu 7 Billionen Dollar für KI-Chip-Projekt

Sam Altman von OpenAI sucht bis zu 7 Billionen Dollar für KI-Chip-Projekt
DALL-E3 prompted by AI Rockstars - Sam Altman von OpenAI sucht bis zu 7 Billionen Dollar für KI-Chip-Projekt

OpenAI CEO Sam Altman strebt eine Investition von bis zu 7 Billionen Dollar an, um die globale Halbleiterindustrie zu revolutionieren und die Produktion von KI-Chips zu steigern. Dieses ambitionierte Projekt soll OpenAIs Wachstum fördern, das durch die aktuelle Knappheit an KI-Chips begrenzt wird. Altman ist in Verhandlungen mit mehreren Investoren, einschließlich der Regierung der Vereinigten Arabischen Emirate.

Key Point Beschreibung
Umgestaltung der Halbleiterindustrie OpenAI CEO Sam Altman plant, mit Billioneninvestitionen die globale Halbleiterindustrie zu revolutionieren.
Finanzierungssuche Altman führt Gespräche mit Investoren, einschließlich der Regierung der Vereinigten Arabischen Emirate.
Projektumfang Zwischen 5 und 7 Billionen Dollar könnten für das Vorhaben benötigt werden.
KI-Infrastruktur-Expansion Das Ziel ist es, die weltweite Kapazität für den Bau von KI-Chips zu erhöhen und OpenAIs Wachstum zu fördern.

Link: https://www.cnbc.com/2024/02/09/openai-ceo-sam-altman-reportedly-seeking-trillions-of-dollars-for-ai-chip-project.html

 

Hugging Face stellt Open-Source-KI-Assistenten vor, um OpenAIs GPTs Konkurrenz zu machen

Hugging Face stellt Open-Source-KI-Assistenten vor, um OpenAIs GPTs Konkurrenz zu machen
Screenshot of Hugging Face’s Hugging Chat Assistants page. - Hugging Face stellt Open-Source-KI-Assistenten vor, um OpenAIs GPTs Konkurrenz zu machen

Hugging Face hat Hugging Chat Assistants eingeführt, eine Open-Source-Alternative zu OpenAIs Custom GPTs, die es Nutzern ermöglicht, eigene KI-Chatbots kostenlos zu erstellen. Im Gegensatz zu OpenAIs kostenpflichtigem Angebot können Nutzer aus verschiedenen Open-Source-Sprachmodellen wählen, was die Anpassung und Zugänglichkeit erhöht.

Key Point Beschreibung
Produktstart Hugging Face führt anpassbare Hugging Chat Assistants ein, eine freie Alternative zu OpenAIs GPT Builder.
Benutzerfreundlichkeit Die Erstellung eines personalisierten KI-Chatbots ist in zwei Klicks möglich, ohne Abonnementkosten.
Modellauswahl Nutzer können aus verschiedenen Open-Source-LLMs wählen, darunter Mistral's Mixtral und Meta's Llama 2.
Open-Source-Ansatz Hugging Face betont die Bedeutung von Vielfalt und Zugänglichkeit in der KI-Entwicklung.

Link: https://venturebeat.com/ai/hugging-face-launches-open-source-ai-assistant-maker-to-rival-openais-custom-gpts/

 

OpenAI entwickelt ChatGPT für Gerätesteuerung

OpenAI entwickelt ChatGPT für Gerätesteuerung
DALL-E3 prompted by AI Rockstars - OpenAI entwickelt ChatGPT für Gerätesteuerung

OpenAI arbeitet an einer innovativen ChatGPT-Version, die physische Geräte nutzen kann, was die Landschaft intelligenter Assistenten verändern könnte. Dieses Vorhaben wirft bedeutende Fragen zu Datenschutz und Sicherheit auf.

Key Point Beschreibung
Neues Produkt von OpenAI OpenAI arbeitet an einem KI-Assistenten, der in der Lage ist, Geräte zu bedienen.
Erweiterung der KI-Fähigkeiten Diese Entwicklung könnte traditionelle Smart-Assistenten revolutionieren.
Datenschutz- und Sicherheitsbedenken Die Technologie wirft Fragen bezüglich Datenschutz und Sicherheit auf.

Link: https://cointelegraph.com/news/open-ai-working-on-artificial-intelligence-chat-gpt-use-devices

 

Midjourney verstärkt Hardware-Team mit ehemaligem Apple Vision Pro Ingenieur

Midjourney verstärkt Hardware-Team mit ehemaligem Apple Vision Pro Ingenieur
DALL-E3 prompted by AI Rockstars - Midjourney verstärkt Hardware-Team mit ehemaligem Apple Vision Pro Ingenieur

Midjourney hat Ahmad Abbas, einen erfahrenen Ingenieur von Apple Vision Pro, eingestellt, um seine Hardware-Initiativen zu leiten. Dies signalisiert spannende Entwicklungen in der generativen KI und Hardware von Midjourney.

Key Point Beschreibung
Neuzugang bei Midjourney Ahmad Abbas, ehemaliger Hardware-Ingenieur bei Apple, leitet nun die Hardware-Entwicklung bei Midjourney.
Hintergrund des Neuzugangs Abbas war an der Entwicklung des Apple Vision Pro beteiligt.
Bedeutung für Midjourney Dies deutet auf ambitionierte Hardware-Projekte bei Midjourney hin, möglicherweise im Bereich der generativen KI.

Link: https://www.benzinga.com/news/24/02/36963263/midjourney-hires-apple-vision-pro-engineer-to-lead-its-hardware-ambitions

 

DALL·E 3 führt C2PA-Metadaten ein: Ein Schritt zur Sicherung digitaler Echtheit

DALL·E 3 führt C2PA-Metadaten ein Ein Schritt zur Sicherung digitaler Echtheit
DALL-E 3 prompted by AI Rockstars - DALL·E 3 führt C2PA-Metadaten ein Ein Schritt zur Sicherung digitaler Echtheit

OpenAI integriert C2PA-Metadaten in DALL·E 3, um die Nachverfolgbarkeit und Authentizität von Bildern zu verbessern. Diese Initiative markiert einen wichtigen Schritt in Richtung Transparenz und Vertrauenswürdigkeit von generierten Medieninhalten. Die Metadaten erleichtern die Überprüfung der Herkunft von Bildern, obwohl ihre Entfernung durch bestimmte Aktionen wie das Hochladen auf soziale Medien möglich ist.

Key Point Beschreibung
C2PA-Metadaten Integration Verbessert die Überprüfbarkeit und Authentizität von generierten Bildern.
Verfügbarkeit Betrifft Bilder, generiert über Web und API, mit geplanter Erweiterung für mobile Nutzer.
Einschränkungen Metadaten können durch bestimmte Handlungen, wie Hochladen auf soziale Medien, entfernt werden.

Link: https://help.openai.com/en/articles/8912793-c2pa-in-dall-e-3

 

Meta führt Kennzeichnung für KI-generierte Bilder auf Facebook, Instagram und Threads ein

Meta führt Kennzeichnung für KI-generierte Bilder auf Facebook, Instagram und Threads ein
DALL-E 3 prompted by AI Rockstars - Meta führt Kennzeichnung für KI-generierte Bilder auf Facebook, Instagram und Threads ein

Meta plant, Bilder auf Facebook, Instagram und Threads zu kennzeichnen, die als KI-generiert erkannt werden. Diese Initiative, die in Zusammenarbeit mit Branchenpartnern entwickelt wurde, zielt darauf ab, Transparenz zu schaffen und Nutzer darüber zu informieren, wann Inhalte durch KI erstellt wurden. Die Kennzeichnung "Imagined with AI" wird für fotorealistische Bilder angewendet, die mit Meta AI generiert wurden, und soll auf Inhalte anderer Unternehmen ausgeweitet werden.

Key Point Beschreibung
Branchenstandards für KI-Inhalte Zusammenarbeit mit Partnern zur Entwicklung gemeinsamer Standards zur Kennzeichnung von KI-Inhalten.
Kennzeichnung von KI-generierten Bildern Meta wird Bilder mit "Imagined with AI" kennzeichnen, um Nutzern Klarheit über die Herkunft zu geben.
Erweiterung der Transparenz Meta arbeitet an der Erkennung von KI-generierten Inhalten über Bilder hinaus, einschließlich Audio und Video.

Link: https://about.fb.com/news/2024/02/labeling-ai-generated-images-on-facebook-instagram-and-threads/

 

Microsoft revolutioniert Copilot mit AI-Bildgenerierung und neuem Modell Deucalion

Microsoft revolutioniert Copilot mit AI-Bildgenerierung und neuem Modell Deucalion
DALL-E 3 prompted by AI Rockstars - Microsoft revolutioniert Copilot mit AI-Bildgenerierung und neuem Modell Deucalion

Microsoft hat Copilot mit neuen Funktionen für die AI-Bildgenerierung und das brandneue AI-Modell Deucalion aktualisiert. Diese Innovationen bieten Nutzern verbesserte Möglichkeiten zur Bildbearbeitung und -erstellung und signalisieren einen bedeutsamen Fortschritt in der Integration von generativer KI in alltägliche Anwendungen. Deucalion verbessert insbesondere den "Balanced Mode" von Copilot, was zu schnelleren und reichhaltigeren Antworten führt.

Key Point Beschreibung
Neue AI-Funktionen in Copilot Einführung von Bildgenerierungs- und Bearbeitungsfunktionen.
Einführung von Deucalion Ein neues AI-Modell, das speziell den Balanced Mode von Copilot verbessert.
Verbesserungen und Zugänglichkeit Copilot ist jetzt öffentlich verfügbar und bietet verbesserte Funktionen für kreative und präzise Anfragen.

Link: https://venturebeat.com/ai/microsoft-brings-ai-image-generation-to-copilot-adds-new-model-deucalion/

 

Stability AI präsentiert SVD 1.1 für konsistentere KI-Videos

Stability AI präsentiert SVD 1.1 für konsistentere KI-Videos
DALL-E 3 prompted by AI Rockstars - Stability AI präsentiert SVD 1.1 für konsistentere KI-Videos

Stability AI hat SVD 1.1 eingeführt, ein optimiertes Diffusionsmodell zur Erstellung konsistenterer KI-Videos. SVD 1.1 verbessert die Bewegungsqualität und Konsistenz in kurzen Videos, basierend auf einem stillen Bild, und ist öffentlich über Hugging Face zugänglich. Es verspricht eine bedeutende Verbesserung gegenüber den Vorgängermodellen, indem es realistischere Bewegungen und visuelle Qualität bietet.

Key Point Beschreibung
SVD 1.1 Veröffentlichung Ein Upgrade des latenten Diffusionsmodells für konsistentere KI-generierte Videos.
Verfügbarkeit und Zugang Öffentlich über Hugging Face verfügbar, mit verschiedenen Abonnementstufen für kommerzielle Nutzung.
Verbesserungen gegenüber Vorgängern Bietet realistischere Bewegung und visuelle Konsistenz in Videos.

Link: https://venturebeat.com/ai/stability-ai-launches-svd-1-1-a-diffusion-model-for-more-consistent-ai-videos/

 

Apple enthüllt MGIE: Revolution in der KI-gestützten Bildbearbeitung

Apple enthüllt MGIE: Revolution in der KI-gestützten Bildbearbeitung
Image: Apple - Apple enthüllt MGIE: Revolution in der KI-gestützten Bildbearbeitung - Screenshot des MGIE papers

Apple hat MGIE (MLLM-Guided Image Editing) vorgestellt, ein innovatives KI-Modell, das es Nutzern ermöglicht, Bildbearbeitungen durch einfache Textanweisungen vorzunehmen. Diese Entwicklung, eine Zusammenarbeit mit der University of California, Santa Barbara, erlaubt es, Fotos zu beschneiden, zu vergrößern, zu drehen und Filter hinzuzufügen, ohne eine Bildbearbeitungssoftware zu nutzen. MGIE ist öffentlich auf GitHub und über eine Web-Demo auf Hugging Face Spaces verfügbar.

Key Point Beschreibung
Einfache und komplexe Bearbeitungen MGIE ermöglicht sowohl einfache als auch komplexe Bildbearbeitungen durch Texteingabe.
Verfügbarkeit Verfügbar zum Download auf GitHub und als Web-Demo auf Hugging Face Spaces.
Zukunftspläne unklar Apple hat keine spezifischen Pläne für das Modell über Forschungszwecke hinaus angekündigt.

Link: https://www.theverge.com/2024/2/7/24065125/apple-generative-ai-image-editing-mgie-open-source-model