OpenAI treibt die Entwicklung von Künstlicher Intelligenz weiter voran und hat angekündigt, den Advanced Voice Mode seines ChatGPT auf breiter Basis zugänglich zu machen. Diese Erweiterung verspricht, die Interaktivität und Natürlichkeit von Sprachkonversationen erheblich zu verbessern.
Advanced Voice is rolling out to all Plus and Team users in the ChatGPT app over the course of the week.
While you’ve been patiently waiting, we’ve added Custom Instructions, Memory, five new voices, and improved accents.
It can also say “Sorry I’m late” in over 50 languages. pic.twitter.com/APOqqhXtDg
— OpenAI (@OpenAI) September 24, 2024
Die neuen Funktionen des Advanced Voice Mode umfassen u.a. die Möglichkeit, Antworten der AI mitten im Satz zu unterbrechen, das Erkennen und Reagieren auf Emotionen aufgrund des Tonfalls des Nutzers sowie ein personalisierter Voice Mode, welcher spezifische Informationen über den Nutzer behalten kann. Außerdem bietet dieser Modus verbesserte Sprachfähigkeiten in mehreren Sprachen und führt fünf neue Stimmen namens Arbor, Maple, Sol, Spruce und Vale ein, die mit Hilfe professioneller Sprecher geschaffen wurden.
Meet the five new voices. pic.twitter.com/F9BOUaJqG1
— OpenAI (@OpenAI) September 24, 2024
Diese Erweiterung ist zunächst für ChatGPT Plus Nutzer (20$ pro Monat) und Team Nutzer (30$ pro Monat mit höherem Nachrichtenlimit) verfügbar. Eine schrittweise Einführung für Unternehmenskunden und Bildungseinrichtungen ist ab nächster Woche geplant, wobei alle Plus-Nutzer bis zum Ende des Herbstes Zugang erhalten sollen. Allerdings bleibt die Funktion für Nutzer in der EU, UK und einigen anderen Ländern aufgrund geografischer Einschränkungen unzugänglich.
Ein besonderes Augenmerk liegt auf den umfassenden Sicherheitsmaßnahmen: OpenAI hat den Advanced Voice Mode von externen Experten in 45 verschiedenen Sprachen und aus 29 geografischen Regionen prüfen lassen. Der GPT-4o System enthält spezifische Mechanismen zur Vermeidung von problematischen Inhalten wie gewalttätiger oder erotischer Sprache sowie zur rechtmäßigen Nutzung von Sprachaufnahmen und dem Schutz vor Urheberrechtsverletzungen.
Dieser Schritt verdeutlicht OpenAI's Engagement zu Nutzersicherheit und gleichzeitig einen hohen Innovationsanspruch, was die Branche unter großen Druck setzt, Schritt zu halten. Die Fähigkeit, nun auch auf emotionsbasierte Interaktionen zu reagieren und in über 50 Sprachen zu kommunizieren, könnte den Einsatzbereich der Stimmings- und Sprachassistenztechnologien erheblich erweitern und neue Marktpotenziale erschließen.
Zusammenfassung
- Anspruchsvolle Funktionen: Sprachliche Interruptionen, Emotionsbasierte Interaktionen, Personalisierte Sprachmodi.
- Verfügbarkeit: Für ChatGPT Plus- und Team-Nutzer, schrittweise Einführung für Unternehmenskunden und Bildungseinrichtungen, geografische Einschränkungen in EU und anderen Ländern.
- Sicherheitsmaßnahmen: Überprüfung durch externe Experten, Mechanismen zur Vermeidung problematischer Inhalte.
- Multilingual: Unterstützung für über 50 Sprachen.
- Nutzererfahrung: Schnelle und realistische Interaktionen, hohe Benutzerfreundlichkeit.
Quellen: OpenAI @ X
Florian Schröder ist Experte im Online-Marketing mit Schwerpunkt PPC (Pay-Per-Click) Kampagnen. Die revolutionären Möglichkeiten der KI erkennt er nicht nur, sondern hat sie bereits fest in seine tägliche Arbeit integriert, um innovative und effektive Marketingstrategien zu entwickeln.
Er ist überzeugt davon, dass die Zukunft des Marketings untrennbar mit der Weiterentwicklung und Nutzung von künstlicher Intelligenz verbunden ist und setzt sich dafür ein, stets am Puls dieser technologischen Entwicklungen zu bleiben.