OpenAI’s Advanced Voice Mode: Neue Funktionen und Sicherheit im Fokus

OpenAI treibt die Entwicklung von Künstlicher Intelligenz weiter voran und hat angekündigt, den Advanced Voice Mode seines ChatGPT auf breiter Basis zugänglich zu machen. Diese Erweiterung verspricht, die Interaktivität und Natürlichkeit von Sprachkonversationen erheblich zu verbessern.


Die neuen Funktionen des Advanced Voice Mode umfassen u.a. die Möglichkeit, Antworten der AI mitten im Satz zu unterbrechen, das Erkennen und Reagieren auf Emotionen aufgrund des Tonfalls des Nutzers sowie ein personalisierter Voice Mode, welcher spezifische Informationen über den Nutzer behalten kann. Außerdem bietet dieser Modus verbesserte Sprachfähigkeiten in mehreren Sprachen und führt fünf neue Stimmen namens Arbor, Maple, Sol, Spruce und Vale ein, die mit Hilfe professioneller Sprecher geschaffen wurden.

Diese Erweiterung ist zunächst für ChatGPT Plus Nutzer (20$ pro Monat) und Team Nutzer (30$ pro Monat mit höherem Nachrichtenlimit) verfügbar. Eine schrittweise Einführung für Unternehmenskunden und Bildungseinrichtungen ist ab nächster Woche geplant, wobei alle Plus-Nutzer bis zum Ende des Herbstes Zugang erhalten sollen. Allerdings bleibt die Funktion für Nutzer in der EU, UK und einigen anderen Ländern aufgrund geografischer Einschränkungen unzugänglich.

Ein besonderes Augenmerk liegt auf den umfassenden Sicherheitsmaßnahmen: OpenAI hat den Advanced Voice Mode von externen Experten in 45 verschiedenen Sprachen und aus 29 geografischen Regionen prüfen lassen. Der GPT-4o System enthält spezifische Mechanismen zur Vermeidung von problematischen Inhalten wie gewalttätiger oder erotischer Sprache sowie zur rechtmäßigen Nutzung von Sprachaufnahmen und dem Schutz vor Urheberrechtsverletzungen.

Dieser Schritt verdeutlicht OpenAI's Engagement zu Nutzersicherheit und gleichzeitig einen hohen Innovationsanspruch, was die Branche unter großen Druck setzt, Schritt zu halten. Die Fähigkeit, nun auch auf emotionsbasierte Interaktionen zu reagieren und in über 50 Sprachen zu kommunizieren, könnte den Einsatzbereich der Stimmings- und Sprachassistenztechnologien erheblich erweitern und neue Marktpotenziale erschließen.

Zusammenfassung

  • Anspruchsvolle Funktionen: Sprachliche Interruptionen, Emotionsbasierte Interaktionen, Personalisierte Sprachmodi.
  • Verfügbarkeit: Für ChatGPT Plus- und Team-Nutzer, schrittweise Einführung für Unternehmenskunden und Bildungseinrichtungen, geografische Einschränkungen in EU und anderen Ländern.
  • Sicherheitsmaßnahmen: Überprüfung durch externe Experten, Mechanismen zur Vermeidung problematischer Inhalte.
  • Multilingual: Unterstützung für über 50 Sprachen.
  • Nutzererfahrung: Schnelle und realistische Interaktionen, hohe Benutzerfreundlichkeit.

Quellen: OpenAI @ X