Amazon Nova Act: Neuer KI-Browser-Agent übertrifft Claude und OpenAI in Benchmarks

Amazons neues KI-System erlaubt präzise Browsersteuerung mit über 90% Genauigkeit und übertrifft dabei die Konkurrenzmodelle von OpenAI und Anthropic.

Die kürzlich im Research Preview veröffentlichte Nova Act SDK stellt einen bedeutenden Fortschritt in der KI-gestützten Browserautomatisierung dar. Die von ehemaligen OpenAI-Forschern David Luan und Pieter Abbeel entwickelte Technologie ermöglicht es Entwicklern, AI-Agenten zu erstellen, die zuverlässig mit Webseiten interagieren können - von der Kalenderplanung bis zum vollständigen E-Commerce-Checkout.

Im Gegensatz zu herkömmlichen KI-Assistenten, die auf Textantworten beschränkt sind, kann Nova Act selbstständig Aktionen in einem Webbrowser ausführen. Das System kombiniert KI-gestützte Entscheidungsfindung mit deterministischer Kontrolle über den Browser, wodurch sensible Operationen wie Passwort-Eingaben sicherer gestaltet werden.

Überlegene Leistung in Benchmarks

In internen Tests von Amazon übertrifft Nova Act die führenden Konkurrenzmodelle bei verschiedenen Aufgaben:

Funktion Nova Act Claude 3.7 OpenAI CUA
Textelement-Interaktion 93,9% 90,0% 88,3%
Icon-Interaktion 87,9% 85,4% 80,6%
UI-Verständnis allgemein 80,5% 82,5% 82,3%

Besonders bemerkenswert ist die hohe Genauigkeit bei der Interaktion mit komplexen UI-Elementen wie Datumsauswahlen und Dropdown-Menüs, bei denen bisherige KI-Modelle oft Schwierigkeiten hatten.

Werbung

Ebook - ChatGPT for Work and Life - The Beginners Guide to getting more done

E-Book: ChatGPT für Job & Alltag – Dein praktischer Einstieg

Unser neues E-Book bietet eine leicht verständliche und strukturierte Einführung in die Nutzung von ChatGPT – sowohl im Beruf als auch im Privatleben.

  • Mit zahlreichen Beispielen und direkt anwendbaren Prompts
  • 8 spannende Anwendungsfälle, darunter als Übersetzer, Lernassistent oder Finanzrechner
  • Kompakt auf 40 Seiten, klar und auf das Wesentliche fokussiert

Jetzt ansehen & durchstarten

Die strategische Bedeutung von Nova Act geht weit über Browserautomatisierung hinaus. Das System wird voraussichtlich als Kerntechnologie für die kommende Alexa+ Aktualisierung dienen und damit Amazons Sprachassistenten ermöglichen, selbstständig im Internet zu navigieren. Zudem ist Nova Act Teil des breiteren Amazon Nova Ökosystems, das über AWS Bedrock für Entwickler zugänglich sein wird.

Werbung

Rechtlicher Hinweis: Diese Website setzt Affiliate-Links zum Amazon-Partnerprogramm ein. Der Betreiber der Website verdient durch qualifizierte Käufe eine Provision. Dadurch finanzieren wir die Kosten dieser Website, wie z.B. für Server-Hosting und weitere Ausgaben.

Zusammenfassung:

  • Nova Act ermöglicht KI-gesteuerte Browserinteraktionen mit über 90% Präzision bei UI-Elementen
  • Das System übertrifft in internen Tests Konkurrenzmodelle von OpenAI und Anthropic
  • Die Technologie wird von ehemaligen OpenAI-Forschern David Luan und Pieter Abbeel entwickelt
  • Integration mit Alexa+ wird Amazon einen Wettbewerbsvorteil im KI-Assistenten-Markt verschaffen
  • Verantwortungsvolle KI-Praktiken wie Eingabe/Ausgabe-Moderation und C2PA-konforme Wasserzeichen sind integriert

Quelle: Amazon AGI Labs