Amazon Nova Act: Neuer KI-Browser-Agent übertrifft Claude und OpenAI in Benchmarks

Amazons neues KI-System erlaubt präzise Browsersteuerung mit über 90% Genauigkeit und übertrifft dabei die Konkurrenzmodelle von OpenAI und Anthropic.

Die kürzlich im Research Preview veröffentlichte Nova Act SDK stellt einen bedeutenden Fortschritt in der KI-gestützten Browserautomatisierung dar. Die von ehemaligen OpenAI-Forschern David Luan und Pieter Abbeel entwickelte Technologie ermöglicht es Entwicklern, AI-Agenten zu erstellen, die zuverlässig mit Webseiten interagieren können – von der Kalenderplanung bis zum vollständigen E-Commerce-Checkout.

Im Gegensatz zu herkömmlichen KI-Assistenten, die auf Textantworten beschränkt sind, kann Nova Act selbstständig Aktionen in einem Webbrowser ausführen. Das System kombiniert KI-gestützte Entscheidungsfindung mit deterministischer Kontrolle über den Browser, wodurch sensible Operationen wie Passwort-Eingaben sicherer gestaltet werden.

Überlegene Leistung in Benchmarks

In internen Tests von Amazon übertrifft Nova Act die führenden Konkurrenzmodelle bei verschiedenen Aufgaben:

Funktion Nova Act Claude 3.7 OpenAI CUA
Textelement-Interaktion 93,9% 90,0% 88,3%
Icon-Interaktion 87,9% 85,4% 80,6%
UI-Verständnis allgemein 80,5% 82,5% 82,3%

Besonders bemerkenswert ist die hohe Genauigkeit bei der Interaktion mit komplexen UI-Elementen wie Datumsauswahlen und Dropdown-Menüs, bei denen bisherige KI-Modelle oft Schwierigkeiten hatten.

Die besten kostenlosen AI-Tools

Die besten kostenlosen KI-Tools
Alle KI-Tools ansehen

Die strategische Bedeutung von Nova Act geht weit über Browserautomatisierung hinaus. Das System wird voraussichtlich als Kerntechnologie für die kommende Alexa+ Aktualisierung dienen und damit Amazons Sprachassistenten ermöglichen, selbstständig im Internet zu navigieren. Zudem ist Nova Act Teil des breiteren Amazon Nova Ökosystems, das über AWS Bedrock für Entwickler zugänglich sein wird.

Werbung

Rechtlicher Hinweis: Diese Website setzt Affiliate-Links zum Amazon-Partnerprogramm ein. Der Betreiber der Website verdient durch qualifizierte Käufe eine Provision. Dadurch finanzieren wir die Kosten dieser Website, wie z.B. für Server-Hosting und weitere Ausgaben.

Zusammenfassung:

  • Nova Act ermöglicht KI-gesteuerte Browserinteraktionen mit über 90% Präzision bei UI-Elementen
  • Das System übertrifft in internen Tests Konkurrenzmodelle von OpenAI und Anthropic
  • Die Technologie wird von ehemaligen OpenAI-Forschern David Luan und Pieter Abbeel entwickelt
  • Integration mit Alexa+ wird Amazon einen Wettbewerbsvorteil im KI-Assistenten-Markt verschaffen
  • Verantwortungsvolle KI-Praktiken wie Eingabe/Ausgabe-Moderation und C2PA-konforme Wasserzeichen sind integriert

Quelle: Amazon AGI Labs