Amazons neues KI-System erlaubt präzise Browsersteuerung mit über 90% Genauigkeit und übertrifft dabei die Konkurrenzmodelle von OpenAI und Anthropic.
Die kürzlich im Research Preview veröffentlichte Nova Act SDK stellt einen bedeutenden Fortschritt in der KI-gestützten Browserautomatisierung dar. Die von ehemaligen OpenAI-Forschern David Luan und Pieter Abbeel entwickelte Technologie ermöglicht es Entwicklern, AI-Agenten zu erstellen, die zuverlässig mit Webseiten interagieren können - von der Kalenderplanung bis zum vollständigen E-Commerce-Checkout.
Im Gegensatz zu herkömmlichen KI-Assistenten, die auf Textantworten beschränkt sind, kann Nova Act selbstständig Aktionen in einem Webbrowser ausführen. Das System kombiniert KI-gestützte Entscheidungsfindung mit deterministischer Kontrolle über den Browser, wodurch sensible Operationen wie Passwort-Eingaben sicherer gestaltet werden.
Überlegene Leistung in Benchmarks
In internen Tests von Amazon übertrifft Nova Act die führenden Konkurrenzmodelle bei verschiedenen Aufgaben:
Funktion | Nova Act | Claude 3.7 | OpenAI CUA |
---|---|---|---|
Textelement-Interaktion | 93,9% | 90,0% | 88,3% |
Icon-Interaktion | 87,9% | 85,4% | 80,6% |
UI-Verständnis allgemein | 80,5% | 82,5% | 82,3% |
Besonders bemerkenswert ist die hohe Genauigkeit bei der Interaktion mit komplexen UI-Elementen wie Datumsauswahlen und Dropdown-Menüs, bei denen bisherige KI-Modelle oft Schwierigkeiten hatten.
Werbung
E-Book: ChatGPT für Job & Alltag – Dein praktischer Einstieg
Unser neues E-Book bietet eine leicht verständliche und strukturierte Einführung in die Nutzung von ChatGPT – sowohl im Beruf als auch im Privatleben.
- ✔ Mit zahlreichen Beispielen und direkt anwendbaren Prompts
- ✔ 8 spannende Anwendungsfälle, darunter als Übersetzer, Lernassistent oder Finanzrechner
- ✔ Kompakt auf 40 Seiten, klar und auf das Wesentliche fokussiert
Die strategische Bedeutung von Nova Act geht weit über Browserautomatisierung hinaus. Das System wird voraussichtlich als Kerntechnologie für die kommende Alexa+ Aktualisierung dienen und damit Amazons Sprachassistenten ermöglichen, selbstständig im Internet zu navigieren. Zudem ist Nova Act Teil des breiteren Amazon Nova Ökosystems, das über AWS Bedrock für Entwickler zugänglich sein wird.
Werbung
Zusammenfassung:
- Nova Act ermöglicht KI-gesteuerte Browserinteraktionen mit über 90% Präzision bei UI-Elementen
- Das System übertrifft in internen Tests Konkurrenzmodelle von OpenAI und Anthropic
- Die Technologie wird von ehemaligen OpenAI-Forschern David Luan und Pieter Abbeel entwickelt
- Integration mit Alexa+ wird Amazon einen Wettbewerbsvorteil im KI-Assistenten-Markt verschaffen
- Verantwortungsvolle KI-Praktiken wie Eingabe/Ausgabe-Moderation und C2PA-konforme Wasserzeichen sind integriert
Quelle: Amazon AGI Labs

Florian Schröder ist Experte im Online-Marketing mit Schwerpunkt PPC (Pay-Per-Click) Kampagnen. Die revolutionären Möglichkeiten der KI erkennt er nicht nur, sondern hat sie bereits fest in seine tägliche Arbeit integriert, um innovative und effektive Marketingstrategien zu entwickeln.
Er ist überzeugt davon, dass die Zukunft des Marketings untrennbar mit der Weiterentwicklung und Nutzung von künstlicher Intelligenz verbunden ist und setzt sich dafür ein, stets am Puls dieser technologischen Entwicklungen zu bleiben.