WebMCP: So macht man Websites für AI-Agenten einfach nutzbar

Googles neuer Standard WebMCP ermöglicht es, dass AI-Agents Webseiten strukturiert und effizient ansteuern – ohne Umwege über Screenshots oder Vision-Modelle. Als offener Web-Standard hat dieses Protokoll das Potenzial, die Interaktion zwischen AI und modernen Web-Anwendungen grundlegend zu verbessern.

WebMCP: Technische Basis und offene Architektur

WebMCP – Web Model Context Protocol – ist ein von der W3C Community Group entwickelter Standardvorschlag, der von Google- und Microsoft-Ingenieuren initiiert wurde. Er zielt darauf ab, Webseiten als MCP-Server agieren zu lassen, indem diese JavaScript-basierte Tools lokal im Browser bereitstellen. Wichtig: WebMCP ist modell-agnostisch und funktioniert mit AI-Systemen wie ChatGPT, Gemini, Claude und Open-Source-Modellen.

Declarative und Imperative APIs: Zwei Wege zur AI-Integration

WebMCP bietet Entwickler:innen zwei Methoden: Die Declarative API verwendet HTML-Attribute (z. B. toolname in Formularen) für standardisierte Aktionen. Für komplexere Workflows gibt es die Imperative API mit JavaScript (navigator.modelContext.registerTool()). Dadurch kann vorhandene Business-Logik direkt weiter genutzt werden, ohne komplette Webanwendungen neu strukturieren zu müssen.

Performance-Boost durch strukturierte Daten

Durch die Interaktion über strukturierte JSON-Schemas anstelle von visueller Analyse erreichen AI-Agents nahezu 0 % Fehlerrate und steigern die Task-Genauigkeit auf ca. 98 %. Gleichzeitig verringern sich Rechenaufwand und Latenz um ca. 67 %, da keine Bilddaten übertragen oder analysiert werden müssen.

Sicherheit und Human-in-the-Loop-Kontrolle

Der permission-first security Ansatz sorgt dafür, dass alle Tool-Aufrufe von AI-Agents über den Browser laufen. Site-Nutzer:innen behalten die Kontrolle, indem sie Aktionen der Agents überwachen und bei Bedarf Freigaben erteilen (agent.requestUserInteraction()). Tools können nicht massenhaft parallel ausgelöst werden; alle wichtigen AI-Interaktionen bleiben nachvollziehbar und zustimmungsbasiert.

Hands-on: So nutzt man WebMCP als Entwickler:in

  • Schritt 1: JavaScript-basiertes Tool mit natürlicher Spracherklärung und Schema im Browser implementieren. Z. B. Funktion zum Auslesen eines Formulars oder zur Produktsuche im Shop-Frontend.
  • Schritt 2: Tool als MCP-Tool via navigator.modelContext.registerTool() registrieren. Dabei JSON-Schema und beschreibenden Prompt hinterlegen.
  • Schritt 3: Optionale Integration mit HTML-Attributen (declarative API) für einfachere Standard-Interaktionen, etwa beim Checkout-Flow in einem E-Commerce-Formular.
  • Schritt 4: Nach Registrierung können AI-Agents (z. B. ChatGPT in unterstützenden Browsern) Tools strukturiert ansteuern; die menschliche Kontrolle und Interaktion bleiben erhalten.

Zusammenfassung / TL;DR

  • Offener Standard: WebMCP wird gemeinsam von Google, Microsoft & W3C vorangetrieben.
  • Zwei APIs: Declarative (HTML) und Imperative (JavaScript) Wege für Tool-Integration.
  • Deutliche Effizienzsteigerung: Weniger Fehler, 67 % weniger Rechenaufwand, fast kein Latency-Overhead.
  • Sicher und transparent: Permission-Management und Human-in-the-Loop im Design verankert.
  • Praktisch und vielseitig: Einsetzbar in Customer-Support, E-Commerce, Travel & mehr.

Quelle: Codely

Werbung