AnwendungsfallFortgeschritten15 min

Browser-Automatisierung mit OpenClaw einrichten

Browser-Aufgaben mit OpenClaw automatisieren: Web Scraping, Formulare ausfuellen, Screenshots erstellen, Daten extrahieren und mehrstufige Web-Workflows — alles KI-gesteuert.

Zuletzt aktualisiert: 2026-03-31

Was du bauen wirst

Ein Browser-Automatisierungs-Setup, mit dem OpenClaw:

Websites navigiert — Seiten oeffnen, Buttons klicken, Formulare ausfuellen, durch Inhalte scrollen
Daten extrahiert — strukturierte Daten aus Webseiten, Tabellen und Dashboards scrapen
Screenshots erstellt — ganze Seiten oder einzelne Elemente fuer Berichte erfassen
Mehrstufige Workflows ausfuehrt — Browser-Aktionen zu komplexen Automatisierungssequenzen verketten

Nach dieser Anleitung kannst du jede Browser-Aufgabe automatisieren, indem du einfach in natuerlicher Sprache beschreibst, was du willst.

Warum KI fuer Browser-Automatisierung

Klassische Browser-Automatisierungstools (Selenium, Puppeteer, Playwright) sind maechtig, erfordern aber fuer jeden Workflow eigenen Code. Aendert sich das Layout einer Website, brechen deine Skripte. Brauchst du einen neuen Workflow, schreibst du ein neues Skript.

KI-gestuetzte Browser-Automatisierung aendert das grundlegend:

Natuerlichsprachliche Anweisungen — beschreibe, was du willst, statt Selektoren und Click-Handler zu schreiben
Selbstheilung — KI passt sich an UI-Aenderungen an, ohne dass Skripte aktualisiert werden muessen
Kein Code-Wartungsaufwand — Workflows werden durch Absicht definiert, nicht durch Implementierung
Schnelles Prototyping — eine neue Automatisierung in Minuten statt Stunden aufsetzen
Visuelles Verstaendnis — KI kann Seitenlayouts interpretieren, Text aus Screenshots lesen und Entscheidungen basierend auf dem Gesehenen treffen

Voraussetzungen

OpenClaw installiert und konfiguriert (Erste-Schritte-Anleitung)
Chrome oder Chromium auf deinem System installiert
Node.js 18+

Schritt 1: Benoetigte Skills installieren

bash

# 1. Browser-Steuerung
npx clawhub@latest install browser-use

# 2. Web-Datenextraktion
npx clawhub@latest install web-scraper

# 3. Screenshot-Erfassung
npx clawhub@latest install screenshot

Schritt 2: Browser-Setup ueberpruefen

Der browser-use Skill braucht eine Chrome/Chromium-Installation:

bash

clawhub inspect browser-use

Das prueft, ob ein kompatibler Browser vorhanden ist, und zeigt den erkannten Pfad an. Falls Chrome nicht automatisch gefunden wird, setze den Pfad manuell in der Skill-Konfiguration.

Schritt 3: Browser-Automatisierung in Aktion

Beispiel 1: Daten aus einem Dashboard extrahieren

Angenommen, du musst jeden Morgen Kennzahlen aus einem Web-Dashboard ziehen:

Open https://analytics.example.com, log in with my saved credentials,
navigate to the Daily Metrics page, and extract the table showing
yesterday's KPIs into a Markdown table.

Der Browser-Skill uebernimmt Login, Navigation und Datenextraktion. Das Ergebnis ist eine saubere Markdown-Tabelle, die du direkt in Berichte oder Slack einfuegen kannst.

Beispiel 2: Preisseite eines Wettbewerbers ueberwachen

Go to competitor.com/pricing, take a screenshot of the pricing table,
and extract all plan names, prices, and feature lists into JSON format.

Ausgabe:

json

{
  "plans": [
    {
      "name": "Starter",
      "price": "$29/month",
      "features": ["5 users", "10GB storage", "Email support"]
    },
    {
      "name": "Professional",
      "price": "$79/month",
      "features": ["25 users", "100GB storage", "Priority support", "API access"]
    },
    {
      "name": "Enterprise",
      "price": "Custom",
      "features": ["Unlimited users", "Unlimited storage", "24/7 support", "SSO", "Audit logs"]
    }
  ]
}

Beispiel 3: Formular ausfuellen

Open the internal expense report form at expenses.company.com,
fill in: date = today, category = "Software", amount = $49.99,
description = "ClawHub Pro subscription", then submit.

Beispiel 4: Mehrstufiger Recherche-Workflow

1. Search Google for "best CI/CD tools 2026 comparison"
2. Open the top 3 results
3. Extract the main comparison points from each article
4. Compile into a summary table

Schritt 4: Screenshots fuer Berichte

Der Screenshot-Skill erfasst visuelle Nachweise fuer Reporting und Monitoring:

bash

# Ganzseitige Aufnahme
clawhub run screenshot --url "https://status.example.com" --full-page

# Bestimmtes Element
clawhub run screenshot --url "https://grafana.example.com/d/api-latency" --selector ".panel-container"

# Mehrere Seiten
clawhub run screenshot --urls "url1,url2,url3" --output "./screenshots/"

Geplantes visuelles Monitoring

In Kombination mit cron fuer taegliche Snapshots:

bash

clawhub run cron --schedule "0 9 * * *" --task "screenshot --url https://status.example.com --output ~/snapshots/{{date}}.png"

Fortgeschritten: Komplexe Workflows

Browser-Aktionen verketten

Fuer mehrstufige Workflows, die zuverlaessig laufen muessen:

yaml

# .openclaw/browser-workflow.yml
workflow:
  name: "Daily Metrics Collection"
  steps:
    - action: navigate
      url: "https://analytics.example.com"
    - action: login
      credentials: "analytics_dashboard"
    - action: click
      target: "Daily Report tab"
    - action: wait
      condition: "table is fully loaded"
    - action: extract
      target: "metrics table"
      format: "csv"
    - action: screenshot
      target: "full page"
    - action: save
      output: "~/reports/{{date}}-metrics.csv"

Authentifizierung handhaben

Fuer Seiten, die einen Login erfordern:

yaml

credentials:
  analytics_dashboard:
    url: "https://analytics.example.com/login"
    username_field: "#email"
    password_field: "#password"
    # Zugangsdaten im sicheren Credential Store von OpenClaw gespeichert

Verwende clawhub credentials set analytics_dashboard, um Login-Daten sicher zu speichern.

Arbeiten mit SPAs und dynamischen Inhalten

Moderne Single-Page-Applications laden Inhalte dynamisch nach. Der Browser-Skill bewaeltigt das automatisch durch:

Warten, bis Netzwerk-Requests abgeschlossen sind
Erkennen, wann die Seite vollstaendig gerendert ist
Wiederholen, falls Inhalte noch nicht geladen wurden

Bei besonders langsamen Seiten kannst du explizite Wartebedingungen setzen:

Navigate to the dashboard and wait until the chart labeled "Revenue" is visible before taking a screenshot.

Fehlerbehebung

Browser startet nicht

Pruefe, ob Chrome/Chromium installiert ist: which google-chrome oder which chromium
Kontrolliere den Pfad in der Skill-Konfiguration: clawhub inspect browser-use
Auf Headless-Servern sicherstellen, dass das --no-sandbox-Flag in der Konfiguration aktiviert ist

Seiteninhalt wird nicht geladen

Einige Seiten benoetigen JavaScript — der Browser-Skill fuehrt einen vollstaendigen Browser aus, daher sollte das standardmaessig funktionieren
Pruefe, ob Cookie-Consent-Banner den Inhalt blockieren
Stelle sicher, dass die URL von deinem Rechner aus erreichbar ist (VPN, Firewall)

Screenshots sind leer oder unvollstaendig

Fuege eine Wartezeit vor der Aufnahme hinzu: die Seite rendert moeglicherweise noch
Verwende das --full-page-Flag fuer Seiten, die Scrollen erfordern
Pruefe, ob die Seite eine Authentifizierung benoetigt

Extraktion liefert falsche Daten

Sei spezifischer, welches Element extrahiert werden soll
Nutze visuelle Referenzen: "die Tabelle im zweiten Abschnitt" oder "die Preiskarte rechts"
Bei komplexen Seiten: erst einen Screenshot machen, um den Seitenstatus zu pruefen, dann extrahieren

Haeufige Fragen

Ist das dasselbe wie Selenium oder Puppeteer?

Nein. Klassische Automatisierungstools erfordern Code mit expliziten Selektoren (document.querySelector('.price-table')). OpenClaws Browser-Automatisierung nutzt KI, um die Seite visuell und semantisch zu verstehen — du beschreibst in natuerlicher Sprache, was du willst, und die KI findet heraus, wie sie mit der Seite interagiert. Das macht sie robuster gegenueber UI-Aenderungen und deutlich schneller einzurichten.

Ja. Der Browser-Skill unterstuetzt Credential-Management fuer Seiten, die Authentifizierung erfordern. Du speicherst Zugangsdaten sicher mit clawhub credentials set, und der Skill uebernimmt den Login-Flow automatisch. Er unterstuetzt Standard-Benutzername/Passwort-Formulare, OAuth-Redirects und Basic Auth.

Ist Web Scraping legal?

Die Legalitaet von Web Scraping haengt von den Nutzungsbedingungen der Website, der Art der gesammelten Daten und deiner Rechtsordnung ab. Generell ist das Scrapen oeffentlich zugaenglicher Daten fuer den persoenlichen Gebrauch akzeptabel. Pruefe immer die robots.txt und die Nutzungsbedingungen der Website. Scrape keine personenbezogenen Daten, urheberrechtlich geschuetzten Inhalte oder Daten hinter Authentifizierung ohne Erlaubnis. OpenClaw umgeht keine CAPTCHAs oder Zugangsbeschraenkungen.

Wie werden CAPTCHAs behandelt?

Der Browser-Skill loest CAPTCHAs nicht automatisch. Wenn eine Seite ein CAPTCHA zeigt, wird der Workflow pausiert und du wirst benachrichtigt. Bei Seiten, die du regelmaessig besuchst, vermeidest du wiederholte CAPTCHAs in der Regel, indem du dich einmal manuell einloggst und die Session-Cookies speicherst.

Kann ich das auf einem Headless-Server ausfuehren?

Ja. Der Browser-Skill unterstuetzt den Headless-Modus, der Chrome ohne sichtbares Fenster ausfuehrt. Auf Servern ohne Display ist das die Standardeinstellung. Setze headless: true in der Konfiguration oder uebergib das --headless-Flag. Alle Funktionen arbeiten im Headless-Modus identisch.

Wie viele Ressourcen verbraucht die Browser-Automatisierung?

Jede Browser-Instanz benötigt ca. 200–500 MB RAM. Wenn du mehrere Workflows gleichzeitig ausfuehrst, plane entsprechend mehr Arbeitsspeicher ein. Die CPU-Auslastung steigt waehrend des Seiten-Renderings und der Screenshot-Erfassung, ist aber bei Wartezeiten gering. Bei geplanten Aufgaben wird der Browser fuer jeden Lauf gestartet und wieder geschlossen, sodass Ressourcen nur waehrend der Ausfuehrung belegt sind.

Browser-Automatisierung mit OpenClaw einrichten

Was du bauen wirst

Warum KI fuer Browser-Automatisierung

Voraussetzungen

Schritt 1: Benoetigte Skills installieren

Schritt 2: Browser-Setup ueberpruefen

Schritt 3: Browser-Automatisierung in Aktion

Beispiel 1: Daten aus einem Dashboard extrahieren

Beispiel 2: Preisseite eines Wettbewerbers ueberwachen

Beispiel 3: Formular ausfuellen

Beispiel 4: Mehrstufiger Recherche-Workflow

Schritt 4: Screenshots fuer Berichte

Geplantes visuelles Monitoring

Fortgeschritten: Komplexe Workflows

Browser-Aktionen verketten

Authentifizierung handhaben

Arbeiten mit SPAs und dynamischen Inhalten

Fehlerbehebung

Browser startet nicht

Seiteninhalt wird nicht geladen

Screenshots sind leer oder unvollstaendig

Extraktion liefert falsche Daten

Haeufige Fragen

Ist das dasselbe wie Selenium oder Puppeteer?

Kann ich login-geschuetzte Seiten automatisieren?

Ist Web Scraping legal?

Wie werden CAPTCHAs behandelt?

Kann ich das auf einem Headless-Server ausfuehren?

Wie viele Ressourcen verbraucht die Browser-Automatisierung?

Verwandte Anwendungsfälle