OpenClaw
AnwendungsfallFortgeschritten15 min

Browser-Automatisierung mit OpenClaw einrichten

Browser-Aufgaben mit OpenClaw automatisieren: Web Scraping, Formulare ausfuellen, Screenshots erstellen, Daten extrahieren und mehrstufige Web-Workflows — alles KI-gesteuert.

Zuletzt aktualisiert: 2026-03-31

Was du bauen wirst

Ein Browser-Automatisierungs-Setup, mit dem OpenClaw:

  1. Websites navigiert — Seiten oeffnen, Buttons klicken, Formulare ausfuellen, durch Inhalte scrollen
  2. Daten extrahiert — strukturierte Daten aus Webseiten, Tabellen und Dashboards scrapen
  3. Screenshots erstellt — ganze Seiten oder einzelne Elemente fuer Berichte erfassen
  4. Mehrstufige Workflows ausfuehrt — Browser-Aktionen zu komplexen Automatisierungssequenzen verketten

Nach dieser Anleitung kannst du jede Browser-Aufgabe automatisieren, indem du einfach in natuerlicher Sprache beschreibst, was du willst.

Warum KI fuer Browser-Automatisierung

Klassische Browser-Automatisierungstools (Selenium, Puppeteer, Playwright) sind maechtig, erfordern aber fuer jeden Workflow eigenen Code. Aendert sich das Layout einer Website, brechen deine Skripte. Brauchst du einen neuen Workflow, schreibst du ein neues Skript.

KI-gestuetzte Browser-Automatisierung aendert das grundlegend:

  • Natuerlichsprachliche Anweisungen — beschreibe, was du willst, statt Selektoren und Click-Handler zu schreiben
  • Selbstheilung — KI passt sich an UI-Aenderungen an, ohne dass Skripte aktualisiert werden muessen
  • Kein Code-Wartungsaufwand — Workflows werden durch Absicht definiert, nicht durch Implementierung
  • Schnelles Prototyping — eine neue Automatisierung in Minuten statt Stunden aufsetzen
  • Visuelles Verstaendnis — KI kann Seitenlayouts interpretieren, Text aus Screenshots lesen und Entscheidungen basierend auf dem Gesehenen treffen

Voraussetzungen

  • OpenClaw installiert und konfiguriert (Erste-Schritte-Anleitung)
  • Chrome oder Chromium auf deinem System installiert
  • Node.js 18+

Schritt 1: Benoetigte Skills installieren

bash
# 1. Browser-Steuerung
npx clawhub@latest install browser-use

# 2. Web-Datenextraktion
npx clawhub@latest install web-scraper

# 3. Screenshot-Erfassung
npx clawhub@latest install screenshot

Schritt 2: Browser-Setup ueberpruefen

Der browser-use Skill braucht eine Chrome/Chromium-Installation:

bash
clawhub inspect browser-use

Das prueft, ob ein kompatibler Browser vorhanden ist, und zeigt den erkannten Pfad an. Falls Chrome nicht automatisch gefunden wird, setze den Pfad manuell in der Skill-Konfiguration.

Schritt 3: Browser-Automatisierung in Aktion

Beispiel 1: Daten aus einem Dashboard extrahieren

Angenommen, du musst jeden Morgen Kennzahlen aus einem Web-Dashboard ziehen:

Open https://analytics.example.com, log in with my saved credentials,
navigate to the Daily Metrics page, and extract the table showing
yesterday's KPIs into a Markdown table.

Der Browser-Skill uebernimmt Login, Navigation und Datenextraktion. Das Ergebnis ist eine saubere Markdown-Tabelle, die du direkt in Berichte oder Slack einfuegen kannst.

Beispiel 2: Preisseite eines Wettbewerbers ueberwachen

Go to competitor.com/pricing, take a screenshot of the pricing table,
and extract all plan names, prices, and feature lists into JSON format.

Ausgabe:

json
{
  "plans": [
    {
      "name": "Starter",
      "price": "$29/month",
      "features": ["5 users", "10GB storage", "Email support"]
    },
    {
      "name": "Professional",
      "price": "$79/month",
      "features": ["25 users", "100GB storage", "Priority support", "API access"]
    },
    {
      "name": "Enterprise",
      "price": "Custom",
      "features": ["Unlimited users", "Unlimited storage", "24/7 support", "SSO", "Audit logs"]
    }
  ]
}

Beispiel 3: Formular ausfuellen

Open the internal expense report form at expenses.company.com,
fill in: date = today, category = "Software", amount = $49.99,
description = "ClawHub Pro subscription", then submit.

Beispiel 4: Mehrstufiger Recherche-Workflow

1. Search Google for "best CI/CD tools 2026 comparison"
2. Open the top 3 results
3. Extract the main comparison points from each article
4. Compile into a summary table

Schritt 4: Screenshots fuer Berichte

Der Screenshot-Skill erfasst visuelle Nachweise fuer Reporting und Monitoring:

bash
# Ganzseitige Aufnahme
clawhub run screenshot --url "https://status.example.com" --full-page

# Bestimmtes Element
clawhub run screenshot --url "https://grafana.example.com/d/api-latency" --selector ".panel-container"

# Mehrere Seiten
clawhub run screenshot --urls "url1,url2,url3" --output "./screenshots/"

Geplantes visuelles Monitoring

In Kombination mit cron fuer taegliche Snapshots:

bash
clawhub run cron --schedule "0 9 * * *" --task "screenshot --url https://status.example.com --output ~/snapshots/{{date}}.png"

Fortgeschritten: Komplexe Workflows

Browser-Aktionen verketten

Fuer mehrstufige Workflows, die zuverlaessig laufen muessen:

yaml
# .openclaw/browser-workflow.yml
workflow:
  name: "Daily Metrics Collection"
  steps:
    - action: navigate
      url: "https://analytics.example.com"
    - action: login
      credentials: "analytics_dashboard"
    - action: click
      target: "Daily Report tab"
    - action: wait
      condition: "table is fully loaded"
    - action: extract
      target: "metrics table"
      format: "csv"
    - action: screenshot
      target: "full page"
    - action: save
      output: "~/reports/{{date}}-metrics.csv"

Authentifizierung handhaben

Fuer Seiten, die einen Login erfordern:

yaml
credentials:
  analytics_dashboard:
    url: "https://analytics.example.com/login"
    username_field: "#email"
    password_field: "#password"
    # Zugangsdaten im sicheren Credential Store von OpenClaw gespeichert

Verwende clawhub credentials set analytics_dashboard, um Login-Daten sicher zu speichern.

Arbeiten mit SPAs und dynamischen Inhalten

Moderne Single-Page-Applications laden Inhalte dynamisch nach. Der Browser-Skill bewaeltigt das automatisch durch:

  • Warten, bis Netzwerk-Requests abgeschlossen sind
  • Erkennen, wann die Seite vollstaendig gerendert ist
  • Wiederholen, falls Inhalte noch nicht geladen wurden

Bei besonders langsamen Seiten kannst du explizite Wartebedingungen setzen:

Navigate to the dashboard and wait until the chart labeled "Revenue" is visible before taking a screenshot.

Fehlerbehebung

Browser startet nicht

  • Pruefe, ob Chrome/Chromium installiert ist: which google-chrome oder which chromium
  • Kontrolliere den Pfad in der Skill-Konfiguration: clawhub inspect browser-use
  • Auf Headless-Servern sicherstellen, dass das --no-sandbox-Flag in der Konfiguration aktiviert ist

Seiteninhalt wird nicht geladen

  • Einige Seiten benoetigen JavaScript — der Browser-Skill fuehrt einen vollstaendigen Browser aus, daher sollte das standardmaessig funktionieren
  • Pruefe, ob Cookie-Consent-Banner den Inhalt blockieren
  • Stelle sicher, dass die URL von deinem Rechner aus erreichbar ist (VPN, Firewall)

Screenshots sind leer oder unvollstaendig

  • Fuege eine Wartezeit vor der Aufnahme hinzu: die Seite rendert moeglicherweise noch
  • Verwende das --full-page-Flag fuer Seiten, die Scrollen erfordern
  • Pruefe, ob die Seite eine Authentifizierung benoetigt

Extraktion liefert falsche Daten

  • Sei spezifischer, welches Element extrahiert werden soll
  • Nutze visuelle Referenzen: "die Tabelle im zweiten Abschnitt" oder "die Preiskarte rechts"
  • Bei komplexen Seiten: erst einen Screenshot machen, um den Seitenstatus zu pruefen, dann extrahieren

Haeufige Fragen

Ist das dasselbe wie Selenium oder Puppeteer?

Nein. Klassische Automatisierungstools erfordern Code mit expliziten Selektoren (document.querySelector('.price-table')). OpenClaws Browser-Automatisierung nutzt KI, um die Seite visuell und semantisch zu verstehen — du beschreibst in natuerlicher Sprache, was du willst, und die KI findet heraus, wie sie mit der Seite interagiert. Das macht sie robuster gegenueber UI-Aenderungen und deutlich schneller einzurichten.

Kann ich login-geschuetzte Seiten automatisieren?

Ja. Der Browser-Skill unterstuetzt Credential-Management fuer Seiten, die Authentifizierung erfordern. Du speicherst Zugangsdaten sicher mit clawhub credentials set, und der Skill uebernimmt den Login-Flow automatisch. Er unterstuetzt Standard-Benutzername/Passwort-Formulare, OAuth-Redirects und Basic Auth.

Die Legalitaet von Web Scraping haengt von den Nutzungsbedingungen der Website, der Art der gesammelten Daten und deiner Rechtsordnung ab. Generell ist das Scrapen oeffentlich zugaenglicher Daten fuer den persoenlichen Gebrauch akzeptabel. Pruefe immer die robots.txt und die Nutzungsbedingungen der Website. Scrape keine personenbezogenen Daten, urheberrechtlich geschuetzten Inhalte oder Daten hinter Authentifizierung ohne Erlaubnis. OpenClaw umgeht keine CAPTCHAs oder Zugangsbeschraenkungen.

Wie werden CAPTCHAs behandelt?

Der Browser-Skill loest CAPTCHAs nicht automatisch. Wenn eine Seite ein CAPTCHA zeigt, wird der Workflow pausiert und du wirst benachrichtigt. Bei Seiten, die du regelmaessig besuchst, vermeidest du wiederholte CAPTCHAs in der Regel, indem du dich einmal manuell einloggst und die Session-Cookies speicherst.

Kann ich das auf einem Headless-Server ausfuehren?

Ja. Der Browser-Skill unterstuetzt den Headless-Modus, der Chrome ohne sichtbares Fenster ausfuehrt. Auf Servern ohne Display ist das die Standardeinstellung. Setze headless: true in der Konfiguration oder uebergib das --headless-Flag. Alle Funktionen arbeiten im Headless-Modus identisch.

Wie viele Ressourcen verbraucht die Browser-Automatisierung?

Jede Browser-Instanz benötigt ca. 200–500 MB RAM. Wenn du mehrere Workflows gleichzeitig ausfuehrst, plane entsprechend mehr Arbeitsspeicher ein. Die CPU-Auslastung steigt waehrend des Seiten-Renderings und der Screenshot-Erfassung, ist aber bei Wartezeiten gering. Bei geplanten Aufgaben wird der Browser fuer jeden Lauf gestartet und wieder geschlossen, sodass Ressourcen nur waehrend der Ausfuehrung belegt sind.

Verwandte Anwendungsfälle