OpenClaw
應用場景進階15 min

用 OpenClaw 實現瀏覽器自動化

用 OpenClaw 實現 AI 驅動的瀏覽器自動化:網頁擷取、表單填寫、截圖採集、資料擷取和多步驟 Web 工作流,用自然語言描述即可執行。

最後更新: 2026-03-31

你將建置什麼

一套瀏覽器自動化能力,讓 OpenClaw 能夠:

  1. 瀏覽網頁 — 開啟頁面、點擊按鈕、填寫表單、捲動瀏覽
  2. 擷取資料 — 從網頁、表格和儀表板中抓取結構化資料
  3. 截取截圖 — 全頁或特定元素的截圖,用於報告
  4. 執行多步驟工作流 — 將瀏覽器操作串聯成複雜的自動化流程

建置完成後,你只需用自然語言描述想做什麼,就能自動化任何瀏覽器操作。

為什麼用 AI 做瀏覽器自動化

傳統瀏覽器自動化工具(Selenium、Puppeteer、Playwright)功能強大,但每個工作流都需要撰寫和維護程式碼。網站改了版面,腳本就掛了。需要新的工作流,就得寫新腳本。

AI 驅動的瀏覽器自動化改變了這一點:

  • 自然語言指令 — 描述你要做什麼,而不是寫選擇器和點擊處理器
  • 自適應修復 — AI 能適應 UI 變化,不需要更新腳本
  • 零程式碼維護 — 工作流由意圖定義,而非實作細節
  • 快速建置 — 幾分鐘建好一個新自動化,而不是幾小時
  • 視覺理解 — AI 能解讀頁面版面、辨識截圖中的文字、根據所見做決策

前置條件

  • OpenClaw 已安裝並設定好(快速上手指南
  • Chrome 或 Chromium 已安裝
  • Node.js 18+

第 1 步:安裝所需 Skills

bash
# 1. 瀏覽器控制
npx clawhub@latest install browser-use

# 2. 網頁資料擷取
npx clawhub@latest install web-scraper

# 3. 截圖採集
npx clawhub@latest install screenshot

第 2 步:驗證瀏覽器環境

browser-use Skill 需要 Chrome/Chromium:

bash
clawhub inspect browser-use

會檢查是否有相容的瀏覽器並顯示偵測到的路徑。如果 Chrome 沒有被自動找到,在 Skill 設定中手動設定路徑。

第 3 步:瀏覽器自動化實戰

範例 1:從資料儀表板擷取指標

假設你每天早上需要從一個 Web 儀表板擷取資料:

Open https://analytics.example.com, log in with my saved credentials,
navigate to the Daily Metrics page, and extract the table showing
yesterday's KPIs into a Markdown table.

瀏覽器 Skill 處理登入、導覽和資料擷取。結果是一份乾淨的 Markdown 表格,可以直接貼到報告或 Slack 中。

範例 2:監控競品定價頁面

Go to competitor.com/pricing, take a screenshot of the pricing table,
and extract all plan names, prices, and feature lists into JSON format.

輸出:

json
{
  "plans": [
    {
      "name": "Starter",
      "price": "$29/month",
      "features": ["5 users", "10GB storage", "Email support"]
    },
    {
      "name": "Professional",
      "price": "$79/month",
      "features": ["25 users", "100GB storage", "Priority support", "API access"]
    },
    {
      "name": "Enterprise",
      "price": "Custom",
      "features": ["Unlimited users", "Unlimited storage", "24/7 support", "SSO", "Audit logs"]
    }
  ]
}

範例 3:自動填表

Open the internal expense report form at expenses.company.com,
fill in: date = today, category = "Software", amount = $49.99,
description = "ClawHub Pro subscription", then submit.

範例 4:多步驟研究工作流

1. Search Google for "best CI/CD tools 2026 comparison"
2. Open the top 3 results
3. Extract the main comparison points from each article
4. Compile into a summary table

第 4 步:截圖用於報告

Screenshot Skill 為報告和監控採集視覺證據:

bash
# 全頁截圖
clawhub run screenshot --url "https://status.example.com" --full-page

# 特定元素
clawhub run screenshot --url "https://grafana.example.com/d/api-latency" --selector ".panel-container"

# 多個頁面
clawhub run screenshot --urls "url1,url2,url3" --output "./screenshots/"

定時視覺監控

配合 Cron 每天採集快照:

bash
clawhub run cron --schedule "0 9 * * *" --task "screenshot --url https://status.example.com --output ~/snapshots/{{date}}.png"

進階:複雜工作流

串聯瀏覽器操作

需要穩定執行的多步驟工作流:

yaml
# .openclaw/browser-workflow.yml
workflow:
  name: "每日指標採集"
  steps:
    - action: navigate
      url: "https://analytics.example.com"
    - action: login
      credentials: "analytics_dashboard"
    - action: click
      target: "Daily Report tab"
    - action: wait
      condition: "table is fully loaded"
    - action: extract
      target: "metrics table"
      format: "csv"
    - action: screenshot
      target: "full page"
    - action: save
      output: "~/reports/{{date}}-metrics.csv"

處理登入驗證

需要登入的網站:

yaml
credentials:
  analytics_dashboard:
    url: "https://analytics.example.com/login"
    username_field: "#email"
    password_field: "#password"
    # 憑證儲存在 OpenClaw 的安全憑證庫中

clawhub credentials set analytics_dashboard 安全儲存登入資訊。

處理 SPA 和動態內容

現代單頁應用程式動態載入內容。瀏覽器 Skill 自動處理:

  • 等待網路請求完成
  • 偵測頁面是否完全渲染
  • 內容未載入時自動重試

對於特別慢的頁面,可以設定明確的等待條件:

Navigate to the dashboard and wait until the chart labeled "Revenue" is visible before taking a screenshot.

常見問題排查

瀏覽器啟動失敗

  • 確認 Chrome/Chromium 已安裝:which google-chromewhich chromium
  • 檢查 Skill 設定中的路徑:clawhub inspect browser-use
  • 在無 GUI 伺服器上,確認設定中啟用了 --no-sandbox 旗標

頁面內容不載入

  • 某些頁面需要 JavaScript——瀏覽器 Skill 執行完整瀏覽器,預設支援
  • 檢查是否有 Cookie 同意彈窗擋住了內容
  • 確認 URL 從你的機器可以存取(VPN、防火牆)

截圖空白或不完整

  • 截圖前加等待時間——頁面可能還在渲染
  • 需要捲動的頁面使用 --full-page 參數
  • 檢查頁面是否需要登入

擷取到錯誤的資料

  • 更具體地描述要擷取的元素
  • 使用視覺描述:「第二個區域中的表格」或「右邊的定價卡片」
  • 對於複雜頁面,先截圖確認頁面狀態,再擷取

常見問題

不一樣。傳統自動化工具需要寫程式碼,用明確的選擇器(如 `document.querySelector('.price-table')`)。OpenClaw 的瀏覽器自動化用 AI 從視覺和語意上理解頁面——你用自然語言描述想做什麼,它自動找到怎麼操作。這讓它對 UI 變化更有韌性,建置速度也快得多。

可以。瀏覽器 Skill 支援憑證管理。用 `clawhub credentials set` 安全儲存憑證,Skill 會自動處理登入流程。支援標準的使用者名稱/密碼表單、OAuth 重新導向和 Basic Auth。

網頁擷取的合法性取決於網站的服務條款、擷取的資料類型和你所在的法律管轄區。一般來說,擷取公開資料供個人使用是可以接受的。務必查看網站的 `robots.txt` 和服務條款。不要未經許可擷取個人資料、受著作權保護的內容或需要登入才能看到的資料。OpenClaw 不會繞過驗證碼或存取限制。

瀏覽器 Skill 不會自動解決驗證碼。如果網站彈出驗證碼,工作流會暫停並通知你。對於經常存取的網站,手動登入一次並儲存階段作業 Cookie,通常可以避免重複觸發驗證碼。

可以。瀏覽器 Skill 支援無頭模式(headless mode),不需要顯示視窗。在沒有圖形介面的伺服器上預設使用無頭模式。在設定中設定 `headless: true` 或傳入 `--headless` 參數。所有功能在無頭模式下完全一致。

每個瀏覽器實例大約佔用 200-500MB 記憶體。如果同時執行多個工作流,按比例規劃記憶體。CPU 在頁面渲染和截圖時會有峰值,等待期間佔用很低。對於定時任務,瀏覽器在每次執行時啟動和關閉,資源只在執行期間佔用。

相關場景