OpenClaw
效能優化10 分鐘閱讀

OpenClaw 模型選擇和成本最佳化指南

比較 OpenClaw 的 AI 模型,了解定價,學習在保持高品質回應的同時最佳化成本的策略。

O

OpenClaw Guides

Tutorial Authors

了解 AI 模型定價

AI 模型按 token 計費 - token 是大約 4 個字元或 0.75 個單詞的文字區塊。你需要為以下兩項付費:

  • 輸入 token:你發送的文字(你的訊息 + 對話歷史)
  • 輸出 token:模型生成的文字(回覆)

OpenClaw 中可用的模型

OpenClaw 支援 Anthropic 的 Claude 模型,並透過 OpenRouter 支援其他供應商。以下是最常用的模型:

Claude 模型(Anthropic)

模型輸入價格輸出價格最適合
Claude Haiku 4.5$1.00/1M$5.00/1M快速任務、大量訊息
Claude Sonnet 4$3.00/1M$15.00/1M均衡效能
Claude Sonnet 4.5$3.00/1M$15.00/1M增強推理
Claude Opus 4.6$5.00/1M$25.00/1M最強大、研究用

價格截至 2026 年初。請查看 Anthropic 定價頁面 取得最新價格。

成本比較範例

一次典型對話(1,000 輸入 token 和 500 輸出 token)的費用:

模型輸入成本輸出成本總計
Claude Haiku 4.5$0.001$0.0025$0.0035
Claude Sonnet 4$0.003$0.0075$0.0105
Claude Opus 4.6$0.005$0.0125$0.0175

Haiku 比 Sonnet 便宜 3 倍,比 Opus 便宜 5 倍!

選擇合適的模型

在以下情況使用 Claude Haiku 4.5:

  • 回答簡單問題
  • 快速查詢和事實查找
  • 高頻訊息場景(WhatsApp、Telegram)
  • 成本是主要考量
  • 速度比深度更重要

~/.openclaw/openclaw.json 中設定為預設模型:

json
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-haiku-4-5"
      }
    }
  }
}

在以下情況使用 Claude Sonnet 4 / 4.5:

  • 需要寫作輔助
  • 程式碼生成或審查
  • 中等複雜度任務
  • 品質與成本的平衡
  • 大多數日常使用場景
json
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-sonnet-4"
      }
    }
  }
}

在以下情況使用 Claude Opus 4.6:

  • 需要複雜分析
  • 研究和深度推理
  • 關鍵商業決策
  • 品質至上
  • 不計較成本
json
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-opus-4-6"
      }
    }
  }
}

按頻道路由模型

OpenClaw 允許你使用 modelByChannel 為不同頻道分配不同模型。這是最有效的成本最佳化方式 —— 在休閒頻道使用較便宜的模型,在工作頻道使用更強大的模型:

json
// ~/.openclaw/openclaw.json
{
  "channels": {
    "modelByChannel": {
      "whatsapp": {
        "default": "anthropic/claude-haiku-4-5"
      },
      "telegram": {
        "default": "anthropic/claude-haiku-4-5"
      },
      "discord": {
        "default": "anthropic/claude-sonnet-4"
      },
      "slack": {
        "default": "anthropic/claude-sonnet-4"
      }
    }
  }
}

你還可以設定模型故障轉移 —— 當主模型不可用時,OpenClaw 會按順序嘗試備用模型:

json
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-sonnet-4",
        "fallbacks": [
          "anthropic/claude-haiku-4-5"
        ]
      }
    }
  }
}

社群自動路由器

如需基於訊息複雜度的更智慧路由,社群專案如 iblai-openclaw-routerClawRoute 可以自動將簡單查詢路由到 Haiku,將複雜查詢路由到 Sonnet 或 Opus。

成本最佳化策略

1. 限制對話歷史

對話歷史會快速累積 token。使用 historyLimit 來限制發送的歷史訊息數量:

json
// ~/.openclaw/openclaw.json
{
  "messages": {
    "groupChat": {
      "historyLimit": 10
    }
  },
  "channels": {
    "whatsapp": {
      "dmHistoryLimit": 8
    },
    "telegram": {
      "dmHistoryLimit": 8
    },
    "discord": {
      "historyLimit": 15
    }
  }
}

休閒頻道(WhatsApp、Telegram)保持 8-10 則訊息,工作頻道(Discord、Slack)保持 15-20 則。這會顯著減少每次請求的輸入 token。

2. 使用 Anthropic 的 Prompt 快取

Anthropic 提供 Prompt 快取,可以大幅降低重複上下文(系統提示詞、對話前綴)的成本:

操作成本倍數
快取寫入(首次請求)1.25x 基礎輸入價格
快取讀取(後續請求)0.1x 基礎輸入價格

首次請求後,快取內容享受 90% 折扣。如果你的系統提示詞有 1,000 個 token,發送 50 則訊息,你只需為第一則支付全價,其餘 49 則只需 10%。

當你的 API 供應商啟用了快取時,OpenClaw 會自動支援此功能。檢查你的 Anthropic 面板中的 "Cache Read Tokens" 使用量。

3. 選擇更便宜的預設模型

最簡單的最佳化:將預設模型從 Sonnet 切換到 Haiku。對於 80% 的日常互動(快速問答、查詢、提醒、閒聊),Haiku 表現同樣出色,而成本只是 Sonnet 的一小部分。

使用 modelByChannel 在特定工作頻道保留 Sonnet 或 Opus。

4. 使用模型目錄和別名

定義模型目錄以便於管理多個模型並追蹤成本:

json
{
  "agents": {
    "defaults": {
      "models": {
        "anthropic/claude-haiku-4-5": {
          "alias": "fast",
          "cost": { "input": 1.0, "output": 5.0 }
        },
        "anthropic/claude-sonnet-4": {
          "alias": "balanced",
          "cost": { "input": 3.0, "output": 15.0 }
        },
        "anthropic/claude-opus-4-6": {
          "alias": "powerful",
          "cost": { "input": 5.0, "output": 25.0 }
        }
      }
    }
  }
}

5. 對非緊急任務使用 Batch API

如果你有不緊急的工作負載,Anthropic 的 Batch API 提供輸入和輸出 token 50% 折扣

模型標準輸出Batch 輸出
Claude Haiku 4.5$5.00/1M$2.50/1M
Claude Sonnet 4$15.00/1M$7.50/1M
Claude Opus 4.6$25.00/1M$12.50/1M

監控成本

即時使用量

bash
# 查看當前使用量
openclaw stats

# 輸出:
# Today's Usage:
#   Input tokens:  45,230
#   Output tokens: 12,450
#   Estimated cost: $0.23
#
# This month:
#   Total tokens: 1,234,567
#   Estimated cost: $8.45

詳細報告

bash
# 產生成本報告
openclaw stats --report monthly

# 匯出為 CSV
openclaw stats --export costs.csv --period 30d

Anthropic Console 限額

Anthropic Console 中直接設定月度消費上限,以防意外帳單。這是最可靠的預算控制方式 —— 達到上限後,API 將停止接受請求。

省錢配置模板

節省型配置

json
// 最小化成本最佳化
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-haiku-4-5"
      }
    }
  },
  "messages": {
    "groupChat": {
      "historyLimit": 5
    }
  }
}

預估成本:中等使用量約 $5-10/月

均衡型配置

json
// 品質與成本的良好平衡
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-sonnet-4",
        "fallbacks": ["anthropic/claude-haiku-4-5"]
      }
    }
  },
  "channels": {
    "modelByChannel": {
      "whatsapp": { "default": "anthropic/claude-haiku-4-5" },
      "telegram": { "default": "anthropic/claude-haiku-4-5" }
    }
  },
  "messages": {
    "groupChat": {
      "historyLimit": 15
    }
  }
}

預估成本:中等使用量約 $15-25/月

品質優先型配置

json
// 最大化品質,成本次要
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-sonnet-4",
        "fallbacks": ["anthropic/claude-opus-4-6"]
      }
    }
  },
  "channels": {
    "modelByChannel": {
      "discord": { "default": "anthropic/claude-opus-4-6" },
      "slack": { "default": "anthropic/claude-opus-4-6" }
    }
  },
  "messages": {
    "groupChat": {
      "historyLimit": 25
    }
  }
}

預估成本:中等使用量約 $30-50/月

多供應商配置(進階)

透過 OpenRouter 使用多個供應商來最佳化成本:

json
// ~/.openclaw/openclaw.json
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-sonnet-4",
        "fallbacks": [
          "openrouter/google/gemini-2.5-flash",
          "anthropic/claude-haiku-4-5"
        ]
      }
    }
  }
}

OpenClaw 使用 provider/model 格式來指定模型 ID。對於 OpenRouter 模型,使用 openrouter/author/slug 格式。

降低成本的技巧

  1. 提示詞要具體 - 模糊的提示詞會導致更長的回覆
  2. 合理使用系統提示詞 - 保持簡潔
  3. 按頻道限制歷史訊息 - 休閒頻道不需要 20 則訊息的上下文
  4. 啟用 Prompt 快取 - 重複上下文節省 90%
  5. 每週監控使用量 - 使用 openclaw stats 及早發現意外峰值
  6. 測試時使用 Haiku - 正式環境再切換到 Sonnet

計算預期成本

使用以下公式:

月度成本 = (每日訊息數 × 平均輸入 Token × 輸入價格) +
           (每日訊息數 × 平均輸出 Token × 輸出價格) × 30

以 Claude Sonnet 4 每天 50 則訊息為例:

  • 平均輸入:800 token
  • 平均輸出:400 token
輸入:50 × 800 × ($3/1M) × 30 = $3.60
輸出:50 × 400 × ($15/1M) × 30 = $9.00
總計:~$12.60/月

如果將一半訊息路由到 Haiku 4.5:

Haiku 部分:25 × 800 × ($1/1M) × 30 + 25 × 400 × ($5/1M) × 30 = $0.60 + $1.50 = $2.10
Sonnet 部分:25 × 800 × ($3/1M) × 30 + 25 × 400 × ($15/1M) × 30 = $1.80 + $4.50 = $6.30
總計:~$8.40/月

僅透過模型路由就節省了 33% —— 加上 Prompt 快取後節省更多。

下一步