OpenClaw 模型選擇和成本最佳化指南
比較 OpenClaw 的 AI 模型,了解定價,學習在保持高品質回應的同時最佳化成本的策略。
OpenClaw Guides
Tutorial Authors
了解 AI 模型定價
AI 模型按 token 計費 - token 是大約 4 個字元或 0.75 個單詞的文字區塊。你需要為以下兩項付費:
- 輸入 token:你發送的文字(你的訊息 + 對話歷史)
- 輸出 token:模型生成的文字(回覆)
OpenClaw 中可用的模型
OpenClaw 支援 Anthropic 的 Claude 模型,並透過 OpenRouter 支援其他供應商。以下是最常用的模型:
Claude 模型(Anthropic)
| 模型 | 輸入價格 | 輸出價格 | 最適合 |
|---|---|---|---|
| Claude Haiku 4.5 | $1.00/1M | $5.00/1M | 快速任務、大量訊息 |
| Claude Sonnet 4 | $3.00/1M | $15.00/1M | 均衡效能 |
| Claude Sonnet 4.5 | $3.00/1M | $15.00/1M | 增強推理 |
| Claude Opus 4.6 | $5.00/1M | $25.00/1M | 最強大、研究用 |
價格截至 2026 年初。請查看 Anthropic 定價頁面 取得最新價格。
成本比較範例
一次典型對話(1,000 輸入 token 和 500 輸出 token)的費用:
| 模型 | 輸入成本 | 輸出成本 | 總計 |
|---|---|---|---|
| Claude Haiku 4.5 | $0.001 | $0.0025 | $0.0035 |
| Claude Sonnet 4 | $0.003 | $0.0075 | $0.0105 |
| Claude Opus 4.6 | $0.005 | $0.0125 | $0.0175 |
Haiku 比 Sonnet 便宜 3 倍,比 Opus 便宜 5 倍!
選擇合適的模型
在以下情況使用 Claude Haiku 4.5:
- 回答簡單問題
- 快速查詢和事實查找
- 高頻訊息場景(WhatsApp、Telegram)
- 成本是主要考量
- 速度比深度更重要
在 ~/.openclaw/openclaw.json 中設定為預設模型:
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-haiku-4-5"
}
}
}
}
在以下情況使用 Claude Sonnet 4 / 4.5:
- 需要寫作輔助
- 程式碼生成或審查
- 中等複雜度任務
- 品質與成本的平衡
- 大多數日常使用場景
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-sonnet-4"
}
}
}
}
在以下情況使用 Claude Opus 4.6:
- 需要複雜分析
- 研究和深度推理
- 關鍵商業決策
- 品質至上
- 不計較成本
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-opus-4-6"
}
}
}
}
按頻道路由模型
OpenClaw 允許你使用 modelByChannel 為不同頻道分配不同模型。這是最有效的成本最佳化方式 —— 在休閒頻道使用較便宜的模型,在工作頻道使用更強大的模型:
// ~/.openclaw/openclaw.json
{
"channels": {
"modelByChannel": {
"whatsapp": {
"default": "anthropic/claude-haiku-4-5"
},
"telegram": {
"default": "anthropic/claude-haiku-4-5"
},
"discord": {
"default": "anthropic/claude-sonnet-4"
},
"slack": {
"default": "anthropic/claude-sonnet-4"
}
}
}
}
你還可以設定模型故障轉移 —— 當主模型不可用時,OpenClaw 會按順序嘗試備用模型:
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-sonnet-4",
"fallbacks": [
"anthropic/claude-haiku-4-5"
]
}
}
}
}
社群自動路由器
如需基於訊息複雜度的更智慧路由,社群專案如 iblai-openclaw-router 和 ClawRoute 可以自動將簡單查詢路由到 Haiku,將複雜查詢路由到 Sonnet 或 Opus。
成本最佳化策略
1. 限制對話歷史
對話歷史會快速累積 token。使用 historyLimit 來限制發送的歷史訊息數量:
// ~/.openclaw/openclaw.json
{
"messages": {
"groupChat": {
"historyLimit": 10
}
},
"channels": {
"whatsapp": {
"dmHistoryLimit": 8
},
"telegram": {
"dmHistoryLimit": 8
},
"discord": {
"historyLimit": 15
}
}
}
休閒頻道(WhatsApp、Telegram)保持 8-10 則訊息,工作頻道(Discord、Slack)保持 15-20 則。這會顯著減少每次請求的輸入 token。
2. 使用 Anthropic 的 Prompt 快取
Anthropic 提供 Prompt 快取,可以大幅降低重複上下文(系統提示詞、對話前綴)的成本:
| 操作 | 成本倍數 |
|---|---|
| 快取寫入(首次請求) | 1.25x 基礎輸入價格 |
| 快取讀取(後續請求) | 0.1x 基礎輸入價格 |
首次請求後,快取內容享受 90% 折扣。如果你的系統提示詞有 1,000 個 token,發送 50 則訊息,你只需為第一則支付全價,其餘 49 則只需 10%。
當你的 API 供應商啟用了快取時,OpenClaw 會自動支援此功能。檢查你的 Anthropic 面板中的 "Cache Read Tokens" 使用量。
3. 選擇更便宜的預設模型
最簡單的最佳化:將預設模型從 Sonnet 切換到 Haiku。對於 80% 的日常互動(快速問答、查詢、提醒、閒聊),Haiku 表現同樣出色,而成本只是 Sonnet 的一小部分。
使用 modelByChannel 在特定工作頻道保留 Sonnet 或 Opus。
4. 使用模型目錄和別名
定義模型目錄以便於管理多個模型並追蹤成本:
{
"agents": {
"defaults": {
"models": {
"anthropic/claude-haiku-4-5": {
"alias": "fast",
"cost": { "input": 1.0, "output": 5.0 }
},
"anthropic/claude-sonnet-4": {
"alias": "balanced",
"cost": { "input": 3.0, "output": 15.0 }
},
"anthropic/claude-opus-4-6": {
"alias": "powerful",
"cost": { "input": 5.0, "output": 25.0 }
}
}
}
}
}
5. 對非緊急任務使用 Batch API
如果你有不緊急的工作負載,Anthropic 的 Batch API 提供輸入和輸出 token 50% 折扣:
| 模型 | 標準輸出 | Batch 輸出 |
|---|---|---|
| Claude Haiku 4.5 | $5.00/1M | $2.50/1M |
| Claude Sonnet 4 | $15.00/1M | $7.50/1M |
| Claude Opus 4.6 | $25.00/1M | $12.50/1M |
監控成本
即時使用量
# 查看當前使用量 openclaw stats # 輸出: # Today's Usage: # Input tokens: 45,230 # Output tokens: 12,450 # Estimated cost: $0.23 # # This month: # Total tokens: 1,234,567 # Estimated cost: $8.45
詳細報告
# 產生成本報告 openclaw stats --report monthly # 匯出為 CSV openclaw stats --export costs.csv --period 30d
Anthropic Console 限額
在 Anthropic Console 中直接設定月度消費上限,以防意外帳單。這是最可靠的預算控制方式 —— 達到上限後,API 將停止接受請求。
省錢配置模板
節省型配置
// 最小化成本最佳化
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-haiku-4-5"
}
}
},
"messages": {
"groupChat": {
"historyLimit": 5
}
}
}
預估成本:中等使用量約 $5-10/月
均衡型配置
// 品質與成本的良好平衡
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-sonnet-4",
"fallbacks": ["anthropic/claude-haiku-4-5"]
}
}
},
"channels": {
"modelByChannel": {
"whatsapp": { "default": "anthropic/claude-haiku-4-5" },
"telegram": { "default": "anthropic/claude-haiku-4-5" }
}
},
"messages": {
"groupChat": {
"historyLimit": 15
}
}
}
預估成本:中等使用量約 $15-25/月
品質優先型配置
// 最大化品質,成本次要
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-sonnet-4",
"fallbacks": ["anthropic/claude-opus-4-6"]
}
}
},
"channels": {
"modelByChannel": {
"discord": { "default": "anthropic/claude-opus-4-6" },
"slack": { "default": "anthropic/claude-opus-4-6" }
}
},
"messages": {
"groupChat": {
"historyLimit": 25
}
}
}
預估成本:中等使用量約 $30-50/月
多供應商配置(進階)
透過 OpenRouter 使用多個供應商來最佳化成本:
// ~/.openclaw/openclaw.json
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-sonnet-4",
"fallbacks": [
"openrouter/google/gemini-2.5-flash",
"anthropic/claude-haiku-4-5"
]
}
}
}
}
OpenClaw 使用 provider/model 格式來指定模型 ID。對於 OpenRouter 模型,使用 openrouter/author/slug 格式。
降低成本的技巧
- 提示詞要具體 - 模糊的提示詞會導致更長的回覆
- 合理使用系統提示詞 - 保持簡潔
- 按頻道限制歷史訊息 - 休閒頻道不需要 20 則訊息的上下文
- 啟用 Prompt 快取 - 重複上下文節省 90%
- 每週監控使用量 - 使用
openclaw stats及早發現意外峰值 - 測試時使用 Haiku - 正式環境再切換到 Sonnet
計算預期成本
使用以下公式:
月度成本 = (每日訊息數 × 平均輸入 Token × 輸入價格) +
(每日訊息數 × 平均輸出 Token × 輸出價格) × 30
以 Claude Sonnet 4 每天 50 則訊息為例:
- 平均輸入:800 token
- 平均輸出:400 token
輸入:50 × 800 × ($3/1M) × 30 = $3.60 輸出:50 × 400 × ($15/1M) × 30 = $9.00 總計:~$12.60/月
如果將一半訊息路由到 Haiku 4.5:
Haiku 部分:25 × 800 × ($1/1M) × 30 + 25 × 400 × ($5/1M) × 30 = $0.60 + $1.50 = $2.10 Sonnet 部分:25 × 800 × ($3/1M) × 30 + 25 × 400 × ($15/1M) × 30 = $1.80 + $4.50 = $6.30 總計:~$8.40/月
僅透過模型路由就節省了 33% —— 加上 Prompt 快取後節省更多。