OpenClaw モデル選択とコスト最適化ガイド
OpenClaw の AI モデルを比較し、価格を理解し、品質の高い応答を維持しながらコストを最適化する戦略を学びます。
OpenClaw Guides
Tutorial Authors
AI モデルの価格を理解する
AI モデルは トークン に基づいて課金されます — 約4文字または0.75語のテキストチャンクです。以下の両方に対して支払います:
- 入力トークン:送信するテキスト(メッセージ + 会話履歴)
- 出力トークン:モデルが生成するテキスト(応答)
OpenClaw で利用可能なモデル
OpenClaw は Anthropic の Claude モデルをサポートし、OpenRouter 経由で他のプロバイダーもサポートします。最もよく使われるモデルは以下の通りです:
Claude モデル (Anthropic)
| モデル | 入力価格 | 出力価格 | 最適な用途 |
|---|---|---|---|
| Claude Haiku 4.5 | $1.00/1M | $5.00/1M | 高速タスク、大量処理 |
| Claude Sonnet 4 | $3.00/1M | $15.00/1M | バランスの取れたパフォーマンス |
| Claude Sonnet 4.5 | $3.00/1M | $15.00/1M | 強化された推論 |
| Claude Opus 4.6 | $5.00/1M | $25.00/1M | 最高性能、研究 |
価格は2026年初頭時点。現在の料金は Anthropic の価格ページ をご確認ください。
コスト比較例
1,000入力トークンと500出力トークンの典型的な会話の場合:
| モデル | 入力コスト | 出力コスト | 合計 |
|---|---|---|---|
| Claude Haiku 4.5 | $0.001 | $0.0025 | $0.0035 |
| Claude Sonnet 4 | $0.003 | $0.0075 | $0.0105 |
| Claude Opus 4.6 | $0.005 | $0.0125 | $0.0175 |
Haiku は Sonnet の3分の1、Opus の5分の1のコスト!
適切なモデルの選択
Claude Haiku 4.5 を使用する場合:
- シンプルな質問への回答
- クイック検索と事実確認
- 大量のメッセージング(WhatsApp、Telegram)
- コストが最優先事項
- 深さよりも速度が重要
~/.openclaw/openclaw.json でデフォルトモデルとして設定:
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-haiku-4-5"
}
}
}
}
Claude Sonnet 4 / 4.5 を使用する場合:
- 文章作成の支援が必要
- コード生成またはレビュー
- 中程度の複雑さのタスク
- 品質とコストのバランス
- ほとんどの日常的なユースケース
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-sonnet-4"
}
}
}
}
Claude Opus 4.6 を使用する場合:
- 複雑な分析が必要
- 研究と深い推論
- 重要なビジネス決定
- 品質が最優先
- コストは問題ではない
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-opus-4-6"
}
}
}
}
チャネル別モデルルーティング
OpenClaw では modelByChannel を使用してチャネルごとに異なるモデルを割り当てることができます。これはコスト最適化の最も効果的な方法です — カジュアルなチャネルには安価なモデルを、仕事用にはより高性能なモデルを使用します:
// ~/.openclaw/openclaw.json
{
"channels": {
"modelByChannel": {
"whatsapp": {
"default": "anthropic/claude-haiku-4-5"
},
"telegram": {
"default": "anthropic/claude-haiku-4-5"
},
"discord": {
"default": "anthropic/claude-sonnet-4"
},
"slack": {
"default": "anthropic/claude-sonnet-4"
}
}
}
}
モデルフェイルオーバー も設定できます — プライマリモデルが利用できない場合、OpenClaw はフォールバックモデルを順番に試します:
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-sonnet-4",
"fallbacks": [
"anthropic/claude-haiku-4-5"
]
}
}
}
}
コミュニティ自動ルーター
メッセージの複雑さに基づいたよりスマートなルーティングには、iblai-openclaw-router や ClawRoute などのコミュニティプロジェクトが、シンプルなクエリを Haiku に、複雑なものを Sonnet や Opus に自動的にルーティングできます。
コスト最適化戦略
1. 会話履歴を制限する
会話履歴は急速に蓄積されます。historyLimit を使用して送信量を制限しましょう:
// ~/.openclaw/openclaw.json
{
"messages": {
"groupChat": {
"historyLimit": 10
}
},
"channels": {
"whatsapp": {
"dmHistoryLimit": 8
},
"telegram": {
"dmHistoryLimit": 8
},
"discord": {
"historyLimit": 15
}
}
}
カジュアルなチャネル(WhatsApp、Telegram)は8〜10メッセージ、仕事用チャネル(Discord、Slack)は15〜20に保ちましょう。これによりリクエストあたりの入力トークンが大幅に削減されます。
2. Anthropic のプロンプトキャッシュを活用する
Anthropic は、繰り返しのコンテキスト(システムプロンプト、会話プレフィックス)のコストを劇的に削減する プロンプトキャッシュ を提供しています:
| 操作 | コスト倍率 |
|---|---|
| キャッシュ書き込み(初回リクエスト) | 基本入力価格の1.25倍 |
| キャッシュ読み取り(後続) | 基本入力価格の0.1倍 |
初回リクエスト後、キャッシュされたコンテンツに対して 90% 割引 になります。システムプロンプトが1,000トークンで50メッセージを送信する場合、フル価格を1回支払い、残り49回は10%で済みます。
OpenClaw は API プロバイダーでキャッシュが有効な場合にこれをサポートします。Anthropic ダッシュボードで使用量の「cache read tokens」を確認してください。
3. より安価なデフォルトモデルを選ぶ
最もシンプルな最適化:ほとんどのユースケースでデフォルトを Sonnet から Haiku に切り替えます。日常的なやり取りの80%(簡単なQ&A、検索、リマインダー、カジュアルな会話)では、Haiku はコストの何分の一かで同様のパフォーマンスを発揮します。
品質が最も重要な特定の仕事用チャネルには modelByChannel で Sonnet や Opus を維持しましょう。
4. エイリアス付きモデルカタログを使用する
複数のモデルを簡単に管理し、コストを追跡するためにモデルカタログを定義します:
{
"agents": {
"defaults": {
"models": {
"anthropic/claude-haiku-4-5": {
"alias": "fast",
"cost": { "input": 1.0, "output": 5.0 }
},
"anthropic/claude-sonnet-4": {
"alias": "balanced",
"cost": { "input": 3.0, "output": 15.0 }
},
"anthropic/claude-opus-4-6": {
"alias": "powerful",
"cost": { "input": 5.0, "output": 25.0 }
}
}
}
}
}
5. 緊急でないタスクにはバッチ API を使用する
時間に敏感でないワークロードがある場合、Anthropic の バッチ API は入力・出力トークンの両方で 50% 割引 を提供します:
| モデル | 標準出力 | バッチ出力 |
|---|---|---|
| Claude Haiku 4.5 | $5.00/1M | $2.50/1M |
| Claude Sonnet 4 | $15.00/1M | $7.50/1M |
| Claude Opus 4.6 | $25.00/1M | $12.50/1M |
コストの監視
リアルタイム使用量
# 現在の使用量を表示 openclaw stats # 出力: # Today's Usage: # Input tokens: 45,230 # Output tokens: 12,450 # Estimated cost: $0.23 # # This month: # Total tokens: 1,234,567 # Estimated cost: $8.45
詳細レポート
# コストレポートを生成 openclaw stats --report monthly # CSV にエクスポート openclaw stats --export costs.csv --period 30d
Anthropic コンソールの制限
Anthropic コンソール で月間支出上限を直接設定し、予想外の請求を防ぎましょう。これは予算を強制する最も信頼できる方法です — 上限に達すると、API はリクエストの受付を停止します。
コスト節約設定テンプレート
予算重視の設定
// 最小コストに最適化
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-haiku-4-5"
}
}
},
"messages": {
"groupChat": {
"historyLimit": 5
}
}
}
推定コスト:中程度の使用で月額約 $5-10
バランスの取れた設定
// 品質とコストの良いバランス
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-sonnet-4",
"fallbacks": ["anthropic/claude-haiku-4-5"]
}
}
},
"channels": {
"modelByChannel": {
"whatsapp": { "default": "anthropic/claude-haiku-4-5" },
"telegram": { "default": "anthropic/claude-haiku-4-5" }
}
},
"messages": {
"groupChat": {
"historyLimit": 15
}
}
}
推定コスト:中程度の使用で月額約 $15-25
品質重視の設定
// 最高品質、コストは二の次
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-sonnet-4",
"fallbacks": ["anthropic/claude-opus-4-6"]
}
}
},
"channels": {
"modelByChannel": {
"discord": { "default": "anthropic/claude-opus-4-6" },
"slack": { "default": "anthropic/claude-opus-4-6" }
}
},
"messages": {
"groupChat": {
"historyLimit": 25
}
}
}
推定コスト:中程度の使用で月額約 $30-50
マルチプロバイダー設定(上級)
OpenRouter 経由で複数のプロバイダーを使用してコストを最適化:
// ~/.openclaw/openclaw.json
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-sonnet-4",
"fallbacks": [
"openrouter/google/gemini-2.5-flash",
"anthropic/claude-haiku-4-5"
]
}
}
}
}
OpenClaw はモデル ID に provider/model 形式を使用します。OpenRouter モデルの場合は openrouter/author/slug 形式を使用します。
コスト削減のヒント
- プロンプトを具体的に — 曖昧なプロンプトは長い応答につながる
- システムプロンプトを賢く使用 — 簡潔に保つ
- チャネルごとに履歴を制限 — カジュアルなチャネルには20メッセージのコンテキストは不要
- プロンプトキャッシュを有効化 — 繰り返しコンテキストで90%の節約
- 毎週使用量を監視 —
openclaw statsで予期しないスパイクを早期に発見 - テストには Haiku を使用 — 本番では Sonnet に切り替え
予想コストの計算
この公式を使用:
月額コスト = (日次メッセージ数 × 平均入力トークン × 入力価格) +
(日次メッセージ数 × 平均出力トークン × 出力価格) × 30
Claude Sonnet 4 で1日50メッセージの例:
- 平均入力:800トークン
- 平均出力:400トークン
入力:50 × 800 × ($3/1M) × 30 = $3.60 出力:50 × 400 × ($15/1M) × 30 = $9.00 合計:約 $12.60/月
メッセージの半分を Haiku 4.5 にルーティングした場合:
Haiku 分:25 × 800 × ($1/1M) × 30 + 25 × 400 × ($5/1M) × 30 = $0.60 + $1.50 = $2.10 Sonnet 分:25 × 800 × ($3/1M) × 30 + 25 × 400 × ($15/1M) × 30 = $1.80 + $4.50 = $6.30 合計:約 $8.40/月
モデルルーティングだけで33%の節約 — さらにプロンプトキャッシュを組み合わせればもっと節約できます。