性能优化10 分钟阅读

OpenClaw 模型选择和成本优化指南

比较 OpenClaw 的 AI 模型，了解定价，学习在保持高质量响应的同时优化成本的策略。

OpenClaw Guides

Tutorial Authors

2025-02-04

理解 AI 模型定价

AI 模型根据 tokens 计费 - 大约4个字符或0.75个单词的文本块。您需要为以下两项付费：

输入 tokens：您发送的文本（您的消息 + 对话历史）
输出 tokens：模型生成的文本（响应）

OpenClaw 可用模型

OpenClaw 主要支持 Anthropic 的 Claude 模型，可选支持其他提供商。

Claude 模型 (Anthropic)

| 模型 | 输入价格 | 输出价格 | 最适合 | |-------|-------------|--------------|----------| | Claude 3.5 Haiku | $0.25/1M | $1.25/1M | 快速任务、高流量 | | Claude 3.5 Sonnet | $3.00/1M | $15.00/1M | 均衡性能 | | Claude Sonnet 4 | $3.00/1M | $15.00/1M | 复杂推理 | | Claude Opus 4 | $15.00/1M | $75.00/1M | 最强能力、研究 |

价格截至2026年初。请查看 Anthropic 定价页面获取当前价格。

成本对比示例

对于一个典型对话（1,000个输入tokens和500个输出tokens）：

| 模型 | 输入成本 | 输出成本 | 总计 | |-------|------------|-------------|-------| | Claude 3.5 Haiku | $0.00025 | $0.000625 | $0.000875 | | Claude 3.5 Sonnet | $0.003 | $0.0075 | $0.0105 | | Claude Opus 4 | $0.015 | $0.0375 | $0.0525 |

Haiku 比 Sonnet 便宜12倍，比 Opus 便宜60倍！

选择正确的模型

何时使用 Claude 3.5 Haiku：

回答简单问题
快速查询和事实
高流量消息（WhatsApp、Telegram）
成本是首要考虑因素
速度比深度更重要

json

// ~/.openclaw/openclaw.json
{
  "model": {
    "default": "claude-3-5-haiku"
  }
}

何时使用 Claude 3.5 Sonnet / Sonnet 4：

需要写作协助
代码生成或审查
中等复杂度任务
质量和成本平衡
大多数日常使用场景

json

// ~/.openclaw/openclaw.json
{
  "model": {
    "default": "claude-sonnet-4"
  }
}

何时使用 Claude Opus 4：

需要复杂分析
研究和深度推理
关键业务决策
质量至上
成本不是问题

json

// ~/.openclaw/openclaw.json
{
  "model": {
    "default": "claude-opus-4"
  }
}

动态模型路由

OpenClaw 可以根据任务自动选择模型：

json

// ~/.openclaw/openclaw.json
{
  "model": {
    "routing": {
      "enabled": true,
      "rules": [
        {
          "pattern": "^(hi|hello|hey|thanks|ok|bye)",
          "model": "claude-3-5-haiku"
        },
        {
          "pattern": "(code|function|bug|error|programming)",
          "model": "claude-sonnet-4"
        },
        {
          "pattern": "(analyze deeply|complex|thorough)",
          "model": "claude-opus-4"
        },
        {
          "pattern": ".*",
          "model": "claude-3-5-sonnet"
        }
      ]
    }
  }
}

成本优化策略

1. 减少上下文长度

对话历史会快速累积。限制发送的数量：

json

// ~/.openclaw/openclaw.json
{
  "model": {
    "context": {
      "maxMessages": 10,
      "maxContextTokens": 4000,
      "summarizeOldMessages": true,
      "summaryThreshold": 20
    }
  }
}

2. 启用响应缓存

缓存相同的查询以避免重复的 API 调用：

json

// ~/.openclaw/openclaw.json
{
  "gateway": {
    "caching": {
      "enabled": true,
      "ttl": 3600,
      "maxSize": 1000
    }
  }
}

3. 设置 Token 限制

防止意外过长（昂贵）的响应：

json

// ~/.openclaw/openclaw.json
{
  "model": {
    "maxOutputTokens": 1024,
    "channelLimits": {
      "whatsapp": 500,
      "discord": 1500,
      "telegram": 800
    }
  }
}

4. 实施使用配额

设置每日/每月消费限制：

json

// ~/.openclaw/openclaw.json
{
  "model": {
    "quotas": {
      "daily": {
        "enabled": true,
        "maxTokens": 100000,
        "maxCost": 1.00,
        "warningThreshold": 0.80
      },
      "monthly": {
        "enabled": true,
        "maxCost": 20.00
      }
    }
  }
}

5. 使用提示压缩

通过更智能的提示减少输入 tokens：

json

// ~/.openclaw/openclaw.json
{
  "model": {
    "optimization": {
      "compressPrompts": true,
      "compactSystemPrompt": true,
      "deltaContext": true
    }
  }
}

监控成本

实时使用情况

bash

# 查看当前使用情况
openclaw stats

# 输出：
# 今日使用：
#   输入 tokens:  45,230
#   输出 tokens: 12,450
#   预估成本: $0.23
#
# 本月：
#   总 tokens: 1,234,567
#   预估成本: $8.45

详细报告

bash

# 生成成本报告
openclaw stats --report monthly

# 导出为 CSV
openclaw stats --export costs.csv --period 30d

设置告警

json

// ~/.openclaw/openclaw.json
{
  "notifications": {
    "costAlerts": {
      "enabled": true,
      "thresholds": [
        { "amount": 5.00, "action": "notify" },
        { "amount": 10.00, "action": "warn" },
        { "amount": 20.00, "action": "pause" }
      ]
    }
  }
}

节省成本的配置模板

预算优先配置

json

// 针对最低成本优化
{
  "model": {
    "default": "claude-3-5-haiku",
    "maxOutputTokens": 512,
    "context": {
      "maxMessages": 5,
      "maxContextTokens": 2000
    },
    "quotas": {
      "daily": {
        "enabled": true,
        "maxCost": 0.50
      }
    }
  },
  "gateway": {
    "caching": {
      "enabled": true,
      "ttl": 7200
    }
  }
}

预估成本：中等使用量约 $5-10/月

均衡配置

json

// 质量和成本的良好平衡
{
  "model": {
    "default": "claude-3-5-sonnet",
    "maxOutputTokens": 1024,
    "context": {
      "maxMessages": 15,
      "maxContextTokens": 4000,
      "summarizeOldMessages": true
    },
    "routing": {
      "enabled": true,
      "rules": [
        { "pattern": "^(hi|hello|thanks|bye|ok)", "model": "claude-3-5-haiku" },
        { "pattern": ".*", "model": "claude-3-5-sonnet" }
      ]
    }
  },
  "gateway": {
    "caching": {
      "enabled": true,
      "ttl": 3600
    }
  }
}

预估成本：中等使用量约 $15-30/月

质量优先配置

json

// 最高质量，成本次要
{
  "model": {
    "default": "claude-sonnet-4",
    "maxOutputTokens": 4096,
    "context": {
      "maxMessages": 30,
      "maxContextTokens": 16000
    },
    "routing": {
      "enabled": true,
      "rules": [
        { "pattern": "(analyze|research|complex|detailed)", "model": "claude-opus-4" },
        { "pattern": ".*", "model": "claude-sonnet-4" }
      ]
    }
  }
}

预估成本：中等使用量约 $50-100/月

多提供商设置（高级）

使用多个提供商优化成本：

json

// ~/.openclaw/openclaw.json
{
  "providers": {
    "anthropic": {
      "apiKey": "${ANTHROPIC_API_KEY}",
      "models": ["claude-3-5-haiku", "claude-sonnet-4"]
    },
    "openai": {
      "apiKey": "${OPENAI_API_KEY}",
      "models": ["gpt-4o-mini"]
    }
  },
  "model": {
    "routing": {
      "enabled": true,
      "rules": [
        { "pattern": "^(hi|hello|what time)", "provider": "openai", "model": "gpt-4o-mini" },
        { "pattern": ".*", "provider": "anthropic", "model": "claude-3-5-sonnet" }
      ]
    }
  }
}

降低成本的技巧

具体化提示 - 模糊的提示导致更长的响应
明智使用系统提示 - 保持简洁
定期清除上下文 - 不要让历史无限增长
缓存常见查询 - FAQ、问候等
每周监控使用 - 及早发现意外峰值
测试时使用 Haiku - 生产时切换到 Sonnet

计算预期成本

使用此公式：

月度成本 = (每日消息数 × 平均输入Tokens × 输入价格) +
           (每日消息数 × 平均输出Tokens × 输出价格) × 30

使用 Claude 3.5 Sonnet 每天50条消息的示例：

平均输入：800 tokens
平均输出：400 tokens

输入：50 × 800 × ($3/1M) × 30 = $3.60
输出：50 × 400 × ($15/1M) × 30 = $9.00
总计：约 $12.60/月

理解 AI 模型定价

OpenClaw 可用模型

Claude 模型 (Anthropic)

成本对比示例

选择正确的模型

何时使用 Claude 3.5 Haiku：

何时使用 Claude 3.5 Sonnet / Sonnet 4：

何时使用 Claude Opus 4：

动态模型路由

成本优化策略

1. 减少上下文长度

2. 启用响应缓存

3. 设置 Token 限制

4. 实施使用配额

5. 使用提示压缩

监控成本

实时使用情况

详细报告

设置告警

节省成本的配置模板

预算优先配置

均衡配置

质量优先配置

多提供商设置（高级）

降低成本的技巧

计算预期成本

后续步骤