Guia de Seleção de Modelo e Otimização de Custos do OpenClaw
Compare modelos de IA para o OpenClaw, entenda os preços e aprenda estratégias para otimizar custos mantendo respostas de qualidade.
OpenClaw Guides
Tutorial Authors
Entendendo os Preços dos Modelos de IA
Os modelos de IA cobram com base em tokens — blocos de texto que são aproximadamente 4 caracteres ou 0,75 palavras. Você paga por ambos:
- Tokens de entrada: O texto que você envia (sua mensagem + histórico de conversa)
- Tokens de saída: O texto que o modelo gera (respostas)
Modelos Disponíveis no OpenClaw
O OpenClaw suporta os modelos Claude da Anthropic e outros provedores via OpenRouter. Aqui estão os modelos mais utilizados:
Modelos Claude (Anthropic)
| Modelo | Preço Entrada | Preço Saída | Melhor Para |
|---|---|---|---|
| Claude Haiku 4.5 | $1,00/1M | $5,00/1M | Tarefas rápidas, alto volume |
| Claude Sonnet 4 | $3,00/1M | $15,00/1M | Desempenho equilibrado |
| Claude Sonnet 4.5 | $3,00/1M | $15,00/1M | Raciocínio aprimorado |
| Claude Opus 4.6 | $5,00/1M | $25,00/1M | Mais capaz, pesquisa |
Preços de início de 2026. Consulte a página de preços da Anthropic para taxas atuais.
Exemplo de Comparação de Custos
Para uma conversa típica com 1.000 tokens de entrada e 500 tokens de saída:
| Modelo | Custo Entrada | Custo Saída | Total |
|---|---|---|---|
| Claude Haiku 4.5 | $0,001 | $0,0025 | $0,0035 |
| Claude Sonnet 4 | $0,003 | $0,0075 | $0,0105 |
| Claude Opus 4.6 | $0,005 | $0,0125 | $0,0175 |
Haiku é 3x mais barato que o Sonnet e 5x mais barato que o Opus!
Escolhendo o Modelo Certo
Use Claude Haiku 4.5 Quando:
- Respondendo perguntas simples
- Consultas rápidas e fatos
- Mensagens de alto volume (WhatsApp, Telegram)
- Custo é uma preocupação principal
- Velocidade importa mais que profundidade
Defina como seu modelo padrão em ~/.openclaw/openclaw.json:
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-haiku-4-5"
}
}
}
}
Use Claude Sonnet 4 / 4.5 Quando:
- Assistência de escrita é necessária
- Geração ou revisão de código
- Tarefas de complexidade moderada
- Equilíbrio entre qualidade e custo
- A maioria dos casos de uso do dia a dia
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-sonnet-4"
}
}
}
}
Use Claude Opus 4.6 Quando:
- Análise complexa é necessária
- Pesquisa e raciocínio profundo
- Decisões críticas de negócios
- Qualidade é primordial
- Custo não é uma preocupação
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-opus-4-6"
}
}
}
}
Roteamento de Modelo por Canal
O OpenClaw permite atribuir diferentes modelos a diferentes canais usando modelByChannel. Esta é a forma mais eficaz de otimizar custos — use um modelo mais barato para canais casuais e um mais capaz para trabalho:
// ~/.openclaw/openclaw.json
{
"channels": {
"modelByChannel": {
"whatsapp": {
"default": "anthropic/claude-haiku-4-5"
},
"telegram": {
"default": "anthropic/claude-haiku-4-5"
},
"discord": {
"default": "anthropic/claude-sonnet-4"
},
"slack": {
"default": "anthropic/claude-sonnet-4"
}
}
}
}
Você também pode configurar failover de modelo — se o modelo principal estiver indisponível, o OpenClaw tentará os modelos de fallback em ordem:
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-sonnet-4",
"fallbacks": [
"anthropic/claude-haiku-4-5"
]
}
}
}
}
Auto-Roteadores da Comunidade
Para roteamento ainda mais inteligente baseado na complexidade da mensagem, projetos da comunidade como iblai-openclaw-router e ClawRoute podem rotear automaticamente consultas simples para Haiku e complexas para Sonnet ou Opus.
Estratégias de Otimização de Custos
1. Limitar o Histórico de Conversas
O histórico de conversas acumula rapidamente. Limite quanto é enviado usando historyLimit:
// ~/.openclaw/openclaw.json
{
"messages": {
"groupChat": {
"historyLimit": 10
}
},
"channels": {
"whatsapp": {
"dmHistoryLimit": 8
},
"telegram": {
"dmHistoryLimit": 8
},
"discord": {
"historyLimit": 15
}
}
}
Mantenha canais casuais (WhatsApp, Telegram) em 8-10 mensagens e canais de trabalho (Discord, Slack) em 15-20. Isso reduz significativamente os tokens de entrada por requisição.
2. Usar o Cache de Prompts da Anthropic
A Anthropic oferece cache de prompts que reduz drasticamente os custos para contexto repetido (prompts de sistema, prefixos de conversa):
| Operação | Multiplicador de Custo |
|---|---|
| Escrita em cache (primeira requisição) | 1,25x preço base de entrada |
| Leitura do cache (subsequentes) | 0,1x preço base de entrada |
Isso é um desconto de 90% no conteúdo em cache após a primeira requisição. Se seu prompt de sistema tem 1.000 tokens e você envia 50 mensagens, você paga preço cheio uma vez e 10% nas outras 49.
O OpenClaw suporta isso quando seu provedor de API tem cache habilitado. Verifique os "cache read tokens" no seu painel da Anthropic.
3. Escolher um Modelo Padrão Mais Barato
A otimização mais simples: mude seu padrão de Sonnet para Haiku na maioria dos casos de uso. Para 80% das interações diárias (perguntas rápidas, buscas, lembretes, conversa casual), Haiku funciona igualmente bem por uma fração do custo.
Use modelByChannel para manter Sonnet ou Opus em canais de trabalho específicos onde a qualidade é mais importante.
4. Usar Catálogo de Modelos com Aliases
Defina um catálogo de modelos para gerenciar múltiplos modelos facilmente e acompanhar custos:
{
"agents": {
"defaults": {
"models": {
"anthropic/claude-haiku-4-5": {
"alias": "fast",
"cost": { "input": 1.0, "output": 5.0 }
},
"anthropic/claude-sonnet-4": {
"alias": "balanced",
"cost": { "input": 3.0, "output": 15.0 }
},
"anthropic/claude-opus-4-6": {
"alias": "powerful",
"cost": { "input": 5.0, "output": 25.0 }
}
}
}
}
}
5. Usar API de Lotes para Tarefas Não Urgentes
Se você tem cargas de trabalho que não são sensíveis ao tempo, a API de Lotes da Anthropic oferece um desconto de 50% tanto em tokens de entrada quanto de saída:
| Modelo | Saída Padrão | Saída em Lote |
|---|---|---|
| Claude Haiku 4.5 | $5,00/1M | $2,50/1M |
| Claude Sonnet 4 | $15,00/1M | $7,50/1M |
| Claude Opus 4.6 | $25,00/1M | $12,50/1M |
Monitorando Custos
Uso em Tempo Real
# Ver uso atual openclaw stats # Saída: # Today's Usage: # Input tokens: 45,230 # Output tokens: 12,450 # Estimated cost: $0.23 # # This month: # Total tokens: 1,234,567 # Estimated cost: $8.45
Relatórios Detalhados
# Gerar relatório de custos openclaw stats --report monthly # Exportar para CSV openclaw stats --export costs.csv --period 30d
Limites do Console da Anthropic
Defina limites de gastos mensais diretamente no Console da Anthropic para evitar faturas inesperadas. Este é o método mais confiável para impor um orçamento — se você atingir o limite, a API para de aceitar requisições.
Templates de Configuração para Economia
Configuração Econômica
// Otimizado para custo mínimo
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-haiku-4-5"
}
}
},
"messages": {
"groupChat": {
"historyLimit": 5
}
}
}
Custo estimado: ~$5-10/mês com uso moderado
Configuração Equilibrada
// Bom equilíbrio entre qualidade e custo
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-sonnet-4",
"fallbacks": ["anthropic/claude-haiku-4-5"]
}
}
},
"channels": {
"modelByChannel": {
"whatsapp": { "default": "anthropic/claude-haiku-4-5" },
"telegram": { "default": "anthropic/claude-haiku-4-5" }
}
},
"messages": {
"groupChat": {
"historyLimit": 15
}
}
}
Custo estimado: ~$15-25/mês com uso moderado
Configuração Focada em Qualidade
// Máxima qualidade, custo secundário
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-sonnet-4",
"fallbacks": ["anthropic/claude-opus-4-6"]
}
}
},
"channels": {
"modelByChannel": {
"discord": { "default": "anthropic/claude-opus-4-6" },
"slack": { "default": "anthropic/claude-opus-4-6" }
}
},
"messages": {
"groupChat": {
"historyLimit": 25
}
}
}
Custo estimado: ~$30-50/mês com uso moderado
Configuração Multi-Provedor (Avançado)
Use múltiplos provedores via OpenRouter para otimizar custos:
// ~/.openclaw/openclaw.json
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-sonnet-4",
"fallbacks": [
"openrouter/google/gemini-2.5-flash",
"anthropic/claude-haiku-4-5"
]
}
}
}
}
O OpenClaw usa o formato provider/model para IDs de modelo. Para modelos OpenRouter, use o formato openrouter/author/slug.
Dicas para Reduzir Custos
- Seja específico nos prompts — Prompts vagos levam a respostas mais longas
- Use prompts de sistema sabiamente — Mantenha-os concisos
- Limite o histórico por canal — Canais casuais não precisam de 20 mensagens de contexto
- Habilite o cache de prompts — 90% de economia em contexto repetido
- Monitore o uso semanalmente — Detecte picos inesperados cedo com
openclaw stats - Use Haiku para testes — Mude para Sonnet em produção
Calculando Seus Custos Esperados
Use esta fórmula:
Custo Mensal = (Mensagens Diárias × Média Tokens Entrada × Preço Entrada) +
(Mensagens Diárias × Média Tokens Saída × Preço Saída) × 30
Exemplo para 50 mensagens/dia com Claude Sonnet 4:
- Média entrada: 800 tokens
- Média saída: 400 tokens
Entrada: 50 × 800 × ($3/1M) × 30 = $3,60 Saída: 50 × 400 × ($15/1M) × 30 = $9,00 Total: ~$12,60/mês
Com metade das suas mensagens roteadas para Haiku 4.5:
Porção Haiku: 25 × 800 × ($1/1M) × 30 + 25 × 400 × ($5/1M) × 30 = $0,60 + $1,50 = $2,10 Porção Sonnet: 25 × 800 × ($3/1M) × 30 + 25 × 400 × ($15/1M) × 30 = $1,80 + $4,50 = $6,30 Total: ~$8,40/mês
Isso é 33% de economia só com roteamento de modelos — e ainda mais com cache de prompts por cima.