Guia de Selecao de Modelo e Otimizacao de Custos do OpenClaw
Compare modelos de IA para o OpenClaw, entenda os precos e aprenda estrategias para otimizar custos mantendo respostas de qualidade.
OpenClaw Guides
Tutorial Authors
Entendendo os Precos dos Modelos de IA
Os modelos de IA cobram com base em tokens - blocos de texto que sao aproximadamente 4 caracteres ou 0,75 palavras. Voce paga por ambos:
- Tokens de entrada: O texto que voce envia (sua mensagem + historico de conversa)
- Tokens de saida: O texto que o modelo gera (respostas)
Modelos Disponiveis no OpenClaw
O OpenClaw suporta principalmente os modelos Claude da Anthropic, com suporte opcional para outros provedores.
Modelos Claude (Anthropic)
| Modelo | Preco Entrada | Preco Saida | Melhor Para | |-------|-------------|--------------|----------| | Claude 3.5 Haiku | $0,25/1M | $1,25/1M | Tarefas rapidas, alto volume | | Claude 3.5 Sonnet | $3,00/1M | $15,00/1M | Desempenho equilibrado | | Claude Sonnet 4 | $3,00/1M | $15,00/1M | Raciocinio complexo | | Claude Opus 4 | $15,00/1M | $75,00/1M | Mais capaz, pesquisa |
Precos de inicio de 2026. Consulte a pagina de precos da Anthropic para taxas atuais.
Exemplo de Comparacao de Custos
Para uma conversa tipica com 1.000 tokens de entrada e 500 tokens de saida:
| Modelo | Custo Entrada | Custo Saida | Total | |-------|------------|-------------|-------| | Claude 3.5 Haiku | $0,00025 | $0,000625 | $0,000875 | | Claude 3.5 Sonnet | $0,003 | $0,0075 | $0,0105 | | Claude Opus 4 | $0,015 | $0,0375 | $0,0525 |
Haiku e 12x mais barato que o Sonnet e 60x mais barato que o Opus!
Escolhendo o Modelo Certo
Use Claude 3.5 Haiku Quando:
- Respondendo perguntas simples
- Consultas rapidas e fatos
- Mensagens de alto volume (WhatsApp, Telegram)
- Custo e uma preocupacao principal
- Velocidade importa mais que profundidade
// ~/.openclaw/openclaw.json
{
"model": {
"default": "claude-3-5-haiku"
}
}
Use Claude 3.5 Sonnet / Sonnet 4 Quando:
- Assistencia de escrita e necessaria
- Geracao ou revisao de codigo
- Tarefas de complexidade moderada
- Equilibrio entre qualidade e custo
- A maioria dos casos de uso do dia a dia
// ~/.openclaw/openclaw.json
{
"model": {
"default": "claude-sonnet-4"
}
}
Use Claude Opus 4 Quando:
- Analise complexa e necessaria
- Pesquisa e raciocinio profundo
- Decisoes criticas de negocios
- Qualidade e primordial
- Custo nao e uma preocupacao
// ~/.openclaw/openclaw.json
{
"model": {
"default": "claude-opus-4"
}
}
Roteamento Dinamico de Modelos
O OpenClaw pode selecionar automaticamente modelos com base na tarefa:
// ~/.openclaw/openclaw.json
{
"model": {
"routing": {
"enabled": true,
"rules": [
{
"pattern": "^(oi|ola|hey|obrigado|ok|tchau)",
"model": "claude-3-5-haiku"
},
{
"pattern": "(codigo|funcao|bug|erro|programacao)",
"model": "claude-sonnet-4"
},
{
"pattern": "(analisar profundamente|complexo|detalhado)",
"model": "claude-opus-4"
},
{
"pattern": ".*",
"model": "claude-3-5-sonnet"
}
]
}
}
}
Estrategias de Otimizacao de Custos
1. Reduza o Comprimento do Contexto
O historico de conversa acumula rapidamente. Limite quanto e enviado:
// ~/.openclaw/openclaw.json
{
"model": {
"context": {
"maxMessages": 10,
"maxContextTokens": 4000,
"summarizeOldMessages": true,
"summaryThreshold": 20
}
}
}
2. Ative o Cache de Respostas
Armazene em cache consultas identicas para evitar chamadas de API repetidas:
// ~/.openclaw/openclaw.json
{
"gateway": {
"caching": {
"enabled": true,
"ttl": 3600,
"maxSize": 1000
}
}
}
3. Defina Limites de Tokens
Previna respostas inesperadamente longas (caras):
// ~/.openclaw/openclaw.json
{
"model": {
"maxOutputTokens": 1024,
"channelLimits": {
"whatsapp": 500,
"discord": 1500,
"telegram": 800
}
}
}
4. Implemente Cotas de Uso
Defina limites de gastos diarios/mensais:
// ~/.openclaw/openclaw.json
{
"model": {
"quotas": {
"daily": {
"enabled": true,
"maxTokens": 100000,
"maxCost": 1.00,
"warningThreshold": 0.80
},
"monthly": {
"enabled": true,
"maxCost": 20.00
}
}
}
}
5. Use Compressao de Prompts
Reduza tokens de entrada com prompts mais inteligentes:
// ~/.openclaw/openclaw.json
{
"model": {
"optimization": {
"compressPrompts": true,
"compactSystemPrompt": true,
"deltaContext": true
}
}
}
Monitorando Custos
Uso em Tempo Real
# Ver uso atual openclaw stats # Saida: # Uso de hoje: # Tokens de entrada: 45.230 # Tokens de saida: 12.450 # Custo estimado: $0,23 # # Este mes: # Total de tokens: 1.234.567 # Custo estimado: $8,45
Relatorios Detalhados
# Gerar relatorio de custos openclaw stats --report monthly # Exportar para CSV openclaw stats --export custos.csv --period 30d
Configurar Alertas
// ~/.openclaw/openclaw.json
{
"notifications": {
"costAlerts": {
"enabled": true,
"thresholds": [
{ "amount": 5.00, "action": "notify" },
{ "amount": 10.00, "action": "warn" },
{ "amount": 20.00, "action": "pause" }
]
}
}
}
Templates de Configuracao para Economia
Configuracao Economica
// Otimizado para custo minimo
{
"model": {
"default": "claude-3-5-haiku",
"maxOutputTokens": 512,
"context": {
"maxMessages": 5,
"maxContextTokens": 2000
},
"quotas": {
"daily": {
"enabled": true,
"maxCost": 0.50
}
}
},
"gateway": {
"caching": {
"enabled": true,
"ttl": 7200
}
}
}
Custo estimado: ~$5-10/mes com uso moderado
Configuracao Equilibrada
// Bom equilibrio entre qualidade e custo
{
"model": {
"default": "claude-3-5-sonnet",
"maxOutputTokens": 1024,
"context": {
"maxMessages": 15,
"maxContextTokens": 4000,
"summarizeOldMessages": true
},
"routing": {
"enabled": true,
"rules": [
{ "pattern": "^(oi|ola|obrigado|tchau|ok)", "model": "claude-3-5-haiku" },
{ "pattern": ".*", "model": "claude-3-5-sonnet" }
]
}
},
"gateway": {
"caching": {
"enabled": true,
"ttl": 3600
}
}
}
Custo estimado: ~$15-30/mes com uso moderado
Configuracao Focada em Qualidade
// Maxima qualidade, custo secundario
{
"model": {
"default": "claude-sonnet-4",
"maxOutputTokens": 4096,
"context": {
"maxMessages": 30,
"maxContextTokens": 16000
},
"routing": {
"enabled": true,
"rules": [
{ "pattern": "(analisar|pesquisar|complexo|detalhado)", "model": "claude-opus-4" },
{ "pattern": ".*", "model": "claude-sonnet-4" }
]
}
}
}
Custo estimado: ~$50-100/mes com uso moderado
Configuracao Multi-Provedor (Avancado)
Use multiplos provedores para otimizar custos:
// ~/.openclaw/openclaw.json
{
"providers": {
"anthropic": {
"apiKey": "${ANTHROPIC_API_KEY}",
"models": ["claude-3-5-haiku", "claude-sonnet-4"]
},
"openai": {
"apiKey": "${OPENAI_API_KEY}",
"models": ["gpt-4o-mini"]
}
},
"model": {
"routing": {
"enabled": true,
"rules": [
{ "pattern": "^(oi|ola|que horas)", "provider": "openai", "model": "gpt-4o-mini" },
{ "pattern": ".*", "provider": "anthropic", "model": "claude-3-5-sonnet" }
]
}
}
}
Dicas para Reduzir Custos
- Seja especifico nos prompts - Prompts vagos levam a respostas mais longas
- Use prompts de sistema sabiamente - Mantenha-os concisos
- Limpe o contexto periodicamente - Nao deixe o historico crescer sem limites
- Armazene em cache consultas comuns - FAQs, saudacoes, etc.
- Monitore o uso semanalmente - Detecte picos inesperados cedo
- Use Haiku para testes - Mude para Sonnet em producao
Calculando Seus Custos Esperados
Use esta formula:
Custo Mensal = (Mensagens Diarias × Media Tokens Entrada × Preco Entrada) +
(Mensagens Diarias × Media Tokens Saida × Preco Saida) × 30
Exemplo para 50 mensagens/dia com Claude 3.5 Sonnet:
- Media entrada: 800 tokens
- Media saida: 400 tokens
Entrada: 50 × 800 × ($3/1M) × 30 = $3,60 Saida: 50 × 400 × ($15/1M) × 30 = $9,00 Total: ~$12,60/mes