OpenClaw
Otimização10 min de leitura

Guia de Seleção de Modelo e Otimização de Custos do OpenClaw

Compare modelos de IA para o OpenClaw, entenda os preços e aprenda estratégias para otimizar custos mantendo respostas de qualidade.

O

OpenClaw Guides

Tutorial Authors

Entendendo os Preços dos Modelos de IA

Os modelos de IA cobram com base em tokens — blocos de texto que são aproximadamente 4 caracteres ou 0,75 palavras. Você paga por ambos:

  • Tokens de entrada: O texto que você envia (sua mensagem + histórico de conversa)
  • Tokens de saída: O texto que o modelo gera (respostas)

Modelos Disponíveis no OpenClaw

O OpenClaw suporta os modelos Claude da Anthropic e outros provedores via OpenRouter. Aqui estão os modelos mais utilizados:

Modelos Claude (Anthropic)

ModeloPreço EntradaPreço SaídaMelhor Para
Claude Haiku 4.5$1,00/1M$5,00/1MTarefas rápidas, alto volume
Claude Sonnet 4$3,00/1M$15,00/1MDesempenho equilibrado
Claude Sonnet 4.5$3,00/1M$15,00/1MRaciocínio aprimorado
Claude Opus 4.6$5,00/1M$25,00/1MMais capaz, pesquisa

Preços de início de 2026. Consulte a página de preços da Anthropic para taxas atuais.

Exemplo de Comparação de Custos

Para uma conversa típica com 1.000 tokens de entrada e 500 tokens de saída:

ModeloCusto EntradaCusto SaídaTotal
Claude Haiku 4.5$0,001$0,0025$0,0035
Claude Sonnet 4$0,003$0,0075$0,0105
Claude Opus 4.6$0,005$0,0125$0,0175

Haiku é 3x mais barato que o Sonnet e 5x mais barato que o Opus!

Escolhendo o Modelo Certo

Use Claude Haiku 4.5 Quando:

  • Respondendo perguntas simples
  • Consultas rápidas e fatos
  • Mensagens de alto volume (WhatsApp, Telegram)
  • Custo é uma preocupação principal
  • Velocidade importa mais que profundidade

Defina como seu modelo padrão em ~/.openclaw/openclaw.json:

json
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-haiku-4-5"
      }
    }
  }
}

Use Claude Sonnet 4 / 4.5 Quando:

  • Assistência de escrita é necessária
  • Geração ou revisão de código
  • Tarefas de complexidade moderada
  • Equilíbrio entre qualidade e custo
  • A maioria dos casos de uso do dia a dia
json
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-sonnet-4"
      }
    }
  }
}

Use Claude Opus 4.6 Quando:

  • Análise complexa é necessária
  • Pesquisa e raciocínio profundo
  • Decisões críticas de negócios
  • Qualidade é primordial
  • Custo não é uma preocupação
json
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-opus-4-6"
      }
    }
  }
}

Roteamento de Modelo por Canal

O OpenClaw permite atribuir diferentes modelos a diferentes canais usando modelByChannel. Esta é a forma mais eficaz de otimizar custos — use um modelo mais barato para canais casuais e um mais capaz para trabalho:

json
// ~/.openclaw/openclaw.json
{
  "channels": {
    "modelByChannel": {
      "whatsapp": {
        "default": "anthropic/claude-haiku-4-5"
      },
      "telegram": {
        "default": "anthropic/claude-haiku-4-5"
      },
      "discord": {
        "default": "anthropic/claude-sonnet-4"
      },
      "slack": {
        "default": "anthropic/claude-sonnet-4"
      }
    }
  }
}

Você também pode configurar failover de modelo — se o modelo principal estiver indisponível, o OpenClaw tentará os modelos de fallback em ordem:

json
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-sonnet-4",
        "fallbacks": [
          "anthropic/claude-haiku-4-5"
        ]
      }
    }
  }
}

Auto-Roteadores da Comunidade

Para roteamento ainda mais inteligente baseado na complexidade da mensagem, projetos da comunidade como iblai-openclaw-router e ClawRoute podem rotear automaticamente consultas simples para Haiku e complexas para Sonnet ou Opus.

Estratégias de Otimização de Custos

1. Limitar o Histórico de Conversas

O histórico de conversas acumula rapidamente. Limite quanto é enviado usando historyLimit:

json
// ~/.openclaw/openclaw.json
{
  "messages": {
    "groupChat": {
      "historyLimit": 10
    }
  },
  "channels": {
    "whatsapp": {
      "dmHistoryLimit": 8
    },
    "telegram": {
      "dmHistoryLimit": 8
    },
    "discord": {
      "historyLimit": 15
    }
  }
}

Mantenha canais casuais (WhatsApp, Telegram) em 8-10 mensagens e canais de trabalho (Discord, Slack) em 15-20. Isso reduz significativamente os tokens de entrada por requisição.

2. Usar o Cache de Prompts da Anthropic

A Anthropic oferece cache de prompts que reduz drasticamente os custos para contexto repetido (prompts de sistema, prefixos de conversa):

OperaçãoMultiplicador de Custo
Escrita em cache (primeira requisição)1,25x preço base de entrada
Leitura do cache (subsequentes)0,1x preço base de entrada

Isso é um desconto de 90% no conteúdo em cache após a primeira requisição. Se seu prompt de sistema tem 1.000 tokens e você envia 50 mensagens, você paga preço cheio uma vez e 10% nas outras 49.

O OpenClaw suporta isso quando seu provedor de API tem cache habilitado. Verifique os "cache read tokens" no seu painel da Anthropic.

3. Escolher um Modelo Padrão Mais Barato

A otimização mais simples: mude seu padrão de Sonnet para Haiku na maioria dos casos de uso. Para 80% das interações diárias (perguntas rápidas, buscas, lembretes, conversa casual), Haiku funciona igualmente bem por uma fração do custo.

Use modelByChannel para manter Sonnet ou Opus em canais de trabalho específicos onde a qualidade é mais importante.

4. Usar Catálogo de Modelos com Aliases

Defina um catálogo de modelos para gerenciar múltiplos modelos facilmente e acompanhar custos:

json
{
  "agents": {
    "defaults": {
      "models": {
        "anthropic/claude-haiku-4-5": {
          "alias": "fast",
          "cost": { "input": 1.0, "output": 5.0 }
        },
        "anthropic/claude-sonnet-4": {
          "alias": "balanced",
          "cost": { "input": 3.0, "output": 15.0 }
        },
        "anthropic/claude-opus-4-6": {
          "alias": "powerful",
          "cost": { "input": 5.0, "output": 25.0 }
        }
      }
    }
  }
}

5. Usar API de Lotes para Tarefas Não Urgentes

Se você tem cargas de trabalho que não são sensíveis ao tempo, a API de Lotes da Anthropic oferece um desconto de 50% tanto em tokens de entrada quanto de saída:

ModeloSaída PadrãoSaída em Lote
Claude Haiku 4.5$5,00/1M$2,50/1M
Claude Sonnet 4$15,00/1M$7,50/1M
Claude Opus 4.6$25,00/1M$12,50/1M

Monitorando Custos

Uso em Tempo Real

bash
# Ver uso atual
openclaw stats

# Saída:
# Today's Usage:
#   Input tokens:  45,230
#   Output tokens: 12,450
#   Estimated cost: $0.23
#
# This month:
#   Total tokens: 1,234,567
#   Estimated cost: $8.45

Relatórios Detalhados

bash
# Gerar relatório de custos
openclaw stats --report monthly

# Exportar para CSV
openclaw stats --export costs.csv --period 30d

Limites do Console da Anthropic

Defina limites de gastos mensais diretamente no Console da Anthropic para evitar faturas inesperadas. Este é o método mais confiável para impor um orçamento — se você atingir o limite, a API para de aceitar requisições.

Templates de Configuração para Economia

Configuração Econômica

json
// Otimizado para custo mínimo
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-haiku-4-5"
      }
    }
  },
  "messages": {
    "groupChat": {
      "historyLimit": 5
    }
  }
}

Custo estimado: ~$5-10/mês com uso moderado

Configuração Equilibrada

json
// Bom equilíbrio entre qualidade e custo
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-sonnet-4",
        "fallbacks": ["anthropic/claude-haiku-4-5"]
      }
    }
  },
  "channels": {
    "modelByChannel": {
      "whatsapp": { "default": "anthropic/claude-haiku-4-5" },
      "telegram": { "default": "anthropic/claude-haiku-4-5" }
    }
  },
  "messages": {
    "groupChat": {
      "historyLimit": 15
    }
  }
}

Custo estimado: ~$15-25/mês com uso moderado

Configuração Focada em Qualidade

json
// Máxima qualidade, custo secundário
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-sonnet-4",
        "fallbacks": ["anthropic/claude-opus-4-6"]
      }
    }
  },
  "channels": {
    "modelByChannel": {
      "discord": { "default": "anthropic/claude-opus-4-6" },
      "slack": { "default": "anthropic/claude-opus-4-6" }
    }
  },
  "messages": {
    "groupChat": {
      "historyLimit": 25
    }
  }
}

Custo estimado: ~$30-50/mês com uso moderado

Configuração Multi-Provedor (Avançado)

Use múltiplos provedores via OpenRouter para otimizar custos:

json
// ~/.openclaw/openclaw.json
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-sonnet-4",
        "fallbacks": [
          "openrouter/google/gemini-2.5-flash",
          "anthropic/claude-haiku-4-5"
        ]
      }
    }
  }
}

O OpenClaw usa o formato provider/model para IDs de modelo. Para modelos OpenRouter, use o formato openrouter/author/slug.

Dicas para Reduzir Custos

  1. Seja específico nos prompts — Prompts vagos levam a respostas mais longas
  2. Use prompts de sistema sabiamente — Mantenha-os concisos
  3. Limite o histórico por canal — Canais casuais não precisam de 20 mensagens de contexto
  4. Habilite o cache de prompts — 90% de economia em contexto repetido
  5. Monitore o uso semanalmente — Detecte picos inesperados cedo com openclaw stats
  6. Use Haiku para testes — Mude para Sonnet em produção

Calculando Seus Custos Esperados

Use esta fórmula:

Custo Mensal = (Mensagens Diárias × Média Tokens Entrada × Preço Entrada) +
               (Mensagens Diárias × Média Tokens Saída × Preço Saída) × 30

Exemplo para 50 mensagens/dia com Claude Sonnet 4:

  • Média entrada: 800 tokens
  • Média saída: 400 tokens
Entrada:  50 × 800 × ($3/1M) × 30 = $3,60
Saída: 50 × 400 × ($15/1M) × 30 = $9,00
Total: ~$12,60/mês

Com metade das suas mensagens roteadas para Haiku 4.5:

Porção Haiku:  25 × 800 × ($1/1M) × 30 + 25 × 400 × ($5/1M) × 30 = $0,60 + $1,50 = $2,10
Porção Sonnet: 25 × 800 × ($3/1M) × 30 + 25 × 400 × ($15/1M) × 30 = $1,80 + $4,50 = $6,30
Total: ~$8,40/mês

Isso é 33% de economia só com roteamento de modelos — e ainda mais com cache de prompts por cima.

Próximos Passos