Otimização10 min de leitura

Guia de Seleção de Modelo e Otimização de Custos do OpenClaw

Compare modelos de IA para o OpenClaw, entenda os preços e aprenda estratégias para otimizar custos mantendo respostas de qualidade.

OpenClaw Guides

Tutorial Authors

2025-02-04

Entendendo os Preços dos Modelos de IA

Os modelos de IA cobram com base em tokens — blocos de texto que são aproximadamente 4 caracteres ou 0,75 palavras. Você paga por ambos:

Tokens de entrada: O texto que você envia (sua mensagem + histórico de conversa)
Tokens de saída: O texto que o modelo gera (respostas)

Modelos Disponíveis no OpenClaw

O OpenClaw suporta os modelos Claude da Anthropic e outros provedores via OpenRouter. Aqui estão os modelos mais utilizados:

Modelos Claude (Anthropic)

Modelo	Preço Entrada	Preço Saída	Melhor Para
Claude Haiku 4.5	$1,00/1M	$5,00/1M	Tarefas rápidas, alto volume
Claude Sonnet 4	$3,00/1M	$15,00/1M	Desempenho equilibrado
Claude Sonnet 4.5	$3,00/1M	$15,00/1M	Raciocínio aprimorado
Claude Opus 4.6	$5,00/1M	$25,00/1M	Mais capaz, pesquisa

Preços de início de 2026. Consulte a página de preços da Anthropic para taxas atuais.

Exemplo de Comparação de Custos

Para uma conversa típica com 1.000 tokens de entrada e 500 tokens de saída:

Modelo	Custo Entrada	Custo Saída	Total
Claude Haiku 4.5	$0,001	$0,0025	$0,0035
Claude Sonnet 4	$0,003	$0,0075	$0,0105
Claude Opus 4.6	$0,005	$0,0125	$0,0175

Haiku é 3x mais barato que o Sonnet e 5x mais barato que o Opus!

Escolhendo o Modelo Certo

Use Claude Haiku 4.5 Quando:

Respondendo perguntas simples
Consultas rápidas e fatos
Mensagens de alto volume (WhatsApp, Telegram)
Custo é uma preocupação principal
Velocidade importa mais que profundidade

Defina como seu modelo padrão em ~/.openclaw/openclaw.json:

json

{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-haiku-4-5"
      }
    }
  }
}

Use Claude Sonnet 4 / 4.5 Quando:

Assistência de escrita é necessária
Geração ou revisão de código
Tarefas de complexidade moderada
Equilíbrio entre qualidade e custo
A maioria dos casos de uso do dia a dia

json

{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-sonnet-4"
      }
    }
  }
}

Use Claude Opus 4.6 Quando:

Análise complexa é necessária
Pesquisa e raciocínio profundo
Decisões críticas de negócios
Qualidade é primordial
Custo não é uma preocupação

json

{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-opus-4-6"
      }
    }
  }
}

Roteamento de Modelo por Canal

O OpenClaw permite atribuir diferentes modelos a diferentes canais usando modelByChannel. Esta é a forma mais eficaz de otimizar custos — use um modelo mais barato para canais casuais e um mais capaz para trabalho:

json

// ~/.openclaw/openclaw.json
{
  "channels": {
    "modelByChannel": {
      "whatsapp": {
        "default": "anthropic/claude-haiku-4-5"
      },
      "telegram": {
        "default": "anthropic/claude-haiku-4-5"
      },
      "discord": {
        "default": "anthropic/claude-sonnet-4"
      },
      "slack": {
        "default": "anthropic/claude-sonnet-4"
      }
    }
  }
}

Você também pode configurar failover de modelo — se o modelo principal estiver indisponível, o OpenClaw tentará os modelos de fallback em ordem:

json

{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-sonnet-4",
        "fallbacks": [
          "anthropic/claude-haiku-4-5"
        ]
      }
    }
  }
}

Auto-Roteadores da Comunidade

Para roteamento ainda mais inteligente baseado na complexidade da mensagem, projetos da comunidade como iblai-openclaw-router e ClawRoute podem rotear automaticamente consultas simples para Haiku e complexas para Sonnet ou Opus.

Estratégias de Otimização de Custos

1. Limitar o Histórico de Conversas

O histórico de conversas acumula rapidamente. Limite quanto é enviado usando historyLimit:

json

// ~/.openclaw/openclaw.json
{
  "messages": {
    "groupChat": {
      "historyLimit": 10
    }
  },
  "channels": {
    "whatsapp": {
      "dmHistoryLimit": 8
    },
    "telegram": {
      "dmHistoryLimit": 8
    },
    "discord": {
      "historyLimit": 15
    }
  }
}

Mantenha canais casuais (WhatsApp, Telegram) em 8-10 mensagens e canais de trabalho (Discord, Slack) em 15-20. Isso reduz significativamente os tokens de entrada por requisição.

2. Usar o Cache de Prompts da Anthropic

A Anthropic oferece cache de prompts que reduz drasticamente os custos para contexto repetido (prompts de sistema, prefixos de conversa):

Operação	Multiplicador de Custo
Escrita em cache (primeira requisição)	1,25x preço base de entrada
Leitura do cache (subsequentes)	0,1x preço base de entrada

Isso é um desconto de 90% no conteúdo em cache após a primeira requisição. Se seu prompt de sistema tem 1.000 tokens e você envia 50 mensagens, você paga preço cheio uma vez e 10% nas outras 49.

O OpenClaw suporta isso quando seu provedor de API tem cache habilitado. Verifique os "cache read tokens" no seu painel da Anthropic.

3. Escolher um Modelo Padrão Mais Barato

A otimização mais simples: mude seu padrão de Sonnet para Haiku na maioria dos casos de uso. Para 80% das interações diárias (perguntas rápidas, buscas, lembretes, conversa casual), Haiku funciona igualmente bem por uma fração do custo.

Use modelByChannel para manter Sonnet ou Opus em canais de trabalho específicos onde a qualidade é mais importante.

4. Usar Catálogo de Modelos com Aliases

Defina um catálogo de modelos para gerenciar múltiplos modelos facilmente e acompanhar custos:

json

{
  "agents": {
    "defaults": {
      "models": {
        "anthropic/claude-haiku-4-5": {
          "alias": "fast",
          "cost": { "input": 1.0, "output": 5.0 }
        },
        "anthropic/claude-sonnet-4": {
          "alias": "balanced",
          "cost": { "input": 3.0, "output": 15.0 }
        },
        "anthropic/claude-opus-4-6": {
          "alias": "powerful",
          "cost": { "input": 5.0, "output": 25.0 }
        }
      }
    }
  }
}

5. Usar API de Lotes para Tarefas Não Urgentes

Se você tem cargas de trabalho que não são sensíveis ao tempo, a API de Lotes da Anthropic oferece um desconto de 50% tanto em tokens de entrada quanto de saída:

Modelo	Saída Padrão	Saída em Lote
Claude Haiku 4.5	$5,00/1M	$2,50/1M
Claude Sonnet 4	$15,00/1M	$7,50/1M
Claude Opus 4.6	$25,00/1M	$12,50/1M

Monitorando Custos

Uso em Tempo Real

bash

# Ver uso atual
openclaw stats

# Saída:
# Today's Usage:
#   Input tokens:  45,230
#   Output tokens: 12,450
#   Estimated cost: $0.23
#
# This month:
#   Total tokens: 1,234,567
#   Estimated cost: $8.45

Relatórios Detalhados

bash

# Gerar relatório de custos
openclaw stats --report monthly

# Exportar para CSV
openclaw stats --export costs.csv --period 30d

Limites do Console da Anthropic

Defina limites de gastos mensais diretamente no Console da Anthropic para evitar faturas inesperadas. Este é o método mais confiável para impor um orçamento — se você atingir o limite, a API para de aceitar requisições.

Templates de Configuração para Economia

Configuração Econômica

json

// Otimizado para custo mínimo
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-haiku-4-5"
      }
    }
  },
  "messages": {
    "groupChat": {
      "historyLimit": 5
    }
  }
}

Custo estimado: ~$5-10/mês com uso moderado

Configuração Equilibrada

json

// Bom equilíbrio entre qualidade e custo
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-sonnet-4",
        "fallbacks": ["anthropic/claude-haiku-4-5"]
      }
    }
  },
  "channels": {
    "modelByChannel": {
      "whatsapp": { "default": "anthropic/claude-haiku-4-5" },
      "telegram": { "default": "anthropic/claude-haiku-4-5" }
    }
  },
  "messages": {
    "groupChat": {
      "historyLimit": 15
    }
  }
}

Custo estimado: ~$15-25/mês com uso moderado

Configuração Focada em Qualidade

json

// Máxima qualidade, custo secundário
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-sonnet-4",
        "fallbacks": ["anthropic/claude-opus-4-6"]
      }
    }
  },
  "channels": {
    "modelByChannel": {
      "discord": { "default": "anthropic/claude-opus-4-6" },
      "slack": { "default": "anthropic/claude-opus-4-6" }
    }
  },
  "messages": {
    "groupChat": {
      "historyLimit": 25
    }
  }
}

Custo estimado: ~$30-50/mês com uso moderado

Configuração Multi-Provedor (Avançado)

Use múltiplos provedores via OpenRouter para otimizar custos:

json

// ~/.openclaw/openclaw.json
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-sonnet-4",
        "fallbacks": [
          "openrouter/google/gemini-2.5-flash",
          "anthropic/claude-haiku-4-5"
        ]
      }
    }
  }
}

O OpenClaw usa o formato provider/model para IDs de modelo. Para modelos OpenRouter, use o formato openrouter/author/slug.

Dicas para Reduzir Custos

Seja específico nos prompts — Prompts vagos levam a respostas mais longas
Use prompts de sistema sabiamente — Mantenha-os concisos
Limite o histórico por canal — Canais casuais não precisam de 20 mensagens de contexto
Habilite o cache de prompts — 90% de economia em contexto repetido
Monitore o uso semanalmente — Detecte picos inesperados cedo com openclaw stats
Use Haiku para testes — Mude para Sonnet em produção

Calculando Seus Custos Esperados

Use esta fórmula:

Custo Mensal = (Mensagens Diárias × Média Tokens Entrada × Preço Entrada) +
               (Mensagens Diárias × Média Tokens Saída × Preço Saída) × 30

Exemplo para 50 mensagens/dia com Claude Sonnet 4:

Média entrada: 800 tokens
Média saída: 400 tokens

Entrada:  50 × 800 × ($3/1M) × 30 = $3,60
Saída: 50 × 400 × ($15/1M) × 30 = $9,00
Total: ~$12,60/mês

Com metade das suas mensagens roteadas para Haiku 4.5:

Porção Haiku:  25 × 800 × ($1/1M) × 30 + 25 × 400 × ($5/1M) × 30 = $0,60 + $1,50 = $2,10
Porção Sonnet: 25 × 800 × ($3/1M) × 30 + 25 × 400 × ($15/1M) × 30 = $1,80 + $4,50 = $6,30
Total: ~$8,40/mês

Isso é 33% de economia só com roteamento de modelos — e ainda mais com cache de prompts por cima.

Entendendo os Preços dos Modelos de IA

Modelos Disponíveis no OpenClaw

Modelos Claude (Anthropic)

Exemplo de Comparação de Custos

Escolhendo o Modelo Certo

Use Claude Haiku 4.5 Quando:

Use Claude Sonnet 4 / 4.5 Quando:

Use Claude Opus 4.6 Quando:

Roteamento de Modelo por Canal

Auto-Roteadores da Comunidade

Estratégias de Otimização de Custos

1. Limitar o Histórico de Conversas

2. Usar o Cache de Prompts da Anthropic

3. Escolher um Modelo Padrão Mais Barato

4. Usar Catálogo de Modelos com Aliases

5. Usar API de Lotes para Tarefas Não Urgentes

Monitorando Custos

Uso em Tempo Real

Relatórios Detalhados

Limites do Console da Anthropic

Templates de Configuração para Economia

Configuração Econômica

Configuração Equilibrada

Configuração Focada em Qualidade

Configuração Multi-Provedor (Avançado)

Dicas para Reduzir Custos

Calculando Seus Custos Esperados

Próximos Passos