OpenClaw
Otimização10 min de leitura

Guia de Selecao de Modelo e Otimizacao de Custos do OpenClaw

Compare modelos de IA para o OpenClaw, entenda os precos e aprenda estrategias para otimizar custos mantendo respostas de qualidade.

O

OpenClaw Guides

Tutorial Authors

Entendendo os Precos dos Modelos de IA

Os modelos de IA cobram com base em tokens - blocos de texto que sao aproximadamente 4 caracteres ou 0,75 palavras. Voce paga por ambos:

  • Tokens de entrada: O texto que voce envia (sua mensagem + historico de conversa)
  • Tokens de saida: O texto que o modelo gera (respostas)

Modelos Disponiveis no OpenClaw

O OpenClaw suporta principalmente os modelos Claude da Anthropic, com suporte opcional para outros provedores.

Modelos Claude (Anthropic)

| Modelo | Preco Entrada | Preco Saida | Melhor Para | |-------|-------------|--------------|----------| | Claude 3.5 Haiku | $0,25/1M | $1,25/1M | Tarefas rapidas, alto volume | | Claude 3.5 Sonnet | $3,00/1M | $15,00/1M | Desempenho equilibrado | | Claude Sonnet 4 | $3,00/1M | $15,00/1M | Raciocinio complexo | | Claude Opus 4 | $15,00/1M | $75,00/1M | Mais capaz, pesquisa |

Precos de inicio de 2026. Consulte a pagina de precos da Anthropic para taxas atuais.

Exemplo de Comparacao de Custos

Para uma conversa tipica com 1.000 tokens de entrada e 500 tokens de saida:

| Modelo | Custo Entrada | Custo Saida | Total | |-------|------------|-------------|-------| | Claude 3.5 Haiku | $0,00025 | $0,000625 | $0,000875 | | Claude 3.5 Sonnet | $0,003 | $0,0075 | $0,0105 | | Claude Opus 4 | $0,015 | $0,0375 | $0,0525 |

Haiku e 12x mais barato que o Sonnet e 60x mais barato que o Opus!

Escolhendo o Modelo Certo

Use Claude 3.5 Haiku Quando:

  • Respondendo perguntas simples
  • Consultas rapidas e fatos
  • Mensagens de alto volume (WhatsApp, Telegram)
  • Custo e uma preocupacao principal
  • Velocidade importa mais que profundidade
json
// ~/.openclaw/openclaw.json
{
  "model": {
    "default": "claude-3-5-haiku"
  }
}

Use Claude 3.5 Sonnet / Sonnet 4 Quando:

  • Assistencia de escrita e necessaria
  • Geracao ou revisao de codigo
  • Tarefas de complexidade moderada
  • Equilibrio entre qualidade e custo
  • A maioria dos casos de uso do dia a dia
json
// ~/.openclaw/openclaw.json
{
  "model": {
    "default": "claude-sonnet-4"
  }
}

Use Claude Opus 4 Quando:

  • Analise complexa e necessaria
  • Pesquisa e raciocinio profundo
  • Decisoes criticas de negocios
  • Qualidade e primordial
  • Custo nao e uma preocupacao
json
// ~/.openclaw/openclaw.json
{
  "model": {
    "default": "claude-opus-4"
  }
}

Roteamento Dinamico de Modelos

O OpenClaw pode selecionar automaticamente modelos com base na tarefa:

json
// ~/.openclaw/openclaw.json
{
  "model": {
    "routing": {
      "enabled": true,
      "rules": [
        {
          "pattern": "^(oi|ola|hey|obrigado|ok|tchau)",
          "model": "claude-3-5-haiku"
        },
        {
          "pattern": "(codigo|funcao|bug|erro|programacao)",
          "model": "claude-sonnet-4"
        },
        {
          "pattern": "(analisar profundamente|complexo|detalhado)",
          "model": "claude-opus-4"
        },
        {
          "pattern": ".*",
          "model": "claude-3-5-sonnet"
        }
      ]
    }
  }
}

Estrategias de Otimizacao de Custos

1. Reduza o Comprimento do Contexto

O historico de conversa acumula rapidamente. Limite quanto e enviado:

json
// ~/.openclaw/openclaw.json
{
  "model": {
    "context": {
      "maxMessages": 10,
      "maxContextTokens": 4000,
      "summarizeOldMessages": true,
      "summaryThreshold": 20
    }
  }
}

2. Ative o Cache de Respostas

Armazene em cache consultas identicas para evitar chamadas de API repetidas:

json
// ~/.openclaw/openclaw.json
{
  "gateway": {
    "caching": {
      "enabled": true,
      "ttl": 3600,
      "maxSize": 1000
    }
  }
}

3. Defina Limites de Tokens

Previna respostas inesperadamente longas (caras):

json
// ~/.openclaw/openclaw.json
{
  "model": {
    "maxOutputTokens": 1024,
    "channelLimits": {
      "whatsapp": 500,
      "discord": 1500,
      "telegram": 800
    }
  }
}

4. Implemente Cotas de Uso

Defina limites de gastos diarios/mensais:

json
// ~/.openclaw/openclaw.json
{
  "model": {
    "quotas": {
      "daily": {
        "enabled": true,
        "maxTokens": 100000,
        "maxCost": 1.00,
        "warningThreshold": 0.80
      },
      "monthly": {
        "enabled": true,
        "maxCost": 20.00
      }
    }
  }
}

5. Use Compressao de Prompts

Reduza tokens de entrada com prompts mais inteligentes:

json
// ~/.openclaw/openclaw.json
{
  "model": {
    "optimization": {
      "compressPrompts": true,
      "compactSystemPrompt": true,
      "deltaContext": true
    }
  }
}

Monitorando Custos

Uso em Tempo Real

bash
# Ver uso atual
openclaw stats

# Saida:
# Uso de hoje:
#   Tokens de entrada:  45.230
#   Tokens de saida: 12.450
#   Custo estimado: $0,23
#
# Este mes:
#   Total de tokens: 1.234.567
#   Custo estimado: $8,45

Relatorios Detalhados

bash
# Gerar relatorio de custos
openclaw stats --report monthly

# Exportar para CSV
openclaw stats --export custos.csv --period 30d

Configurar Alertas

json
// ~/.openclaw/openclaw.json
{
  "notifications": {
    "costAlerts": {
      "enabled": true,
      "thresholds": [
        { "amount": 5.00, "action": "notify" },
        { "amount": 10.00, "action": "warn" },
        { "amount": 20.00, "action": "pause" }
      ]
    }
  }
}

Templates de Configuracao para Economia

Configuracao Economica

json
// Otimizado para custo minimo
{
  "model": {
    "default": "claude-3-5-haiku",
    "maxOutputTokens": 512,
    "context": {
      "maxMessages": 5,
      "maxContextTokens": 2000
    },
    "quotas": {
      "daily": {
        "enabled": true,
        "maxCost": 0.50
      }
    }
  },
  "gateway": {
    "caching": {
      "enabled": true,
      "ttl": 7200
    }
  }
}

Custo estimado: ~$5-10/mes com uso moderado

Configuracao Equilibrada

json
// Bom equilibrio entre qualidade e custo
{
  "model": {
    "default": "claude-3-5-sonnet",
    "maxOutputTokens": 1024,
    "context": {
      "maxMessages": 15,
      "maxContextTokens": 4000,
      "summarizeOldMessages": true
    },
    "routing": {
      "enabled": true,
      "rules": [
        { "pattern": "^(oi|ola|obrigado|tchau|ok)", "model": "claude-3-5-haiku" },
        { "pattern": ".*", "model": "claude-3-5-sonnet" }
      ]
    }
  },
  "gateway": {
    "caching": {
      "enabled": true,
      "ttl": 3600
    }
  }
}

Custo estimado: ~$15-30/mes com uso moderado

Configuracao Focada em Qualidade

json
// Maxima qualidade, custo secundario
{
  "model": {
    "default": "claude-sonnet-4",
    "maxOutputTokens": 4096,
    "context": {
      "maxMessages": 30,
      "maxContextTokens": 16000
    },
    "routing": {
      "enabled": true,
      "rules": [
        { "pattern": "(analisar|pesquisar|complexo|detalhado)", "model": "claude-opus-4" },
        { "pattern": ".*", "model": "claude-sonnet-4" }
      ]
    }
  }
}

Custo estimado: ~$50-100/mes com uso moderado

Configuracao Multi-Provedor (Avancado)

Use multiplos provedores para otimizar custos:

json
// ~/.openclaw/openclaw.json
{
  "providers": {
    "anthropic": {
      "apiKey": "${ANTHROPIC_API_KEY}",
      "models": ["claude-3-5-haiku", "claude-sonnet-4"]
    },
    "openai": {
      "apiKey": "${OPENAI_API_KEY}",
      "models": ["gpt-4o-mini"]
    }
  },
  "model": {
    "routing": {
      "enabled": true,
      "rules": [
        { "pattern": "^(oi|ola|que horas)", "provider": "openai", "model": "gpt-4o-mini" },
        { "pattern": ".*", "provider": "anthropic", "model": "claude-3-5-sonnet" }
      ]
    }
  }
}

Dicas para Reduzir Custos

  1. Seja especifico nos prompts - Prompts vagos levam a respostas mais longas
  2. Use prompts de sistema sabiamente - Mantenha-os concisos
  3. Limpe o contexto periodicamente - Nao deixe o historico crescer sem limites
  4. Armazene em cache consultas comuns - FAQs, saudacoes, etc.
  5. Monitore o uso semanalmente - Detecte picos inesperados cedo
  6. Use Haiku para testes - Mude para Sonnet em producao

Calculando Seus Custos Esperados

Use esta formula:

Custo Mensal = (Mensagens Diarias × Media Tokens Entrada × Preco Entrada) +
               (Mensagens Diarias × Media Tokens Saida × Preco Saida) × 30

Exemplo para 50 mensagens/dia com Claude 3.5 Sonnet:

  • Media entrada: 800 tokens
  • Media saida: 400 tokens
Entrada:  50 × 800 × ($3/1M) × 30 = $3,60
Saida: 50 × 400 × ($15/1M) × 30 = $9,00
Total: ~$12,60/mes

Proximos Passos