OpenClaw
Optimisation10 min de lecture

Guide de selection de modele et d'optimisation des couts OpenClaw

Comparez les modeles IA pour OpenClaw, comprenez la tarification et apprenez des strategies pour optimiser les couts tout en maintenant des reponses de qualite.

O

OpenClaw Guides

Tutorial Authors

Comprendre la tarification des modeles IA

Les modeles IA facturent en fonction des tokens - des morceaux de texte qui representent environ 4 caracteres ou 0,75 mots. Vous payez pour les deux :

  • Tokens d'entree : Le texte que vous envoyez (votre message + historique de conversation)
  • Tokens de sortie : Le texte que le modele genere (reponses)

Modeles disponibles dans OpenClaw

OpenClaw prend en charge principalement les modeles Claude d'Anthropic, avec un support optionnel pour d'autres fournisseurs.

Modeles Claude (Anthropic)

| Modele | Prix d'entree | Prix de sortie | Ideal pour | |--------|---------------|----------------|------------| | Claude 3.5 Haiku | 0,25$/1M | 1,25$/1M | Taches rapides, gros volume | | Claude 3.5 Sonnet | 3,00$/1M | 15,00$/1M | Performance equilibree | | Claude Sonnet 4 | 3,00$/1M | 15,00$/1M | Raisonnement complexe | | Claude Opus 4 | 15,00$/1M | 75,00$/1M | Le plus capable, recherche |

Prix debut 2026. Consultez la page de tarification d'Anthropic pour les tarifs actuels.

Exemple de comparaison des couts

Pour une conversation typique avec 1 000 tokens d'entree et 500 tokens de sortie :

| Modele | Cout d'entree | Cout de sortie | Total | |--------|---------------|----------------|-------| | Claude 3.5 Haiku | 0,00025$ | 0,000625$ | 0,000875$ | | Claude 3.5 Sonnet | 0,003$ | 0,0075$ | 0,0105$ | | Claude Opus 4 | 0,015$ | 0,0375$ | 0,0525$ |

Haiku est 12x moins cher que Sonnet et 60x moins cher qu'Opus !

Choisir le bon modele

Utilisez Claude 3.5 Haiku quand :

  • Vous repondez a des questions simples
  • Recherches rapides et faits
  • Messagerie a haut volume (WhatsApp, Telegram)
  • Le cout est une preoccupation principale
  • La vitesse compte plus que la profondeur
json
// ~/.openclaw/openclaw.json
{
  "model": {
    "default": "claude-3-5-haiku"
  }
}

Utilisez Claude 3.5 Sonnet / Sonnet 4 quand :

  • Une assistance a la redaction est necessaire
  • Generation ou revue de code
  • Taches de complexite moderee
  • Equilibre qualite et cout
  • La plupart des cas d'utilisation quotidiens
json
// ~/.openclaw/openclaw.json
{
  "model": {
    "default": "claude-sonnet-4"
  }
}

Utilisez Claude Opus 4 quand :

  • Une analyse complexe est requise
  • Recherche et raisonnement approfondi
  • Decisions commerciales critiques
  • La qualite est primordiale
  • Le cout n'est pas une preoccupation
json
// ~/.openclaw/openclaw.json
{
  "model": {
    "default": "claude-opus-4"
  }
}

Routage dynamique des modeles

OpenClaw peut automatiquement selectionner les modeles en fonction de la tache :

json
// ~/.openclaw/openclaw.json
{
  "model": {
    "routing": {
      "enabled": true,
      "rules": [
        {
          "pattern": "^(hi|hello|hey|thanks|ok|bye)",
          "model": "claude-3-5-haiku"
        },
        {
          "pattern": "(code|function|bug|error|programming)",
          "model": "claude-sonnet-4"
        },
        {
          "pattern": "(analyze deeply|complex|thorough)",
          "model": "claude-opus-4"
        },
        {
          "pattern": ".*",
          "model": "claude-3-5-sonnet"
        }
      ]
    }
  }
}

Strategies d'optimisation des couts

1. Reduire la longueur du contexte

L'historique de conversation s'accumule rapidement. Limitez ce qui est envoye :

json
// ~/.openclaw/openclaw.json
{
  "model": {
    "context": {
      "maxMessages": 10,
      "maxContextTokens": 4000,
      "summarizeOldMessages": true,
      "summaryThreshold": 20
    }
  }
}

2. Activer la mise en cache des reponses

Mettez en cache les requetes identiques pour eviter les appels API repetes :

json
// ~/.openclaw/openclaw.json
{
  "gateway": {
    "caching": {
      "enabled": true,
      "ttl": 3600,
      "maxSize": 1000
    }
  }
}

3. Definir des limites de tokens

Evitez les reponses inattendument longues (couteuses) :

json
// ~/.openclaw/openclaw.json
{
  "model": {
    "maxOutputTokens": 1024,
    "channelLimits": {
      "whatsapp": 500,
      "discord": 1500,
      "telegram": 800
    }
  }
}

4. Implementer des quotas d'utilisation

Definissez des limites de depenses quotidiennes/mensuelles :

json
// ~/.openclaw/openclaw.json
{
  "model": {
    "quotas": {
      "daily": {
        "enabled": true,
        "maxTokens": 100000,
        "maxCost": 1.00,
        "warningThreshold": 0.80
      },
      "monthly": {
        "enabled": true,
        "maxCost": 20.00
      }
    }
  }
}

5. Utiliser la compression de prompts

Reduisez les tokens d'entree avec des prompts plus intelligents :

json
// ~/.openclaw/openclaw.json
{
  "model": {
    "optimization": {
      "compressPrompts": true,
      "compactSystemPrompt": true,
      "deltaContext": true
    }
  }
}

Surveiller les couts

Utilisation en temps reel

bash
# Voir l'utilisation actuelle
openclaw stats

# Sortie :
# Today's Usage:
#   Input tokens:  45,230
#   Output tokens: 12,450
#   Estimated cost: $0.23
#
# This month:
#   Total tokens: 1,234,567
#   Estimated cost: $8.45

Rapports detailles

bash
# Generer un rapport de couts
openclaw stats --report monthly

# Exporter en CSV
openclaw stats --export costs.csv --period 30d

Configurer des alertes

json
// ~/.openclaw/openclaw.json
{
  "notifications": {
    "costAlerts": {
      "enabled": true,
      "thresholds": [
        { "amount": 5.00, "action": "notify" },
        { "amount": 10.00, "action": "warn" },
        { "amount": 20.00, "action": "pause" }
      ]
    }
  }
}

Modeles de configuration economiques

Configuration economique

json
// Optimise pour un cout minimal
{
  "model": {
    "default": "claude-3-5-haiku",
    "maxOutputTokens": 512,
    "context": {
      "maxMessages": 5,
      "maxContextTokens": 2000
    },
    "quotas": {
      "daily": {
        "enabled": true,
        "maxCost": 0.50
      }
    }
  },
  "gateway": {
    "caching": {
      "enabled": true,
      "ttl": 7200
    }
  }
}

Cout estime : ~5-10$/mois avec une utilisation moderee

Configuration equilibree

json
// Bon equilibre entre qualite et cout
{
  "model": {
    "default": "claude-3-5-sonnet",
    "maxOutputTokens": 1024,
    "context": {
      "maxMessages": 15,
      "maxContextTokens": 4000,
      "summarizeOldMessages": true
    },
    "routing": {
      "enabled": true,
      "rules": [
        { "pattern": "^(hi|hello|thanks|bye|ok)", "model": "claude-3-5-haiku" },
        { "pattern": ".*", "model": "claude-3-5-sonnet" }
      ]
    }
  },
  "gateway": {
    "caching": {
      "enabled": true,
      "ttl": 3600
    }
  }
}

Cout estime : ~15-30$/mois avec une utilisation moderee

Configuration qualite d'abord

json
// Qualite maximale, cout secondaire
{
  "model": {
    "default": "claude-sonnet-4",
    "maxOutputTokens": 4096,
    "context": {
      "maxMessages": 30,
      "maxContextTokens": 16000
    },
    "routing": {
      "enabled": true,
      "rules": [
        { "pattern": "(analyze|research|complex|detailed)", "model": "claude-opus-4" },
        { "pattern": ".*", "model": "claude-sonnet-4" }
      ]
    }
  }
}

Cout estime : ~50-100$/mois avec une utilisation moderee

Configuration multi-fournisseurs (Avance)

Utilisez plusieurs fournisseurs pour optimiser les couts :

json
// ~/.openclaw/openclaw.json
{
  "providers": {
    "anthropic": {
      "apiKey": "${ANTHROPIC_API_KEY}",
      "models": ["claude-3-5-haiku", "claude-sonnet-4"]
    },
    "openai": {
      "apiKey": "${OPENAI_API_KEY}",
      "models": ["gpt-4o-mini"]
    }
  },
  "model": {
    "routing": {
      "enabled": true,
      "rules": [
        { "pattern": "^(hi|hello|what time)", "provider": "openai", "model": "gpt-4o-mini" },
        { "pattern": ".*", "provider": "anthropic", "model": "claude-3-5-sonnet" }
      ]
    }
  }
}

Conseils pour reduire les couts

  1. Soyez specifique dans les prompts - Les prompts vagues menent a des reponses plus longues
  2. Utilisez les prompts systeme judicieusement - Gardez-les concis
  3. Effacez le contexte periodiquement - Ne laissez pas l'historique croitre indefiniment
  4. Mettez en cache les requetes courantes - FAQs, salutations, etc.
  5. Surveillez l'utilisation hebdomadairement - Detectez les pics inattendus tot
  6. Utilisez Haiku pour les tests - Passez a Sonnet pour la production

Calculer vos couts prevus

Utilisez cette formule :

Cout mensuel = (Messages quotidiens × Tokens d'entree moyens × Prix d'entree) +
               (Messages quotidiens × Tokens de sortie moyens × Prix de sortie) × 30

Exemple pour 50 messages/jour avec Claude 3.5 Sonnet :

  • Entree moyenne : 800 tokens
  • Sortie moyenne : 400 tokens
Entree :  50 × 800 × (3$/1M) × 30 = 3,60$
Sortie : 50 × 400 × (15$/1M) × 30 = 9,00$
Total : ~12,60$/mois

Prochaines etapes