Guide de selection de modele et d'optimisation des couts OpenClaw
Comparez les modeles IA pour OpenClaw, comprenez la tarification et apprenez des strategies pour optimiser les couts tout en maintenant des reponses de qualite.
OpenClaw Guides
Tutorial Authors
Comprendre la tarification des modeles IA
Les modeles IA facturent en fonction des tokens - des morceaux de texte qui representent environ 4 caracteres ou 0,75 mots. Vous payez pour les deux :
- Tokens d'entree : Le texte que vous envoyez (votre message + historique de conversation)
- Tokens de sortie : Le texte que le modele genere (reponses)
Modeles disponibles dans OpenClaw
OpenClaw prend en charge principalement les modeles Claude d'Anthropic, avec un support optionnel pour d'autres fournisseurs.
Modeles Claude (Anthropic)
| Modele | Prix d'entree | Prix de sortie | Ideal pour | |--------|---------------|----------------|------------| | Claude 3.5 Haiku | 0,25$/1M | 1,25$/1M | Taches rapides, gros volume | | Claude 3.5 Sonnet | 3,00$/1M | 15,00$/1M | Performance equilibree | | Claude Sonnet 4 | 3,00$/1M | 15,00$/1M | Raisonnement complexe | | Claude Opus 4 | 15,00$/1M | 75,00$/1M | Le plus capable, recherche |
Prix debut 2026. Consultez la page de tarification d'Anthropic pour les tarifs actuels.
Exemple de comparaison des couts
Pour une conversation typique avec 1 000 tokens d'entree et 500 tokens de sortie :
| Modele | Cout d'entree | Cout de sortie | Total | |--------|---------------|----------------|-------| | Claude 3.5 Haiku | 0,00025$ | 0,000625$ | 0,000875$ | | Claude 3.5 Sonnet | 0,003$ | 0,0075$ | 0,0105$ | | Claude Opus 4 | 0,015$ | 0,0375$ | 0,0525$ |
Haiku est 12x moins cher que Sonnet et 60x moins cher qu'Opus !
Choisir le bon modele
Utilisez Claude 3.5 Haiku quand :
- Vous repondez a des questions simples
- Recherches rapides et faits
- Messagerie a haut volume (WhatsApp, Telegram)
- Le cout est une preoccupation principale
- La vitesse compte plus que la profondeur
// ~/.openclaw/openclaw.json
{
"model": {
"default": "claude-3-5-haiku"
}
}
Utilisez Claude 3.5 Sonnet / Sonnet 4 quand :
- Une assistance a la redaction est necessaire
- Generation ou revue de code
- Taches de complexite moderee
- Equilibre qualite et cout
- La plupart des cas d'utilisation quotidiens
// ~/.openclaw/openclaw.json
{
"model": {
"default": "claude-sonnet-4"
}
}
Utilisez Claude Opus 4 quand :
- Une analyse complexe est requise
- Recherche et raisonnement approfondi
- Decisions commerciales critiques
- La qualite est primordiale
- Le cout n'est pas une preoccupation
// ~/.openclaw/openclaw.json
{
"model": {
"default": "claude-opus-4"
}
}
Routage dynamique des modeles
OpenClaw peut automatiquement selectionner les modeles en fonction de la tache :
// ~/.openclaw/openclaw.json
{
"model": {
"routing": {
"enabled": true,
"rules": [
{
"pattern": "^(hi|hello|hey|thanks|ok|bye)",
"model": "claude-3-5-haiku"
},
{
"pattern": "(code|function|bug|error|programming)",
"model": "claude-sonnet-4"
},
{
"pattern": "(analyze deeply|complex|thorough)",
"model": "claude-opus-4"
},
{
"pattern": ".*",
"model": "claude-3-5-sonnet"
}
]
}
}
}
Strategies d'optimisation des couts
1. Reduire la longueur du contexte
L'historique de conversation s'accumule rapidement. Limitez ce qui est envoye :
// ~/.openclaw/openclaw.json
{
"model": {
"context": {
"maxMessages": 10,
"maxContextTokens": 4000,
"summarizeOldMessages": true,
"summaryThreshold": 20
}
}
}
2. Activer la mise en cache des reponses
Mettez en cache les requetes identiques pour eviter les appels API repetes :
// ~/.openclaw/openclaw.json
{
"gateway": {
"caching": {
"enabled": true,
"ttl": 3600,
"maxSize": 1000
}
}
}
3. Definir des limites de tokens
Evitez les reponses inattendument longues (couteuses) :
// ~/.openclaw/openclaw.json
{
"model": {
"maxOutputTokens": 1024,
"channelLimits": {
"whatsapp": 500,
"discord": 1500,
"telegram": 800
}
}
}
4. Implementer des quotas d'utilisation
Definissez des limites de depenses quotidiennes/mensuelles :
// ~/.openclaw/openclaw.json
{
"model": {
"quotas": {
"daily": {
"enabled": true,
"maxTokens": 100000,
"maxCost": 1.00,
"warningThreshold": 0.80
},
"monthly": {
"enabled": true,
"maxCost": 20.00
}
}
}
}
5. Utiliser la compression de prompts
Reduisez les tokens d'entree avec des prompts plus intelligents :
// ~/.openclaw/openclaw.json
{
"model": {
"optimization": {
"compressPrompts": true,
"compactSystemPrompt": true,
"deltaContext": true
}
}
}
Surveiller les couts
Utilisation en temps reel
# Voir l'utilisation actuelle openclaw stats # Sortie : # Today's Usage: # Input tokens: 45,230 # Output tokens: 12,450 # Estimated cost: $0.23 # # This month: # Total tokens: 1,234,567 # Estimated cost: $8.45
Rapports detailles
# Generer un rapport de couts openclaw stats --report monthly # Exporter en CSV openclaw stats --export costs.csv --period 30d
Configurer des alertes
// ~/.openclaw/openclaw.json
{
"notifications": {
"costAlerts": {
"enabled": true,
"thresholds": [
{ "amount": 5.00, "action": "notify" },
{ "amount": 10.00, "action": "warn" },
{ "amount": 20.00, "action": "pause" }
]
}
}
}
Modeles de configuration economiques
Configuration economique
// Optimise pour un cout minimal
{
"model": {
"default": "claude-3-5-haiku",
"maxOutputTokens": 512,
"context": {
"maxMessages": 5,
"maxContextTokens": 2000
},
"quotas": {
"daily": {
"enabled": true,
"maxCost": 0.50
}
}
},
"gateway": {
"caching": {
"enabled": true,
"ttl": 7200
}
}
}
Cout estime : ~5-10$/mois avec une utilisation moderee
Configuration equilibree
// Bon equilibre entre qualite et cout
{
"model": {
"default": "claude-3-5-sonnet",
"maxOutputTokens": 1024,
"context": {
"maxMessages": 15,
"maxContextTokens": 4000,
"summarizeOldMessages": true
},
"routing": {
"enabled": true,
"rules": [
{ "pattern": "^(hi|hello|thanks|bye|ok)", "model": "claude-3-5-haiku" },
{ "pattern": ".*", "model": "claude-3-5-sonnet" }
]
}
},
"gateway": {
"caching": {
"enabled": true,
"ttl": 3600
}
}
}
Cout estime : ~15-30$/mois avec une utilisation moderee
Configuration qualite d'abord
// Qualite maximale, cout secondaire
{
"model": {
"default": "claude-sonnet-4",
"maxOutputTokens": 4096,
"context": {
"maxMessages": 30,
"maxContextTokens": 16000
},
"routing": {
"enabled": true,
"rules": [
{ "pattern": "(analyze|research|complex|detailed)", "model": "claude-opus-4" },
{ "pattern": ".*", "model": "claude-sonnet-4" }
]
}
}
}
Cout estime : ~50-100$/mois avec une utilisation moderee
Configuration multi-fournisseurs (Avance)
Utilisez plusieurs fournisseurs pour optimiser les couts :
// ~/.openclaw/openclaw.json
{
"providers": {
"anthropic": {
"apiKey": "${ANTHROPIC_API_KEY}",
"models": ["claude-3-5-haiku", "claude-sonnet-4"]
},
"openai": {
"apiKey": "${OPENAI_API_KEY}",
"models": ["gpt-4o-mini"]
}
},
"model": {
"routing": {
"enabled": true,
"rules": [
{ "pattern": "^(hi|hello|what time)", "provider": "openai", "model": "gpt-4o-mini" },
{ "pattern": ".*", "provider": "anthropic", "model": "claude-3-5-sonnet" }
]
}
}
}
Conseils pour reduire les couts
- Soyez specifique dans les prompts - Les prompts vagues menent a des reponses plus longues
- Utilisez les prompts systeme judicieusement - Gardez-les concis
- Effacez le contexte periodiquement - Ne laissez pas l'historique croitre indefiniment
- Mettez en cache les requetes courantes - FAQs, salutations, etc.
- Surveillez l'utilisation hebdomadairement - Detectez les pics inattendus tot
- Utilisez Haiku pour les tests - Passez a Sonnet pour la production
Calculer vos couts prevus
Utilisez cette formule :
Cout mensuel = (Messages quotidiens × Tokens d'entree moyens × Prix d'entree) +
(Messages quotidiens × Tokens de sortie moyens × Prix de sortie) × 30
Exemple pour 50 messages/jour avec Claude 3.5 Sonnet :
- Entree moyenne : 800 tokens
- Sortie moyenne : 400 tokens
Entree : 50 × 800 × (3$/1M) × 30 = 3,60$ Sortie : 50 × 400 × (15$/1M) × 30 = 9,00$ Total : ~12,60$/mois