Guide de sélection de modèle et d'optimisation des coûts OpenClaw
Comparez les modèles IA pour OpenClaw, comprenez la tarification et apprenez des stratégies pour optimiser les coûts tout en maintenant des réponses de qualité.
OpenClaw Guides
Tutorial Authors
Comprendre la tarification des modèles IA
Les modèles IA facturent en fonction des tokens — des morceaux de texte qui représentent environ 4 caractères ou 0,75 mots. Vous payez pour les deux :
- Tokens d'entrée : Le texte que vous envoyez (votre message + historique de conversation)
- Tokens de sortie : Le texte que le modèle génère (réponses)
Modèles disponibles dans OpenClaw
OpenClaw prend en charge les modèles Claude d'Anthropic et d'autres fournisseurs via OpenRouter. Voici les modèles les plus couramment utilisés :
Modèles Claude (Anthropic)
| Modèle | Prix d'entrée | Prix de sortie | Idéal pour |
|---|---|---|---|
| Claude Haiku 4.5 | 1,00$/1M | 5,00$/1M | Tâches rapides, gros volume |
| Claude Sonnet 4 | 3,00$/1M | 15,00$/1M | Performance équilibrée |
| Claude Sonnet 4.5 | 3,00$/1M | 15,00$/1M | Raisonnement amélioré |
| Claude Opus 4.6 | 5,00$/1M | 25,00$/1M | Le plus capable, recherche |
Prix début 2026. Consultez la page de tarification d'Anthropic pour les tarifs actuels.
Exemple de comparaison des coûts
Pour une conversation typique avec 1 000 tokens d'entrée et 500 tokens de sortie :
| Modèle | Coût d'entrée | Coût de sortie | Total |
|---|---|---|---|
| Claude Haiku 4.5 | 0,001$ | 0,0025$ | 0,0035$ |
| Claude Sonnet 4 | 0,003$ | 0,0075$ | 0,0105$ |
| Claude Opus 4.6 | 0,005$ | 0,0125$ | 0,0175$ |
Haiku est 3x moins cher que Sonnet et 5x moins cher qu'Opus !
Choisir le bon modèle
Utilisez Claude Haiku 4.5 quand :
- Vous répondez à des questions simples
- Recherches rapides et faits
- Messagerie à haut volume (WhatsApp, Telegram)
- Le coût est une préoccupation principale
- La vitesse compte plus que la profondeur
Définissez-le comme modèle par défaut dans ~/.openclaw/openclaw.json :
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-haiku-4-5"
}
}
}
}
Utilisez Claude Sonnet 4 / 4.5 quand :
- Une assistance à la rédaction est nécessaire
- Génération ou revue de code
- Tâches de complexité modérée
- Équilibre qualité et coût
- La plupart des cas d'utilisation quotidiens
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-sonnet-4"
}
}
}
}
Utilisez Claude Opus 4.6 quand :
- Une analyse complexe est requise
- Recherche et raisonnement approfondi
- Décisions commerciales critiques
- La qualité est primordiale
- Le coût n'est pas une préoccupation
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-opus-4-6"
}
}
}
}
Routage de modèles par canal
OpenClaw vous permet d'assigner différents modèles à différents canaux avec modelByChannel. C'est la façon la plus efficace d'optimiser les coûts — utilisez un modèle moins cher pour les canaux décontractés et un plus capable pour le travail :
// ~/.openclaw/openclaw.json
{
"channels": {
"modelByChannel": {
"whatsapp": {
"default": "anthropic/claude-haiku-4-5"
},
"telegram": {
"default": "anthropic/claude-haiku-4-5"
},
"discord": {
"default": "anthropic/claude-sonnet-4"
},
"slack": {
"default": "anthropic/claude-sonnet-4"
}
}
}
}
Vous pouvez également configurer le basculement de modèle — si le modèle principal n'est pas disponible, OpenClaw essaiera les modèles de secours dans l'ordre :
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-sonnet-4",
"fallbacks": [
"anthropic/claude-haiku-4-5"
]
}
}
}
}
Auto-routeurs communautaires
Pour un routage encore plus intelligent basé sur la complexité des messages, des projets communautaires comme iblai-openclaw-router et ClawRoute peuvent automatiquement router les requêtes simples vers Haiku et les complexes vers Sonnet ou Opus.
Stratégies d'optimisation des coûts
1. Limiter l'historique de conversation
L'historique de conversation s'accumule rapidement. Limitez ce qui est envoyé avec historyLimit :
// ~/.openclaw/openclaw.json
{
"messages": {
"groupChat": {
"historyLimit": 10
}
},
"channels": {
"whatsapp": {
"dmHistoryLimit": 8
},
"telegram": {
"dmHistoryLimit": 8
},
"discord": {
"historyLimit": 15
}
}
}
Gardez les canaux décontractés (WhatsApp, Telegram) à 8-10 messages et les canaux de travail (Discord, Slack) à 15-20. Cela réduit significativement les tokens d'entrée par requête.
2. Utiliser le cache de prompts d'Anthropic
Anthropic propose le cache de prompts qui réduit drastiquement les coûts pour le contexte répété (prompts système, préfixes de conversation) :
| Opération | Multiplicateur de coût |
|---|---|
| Écriture en cache (première requête) | 1,25x prix d'entrée de base |
| Lecture du cache (suivantes) | 0,1x prix d'entrée de base |
C'est une réduction de 90% sur le contenu mis en cache après la première requête. Si votre prompt système fait 1 000 tokens et que vous envoyez 50 messages, vous payez le prix plein une fois et 10% pour les 49 autres.
OpenClaw prend cela en charge lorsque votre fournisseur d'API a le cache activé. Vérifiez les « cache read tokens » dans votre tableau de bord Anthropic.
3. Choisir un modèle par défaut moins cher
L'optimisation la plus simple : passez votre modèle par défaut de Sonnet à Haiku pour la plupart des cas d'utilisation. Pour 80% des interactions quotidiennes (Q&R rapides, recherches, rappels, conversation décontractée), Haiku fonctionne tout aussi bien pour une fraction du coût.
Utilisez modelByChannel pour garder Sonnet ou Opus sur des canaux de travail spécifiques où la qualité compte le plus.
4. Utiliser un catalogue de modèles avec alias
Définissez un catalogue de modèles pour gérer facilement plusieurs modèles et suivre les coûts :
{
"agents": {
"defaults": {
"models": {
"anthropic/claude-haiku-4-5": {
"alias": "fast",
"cost": { "input": 1.0, "output": 5.0 }
},
"anthropic/claude-sonnet-4": {
"alias": "balanced",
"cost": { "input": 3.0, "output": 15.0 }
},
"anthropic/claude-opus-4-6": {
"alias": "powerful",
"cost": { "input": 5.0, "output": 25.0 }
}
}
}
}
}
5. Utiliser l'API Batch pour les tâches non urgentes
Si vous avez des charges de travail non sensibles au temps, l'API Batch d'Anthropic offre une réduction de 50% sur les tokens d'entrée et de sortie :
| Modèle | Sortie standard | Sortie batch |
|---|---|---|
| Claude Haiku 4.5 | 5,00$/1M | 2,50$/1M |
| Claude Sonnet 4 | 15,00$/1M | 7,50$/1M |
| Claude Opus 4.6 | 25,00$/1M | 12,50$/1M |
Surveiller les coûts
Utilisation en temps réel
# Voir l'utilisation actuelle openclaw stats # Sortie : # Today's Usage: # Input tokens: 45,230 # Output tokens: 12,450 # Estimated cost: $0.23 # # This month: # Total tokens: 1,234,567 # Estimated cost: $8.45
Rapports détaillés
# Générer un rapport de coûts openclaw stats --report monthly # Exporter en CSV openclaw stats --export costs.csv --period 30d
Limites de la console Anthropic
Définissez des plafonds de dépenses mensuelles directement dans la Console Anthropic pour éviter les factures surprises. C'est la méthode la plus fiable pour imposer un budget — si vous atteignez le plafond, l'API cesse d'accepter les requêtes.
Modèles de configuration économiques
Configuration économique
// Optimisé pour un coût minimal
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-haiku-4-5"
}
}
},
"messages": {
"groupChat": {
"historyLimit": 5
}
}
}
Coût estimé : ~5-10$/mois avec une utilisation modérée
Configuration équilibrée
// Bon équilibre entre qualité et coût
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-sonnet-4",
"fallbacks": ["anthropic/claude-haiku-4-5"]
}
}
},
"channels": {
"modelByChannel": {
"whatsapp": { "default": "anthropic/claude-haiku-4-5" },
"telegram": { "default": "anthropic/claude-haiku-4-5" }
}
},
"messages": {
"groupChat": {
"historyLimit": 15
}
}
}
Coût estimé : ~15-25$/mois avec une utilisation modérée
Configuration qualité d'abord
// Qualité maximale, coût secondaire
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-sonnet-4",
"fallbacks": ["anthropic/claude-opus-4-6"]
}
}
},
"channels": {
"modelByChannel": {
"discord": { "default": "anthropic/claude-opus-4-6" },
"slack": { "default": "anthropic/claude-opus-4-6" }
}
},
"messages": {
"groupChat": {
"historyLimit": 25
}
}
}
Coût estimé : ~30-50$/mois avec une utilisation modérée
Configuration multi-fournisseurs (Avancé)
Utilisez plusieurs fournisseurs via OpenRouter pour optimiser les coûts :
// ~/.openclaw/openclaw.json
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-sonnet-4",
"fallbacks": [
"openrouter/google/gemini-2.5-flash",
"anthropic/claude-haiku-4-5"
]
}
}
}
}
OpenClaw utilise le format provider/model pour les identifiants de modèle. Pour les modèles OpenRouter, utilisez le format openrouter/author/slug.
Conseils pour réduire les coûts
- Soyez spécifique dans les prompts — Les prompts vagues mènent à des réponses plus longues
- Utilisez les prompts système judicieusement — Gardez-les concis
- Limitez l'historique par canal — Les canaux décontractés n'ont pas besoin de 20 messages de contexte
- Activez le cache de prompts — 90% d'économies sur le contexte répété
- Surveillez l'utilisation chaque semaine — Détectez les pics inattendus tôt avec
openclaw stats - Utilisez Haiku pour les tests — Passez à Sonnet pour la production
Calculer vos coûts prévus
Utilisez cette formule :
Coût mensuel = (Messages quotidiens × Tokens d'entrée moyens × Prix d'entrée) +
(Messages quotidiens × Tokens de sortie moyens × Prix de sortie) × 30
Exemple pour 50 messages/jour avec Claude Sonnet 4 :
- Entrée moyenne : 800 tokens
- Sortie moyenne : 400 tokens
Entrée : 50 × 800 × (3$/1M) × 30 = 3,60$ Sortie : 50 × 400 × (15$/1M) × 30 = 9,00$ Total : ~12,60$/mois
Avec la moitié de vos messages routés vers Haiku 4.5 :
Portion Haiku : 25 × 800 × (1$/1M) × 30 + 25 × 400 × (5$/1M) × 30 = 0,60$ + 1,50$ = 2,10$ Portion Sonnet : 25 × 800 × (3$/1M) × 30 + 25 × 400 × (15$/1M) × 30 = 1,80$ + 4,50$ = 6,30$ Total : ~8,40$/mois
C'est 33% d'économie rien qu'avec le routage de modèles — et encore plus avec le cache de prompts en plus.