Optimisation10 min de lecture

Guide de sélection de modèle et d'optimisation des coûts OpenClaw

Comparez les modèles IA pour OpenClaw, comprenez la tarification et apprenez des stratégies pour optimiser les coûts tout en maintenant des réponses de qualité.

OpenClaw Guides

Tutorial Authors

2025-02-04

Comprendre la tarification des modèles IA

Les modèles IA facturent en fonction des tokens — des morceaux de texte qui représentent environ 4 caractères ou 0,75 mots. Vous payez pour les deux :

Tokens d'entrée : Le texte que vous envoyez (votre message + historique de conversation)
Tokens de sortie : Le texte que le modèle génère (réponses)

Modèles disponibles dans OpenClaw

OpenClaw prend en charge les modèles Claude d'Anthropic et d'autres fournisseurs via OpenRouter. Voici les modèles les plus couramment utilisés :

Modèles Claude (Anthropic)

Modèle	Prix d'entrée	Prix de sortie	Idéal pour
Claude Haiku 4.5	1,00$/1M	5,00$/1M	Tâches rapides, gros volume
Claude Sonnet 4	3,00$/1M	15,00$/1M	Performance équilibrée
Claude Sonnet 4.5	3,00$/1M	15,00$/1M	Raisonnement amélioré
Claude Opus 4.6	5,00$/1M	25,00$/1M	Le plus capable, recherche

Prix début 2026. Consultez la page de tarification d'Anthropic pour les tarifs actuels.

Exemple de comparaison des coûts

Pour une conversation typique avec 1 000 tokens d'entrée et 500 tokens de sortie :

Modèle	Coût d'entrée	Coût de sortie	Total
Claude Haiku 4.5	0,001$	0,0025$	0,0035$
Claude Sonnet 4	0,003$	0,0075$	0,0105$
Claude Opus 4.6	0,005$	0,0125$	0,0175$

Haiku est 3x moins cher que Sonnet et 5x moins cher qu'Opus !

Choisir le bon modèle

Utilisez Claude Haiku 4.5 quand :

Vous répondez à des questions simples
Recherches rapides et faits
Messagerie à haut volume (WhatsApp, Telegram)
Le coût est une préoccupation principale
La vitesse compte plus que la profondeur

Définissez-le comme modèle par défaut dans ~/.openclaw/openclaw.json :

json

{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-haiku-4-5"
      }
    }
  }
}

Utilisez Claude Sonnet 4 / 4.5 quand :

Une assistance à la rédaction est nécessaire
Génération ou revue de code
Tâches de complexité modérée
Équilibre qualité et coût
La plupart des cas d'utilisation quotidiens

json

{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-sonnet-4"
      }
    }
  }
}

Utilisez Claude Opus 4.6 quand :

Une analyse complexe est requise
Recherche et raisonnement approfondi
Décisions commerciales critiques
La qualité est primordiale
Le coût n'est pas une préoccupation

json

{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-opus-4-6"
      }
    }
  }
}

Routage de modèles par canal

OpenClaw vous permet d'assigner différents modèles à différents canaux avec modelByChannel. C'est la façon la plus efficace d'optimiser les coûts — utilisez un modèle moins cher pour les canaux décontractés et un plus capable pour le travail :

json

// ~/.openclaw/openclaw.json
{
  "channels": {
    "modelByChannel": {
      "whatsapp": {
        "default": "anthropic/claude-haiku-4-5"
      },
      "telegram": {
        "default": "anthropic/claude-haiku-4-5"
      },
      "discord": {
        "default": "anthropic/claude-sonnet-4"
      },
      "slack": {
        "default": "anthropic/claude-sonnet-4"
      }
    }
  }
}

Vous pouvez également configurer le basculement de modèle — si le modèle principal n'est pas disponible, OpenClaw essaiera les modèles de secours dans l'ordre :

json

{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-sonnet-4",
        "fallbacks": [
          "anthropic/claude-haiku-4-5"
        ]
      }
    }
  }
}

Auto-routeurs communautaires

Pour un routage encore plus intelligent basé sur la complexité des messages, des projets communautaires comme iblai-openclaw-router et ClawRoute peuvent automatiquement router les requêtes simples vers Haiku et les complexes vers Sonnet ou Opus.

Stratégies d'optimisation des coûts

1. Limiter l'historique de conversation

L'historique de conversation s'accumule rapidement. Limitez ce qui est envoyé avec historyLimit :

json

// ~/.openclaw/openclaw.json
{
  "messages": {
    "groupChat": {
      "historyLimit": 10
    }
  },
  "channels": {
    "whatsapp": {
      "dmHistoryLimit": 8
    },
    "telegram": {
      "dmHistoryLimit": 8
    },
    "discord": {
      "historyLimit": 15
    }
  }
}

Gardez les canaux décontractés (WhatsApp, Telegram) à 8-10 messages et les canaux de travail (Discord, Slack) à 15-20. Cela réduit significativement les tokens d'entrée par requête.

2. Utiliser le cache de prompts d'Anthropic

Anthropic propose le cache de prompts qui réduit drastiquement les coûts pour le contexte répété (prompts système, préfixes de conversation) :

Opération	Multiplicateur de coût
Écriture en cache (première requête)	1,25x prix d'entrée de base
Lecture du cache (suivantes)	0,1x prix d'entrée de base

C'est une réduction de 90% sur le contenu mis en cache après la première requête. Si votre prompt système fait 1 000 tokens et que vous envoyez 50 messages, vous payez le prix plein une fois et 10% pour les 49 autres.

OpenClaw prend cela en charge lorsque votre fournisseur d'API a le cache activé. Vérifiez les « cache read tokens » dans votre tableau de bord Anthropic.

3. Choisir un modèle par défaut moins cher

L'optimisation la plus simple : passez votre modèle par défaut de Sonnet à Haiku pour la plupart des cas d'utilisation. Pour 80% des interactions quotidiennes (Q&R rapides, recherches, rappels, conversation décontractée), Haiku fonctionne tout aussi bien pour une fraction du coût.

Utilisez modelByChannel pour garder Sonnet ou Opus sur des canaux de travail spécifiques où la qualité compte le plus.

4. Utiliser un catalogue de modèles avec alias

Définissez un catalogue de modèles pour gérer facilement plusieurs modèles et suivre les coûts :

json

{
  "agents": {
    "defaults": {
      "models": {
        "anthropic/claude-haiku-4-5": {
          "alias": "fast",
          "cost": { "input": 1.0, "output": 5.0 }
        },
        "anthropic/claude-sonnet-4": {
          "alias": "balanced",
          "cost": { "input": 3.0, "output": 15.0 }
        },
        "anthropic/claude-opus-4-6": {
          "alias": "powerful",
          "cost": { "input": 5.0, "output": 25.0 }
        }
      }
    }
  }
}

5. Utiliser l'API Batch pour les tâches non urgentes

Si vous avez des charges de travail non sensibles au temps, l'API Batch d'Anthropic offre une réduction de 50% sur les tokens d'entrée et de sortie :

Modèle	Sortie standard	Sortie batch
Claude Haiku 4.5	5,00$/1M	2,50$/1M
Claude Sonnet 4	15,00$/1M	7,50$/1M
Claude Opus 4.6	25,00$/1M	12,50$/1M

Surveiller les coûts

Utilisation en temps réel

bash

# Voir l'utilisation actuelle
openclaw stats

# Sortie :
# Today's Usage:
#   Input tokens:  45,230
#   Output tokens: 12,450
#   Estimated cost: $0.23
#
# This month:
#   Total tokens: 1,234,567
#   Estimated cost: $8.45

Rapports détaillés

bash

# Générer un rapport de coûts
openclaw stats --report monthly

# Exporter en CSV
openclaw stats --export costs.csv --period 30d

Limites de la console Anthropic

Définissez des plafonds de dépenses mensuelles directement dans la Console Anthropic pour éviter les factures surprises. C'est la méthode la plus fiable pour imposer un budget — si vous atteignez le plafond, l'API cesse d'accepter les requêtes.

Modèles de configuration économiques

Configuration économique

json

// Optimisé pour un coût minimal
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-haiku-4-5"
      }
    }
  },
  "messages": {
    "groupChat": {
      "historyLimit": 5
    }
  }
}

Coût estimé : ~5-10$/mois avec une utilisation modérée

Configuration équilibrée

json

// Bon équilibre entre qualité et coût
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-sonnet-4",
        "fallbacks": ["anthropic/claude-haiku-4-5"]
      }
    }
  },
  "channels": {
    "modelByChannel": {
      "whatsapp": { "default": "anthropic/claude-haiku-4-5" },
      "telegram": { "default": "anthropic/claude-haiku-4-5" }
    }
  },
  "messages": {
    "groupChat": {
      "historyLimit": 15
    }
  }
}

Coût estimé : ~15-25$/mois avec une utilisation modérée

Configuration qualité d'abord

json

// Qualité maximale, coût secondaire
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-sonnet-4",
        "fallbacks": ["anthropic/claude-opus-4-6"]
      }
    }
  },
  "channels": {
    "modelByChannel": {
      "discord": { "default": "anthropic/claude-opus-4-6" },
      "slack": { "default": "anthropic/claude-opus-4-6" }
    }
  },
  "messages": {
    "groupChat": {
      "historyLimit": 25
    }
  }
}

Coût estimé : ~30-50$/mois avec une utilisation modérée

Configuration multi-fournisseurs (Avancé)

Utilisez plusieurs fournisseurs via OpenRouter pour optimiser les coûts :

json

// ~/.openclaw/openclaw.json
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-sonnet-4",
        "fallbacks": [
          "openrouter/google/gemini-2.5-flash",
          "anthropic/claude-haiku-4-5"
        ]
      }
    }
  }
}

OpenClaw utilise le format provider/model pour les identifiants de modèle. Pour les modèles OpenRouter, utilisez le format openrouter/author/slug.

Conseils pour réduire les coûts

Soyez spécifique dans les prompts — Les prompts vagues mènent à des réponses plus longues
Utilisez les prompts système judicieusement — Gardez-les concis
Limitez l'historique par canal — Les canaux décontractés n'ont pas besoin de 20 messages de contexte
Activez le cache de prompts — 90% d'économies sur le contexte répété
Surveillez l'utilisation chaque semaine — Détectez les pics inattendus tôt avec openclaw stats
Utilisez Haiku pour les tests — Passez à Sonnet pour la production

Calculer vos coûts prévus

Utilisez cette formule :

Coût mensuel = (Messages quotidiens × Tokens d'entrée moyens × Prix d'entrée) +
               (Messages quotidiens × Tokens de sortie moyens × Prix de sortie) × 30

Exemple pour 50 messages/jour avec Claude Sonnet 4 :

Entrée moyenne : 800 tokens
Sortie moyenne : 400 tokens

Entrée :  50 × 800 × (3$/1M) × 30 = 3,60$
Sortie : 50 × 400 × (15$/1M) × 30 = 9,00$
Total : ~12,60$/mois

Avec la moitié de vos messages routés vers Haiku 4.5 :

Portion Haiku :  25 × 800 × (1$/1M) × 30 + 25 × 400 × (5$/1M) × 30 = 0,60$ + 1,50$ = 2,10$
Portion Sonnet : 25 × 800 × (3$/1M) × 30 + 25 × 400 × (15$/1M) × 30 = 1,80$ + 4,50$ = 6,30$
Total : ~8,40$/mois

C'est 33% d'économie rien qu'avec le routage de modèles — et encore plus avec le cache de prompts en plus.

Comprendre la tarification des modèles IA

Modèles disponibles dans OpenClaw

Modèles Claude (Anthropic)

Exemple de comparaison des coûts

Choisir le bon modèle

Utilisez Claude Haiku 4.5 quand :

Utilisez Claude Sonnet 4 / 4.5 quand :

Utilisez Claude Opus 4.6 quand :

Routage de modèles par canal

Auto-routeurs communautaires

Stratégies d'optimisation des coûts

1. Limiter l'historique de conversation

2. Utiliser le cache de prompts d'Anthropic

3. Choisir un modèle par défaut moins cher

4. Utiliser un catalogue de modèles avec alias

5. Utiliser l'API Batch pour les tâches non urgentes

Surveiller les coûts

Utilisation en temps réel

Rapports détaillés

Limites de la console Anthropic

Modèles de configuration économiques

Configuration économique

Configuration équilibrée

Configuration qualité d'abord

Configuration multi-fournisseurs (Avancé)

Conseils pour réduire les coûts

Calculer vos coûts prévus

Prochaines étapes