OpenClaw
Optimisation10 min de lecture

Guide de sélection de modèle et d'optimisation des coûts OpenClaw

Comparez les modèles IA pour OpenClaw, comprenez la tarification et apprenez des stratégies pour optimiser les coûts tout en maintenant des réponses de qualité.

O

OpenClaw Guides

Tutorial Authors

Comprendre la tarification des modèles IA

Les modèles IA facturent en fonction des tokens — des morceaux de texte qui représentent environ 4 caractères ou 0,75 mots. Vous payez pour les deux :

  • Tokens d'entrée : Le texte que vous envoyez (votre message + historique de conversation)
  • Tokens de sortie : Le texte que le modèle génère (réponses)

Modèles disponibles dans OpenClaw

OpenClaw prend en charge les modèles Claude d'Anthropic et d'autres fournisseurs via OpenRouter. Voici les modèles les plus couramment utilisés :

Modèles Claude (Anthropic)

ModèlePrix d'entréePrix de sortieIdéal pour
Claude Haiku 4.51,00$/1M5,00$/1MTâches rapides, gros volume
Claude Sonnet 43,00$/1M15,00$/1MPerformance équilibrée
Claude Sonnet 4.53,00$/1M15,00$/1MRaisonnement amélioré
Claude Opus 4.65,00$/1M25,00$/1MLe plus capable, recherche

Prix début 2026. Consultez la page de tarification d'Anthropic pour les tarifs actuels.

Exemple de comparaison des coûts

Pour une conversation typique avec 1 000 tokens d'entrée et 500 tokens de sortie :

ModèleCoût d'entréeCoût de sortieTotal
Claude Haiku 4.50,001$0,0025$0,0035$
Claude Sonnet 40,003$0,0075$0,0105$
Claude Opus 4.60,005$0,0125$0,0175$

Haiku est 3x moins cher que Sonnet et 5x moins cher qu'Opus !

Choisir le bon modèle

Utilisez Claude Haiku 4.5 quand :

  • Vous répondez à des questions simples
  • Recherches rapides et faits
  • Messagerie à haut volume (WhatsApp, Telegram)
  • Le coût est une préoccupation principale
  • La vitesse compte plus que la profondeur

Définissez-le comme modèle par défaut dans ~/.openclaw/openclaw.json :

json
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-haiku-4-5"
      }
    }
  }
}

Utilisez Claude Sonnet 4 / 4.5 quand :

  • Une assistance à la rédaction est nécessaire
  • Génération ou revue de code
  • Tâches de complexité modérée
  • Équilibre qualité et coût
  • La plupart des cas d'utilisation quotidiens
json
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-sonnet-4"
      }
    }
  }
}

Utilisez Claude Opus 4.6 quand :

  • Une analyse complexe est requise
  • Recherche et raisonnement approfondi
  • Décisions commerciales critiques
  • La qualité est primordiale
  • Le coût n'est pas une préoccupation
json
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-opus-4-6"
      }
    }
  }
}

Routage de modèles par canal

OpenClaw vous permet d'assigner différents modèles à différents canaux avec modelByChannel. C'est la façon la plus efficace d'optimiser les coûts — utilisez un modèle moins cher pour les canaux décontractés et un plus capable pour le travail :

json
// ~/.openclaw/openclaw.json
{
  "channels": {
    "modelByChannel": {
      "whatsapp": {
        "default": "anthropic/claude-haiku-4-5"
      },
      "telegram": {
        "default": "anthropic/claude-haiku-4-5"
      },
      "discord": {
        "default": "anthropic/claude-sonnet-4"
      },
      "slack": {
        "default": "anthropic/claude-sonnet-4"
      }
    }
  }
}

Vous pouvez également configurer le basculement de modèle — si le modèle principal n'est pas disponible, OpenClaw essaiera les modèles de secours dans l'ordre :

json
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-sonnet-4",
        "fallbacks": [
          "anthropic/claude-haiku-4-5"
        ]
      }
    }
  }
}

Auto-routeurs communautaires

Pour un routage encore plus intelligent basé sur la complexité des messages, des projets communautaires comme iblai-openclaw-router et ClawRoute peuvent automatiquement router les requêtes simples vers Haiku et les complexes vers Sonnet ou Opus.

Stratégies d'optimisation des coûts

1. Limiter l'historique de conversation

L'historique de conversation s'accumule rapidement. Limitez ce qui est envoyé avec historyLimit :

json
// ~/.openclaw/openclaw.json
{
  "messages": {
    "groupChat": {
      "historyLimit": 10
    }
  },
  "channels": {
    "whatsapp": {
      "dmHistoryLimit": 8
    },
    "telegram": {
      "dmHistoryLimit": 8
    },
    "discord": {
      "historyLimit": 15
    }
  }
}

Gardez les canaux décontractés (WhatsApp, Telegram) à 8-10 messages et les canaux de travail (Discord, Slack) à 15-20. Cela réduit significativement les tokens d'entrée par requête.

2. Utiliser le cache de prompts d'Anthropic

Anthropic propose le cache de prompts qui réduit drastiquement les coûts pour le contexte répété (prompts système, préfixes de conversation) :

OpérationMultiplicateur de coût
Écriture en cache (première requête)1,25x prix d'entrée de base
Lecture du cache (suivantes)0,1x prix d'entrée de base

C'est une réduction de 90% sur le contenu mis en cache après la première requête. Si votre prompt système fait 1 000 tokens et que vous envoyez 50 messages, vous payez le prix plein une fois et 10% pour les 49 autres.

OpenClaw prend cela en charge lorsque votre fournisseur d'API a le cache activé. Vérifiez les « cache read tokens » dans votre tableau de bord Anthropic.

3. Choisir un modèle par défaut moins cher

L'optimisation la plus simple : passez votre modèle par défaut de Sonnet à Haiku pour la plupart des cas d'utilisation. Pour 80% des interactions quotidiennes (Q&R rapides, recherches, rappels, conversation décontractée), Haiku fonctionne tout aussi bien pour une fraction du coût.

Utilisez modelByChannel pour garder Sonnet ou Opus sur des canaux de travail spécifiques où la qualité compte le plus.

4. Utiliser un catalogue de modèles avec alias

Définissez un catalogue de modèles pour gérer facilement plusieurs modèles et suivre les coûts :

json
{
  "agents": {
    "defaults": {
      "models": {
        "anthropic/claude-haiku-4-5": {
          "alias": "fast",
          "cost": { "input": 1.0, "output": 5.0 }
        },
        "anthropic/claude-sonnet-4": {
          "alias": "balanced",
          "cost": { "input": 3.0, "output": 15.0 }
        },
        "anthropic/claude-opus-4-6": {
          "alias": "powerful",
          "cost": { "input": 5.0, "output": 25.0 }
        }
      }
    }
  }
}

5. Utiliser l'API Batch pour les tâches non urgentes

Si vous avez des charges de travail non sensibles au temps, l'API Batch d'Anthropic offre une réduction de 50% sur les tokens d'entrée et de sortie :

ModèleSortie standardSortie batch
Claude Haiku 4.55,00$/1M2,50$/1M
Claude Sonnet 415,00$/1M7,50$/1M
Claude Opus 4.625,00$/1M12,50$/1M

Surveiller les coûts

Utilisation en temps réel

bash
# Voir l'utilisation actuelle
openclaw stats

# Sortie :
# Today's Usage:
#   Input tokens:  45,230
#   Output tokens: 12,450
#   Estimated cost: $0.23
#
# This month:
#   Total tokens: 1,234,567
#   Estimated cost: $8.45

Rapports détaillés

bash
# Générer un rapport de coûts
openclaw stats --report monthly

# Exporter en CSV
openclaw stats --export costs.csv --period 30d

Limites de la console Anthropic

Définissez des plafonds de dépenses mensuelles directement dans la Console Anthropic pour éviter les factures surprises. C'est la méthode la plus fiable pour imposer un budget — si vous atteignez le plafond, l'API cesse d'accepter les requêtes.

Modèles de configuration économiques

Configuration économique

json
// Optimisé pour un coût minimal
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-haiku-4-5"
      }
    }
  },
  "messages": {
    "groupChat": {
      "historyLimit": 5
    }
  }
}

Coût estimé : ~5-10$/mois avec une utilisation modérée

Configuration équilibrée

json
// Bon équilibre entre qualité et coût
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-sonnet-4",
        "fallbacks": ["anthropic/claude-haiku-4-5"]
      }
    }
  },
  "channels": {
    "modelByChannel": {
      "whatsapp": { "default": "anthropic/claude-haiku-4-5" },
      "telegram": { "default": "anthropic/claude-haiku-4-5" }
    }
  },
  "messages": {
    "groupChat": {
      "historyLimit": 15
    }
  }
}

Coût estimé : ~15-25$/mois avec une utilisation modérée

Configuration qualité d'abord

json
// Qualité maximale, coût secondaire
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-sonnet-4",
        "fallbacks": ["anthropic/claude-opus-4-6"]
      }
    }
  },
  "channels": {
    "modelByChannel": {
      "discord": { "default": "anthropic/claude-opus-4-6" },
      "slack": { "default": "anthropic/claude-opus-4-6" }
    }
  },
  "messages": {
    "groupChat": {
      "historyLimit": 25
    }
  }
}

Coût estimé : ~30-50$/mois avec une utilisation modérée

Configuration multi-fournisseurs (Avancé)

Utilisez plusieurs fournisseurs via OpenRouter pour optimiser les coûts :

json
// ~/.openclaw/openclaw.json
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-sonnet-4",
        "fallbacks": [
          "openrouter/google/gemini-2.5-flash",
          "anthropic/claude-haiku-4-5"
        ]
      }
    }
  }
}

OpenClaw utilise le format provider/model pour les identifiants de modèle. Pour les modèles OpenRouter, utilisez le format openrouter/author/slug.

Conseils pour réduire les coûts

  1. Soyez spécifique dans les prompts — Les prompts vagues mènent à des réponses plus longues
  2. Utilisez les prompts système judicieusement — Gardez-les concis
  3. Limitez l'historique par canal — Les canaux décontractés n'ont pas besoin de 20 messages de contexte
  4. Activez le cache de prompts — 90% d'économies sur le contexte répété
  5. Surveillez l'utilisation chaque semaine — Détectez les pics inattendus tôt avec openclaw stats
  6. Utilisez Haiku pour les tests — Passez à Sonnet pour la production

Calculer vos coûts prévus

Utilisez cette formule :

Coût mensuel = (Messages quotidiens × Tokens d'entrée moyens × Prix d'entrée) +
               (Messages quotidiens × Tokens de sortie moyens × Prix de sortie) × 30

Exemple pour 50 messages/jour avec Claude Sonnet 4 :

  • Entrée moyenne : 800 tokens
  • Sortie moyenne : 400 tokens
Entrée :  50 × 800 × (3$/1M) × 30 = 3,60$
Sortie : 50 × 400 × (15$/1M) × 30 = 9,00$
Total : ~12,60$/mois

Avec la moitié de vos messages routés vers Haiku 4.5 :

Portion Haiku :  25 × 800 × (1$/1M) × 30 + 25 × 400 × (5$/1M) × 30 = 0,60$ + 1,50$ = 2,10$
Portion Sonnet : 25 × 800 × (3$/1M) × 30 + 25 × 400 × (15$/1M) × 30 = 1,80$ + 4,50$ = 6,30$
Total : ~8,40$/mois

C'est 33% d'économie rien qu'avec le routage de modèles — et encore plus avec le cache de prompts en plus.

Prochaines étapes