OpenClaw Modellauswahl und Kostenoptimierungsanleitung
Vergleichen Sie KI-Modelle für OpenClaw, verstehen Sie die Preisgestaltung und lernen Sie Strategien zur Kostenoptimierung bei gleichbleibender Antwortqualität.
OpenClaw Guides
Tutorial Authors
KI-Modell-Preisgestaltung verstehen
KI-Modelle berechnen basierend auf Tokens - Textblöcke, die ungefähr 4 Zeichen oder 0,75 Wörter umfassen. Sie zahlen für beides:
- Input-Tokens: Der Text, den Sie senden (Ihre Nachricht + Gesprächsverlauf)
- Output-Tokens: Der Text, den das Modell generiert (Antworten)
Verfügbare Modelle in OpenClaw
OpenClaw unterstützt Anthropics Claude-Modelle und andere Anbieter über OpenRouter. Hier sind die am häufigsten verwendeten Modelle:
Claude-Modelle (Anthropic)
| Modell | Input-Preis | Output-Preis | Am besten für |
|---|---|---|---|
| Claude Haiku 4.5 | $1,00/1M | $5,00/1M | Schnelle Aufgaben, hohes Volumen |
| Claude Sonnet 4 | $3,00/1M | $15,00/1M | Ausgewogene Leistung |
| Claude Sonnet 4.5 | $3,00/1M | $15,00/1M | Verbessertes Reasoning |
| Claude Opus 4.6 | $5,00/1M | $25,00/1M | Leistungsfähigstes, Forschung |
Preise Stand Anfang 2026. Prüfen Sie die Anthropic-Preisseite für aktuelle Tarife.
Kostenvergleichsbeispiel
Für ein typisches Gespräch mit 1.000 Input-Tokens und 500 Output-Tokens:
| Modell | Input-Kosten | Output-Kosten | Gesamt |
|---|---|---|---|
| Claude Haiku 4.5 | $0,001 | $0,0025 | $0,0035 |
| Claude Sonnet 4 | $0,003 | $0,0075 | $0,0105 |
| Claude Opus 4.6 | $0,005 | $0,0125 | $0,0175 |
Haiku ist 3x günstiger als Sonnet und 5x günstiger als Opus!
Das richtige Modell wählen
Verwenden Sie Claude Haiku 4.5 wenn:
- Einfache Fragen beantwortet werden
- Schnelle Abfragen und Fakten nötig sind
- Hohes Nachrichtenaufkommen (WhatsApp, Telegram)
- Kosten ein Hauptanliegen sind
- Geschwindigkeit wichtiger als Tiefe ist
Setzen Sie es als Standardmodell in ~/.openclaw/openclaw.json:
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-haiku-4-5"
}
}
}
}
Verwenden Sie Claude Sonnet 4 / 4.5 wenn:
- Schreibunterstützung benötigt wird
- Code-Generierung oder -Überprüfung
- Mäßig komplexe Aufgaben
- Balance zwischen Qualität und Kosten
- Die meisten alltäglichen Anwendungsfälle
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-sonnet-4"
}
}
}
}
Verwenden Sie Claude Opus 4.6 wenn:
- Komplexe Analyse erforderlich ist
- Forschung und tiefgreifende Schlussfolgerungen
- Kritische Geschäftsentscheidungen
- Qualität oberste Priorität hat
- Kosten kein Anliegen sind
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-opus-4-6"
}
}
}
}
Modell-Routing nach Kanal
OpenClaw ermöglicht es, verschiedenen Kanälen unterschiedliche Modelle zuzuweisen, indem Sie modelByChannel verwenden. Das ist der effektivste Weg zur Kostenoptimierung — verwenden Sie ein günstigeres Modell für Casual-Kanäle und ein leistungsfähigeres für die Arbeit:
// ~/.openclaw/openclaw.json
{
"channels": {
"modelByChannel": {
"whatsapp": {
"default": "anthropic/claude-haiku-4-5"
},
"telegram": {
"default": "anthropic/claude-haiku-4-5"
},
"discord": {
"default": "anthropic/claude-sonnet-4"
},
"slack": {
"default": "anthropic/claude-sonnet-4"
}
}
}
}
Sie können auch ein Modell-Failover einrichten — wenn das primäre Modell nicht verfügbar ist, probiert OpenClaw die Fallback-Modelle der Reihe nach:
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-sonnet-4",
"fallbacks": [
"anthropic/claude-haiku-4-5"
]
}
}
}
}
Community Auto-Router
Für noch intelligenteres Routing basierend auf Nachrichtenkomplexität können Community-Projekte wie iblai-openclaw-router und ClawRoute einfache Anfragen automatisch an Haiku und komplexe an Sonnet oder Opus weiterleiten.
Kostenoptimierungsstrategien
1. Gesprächsverlauf begrenzen
Der Gesprächsverlauf summiert sich schnell. Begrenzen Sie, wie viel gesendet wird, mit historyLimit:
// ~/.openclaw/openclaw.json
{
"messages": {
"groupChat": {
"historyLimit": 10
}
},
"channels": {
"whatsapp": {
"dmHistoryLimit": 8
},
"telegram": {
"dmHistoryLimit": 8
},
"discord": {
"historyLimit": 15
}
}
}
Halten Sie Casual-Kanäle (WhatsApp, Telegram) bei 8-10 Nachrichten und Arbeitskanäle (Discord, Slack) bei 15-20. Das reduziert die Input-Tokens pro Anfrage erheblich.
2. Anthropics Prompt Caching nutzen
Anthropic bietet Prompt Caching, das die Kosten für wiederholten Kontext (System-Prompts, Gesprächspräfixe) drastisch senkt:
| Vorgang | Kostenmultiplikator |
|---|---|
| Cache-Schreiben (erste Anfrage) | 1,25x Basis-Input-Preis |
| Cache-Lesen (danach) | 0,1x Basis-Input-Preis |
Das ist ein 90% Rabatt auf gecachte Inhalte nach der ersten Anfrage. Wenn Ihr System-Prompt 1.000 Tokens umfasst und Sie 50 Nachrichten senden, zahlen Sie einmal den vollen Preis und 10% für die anderen 49.
OpenClaw unterstützt dies, wenn Ihr API-Anbieter Caching aktiviert hat. Prüfen Sie Ihr Anthropic-Dashboard auf „Cache Read Tokens" in Ihrer Nutzung.
3. Ein günstigeres Standardmodell wählen
Die einfachste Optimierung: Wechseln Sie Ihr Standardmodell von Sonnet zu Haiku für die meisten Anwendungsfälle. Für 80% der täglichen Interaktionen (schnelle Fragen, Abfragen, Erinnerungen, Smalltalk) leistet Haiku genauso gut — zu einem Bruchteil der Kosten.
Verwenden Sie modelByChannel, um Sonnet oder Opus auf bestimmten Arbeitskanälen zu behalten, wo Qualität am wichtigsten ist.
4. Modellkatalog mit Aliasen verwenden
Definieren Sie einen Modellkatalog, um mehrere Modelle einfach zu verwalten und Kosten im Blick zu behalten:
{
"agents": {
"defaults": {
"models": {
"anthropic/claude-haiku-4-5": {
"alias": "fast",
"cost": { "input": 1.0, "output": 5.0 }
},
"anthropic/claude-sonnet-4": {
"alias": "balanced",
"cost": { "input": 3.0, "output": 15.0 }
},
"anthropic/claude-opus-4-6": {
"alias": "powerful",
"cost": { "input": 5.0, "output": 25.0 }
}
}
}
}
}
5. Batch API für nicht-dringende Aufgaben nutzen
Wenn Sie nicht zeitkritische Aufgaben haben, bietet Anthropics Batch API einen 50% Rabatt auf Input- und Output-Tokens:
| Modell | Standard-Output | Batch-Output |
|---|---|---|
| Claude Haiku 4.5 | $5,00/1M | $2,50/1M |
| Claude Sonnet 4 | $15,00/1M | $7,50/1M |
| Claude Opus 4.6 | $25,00/1M | $12,50/1M |
Kosten überwachen
Echtzeit-Nutzung
# Aktuelle Nutzung anzeigen openclaw stats # Ausgabe: # Today's Usage: # Input tokens: 45,230 # Output tokens: 12,450 # Estimated cost: $0.23 # # This month: # Total tokens: 1,234,567 # Estimated cost: $8.45
Detaillierte Berichte
# Kostenbericht erstellen openclaw stats --report monthly # Nach CSV exportieren openclaw stats --export costs.csv --period 30d
Anthropic Console Limits
Setzen Sie monatliche Ausgabelimits direkt in der Anthropic Console, um überraschende Rechnungen zu vermeiden. Das ist der zuverlässigste Weg, ein Budget durchzusetzen — wenn Sie das Limit erreichen, akzeptiert die API keine Anfragen mehr.
Kostensparende Konfigurationsvorlagen
Budgetbewusste Einrichtung
// Optimiert für minimale Kosten
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-haiku-4-5"
}
}
},
"messages": {
"groupChat": {
"historyLimit": 5
}
}
}
Geschätzte Kosten: ~$5-10/Monat bei mäßiger Nutzung
Ausgewogene Einrichtung
// Gute Balance zwischen Qualität und Kosten
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-sonnet-4",
"fallbacks": ["anthropic/claude-haiku-4-5"]
}
}
},
"channels": {
"modelByChannel": {
"whatsapp": { "default": "anthropic/claude-haiku-4-5" },
"telegram": { "default": "anthropic/claude-haiku-4-5" }
}
},
"messages": {
"groupChat": {
"historyLimit": 15
}
}
}
Geschätzte Kosten: ~$15-25/Monat bei mäßiger Nutzung
Qualitätsorientierte Einrichtung
// Maximale Qualität, Kosten sekundär
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-sonnet-4",
"fallbacks": ["anthropic/claude-opus-4-6"]
}
}
},
"channels": {
"modelByChannel": {
"discord": { "default": "anthropic/claude-opus-4-6" },
"slack": { "default": "anthropic/claude-opus-4-6" }
}
},
"messages": {
"groupChat": {
"historyLimit": 25
}
}
}
Geschätzte Kosten: ~$30-50/Monat bei mäßiger Nutzung
Multi-Provider-Einrichtung (Fortgeschritten)
Mehrere Anbieter über OpenRouter nutzen, um Kosten zu optimieren:
// ~/.openclaw/openclaw.json
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-sonnet-4",
"fallbacks": [
"openrouter/google/gemini-2.5-flash",
"anthropic/claude-haiku-4-5"
]
}
}
}
}
OpenClaw verwendet das Format provider/model für Modell-IDs. Für OpenRouter-Modelle verwenden Sie das Format openrouter/author/slug.
Tipps zur Kostenreduzierung
- Prompts spezifisch formulieren - Vage Prompts führen zu längeren Antworten
- System-Prompts klug nutzen - Halten Sie sie prägnant
- Verlauf pro Kanal begrenzen - Casual-Kanäle brauchen keinen Kontext von 20 Nachrichten
- Prompt Caching aktivieren - 90% Ersparnis bei wiederholtem Kontext
- Nutzung wöchentlich überwachen - Unerwartete Spitzen früh erkennen mit
openclaw stats - Haiku zum Testen verwenden - Für Produktion zu Sonnet wechseln
Erwartete Kosten berechnen
Verwenden Sie diese Formel:
Monatliche Kosten = (Tägliche Nachrichten × Durchschn. Input-Tokens × Input-Preis) +
(Tägliche Nachrichten × Durchschn. Output-Tokens × Output-Preis) × 30
Beispiel für 50 Nachrichten/Tag mit Claude Sonnet 4:
- Durchschn. Input: 800 Tokens
- Durchschn. Output: 400 Tokens
Input: 50 × 800 × ($3/1M) × 30 = $3,60 Output: 50 × 400 × ($15/1M) × 30 = $9,00 Gesamt: ~$12,60/Monat
Mit der Hälfte Ihrer Nachrichten an Haiku 4.5 geroutet:
Haiku-Anteil: 25 × 800 × ($1/1M) × 30 + 25 × 400 × ($5/1M) × 30 = $0,60 + $1,50 = $2,10 Sonnet-Anteil: 25 × 800 × ($3/1M) × 30 + 25 × 400 × ($15/1M) × 30 = $1,80 + $4,50 = $6,30 Gesamt: ~$8,40/Monat
Das ist eine Ersparnis von 33% allein durch Modell-Routing — und mit Prompt Caching obendrauf noch mehr.