OpenClaw Modellauswahl und Kostenoptimierungsanleitung
Vergleichen Sie KI-Modelle fuer OpenClaw, verstehen Sie die Preisgestaltung und lernen Sie Strategien zur Kostenoptimierung bei gleichbleibender Antwortqualitaet.
OpenClaw Guides
Tutorial Authors
KI-Modell-Preisgestaltung verstehen
KI-Modelle berechnen basierend auf Tokens - Textbloecke, die ungefaehr 4 Zeichen oder 0,75 Woerter umfassen. Sie zahlen fuer beides:
- Input-Tokens: Der Text, den Sie senden (Ihre Nachricht + Gespraechsverlauf)
- Output-Tokens: Der Text, den das Modell generiert (Antworten)
Verfuegbare Modelle in OpenClaw
OpenClaw unterstuetzt hauptsaechlich Anthropics Claude-Modelle, mit optionaler Unterstuetzung fuer andere Anbieter.
Claude-Modelle (Anthropic)
| Modell | Input-Preis | Output-Preis | Am besten fuer | |--------|-------------|--------------|----------------| | Claude 3.5 Haiku | $0,25/1M | $1,25/1M | Schnelle Aufgaben, hohe Volumen | | Claude 3.5 Sonnet | $3,00/1M | $15,00/1M | Ausgewogene Leistung | | Claude Sonnet 4 | $3,00/1M | $15,00/1M | Komplexe Schlussfolgerungen | | Claude Opus 4 | $15,00/1M | $75,00/1M | Leistungsfaehigstes, Forschung |
Preise Stand Anfang 2026. Pruefen Sie die Anthropic-Preisseite fuer aktuelle Tarife.
Kostenvergleichsbeispiel
Fuer ein typisches Gespraech mit 1.000 Input-Tokens und 500 Output-Tokens:
| Modell | Input-Kosten | Output-Kosten | Gesamt | |--------|--------------|---------------|--------| | Claude 3.5 Haiku | $0,00025 | $0,000625 | $0,000875 | | Claude 3.5 Sonnet | $0,003 | $0,0075 | $0,0105 | | Claude Opus 4 | $0,015 | $0,0375 | $0,0525 |
Haiku ist 12x guenstiger als Sonnet und 60x guenstiger als Opus!
Das richtige Modell waehlen
Verwenden Sie Claude 3.5 Haiku wenn:
- Einfache Fragen beantwortet werden
- Schnelle Abfragen und Fakten noetig sind
- Hohes Nachrichtenaufkommen (WhatsApp, Telegram)
- Kosten ein Hauptanliegen sind
- Geschwindigkeit wichtiger als Tiefe ist
// ~/.openclaw/openclaw.json
{
"model": {
"default": "claude-3-5-haiku"
}
}
Verwenden Sie Claude 3.5 Sonnet / Sonnet 4 wenn:
- Schreibunterstuetzung benoetigt wird
- Code-Generierung oder -Ueberpruefung
- Maessig komplexe Aufgaben
- Balance zwischen Qualitaet und Kosten
- Die meisten alltaeglichen Anwendungsfaelle
// ~/.openclaw/openclaw.json
{
"model": {
"default": "claude-sonnet-4"
}
}
Verwenden Sie Claude Opus 4 wenn:
- Komplexe Analyse erforderlich ist
- Forschung und tiefgreifende Schlussfolgerungen
- Kritische Geschaeftsentscheidungen
- Qualitaet oberste Prioritaet hat
- Kosten kein Anliegen sind
// ~/.openclaw/openclaw.json
{
"model": {
"default": "claude-opus-4"
}
}
Dynamisches Modell-Routing
OpenClaw kann Modelle automatisch basierend auf der Aufgabe auswaehlen:
// ~/.openclaw/openclaw.json
{
"model": {
"routing": {
"enabled": true,
"rules": [
{
"pattern": "^(hi|hello|hey|thanks|ok|bye)",
"model": "claude-3-5-haiku"
},
{
"pattern": "(code|function|bug|error|programming)",
"model": "claude-sonnet-4"
},
{
"pattern": "(analyze deeply|complex|thorough)",
"model": "claude-opus-4"
},
{
"pattern": ".*",
"model": "claude-3-5-sonnet"
}
]
}
}
}
Kostenoptimierungsstrategien
1. Kontextlaenge reduzieren
Der Gespraechsverlauf summiert sich schnell. Begrenzen Sie, wie viel gesendet wird:
// ~/.openclaw/openclaw.json
{
"model": {
"context": {
"maxMessages": 10,
"maxContextTokens": 4000,
"summarizeOldMessages": true,
"summaryThreshold": 20
}
}
}
2. Antwort-Caching aktivieren
Identische Abfragen cachen, um wiederholte API-Aufrufe zu vermeiden:
// ~/.openclaw/openclaw.json
{
"gateway": {
"caching": {
"enabled": true,
"ttl": 3600,
"maxSize": 1000
}
}
}
3. Token-Limits setzen
Unerwartet lange (teure) Antworten verhindern:
// ~/.openclaw/openclaw.json
{
"model": {
"maxOutputTokens": 1024,
"channelLimits": {
"whatsapp": 500,
"discord": 1500,
"telegram": 800
}
}
}
4. Nutzungskontingente implementieren
Taegliche/monatliche Ausgabenlimits setzen:
// ~/.openclaw/openclaw.json
{
"model": {
"quotas": {
"daily": {
"enabled": true,
"maxTokens": 100000,
"maxCost": 1.00,
"warningThreshold": 0.80
},
"monthly": {
"enabled": true,
"maxCost": 20.00
}
}
}
}
5. Prompt-Kompression verwenden
Input-Tokens mit intelligenteren Prompts reduzieren:
// ~/.openclaw/openclaw.json
{
"model": {
"optimization": {
"compressPrompts": true,
"compactSystemPrompt": true,
"deltaContext": true
}
}
}
Kosten ueberwachen
Echtzeit-Nutzung
# Aktuelle Nutzung anzeigen openclaw stats # Ausgabe: # Today's Usage: # Input tokens: 45,230 # Output tokens: 12,450 # Estimated cost: $0.23 # # This month: # Total tokens: 1,234,567 # Estimated cost: $8.45
Detaillierte Berichte
# Kostenbericht erstellen openclaw stats --report monthly # Nach CSV exportieren openclaw stats --export costs.csv --period 30d
Benachrichtigungen einrichten
// ~/.openclaw/openclaw.json
{
"notifications": {
"costAlerts": {
"enabled": true,
"thresholds": [
{ "amount": 5.00, "action": "notify" },
{ "amount": 10.00, "action": "warn" },
{ "amount": 20.00, "action": "pause" }
]
}
}
}
Kostensparende Konfigurationsvorlagen
Budgetbewusste Einrichtung
// Optimiert fuer minimale Kosten
{
"model": {
"default": "claude-3-5-haiku",
"maxOutputTokens": 512,
"context": {
"maxMessages": 5,
"maxContextTokens": 2000
},
"quotas": {
"daily": {
"enabled": true,
"maxCost": 0.50
}
}
},
"gateway": {
"caching": {
"enabled": true,
"ttl": 7200
}
}
}
Geschaetzte Kosten: ~$5-10/Monat bei maessiger Nutzung
Ausgewogene Einrichtung
// Gute Balance zwischen Qualitaet und Kosten
{
"model": {
"default": "claude-3-5-sonnet",
"maxOutputTokens": 1024,
"context": {
"maxMessages": 15,
"maxContextTokens": 4000,
"summarizeOldMessages": true
},
"routing": {
"enabled": true,
"rules": [
{ "pattern": "^(hi|hello|thanks|bye|ok)", "model": "claude-3-5-haiku" },
{ "pattern": ".*", "model": "claude-3-5-sonnet" }
]
}
},
"gateway": {
"caching": {
"enabled": true,
"ttl": 3600
}
}
}
Geschaetzte Kosten: ~$15-30/Monat bei maessiger Nutzung
Qualitaetsorientierte Einrichtung
// Maximale Qualitaet, Kosten sekundaer
{
"model": {
"default": "claude-sonnet-4",
"maxOutputTokens": 4096,
"context": {
"maxMessages": 30,
"maxContextTokens": 16000
},
"routing": {
"enabled": true,
"rules": [
{ "pattern": "(analyze|research|complex|detailed)", "model": "claude-opus-4" },
{ "pattern": ".*", "model": "claude-sonnet-4" }
]
}
}
}
Geschaetzte Kosten: ~$50-100/Monat bei maessiger Nutzung
Multi-Provider-Einrichtung (Fortgeschritten)
Mehrere Anbieter nutzen, um Kosten zu optimieren:
// ~/.openclaw/openclaw.json
{
"providers": {
"anthropic": {
"apiKey": "${ANTHROPIC_API_KEY}",
"models": ["claude-3-5-haiku", "claude-sonnet-4"]
},
"openai": {
"apiKey": "${OPENAI_API_KEY}",
"models": ["gpt-4o-mini"]
}
},
"model": {
"routing": {
"enabled": true,
"rules": [
{ "pattern": "^(hi|hello|what time)", "provider": "openai", "model": "gpt-4o-mini" },
{ "pattern": ".*", "provider": "anthropic", "model": "claude-3-5-sonnet" }
]
}
}
}
Tipps zur Kostenreduzierung
- Prompts spezifisch formulieren - Vage Prompts fuehren zu laengeren Antworten
- System-Prompts klug nutzen - Halten Sie sie praegnant
- Kontext periodisch loeschen - Lassen Sie den Verlauf nicht unbegrenzt wachsen
- Haeufige Abfragen cachen - FAQs, Begruessungen usw.
- Nutzung woechentlich ueberwachen - Unerwartete Spitzen frueh erkennen
- Haiku zum Testen verwenden - Fuer Produktion zu Sonnet wechseln
Erwartete Kosten berechnen
Verwenden Sie diese Formel:
Monatliche Kosten = (Taegliche Nachrichten × Durchschn. Input-Tokens × Input-Preis) +
(Taegliche Nachrichten × Durchschn. Output-Tokens × Output-Preis) × 30
Beispiel fuer 50 Nachrichten/Tag mit Claude 3.5 Sonnet:
- Durchschn. Input: 800 Tokens
- Durchschn. Output: 400 Tokens
Input: 50 × 800 × ($3/1M) × 30 = $3,60 Output: 50 × 400 × ($15/1M) × 30 = $9,00 Gesamt: ~$12,60/Monat