OpenClaw
Optimierung10 Min. Lesezeit

OpenClaw Modellauswahl und Kostenoptimierungsanleitung

Vergleichen Sie KI-Modelle fuer OpenClaw, verstehen Sie die Preisgestaltung und lernen Sie Strategien zur Kostenoptimierung bei gleichbleibender Antwortqualitaet.

O

OpenClaw Guides

Tutorial Authors

KI-Modell-Preisgestaltung verstehen

KI-Modelle berechnen basierend auf Tokens - Textbloecke, die ungefaehr 4 Zeichen oder 0,75 Woerter umfassen. Sie zahlen fuer beides:

  • Input-Tokens: Der Text, den Sie senden (Ihre Nachricht + Gespraechsverlauf)
  • Output-Tokens: Der Text, den das Modell generiert (Antworten)

Verfuegbare Modelle in OpenClaw

OpenClaw unterstuetzt hauptsaechlich Anthropics Claude-Modelle, mit optionaler Unterstuetzung fuer andere Anbieter.

Claude-Modelle (Anthropic)

| Modell | Input-Preis | Output-Preis | Am besten fuer | |--------|-------------|--------------|----------------| | Claude 3.5 Haiku | $0,25/1M | $1,25/1M | Schnelle Aufgaben, hohe Volumen | | Claude 3.5 Sonnet | $3,00/1M | $15,00/1M | Ausgewogene Leistung | | Claude Sonnet 4 | $3,00/1M | $15,00/1M | Komplexe Schlussfolgerungen | | Claude Opus 4 | $15,00/1M | $75,00/1M | Leistungsfaehigstes, Forschung |

Preise Stand Anfang 2026. Pruefen Sie die Anthropic-Preisseite fuer aktuelle Tarife.

Kostenvergleichsbeispiel

Fuer ein typisches Gespraech mit 1.000 Input-Tokens und 500 Output-Tokens:

| Modell | Input-Kosten | Output-Kosten | Gesamt | |--------|--------------|---------------|--------| | Claude 3.5 Haiku | $0,00025 | $0,000625 | $0,000875 | | Claude 3.5 Sonnet | $0,003 | $0,0075 | $0,0105 | | Claude Opus 4 | $0,015 | $0,0375 | $0,0525 |

Haiku ist 12x guenstiger als Sonnet und 60x guenstiger als Opus!

Das richtige Modell waehlen

Verwenden Sie Claude 3.5 Haiku wenn:

  • Einfache Fragen beantwortet werden
  • Schnelle Abfragen und Fakten noetig sind
  • Hohes Nachrichtenaufkommen (WhatsApp, Telegram)
  • Kosten ein Hauptanliegen sind
  • Geschwindigkeit wichtiger als Tiefe ist
json
// ~/.openclaw/openclaw.json
{
  "model": {
    "default": "claude-3-5-haiku"
  }
}

Verwenden Sie Claude 3.5 Sonnet / Sonnet 4 wenn:

  • Schreibunterstuetzung benoetigt wird
  • Code-Generierung oder -Ueberpruefung
  • Maessig komplexe Aufgaben
  • Balance zwischen Qualitaet und Kosten
  • Die meisten alltaeglichen Anwendungsfaelle
json
// ~/.openclaw/openclaw.json
{
  "model": {
    "default": "claude-sonnet-4"
  }
}

Verwenden Sie Claude Opus 4 wenn:

  • Komplexe Analyse erforderlich ist
  • Forschung und tiefgreifende Schlussfolgerungen
  • Kritische Geschaeftsentscheidungen
  • Qualitaet oberste Prioritaet hat
  • Kosten kein Anliegen sind
json
// ~/.openclaw/openclaw.json
{
  "model": {
    "default": "claude-opus-4"
  }
}

Dynamisches Modell-Routing

OpenClaw kann Modelle automatisch basierend auf der Aufgabe auswaehlen:

json
// ~/.openclaw/openclaw.json
{
  "model": {
    "routing": {
      "enabled": true,
      "rules": [
        {
          "pattern": "^(hi|hello|hey|thanks|ok|bye)",
          "model": "claude-3-5-haiku"
        },
        {
          "pattern": "(code|function|bug|error|programming)",
          "model": "claude-sonnet-4"
        },
        {
          "pattern": "(analyze deeply|complex|thorough)",
          "model": "claude-opus-4"
        },
        {
          "pattern": ".*",
          "model": "claude-3-5-sonnet"
        }
      ]
    }
  }
}

Kostenoptimierungsstrategien

1. Kontextlaenge reduzieren

Der Gespraechsverlauf summiert sich schnell. Begrenzen Sie, wie viel gesendet wird:

json
// ~/.openclaw/openclaw.json
{
  "model": {
    "context": {
      "maxMessages": 10,
      "maxContextTokens": 4000,
      "summarizeOldMessages": true,
      "summaryThreshold": 20
    }
  }
}

2. Antwort-Caching aktivieren

Identische Abfragen cachen, um wiederholte API-Aufrufe zu vermeiden:

json
// ~/.openclaw/openclaw.json
{
  "gateway": {
    "caching": {
      "enabled": true,
      "ttl": 3600,
      "maxSize": 1000
    }
  }
}

3. Token-Limits setzen

Unerwartet lange (teure) Antworten verhindern:

json
// ~/.openclaw/openclaw.json
{
  "model": {
    "maxOutputTokens": 1024,
    "channelLimits": {
      "whatsapp": 500,
      "discord": 1500,
      "telegram": 800
    }
  }
}

4. Nutzungskontingente implementieren

Taegliche/monatliche Ausgabenlimits setzen:

json
// ~/.openclaw/openclaw.json
{
  "model": {
    "quotas": {
      "daily": {
        "enabled": true,
        "maxTokens": 100000,
        "maxCost": 1.00,
        "warningThreshold": 0.80
      },
      "monthly": {
        "enabled": true,
        "maxCost": 20.00
      }
    }
  }
}

5. Prompt-Kompression verwenden

Input-Tokens mit intelligenteren Prompts reduzieren:

json
// ~/.openclaw/openclaw.json
{
  "model": {
    "optimization": {
      "compressPrompts": true,
      "compactSystemPrompt": true,
      "deltaContext": true
    }
  }
}

Kosten ueberwachen

Echtzeit-Nutzung

bash
# Aktuelle Nutzung anzeigen
openclaw stats

# Ausgabe:
# Today's Usage:
#   Input tokens:  45,230
#   Output tokens: 12,450
#   Estimated cost: $0.23
#
# This month:
#   Total tokens: 1,234,567
#   Estimated cost: $8.45

Detaillierte Berichte

bash
# Kostenbericht erstellen
openclaw stats --report monthly

# Nach CSV exportieren
openclaw stats --export costs.csv --period 30d

Benachrichtigungen einrichten

json
// ~/.openclaw/openclaw.json
{
  "notifications": {
    "costAlerts": {
      "enabled": true,
      "thresholds": [
        { "amount": 5.00, "action": "notify" },
        { "amount": 10.00, "action": "warn" },
        { "amount": 20.00, "action": "pause" }
      ]
    }
  }
}

Kostensparende Konfigurationsvorlagen

Budgetbewusste Einrichtung

json
// Optimiert fuer minimale Kosten
{
  "model": {
    "default": "claude-3-5-haiku",
    "maxOutputTokens": 512,
    "context": {
      "maxMessages": 5,
      "maxContextTokens": 2000
    },
    "quotas": {
      "daily": {
        "enabled": true,
        "maxCost": 0.50
      }
    }
  },
  "gateway": {
    "caching": {
      "enabled": true,
      "ttl": 7200
    }
  }
}

Geschaetzte Kosten: ~$5-10/Monat bei maessiger Nutzung

Ausgewogene Einrichtung

json
// Gute Balance zwischen Qualitaet und Kosten
{
  "model": {
    "default": "claude-3-5-sonnet",
    "maxOutputTokens": 1024,
    "context": {
      "maxMessages": 15,
      "maxContextTokens": 4000,
      "summarizeOldMessages": true
    },
    "routing": {
      "enabled": true,
      "rules": [
        { "pattern": "^(hi|hello|thanks|bye|ok)", "model": "claude-3-5-haiku" },
        { "pattern": ".*", "model": "claude-3-5-sonnet" }
      ]
    }
  },
  "gateway": {
    "caching": {
      "enabled": true,
      "ttl": 3600
    }
  }
}

Geschaetzte Kosten: ~$15-30/Monat bei maessiger Nutzung

Qualitaetsorientierte Einrichtung

json
// Maximale Qualitaet, Kosten sekundaer
{
  "model": {
    "default": "claude-sonnet-4",
    "maxOutputTokens": 4096,
    "context": {
      "maxMessages": 30,
      "maxContextTokens": 16000
    },
    "routing": {
      "enabled": true,
      "rules": [
        { "pattern": "(analyze|research|complex|detailed)", "model": "claude-opus-4" },
        { "pattern": ".*", "model": "claude-sonnet-4" }
      ]
    }
  }
}

Geschaetzte Kosten: ~$50-100/Monat bei maessiger Nutzung

Multi-Provider-Einrichtung (Fortgeschritten)

Mehrere Anbieter nutzen, um Kosten zu optimieren:

json
// ~/.openclaw/openclaw.json
{
  "providers": {
    "anthropic": {
      "apiKey": "${ANTHROPIC_API_KEY}",
      "models": ["claude-3-5-haiku", "claude-sonnet-4"]
    },
    "openai": {
      "apiKey": "${OPENAI_API_KEY}",
      "models": ["gpt-4o-mini"]
    }
  },
  "model": {
    "routing": {
      "enabled": true,
      "rules": [
        { "pattern": "^(hi|hello|what time)", "provider": "openai", "model": "gpt-4o-mini" },
        { "pattern": ".*", "provider": "anthropic", "model": "claude-3-5-sonnet" }
      ]
    }
  }
}

Tipps zur Kostenreduzierung

  1. Prompts spezifisch formulieren - Vage Prompts fuehren zu laengeren Antworten
  2. System-Prompts klug nutzen - Halten Sie sie praegnant
  3. Kontext periodisch loeschen - Lassen Sie den Verlauf nicht unbegrenzt wachsen
  4. Haeufige Abfragen cachen - FAQs, Begruessungen usw.
  5. Nutzung woechentlich ueberwachen - Unerwartete Spitzen frueh erkennen
  6. Haiku zum Testen verwenden - Fuer Produktion zu Sonnet wechseln

Erwartete Kosten berechnen

Verwenden Sie diese Formel:

Monatliche Kosten = (Taegliche Nachrichten × Durchschn. Input-Tokens × Input-Preis) +
                    (Taegliche Nachrichten × Durchschn. Output-Tokens × Output-Preis) × 30

Beispiel fuer 50 Nachrichten/Tag mit Claude 3.5 Sonnet:

  • Durchschn. Input: 800 Tokens
  • Durchschn. Output: 400 Tokens
Input:  50 × 800 × ($3/1M) × 30 = $3,60
Output: 50 × 400 × ($15/1M) × 30 = $9,00
Gesamt: ~$12,60/Monat

Naechste Schritte