Optimierung10 Min. Lesezeit

OpenClaw Modellauswahl und Kostenoptimierungsanleitung

Vergleichen Sie KI-Modelle für OpenClaw, verstehen Sie die Preisgestaltung und lernen Sie Strategien zur Kostenoptimierung bei gleichbleibender Antwortqualität.

OpenClaw Guides

Tutorial Authors

2025-02-04

KI-Modell-Preisgestaltung verstehen

KI-Modelle berechnen basierend auf Tokens - Textblöcke, die ungefähr 4 Zeichen oder 0,75 Wörter umfassen. Sie zahlen für beides:

Input-Tokens: Der Text, den Sie senden (Ihre Nachricht + Gesprächsverlauf)
Output-Tokens: Der Text, den das Modell generiert (Antworten)

Verfügbare Modelle in OpenClaw

OpenClaw unterstützt Anthropics Claude-Modelle und andere Anbieter über OpenRouter. Hier sind die am häufigsten verwendeten Modelle:

Claude-Modelle (Anthropic)

Modell	Input-Preis	Output-Preis	Am besten für
Claude Haiku 4.5	$1,00/1M	$5,00/1M	Schnelle Aufgaben, hohes Volumen
Claude Sonnet 4	$3,00/1M	$15,00/1M	Ausgewogene Leistung
Claude Sonnet 4.5	$3,00/1M	$15,00/1M	Verbessertes Reasoning
Claude Opus 4.6	$5,00/1M	$25,00/1M	Leistungsfähigstes, Forschung

Preise Stand Anfang 2026. Prüfen Sie die Anthropic-Preisseite für aktuelle Tarife.

Kostenvergleichsbeispiel

Für ein typisches Gespräch mit 1.000 Input-Tokens und 500 Output-Tokens:

Modell	Input-Kosten	Output-Kosten	Gesamt
Claude Haiku 4.5	$0,001	$0,0025	$0,0035
Claude Sonnet 4	$0,003	$0,0075	$0,0105
Claude Opus 4.6	$0,005	$0,0125	$0,0175

Haiku ist 3x günstiger als Sonnet und 5x günstiger als Opus!

Das richtige Modell wählen

Verwenden Sie Claude Haiku 4.5 wenn:

Einfache Fragen beantwortet werden
Schnelle Abfragen und Fakten nötig sind
Hohes Nachrichtenaufkommen (WhatsApp, Telegram)
Kosten ein Hauptanliegen sind
Geschwindigkeit wichtiger als Tiefe ist

Setzen Sie es als Standardmodell in ~/.openclaw/openclaw.json:

json

{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-haiku-4-5"
      }
    }
  }
}

Verwenden Sie Claude Sonnet 4 / 4.5 wenn:

Schreibunterstützung benötigt wird
Code-Generierung oder -Überprüfung
Mäßig komplexe Aufgaben
Balance zwischen Qualität und Kosten
Die meisten alltäglichen Anwendungsfälle

json

{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-sonnet-4"
      }
    }
  }
}

Verwenden Sie Claude Opus 4.6 wenn:

Komplexe Analyse erforderlich ist
Forschung und tiefgreifende Schlussfolgerungen
Kritische Geschäftsentscheidungen
Qualität oberste Priorität hat
Kosten kein Anliegen sind

json

{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-opus-4-6"
      }
    }
  }
}

Modell-Routing nach Kanal

OpenClaw ermöglicht es, verschiedenen Kanälen unterschiedliche Modelle zuzuweisen, indem Sie modelByChannel verwenden. Das ist der effektivste Weg zur Kostenoptimierung — verwenden Sie ein günstigeres Modell für Casual-Kanäle und ein leistungsfähigeres für die Arbeit:

json

// ~/.openclaw/openclaw.json
{
  "channels": {
    "modelByChannel": {
      "whatsapp": {
        "default": "anthropic/claude-haiku-4-5"
      },
      "telegram": {
        "default": "anthropic/claude-haiku-4-5"
      },
      "discord": {
        "default": "anthropic/claude-sonnet-4"
      },
      "slack": {
        "default": "anthropic/claude-sonnet-4"
      }
    }
  }
}

Sie können auch ein Modell-Failover einrichten — wenn das primäre Modell nicht verfügbar ist, probiert OpenClaw die Fallback-Modelle der Reihe nach:

json

{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-sonnet-4",
        "fallbacks": [
          "anthropic/claude-haiku-4-5"
        ]
      }
    }
  }
}

Community Auto-Router

Für noch intelligenteres Routing basierend auf Nachrichtenkomplexität können Community-Projekte wie iblai-openclaw-router und ClawRoute einfache Anfragen automatisch an Haiku und komplexe an Sonnet oder Opus weiterleiten.

Kostenoptimierungsstrategien

1. Gesprächsverlauf begrenzen

Der Gesprächsverlauf summiert sich schnell. Begrenzen Sie, wie viel gesendet wird, mit historyLimit:

json

// ~/.openclaw/openclaw.json
{
  "messages": {
    "groupChat": {
      "historyLimit": 10
    }
  },
  "channels": {
    "whatsapp": {
      "dmHistoryLimit": 8
    },
    "telegram": {
      "dmHistoryLimit": 8
    },
    "discord": {
      "historyLimit": 15
    }
  }
}

Halten Sie Casual-Kanäle (WhatsApp, Telegram) bei 8-10 Nachrichten und Arbeitskanäle (Discord, Slack) bei 15-20. Das reduziert die Input-Tokens pro Anfrage erheblich.

2. Anthropics Prompt Caching nutzen

Anthropic bietet Prompt Caching, das die Kosten für wiederholten Kontext (System-Prompts, Gesprächspräfixe) drastisch senkt:

Vorgang	Kostenmultiplikator
Cache-Schreiben (erste Anfrage)	1,25x Basis-Input-Preis
Cache-Lesen (danach)	0,1x Basis-Input-Preis

Das ist ein 90% Rabatt auf gecachte Inhalte nach der ersten Anfrage. Wenn Ihr System-Prompt 1.000 Tokens umfasst und Sie 50 Nachrichten senden, zahlen Sie einmal den vollen Preis und 10% für die anderen 49.

OpenClaw unterstützt dies, wenn Ihr API-Anbieter Caching aktiviert hat. Prüfen Sie Ihr Anthropic-Dashboard auf „Cache Read Tokens" in Ihrer Nutzung.

3. Ein günstigeres Standardmodell wählen

Die einfachste Optimierung: Wechseln Sie Ihr Standardmodell von Sonnet zu Haiku für die meisten Anwendungsfälle. Für 80% der täglichen Interaktionen (schnelle Fragen, Abfragen, Erinnerungen, Smalltalk) leistet Haiku genauso gut — zu einem Bruchteil der Kosten.

Verwenden Sie modelByChannel, um Sonnet oder Opus auf bestimmten Arbeitskanälen zu behalten, wo Qualität am wichtigsten ist.

4. Modellkatalog mit Aliasen verwenden

Definieren Sie einen Modellkatalog, um mehrere Modelle einfach zu verwalten und Kosten im Blick zu behalten:

json

{
  "agents": {
    "defaults": {
      "models": {
        "anthropic/claude-haiku-4-5": {
          "alias": "fast",
          "cost": { "input": 1.0, "output": 5.0 }
        },
        "anthropic/claude-sonnet-4": {
          "alias": "balanced",
          "cost": { "input": 3.0, "output": 15.0 }
        },
        "anthropic/claude-opus-4-6": {
          "alias": "powerful",
          "cost": { "input": 5.0, "output": 25.0 }
        }
      }
    }
  }
}

5. Batch API für nicht-dringende Aufgaben nutzen

Wenn Sie nicht zeitkritische Aufgaben haben, bietet Anthropics Batch API einen 50% Rabatt auf Input- und Output-Tokens:

Modell	Standard-Output	Batch-Output
Claude Haiku 4.5	$5,00/1M	$2,50/1M
Claude Sonnet 4	$15,00/1M	$7,50/1M
Claude Opus 4.6	$25,00/1M	$12,50/1M

Kosten überwachen

Echtzeit-Nutzung

bash

# Aktuelle Nutzung anzeigen
openclaw stats

# Ausgabe:
# Today's Usage:
#   Input tokens:  45,230
#   Output tokens: 12,450
#   Estimated cost: $0.23
#
# This month:
#   Total tokens: 1,234,567
#   Estimated cost: $8.45

Detaillierte Berichte

bash

# Kostenbericht erstellen
openclaw stats --report monthly

# Nach CSV exportieren
openclaw stats --export costs.csv --period 30d

Anthropic Console Limits

Setzen Sie monatliche Ausgabelimits direkt in der Anthropic Console, um überraschende Rechnungen zu vermeiden. Das ist der zuverlässigste Weg, ein Budget durchzusetzen — wenn Sie das Limit erreichen, akzeptiert die API keine Anfragen mehr.

Kostensparende Konfigurationsvorlagen

Budgetbewusste Einrichtung

json

// Optimiert für minimale Kosten
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-haiku-4-5"
      }
    }
  },
  "messages": {
    "groupChat": {
      "historyLimit": 5
    }
  }
}

Geschätzte Kosten: ~$5-10/Monat bei mäßiger Nutzung

Ausgewogene Einrichtung

json

// Gute Balance zwischen Qualität und Kosten
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-sonnet-4",
        "fallbacks": ["anthropic/claude-haiku-4-5"]
      }
    }
  },
  "channels": {
    "modelByChannel": {
      "whatsapp": { "default": "anthropic/claude-haiku-4-5" },
      "telegram": { "default": "anthropic/claude-haiku-4-5" }
    }
  },
  "messages": {
    "groupChat": {
      "historyLimit": 15
    }
  }
}

Geschätzte Kosten: ~$15-25/Monat bei mäßiger Nutzung

Qualitätsorientierte Einrichtung

json

// Maximale Qualität, Kosten sekundär
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-sonnet-4",
        "fallbacks": ["anthropic/claude-opus-4-6"]
      }
    }
  },
  "channels": {
    "modelByChannel": {
      "discord": { "default": "anthropic/claude-opus-4-6" },
      "slack": { "default": "anthropic/claude-opus-4-6" }
    }
  },
  "messages": {
    "groupChat": {
      "historyLimit": 25
    }
  }
}

Geschätzte Kosten: ~$30-50/Monat bei mäßiger Nutzung

Multi-Provider-Einrichtung (Fortgeschritten)

Mehrere Anbieter über OpenRouter nutzen, um Kosten zu optimieren:

json

// ~/.openclaw/openclaw.json
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-sonnet-4",
        "fallbacks": [
          "openrouter/google/gemini-2.5-flash",
          "anthropic/claude-haiku-4-5"
        ]
      }
    }
  }
}

OpenClaw verwendet das Format provider/model für Modell-IDs. Für OpenRouter-Modelle verwenden Sie das Format openrouter/author/slug.

Tipps zur Kostenreduzierung

Prompts spezifisch formulieren - Vage Prompts führen zu längeren Antworten
System-Prompts klug nutzen - Halten Sie sie prägnant
Verlauf pro Kanal begrenzen - Casual-Kanäle brauchen keinen Kontext von 20 Nachrichten
Prompt Caching aktivieren - 90% Ersparnis bei wiederholtem Kontext
Nutzung wöchentlich überwachen - Unerwartete Spitzen früh erkennen mit openclaw stats
Haiku zum Testen verwenden - Für Produktion zu Sonnet wechseln

Erwartete Kosten berechnen

Verwenden Sie diese Formel:

Monatliche Kosten = (Tägliche Nachrichten × Durchschn. Input-Tokens × Input-Preis) +
                    (Tägliche Nachrichten × Durchschn. Output-Tokens × Output-Preis) × 30

Beispiel für 50 Nachrichten/Tag mit Claude Sonnet 4:

Durchschn. Input: 800 Tokens
Durchschn. Output: 400 Tokens

Input:  50 × 800 × ($3/1M) × 30 = $3,60
Output: 50 × 400 × ($15/1M) × 30 = $9,00
Gesamt: ~$12,60/Monat

Mit der Hälfte Ihrer Nachrichten an Haiku 4.5 geroutet:

Haiku-Anteil:  25 × 800 × ($1/1M) × 30 + 25 × 400 × ($5/1M) × 30 = $0,60 + $1,50 = $2,10
Sonnet-Anteil: 25 × 800 × ($3/1M) × 30 + 25 × 400 × ($15/1M) × 30 = $1,80 + $4,50 = $6,30
Gesamt: ~$8,40/Monat

Das ist eine Ersparnis von 33% allein durch Modell-Routing — und mit Prompt Caching obendrauf noch mehr.

KI-Modell-Preisgestaltung verstehen

Verfügbare Modelle in OpenClaw

Claude-Modelle (Anthropic)

Kostenvergleichsbeispiel

Das richtige Modell wählen

Verwenden Sie Claude Haiku 4.5 wenn:

Verwenden Sie Claude Sonnet 4 / 4.5 wenn:

Verwenden Sie Claude Opus 4.6 wenn:

Modell-Routing nach Kanal

Community Auto-Router

Kostenoptimierungsstrategien

1. Gesprächsverlauf begrenzen

2. Anthropics Prompt Caching nutzen

3. Ein günstigeres Standardmodell wählen

4. Modellkatalog mit Aliasen verwenden

5. Batch API für nicht-dringende Aufgaben nutzen

Kosten überwachen

Echtzeit-Nutzung

Detaillierte Berichte

Anthropic Console Limits

Kostensparende Konfigurationsvorlagen

Budgetbewusste Einrichtung

Ausgewogene Einrichtung

Qualitätsorientierte Einrichtung

Multi-Provider-Einrichtung (Fortgeschritten)

Tipps zur Kostenreduzierung

Erwartete Kosten berechnen

Nächste Schritte