OpenClaw
Optimierung10 Min. Lesezeit

OpenClaw Modellauswahl und Kostenoptimierungsanleitung

Vergleichen Sie KI-Modelle für OpenClaw, verstehen Sie die Preisgestaltung und lernen Sie Strategien zur Kostenoptimierung bei gleichbleibender Antwortqualität.

O

OpenClaw Guides

Tutorial Authors

KI-Modell-Preisgestaltung verstehen

KI-Modelle berechnen basierend auf Tokens - Textblöcke, die ungefähr 4 Zeichen oder 0,75 Wörter umfassen. Sie zahlen für beides:

  • Input-Tokens: Der Text, den Sie senden (Ihre Nachricht + Gesprächsverlauf)
  • Output-Tokens: Der Text, den das Modell generiert (Antworten)

Verfügbare Modelle in OpenClaw

OpenClaw unterstützt Anthropics Claude-Modelle und andere Anbieter über OpenRouter. Hier sind die am häufigsten verwendeten Modelle:

Claude-Modelle (Anthropic)

ModellInput-PreisOutput-PreisAm besten für
Claude Haiku 4.5$1,00/1M$5,00/1MSchnelle Aufgaben, hohes Volumen
Claude Sonnet 4$3,00/1M$15,00/1MAusgewogene Leistung
Claude Sonnet 4.5$3,00/1M$15,00/1MVerbessertes Reasoning
Claude Opus 4.6$5,00/1M$25,00/1MLeistungsfähigstes, Forschung

Preise Stand Anfang 2026. Prüfen Sie die Anthropic-Preisseite für aktuelle Tarife.

Kostenvergleichsbeispiel

Für ein typisches Gespräch mit 1.000 Input-Tokens und 500 Output-Tokens:

ModellInput-KostenOutput-KostenGesamt
Claude Haiku 4.5$0,001$0,0025$0,0035
Claude Sonnet 4$0,003$0,0075$0,0105
Claude Opus 4.6$0,005$0,0125$0,0175

Haiku ist 3x günstiger als Sonnet und 5x günstiger als Opus!

Das richtige Modell wählen

Verwenden Sie Claude Haiku 4.5 wenn:

  • Einfache Fragen beantwortet werden
  • Schnelle Abfragen und Fakten nötig sind
  • Hohes Nachrichtenaufkommen (WhatsApp, Telegram)
  • Kosten ein Hauptanliegen sind
  • Geschwindigkeit wichtiger als Tiefe ist

Setzen Sie es als Standardmodell in ~/.openclaw/openclaw.json:

json
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-haiku-4-5"
      }
    }
  }
}

Verwenden Sie Claude Sonnet 4 / 4.5 wenn:

  • Schreibunterstützung benötigt wird
  • Code-Generierung oder -Überprüfung
  • Mäßig komplexe Aufgaben
  • Balance zwischen Qualität und Kosten
  • Die meisten alltäglichen Anwendungsfälle
json
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-sonnet-4"
      }
    }
  }
}

Verwenden Sie Claude Opus 4.6 wenn:

  • Komplexe Analyse erforderlich ist
  • Forschung und tiefgreifende Schlussfolgerungen
  • Kritische Geschäftsentscheidungen
  • Qualität oberste Priorität hat
  • Kosten kein Anliegen sind
json
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-opus-4-6"
      }
    }
  }
}

Modell-Routing nach Kanal

OpenClaw ermöglicht es, verschiedenen Kanälen unterschiedliche Modelle zuzuweisen, indem Sie modelByChannel verwenden. Das ist der effektivste Weg zur Kostenoptimierung — verwenden Sie ein günstigeres Modell für Casual-Kanäle und ein leistungsfähigeres für die Arbeit:

json
// ~/.openclaw/openclaw.json
{
  "channels": {
    "modelByChannel": {
      "whatsapp": {
        "default": "anthropic/claude-haiku-4-5"
      },
      "telegram": {
        "default": "anthropic/claude-haiku-4-5"
      },
      "discord": {
        "default": "anthropic/claude-sonnet-4"
      },
      "slack": {
        "default": "anthropic/claude-sonnet-4"
      }
    }
  }
}

Sie können auch ein Modell-Failover einrichten — wenn das primäre Modell nicht verfügbar ist, probiert OpenClaw die Fallback-Modelle der Reihe nach:

json
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-sonnet-4",
        "fallbacks": [
          "anthropic/claude-haiku-4-5"
        ]
      }
    }
  }
}

Community Auto-Router

Für noch intelligenteres Routing basierend auf Nachrichtenkomplexität können Community-Projekte wie iblai-openclaw-router und ClawRoute einfache Anfragen automatisch an Haiku und komplexe an Sonnet oder Opus weiterleiten.

Kostenoptimierungsstrategien

1. Gesprächsverlauf begrenzen

Der Gesprächsverlauf summiert sich schnell. Begrenzen Sie, wie viel gesendet wird, mit historyLimit:

json
// ~/.openclaw/openclaw.json
{
  "messages": {
    "groupChat": {
      "historyLimit": 10
    }
  },
  "channels": {
    "whatsapp": {
      "dmHistoryLimit": 8
    },
    "telegram": {
      "dmHistoryLimit": 8
    },
    "discord": {
      "historyLimit": 15
    }
  }
}

Halten Sie Casual-Kanäle (WhatsApp, Telegram) bei 8-10 Nachrichten und Arbeitskanäle (Discord, Slack) bei 15-20. Das reduziert die Input-Tokens pro Anfrage erheblich.

2. Anthropics Prompt Caching nutzen

Anthropic bietet Prompt Caching, das die Kosten für wiederholten Kontext (System-Prompts, Gesprächspräfixe) drastisch senkt:

VorgangKostenmultiplikator
Cache-Schreiben (erste Anfrage)1,25x Basis-Input-Preis
Cache-Lesen (danach)0,1x Basis-Input-Preis

Das ist ein 90% Rabatt auf gecachte Inhalte nach der ersten Anfrage. Wenn Ihr System-Prompt 1.000 Tokens umfasst und Sie 50 Nachrichten senden, zahlen Sie einmal den vollen Preis und 10% für die anderen 49.

OpenClaw unterstützt dies, wenn Ihr API-Anbieter Caching aktiviert hat. Prüfen Sie Ihr Anthropic-Dashboard auf „Cache Read Tokens" in Ihrer Nutzung.

3. Ein günstigeres Standardmodell wählen

Die einfachste Optimierung: Wechseln Sie Ihr Standardmodell von Sonnet zu Haiku für die meisten Anwendungsfälle. Für 80% der täglichen Interaktionen (schnelle Fragen, Abfragen, Erinnerungen, Smalltalk) leistet Haiku genauso gut — zu einem Bruchteil der Kosten.

Verwenden Sie modelByChannel, um Sonnet oder Opus auf bestimmten Arbeitskanälen zu behalten, wo Qualität am wichtigsten ist.

4. Modellkatalog mit Aliasen verwenden

Definieren Sie einen Modellkatalog, um mehrere Modelle einfach zu verwalten und Kosten im Blick zu behalten:

json
{
  "agents": {
    "defaults": {
      "models": {
        "anthropic/claude-haiku-4-5": {
          "alias": "fast",
          "cost": { "input": 1.0, "output": 5.0 }
        },
        "anthropic/claude-sonnet-4": {
          "alias": "balanced",
          "cost": { "input": 3.0, "output": 15.0 }
        },
        "anthropic/claude-opus-4-6": {
          "alias": "powerful",
          "cost": { "input": 5.0, "output": 25.0 }
        }
      }
    }
  }
}

5. Batch API für nicht-dringende Aufgaben nutzen

Wenn Sie nicht zeitkritische Aufgaben haben, bietet Anthropics Batch API einen 50% Rabatt auf Input- und Output-Tokens:

ModellStandard-OutputBatch-Output
Claude Haiku 4.5$5,00/1M$2,50/1M
Claude Sonnet 4$15,00/1M$7,50/1M
Claude Opus 4.6$25,00/1M$12,50/1M

Kosten überwachen

Echtzeit-Nutzung

bash
# Aktuelle Nutzung anzeigen
openclaw stats

# Ausgabe:
# Today's Usage:
#   Input tokens:  45,230
#   Output tokens: 12,450
#   Estimated cost: $0.23
#
# This month:
#   Total tokens: 1,234,567
#   Estimated cost: $8.45

Detaillierte Berichte

bash
# Kostenbericht erstellen
openclaw stats --report monthly

# Nach CSV exportieren
openclaw stats --export costs.csv --period 30d

Anthropic Console Limits

Setzen Sie monatliche Ausgabelimits direkt in der Anthropic Console, um überraschende Rechnungen zu vermeiden. Das ist der zuverlässigste Weg, ein Budget durchzusetzen — wenn Sie das Limit erreichen, akzeptiert die API keine Anfragen mehr.

Kostensparende Konfigurationsvorlagen

Budgetbewusste Einrichtung

json
// Optimiert für minimale Kosten
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-haiku-4-5"
      }
    }
  },
  "messages": {
    "groupChat": {
      "historyLimit": 5
    }
  }
}

Geschätzte Kosten: ~$5-10/Monat bei mäßiger Nutzung

Ausgewogene Einrichtung

json
// Gute Balance zwischen Qualität und Kosten
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-sonnet-4",
        "fallbacks": ["anthropic/claude-haiku-4-5"]
      }
    }
  },
  "channels": {
    "modelByChannel": {
      "whatsapp": { "default": "anthropic/claude-haiku-4-5" },
      "telegram": { "default": "anthropic/claude-haiku-4-5" }
    }
  },
  "messages": {
    "groupChat": {
      "historyLimit": 15
    }
  }
}

Geschätzte Kosten: ~$15-25/Monat bei mäßiger Nutzung

Qualitätsorientierte Einrichtung

json
// Maximale Qualität, Kosten sekundär
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-sonnet-4",
        "fallbacks": ["anthropic/claude-opus-4-6"]
      }
    }
  },
  "channels": {
    "modelByChannel": {
      "discord": { "default": "anthropic/claude-opus-4-6" },
      "slack": { "default": "anthropic/claude-opus-4-6" }
    }
  },
  "messages": {
    "groupChat": {
      "historyLimit": 25
    }
  }
}

Geschätzte Kosten: ~$30-50/Monat bei mäßiger Nutzung

Multi-Provider-Einrichtung (Fortgeschritten)

Mehrere Anbieter über OpenRouter nutzen, um Kosten zu optimieren:

json
// ~/.openclaw/openclaw.json
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-sonnet-4",
        "fallbacks": [
          "openrouter/google/gemini-2.5-flash",
          "anthropic/claude-haiku-4-5"
        ]
      }
    }
  }
}

OpenClaw verwendet das Format provider/model für Modell-IDs. Für OpenRouter-Modelle verwenden Sie das Format openrouter/author/slug.

Tipps zur Kostenreduzierung

  1. Prompts spezifisch formulieren - Vage Prompts führen zu längeren Antworten
  2. System-Prompts klug nutzen - Halten Sie sie prägnant
  3. Verlauf pro Kanal begrenzen - Casual-Kanäle brauchen keinen Kontext von 20 Nachrichten
  4. Prompt Caching aktivieren - 90% Ersparnis bei wiederholtem Kontext
  5. Nutzung wöchentlich überwachen - Unerwartete Spitzen früh erkennen mit openclaw stats
  6. Haiku zum Testen verwenden - Für Produktion zu Sonnet wechseln

Erwartete Kosten berechnen

Verwenden Sie diese Formel:

Monatliche Kosten = (Tägliche Nachrichten × Durchschn. Input-Tokens × Input-Preis) +
                    (Tägliche Nachrichten × Durchschn. Output-Tokens × Output-Preis) × 30

Beispiel für 50 Nachrichten/Tag mit Claude Sonnet 4:

  • Durchschn. Input: 800 Tokens
  • Durchschn. Output: 400 Tokens
Input:  50 × 800 × ($3/1M) × 30 = $3,60
Output: 50 × 400 × ($15/1M) × 30 = $9,00
Gesamt: ~$12,60/Monat

Mit der Hälfte Ihrer Nachrichten an Haiku 4.5 geroutet:

Haiku-Anteil:  25 × 800 × ($1/1M) × 30 + 25 × 400 × ($5/1M) × 30 = $0,60 + $1,50 = $2,10
Sonnet-Anteil: 25 × 800 × ($3/1M) × 30 + 25 × 400 × ($15/1M) × 30 = $1,80 + $4,50 = $6,30
Gesamt: ~$8,40/Monat

Das ist eine Ersparnis von 33% allein durch Modell-Routing — und mit Prompt Caching obendrauf noch mehr.

Nächste Schritte