Guía de Selección de Modelos y Optimización de Costos de OpenClaw
Compara modelos de IA para OpenClaw, entiende los precios y aprende estrategias para optimizar costos mientras mantienes respuestas de calidad.
OpenClaw Guides
Tutorial Authors
Entendiendo los Precios de Modelos de IA
Los modelos de IA cobran basándose en tokens — fragmentos de texto que son aproximadamente 4 caracteres o 0.75 palabras. Pagas por ambos:
- Tokens de entrada: El texto que envías (tu mensaje + historial de conversación)
- Tokens de salida: El texto que genera el modelo (respuestas)
Modelos Disponibles en OpenClaw
OpenClaw soporta los modelos Claude de Anthropic y otros proveedores a través de OpenRouter. Estos son los modelos más utilizados:
Modelos Claude (Anthropic)
| Modelo | Precio Entrada | Precio Salida | Mejor Para |
|---|---|---|---|
| Claude Haiku 4.5 | $1.00/1M | $5.00/1M | Tareas rápidas, alto volumen |
| Claude Sonnet 4 | $3.00/1M | $15.00/1M | Rendimiento equilibrado |
| Claude Sonnet 4.5 | $3.00/1M | $15.00/1M | Razonamiento mejorado |
| Claude Opus 4.6 | $5.00/1M | $25.00/1M | Más capaz, investigación |
Precios a principios de 2026. Consulta la página de precios de Anthropic para tarifas actuales.
Ejemplo de Comparación de Costos
Para una conversación típica con 1,000 tokens de entrada y 500 tokens de salida:
| Modelo | Costo Entrada | Costo Salida | Total |
|---|---|---|---|
| Claude Haiku 4.5 | $0.001 | $0.0025 | $0.0035 |
| Claude Sonnet 4 | $0.003 | $0.0075 | $0.0105 |
| Claude Opus 4.6 | $0.005 | $0.0125 | $0.0175 |
¡Haiku es 3 veces más barato que Sonnet y 5 veces más barato que Opus!
Elegir el Modelo Correcto
Usa Claude Haiku 4.5 Cuando:
- Respondas preguntas simples
- Búsquedas rápidas y datos
- Mensajería de alto volumen (WhatsApp, Telegram)
- El costo es una preocupación principal
- La velocidad importa más que la profundidad
Configúralo como tu modelo predeterminado en ~/.openclaw/openclaw.json:
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-haiku-4-5"
}
}
}
}
Usa Claude Sonnet 4 / 4.5 Cuando:
- Se necesita asistencia de escritura
- Generación o revisión de código
- Tareas de complejidad moderada
- Balance de calidad y costo
- La mayoría de casos de uso cotidianos
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-sonnet-4"
}
}
}
}
Usa Claude Opus 4.6 Cuando:
- Se requiere análisis complejo
- Investigación y razonamiento profundo
- Decisiones críticas de negocio
- La calidad es primordial
- El costo no es una preocupación
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-opus-4-6"
}
}
}
}
Enrutamiento de Modelos por Canal
OpenClaw te permite asignar diferentes modelos a diferentes canales usando modelByChannel. Esta es la forma más efectiva de optimizar costos — usa un modelo más económico para canales casuales y uno más capaz para trabajo:
// ~/.openclaw/openclaw.json
{
"channels": {
"modelByChannel": {
"whatsapp": {
"default": "anthropic/claude-haiku-4-5"
},
"telegram": {
"default": "anthropic/claude-haiku-4-5"
},
"discord": {
"default": "anthropic/claude-sonnet-4"
},
"slack": {
"default": "anthropic/claude-sonnet-4"
}
}
}
}
También puedes configurar failover de modelos — si el modelo principal no está disponible, OpenClaw probará los modelos de respaldo en orden:
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-sonnet-4",
"fallbacks": [
"anthropic/claude-haiku-4-5"
]
}
}
}
}
Auto-Routers de la Comunidad
Para un enrutamiento aún más inteligente basado en la complejidad del mensaje, proyectos comunitarios como iblai-openclaw-router y ClawRoute pueden enrutar automáticamente consultas simples a Haiku y las complejas a Sonnet u Opus.
Estrategias de Optimización de Costos
1. Limita el Historial de Conversación
El historial de conversación se acumula rápido. Limita cuánto se envía usando historyLimit:
// ~/.openclaw/openclaw.json
{
"messages": {
"groupChat": {
"historyLimit": 10
}
},
"channels": {
"whatsapp": {
"dmHistoryLimit": 8
},
"telegram": {
"dmHistoryLimit": 8
},
"discord": {
"historyLimit": 15
}
}
}
Mantén los canales casuales (WhatsApp, Telegram) en 8-10 mensajes y los canales de trabajo (Discord, Slack) en 15-20. Esto reduce significativamente los tokens de entrada por solicitud.
2. Usa el Caché de Prompts de Anthropic
Anthropic ofrece caché de prompts que reduce drásticamente los costos para contexto repetido (prompts de sistema, prefijos de conversación):
| Operación | Multiplicador de Costo |
|---|---|
| Escritura en caché (primera solicitud) | 1.25x precio base de entrada |
| Lectura de caché (posteriores) | 0.1x precio base de entrada |
Eso es un 90% de descuento en contenido cacheado después de la primera solicitud. Si tu prompt de sistema tiene 1,000 tokens y envías 50 mensajes, pagas precio completo una vez y 10% por los otros 49.
OpenClaw soporta esto cuando tu proveedor de API tiene el caché habilitado. Verifica los "cache read tokens" en tu panel de Anthropic.
3. Elige un Modelo Predeterminado Más Económico
La optimización más simple: cambia tu predeterminado de Sonnet a Haiku para la mayoría de los casos de uso. Para el 80% de las interacciones diarias (Q&A rápido, búsquedas, recordatorios, conversación casual), Haiku funciona igual de bien a una fracción del costo.
Usa modelByChannel para mantener Sonnet u Opus en canales de trabajo específicos donde la calidad es más importante.
4. Usa un Catálogo de Modelos con Alias
Define un catálogo de modelos para gestionar múltiples modelos fácilmente y hacer seguimiento de costos:
{
"agents": {
"defaults": {
"models": {
"anthropic/claude-haiku-4-5": {
"alias": "fast",
"cost": { "input": 1.0, "output": 5.0 }
},
"anthropic/claude-sonnet-4": {
"alias": "balanced",
"cost": { "input": 3.0, "output": 15.0 }
},
"anthropic/claude-opus-4-6": {
"alias": "powerful",
"cost": { "input": 5.0, "output": 25.0 }
}
}
}
}
}
5. Usa la API de Lotes para Tareas No Urgentes
Si tienes cargas de trabajo que no son sensibles al tiempo, la API de Lotes de Anthropic ofrece un 50% de descuento tanto en tokens de entrada como de salida:
| Modelo | Salida Estándar | Salida por Lotes |
|---|---|---|
| Claude Haiku 4.5 | $5.00/1M | $2.50/1M |
| Claude Sonnet 4 | $15.00/1M | $7.50/1M |
| Claude Opus 4.6 | $25.00/1M | $12.50/1M |
Monitoreo de Costos
Uso en Tiempo Real
# Ver uso actual openclaw stats # Salida: # Today's Usage: # Input tokens: 45,230 # Output tokens: 12,450 # Estimated cost: $0.23 # # This month: # Total tokens: 1,234,567 # Estimated cost: $8.45
Informes Detallados
# Generar informe de costos openclaw stats --report monthly # Exportar a CSV openclaw stats --export costs.csv --period 30d
Límites de la Consola de Anthropic
Establece topes de gasto mensual directamente en la Consola de Anthropic para prevenir facturas inesperadas. Esta es la forma más confiable de aplicar un presupuesto — si alcanzas el tope, la API deja de aceptar solicitudes.
Plantillas de Configuración para Ahorro de Costos
Configuración Consciente del Presupuesto
// Optimizado para costo mínimo
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-haiku-4-5"
}
}
},
"messages": {
"groupChat": {
"historyLimit": 5
}
}
}
Costo estimado: ~$5-10/mes con uso moderado
Configuración Equilibrada
// Buen balance de calidad y costo
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-sonnet-4",
"fallbacks": ["anthropic/claude-haiku-4-5"]
}
}
},
"channels": {
"modelByChannel": {
"whatsapp": { "default": "anthropic/claude-haiku-4-5" },
"telegram": { "default": "anthropic/claude-haiku-4-5" }
}
},
"messages": {
"groupChat": {
"historyLimit": 15
}
}
}
Costo estimado: ~$15-25/mes con uso moderado
Configuración Prioridad Calidad
// Máxima calidad, costo secundario
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-sonnet-4",
"fallbacks": ["anthropic/claude-opus-4-6"]
}
}
},
"channels": {
"modelByChannel": {
"discord": { "default": "anthropic/claude-opus-4-6" },
"slack": { "default": "anthropic/claude-opus-4-6" }
}
},
"messages": {
"groupChat": {
"historyLimit": 25
}
}
}
Costo estimado: ~$30-50/mes con uso moderado
Configuración Multi-Proveedor (Avanzado)
Usa múltiples proveedores a través de OpenRouter para optimizar costos:
// ~/.openclaw/openclaw.json
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-sonnet-4",
"fallbacks": [
"openrouter/google/gemini-2.5-flash",
"anthropic/claude-haiku-4-5"
]
}
}
}
}
OpenClaw usa el formato provider/model para los IDs de modelo. Para modelos de OpenRouter, usa el formato openrouter/author/slug.
Consejos para Reducir Costos
- Sé específico en los prompts — Los prompts vagos llevan a respuestas más largas
- Usa prompts de sistema sabiamente — Mantenlos concisos
- Limita el historial por canal — Los canales casuales no necesitan 20 mensajes de contexto
- Habilita el caché de prompts — 90% de ahorro en contexto repetido
- Monitorea el uso semanalmente — Detecta picos inesperados temprano con
openclaw stats - Usa Haiku para pruebas — Cambia a Sonnet para producción
Calcula tus Costos Esperados
Usa esta fórmula:
Costo Mensual = (Mensajes Diarios × Tokens Entrada Promedio × Precio Entrada) +
(Mensajes Diarios × Tokens Salida Promedio × Precio Salida) × 30
Ejemplo para 50 mensajes/día con Claude Sonnet 4:
- Entrada promedio: 800 tokens
- Salida promedio: 400 tokens
Entrada: 50 × 800 × ($3/1M) × 30 = $3.60 Salida: 50 × 400 × ($15/1M) × 30 = $9.00 Total: ~$12.60/mes
Con la mitad de tus mensajes enrutados a Haiku 4.5:
Porción Haiku: 25 × 800 × ($1/1M) × 30 + 25 × 400 × ($5/1M) × 30 = $0.60 + $1.50 = $2.10 Porción Sonnet: 25 × 800 × ($3/1M) × 30 + 25 × 400 × ($15/1M) × 30 = $1.80 + $4.50 = $6.30 Total: ~$8.40/mes
Eso es un 33% de ahorro solo con enrutamiento de modelos — y aún más con caché de prompts encima.