OpenClaw
Optimización10 min de lectura

Guía de Selección de Modelos y Optimización de Costos de OpenClaw

Compara modelos de IA para OpenClaw, entiende los precios y aprende estrategias para optimizar costos mientras mantienes respuestas de calidad.

O

OpenClaw Guides

Tutorial Authors

Entendiendo los Precios de Modelos de IA

Los modelos de IA cobran basándose en tokens — fragmentos de texto que son aproximadamente 4 caracteres o 0.75 palabras. Pagas por ambos:

  • Tokens de entrada: El texto que envías (tu mensaje + historial de conversación)
  • Tokens de salida: El texto que genera el modelo (respuestas)

Modelos Disponibles en OpenClaw

OpenClaw soporta los modelos Claude de Anthropic y otros proveedores a través de OpenRouter. Estos son los modelos más utilizados:

Modelos Claude (Anthropic)

ModeloPrecio EntradaPrecio SalidaMejor Para
Claude Haiku 4.5$1.00/1M$5.00/1MTareas rápidas, alto volumen
Claude Sonnet 4$3.00/1M$15.00/1MRendimiento equilibrado
Claude Sonnet 4.5$3.00/1M$15.00/1MRazonamiento mejorado
Claude Opus 4.6$5.00/1M$25.00/1MMás capaz, investigación

Precios a principios de 2026. Consulta la página de precios de Anthropic para tarifas actuales.

Ejemplo de Comparación de Costos

Para una conversación típica con 1,000 tokens de entrada y 500 tokens de salida:

ModeloCosto EntradaCosto SalidaTotal
Claude Haiku 4.5$0.001$0.0025$0.0035
Claude Sonnet 4$0.003$0.0075$0.0105
Claude Opus 4.6$0.005$0.0125$0.0175

¡Haiku es 3 veces más barato que Sonnet y 5 veces más barato que Opus!

Elegir el Modelo Correcto

Usa Claude Haiku 4.5 Cuando:

  • Respondas preguntas simples
  • Búsquedas rápidas y datos
  • Mensajería de alto volumen (WhatsApp, Telegram)
  • El costo es una preocupación principal
  • La velocidad importa más que la profundidad

Configúralo como tu modelo predeterminado en ~/.openclaw/openclaw.json:

json
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-haiku-4-5"
      }
    }
  }
}

Usa Claude Sonnet 4 / 4.5 Cuando:

  • Se necesita asistencia de escritura
  • Generación o revisión de código
  • Tareas de complejidad moderada
  • Balance de calidad y costo
  • La mayoría de casos de uso cotidianos
json
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-sonnet-4"
      }
    }
  }
}

Usa Claude Opus 4.6 Cuando:

  • Se requiere análisis complejo
  • Investigación y razonamiento profundo
  • Decisiones críticas de negocio
  • La calidad es primordial
  • El costo no es una preocupación
json
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-opus-4-6"
      }
    }
  }
}

Enrutamiento de Modelos por Canal

OpenClaw te permite asignar diferentes modelos a diferentes canales usando modelByChannel. Esta es la forma más efectiva de optimizar costos — usa un modelo más económico para canales casuales y uno más capaz para trabajo:

json
// ~/.openclaw/openclaw.json
{
  "channels": {
    "modelByChannel": {
      "whatsapp": {
        "default": "anthropic/claude-haiku-4-5"
      },
      "telegram": {
        "default": "anthropic/claude-haiku-4-5"
      },
      "discord": {
        "default": "anthropic/claude-sonnet-4"
      },
      "slack": {
        "default": "anthropic/claude-sonnet-4"
      }
    }
  }
}

También puedes configurar failover de modelos — si el modelo principal no está disponible, OpenClaw probará los modelos de respaldo en orden:

json
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-sonnet-4",
        "fallbacks": [
          "anthropic/claude-haiku-4-5"
        ]
      }
    }
  }
}

Auto-Routers de la Comunidad

Para un enrutamiento aún más inteligente basado en la complejidad del mensaje, proyectos comunitarios como iblai-openclaw-router y ClawRoute pueden enrutar automáticamente consultas simples a Haiku y las complejas a Sonnet u Opus.

Estrategias de Optimización de Costos

1. Limita el Historial de Conversación

El historial de conversación se acumula rápido. Limita cuánto se envía usando historyLimit:

json
// ~/.openclaw/openclaw.json
{
  "messages": {
    "groupChat": {
      "historyLimit": 10
    }
  },
  "channels": {
    "whatsapp": {
      "dmHistoryLimit": 8
    },
    "telegram": {
      "dmHistoryLimit": 8
    },
    "discord": {
      "historyLimit": 15
    }
  }
}

Mantén los canales casuales (WhatsApp, Telegram) en 8-10 mensajes y los canales de trabajo (Discord, Slack) en 15-20. Esto reduce significativamente los tokens de entrada por solicitud.

2. Usa el Caché de Prompts de Anthropic

Anthropic ofrece caché de prompts que reduce drásticamente los costos para contexto repetido (prompts de sistema, prefijos de conversación):

OperaciónMultiplicador de Costo
Escritura en caché (primera solicitud)1.25x precio base de entrada
Lectura de caché (posteriores)0.1x precio base de entrada

Eso es un 90% de descuento en contenido cacheado después de la primera solicitud. Si tu prompt de sistema tiene 1,000 tokens y envías 50 mensajes, pagas precio completo una vez y 10% por los otros 49.

OpenClaw soporta esto cuando tu proveedor de API tiene el caché habilitado. Verifica los "cache read tokens" en tu panel de Anthropic.

3. Elige un Modelo Predeterminado Más Económico

La optimización más simple: cambia tu predeterminado de Sonnet a Haiku para la mayoría de los casos de uso. Para el 80% de las interacciones diarias (Q&A rápido, búsquedas, recordatorios, conversación casual), Haiku funciona igual de bien a una fracción del costo.

Usa modelByChannel para mantener Sonnet u Opus en canales de trabajo específicos donde la calidad es más importante.

4. Usa un Catálogo de Modelos con Alias

Define un catálogo de modelos para gestionar múltiples modelos fácilmente y hacer seguimiento de costos:

json
{
  "agents": {
    "defaults": {
      "models": {
        "anthropic/claude-haiku-4-5": {
          "alias": "fast",
          "cost": { "input": 1.0, "output": 5.0 }
        },
        "anthropic/claude-sonnet-4": {
          "alias": "balanced",
          "cost": { "input": 3.0, "output": 15.0 }
        },
        "anthropic/claude-opus-4-6": {
          "alias": "powerful",
          "cost": { "input": 5.0, "output": 25.0 }
        }
      }
    }
  }
}

5. Usa la API de Lotes para Tareas No Urgentes

Si tienes cargas de trabajo que no son sensibles al tiempo, la API de Lotes de Anthropic ofrece un 50% de descuento tanto en tokens de entrada como de salida:

ModeloSalida EstándarSalida por Lotes
Claude Haiku 4.5$5.00/1M$2.50/1M
Claude Sonnet 4$15.00/1M$7.50/1M
Claude Opus 4.6$25.00/1M$12.50/1M

Monitoreo de Costos

Uso en Tiempo Real

bash
# Ver uso actual
openclaw stats

# Salida:
# Today's Usage:
#   Input tokens:  45,230
#   Output tokens: 12,450
#   Estimated cost: $0.23
#
# This month:
#   Total tokens: 1,234,567
#   Estimated cost: $8.45

Informes Detallados

bash
# Generar informe de costos
openclaw stats --report monthly

# Exportar a CSV
openclaw stats --export costs.csv --period 30d

Límites de la Consola de Anthropic

Establece topes de gasto mensual directamente en la Consola de Anthropic para prevenir facturas inesperadas. Esta es la forma más confiable de aplicar un presupuesto — si alcanzas el tope, la API deja de aceptar solicitudes.

Plantillas de Configuración para Ahorro de Costos

Configuración Consciente del Presupuesto

json
// Optimizado para costo mínimo
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-haiku-4-5"
      }
    }
  },
  "messages": {
    "groupChat": {
      "historyLimit": 5
    }
  }
}

Costo estimado: ~$5-10/mes con uso moderado

Configuración Equilibrada

json
// Buen balance de calidad y costo
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-sonnet-4",
        "fallbacks": ["anthropic/claude-haiku-4-5"]
      }
    }
  },
  "channels": {
    "modelByChannel": {
      "whatsapp": { "default": "anthropic/claude-haiku-4-5" },
      "telegram": { "default": "anthropic/claude-haiku-4-5" }
    }
  },
  "messages": {
    "groupChat": {
      "historyLimit": 15
    }
  }
}

Costo estimado: ~$15-25/mes con uso moderado

Configuración Prioridad Calidad

json
// Máxima calidad, costo secundario
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-sonnet-4",
        "fallbacks": ["anthropic/claude-opus-4-6"]
      }
    }
  },
  "channels": {
    "modelByChannel": {
      "discord": { "default": "anthropic/claude-opus-4-6" },
      "slack": { "default": "anthropic/claude-opus-4-6" }
    }
  },
  "messages": {
    "groupChat": {
      "historyLimit": 25
    }
  }
}

Costo estimado: ~$30-50/mes con uso moderado

Configuración Multi-Proveedor (Avanzado)

Usa múltiples proveedores a través de OpenRouter para optimizar costos:

json
// ~/.openclaw/openclaw.json
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-sonnet-4",
        "fallbacks": [
          "openrouter/google/gemini-2.5-flash",
          "anthropic/claude-haiku-4-5"
        ]
      }
    }
  }
}

OpenClaw usa el formato provider/model para los IDs de modelo. Para modelos de OpenRouter, usa el formato openrouter/author/slug.

Consejos para Reducir Costos

  1. Sé específico en los prompts — Los prompts vagos llevan a respuestas más largas
  2. Usa prompts de sistema sabiamente — Mantenlos concisos
  3. Limita el historial por canal — Los canales casuales no necesitan 20 mensajes de contexto
  4. Habilita el caché de prompts — 90% de ahorro en contexto repetido
  5. Monitorea el uso semanalmente — Detecta picos inesperados temprano con openclaw stats
  6. Usa Haiku para pruebas — Cambia a Sonnet para producción

Calcula tus Costos Esperados

Usa esta fórmula:

Costo Mensual = (Mensajes Diarios × Tokens Entrada Promedio × Precio Entrada) +
                (Mensajes Diarios × Tokens Salida Promedio × Precio Salida) × 30

Ejemplo para 50 mensajes/día con Claude Sonnet 4:

  • Entrada promedio: 800 tokens
  • Salida promedio: 400 tokens
Entrada:  50 × 800 × ($3/1M) × 30 = $3.60
Salida: 50 × 400 × ($15/1M) × 30 = $9.00
Total: ~$12.60/mes

Con la mitad de tus mensajes enrutados a Haiku 4.5:

Porción Haiku:  25 × 800 × ($1/1M) × 30 + 25 × 400 × ($5/1M) × 30 = $0.60 + $1.50 = $2.10
Porción Sonnet: 25 × 800 × ($3/1M) × 30 + 25 × 400 × ($15/1M) × 30 = $1.80 + $4.50 = $6.30
Total: ~$8.40/mes

Eso es un 33% de ahorro solo con enrutamiento de modelos — y aún más con caché de prompts encima.

Siguientes Pasos