최적화10 분 소요

OpenClaw 모델 선택 및 비용 최적화 가이드

OpenClaw용 AI 모델 비교, 가격 이해, 품질 응답을 유지하면서 비용을 최적화하는 전략을 알아보세요.

OpenClaw Guides

Tutorial Authors

2025-02-04

AI 모델 가격 이해

AI 모델은 토큰 기반으로 요금을 부과합니다. 토큰은 대략 4자 또는 0.75단어 정도의 텍스트 청크입니다. 다음 두 가지에 대해 비용을 지불합니다:

입력 토큰: 보내는 텍스트 (메시지 + 대화 기록)
출력 토큰: 모델이 생성하는 텍스트 (응답)

OpenClaw에서 사용 가능한 모델

OpenClaw는 주로 Anthropic의 Claude 모델을 지원하며, 다른 제공업체도 선택적으로 지원합니다.

Claude 모델 (Anthropic)

| 모델 | 입력 가격 | 출력 가격 | 최적 용도 | |------|-----------|-----------|-----------| | Claude 3.5 Haiku | $0.25/1M | $1.25/1M | 빠른 작업, 대량 처리 | | Claude 3.5 Sonnet | $3.00/1M | $15.00/1M | 균형 잡힌 성능 | | Claude Sonnet 4 | $3.00/1M | $15.00/1M | 복잡한 추론 | | Claude Opus 4 | $15.00/1M | $75.00/1M | 최고 성능, 연구 |

2026년 초 기준 가격입니다. 현재 요금은 Anthropic 가격 페이지에서 확인하세요.

비용 비교 예시

1,000개의 입력 토큰과 500개의 출력 토큰이 있는 일반적인 대화의 경우:

| 모델 | 입력 비용 | 출력 비용 | 합계 | |------|-----------|-----------|------| | Claude 3.5 Haiku | $0.00025 | $0.000625 | $0.000875 | | Claude 3.5 Sonnet | $0.003 | $0.0075 | $0.0105 | | Claude Opus 4 | $0.015 | $0.0375 | $0.0525 |

Haiku는 Sonnet보다 12배, Opus보다 60배 저렴합니다!

적합한 모델 선택

Claude 3.5 Haiku 사용 시기:

간단한 질문에 응답
빠른 조회 및 팩트 확인
대량 메시징 (WhatsApp, Telegram)
비용이 주요 관심사
깊이보다 속도가 중요

json

// ~/.openclaw/openclaw.json
{
  "model": {
    "default": "claude-3-5-haiku"
  }
}

Claude 3.5 Sonnet / Sonnet 4 사용 시기:

글쓰기 지원이 필요
코드 생성 또는 검토
중간 복잡도 작업
품질과 비용의 균형
대부분의 일상적인 사용 사례

json

// ~/.openclaw/openclaw.json
{
  "model": {
    "default": "claude-sonnet-4"
  }
}

Claude Opus 4 사용 시기:

복잡한 분석 필요
연구 및 깊은 추론
중요한 비즈니스 결정
품질이 가장 중요
비용이 문제되지 않음

json

// ~/.openclaw/openclaw.json
{
  "model": {
    "default": "claude-opus-4"
  }
}

동적 모델 라우팅

OpenClaw는 작업에 따라 자동으로 모델을 선택할 수 있습니다:

json

// ~/.openclaw/openclaw.json
{
  "model": {
    "routing": {
      "enabled": true,
      "rules": [
        {
          "pattern": "^(hi|hello|hey|thanks|ok|bye)",
          "model": "claude-3-5-haiku"
        },
        {
          "pattern": "(code|function|bug|error|programming)",
          "model": "claude-sonnet-4"
        },
        {
          "pattern": "(analyze deeply|complex|thorough)",
          "model": "claude-opus-4"
        },
        {
          "pattern": ".*",
          "model": "claude-3-5-sonnet"
        }
      ]
    }
  }
}

비용 최적화 전략

1. 컨텍스트 길이 줄이기

대화 기록은 빠르게 누적됩니다. 전송량을 제한하세요:

json

// ~/.openclaw/openclaw.json
{
  "model": {
    "context": {
      "maxMessages": 10,
      "maxContextTokens": 4000,
      "summarizeOldMessages": true,
      "summaryThreshold": 20
    }
  }
}

2. 응답 캐싱 활성화

동일한 쿼리를 캐시하여 반복 API 호출 방지:

json

// ~/.openclaw/openclaw.json
{
  "gateway": {
    "caching": {
      "enabled": true,
      "ttl": 3600,
      "maxSize": 1000
    }
  }
}

3. 토큰 제한 설정

예상치 못하게 긴 (비싼) 응답 방지:

json

// ~/.openclaw/openclaw.json
{
  "model": {
    "maxOutputTokens": 1024,
    "channelLimits": {
      "whatsapp": 500,
      "discord": 1500,
      "telegram": 800
    }
  }
}

4. 사용량 할당량 구현

일일/월간 지출 한도 설정:

json

// ~/.openclaw/openclaw.json
{
  "model": {
    "quotas": {
      "daily": {
        "enabled": true,
        "maxTokens": 100000,
        "maxCost": 1.00,
        "warningThreshold": 0.80
      },
      "monthly": {
        "enabled": true,
        "maxCost": 20.00
      }
    }
  }
}

5. 프롬프트 압축 사용

더 스마트한 프롬프트로 입력 토큰 줄이기:

json

// ~/.openclaw/openclaw.json
{
  "model": {
    "optimization": {
      "compressPrompts": true,
      "compactSystemPrompt": true,
      "deltaContext": true
    }
  }
}

비용 모니터링

실시간 사용량

bash

# 현재 사용량 확인
openclaw stats

# 출력:
# Today's Usage:
#   Input tokens:  45,230
#   Output tokens: 12,450
#   Estimated cost: $0.23
#
# This month:
#   Total tokens: 1,234,567
#   Estimated cost: $8.45

상세 보고서

bash

# 비용 보고서 생성
openclaw stats --report monthly

# CSV로 내보내기
openclaw stats --export costs.csv --period 30d

알림 설정

json

// ~/.openclaw/openclaw.json
{
  "notifications": {
    "costAlerts": {
      "enabled": true,
      "thresholds": [
        { "amount": 5.00, "action": "notify" },
        { "amount": 10.00, "action": "warn" },
        { "amount": 20.00, "action": "pause" }
      ]
    }
  }
}

비용 절감 구성 템플릿

예산 중심 설정

json

// 최소 비용 최적화
{
  "model": {
    "default": "claude-3-5-haiku",
    "maxOutputTokens": 512,
    "context": {
      "maxMessages": 5,
      "maxContextTokens": 2000
    },
    "quotas": {
      "daily": {
        "enabled": true,
        "maxCost": 0.50
      }
    }
  },
  "gateway": {
    "caching": {
      "enabled": true,
      "ttl": 7200
    }
  }
}

예상 비용: 적당한 사용 시 월 ~$5-10

균형 잡힌 설정

json

// 품질과 비용의 좋은 균형
{
  "model": {
    "default": "claude-3-5-sonnet",
    "maxOutputTokens": 1024,
    "context": {
      "maxMessages": 15,
      "maxContextTokens": 4000,
      "summarizeOldMessages": true
    },
    "routing": {
      "enabled": true,
      "rules": [
        { "pattern": "^(hi|hello|thanks|bye|ok)", "model": "claude-3-5-haiku" },
        { "pattern": ".*", "model": "claude-3-5-sonnet" }
      ]
    }
  },
  "gateway": {
    "caching": {
      "enabled": true,
      "ttl": 3600
    }
  }
}

예상 비용: 적당한 사용 시 월 ~$15-30

품질 우선 설정

json

// 최대 품질, 비용은 부차적
{
  "model": {
    "default": "claude-sonnet-4",
    "maxOutputTokens": 4096,
    "context": {
      "maxMessages": 30,
      "maxContextTokens": 16000
    },
    "routing": {
      "enabled": true,
      "rules": [
        { "pattern": "(analyze|research|complex|detailed)", "model": "claude-opus-4" },
        { "pattern": ".*", "model": "claude-sonnet-4" }
      ]
    }
  }
}

예상 비용: 적당한 사용 시 월 ~$50-100

멀티 프로바이더 설정 (고급)

여러 제공업체를 사용하여 비용 최적화:

json

// ~/.openclaw/openclaw.json
{
  "providers": {
    "anthropic": {
      "apiKey": "${ANTHROPIC_API_KEY}",
      "models": ["claude-3-5-haiku", "claude-sonnet-4"]
    },
    "openai": {
      "apiKey": "${OPENAI_API_KEY}",
      "models": ["gpt-4o-mini"]
    }
  },
  "model": {
    "routing": {
      "enabled": true,
      "rules": [
        { "pattern": "^(hi|hello|what time)", "provider": "openai", "model": "gpt-4o-mini" },
        { "pattern": ".*", "provider": "anthropic", "model": "claude-3-5-sonnet" }
      ]
    }
  }
}

비용 절감 팁

프롬프트를 구체적으로 - 모호한 프롬프트는 더 긴 응답을 유발
시스템 프롬프트를 현명하게 사용 - 간결하게 유지
주기적으로 컨텍스트 지우기 - 기록이 무한정 늘어나지 않도록
일반적인 쿼리 캐시 - FAQ, 인사말 등
주간 사용량 모니터링 - 예상치 못한 급증 조기 발견
테스트에는 Haiku 사용 - 프로덕션에는 Sonnet으로 전환

예상 비용 계산

다음 공식을 사용하세요:

월간 비용 = (일일 메시지 × 평균 입력 토큰 × 입력 가격) +
           (일일 메시지 × 평균 출력 토큰 × 출력 가격) × 30

Claude 3.5 Sonnet으로 하루 50개 메시지 예시:

평균 입력: 800 토큰
평균 출력: 400 토큰

입력:  50 × 800 × ($3/1M) × 30 = $3.60
출력: 50 × 400 × ($15/1M) × 30 = $9.00
합계: ~$12.60/월

AI 모델 가격 이해

OpenClaw에서 사용 가능한 모델

Claude 모델 (Anthropic)

비용 비교 예시

적합한 모델 선택

Claude 3.5 Haiku 사용 시기:

Claude 3.5 Sonnet / Sonnet 4 사용 시기:

Claude Opus 4 사용 시기:

동적 모델 라우팅

비용 최적화 전략

1. 컨텍스트 길이 줄이기

2. 응답 캐싱 활성화

3. 토큰 제한 설정

4. 사용량 할당량 구현

5. 프롬프트 압축 사용

비용 모니터링

실시간 사용량

상세 보고서

알림 설정

비용 절감 구성 템플릿

예산 중심 설정

균형 잡힌 설정

품질 우선 설정

멀티 프로바이더 설정 (고급)

비용 절감 팁

예상 비용 계산

다음 단계