OpenClaw 모델 선택 및 비용 최적화 가이드
OpenClaw용 AI 모델 비교, 가격 이해, 품질 응답을 유지하면서 비용을 최적화하는 전략을 알아보세요.
OpenClaw Guides
Tutorial Authors
AI 모델 가격 이해
AI 모델은 토큰 기반으로 요금을 부과합니다 — 토큰은 대략 4자 또는 0.75단어 정도의 텍스트 청크입니다. 다음 두 가지에 대해 비용을 지불합니다:
- 입력 토큰: 보내는 텍스트 (메시지 + 대화 기록)
- 출력 토큰: 모델이 생성하는 텍스트 (응답)
OpenClaw에서 사용 가능한 모델
OpenClaw는 Anthropic의 Claude 모델과 OpenRouter를 통한 다른 제공업체를 지원합니다. 가장 많이 사용되는 모델은 다음과 같습니다:
Claude 모델 (Anthropic)
| 모델 | 입력 가격 | 출력 가격 | 최적 용도 |
|---|---|---|---|
| Claude Haiku 4.5 | $1.00/1M | $5.00/1M | 빠른 작업, 대량 처리 |
| Claude Sonnet 4 | $3.00/1M | $15.00/1M | 균형 잡힌 성능 |
| Claude Sonnet 4.5 | $3.00/1M | $15.00/1M | 향상된 추론 |
| Claude Opus 4.6 | $5.00/1M | $25.00/1M | 최고 성능, 연구 |
2026년 초 기준 가격입니다. 현재 요금은 Anthropic 가격 페이지에서 확인하세요.
비용 비교 예시
1,000개의 입력 토큰과 500개의 출력 토큰이 있는 일반적인 대화의 경우:
| 모델 | 입력 비용 | 출력 비용 | 합계 |
|---|---|---|---|
| Claude Haiku 4.5 | $0.001 | $0.0025 | $0.0035 |
| Claude Sonnet 4 | $0.003 | $0.0075 | $0.0105 |
| Claude Opus 4.6 | $0.005 | $0.0125 | $0.0175 |
Haiku는 Sonnet보다 3배, Opus보다 5배 저렴합니다!
적합한 모델 선택
Claude Haiku 4.5 사용 시기:
- 간단한 질문에 응답
- 빠른 조회 및 팩트 확인
- 대량 메시징 (WhatsApp, Telegram)
- 비용이 주요 관심사
- 깊이보다 속도가 중요
~/.openclaw/openclaw.json에서 기본 모델로 설정:
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-haiku-4-5"
}
}
}
}
Claude Sonnet 4 / 4.5 사용 시기:
- 글쓰기 지원이 필요
- 코드 생성 또는 검토
- 중간 복잡도 작업
- 품질과 비용의 균형
- 대부분의 일상적인 사용 사례
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-sonnet-4"
}
}
}
}
Claude Opus 4.6 사용 시기:
- 복잡한 분석 필요
- 연구 및 깊은 추론
- 중요한 비즈니스 결정
- 품질이 가장 중요
- 비용이 문제되지 않음
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-opus-4-6"
}
}
}
}
채널별 모델 라우팅
OpenClaw에서는 modelByChannel을 사용하여 채널마다 다른 모델을 할당할 수 있습니다. 이것은 비용 최적화의 가장 효과적인 방법입니다 — 캐주얼 채널에는 저렴한 모델을, 업무용에는 더 강력한 모델을 사용하세요:
// ~/.openclaw/openclaw.json
{
"channels": {
"modelByChannel": {
"whatsapp": {
"default": "anthropic/claude-haiku-4-5"
},
"telegram": {
"default": "anthropic/claude-haiku-4-5"
},
"discord": {
"default": "anthropic/claude-sonnet-4"
},
"slack": {
"default": "anthropic/claude-sonnet-4"
}
}
}
}
모델 페일오버도 설정할 수 있습니다 — 기본 모델이 사용 불가능하면 OpenClaw가 대체 모델을 순서대로 시도합니다:
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-sonnet-4",
"fallbacks": [
"anthropic/claude-haiku-4-5"
]
}
}
}
}
커뮤니티 자동 라우터
메시지 복잡도에 따른 더 스마트한 라우팅을 위해 iblai-openclaw-router와 ClawRoute 같은 커뮤니티 프로젝트가 간단한 쿼리를 Haiku로, 복잡한 쿼리를 Sonnet이나 Opus로 자동 라우팅할 수 있습니다.
비용 최적화 전략
1. 대화 기록 제한
대화 기록은 빠르게 누적됩니다. historyLimit를 사용하여 전송량을 제한하세요:
// ~/.openclaw/openclaw.json
{
"messages": {
"groupChat": {
"historyLimit": 10
}
},
"channels": {
"whatsapp": {
"dmHistoryLimit": 8
},
"telegram": {
"dmHistoryLimit": 8
},
"discord": {
"historyLimit": 15
}
}
}
캐주얼 채널(WhatsApp, Telegram)은 8-10개 메시지, 업무 채널(Discord, Slack)은 15-20개로 유지하세요. 이렇게 하면 요청당 입력 토큰이 크게 줄어듭니다.
2. Anthropic의 프롬프트 캐싱 활용
Anthropic은 반복되는 컨텍스트(시스템 프롬프트, 대화 접두사)의 비용을 획기적으로 줄이는 프롬프트 캐싱을 제공합니다:
| 작업 | 비용 배율 |
|---|---|
| 캐시 쓰기 (첫 요청) | 기본 입력 가격의 1.25배 |
| 캐시 읽기 (후속) | 기본 입력 가격의 0.1배 |
첫 요청 이후 캐시된 콘텐츠에 대해 90% 할인이 적용됩니다. 시스템 프롬프트가 1,000토큰이고 50개 메시지를 보낸다면, 전체 가격은 1회만 지불하고 나머지 49회는 10%만 지불합니다.
OpenClaw는 API 제공업체에서 캐싱이 활성화된 경우 이를 지원합니다. Anthropic 대시보드에서 사용량의 "cache read tokens"를 확인하세요.
3. 더 저렴한 기본 모델 선택
가장 간단한 최적화: 대부분의 사용 사례에서 기본 모델을 Sonnet에서 Haiku로 전환하세요. 일상적인 상호작용의 80%(간단한 Q&A, 검색, 알림, 캐주얼 대화)에서 Haiku는 훨씬 적은 비용으로 동일한 성능을 발휘합니다.
품질이 가장 중요한 특정 업무 채널에는 modelByChannel로 Sonnet이나 Opus를 유지하세요.
4. 별칭이 있는 모델 카탈로그 사용
여러 모델을 쉽게 관리하고 비용을 추적하기 위해 모델 카탈로그를 정의하세요:
{
"agents": {
"defaults": {
"models": {
"anthropic/claude-haiku-4-5": {
"alias": "fast",
"cost": { "input": 1.0, "output": 5.0 }
},
"anthropic/claude-sonnet-4": {
"alias": "balanced",
"cost": { "input": 3.0, "output": 15.0 }
},
"anthropic/claude-opus-4-6": {
"alias": "powerful",
"cost": { "input": 5.0, "output": 25.0 }
}
}
}
}
}
5. 긴급하지 않은 작업에 배치 API 사용
시간에 민감하지 않은 워크로드가 있다면, Anthropic의 배치 API가 입출력 토큰 모두에 50% 할인을 제공합니다:
| 모델 | 표준 출력 | 배치 출력 |
|---|---|---|
| Claude Haiku 4.5 | $5.00/1M | $2.50/1M |
| Claude Sonnet 4 | $15.00/1M | $7.50/1M |
| Claude Opus 4.6 | $25.00/1M | $12.50/1M |
비용 모니터링
실시간 사용량
# 현재 사용량 확인 openclaw stats # 출력: # Today's Usage: # Input tokens: 45,230 # Output tokens: 12,450 # Estimated cost: $0.23 # # This month: # Total tokens: 1,234,567 # Estimated cost: $8.45
상세 보고서
# 비용 보고서 생성 openclaw stats --report monthly # CSV로 내보내기 openclaw stats --export costs.csv --period 30d
Anthropic 콘솔 한도
Anthropic 콘솔에서 직접 월간 지출 한도를 설정하여 예상치 못한 청구를 방지하세요. 이것은 예산을 강제하는 가장 신뢰할 수 있는 방법입니다 — 한도에 도달하면 API가 요청 수신을 중단합니다.
비용 절감 구성 템플릿
예산 중심 설정
// 최소 비용 최적화
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-haiku-4-5"
}
}
},
"messages": {
"groupChat": {
"historyLimit": 5
}
}
}
예상 비용: 적당한 사용 시 월 ~$5-10
균형 잡힌 설정
// 품질과 비용의 좋은 균형
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-sonnet-4",
"fallbacks": ["anthropic/claude-haiku-4-5"]
}
}
},
"channels": {
"modelByChannel": {
"whatsapp": { "default": "anthropic/claude-haiku-4-5" },
"telegram": { "default": "anthropic/claude-haiku-4-5" }
}
},
"messages": {
"groupChat": {
"historyLimit": 15
}
}
}
예상 비용: 적당한 사용 시 월 ~$15-25
품질 우선 설정
// 최대 품질, 비용은 부차적
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-sonnet-4",
"fallbacks": ["anthropic/claude-opus-4-6"]
}
}
},
"channels": {
"modelByChannel": {
"discord": { "default": "anthropic/claude-opus-4-6" },
"slack": { "default": "anthropic/claude-opus-4-6" }
}
},
"messages": {
"groupChat": {
"historyLimit": 25
}
}
}
예상 비용: 적당한 사용 시 월 ~$30-50
멀티 프로바이더 설정 (고급)
OpenRouter를 통해 여러 제공업체를 사용하여 비용 최적화:
// ~/.openclaw/openclaw.json
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-sonnet-4",
"fallbacks": [
"openrouter/google/gemini-2.5-flash",
"anthropic/claude-haiku-4-5"
]
}
}
}
}
OpenClaw는 모델 ID에 provider/model 형식을 사용합니다. OpenRouter 모델의 경우 openrouter/author/slug 형식을 사용합니다.
비용 절감 팁
- 프롬프트를 구체적으로 — 모호한 프롬프트는 더 긴 응답을 유발
- 시스템 프롬프트를 현명하게 사용 — 간결하게 유지
- 채널별로 기록 제한 — 캐주얼 채널에는 20개 메시지 컨텍스트가 불필요
- 프롬프트 캐싱 활성화 — 반복 컨텍스트에서 90% 절약
- 주간 사용량 모니터링 —
openclaw stats로 예상치 못한 급증 조기 발견 - 테스트에는 Haiku 사용 — 프로덕션에는 Sonnet으로 전환
예상 비용 계산
다음 공식을 사용하세요:
월간 비용 = (일일 메시지 × 평균 입력 토큰 × 입력 가격) +
(일일 메시지 × 평균 출력 토큰 × 출력 가격) × 30
Claude Sonnet 4로 하루 50개 메시지 예시:
- 평균 입력: 800 토큰
- 평균 출력: 400 토큰
입력: 50 × 800 × ($3/1M) × 30 = $3.60 출력: 50 × 400 × ($15/1M) × 30 = $9.00 합계: ~$12.60/월
메시지의 절반을 Haiku 4.5로 라우팅한 경우:
Haiku 부분: 25 × 800 × ($1/1M) × 30 + 25 × 400 × ($5/1M) × 30 = $0.60 + $1.50 = $2.10 Sonnet 부분: 25 × 800 × ($3/1M) × 30 + 25 × 400 × ($15/1M) × 30 = $1.80 + $4.50 = $6.30 합계: ~$8.40/월
모델 라우팅만으로 33% 절약 — 프롬프트 캐싱까지 더하면 더 많이 절약됩니다.