핵심 요약
Anthropic이 5월 28일 오전 Claude 4.9 패밀리(Opus·Sonnet·Haiku) 동시 출시를 발표했다. SWE-bench Verified 82.1%, τ-bench(retail) 91%로 자체 4.8 대비 +3~4%p 향상. Sonnet 4.9가 Opus 4.8 수준 성능을 1/5 가격으로 제공해 사실상 표준 모델로 자리 잡을 전망이다.
- Opus 4.9: SWE-bench 82.1%, 1M needle@800K 98%
- Sonnet 4.9: $3/M input, $15/M output (Opus 4.8 대비 -80%)
- Haiku 4.9: 한국어 KMMLU 81.4% (전 세대 +3%p)
- extended thinking 자동 활성 — 복잡도에 따라 reasoning 깊이 자동 조절
벤치마크 — 4모델 비교
| 벤치 | Claude 4.9 Opus | GPT-5.5 | Gemini 3 Pro |
|---|---|---|---|
| SWE-bench Verified | 82.1% | 74.1% | 78.4% |
| τ-bench retail | 91% | 83% | 84% |
| AIME 2026 | 78% | 72% | 74% |
| KMMLU(한국어) | 84.2% | 74.1% | 85.8% |
업계 영향
Cursor·Cognition·Replit·Vercel은 발표 당일 기본 모델을 Sonnet 4.9로 일제히 전환했다. AWS Bedrock 한국 리전은 6월 중 가용 예정. 한 업계 관계자는 "Sonnet 4.9가 Opus 4.8을 비용 80% 절감하며 대체하는 게 진짜 충격"이라고 평했다.
가격 — 시장 재편 신호
- Opus 4.9: $15/M input, $75/M output (4.8과 동일)
- Sonnet 4.9: $3/M input, $15/M output
- Haiku 4.9: $0.8/M input, $4/M output
경쟁사 OpenAI·Google은 GPT-5.5·Gemini 3.5 Pro에서 비슷한 가격 정책을 따라잡을 것으로 예상된다.
한국 시장
- 네이버 클로바X 2.0(6/4 출시 예정) 직전 타이밍에 압박
- 한국어 fine-tune 별도 모델 6월 중 추가 발표 예정
- Bedrock 한국 리전 가용 시 금융·정부 수요 폭증 예상

댓글 0