Claude Haiku 4.5는 Anthropic이 2025년 10월 중순에 출시한 목적 최적화 소형급 언어 모델입니다. Claude 라인업에서 빠른 속도와 저비용 옵션으로 자리매김하며, 코딩, 에이전트 오케스트레이션, 상호작용형 “컴퓨터 사용” 워크플로 같은 작업에서 강력한 역량을 유지하는 동시에 엔터프라이즈 배포에서 훨씬 높은 처리량과 더 낮은 단가를 가능하게 합니다.
핵심 기능
- 속도 및 비용 효율성: Haiku 4.5는 Sonnet 4보다 2배 이상 빠르고 Sonnet 4의 약 3분의 1 비용(Opus보다 훨씬 저렴)으로 설명되며, 대규모 사용에 매력적입니다.
- 확장 사고: 레이턴시와의 균형을 유지하면서 더 깊은 단계적 추론을 위해 확장 사고(요약/교차 사고, 구성 가능한 사고 예산)를 지원하는 최초의 Haiku 모델입니다.
- 도구 및 컴퓨터 사용: Claude 도구(bash, 코드 실행, 텍스트 편집기, 웹 검색, 컴퓨터 사용 자동화)에 대한 완전한 지원. 에이전트형 워크플로와 서브 에이전트 아키텍처를 위해 설계됨.
- 대규모 컨텍스트 윈도우: 200k 토큰 컨텍스트 윈도우(다른 모델 클래스용으로는 대형 모델에서 1M 컨텍스트 옵션이 베타로 제공).
기술 세부 정보
- 학습 데이터 및 컷오프: Haiku 4.5는 공개 및 라이선스 데이터의 독자적 믹스로 학습되었으며 학습 컷오프는 2025년 2월경입니다.
- 확장 사고(하이브리드 추론 모드)를 지원하여 요청 시 더 깊은 추론을 위해 지연 시간과의 트레이드오프가 가능합니다.
- 출시 시점의 컨텍스트 윈도우는 200,000 토큰이며, 모델은 명시적으로 컨텍스트 인지형입니다(윈도우 사용량을 추적).
- 성능/처리량: 커뮤니티 초기 보고와 Anthropic 테스트에 따르면 매우 높은 OTPS(output tokens/sec)와 일부 내부/초기 테스트에서 ~200+ tokens/sec 수준의 체감 속도가 보고되었습니다 — 유사한 중급 모델들보다 훨씬 빠릅니다.
벤치마크 성능
SWE-Bench(코딩): Haiku 4.5는 SWE-Bench Verified에서 **~73.3%**를 기록했습니다 — Anthropic은 이 결과가 Haiku 4.5를 동급 최상급 코딩 모델 반열에 올려놓는다고 강조합니다.

Terminal/커맨드라인/도구 테스트: Anthropic은 Terminal-Bench(커맨드라인 중심)에서 **~41%**를 보고했으며, 많은 도구 사용 벤치마크에서 Sonnet 4 및 여러 경쟁 중급 프런티어 모델과 유사한 결과를 보였다고 밝혔습니다.
지시 따르기 및 슬라이드 텍스트: Anthropic의 내부 예시에서는 Haiku 4.5가 일부 지시 따르기 과제에서 이전 모델을 능가했다고 주장합니다(예: 슬라이드 텍스트 생성: 그들의 벤치마크에서 이전 프리미엄 모델 대비 65% 대 44%).
실세계 자동화/에이전트 과제: 서드파티 평가와 초기 도입자들은 자동화된 UI/에이전트 과제에서 경쟁력 있는 성공률을 보고합니다(예: 일부 테스트에서 복잡한 자동화에 대해 ≈50%의 성공률을 보고하는 OSWorld 스타일 또는 에이전트 벤치마크). 이는 규모화된 워크플로에서의 유용성을 보여주지만 무시할 수 없는 실패 양상도 있음을 시사합니다.

한계 및 안전 유의사항
- 프런티어 모델 아님: Anthropic은 Haiku 4.5를 프런티어를 진전시키는 모델이 아니다라고 명시합니다. 최첨단을 밀어붙이기보다 효율성에 최적화되어 있습니다. (Anthropic)
- 민감 주제에서의 간헐적 거동: 일부 과학/바이오 안전 관련 프롬프트에서 Haiku 4.5는 엄격한 거부 대신 주의문을 단 고수준 정보를 반환하는 경우가 있으며, Anthropic은 이를 계속 개선 중인 영역으로 지목합니다.
- 확장 사고는 거동을 변화시킬 수 있습니다(때때로 응답의 비대칭성을 증가시킴).
권장 사용 사례
- 에이전트형 코딩 및 멀티 에이전트 오케스트레이션: 빠른 서브 에이전트, 반복적 코드 리팩터링, 자동 테스트 및 패치 생성. (적합.)
- 실시간·대량 고객 워크플로: 요청당 비용이 중요한 챗 어시스턴트, 내부 자동화. (적합.)
- 도구 기반 워크플로 및 컴퓨터 제어: GUI/CLI 작업 자동화, 저지연이 유리한 문서 워크플로와 툴체인. (적합.)
- 권장되지 않음(통제 없이): 프런티어 수준의 과학적 서열 설계 또는 고신뢰 바이오보안 작업이 필요한 독립 실행 역할. (주의 요망.)