Claude Haiku 4.5, Anthropic tarafından belirli amaçlar için optimize edilmiş, daha küçük sınıfta bir dil modelidir; 2025 Ekim ortasında yayınlandı. Claude ürün ailesinde hızlı ve düşük maliyetli bir seçenek olarak konumlandırılmıştır; kodlama, ajan orkestrasyonu ve etkileşimli “bilgisayar kullanımı” iş akışları gibi görevlerde güçlü yeteneklerini korurken kurumsal dağıtımlar için çok daha yüksek çıktı hacmi ve daha düşük birim maliyet sağlar.
Key features
- Hız ve maliyet verimliliği: Haiku 4.5’in, Sonnet 4’ten iki kattan daha hızlı ve Sonnet 4’ün yaklaşık üçte biri maliyetinde olduğu belirtiliyor (Opus’tan da çok daha ucuz), bu da ölçekli kullanım için cazip kılıyor.
- Genişletilmiş düşünme: Gecikmeyi dengelerken daha derin çok adımlı akıl yürütme için genişletilmiş düşünmeyi destekleyen ilk Haiku modeli (özetlenmiş / iç içe geçmiş düşünceler, yapılandırılabilir düşünme bütçeleri).
- Araçlar ve bilgisayar kullanımı: Claude araçları için tam destek (bash, kod çalıştırma, metin düzenleyici, web araması ve bilgisayar kullanımı otomasyonu). Ajan odaklı iş akışları ve alt-ajan mimarileri için tasarlanmıştır.
- Geniş bağlam penceresi: 200k token bağlam penceresi (diğer model sınıfları için beta olarak daha büyük modellerde 1M bağlam seçenekleri mevcut).
Technical details
- Eğitim verisi ve kesim tarihi: Haiku 4.5, genel ve lisanslı verilerin özel bir karması üzerinde eğitildi; eğitim kesim tarihi yaklaşık Şubat 2025.
- Genişletilmiş düşünme (hibrit akıl yürütme modu) desteklenir; böylece istendiğinde model daha derin akıl yürütme için gecikme ile takas yapabilir.
- Yayınlandığında bağlam penceresi 200,000 token’dır ve model açıkça bağlam farkındadır (pencerenin ne kadarının kullanıldığını izler).
- Performans / throughput: Erken topluluk raporları ve Anthropic testleri, bazı dahili/erken testlerde çok yüksek OTPS (output tokens/sec) ve yaklaşık ~200+ tokens/sec hızlardan söz ediyor — birçok benzer orta sınıf modelden çok daha hızlı.
Benchmark performance
SWE-Bench (kodlama): Haiku 4.5, SWE-Bench Verified’da ~73.3% puan aldı — Anthropic’e göre bu sonuç, Haiku 4.5’i kendi sınıfında dünyanın en iyi kodlama modelleri arasına yerleştiriyor.

Terminal / komut satırı / araç testleri: Anthropic, Terminal-Bench’te (komut satırı odaklı) ~41% bildirdi ve birçok araç kullanımı kıyaslamasında Sonnet 4 ve birkaç rakip orta seviye frontier modelle karşılaştırılabilir sonuçlar elde edildiğini belirtti.
Talimat izleme ve slayt metni: Anthropic’in dahili örnekleri, Haiku 4.5’in bazı talimat izleme görevlerinde önceki modelleri geride bıraktığını iddia ediyor (ör. slayt metni üretimi: 65% vs 44% kendi kıyaslarında önceki bir premium model için).
Gerçek dünya otomasyonu / ajan görevleri: üçüncü taraf değerlendirmeler ve erken benimseyenler, otomatik UI/ajan görevlerinde rekabetçi başarı oranları bildirmektedir (örneğin, bazı testlerde karmaşık otomasyonlarda ≈50% başarı bildiren OSWorld tarzı veya ajan kıyasları), ölçekli iş akışları için faydalı olduğunu ancak kayda değer hata biçimlerinin bulunduğunu göstermektedir.

Limitations & safety notes
- Bir frontier modeli değil: Anthropic, Haiku 4.5’i açıkça sınırları ilerletmeyen bir model olarak sınıflandırıyor; mutlak son teknolojiyi zorlamaktan ziyade verimlilik için optimize edilmiştir. (Anthropic)
- Zaman zaman hassas konulardaki davranış: bazı bilimsel/biyogüvenlik ile ilgili istemlerde Haiku 4.5, katı retler yerine bazen uyarılarla birlikte üst düzey bilgiler döndürüyor; Anthropic bunu sürekli iyileştirme altında olan bir alan olarak işaret ediyor.
- Genişletilmiş düşünme davranışı değiştirebilir (yanıtlardaki asimetriyi bazen artırabilir).
Recommended use cases
- Ajan odaklı kodlama ve çok-ajan orkestrasyonu: hızlı alt-ajanlar, yinelemeli kod yeniden düzenleme, otomatik testler ve yama üretimi. (Uygun.)
- Gerçek zamanlı, yüksek hacimli müşteri iş akışları: istek başına maliyetin önemli olduğu sohbet asistanları, dahili otomasyon. (Uygun.)
- Araç destekli iş akışları ve bilgisayar kontrolü: düşük gecikmenin fayda sağladığı GUI/CLI görevlerinin otomasyonu, belge iş akışları ve araç zincirleri. (Uygun.)
- Önerilmez (kontroller olmadan): frontier düzeyinde bilimsel dizilim tasarımı veya yüksek güvence gerektiren biyogüvenlik görevleri isteyen tek başına roller. (Dikkatli olun.)