Claude Haiku 4.5 adalah model bahasa kelas lebih kecil yang dioptimalkan untuk tujuan tertentu dari Anthropic, dirilis pada pertengahan Oktober 2025. Model ini diposisikan sebagai opsi cepat dan berbiaya rendah dalam jajaran Claude yang tetap mempertahankan kapabilitas kuat pada tugas seperti coding, orkestrasi agen, dan alur kerja “penggunaan komputer” interaktif sekaligus memungkinkan throughput jauh lebih tinggi dan biaya per unit lebih rendah untuk penerapan tingkat perusahaan.
Fitur utama
- Kecepatan & efisiensi biaya: Haiku 4.5 dideskripsikan lebih dari dua kali lebih cepat daripada Sonnet 4 dan sekitar sepertiga biaya Sonnet 4 (serta jauh lebih murah daripada Opus), sehingga menarik untuk penggunaan berskala.
- Penalaran diperluas: Model Haiku pertama yang mendukung penalaran diperluas (pemikiran yang diringkas/berselang-seling, anggaran penalaran yang dapat dikonfigurasi) untuk penalaran multi-langkah yang lebih dalam sambil menyeimbangkan latensi.
- Alat & penggunaan komputer: Dukungan penuh untuk alat Claude (bash, eksekusi kode, editor teks, penelusuran web, dan otomasi penggunaan komputer). Dirancang untuk alur kerja berbasis agen dan arsitektur sub-agen.
- Jendela konteks besar: Jendela konteks 200k token (dengan opsi konteks 1M tersedia pada model yang lebih besar sebagai beta untuk kelas model lain).
Detail teknis
- Data pelatihan & cutoff: Haiku 4.5 dilatih pada campuran data publik dan berlisensi yang bersifat proprietari dengan batas pelatihan sekitar Februari 2025.
- Penalaran diperluas (mode penalaran hibrida) didukung sehingga model dapat menukar latensi dengan penalaran yang lebih dalam saat diminta.
- Jendela konteks saat rilis adalah 200,000 tokens, dan model ini secara eksplisit sadar konteks (melacak seberapa banyak jendela telah digunakan).
- Kinerja / throughput: Laporan komunitas awal dan pengujian Anthropic menyebut OTPS sangat tinggi (output tokens/sec) dan kecepatan anekdotal sekitar ~200+ tokens/sec dalam beberapa pengujian internal/awal — jauh lebih cepat daripada banyak model kelas menengah yang sebanding.
Performa benchmark
SWE-Bench (coding): Haiku 4.5 meraih ~73.3% pada SWE-Bench Verified — hasil yang disorot Anthropic sebagai menempatkan Haiku 4.5 di antara model coding terbaik di dunia untuk kelasnya.

Terminal / command-line / pengujian alat: Anthropic melaporkan ~41% pada Terminal-Bench (berfokus pada command-line) dan hasil yang sebanding dengan Sonnet 4 serta beberapa model frontier kelas menengah pesaing pada banyak benchmark penggunaan alat.
Mengikuti instruksi & teks slide: contoh internal Anthropic menyatakan Haiku 4.5 melampaui model sebelumnya pada beberapa tugas mengikuti instruksi (mis., pembuatan teks slide: 65% vs 44% untuk model premium sebelumnya dalam benchmark mereka).
Otomatisasi dunia nyata / tugas agen: evaluasi pihak ketiga dan pengguna awal melaporkan tingkat keberhasilan kompetitif pada tugas UI/agen otomatis (misalnya, benchmark bergaya OSWorld atau agen yang melaporkan ≈50% keberhasilan pada otomasi kompleks dalam beberapa pengujian), menunjukkan kegunaan untuk alur kerja berskala meski memiliki mode kegagalan yang tidak sepele.

Keterbatasan & catatan keamanan
- Bukan model frontier: Anthropic secara eksplisit mengklasifikasikan Haiku 4.5 sebagai bukan frontier-advancing; model ini dioptimalkan untuk efisiensi alih-alih mendorong batas teratas kemampuan. (Anthropic)
- Perilaku sesekali pada topik sensitif: pada beberapa prompt terkait sains/keamanan hayati, Haiku 4.5 terkadang memberikan informasi tingkat tinggi dengan catatan alih-alih penolakan tegas; Anthropic menandai ini sebagai area yang terus ditingkatkan.
- Penalaran diperluas dapat mengubah perilaku (kadang meningkatkan asimetri dalam respons).
Rekomendasi kasus penggunaan
- Pengkodean berbasis agen & orkestrasi multi-agen: sub-agen cepat, refaktor kode iteratif, autotest dan pembuatan patch. (Cocok.)
- Alur kerja pelanggan real-time, volume tinggi: asisten chat, otomasi internal saat biaya per permintaan penting. (Cocok.)
- Alur kerja berkemampuan alat & kontrol komputer: mengotomatiskan tugas GUI/CLI, alur dokumen dan rantai alat di mana latensi rendah membantu. (Cocok.)
- Tidak direkomendasikan (tanpa kontrol): peran mandiri yang memerlukan perancangan sekuens ilmiah tingkat frontier atau tugas biosekuriti dengan jaminan tinggi. (Gunakan kehati-hatian.)