Claude Haiku 4.5 ialah model bahasa kelas lebih kecil yang dioptimumkan mengikut tujuan daripada Anthropic, dikeluarkan pada pertengahan Oktober 2025. Ia diposisikan sebagai pilihan pantas, kos rendah dalam barisan Claude yang mengekalkan keupayaan kukuh pada tugas seperti pengekodan, orkestrasi agen, dan aliran kerja “penggunaan komputer” interaktif sambil membolehkan kadar pemprosesan jauh lebih tinggi dan kos seunit lebih rendah untuk penerapan perusahaan.
Ciri utama
- Kelajuan & kecekapan kos: Haiku 4.5 digambarkan sebagai lebih daripada dua kali ganda lebih pantas berbanding Sonnet 4 dan kira-kira satu pertiga kos Sonnet 4 (dan jauh lebih murah daripada Opus), menjadikannya menarik untuk penggunaan berskala.
- Pemikiran lanjutan: Model Haiku pertama yang menyokong pemikiran lanjutan (pemikiran yang dirumus/diselang-selikan, belanjawan pemikiran boleh dikonfigurasi) untuk penaakulan berbilang langkah yang lebih mendalam sambil mengimbangi kependaman.
- Alat & penggunaan komputer: Sokongan penuh untuk alat Claude (bash, pelaksanaan kod, penyunting teks, carian web, dan automasi penggunaan komputer). Direka untuk aliran kerja beragensi dan seni bina sub-agen.
- Tetingkap konteks besar: Tetingkap konteks 200k token (dengan pilihan konteks 1M tersedia pada model lebih besar sebagai beta untuk kelas model lain).
Butiran teknikal
- Data latihan & cutoff: Haiku 4.5 dilatih pada gabungan proprietari data awam dan berlesen dengan cutoff latihan sekitar Februari 2025.
- Pemikiran lanjutan (mod penaakulan hibrid) disokong supaya model boleh menukar kependaman untuk penaakulan lebih mendalam apabila diminta.
- Tetingkap konteks ketika dikeluarkan ialah 200,000 token, dan model ini secara jelas peka konteks (ia menjejak berapa banyak tetingkap tersebut telah digunakan).
- Prestasi / throughput: Laporan komuniti awal dan ujian Anthropic menyebut OTPS yang sangat tinggi (token keluaran/saat) dan kelajuan anekdotal sekitar ~200+ token/saat dalam beberapa ujian dalaman/awal — jauh lebih pantas berbanding banyak model pertengahan setara.
Prestasi penanda aras
SWE-Bench (pengekodan): Haiku 4.5 mencatat ~73.3% pada SWE-Bench Verified — satu keputusan yang diketengahkan Anthropic sebagai meletakkan Haiku 4.5 antara model pengekodan terbaik di dunia untuk kelasnya.

Terminal / baris arahan / ujian alat: Anthropic melaporkan ~41% pada Terminal-Bench (berfokus baris arahan) dan keputusan setanding dengan Sonnet 4 serta beberapa model barisan hadapan julat pertengahan yang bersaing pada banyak penanda aras penggunaan alat.
Mengikut arahan & teks slaid: contoh dalaman Anthropic mendakwa Haiku 4.5 mengatasi model terdahulu pada sesetengah tugas mengikut arahan (cth., penjanaan teks slaid: 65% vs 44% untuk model premium terdahulu dalam penanda aras mereka).
Automasi dunia sebenar / tugas agen: penilaian pihak ketiga dan pengguna awal melaporkan kadar kejayaan kompetitif pada tugas UI/agen automatik (contohnya, gaya OSWorld atau penanda aras agen yang melaporkan ≈50% kejayaan pada automasi kompleks dalam beberapa ujian), menunjukkan kegunaan untuk aliran kerja berskala walaupun wujud mod kegagalan yang tidak remeh.

Batasan dan nota keselamatan
- Bukan model barisan hadapan: Anthropic secara jelas mengklasifikasikan Haiku 4.5 sebagai bukan memajukan barisan hadapan; ia dioptimumkan untuk kecekapan dan bukannya menolak tahap tercanggih mutlak. (Anthropic)
- Kelakuan sesekali pada topik sensitif: dalam sesetengah gesaan berkaitan sains/keselamatan bio, Haiku 4.5 kadangkala memberikan maklumat peringkat tinggi dengan peringatan berbanding penolakan tegas; Anthropic menandakan ini sebagai bidang yang sedang diperbaiki.
- Pemikiran lanjutan boleh mengubah tingkah laku (kadang-kadang meningkatkan ketidaksimetrian dalam respons).
Kes penggunaan yang disyorkan
- Pengekodan beragensi & orkestrasi berbilang agen: sub-agen pantas, pembaikpulih kod iteratif, ujian automatik dan penjanaan tampalan. (Sesuai.)
- Aliran kerja pelanggan masa nyata, berjumlah tinggi: pembantu sembang, automasi dalaman di mana kos per permintaan penting. (Sesuai.)
- Aliran kerja berasaskan alat & kawalan komputer: mengautomasi tugas GUI/CLI, aliran kerja dokumen dan rantaian alat di mana kependaman rendah membantu. (Sesuai.)
- Tidak disyorkan (tanpa kawalan): peranan kendiri yang memerlukan reka bentuk jujukan saintifik tahap barisan hadapan atau tugas biosekuriti jaminan tinggi. (Berhati-hati.)