Claude Haiku 4.5 là một mô hình ngôn ngữ hạng nhỏ được tối ưu theo mục đích từ Anthropic, phát hành vào giữa tháng 10 năm 2025. Sản phẩm được định vị như một lựa chọn nhanh, chi phí thấp trong dòng Claude, vẫn giữ năng lực mạnh ở các tác vụ như lập trình, điều phối tác tử (agent) và các quy trình “sử dụng máy tính” tương tác, đồng thời cho phép thông lượng cao hơn nhiều và chi phí đơn vị thấp hơn cho các triển khai doanh nghiệp.
Tính năng chính
- Tốc độ & hiệu quả chi phí: Haiku 4.5 được mô tả là nhanh hơn hơn 2 lần so với Sonnet 4 và chi phí khoảng bằng một phần ba Sonnet 4 (và rẻ hơn nhiều so với Opus), khiến nó hấp dẫn cho các trường hợp sử dụng ở quy mô lớn.
- Tư duy mở rộng: Mẫu Haiku đầu tiên hỗ trợ extended thinking (tư duy tóm tắt/đan xen, ngân sách suy luận có thể cấu hình) để thực hiện suy luận nhiều bước sâu hơn trong khi cân bằng độ trễ.
- Công cụ & sử dụng máy tính: Hỗ trợ đầy đủ các công cụ của Claude (bash, thực thi mã, trình soạn thảo văn bản, tìm kiếm web và tự động hóa thao tác máy tính). Thiết kế cho quy trình tác tử (agentic) và kiến trúc tác tử phụ (sub-agent).
- Cửa sổ ngữ cảnh lớn: Cửa sổ ngữ cảnh 200k token (với tùy chọn ngữ cảnh 1M có sẵn trên các mô hình lớn hơn ở trạng thái beta cho các lớp mô hình khác).
Thông tin kỹ thuật
- Dữ liệu huấn luyện & mốc cắt: Haiku 4.5 được huấn luyện trên một tập hợp độc quyền gồm dữ liệu công khai và dữ liệu được cấp phép, với mốc cắt huấn luyện vào khoảng tháng 2 năm 2025.
- Extended-thinking (một chế độ suy luận lai) được hỗ trợ để mô hình có thể đánh đổi độ trễ lấy khả năng suy luận sâu hơn khi được yêu cầu.
- Cửa sổ ngữ cảnh khi phát hành là 200.000 token, và mô hình được thiết kế nhận biết ngữ cảnh rõ ràng (theo dõi mức sử dụng của cửa sổ).
- Hiệu năng / thông lượng: Các báo cáo ban đầu từ cộng đồng và thử nghiệm của Anthropic ghi nhận OTPS rất cao (số token đầu ra/giây) và tốc độ thực tế khoảng ~200+ token/giây trong một số thử nghiệm nội bộ/giai đoạn đầu — nhanh hơn nhiều so với nhiều mô hình tầm trung tương đương.
Hiệu năng qua benchmark
SWE-Bench (lập trình): Haiku 4.5 đạt ~73,3% trên SWE-Bench Verified — kết quả mà Anthropic nhấn mạnh là đưa Haiku 4.5 vào nhóm mô hình lập trình tốt nhất thế giới trong phân khúc của nó.

Terminal / dòng lệnh / kiểm thử công cụ: Anthropic báo cáo ~41% trên Terminal-Bench (tập trung vào dòng lệnh) và kết quả tương đương Sonnet 4 cùng một số mô hình tầm trung cạnh tranh khác trên nhiều benchmark về sử dụng công cụ.
Tuân thủ hướng dẫn & văn bản slide: ví dụ nội bộ của Anthropic cho thấy Haiku 4.5 vượt các mô hình trước đây ở một số tác vụ tuân thủ hướng dẫn (ví dụ, tạo văn bản slide: 65% so với 44% đối với một mô hình cao cấp trước đó trong benchmark của họ).
Tự động hóa thực tế / tác vụ tác tử: các đánh giá từ bên thứ ba và những người dùng sớm báo cáo tỷ lệ thành công cạnh tranh trên các tác vụ tự động hóa UI/tác tử (ví dụ, các benchmark kiểu OSWorld hoặc benchmark tác tử ghi nhận ≈50% thành công đối với tự động hóa phức tạp trong một số thử nghiệm), cho thấy tính hữu dụng cho các quy trình quy mô lớn dù vẫn tồn tại những chế độ lỗi đáng kể.

Hạn chế & lưu ý an toàn
- Không phải mô hình tiên phong: Anthropic phân loại rõ ràng Haiku 4.5 là không nhằm mở rộng ranh giới tiên tiến; mô hình được tối ưu cho hiệu quả thay vì thúc đẩy trình độ tiên tiến nhất tuyệt đối. (Anthropic)
- Hành vi với chủ đề nhạy cảm (thỉnh thoảng): trong một số yêu cầu liên quan khoa học/sinh học an toàn, Haiku 4.5 đôi khi trả về thông tin ở mức khái quát kèm lưu ý thay vì từ chối dứt khoát; Anthropic xem đây là một lĩnh vực đang tiếp tục cải thiện.
- Extended-thinking có thể làm thay đổi hành vi (đôi khi tăng tính bất đối xứng trong phản hồi).
Trường hợp sử dụng khuyến nghị
- Lập trình theo tác tử & điều phối đa tác tử: tác tử phụ tốc độ cao, tái cấu trúc mã lặp, kiểm thử tự động và tạo bản vá. (Phù hợp.)
- Quy trình khách hàng thời gian thực, khối lượng lớn: trợ lý chat, tự động hóa nội bộ nơi chi phí trên mỗi yêu cầu là quan trọng. (Phù hợp.)
- Quy trình dựa trên công cụ & điều khiển máy tính: tự động hóa tác vụ GUI/CLI, quy trình tài liệu và chuỗi công cụ nơi độ trễ thấp có lợi. (Phù hợp.)
- Không khuyến nghị (khi thiếu kiểm soát): các vai trò độc lập đòi hỏi thiết kế chuỗi khoa học ở mức tiên phong hoặc các tác vụ an ninh sinh học yêu cầu độ đảm bảo cao. (Cần thận trọng.)