Home/Models/Anthropic/Claude Haiku 4.5
C

Claude Haiku 4.5

Đầu vào:$0.8/M
Đầu ra:$4/M
Bối cảnh:200K
Đầu ra tối đa:8K
Mô hình nhanh nhất, tiết kiệm chi phí nhất.
Mới
Sử dụng thương mại
Playground
Tổng quan
Tính năng
Giá cả
API
Phiên bản

Claude Haiku 4.5 là một mô hình ngôn ngữ hạng nhỏ được tối ưu theo mục đích từ Anthropic, phát hành vào giữa tháng 10 năm 2025. Sản phẩm được định vị như một lựa chọn nhanh, chi phí thấp trong dòng Claude, vẫn giữ năng lực mạnh ở các tác vụ như lập trình, điều phối tác tử (agent) và các quy trình “sử dụng máy tính” tương tác, đồng thời cho phép thông lượng cao hơn nhiều và chi phí đơn vị thấp hơn cho các triển khai doanh nghiệp.

Tính năng chính

  • Tốc độ & hiệu quả chi phí: Haiku 4.5 được mô tả là nhanh hơn hơn 2 lần so với Sonnet 4 và chi phí khoảng bằng một phần ba Sonnet 4 (và rẻ hơn nhiều so với Opus), khiến nó hấp dẫn cho các trường hợp sử dụng ở quy mô lớn.
  • Tư duy mở rộng: Mẫu Haiku đầu tiên hỗ trợ extended thinking (tư duy tóm tắt/đan xen, ngân sách suy luận có thể cấu hình) để thực hiện suy luận nhiều bước sâu hơn trong khi cân bằng độ trễ.
  • Công cụ & sử dụng máy tính: Hỗ trợ đầy đủ các công cụ của Claude (bash, thực thi mã, trình soạn thảo văn bản, tìm kiếm web và tự động hóa thao tác máy tính). Thiết kế cho quy trình tác tử (agentic) và kiến trúc tác tử phụ (sub-agent).
  • Cửa sổ ngữ cảnh lớn: Cửa sổ ngữ cảnh 200k token (với tùy chọn ngữ cảnh 1M có sẵn trên các mô hình lớn hơn ở trạng thái beta cho các lớp mô hình khác).

Thông tin kỹ thuật

  • Dữ liệu huấn luyện & mốc cắt: Haiku 4.5 được huấn luyện trên một tập hợp độc quyền gồm dữ liệu công khai và dữ liệu được cấp phép, với mốc cắt huấn luyện vào khoảng tháng 2 năm 2025.
  • Extended-thinking (một chế độ suy luận lai) được hỗ trợ để mô hình có thể đánh đổi độ trễ lấy khả năng suy luận sâu hơn khi được yêu cầu.
  • Cửa sổ ngữ cảnh khi phát hành là 200.000 token, và mô hình được thiết kế nhận biết ngữ cảnh rõ ràng (theo dõi mức sử dụng của cửa sổ).
  • Hiệu năng / thông lượng: Các báo cáo ban đầu từ cộng đồng và thử nghiệm của Anthropic ghi nhận OTPS rất cao (số token đầu ra/giây) và tốc độ thực tế khoảng ~200+ token/giây trong một số thử nghiệm nội bộ/giai đoạn đầu — nhanh hơn nhiều so với nhiều mô hình tầm trung tương đương.

Hiệu năng qua benchmark

SWE-Bench (lập trình): Haiku 4.5 đạt ~73,3% trên SWE-Bench Verified — kết quả mà Anthropic nhấn mạnh là đưa Haiku 4.5 vào nhóm mô hình lập trình tốt nhất thế giới trong phân khúc của nó.

hình

Terminal / dòng lệnh / kiểm thử công cụ: Anthropic báo cáo ~41% trên Terminal-Bench (tập trung vào dòng lệnh) và kết quả tương đương Sonnet 4 cùng một số mô hình tầm trung cạnh tranh khác trên nhiều benchmark về sử dụng công cụ.

Tuân thủ hướng dẫn & văn bản slide: ví dụ nội bộ của Anthropic cho thấy Haiku 4.5 vượt các mô hình trước đây ở một số tác vụ tuân thủ hướng dẫn (ví dụ, tạo văn bản slide: 65% so với 44% đối với một mô hình cao cấp trước đó trong benchmark của họ).

Tự động hóa thực tế / tác vụ tác tử: các đánh giá từ bên thứ ba và những người dùng sớm báo cáo tỷ lệ thành công cạnh tranh trên các tác vụ tự động hóa UI/tác tử (ví dụ, các benchmark kiểu OSWorld hoặc benchmark tác tử ghi nhận ≈50% thành công đối với tự động hóa phức tạp trong một số thử nghiệm), cho thấy tính hữu dụng cho các quy trình quy mô lớn dù vẫn tồn tại những chế độ lỗi đáng kể.

hình

Hạn chế & lưu ý an toàn

  • Không phải mô hình tiên phong: Anthropic phân loại rõ ràng Haiku 4.5 là không nhằm mở rộng ranh giới tiên tiến; mô hình được tối ưu cho hiệu quả thay vì thúc đẩy trình độ tiên tiến nhất tuyệt đối. (Anthropic)
  • Hành vi với chủ đề nhạy cảm (thỉnh thoảng): trong một số yêu cầu liên quan khoa học/sinh học an toàn, Haiku 4.5 đôi khi trả về thông tin ở mức khái quát kèm lưu ý thay vì từ chối dứt khoát; Anthropic xem đây là một lĩnh vực đang tiếp tục cải thiện.
  • Extended-thinking có thể làm thay đổi hành vi (đôi khi tăng tính bất đối xứng trong phản hồi).

Trường hợp sử dụng khuyến nghị

  • Lập trình theo tác tử & điều phối đa tác tử: tác tử phụ tốc độ cao, tái cấu trúc mã lặp, kiểm thử tự động và tạo bản vá. (Phù hợp.)
  • Quy trình khách hàng thời gian thực, khối lượng lớn: trợ lý chat, tự động hóa nội bộ nơi chi phí trên mỗi yêu cầu là quan trọng. (Phù hợp.)
  • Quy trình dựa trên công cụ & điều khiển máy tính: tự động hóa tác vụ GUI/CLI, quy trình tài liệu và chuỗi công cụ nơi độ trễ thấp có lợi. (Phù hợp.)
  • Không khuyến nghị (khi thiếu kiểm soát): các vai trò độc lập đòi hỏi thiết kế chuỗi khoa học ở mức tiên phong hoặc các tác vụ an ninh sinh học yêu cầu độ đảm bảo cao. (Cần thận trọng.)

Tính năng cho Claude Haiku 4.5

Khám phá các tính năng chính của Claude Haiku 4.5, được thiết kế để nâng cao hiệu suất và khả năng sử dụng. Tìm hiểu cách các khả năng này có thể mang lại lợi ích cho dự án của bạn và cải thiện trải nghiệm người dùng.

Giá cả cho Claude Haiku 4.5

Khám phá mức giá cạnh tranh cho Claude Haiku 4.5, được thiết kế để phù hợp với nhiều ngân sách và nhu cầu sử dụng khác nhau. Các gói linh hoạt của chúng tôi đảm bảo bạn chỉ trả tiền cho những gì bạn sử dụng, giúp dễ dàng mở rộng quy mô khi yêu cầu của bạn tăng lên. Khám phá cách Claude Haiku 4.5 có thể nâng cao các dự án của bạn trong khi vẫn kiểm soát được chi phí.
Giá Comet (USD / M Tokens)Giá Chính Thức (USD / M Tokens)Giảm giá
Đầu vào:$0.8/M
Đầu ra:$4/M
Mỗi Giây:$1
-20%

Mã mẫu và API cho Claude Haiku 4.5

Claude Haiku 4.5 là một mô hình ngôn ngữ cỡ nhỏ được tối ưu hóa theo mục đích của Anthropic, ra mắt vào giữa tháng 10 năm 2025. Sản phẩm được định vị là một lựa chọn nhanh, chi phí thấp trong dòng sản phẩm Claude, vẫn giữ vững năng lực mạnh mẽ ở các tác vụ như lập trình, điều phối tác tử và các quy trình làm việc tương tác “sử dụng máy tính”, đồng thời cho phép thông lượng cao hơn nhiều và chi phí trên mỗi đơn vị thấp hơn cho các triển khai cấp doanh nghiệp.
Python
JavaScript
Curl
import anthropic
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

message = anthropic.Anthropic(
    base_url=BASE_URL,
    api_key=COMETAPI_KEY,
)
messages = message.messages.create(
    model="claude-haiku-4-5-20251001",
    max_tokens=1024,
    messages=[{"role": "user", "content": "Hello, Claude"}],
)
print(messages.content[0].text)

Các phiên bản của Claude Haiku 4.5

Lý do Claude Haiku 4.5 có nhiều snapshot có thể bao gồm các yếu tố tiềm năng như: sự thay đổi đầu ra sau các bản cập nhật cần các snapshot cũ để đảm bảo tính nhất quán, cung cấp cho nhà phát triển thời gian chuyển tiếp để thích ứng và di chuyển, cũng như các snapshot khác nhau tương ứng với các endpoint toàn cầu hoặc khu vực nhằm tối ưu hóa trải nghiệm người dùng. Để biết chi tiết về sự khác biệt giữa các phiên bản, vui lòng tham khảo tài liệu chính thức.
claude-haiku-4-5-20251001
cometapi-haiku-4-5-20251001phiên bản đặc biệt của cursor

Thêm mô hình