Claude Opus 4.5 là gì
Claude Opus 4.5 là mẫu LLM “Opus”-class mới nhất của Anthropic trong gia đình Claude 4.5, được xây dựng cho lập luận phức tạp, kỹ nghệ phần mềm chuyên nghiệp và các quy trình tác nhân tự động chạy dài. Anthropic định vị Opus 4.5 là lựa chọn cao cấp cân bằng giữa năng lực tối đa, hiệu năng thực tế và mức giá dễ tiếp cận hơn so với các bản Opus trước. Bản phát hành này hoàn thiện dòng Claude 4.5 bên cạnh Sonnet 4.5 và Haiku 4.5.
Dòng mô hình / định danh: Claude Opus 4.5 (tên API do Anthropic ghi là claude-opus-4-5-20251101).
Tính năng cốt lõi của Claude Opus 4.5
- Mục đích / thế mạnh chính: Kỹ nghệ phần mềm chuyên nghiệp, tác nhân nâng cao, mô hình bảng tính/tài chính, quy trình đa lượt kéo dài và “computer use” (tương tác với GUI, bảng tính, trình duyệt).
- Tham số Effort: Tham số yêu cầu mới (thấp / trung bình / cao) cho phép đánh đổi tài nguyên tính toán/token lấy chiều sâu lập luận. Hữu ích để cân chỉnh độ trễ/chi phí so với mức độ chi tiết của câu trả lời.
- Khả năng sử dụng máy tính & thị giác được tăng cường: Hành động thu phóng mới và cải thiện khả năng kiểm tra màn hình/giao diện để mô hình đọc được các thành phần UI nhỏ và hình ảnh chi tiết trước khi thực hiện hành động.
- Tính liên tục tư duy: “Bảo toàn khối suy nghĩ” — Opus 4.5 giữ lại các khối lập luận trước đó để duy trì tính liên tục trong các phiên kéo dài.
Chi tiết kỹ thuật của Claude Opus 4.5
Định danh mô hình: claude-opus-4-5-20251101 (thường dùng trong gọi API).
Cửa sổ ngữ cảnh & giới hạn token: đầu vào 200.000 token / đầu ra 64.000 token
Khả năng: hỗ trợ đầu vào văn bản, mã, hình ảnh và tài liệu; đầu ra là văn bản (có cấu trúc và không cấu trúc). Tích hợp với đối tác bổ sung tính năng (dự đoán theo lô, gọi hàm, bộ nhớ đệm prompt).
Hiệu năng benchmark & kết quả thực nghiệm
Anthropic và nhiều nguồn độc lập đã công bố/báo cáo kết quả benchmark và hành vi thử nghiệm cho Opus 4.5. Dưới đây là các tuyên bố và con số đáng chú ý nhất:
- SWE-bench (benchmark kỹ nghệ phần mềm) — SWE-bench ≈ 80.9% theo đánh giá Anthropic báo cáo. Opus 4.5 dẫn đầu ở 7/8 ngôn ngữ lập trình trong bài kiểm tra SWE-bench Multilingual của Anthropic.
- Độ bền tác nhân trong thực tế — cải thiện vận hành tác nhân liên tục và xử lý tốt hơn các quy trình nhiều bước và điều phối công cụ.
- Aider Polyglot: +10.6% cải thiện so với Sonnet 4.5 trên các tác vụ mã hóa phức tạp. Anthropic
- Terminal Bench: +15% so với Sonnet 4.5 trong các quy trình terminal/mã nhiều bước.
- Vending-Bench (lập kế hoạch tầm xa): cải thiện 29% so với Sonnet 4.5 trên các tác vụ tác nhân tầm xa.
- Lập trình tự động: Anthropic báo cáo hiệu năng ổn định qua các phiên lập trình tự động 30 phút (trong khi các mô hình trước suy giảm sớm hơn).
Trường hợp sử dụng điển hình và ưu tiên
- Kỹ nghệ phần mềm phức tạp & tập lệnh dài — sinh mã, gỡ lỗi, tái cấu trúc nhiều tệp và tác nhân lập trình tự động.
- Tác nhân tự động và điều phối công cụ — xâu chuỗi gọi API, duyệt web, tự động hóa bảng tính và quy trình nhiều bước kéo dài cần bảo toàn trạng thái qua nhiều lượt.
- Tổng hợp tài liệu lớn & nghiên cứu — bản ghi pháp lý, báo cáo dài, viết nhiều chương và tóm tắt trên tập liệu rất lớn nhờ ngữ cảnh mở rộng và nén.
- Tự động hóa doanh nghiệp — công cụ nội bộ, trích xuất dữ liệu từ tệp/bảng tính và tác nhân vận hành quy trình kinh doanh liên tục.
Claude Opus 4.5 vs Gemini 3.0 Pro vs GPT 5.1
| Khía cạnh | Claude Opus 4.5 (Anthropic) | Gemini 3.0 Pro (Google) | GPT 5.1 (OpenAI) |
|---|---|---|---|
| Tên mô hình | claude-opus-4-5-20251101-thinking;claude-opus-4-5-20251101 | gemini-3-pro-preview-thinking;gemini-3-pro-preview | gpt-5.1-chat-latest;gpt-5.1 |
| Thế mạnh chính | Độ tin cậy tác nhân tầm xa, hiệu quả token, lập trình & điều phối đa tác nhân, tập trung vào an toàn. | Lập luận tiên tiến, hiệu suất đa phương thức, điểm dẫn đầu bảng xếp hạng (LMArena, GPQA, MathArena); tích hợp sâu Google. | Lập luận thích ứng, trải nghiệm cho nhà phát triển, bộ nhớ đệm prompt mở rộng (24h), tương tác nhanh và công cụ mã. |
| Mức giá đại diện (đầu vào/đầu ra trên mỗi 1M token) | $5 / $25 (Anthropic nêu cho Opus 4.5). — giá bản enterprise preview. | Các bậc preview được báo cáo ≈ $2 / $12 hoặc cao hơn tùy khu vực / gói. | $1.25 / $10 (giá API GPT-5.1 do OpenAI công bố). |
| Ngữ cảnh / cửa sổ & bộ nhớ | Tập trung vào nén ngữ cảnh, tính năng bộ nhớ và phiên dài hiệu quả; tối ưu cho chạy đa tác nhân. | Cửa sổ ngữ cảnh rất lớn được báo cáo (1M token ở bản preview) và đầu vào đa phương thức (văn bản, hình ảnh, âm thanh, video). | Bộ nhớ đệm prompt kéo dài và lập luận thích ứng hiệu quả; caching nhằm giảm chi phí & độ trễ cho các lượt tiếp theo. |
| Phù hợp nhất cho | Tác nhân doanh nghiệp, quy trình mã tự động kéo dài, chạy dài nhạy cảm chi phí, môi trường tuân thủ với kiểm soát an toàn. | Nghiên cứu/benchmark, lập luận đa phương thức, tính năng tích hợp hệ sinh thái Google (Search/Ads/Apps). | Sản phẩm cho nhà phát triển tương tác, trợ lý lập trình độ trễ thấp, quy trình lặp lại hưởng lợi từ bộ nhớ đệm prompt. |
Cách truy cập Claude opus 4.5 API
Bước 1: Đăng ký khóa API
Đăng nhập vào cometapi.com. Nếu bạn chưa phải là người dùng của chúng tôi, vui lòng đăng ký trước. Đăng nhập vào CometAPI console. Lấy khóa API thông tin truy cập của giao diện. Nhấp “Add Token” tại mục API token trong trung tâm cá nhân, lấy khóa token: sk-xxxxx và gửi.
<img height="527" width="1024" src="https://www.cometapi.com/wp-content/uploads/2025/09/cometapi-key-guide-1024x527.webp" />Bước 2: Gửi yêu cầu tới Claude opus 4.5 API
Chọn endpoint “claude-opus-4-5-20251101-thinking;claude-opus-4-5-20251101” để gửi yêu cầu API và thiết lập phần thân yêu cầu. Phương thức yêu cầu và phần thân yêu cầu được lấy từ tài liệu API trên website của chúng tôi. Website cũng cung cấp bài kiểm thử Apifox để bạn tiện sử dụng. Thay thế <YOUR_API_KEY> bằng khóa CometAPI thực tế từ tài khoản của bạn. base url ở định dạng Anthropic Messages và định dạng Chat.
Chèn câu hỏi hoặc yêu cầu của bạn vào trường content — đây là nội dung mô hình sẽ phản hồi. Xử lý phản hồi API để lấy câu trả lời được tạo.
Bước 3: Truy xuất và xác minh kết quả
Xử lý phản hồi API để lấy câu trả lời được tạo. Sau khi xử lý, API phản hồi trạng thái tác vụ và dữ liệu đầu ra.
Xem thêm Gemini 3 Pro Preview API