什麼是 Claude Opus 4.5
Claude Opus 4.5 是 Anthropic 在 Claude 4.5 家族中的最新「Opus」級大型語言模型(LLM),專為 複雜推理、專業軟體工程,以及長時運行的 Agent 工作流程 而打造。Anthropic 將 Opus 4.5 定位為兼顧極致能力與實用效能,且相較先前 Opus 版本更易於負擔的頂級選項。此次發佈與 Sonnet 4.5、Haiku 4.5 一同完善了 Claude 4.5 家族。
Model family / identifier: Claude Opus 4.5(Anthropic 註記的 API 名稱為 claude-opus-4-5-20251101)。
Claude Opus 4.5 的核心功能
- 用途/主要強項: 專業軟體工程、進階 Agents、試算表/財務建模、延展的多輪工作流程,以及「電腦操作」(與 GUI、試算表、瀏覽器互動)。
- Effort 參數: 新的請求參數(low/medium/high),可在運算量/權杖用量與推理深度之間取捨。用於在延遲/成本與答案完整度之間進行調校。
- 增強的電腦操作與視覺: 新增 zoom 動作並改進螢幕/UI 檢視,讓模型在採取動作前能讀取更細緻的 UI 元素與圖像細節。
- 思考延續性:「思考區塊保留」——Opus 4.5 會保留先前的推理區塊,以在長時對話中維持連貫性。
Claude Opus 4.5 的技術細節
Model identifier:claude-opus-4-5-20251101(API 呼叫中常用的引用名稱)。
Context window & token limits: 輸入 200,000 權杖/輸出 64,000 權杖
Modalities: 支援文字、程式碼、影像與文件輸入;輸出為文字(結構化與非結構化)。合作整合可增添功能(批次預測、函式呼叫、提示快取)。
基準表現與實證結果
Anthropic 與多個獨立機構發佈/報導了 Opus 4.5 的基準結果與測試表現。以下為較具代表性的說法與數據:
- SWE-bench(軟體工程基準)——Anthropic 報告的評測中 SWE-bench 約為 80.9%。在 Anthropic 的 SWE-bench Multilingual 測試中,Opus 4.5 於 8 種程式語言中的 7 種領先。
- 實際場景的 Agent 耐久度——連續運作能力提升,對多步驟流程與工具協同的處理更佳。
- Aider Polyglot:在複雜編碼任務上較 Sonnet 4.5 提升 +10.6%。Anthropic
- Terminal Bench:在多步驟終端機/程式碼工作流程上較 Sonnet 4.5 提升 +15%。
- Vending-Bench(長期規劃):在長期 Agent 任務上較 Sonnet 4.5 提升 29%。
- 自主編碼:Anthropic 報告指稱在 30 分鐘的自主編碼階段內表現保持穩定(相較先前模型更早出現衰退)。
典型與優先使用情境
- 複雜軟體工程與長腳本 —— 程式碼生成、偵錯、多檔重構,以及自主編碼 Agents。
- 自主 Agents 與工具協同 —— 串接 API 呼叫、瀏覽、試算表自動化,以及需在多輪互動中保留狀態的長鏈多步驟工作流程。
- 大型文件綜整與研究 —— 法律摘要、長篇報告、多章節寫作,並可憑藉擴增的上下文與壓縮能力對超大語料進行摘要。
- 企業自動化 —— 內部工具、從檔案/試算表抽取資料,以及可持續運行業務流程的 Agents。
Claude Opus 4.5 對比 Gemini 3.0 Pro 與 GPT 5.1
| 維度 | Claude Opus 4.5 (Anthropic) | Gemini 3.0 Pro (Google) | GPT 5.1 (OpenAI) |
|---|---|---|---|
| 模型名稱 | claude-opus-4-5-20251101-thinking;claude-opus-4-5-20251101 | gemini-3-pro-preview-thinking;gemini-3-pro-preview | gpt-5.1-chat-latest;gpt-5.1 |
| 主要強項 | 長期任務 Agent 穩定性、權杖效率、程式設計與多 Agent 協同、重視安全。 | 前沿推理、多模態表現、排行榜頂尖成績(LMArena、GPQA、MathArena);廣泛的 Google 生態整合。 | 自適應推理、開發者體驗、延長的提示快取(24 小時)、高速互動與程式設計工具。 |
| 代表性定價(每 100 萬權杖的輸入/輸出) | $5/$25(Anthropic 聲稱的 Opus 4.5)。— 企業預覽定價。 | 據報導的預覽階層約 ≈ $2/$12 或更高級別(因地區/方案而異)。 | $1.25/$10(OpenAI 公布的 GPT-5.1 API 定價)。 |
| 上下文/視窗與記憶 | 著重於上下文壓縮、記憶功能與高效率長時會話;針對多 Agent 執行進行調校。 | 據報導擁有非常大的上下文視窗(預覽為 100 萬權杖),並支援多模態輸入(文字、影像、音訊、視訊)。 | 延伸的提示快取與高效率自適應推理;快取旨在降低後續互動的成本與延遲。 |
| 最適用於 | 企業級 Agents、長時自主程式工作流程、對成本敏感的長時運行、具備安全控管的受規範環境。 | 研究/基準測試、多模態推理、整合 Google 生態的功能(Search/Ads/Apps)。 | 互動式開發者產品、低延遲的程式輔助、可從提示快取受益的反覆工作流程。 |
如何存取 Claude opus 4.5 API
步驟 1:註冊取得 API 金鑰
登入 cometapi.com。若您尚未成為我們的使用者,請先註冊。登入您的 CometAPI console。取得介面的存取憑證 API 金鑰。在個人中心的 API token 處點選「Add Token」,取得 token 金鑰:sk-xxxxx 並提交。
<img height="527" width="1024" src="https://www.cometapi.com/wp-content/uploads/2025/09/cometapi-key-guide-1024x527.webp" />步驟 2:向 Claude opus 4.5 API 發送請求
選擇「claude-opus-4-5-20251101-thinking;claude-opus-4-5-20251101」端點以發送 API 請求並設定請求本文。請求方法與請求本文可於我們網站的 API 文件取得。我們的網站亦提供 Apifox 測試以利使用。將 <YOUR_API_KEY> 替換成您帳戶中的實際 CometAPI 金鑰。base url 為 Anthropic Messages 格式與 Chat 格式。
將您的問題或請求填入 content 欄位——模型將對該內容作出回應。處理 API 回應以取得產生的答案。
步驟 3:擷取並驗證結果
處理 API 回應以取得產生的答案。處理完成後,API 會回傳任務狀態與輸出資料。
See also Gemini 3 Pro Preview API