Home/Models/OpenAI/GPT-5.1 Chat
O

GPT-5.1 Chat

輸入:$1/M
輸出:$8/M
上下文:400.0k
最大輸出:128.0k
GPT-5.1 Chat 是一個經指令微調的對話式語言模型,用於通用聊天、推理與寫作。它支援多輪對話、摘要、草擬、知識庫問答,以及面向應用內助理、支援自動化與工作流程副駕的輕量級程式碼輔助。技術亮點包括針對聊天優化的對齊、可控且結構化的輸出,以及在可用時提供工具呼叫與檢索工作流程的整合路徑。
新
商業用途
Playground
概覽
功能
定價
API

gpt-5.1-chat-latest API,是 OpenAI 的 GPT-5.1 Instant,即新近發佈的 GPT-5.1 系列的低延遲變體(於 2025 年 11 月 12 日宣佈)。其旨在提供「最常用」的 ChatGPT 體驗,具備更快的輪次切換、更溫暖的對話語氣預設、更佳的指令遵循能力,以及內建的自適應推理能力,可判斷何時立即回覆、何時投入額外算力來「思考」較困難的查詢。

基本資訊與功能

  • 更溫暖、更具對話感的預設語氣,並擴充語氣/個人化預設以匹配使用者偏好(例:Professional、Friendly、Candid、Quirky、Efficient、Nerdy、Cynical)。
  • **自適應推理:**模型會自行判斷何時需要在回答前進行額外推理;Instant 目標是在日常提示上保持快速,同時在必要時投入更多精力。
  • 改善指令遵循(在多步驟提示上更少誤解),且一般性地減少行話以利使用者理解(特別是在 Thinking 變體上)。
  • 為即時 UX而設計:支援串流回應;低 token 往返延遲,適用於語音助理、即時轉寫與高互動性的對話式應用。

技術細節(面向開發者)

  • **API 模型識別符:**OpenAI 將在 API 中以對話風格識別符 gpt-5.1-chat-latest(Instant)與 gpt-5.1(Thinking;依據 OpenAI 發佈說明)提供。建議使用 Responses API 端點以獲得最佳效率。
  • **Responses API 與參數:**GPT-5 系列(包含 5.1)最適合透過較新的 Responses API 使用。常見選項包含模型名稱、輸入/訊息,以及可選的控制參數如 verbosity / reasoning(推理投入),用以調節模型在回覆前的內部推理量(假設平台沿用 GPT-5 引入的參數慣例)。對高度互動的應用,請啟用串流回覆。
  • **自適應推理行為:**Instant 偏向快速回覆,但具備「輕量級」自適應推理——在較難(數學、程式、 多步推理)的提示上會適度投入更多算力,以降低錯誤,同時維持平均延遲較低。GPT-5.1 Thinking 會在困難問題上投入更多算力、在簡單問題上投入更少。

基準與安全表現

GPT-5.1 Instant 調校為在維持回覆快速的同時提升數學與程式評測表現(OpenAI 特別提到 AIME 2025 與 Codeforces 的改進)。

OpenAI 發佈了含生產基準指標與定向安全評估的 GPT-5.1 System Card addendum。關鍵數據(Production Benchmarks,數值越高越好,not_unsafe 指標):

  • Illicit / non-violent(not_unsafe)— gpt-5.1-instant:0.853。
  • Personal data — gpt-5.1-instant:1.000(此基準上達到滿分)。
  • Harassment — gpt-5.1-instant:0.836。
  • Mental health (new eval) — gpt-5.1-instant:0.883。
  • StrongReject (jailbreak robustness, not_unsafe) — gpt-5.1-instant:0.976(相較較舊的 instant 檢查點展現更強的對抗越獄魯棒性)。

GPT-5.1 Instant 的典型與推薦用例

  1. 聊天機器人與對話式介面——客服支援、銷售助理、產品指南;低延遲有助維持對話流暢。
  2. 語音助理/串流回覆——將部分輸出串流至 UI 或 TTS 引擎,以實現次秒級互動。
  3. 摘要、改寫、訊息撰寫——快速轉換並具更友善的語氣。
  4. 輕量級程式協助與即時除錯——適合快速程式片段與建議;更深入的除錯請使用 Thinking。(請在您的程式碼庫上測試。)
  5. Agent 前端與檢索增強工作流——在需要快速回覆、偶爾深度推理/工具呼叫的場景。利用自適應推理在成本與深度間取得平衡。

與其他模型的比較

  • GPT-5.1 對 GPT-5: GPT-5.1 是調校升級版——更溫暖的預設語氣、更佳的指令遵循、自適應推理。OpenAI 將 5.1 定位為在其目標領域上「嚴格更好」,同時保留 GPT-5 於舊版清單以利過渡/相容性。
  • GPT-5.1 對 GPT-4.1 / GPT-4.5 / GPT-4o: GPT-5 系列在推理與程式能力上仍以超越 GPT-4.x 為目標;GPT-4.1 在超長上下文或成本敏感部署上仍具價值。媒體報導強調 GPT-5/5.1 在高難度數學/程式基準上的領先,但具體優勢視任務與基準而定。
  • GPT-5.1 對 Claude / Gemini / 其他競品: 早期評論認為 GPT-5.1 回應了使用者對個性與能力的反饋。競品(Anthropic 的 Claude Sonnet 系列、Google 的 Gemini 3 Pro、Baidu 的 ERNIE 變體)強調不同的取捨(安全優先、多模態、超長上下文)。對技術客戶而言,請在您的工作負載(提示 + 工具呼叫 + 領域資料)上評估成本、延遲與安全表現。

GPT-5.1 Chat 的功能

探索 GPT-5.1 Chat 的核心功能,專為提升效能和可用性而設計。了解這些功能如何為您的專案帶來效益並改善使用者體驗。

GPT-5.1 Chat 的定價

探索 GPT-5.1 Chat 的競爭性定價,專為滿足各種預算和使用需求而設計。我們靈活的方案確保您只需為實際使用量付費,讓您能夠隨著需求增長輕鬆擴展。了解 GPT-5.1 Chat 如何在保持成本可控的同時提升您的專案效果。
彗星價格 (USD / M Tokens)官方價格 (USD / M Tokens)折扣
輸入:$1/M
輸出:$8/M
輸入:$1.25/M
輸出:$10/M
-20%

GPT-5.1 Chat 的範例程式碼和 API

OpenAI 的 GPT-5.1 Instant 是新近發布的 GPT-5.1 系列的低延遲變體(於 2025 年 11 月 12 日宣布)。它旨在提供「最常用」的 ChatGPT 體驗,具備更快的輪流應答、更溫暖的對話語氣預設、更強的指令遵循能力,以及內建的自適應推理能力,可判斷何時應立即回覆、何時為較困難的查詢投入額外算力進行「思考」。
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="gpt-5.1-chat-latest", input="Tell me a three sentence bedtime story about a unicorn."
)

print(response)

更多模型