Home/Models/OpenAI/GPT-5.1
O

GPT-5.1

Đầu vào:$1/M
Đầu ra:$8/M
GPT-5.1 là một mô hình ngôn ngữ mục đích chung được tinh chỉnh theo hướng dẫn, tập trung vào việc tạo văn bản và suy luận trên các quy trình làm việc của sản phẩm. Mô hình hỗ trợ đối thoại đa lượt, định dạng đầu ra có cấu trúc, và các tác vụ hướng mã như soạn thảo, tái cấu trúc và giải thích. Các trường hợp sử dụng điển hình bao gồm trợ lý trò chuyện, Hỏi đáp tăng cường truy hồi, chuyển đổi dữ liệu, và tự động hóa kiểu tác tử với công cụ hoặc API khi được hỗ trợ. Những điểm nổi bật về kỹ thuật bao gồm chế độ lấy văn bản làm trung tâm, khả năng tuân theo hướng dẫn, đầu ra theo kiểu JSON, và khả năng tương thích với việc gọi hàm trong các khung điều phối phổ biến.
Mới
Sử dụng thương mại
Playground
Tổng quan
Tính năng
Giá cả
API

GPT 5.1 API là gì? GPT-5.1 Thinking là biến thể lập luận nâng cao trong họ GPT-5.1 của OpenAI, ưu tiên khả năng lập luận thích ứng và chất lượng cao đồng thời cung cấp cho nhà phát triển quyền kiểm soát rõ ràng đối với sự đánh đổi giữa độ trễ và chi phí tính toán.

Tính năng cơ bản

  • Lập luận thích ứng: mô hình tự động điều chỉnh độ sâu suy nghĩ theo từng yêu cầu — nhanh hơn với tác vụ thường lệ, kiên trì hơn với tác vụ phức tạp. Điều này giúp giảm độ trễ và số token cho các truy vấn phổ biến; đồng thời phân bổ rõ ràng nhiều thời gian lập luận hơn cho đề bài phức tạp và bền bỉ hơn với bài toán nhiều bước; có thể chậm hơn với bài khó nhưng cho câu trả lời sâu hơn.
  • Chế độ lập luận: none / low / medium / high (GPT-5.1 mặc định none cho trường hợp cần độ trễ thấp; chọn mức cao hơn cho tác vụ đòi hỏi hơn). Responses API cung cấp tham số reasoning để kiểm soát điều này.
  • Giọng điệu & phong cách mặc định: thiên về sự rõ ràng với chủ đề phức tạp (ít biệt ngữ hơn), giải thích cặn kẽ và “kiên nhẫn” hơn.
  • Cửa sổ ngữ cảnh (tokens / ngữ cảnh dài) Thinking: lớn hơn nhiều — ngữ cảnh 400K token cho các gói trả phí.

Chi tiết kỹ thuật chính

  • Phân bổ tính toán thích ứng — thiết kế huấn luyện và suy luận khiến mô hình dùng ít token lập luận hơn cho tác vụ tầm thường và dùng nhiều hơn theo tỷ lệ cho tác vụ khó. Đây không phải “động cơ suy nghĩ” tách biệt mà là phân bổ động trong pipeline lập luận.
  • Tham số lập luận trong Responses API — phía client truyền một đối tượng reasoning (ví dụ reasoning: { "effort": "high" }) để yêu cầu lập luận nội bộ sâu hơn; đặt reasoning: { "effort": "none" } sẽ vô hiệu hóa hiệu quả lượt lập luận nội bộ mở rộng để có độ trễ thấp hơn. Responses API cũng trả về metadata về reasoning/token (hữu ích cho chi phí và gỡ lỗi). )
  • Công cụ & lời gọi công cụ song song — GPT-5.1 cải thiện khả năng gọi công cụ song song và bao gồm các công cụ có tên (như apply_patch) giúp giảm lỗi khi chỉnh sửa theo chương trình; song song hóa tăng thông lượng đầu-cuối cho quy trình nặng công cụ.
  • Bộ nhớ đệm prompt và tính bền — hỗ trợ prompt_cache_retention='24h' trên các endpoint Responses và Chat Completions để giữ ngữ cảnh qua nhiều lượt hội thoại (giảm mã hóa token lặp lại).

Hiệu năng benchmark

Ví dụ về độ trễ / hiệu quả token (do nhà cung cấp cung cấp): với truy vấn thường lệ, OpenAI báo cáo giảm mạnh thời gian/token (ví dụ: một lệnh liệt kê npm mất ~10s / ~250 token trên GPT-5 nay còn ~2s / ~50 token trên GPT-5.1 trong thử nghiệm đại diện). Các bên thử nghiệm sớm bên thứ ba (ví dụ, nhà quản lý tài sản, công ty lập trình) báo cáo tăng tốc 2–3× trên nhiều tác vụ và cải thiện hiệu quả token trong các luồng nặng công cụ.

OpenAI và các đối tác sớm đã công bố các tuyên bố benchmark đại diện và những cải thiện đo được:

Đánh giáGPT‑5.1 (high)GPT‑5 (high)
SWE-bench Verified (all 500 problems)76.3%72.8%
GPQA Diamond (no tools)88.1%85.7%
AIME 2025 (no tools)94.0%94.6%
FrontierMath (with Python tool)26.7%26.3%
MMMU85.4%84.2%
Tau2-bench Airline67.0%62.6%
Tau2-bench Telecom*95.6%96.7%
Tau2-bench Retail77.9%81.1%
BrowseComp Long Context 128k90.0%90.0%

Hạn chế & cân nhắc an toàn

  • Rủi ro ảo giác vẫn tồn tại. Lập luận thích ứng giúp ích cho bài toán phức tạp nhưng không loại bỏ ảo giác; tăng reasoning_effort cải thiện kiểm tra nhưng không đảm bảo đúng tuyệt đối. Luôn xác thực đầu ra trong tình huống rủi ro cao.
  • Đánh đổi tài nguyên và chi phí: dù GPT-5.1 có thể hiệu quả token hơn nhiều trên luồng đơn giản, bật mức nỗ lực lập luận cao hoặc chuỗi dùng công cụ kéo dài có thể tăng tiêu thụ token và độ trễ. Dùng bộ nhớ đệm prompt để giảm chi phí lặp lại khi phù hợp.
  • An toàn công cụ: các công cụ apply_patch và shell tăng quyền tự động hóa (và rủi ro). Triển khai sản xuất nên kiểm soát thực thi công cụ (duyệt diff/lệnh trước khi chạy), áp dụng nguyên tắc đặc quyền tối thiểu, và bảo đảm CI/CD cùng rào chắn vận hành vững chắc.

So sánh với các mô hình khác

  • vs GPT-5: GPT-5.1 cải thiện lập luận thích ứng và tuân thủ chỉ dẫn; OpenAI báo cáo thời gian phản hồi nhanh hơn với tác vụ dễ và bền bỉ hơn với tác vụ khó. GPT-5.1 cũng bổ sung tùy chọn lập luận none và mở rộng bộ nhớ đệm prompt.
  • vs GPT-4.x / 4.1: GPT-5.1 được thiết kế cho tác vụ mang tính agent, nặng công cụ và lập trình; OpenAI và đối tác báo cáo cải thiện trên benchmark lập trình và lập luận nhiều bước. Với nhiều tác vụ trò chuyện chuẩn, GPT-5.1 Instant có thể tương đương các mẫu GPT-4.x trước đó nhưng khả năng điều hướng và thiết lập cá tính tốt hơn.
  • vs Anthropic / Claude / các LLM khác: ChatGPT 5.1′;s kiến trúc MoA mang lại lợi thế rõ rệt ở các tác vụ đòi hỏi lập luận phức tạp, nhiều bước. Mô hình đạt điểm số chưa từng có 98.20 trên benchmark HELM về lập luận phức tạp, so với 95.60 của Claude 4 và 94.80 của Gemini 2.0 Ultra.

Tính năng cho GPT-5.1

Khám phá các tính năng chính của GPT-5.1, được thiết kế để nâng cao hiệu suất và khả năng sử dụng. Tìm hiểu cách các khả năng này có thể mang lại lợi ích cho dự án của bạn và cải thiện trải nghiệm người dùng.

Giá cả cho GPT-5.1

Khám phá mức giá cạnh tranh cho GPT-5.1, được thiết kế để phù hợp với nhiều ngân sách và nhu cầu sử dụng khác nhau. Các gói linh hoạt của chúng tôi đảm bảo bạn chỉ trả tiền cho những gì bạn sử dụng, giúp dễ dàng mở rộng quy mô khi yêu cầu của bạn tăng lên. Khám phá cách GPT-5.1 có thể nâng cao các dự án của bạn trong khi vẫn kiểm soát được chi phí.
Giá Comet (USD / M Tokens)Giá Chính Thức (USD / M Tokens)Giảm giá
Đầu vào:$1/M
Đầu ra:$8/M
Đầu vào:$1.25/M
Đầu ra:$10/M
-20%

Mã mẫu và API cho GPT-5.1

GPT 5.1 API là gì, GPT-5.1 Thinking là biến thể suy luận nâng cao thuộc họ GPT-5.1 của OpenAI, nó ưu tiên khả năng suy luận thích ứng với chất lượng cao hơn đồng thời cho phép các nhà phát triển kiểm soát tường minh đối với sự đánh đổi giữa độ trễ / tài nguyên tính toán.
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="gpt-5.1", input="Tell me a three sentence bedtime story about a unicorn."
)

print(response)

Thêm mô hình