Home/Models/OpenAI/GPT-5.1 Chat
O

GPT-5.1 Chat

Đầu vào:$1/M
Đầu ra:$8/M
Bối cảnh:400.0k
Đầu ra tối đa:128.0k
GPT-5.1 Chat là mô hình ngôn ngữ hội thoại được tinh chỉnh theo chỉ dẫn cho các mục đích chung về trò chuyện, suy luận và viết. Nó hỗ trợ đối thoại nhiều lượt, tóm tắt, soạn thảo, hỏi-đáp dựa trên cơ sở tri thức, và hỗ trợ viết mã nhẹ cho các trợ lý trong ứng dụng, tự động hóa hỗ trợ, và trợ lý đồng hành cho quy trình làm việc. Các điểm nổi bật kỹ thuật bao gồm căn chỉnh tối ưu cho hội thoại, đầu ra có thể kiểm soát và có cấu trúc, cùng các lộ trình tích hợp để gọi công cụ và quy trình truy xuất khi khả dụng.
Mới
Sử dụng thương mại
Playground
Tổng quan
Tính năng
Giá cả
API

gpt-5.1-chat-latest API, là GPT-5.1 Instant của OpenAI — biến thể độ trễ thấp của họ GPT-5.1 mới phát hành (được công bố vào ngày 12 tháng 11 năm 2025). Nó được thiết kế để mang lại trải nghiệm ChatGPT “được dùng nhiều nhất” với chuyển lượt nhanh hơn, giọng điệu hội thoại mặc định ấm áp hơn, khả năng tuân thủ hướng dẫn được cải thiện và khả năng adaptive-reasoning tích hợp sẵn, có thể quyết định khi nào trả lời ngay và khi nào dùng thêm tài nguyên tính toán để “suy nghĩ” qua các truy vấn khó hơn.

Thông tin cơ bản & tính năng

  • Giọng điệu mặc định ấm áp, giàu tính hội thoại hơn và có nhiều preset giọng điệu/cá nhân hóa để khớp sở thích người dùng (ví dụ: Chuyên nghiệp, Thân thiện, Thẳng thắn, Hơi lập dị, Hiệu quả, Mọt sách, Hoài nghi).
  • Lý luận thích ứng: mô hình quyết định khi nào cần thêm bước lý luận trước khi trả lời; Instant nhắm đến tốc độ trên hầu hết các lời nhắc thường ngày trong khi vẫn nỗ lực thêm khi phù hợp.
  • Cải thiện khả năng tuân thủ hướng dẫn (ít hiểu sai hơn trên các lời nhắc nhiều bước) và nhìn chung giảm biệt ngữ để người dùng dễ hiểu hơn (đặc biệt ở biến thể Thinking).
  • Thiết kế cho trải nghiệm thời gian thực: phản hồi dạng streaming, độ trễ khứ hồi theo token thấp — hữu ích cho trợ lý giọng nói, chuyển lời nói thành văn bản trực tiếp và các ứng dụng hội thoại tương tác cao.

Chi tiết kỹ thuật (dành cho nhà phát triển)

  • Định danh model API: OpenAI sẽ cung cấp Instant trong API dưới định danh kiểu chat gpt-5.1-chat-latest (Instant) và gpt-5.1 cho bản Thinking (theo ghi chú phát hành của OpenAI). Sử dụng endpoint Responses API để đạt hiệu suất tốt nhất.
  • Responses API & tham số: Họ GPT-5 (bao gồm 5.1) hoạt động tốt nhất qua Responses API mới hơn. Các tùy chọn điển hình bạn sẽ truyền gồm tên model, input/tin nhắn, và các tham số điều khiển tùy chọn như verbosity / reasoning (mức nỗ lực) để tinh chỉnh mức độ lý luận nội bộ trước khi phản hồi (giả định nền tảng tuân theo cùng quy ước tham số được giới thiệu với GPT-5). Với ứng dụng tương tác cao, hãy bật phản hồi dạng streaming.
  • Hành vi lý luận thích ứng: Instant được tinh chỉnh để ưu tiên trả lời nhanh nhưng có khả năng lý luận thích ứng mức nhẹ — nó sẽ phân bổ thêm một ít tài nguyên tính toán cho các lời nhắc khó (toán, mã, lý luận nhiều bước) nhằm giảm lỗi đồng thời vẫn giữ độ trễ trung bình thấp. GPT-5.1 Thinking sẽ dùng nhiều tài nguyên hơn cho bài toán khó và ít hơn cho bài toán đơn giản.

Hiệu năng benchmark & an toàn

GPT-5.1 Instant được tinh chỉnh để giữ phản hồi nhanh trong khi cải thiện các đánh giá toán và lập trình (AIME 2025, các cải thiện trên Codeforces được OpenAI ghi nhận cụ thể).

OpenAI đã công bố một phụ lục GPT-5.1 System Card với số liệu benchmark sản xuất và các đánh giá an toàn theo mục tiêu. Số liệu chính (Production Benchmarks, cao hơn = tốt hơn, chỉ số not_unsafe):

  • Bất hợp pháp / không bạo lực (not_unsafe) — gpt-5.1-instant: 0.853.
  • Dữ liệu cá nhân — gpt-5.1-instant: 1.000 (hoàn hảo trên benchmark này).
  • Quấy rối — gpt-5.1-instant: 0.836.
  • Sức khỏe tinh thần (đánh giá mới) — gpt-5.1-instant: 0.883.
  • StrongReject (độ bền trước jailbreak, not_unsafe) — gpt-5.1-instant: 0.976 (cho thấy độ bền tốt trước jailbreak so với các checkpoint instant cũ hơn).

Trường hợp sử dụng điển hình và khuyến nghị cho GPT-5.1 Instant

  1. Chatbot & giao diện hội thoại — hỗ trợ khách hàng, trợ lý bán hàng và hướng dẫn sản phẩm, nơi độ trễ thấp duy trì nhịp hội thoại.
  2. Trợ lý giọng nói / phản hồi dạng streaming — phát trực tuyến đầu ra từng phần tới UI hoặc engine TTS cho tương tác dưới 1 giây.
  3. Tóm tắt, diễn đạt lại, soạn thảo tin nhắn — biến đổi nhanh, hưởng lợi từ giọng điệu thân thiện, gần gũi hơn.
  4. Hỗ trợ code nhẹ và gỡ lỗi inline — cho snippet nhanh và gợi ý; dùng bản Thinking cho các cuộc săn lỗi sâu. (Hãy thử trên codebase của bạn.)
  5. Front-end cho agent và quy trình tăng cường truy xuất — khi bạn cần phản hồi nhanh kết hợp thỉnh thoảng lý luận sâu/gọi công cụ. Tận dụng hành vi lý luận thích ứng để cân bằng chi phí so với độ sâu.

So sánh với các mô hình khác

  • GPT-5.1 vs GPT-5: GPT-5.1 là bản nâng cấp được tinh chỉnh — giọng điệu mặc định ấm hơn, tuân thủ hướng dẫn tốt hơn và có lý luận thích ứng. OpenAI định vị 5.1 là tốt hơn trong các khía cạnh họ nhắm đến, nhưng vẫn giữ GPT-5 trong danh mục kế thừa để chuyển tiếp/tương thích.
  • GPT-5.1 vs GPT-4.1 / GPT-4.5 / GPT-4o: Họ GPT-5 vẫn nhắm đến hiệu năng lý luận và lập trình cao hơn dòng GPT-4.x; GPT-4.1 vẫn hữu ích cho ngữ cảnh rất dài hoặc triển khai nhạy cảm về chi phí. Giới truyền thông nhấn mạnh lợi thế của GPT-5/5.1 trên các benchmark toán/lập trình khó, nhưng lợi thế theo tác vụ phụ thuộc từng benchmark.
  • GPT-5.1 vs Claude / Gemini / đối thủ khác: bình luận ban đầu xem GPT-5.1 là hồi đáp cho phản hồi người dùng (tính cách + năng lực). Các đối thủ (Claude Sonnet series của Anthropic, Gemini 3 Pro của Google, ERNIE của Baidu) nhấn mạnh đánh đổi khác nhau (ưu tiên an toàn, đa phương thức, ngữ cảnh lớn). Với khách hàng kỹ thuật, hãy đánh giá theo chi phí, độ trễ, hành vi an toàn trên tác vụ của bạn (prompt + gọi công cụ + dữ liệu miền).

Tính năng cho GPT-5.1 Chat

Khám phá các tính năng chính của GPT-5.1 Chat, được thiết kế để nâng cao hiệu suất và khả năng sử dụng. Tìm hiểu cách các khả năng này có thể mang lại lợi ích cho dự án của bạn và cải thiện trải nghiệm người dùng.

Giá cả cho GPT-5.1 Chat

Khám phá mức giá cạnh tranh cho GPT-5.1 Chat, được thiết kế để phù hợp với nhiều ngân sách và nhu cầu sử dụng khác nhau. Các gói linh hoạt của chúng tôi đảm bảo bạn chỉ trả tiền cho những gì bạn sử dụng, giúp dễ dàng mở rộng quy mô khi yêu cầu của bạn tăng lên. Khám phá cách GPT-5.1 Chat có thể nâng cao các dự án của bạn trong khi vẫn kiểm soát được chi phí.
Giá Comet (USD / M Tokens)Giá Chính Thức (USD / M Tokens)Giảm giá
Đầu vào:$1/M
Đầu ra:$8/M
Đầu vào:$1.25/M
Đầu ra:$10/M
-20%

Mã mẫu và API cho GPT-5.1 Chat

GPT-5.1 Instant của OpenAI là biến thể độ trễ thấp của dòng GPT-5.1 vừa ra mắt (được công bố vào ngày 12 tháng 11 năm 2025). Sản phẩm được thiết kế để mang lại trải nghiệm ChatGPT “được sử dụng nhiều nhất” với tốc độ luân phiên lượt nói nhanh hơn, tông giọng hội thoại mặc định ấm áp hơn, khả năng tuân thủ chỉ dẫn được cải thiện, và khả năng lập luận thích ứng tích hợp sẵn có thể quyết định khi nào phản hồi ngay lập tức và khi nào dành thêm tài nguyên tính toán để “suy nghĩ” kỹ hơn đối với các truy vấn khó.
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="gpt-5.1-chat-latest", input="Tell me a three sentence bedtime story about a unicorn."
)

print(response)

Thêm mô hình