Home/Models/OpenAI/GPT-5.1
O

GPT-5.1

Masukan:$1/M
Keluaran:$8/M
GPT-5.1 adalah model bahasa serbaguna yang disetel untuk mengikuti instruksi, berfokus pada pembuatan teks dan penalaran di berbagai alur kerja produk. Model ini mendukung dialog multi-putaran, pemformatan keluaran terstruktur, dan tugas berorientasi kode seperti penyusunan draf, refaktorisasi, dan penjelasan. Penggunaan umum mencakup asisten percakapan, QA yang ditingkatkan dengan retrieval, transformasi data, serta otomatisasi bergaya agen menggunakan alat atau API ketika didukung. Sorotan teknis mencakup modalitas berpusat pada teks, kemampuan mengikuti instruksi, keluaran bergaya JSON, serta kompatibilitas dengan pemanggilan fungsi dalam kerangka orkestrasi yang umum.
Baru
Penggunaan komersial
Playground
Ikhtisar
Fitur
Harga
API

GPT 5.1 API adalah varian penalaran lanjutan GPT-5.1 Thinking dari keluarga GPT-5.1 milik OpenAI; model ini memprioritaskan penalaran adaptif dan berkualitas lebih tinggi sekaligus memberi pengembang kendali eksplisit atas trade-off latensi/komputasi.

Fitur dasar

  • Penalaran adaptif: model menyesuaikan kedalaman “berpikir” secara dinamis per permintaan — lebih cepat untuk tugas rutin, lebih gigih pada yang kompleks. Ini mengurangi latensi dan penggunaan token untuk kueri umum. Secara eksplisit mengalokasikan lebih banyak waktu penalaran untuk prompt kompleks, dan lebih gigih pada masalah multi-langkah; bisa lebih lambat untuk tugas sulit namun memberikan jawaban lebih mendalam.
  • Mode penalaran: none / low / medium / high (GPT-5.1 secara default menggunakan none untuk kasus latensi rendah; pilih level lebih tinggi untuk tugas yang lebih menuntut). Responses API mengekspos parameter reasoning untuk mengontrol ini.
  • Nada & gaya default: ditulis agar lebih jelas pada topik kompleks (lebih sedikit jargon), lebih menjelaskan dan “sabar.”
  • Context window (tokens / long context) Thinking: jauh lebih besar — konteks 400K token untuk tier berbayar.

Detail teknis utama

  • Adaptive compute allocation — desain pelatihan dan inferensi membuat model menghabiskan lebih sedikit token penalaran pada tugas sepele dan secara proporsional lebih banyak pada tugas sulit. Ini bukan “mesin berpikir” terpisah melainkan alokasi dinamis di dalam pipeline penalaran.
  • Parameter penalaran di Responses API — klien mengirim sebuah objek reasoning (misalnya reasoning: { "effort": "high" }) untuk meminta penalaran internal yang lebih dalam; menyetel reasoning: { "effort": "none" } secara efektif menonaktifkan lintasan penalaran internal yang diperluas demi latensi lebih rendah. Responses API juga mengembalikan metadata reasoning/token (berguna untuk biaya dan debugging). )
  • Tools & parallel tool calls — GPT-5.1 meningkatkan pemanggilan tool paralel dan menyertakan named tools (seperti apply_patch) yang mengurangi mode kegagalan untuk pengeditan terprogram; paralelisasi meningkatkan throughput ujung-ke-ujung untuk alur kerja yang banyak tool.
  • Prompt cache dan persistensi — prompt_cache_retention='24h' didukung pada endpoint Responses dan Chat Completions untuk mempertahankan konteks di sesi multi-giliran (mengurangi pengkodean token berulang).

Kinerja benchmark

Contoh latensi/efisiensi token (dari vendor): pada kueri rutin, OpenAI melaporkan pengurangan dramatis pada waktu/token (contoh: perintah listing npm yang memakan ~10 dtk / ~250 token di GPT-5 kini ~2 dtk / ~50 token di GPT-5.1 pada uji representatif mereka). Penguji awal pihak ketiga (mis. manajer aset, firma coding) melaporkan peningkatan kecepatan 2–3× pada banyak tugas dan efisiensi token lebih baik di alur kerja yang banyak tool.

OpenAI dan mitra awal menerbitkan klaim benchmark representatif dan peningkatan terukur:

EvaluasiGPT‑5.1 (tinggi)GPT‑5 (tinggi)
SWE-bench Verified (semua 500 soal)76.3%72.8%
GPQA Diamond (tanpa alat)88.1%85.7%
AIME 2025 (tanpa alat)94.0%94.6%
FrontierMath (dengan alat Python)26.7%26.3%
MMMU85.4%84.2%
Tau2-bench Airline67.0%62.6%
Tau2-bench Telecom*95.6%96.7%
Tau2-bench Retail77.9%81.1%
BrowseComp Long Context 128k90.0%90.0%

Batasan & pertimbangan keamanan

  • Risiko halusinasi tetap ada. Penalaran adaptif membantu pada masalah kompleks tetapi tidak menghilangkan halusinasi; reasoning_effort yang lebih tinggi meningkatkan pengecekan namun tidak menjamin kebenaran. Selalu validasi output berisiko tinggi.
  • Trade-off sumber daya dan biaya: meski GPT-5.1 bisa jauh lebih efisien token pada alur sederhana, mengaktifkan upaya penalaran tinggi atau penggunaan tool agen yang panjang dapat meningkatkan konsumsi token dan latensi. Gunakan prompt caching untuk mengurangi biaya berulang jika sesuai.
  • Keamanan tool: tool apply_patch dan shell meningkatkan kekuatan otomasi (dan risiko). Deploy produksi harus membatasi eksekusi tool (tinjau diff/perintah sebelum eksekusi), gunakan least privilege, dan pastikan pagar pengaman CI/CD dan operasional yang kuat.

Perbandingan dengan model lain

  • vs GPT-5: GPT-5.1 meningkatkan penalaran adaptif dan kepatuhan instruksi; OpenAI melaporkan respons lebih cepat pada tugas mudah dan kegigihan lebih baik pada tugas sulit. GPT-5.1 juga menambahkan opsi penalaran none dan prompt caching yang diperluas.
  • vs GPT-4.x / 4.1: GPT-5.1 dirancang untuk tugas yang lebih agentic, banyak tool, dan coding; OpenAI dan mitra melaporkan peningkatan pada benchmark coding dan penalaran multi-langkah. Untuk banyak tugas percakapan standar, GPT-5.1 Instant mungkin sebanding dengan model chat GPT-4.x sebelumnya namun dengan kemampuan steering dan preset kepribadian yang lebih baik.
  • vs Anthropic / Claude / LLM lain: Arsitektur MoA ChatGPT 5.1 memberikannya keunggulan jelas pada tugas yang memerlukan penalaran kompleks multi-langkah. Model ini meraih skor 98.20 yang belum pernah terjadi pada benchmark HELM untuk penalaran kompleks, dibanding 95.60 milik Claude 4 dan 94.80 milik Gemini 2.0 Ultra.

Fitur untuk GPT-5.1

Jelajahi fitur-fitur utama dari GPT-5.1, yang dirancang untuk meningkatkan performa dan kegunaan. Temukan bagaimana kemampuan-kemampuan ini dapat menguntungkan proyek Anda dan meningkatkan pengalaman pengguna.

Harga untuk GPT-5.1

Jelajahi harga kompetitif untuk GPT-5.1, dirancang untuk berbagai anggaran dan kebutuhan penggunaan. Paket fleksibel kami memastikan Anda hanya membayar untuk apa yang Anda gunakan, memudahkan untuk meningkatkan skala seiring berkembangnya kebutuhan Anda. Temukan bagaimana GPT-5.1 dapat meningkatkan proyek Anda sambil menjaga biaya tetap terkendali.
Harga Comet (USD / M Tokens)Harga Resmi (USD / M Tokens)Diskon
Masukan:$1/M
Keluaran:$8/M
Masukan:$1.25/M
Keluaran:$10/M
-20%

Kode contoh dan API untuk GPT-5.1

GPT-5.1 Thinking adalah varian penalaran tingkat lanjut dari keluarga GPT-5.1 milik OpenAI; model ini mengutamakan penalaran yang adaptif dan berkualitas lebih tinggi sekaligus memberi pengembang kontrol eksplisit atas trade-off latensi/komputasi.
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="gpt-5.1", input="Tell me a three sentence bedtime story about a unicorn."
)

print(response)

Model Lainnya