Home/Models/OpenAI/GPT-5.1
O

GPT-5.1

ان پٹ:$1/M
آؤٹ پٹ:$8/M
GPT-5.1 ایک عمومی مقاصد کے لیے ہدایات کے مطابق تربیت یافتہ لسانی ماڈل ہے جو متن کی تخلیق اور پروڈکٹ ورک فلو میں استدلال پر مرکوز ہے۔ یہ متعدد مراحل پر مشتمل مکالمے، ساختہ آؤٹ پٹ فارمیٹنگ، اور ڈرافٹنگ، ریفیکٹرنگ اور وضاحت جیسے کوڈ سے متعلق کاموں کی معاونت کرتا ہے۔ عام استعمالات میں چیٹ اسسٹنٹس، ریٹریول سے تقویت یافتہ سوال و جواب (QA)، ڈیٹا ٹرانسفارمیشن، اور جب سپورٹ ہو تو ٹولز یا APIs کے ساتھ ایجنٹ طرز کی خودکاری شامل ہیں۔ تکنیکی نمایاں خصوصیات میں متن مرکوز مودیلیٹی، ہدایات پر عمل، JSON طرز کے آؤٹ پٹ، اور عام آرکیسٹریشن فریم ورکس میں فنکشن کالنگ کے ساتھ مطابقت شامل ہیں۔
نیا
تجارتی استعمال
Playground
خلاصہ
خصوصیات
قیمت
API

GPT‑5.1 API کیا ہے — GPT‑5.1 Thinking، OpenAI کے GPT‑5.1 خاندان کا اعلیٰ درجے کا استدلالی ویریئنٹ ہے، یہ موافق اور اعلیٰ معیار کی دلیل کو ترجیح دیتا ہے جبکہ ڈویلپرز کو latency / compute ٹریڈ آف پر واضح کنٹرول فراہم کرتا ہے۔

بنیادی خصوصیات

  • Adaptive reasoning: ماڈل ہر درخواست کے مطابق سوچ کی گہرائی کو خودکار طور پر ایڈجسٹ کرتا ہے — معمول کے کاموں پر تیز، پیچیدہ کاموں پر زیادہ مستقل۔ اس سے عام سوالات کے لیے لیٹنسی اور ٹوکن استعمال کم ہوتا ہے۔ یہ پیچیدہ پرامپٹس کے لیے واضح طور پر زیادہ سوچنے کا وقت مختص کرتا ہے اور کثیر المراحل مسائل پر زیادہ مستقل رہتا ہے؛ مشکل کاموں پر سست ہو سکتا ہے مگر زیادہ گہرے جواب دیتا ہے۔
  • Reasoning modes: none / low / medium / high (GPT‑5.1 کم لیٹنسی والے کیسز کے لیے بطور ڈیفالٹ none استعمال کرتا ہے؛ زیادہ تقاضا رکھنے والے کاموں کے لیے بلند سطح منتخب کریں)۔ Responses API میں اس کو کنٹرول کرنے کے لیے reasoning پیرامیٹر موجود ہے۔
  • ڈیفالٹ ٹون اور انداز: پیچیدہ موضوعات پر زیادہ واضح، کم جارگن، زیادہ توضیحی اور “patient” اسلوب۔
  • Context window (tokens / long context) Thinking: بہت بڑا — ادائیگی والے صارفین کے لیے 400K ٹوکن کانٹیکسٹ۔

کلیدی تکنیکی تفصیلات

  • Adaptive compute allocation — تربیت اور انفیرنس کی ساخت کی وجہ سے ماڈل معمولی کاموں پر کم استدلالی ٹوکن خرچ کرتا ہے اور مشکل کاموں پر تناسباً زیادہ۔ یہ کوئی الگ “think engine” نہیں بلکہ reasoning پائپ لائن کے اندر ڈائنامک الاٹمنٹ ہے۔
  • Responses API میں Reasoning پیرامیٹر — کلائنٹس گہری داخلی سوچ کے لیے reasoning: { "effort": "high" } جیسا reasoning آبجیکٹ پاس کرتے ہیں؛ reasoning: { "effort": "none" } سیٹ کرنے سے کم لیٹنسی کے لیے توسیعی داخلی reasoning پاس مؤثر طور پر بند ہو جاتا ہے۔ Responses API reasoning/ٹوکن میٹاڈیٹا بھی واپس کرتی ہے (لاگت اور ڈیبگنگ کے لیے مفید)۔ )
  • Tools اور parallel tool calls — GPT‑5.1 متوازی ٹول کالنگ بہتر بناتا ہے اور نام والے ٹولز (جیسے apply_patch) شامل کرتا ہے جو پروگراماتی ایڈٹس کی ناکامی کے خدشات کم کرتے ہیں؛ پیرا lel ازیشن ٹول ہیوی ورک فلو میں اینڈ ٹو اینڈ تھروپٹ بڑھاتی ہے۔
  • Prompt cache اور persistence — prompt_cache_retention='24h' Responses اور Chat Completions اینڈ پوائنٹس پر معاونت یافتہ ہے تاکہ کثیر پیغامی سیشنز میں سیاق برقرار رکھا جا سکے (دہرائے گئے ٹوکن انکوڈنگ کو کم کرتا ہے)۔

بینچ مارک کارکردگی

Latency / ٹوکن افادیت کی مثالیں (وینڈر فراہم کردہ): معمول کی کوئریز پر، OpenAI رپورٹ کرتا ہے کہ ٹوکنز/وقت میں نمایاں کمی ہوئی ہے (مثال: ایک npm لسٹنگ کمانڈ جو GPT‑5 پر تقریباً ~10s / ~250 ٹوکن لیتی تھی، ان کے نمائشی ٹیسٹ میں GPT‑5.1 پر ~2s / ~50 ٹوکن لیتی ہے)۔ فریق ثالث کے ابتدائی ٹیسٹرز (مثلاً، ایسٹ مینیجرز، کوڈنگ فرمز) نے بہت سے کاموں پر 2–3× اسپیڈ اپس اور ٹول ہیوی فلو میں ٹوکن افادیت کے فوائد رپورٹ کیے۔

OpenAI اور ابتدائی شراکت داروں نے نمائشی بینچ مارک دعوے اور ناپی گئی بہتریاں شائع کیں:

EvaluationGPT‑5.1 (high)GPT‑5 (high)
SWE-bench Verified (all 500 problems)76.3%72.8%
GPQA Diamond (no tools)88.1%85.7%
AIME 2025 (no tools)94.0%94.6%
FrontierMath (with Python tool)26.7%26.3%
MMMU85.4%84.2%
Tau2-bench Airline67.0%62.6%
Tau2-bench Telecom*95.6%96.7%
Tau2-bench Retail77.9%81.1%
BrowseComp Long Context 128k90.0%90.0%

حدود اور حفاظتی غور و فکر

  • ہیلوسینیشن کا خطرہ برقرار ہے۔ Adaptive reasoning پیچیدہ مسائل پر مدد دیتا ہے مگر ہیلوسینیشن ختم نہیں کرتا؛ بلند reasoning_effort جانچ کو بہتر بناتا ہے مگر درستی کی ضمانت نہیں۔ اہم نوعیت کے نتائج ہمیشہ ویریفائی کریں۔
  • وسائل اور لاگت کے تبادلے: اگرچہ GPT‑5.1 سادہ فلو پر کہیں زیادہ ٹوکن مؤثر ہو سکتا ہے، بلند reasoning effort یا طویل ایجنٹک ٹول استعمال ٹوکن کھپت اور لیٹنسی بڑھا سکتے ہیں۔ مناسب ہو تو بار بار کی لاگت گھٹانے کے لیے پرامپٹ کیشنگ استعمال کریں۔
  • Tool safety: apply_patch اور shell جیسے ٹولز آٹومیشن طاقت بڑھاتے ہیں (اور خطرہ بھی)۔ پروڈکشن میں ٹول ایکزیکیوشن کو گیٹ کریں (ایکسیکیوشن سے پہلے ڈف/کمانڈز کا جائزہ لیں)، کم سے کم مراعات کا اصول اپنائیں، اور مضبوط CI/CD اور آپریشنل گارڈ ریلز یقینی بنائیں۔

دوسرے ماڈلز سے موازنہ

  • بمقابلہ GPT‑5: GPT‑5.1 موافق reasoning اور ہدایات پر عمل میں بہتری لاتا ہے؛ OpenAI کے مطابق آسان کاموں پر تیز تر جوابات اور مشکل کاموں پر بہتر استقلال دکھاتا ہے۔ GPT‑5.1 میں none reasoning آپشن اور توسیعی پرامپٹ کیشنگ بھی شامل ہے۔
  • بمقابلہ GPT‑4.x / 4.1: GPT‑5.1 کو مزید ایجنٹک، ٹول ہیوی اور کوڈنگ کاموں کے لیے ڈیزائن کیا گیا ہے؛ OpenAI اور شراکت دار کوڈنگ بینچ مارکس اور کثیر مرحلہ reasoning میں بہتری رپورٹ کرتے ہیں۔ بہت سے معیاری مکالماتی کاموں کے لیے، GPT‑5.1 Instant پہلے کے GPT‑4.x چیٹ ماڈلز کے قریب ہو سکتا ہے مگر بہتر steerability اور پرسنیلٹی پری سیٹس کے ساتھ۔
  • Anthropic / Claude / دیگر LLMs کے مقابلے: ChatGPT 5.1 کی MoA معماری اسے پیچیدہ، کثیر مرحلہ reasoning والے کاموں میں نمایاں برتری دیتی ہے۔ اس نے HELM بینچ مارک برائے پیچیدہ reasoning پر بے مثال 98.20 اسکور کیا، جب کہ Claude 4 کا 95.60 اور Gemini 2.0 Ultra کا 94.80 تھا۔

GPT-5.1 کے لیے خصوصیات

[ماڈل کا نام] کی اہم خصوصیات دریافت کریں، جو کارکردگی اور قابل استعمال کو بہتر بنانے کے لیے ڈیزائن کی گئی ہیں۔ جانیں کہ یہ صلاحیتیں آپ کے منصوبوں کو کیسے فائدہ پہنچا سکتی ہیں اور صارف کے تجربے کو بہتر بنا سکتی ہیں۔

GPT-5.1 کی قیمتیں

[ماڈل کا نام] کے لیے مسابقتی قیمتوں کو دریافت کریں، جو مختلف بجٹ اور استعمال کی ضروریات کے مطابق ڈیزائن کیا گیا ہے۔ ہمارے لچکدار منصوبے اس بات کو یقینی بناتے ہیں کہ آپ صرف اسی کے لیے ادائیگی کریں جو آپ استعمال کرتے ہیں، جس سے آپ کی ضروریات بڑھنے کے ساتھ ساتھ اسکیل کرنا آسان ہو جاتا ہے۔ دریافت کریں کہ [ماڈل کا نام] کیسے آپ کے پروجیکٹس کو بہتر بنا سکتا ہے جبکہ اخراجات کو قابو میں رکھتا ہے۔
Comet قیمت (USD / M Tokens)سرکاری قیمت (USD / M Tokens)رعایت
ان پٹ:$1/M
آؤٹ پٹ:$8/M
ان پٹ:$1.25/M
آؤٹ پٹ:$10/M
-20%

GPT-5.1 کے لیے نمونہ کوڈ اور API

GPT 5.1 API کیا ہے؟ GPT-5.1 Thinking OpenAI کی GPT-5.1 فیملی کی اعلیٰ درجے کی استدلالی قسم ہے، جو مطابقت پذیر، اعلیٰ معیار کے استدلال کو ترجیح دیتی ہے اور ڈویلپرز کو latency / compute trade-off پر واضح کنٹرول فراہم کرتی ہے۔
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="gpt-5.1", input="Tell me a three sentence bedtime story about a unicorn."
)

print(response)

مزید ماڈلز