کلیدی خصوصیات
- متن→تصویر جنریشن: قدرتی زبان کے پرامپٹس کو مضبوط ہدایتی پیروی کے ساتھ تصاویر میں تبدیل کرتی ہے۔
- تصویری ترمیم / اِن پینٹنگ: ہدفی ترامیم کے لیے حوالہ جاتی تصاویر اور ماسکس قبول کرتا ہے۔
- لاگت کے لحاظ سے بہتر (“mini”) ڈیزائن: چھوٹا فٹ پرنٹ جو فی تصویر بڑے ماڈل کے مقابلے میں کہیں سستا بتایا گیا ہے (OpenAI/DevDay میسجنگ اور ابتدائی رپورٹس کے مطابق تقریباً ~80% کم مہنگا)۔
- آؤٹ پٹ پر لچک دار کنٹرولز: سائز، آؤٹ پٹ فارمیٹ (JPEG/PNG/WEBP)، کمپریشن اور کوالٹی نوب (cookbook میں low/medium/high/auto) کی سپورٹ۔
تکنیکی تفصیلات (آرکیٹیکچر اور صلاحیتیں)
- ماڈل فیملی اور اِن پٹ/آؤٹ پٹ: gpt-image-1 فیملی کا رکن؛ ٹیکسٹ پرامپٹس اور تصویری اِن پٹس (ایڈٹس کے لیے) قبول کرتا ہے اور تیار شدہ تصویری آؤٹ پٹ دیتا ہے۔ کوالٹی/سائز پیرا میٹرز ریزولوشن کو کنٹرول کرتے ہیں (اس فیملی میں عمومی زیادہ سے زیادہ ~1536×1024 — درست سپورٹڈ سائزز کے لیے دستاویزات دیکھیں)۔
- آپریشنل ٹریڈ آفز: چھوٹے فٹ پرنٹ کے طور پر انجنیئرڈ — تھروپٹ اور لاگت میں بہتری کے لیے کچھ بالائی درجے کے معیار کی قربانی دیتا ہے جبکہ مضبوط پرامپٹ-فالوئنگ اور ایڈٹ فیچرز برقرار رکھتا ہے۔
- حفاظت اور میٹاڈیٹا: OpenAI کی امیج سیفٹی گائیڈ لائنز کی پیروی کرتا ہے اور جہاں دستیاب ہو وہاں C2PA میٹاڈیٹا آپشنز برائے ماخذ (provenance) ایمبیڈ کرتا ہے۔
اِن پٹس اور آؤٹ پٹس — معیاری استعمال میں شامل:
- نئی تصویر بنانے کے لیے ٹیکسٹ پرامپٹ (string)۔
- ہدفی ترامیم/اِن پینٹنگ کے لیے تصویر + ماسک۔
- انداز یا کمپوزیشن کنٹرول کرنے کے لیے حوالہ جاتی تصاویر۔
یہ Images API کے ذریعے دستیاب ہیں (ماڈل نامgpt-image-1-mini)۔
حدود
- بالائی معیار میں کمی: بڑے gpt-image-1 ماڈل کے مقابلے میں mini میں کچھ مائیکرو تفصیل اور اعلیٰ درجے کے فوٹو ریئلسٹک معیار کی کمی ہو سکتی ہے (لاگت کے بدلے متوقع ٹریڈ آف)۔
- متن کی رینڈرنگ اور باریک تفصیلات: کئی امیج ماڈلز کی طرح چھوٹے قابلِ مطالعہ متن، گھنے چارٹس یا نہایت باریک ٹیکسچرز میں مشکل ہو سکتی ہے؛ ان ضروریات کے لیے پوسٹ پروسیسنگ یا زیادہ گنجائش والے ماڈلز استعمال کریں۔
- تدوین کی حد: امیج ایڈٹ/اِن پینٹنگ فیچرز دستیاب ہیں مگر ChatGPT ویب ٹولز کے مقابلے میں کچھ حدود متوقع ہیں—بہت سے کاموں میں ایڈٹس مؤثر ہیں مگر تکراری بہتر کاری درکار ہو سکتی ہے۔
- حفاظتی و پالیسی پابندیاں: آؤٹ پٹس OpenAI ماڈریشن/سیفٹی گائیڈ لائنز کے تابع ہیں (explicit مواد، کاپی رائٹڈ مواد کی پابندیاں، ممنوعہ آؤٹ پٹس)۔ جہاں دستیاب ہو، ڈویلپرز API پیرامیٹرز کے ذریعے ماڈریشن حساسیت کو کنٹرول کر سکتے ہیں۔
تجویز کردہ استعمالات
- بڑی مقدار میں مواد کی تیاری (مارکیٹنگ اثاثے، تھمب نیلز، تیز کانسپٹ آرٹ) — جہاں فی تصویر لاگت اولین ترجیح ہو۔
- پروگراماتی تدوین / ٹیمپلیٹنگ — بنیادی اثاثے سے بڑی تعداد میں اِن پینٹنگ یا ویریئنٹس کی تیاری۔
- بجٹ پابندیوں والی تعاملی ایپلی کیشنز — چیٹ انٹرفیسز یا مربوط ڈیزائن ٹولز جہاں ردِعمل کی رفتار اور لاگت، مطلق بالائی معیار سے زیادہ اہم ہوں۔
- پروٹو ٹائپنگ اور A/B تصویری جنریشن — بہت سے امیدوار تصاویر تیزی سے بنائیں، پھر منتخب طور پر اپ اسکیل کریں یا حتمی انتخاب کے لیے بڑے ماڈلز پر دوبارہ چلائیں۔
- gpt-image-1-mini API تک رسائی کا طریقہ
مرحلہ 1: API Key کے لیے سائن اپ کریں
cometapi.com میں لاگ اِن کریں۔ اگر آپ ہمارے صارف نہیں ہیں تو پہلے رجسٹر کریں۔ اپنے CometAPI console میں سائن اِن کریں۔ انٹرفیس کا ایکسس کریڈینشل API key حاصل کریں۔ ذاتی مرکز میں API token پر “Add Token” پر کلک کریں، ٹوکن key: sk-xxxxx حاصل کریں اور جمع کرائیں۔

مرحلہ 2: gpt-image-1-mini API کو درخواستیں بھیجیں
API درخواست بھیجنے اور ریکوئسٹ باڈی سیٹ کرنے کے لیے “\**gpt-image-1-mini \**”endpoint منتخب کریں۔ درخواست کا طریقہ اور ریکوئسٹ باڈی ہماری ویب سائٹ کی API دستاویز سے حاصل کیے جاتے ہیں۔ آپ کی سہولت کے لیے ہماری ویب سائٹ Apifox ٹیسٹ بھی فراہم کرتی ہے۔ اپنے اکاؤنٹ کی اصل CometAPI key سے <YOUR_API_KEY> کو تبدیل کریں۔
اپنا سوال یا درخواست content فیلڈ میں درج کریں—ماڈل اسی کا جواب دے گا۔ تیار شدہ جواب حاصل کرنے کے لیے API ریسپانس کو پروسیس کریں۔
مرحلہ 3: نتائج حاصل کریں اور توثیق کریں
تیار شدہ جواب حاصل کرنے کے لیے API ریسپانس کو پروسیس کریں۔ پروسیسنگ کے بعد، API ٹاسک اسٹیٹس اور آؤٹ پٹ ڈیٹا کے ساتھ جواب دیتی ہے۔