الميزات الرئيسية
- توليد نص→صورة: يحوّل الموجهات باللغة الطبيعية إلى صور مع قدرة قوية على اتباع التعليمات.
- تحرير الصور / التلوين الداخلي (Inpainting): يقبل صورًا مرجعية وأقنعة لإجراء تعديلات مستهدفة.
- تصميم مُحسَّن للتكلفة (“mini”): حجم أصغر تصفه OpenAI والمراقبون بأنه أرخص بكثير لكل صورة مقارنة بالنموذج الكبير (تشير رسائل OpenAI/DevDay وتقارير مبكرة إلى أنه أقل تكلفة بنسبة ~80%).
- عناصر تحكم مرنة في الإخراج: يدعم الحجم، وصيغة الإخراج (JPEG/PNG/WEBP)، والضغط، ومؤشر جودة (منخفض/متوسط/مرتفع/تلقائي في cookbook).
التفاصيل التقنية (البنية والقدرات)
- عائلة النموذج والمدخلات/المخرجات: عضو في عائلة gpt-image-1؛ يقبل موجهات نصية ومدخلات صور (لأغراض التحرير) ويعيد مخرجات صور مولدة. تتحكم معلمات الجودة/الحجم في الدقة (الحد الأقصى النموذجي ~1536×1024 ضمن هذه العائلة—راجع الوثائق للأحجام المدعومة بدقة).
- المقايضات التشغيلية: صُمم بنية أصغر—يستبدل بعض أعلى مستويات الدقة بتركيز على تحسين الإنتاجية والتكلفة مع الحفاظ على اتباع قوي للموجهات وميزات التحرير.
- السلامة والبيانات الوصفية: يتبع ضوابط أمان الصور لدى OpenAI ويدمج خيارات بيانات وصفية C2PA لإثبات المنشأ عند توفرها.
المدخلات والمخرجات — تدعم حالات الاستخدام القياسية:
- موجه نصي (سلسلة نصية) لتوليد صورة جديدة.
- صورة + قناع لإجراء تعديلات/تلوين داخلي مستهدف.
- صور مرجعية للتحكم في الأسلوب أو التكوين.
يتم إتاحة ذلك عبر Images API (اسم النموذجgpt-image-1-mini).
القيود
- انخفاض الدقة القصوى: مقارنة بالنموذج الكبير gpt-image-1، قد يفقد mini بعض التفاصيل الدقيقة جدًا والواقعية الفوتوغرافية رفيعة المستوى (مقايضة متوقعة لصالح التكلفة).
- تصيير النص والتفاصيل الصغيرة جدًا: مثل العديد من نماذج الصور، قد يواجه صعوبة مع النص الصغير المقروء، أو المخططات الكثيفة، أو الأنسجة فائقة الدقة؛ توقّع إجراء معالجة لاحقة أو استخدام نماذج أعلى سعة لهذه الاحتياجات.
- نطاق التحرير: ميزات تحرير الصور/التلوين الداخلي متاحة، لكن يُحتمل وجود قيود في التحرير مقارنة بأدوات الويب التفاعلية في ChatGPT—التعديلات فعّالة للعديد من المهام لكنها قد تتطلب تحسينًا تكراريًا.
- قيود السلامة والسياسات: تخضع المخرجات لضوابط الإشراف/السلامة في OpenAI (المحتوى الصريح، قيود المحتوى المحمي بحقوق النشر، المخرجات غير المسموح بها). يمكن للمطورين التحكم في حساسية الإشراف عبر معلمات API حيثما توفرت.
حالات الاستخدام الموصى بها
- إنشاء محتوى بكميات كبيرة (أصول تسويقية، صور مصغّرة، رسوم مفاهيمية سريعة) — حيث تكلفة الصورة هي الأولوية.
- التحرير البرمجي/القولبة — تلوين داخلي بالجملة أو توليد متغيرات انطلاقًا من أصل أساسي.
- تطبيقات تفاعلية ذات قيود ميزانية — واجهات محادثة أو أدوات تصميم مدمجة حيث تهم سرعة الاستجابة والتكلفة أكثر من أعلى دقة ممكنة.
- النمذجة الأولية وتوليد صور A/B — توليد العديد من المرشحين بسرعة ثم القيام بترقية انتقائية للدقة أو إعادة التشغيل على نماذج أكبر للنسخ النهائية.
- كيفية الوصول إلى واجهة gpt-image-1-mini API
الخطوة 1: التسجيل للحصول على مفتاح API
سجّل الدخول إلى cometapi.com. إذا لم تكن مستخدمًا لدينا بعد، يُرجى التسجيل أولًا. سجّل الدخول إلى CometAPI console. احصل على مفتاح API كبيانات اعتماد الوصول للواجهة. انقر على “Add Token” ضمن رمز API في المركز الشخصي، واحصل على مفتاح الرمز: sk-xxxxx ثم أرسله.

الخطوة 2: إرسال الطلبات إلى واجهة gpt-image-1-mini API
حدد “\**gpt-image-1-mini \**”نقطة النهاية لإرسال طلب API واضبط جسم الطلب. يمكن الحصول على طريقة الطلب وجسم الطلب من مستند واجهة برمجة التطبيقات على موقعنا. يوفر موقعنا أيضًا اختبار Apifox لراحتك. استبدل <YOUR_API_KEY> بمفتاح CometAPI الفعلي من حسابك.
أدخل سؤالك أو طلبك في حقل المحتوى—فهذا ما سيستجيب له النموذج . قم بمعالجة استجابة API للحصول على الإجابة المُولَّدة.
الخطوة 3: استرجاع النتائج والتحقق منها
قم بمعالجة استجابة API للحصول على الإجابة المُولَّدة. بعد المعالجة، تستجيب واجهة API بحالة المهمة وبيانات المخرجات.