คุณสมบัติหลัก
- การสร้างภาพจากข้อความ (Text→Image): แปลงพรอมต์ภาษาธรรมชาติเป็นภาพ พร้อมความสามารถในการทำตามคำสั่งได้อย่างแม่นยำ
- การแก้ไขภาพ/เติมแต่งภาพ (Image editing / inpainting): รองรับภาพอ้างอิงและมาสก์เพื่อการแก้ไขแบบเจาะจง
- การออกแบบเพื่อประหยัดต้นทุน (“mini”): ขนาดโมเดลเล็กลงที่ OpenAI และผู้สังเกตการณ์อธิบายว่ามีต้นทุนต่อภาพถูกกว่ารุ่นใหญ่ (จากข้อความ OpenAI/DevDay และรายงานช่วงแรก ระบุว่าถูกกว่าประมาณ ~80%)
- การควบคุมเอาต์พุตที่ยืดหยุ่น: รองรับการกำหนดขนาด รูปแบบเอาต์พุต (JPEG/PNG/WEBP) การบีบอัด และตัวเลือกคุณภาพ (low/medium/high/auto ใน cookbook)
รายละเอียดเชิงเทคนิค (สถาปัตยกรรมและความสามารถ)
- ตระกูลโมเดลและอินพุต/เอาต์พุต: เป็นสมาชิกของตระกูล gpt-image-1; รองรับพรอมต์ข้อความและอินพุตภาพ (สำหรับการแก้ไข) และส่งคืนภาพที่สร้างขึ้น พารามิเตอร์คุณภาพ/ขนาดควบคุมความละเอียด (ค่าสูงสุดทั่วไป ~1536×1024 ในตระกูลนี้—ดูเอกสารเพื่อขนาดที่รองรับอย่างแม่นยำ)
- การแลกเปลี่ยนด้านการทำงาน: ออกแบบให้มีขนาดกะทัดรัด—แลกความเที่ยงตรงระดับสูงสุดบางส่วนกับปริมาณงานและต้นทุนที่ดีขึ้น โดยยังคงความสามารถในการทำตามพรอมต์และฟีเจอร์การแก้ไขภาพที่แข็งแรง
- ความปลอดภัยและเมตาดาตา: ปฏิบัติตามแนวป้องกันความปลอดภัยด้านภาพของ OpenAI และรองรับการฝังเมตาดาตา C2PA เพื่อยืนยันที่มาเมื่อมีให้ใช้งาน
อินพุตและเอาต์พุต — การใช้งานมาตรฐานรองรับ:
- พรอมต์ข้อความ (string) เพื่อสร้างภาพใหม่
- ภาพ + มาสก์ เพื่อแก้ไข/เติมแต่งแบบเจาะจง
- ภาพอ้างอิงเพื่อควบคุมสไตล์หรือองค์ประกอบ
ใช้งานผ่าน Images API (ชื่อโมเดลgpt-image-1-mini)
ข้อจำกัด
- ความเที่ยงตรงสูงสุดต่ำกว่า: เมื่อเทียบกับโมเดล gpt-image-1 ขนาดใหญ่ รุ่น mini อาจสูญเสียรายละเอียดจิ๋วและความสมจริงระดับสูงสุดบางส่วน (เป็นการแลกที่คาดหมายได้เพื่อความคุ้มค่า)
- การเรนเดอร์ข้อความและรายละเอียดเล็กมาก: เช่นโมเดลภาพหลายรุ่น อาจลำบากกับข้อความขนาดเล็กที่อ่านได้ กราฟหนาแน่น หรือพื้นผิวละเอียดมาก; ควรพิจารณาโพสต์โปรเซสหรือใช้โมเดลที่มีขีดความสามารถสูงกว่าเมื่อจำเป็น
- ขอบเขตการแก้ไข: รองรับการแก้ไข/เติมแต่งภาพ แต่มีข้อจำกัดบางประการเมื่อเทียบกับเครื่องมือบนเว็บของ ChatGPT ที่โต้ตอบได้—การแก้ไขมีประสิทธิภาพในหลายงาน แต่อาจต้องปรับแต่งแบบวนซ้ำ
- ข้อจำกัดด้านความปลอดภัยและนโยบาย: เอาต์พุตอยู่ภายใต้การกลั่นกรอง/แนวป้องกันของ OpenAI (เนื้อหาโจ่งแจ้ง ลิขสิทธิ์ ข้อห้ามต่างๆ) นักพัฒนาสามารถควบคุมความไวของการกลั่นกรองผ่านพารามิเตอร์ API หากมีให้ใช้งาน
กรณีใช้งานแนะนำ
- การสร้างคอนเทนต์ปริมาณมาก (สื่อการตลาด, thumbnail, งานคอนเซ็ปต์รวดเร็ว) — ที่ให้ความสำคัญกับต้นทุนต่อภาพ
- การแก้ไขแบบโปรแกรม/การใช้เทมเพลต — เติมแต่งจำนวนมากหรือสร้างเวอร์ชันจากแอสเซ็ตตั้งต้น
- แอปเชิงโต้ตอบที่มีข้อจำกัดงบประมาณ — อินเทอร์เฟซแชตหรือเครื่องมือออกแบบแบบบูรณาการที่ให้ความสำคัญกับความเร็วและต้นทุนมากกว่าความเที่ยงตรงสูงสุด
- การทำต้นแบบและการสร้างภาพแบบ A/B — สร้างภาพตัวเลือกจำนวนมากอย่างรวดเร็ว แล้วเลือกอัปสเกลหรือรันใหม่บนโมเดลที่ใหญ่กว่าสำหรับตัวเลือกสุดท้าย
- วิธีเข้าถึง gpt-image-1-mini API
ขั้นตอนที่ 1: ลงทะเบียนรับ API Key
ลงชื่อเข้าใช้ที่ cometapi.com หากคุณยังไม่เป็นผู้ใช้ โปรดลงทะเบียนก่อน เข้าสู่ CometAPI console รับคีย์ API สำหรับยืนยันสิทธิ์การเข้าถึง คลิก “Add Token” ที่ API token ในศูนย์ส่วนบุคคล รับคีย์โทเค็น: sk-xxxxx แล้วส่ง

ขั้นตอนที่ 2: ส่งคำขอไปยัง gpt-image-1-mini API
เลือกเอ็นด์พอยต์ “\**gpt-image-1-mini \**” เพื่อส่งคำขอ API และกำหนด request body วิธีการและ request body สามารถดูได้จากเอกสาร API บนเว็บไซต์ของเรา เว็บไซต์ของเรายังมีการทดสอบผ่าน Apifox เพื่อความสะดวก แทนที่ <YOUR_API_KEY> ด้วยคีย์ CometAPI จริงจากบัญชีของคุณ
ใส่คำถามหรือคำขอของคุณในฟิลด์ content—นี่คือสิ่งที่โมเดลจะตอบกลับ ประมวลผลการตอบกลับของ API เพื่อรับคำตอบที่สร้างขึ้น
ขั้นตอนที่ 3: ดึงและตรวจสอบผลลัพธ์
ประมวลผลการตอบกลับของ API เพื่อรับคำตอบที่สร้างขึ้น หลังการประมวลผล API จะส่งสถานะงานและข้อมูลผลลัพธ์กลับมา