คุณสมบัติหลัก

การสร้างภาพจากข้อความ (Text→Image): แปลงพรอมต์ภาษาธรรมชาติเป็นภาพ พร้อมความสามารถในการทำตามคำสั่งได้อย่างแม่นยำ
การแก้ไขภาพ/เติมแต่งภาพ (Image editing / inpainting): รองรับภาพอ้างอิงและมาสก์เพื่อการแก้ไขแบบเจาะจง
การออกแบบเพื่อประหยัดต้นทุน (“mini”): ขนาดโมเดลเล็กลงที่ OpenAI และผู้สังเกตการณ์อธิบายว่ามีต้นทุนต่อภาพถูกกว่ารุ่นใหญ่ (จากข้อความ OpenAI/DevDay และรายงานช่วงแรก ระบุว่าถูกกว่าประมาณ ~80%)
การควบคุมเอาต์พุตที่ยืดหยุ่น: รองรับการกำหนดขนาด รูปแบบเอาต์พุต (JPEG/PNG/WEBP) การบีบอัด และตัวเลือกคุณภาพ (low/medium/high/auto ใน cookbook)

รายละเอียดเชิงเทคนิค (สถาปัตยกรรมและความสามารถ)

ตระกูลโมเดลและอินพุต/เอาต์พุต: เป็นสมาชิกของตระกูล gpt-image-1; รองรับพรอมต์ข้อความและอินพุตภาพ (สำหรับการแก้ไข) และส่งคืนภาพที่สร้างขึ้น พารามิเตอร์คุณภาพ/ขนาดควบคุมความละเอียด (ค่าสูงสุดทั่วไป ~1536×1024 ในตระกูลนี้—ดูเอกสารเพื่อขนาดที่รองรับอย่างแม่นยำ)
การแลกเปลี่ยนด้านการทำงาน: ออกแบบให้มีขนาดกะทัดรัด—แลกความเที่ยงตรงระดับสูงสุดบางส่วนกับปริมาณงานและต้นทุนที่ดีขึ้น โดยยังคงความสามารถในการทำตามพรอมต์และฟีเจอร์การแก้ไขภาพที่แข็งแรง
ความปลอดภัยและเมตาดาตา: ปฏิบัติตามแนวป้องกันความปลอดภัยด้านภาพของ OpenAI และรองรับการฝังเมตาดาตา C2PA เพื่อยืนยันที่มาเมื่อมีให้ใช้งาน

อินพุตและเอาต์พุต — การใช้งานมาตรฐานรองรับ:

พรอมต์ข้อความ (string) เพื่อสร้างภาพใหม่
ภาพ + มาสก์ เพื่อแก้ไข/เติมแต่งแบบเจาะจง
ภาพอ้างอิงเพื่อควบคุมสไตล์หรือองค์ประกอบ
ใช้งานผ่าน Images API (ชื่อโมเดล gpt-image-1-mini)

ข้อจำกัด

ความเที่ยงตรงสูงสุดต่ำกว่า: เมื่อเทียบกับโมเดล gpt-image-1 ขนาดใหญ่ รุ่น mini อาจสูญเสียรายละเอียดจิ๋วและความสมจริงระดับสูงสุดบางส่วน (เป็นการแลกที่คาดหมายได้เพื่อความคุ้มค่า)
การเรนเดอร์ข้อความและรายละเอียดเล็กมาก: เช่นโมเดลภาพหลายรุ่น อาจลำบากกับข้อความขนาดเล็กที่อ่านได้ กราฟหนาแน่น หรือพื้นผิวละเอียดมาก; ควรพิจารณาโพสต์โปรเซสหรือใช้โมเดลที่มีขีดความสามารถสูงกว่าเมื่อจำเป็น
ขอบเขตการแก้ไข: รองรับการแก้ไข/เติมแต่งภาพ แต่มีข้อจำกัดบางประการเมื่อเทียบกับเครื่องมือบนเว็บของ ChatGPT ที่โต้ตอบได้—การแก้ไขมีประสิทธิภาพในหลายงาน แต่อาจต้องปรับแต่งแบบวนซ้ำ
ข้อจำกัดด้านความปลอดภัยและนโยบาย: เอาต์พุตอยู่ภายใต้การกลั่นกรอง/แนวป้องกันของ OpenAI (เนื้อหาโจ่งแจ้ง ลิขสิทธิ์ ข้อห้ามต่างๆ) นักพัฒนาสามารถควบคุมความไวของการกลั่นกรองผ่านพารามิเตอร์ API หากมีให้ใช้งาน

กรณีใช้งานแนะนำ

การสร้างคอนเทนต์ปริมาณมาก (สื่อการตลาด, thumbnail, งานคอนเซ็ปต์รวดเร็ว) — ที่ให้ความสำคัญกับต้นทุนต่อภาพ
การแก้ไขแบบโปรแกรม/การใช้เทมเพลต — เติมแต่งจำนวนมากหรือสร้างเวอร์ชันจากแอสเซ็ตตั้งต้น
แอปเชิงโต้ตอบที่มีข้อจำกัดงบประมาณ — อินเทอร์เฟซแชตหรือเครื่องมือออกแบบแบบบูรณาการที่ให้ความสำคัญกับความเร็วและต้นทุนมากกว่าความเที่ยงตรงสูงสุด
การทำต้นแบบและการสร้างภาพแบบ A/B — สร้างภาพตัวเลือกจำนวนมากอย่างรวดเร็ว แล้วเลือกอัปสเกลหรือรันใหม่บนโมเดลที่ใหญ่กว่าสำหรับตัวเลือกสุดท้าย
วิธีเข้าถึง gpt-image-1-mini API

ขั้นตอนที่ 1: ลงทะเบียนรับ API Key

ลงชื่อเข้าใช้ที่ cometapi.com หากคุณยังไม่เป็นผู้ใช้ โปรดลงทะเบียนก่อน เข้าสู่ CometAPI console รับคีย์ API สำหรับยืนยันสิทธิ์การเข้าถึง คลิก “Add Token” ที่ API token ในศูนย์ส่วนบุคคล รับคีย์โทเค็น: sk-xxxxx แล้วส่ง

รูปภาพ

ขั้นตอนที่ 2: ส่งคำขอไปยัง gpt-image-1-mini API

เลือกเอ็นด์พอยต์ “\**gpt-image-1-mini \**” เพื่อส่งคำขอ API และกำหนด request body วิธีการและ request body สามารถดูได้จากเอกสาร API บนเว็บไซต์ของเรา เว็บไซต์ของเรายังมีการทดสอบผ่าน Apifox เพื่อความสะดวก แทนที่ <YOUR_API_KEY> ด้วยคีย์ CometAPI จริงจากบัญชีของคุณ

ใส่คำถามหรือคำขอของคุณในฟิลด์ content—นี่คือสิ่งที่โมเดลจะตอบกลับ ประมวลผลการตอบกลับของ API เพื่อรับคำตอบที่สร้างขึ้น

ขั้นตอนที่ 3: ดึงและตรวจสอบผลลัพธ์

ประมวลผลการตอบกลับของ API เพื่อรับคำตอบที่สร้างขึ้น หลังการประมวลผล API จะส่งสถานะงานและข้อมูลผลลัพธ์กลับมา

คุณสมบัติหลัก

การสร้างภาพจากข้อความ (Text→Image): แปลงพรอมต์ภาษาธรรมชาติเป็นภาพ พร้อมความสามารถในการทำตามคำสั่งได้อย่างแม่นยำ
การแก้ไขภาพ/เติมแต่งภาพ (Image editing / inpainting): รองรับภาพอ้างอิงและมาสก์เพื่อการแก้ไขแบบเจาะจง
การออกแบบเพื่อประหยัดต้นทุน (“mini”): ขนาดโมเดลเล็กลงที่ OpenAI และผู้สังเกตการณ์อธิบายว่ามีต้นทุนต่อภาพถูกกว่ารุ่นใหญ่ (จากข้อความ OpenAI/DevDay และรายงานช่วงแรก ระบุว่าถูกกว่าประมาณ ~80%)
การควบคุมเอาต์พุตที่ยืดหยุ่น: รองรับการกำหนดขนาด รูปแบบเอาต์พุต (JPEG/PNG/WEBP) การบีบอัด และตัวเลือกคุณภาพ (low/medium/high/auto ใน cookbook)

รายละเอียดเชิงเทคนิค (สถาปัตยกรรมและความสามารถ)

ตระกูลโมเดลและอินพุต/เอาต์พุต: เป็นสมาชิกของตระกูล gpt-image-1; รองรับพรอมต์ข้อความและอินพุตภาพ (สำหรับการแก้ไข) และส่งคืนภาพที่สร้างขึ้น พารามิเตอร์คุณภาพ/ขนาดควบคุมความละเอียด (ค่าสูงสุดทั่วไป ~1536×1024 ในตระกูลนี้—ดูเอกสารเพื่อขนาดที่รองรับอย่างแม่นยำ)
การแลกเปลี่ยนด้านการทำงาน: ออกแบบให้มีขนาดกะทัดรัด—แลกความเที่ยงตรงระดับสูงสุดบางส่วนกับปริมาณงานและต้นทุนที่ดีขึ้น โดยยังคงความสามารถในการทำตามพรอมต์และฟีเจอร์การแก้ไขภาพที่แข็งแรง
ความปลอดภัยและเมตาดาตา: ปฏิบัติตามแนวป้องกันความปลอดภัยด้านภาพของ OpenAI และรองรับการฝังเมตาดาตา C2PA เพื่อยืนยันที่มาเมื่อมีให้ใช้งาน

อินพุตและเอาต์พุต — การใช้งานมาตรฐานรองรับ:

พรอมต์ข้อความ (string) เพื่อสร้างภาพใหม่
ภาพ + มาสก์ เพื่อแก้ไข/เติมแต่งแบบเจาะจง
ภาพอ้างอิงเพื่อควบคุมสไตล์หรือองค์ประกอบ
ใช้งานผ่าน Images API (ชื่อโมเดล gpt-image-1-mini)

ข้อจำกัด

ความเที่ยงตรงสูงสุดต่ำกว่า: เมื่อเทียบกับโมเดล gpt-image-1 ขนาดใหญ่ รุ่น mini อาจสูญเสียรายละเอียดจิ๋วและความสมจริงระดับสูงสุดบางส่วน (เป็นการแลกที่คาดหมายได้เพื่อความคุ้มค่า)
การเรนเดอร์ข้อความและรายละเอียดเล็กมาก: เช่นโมเดลภาพหลายรุ่น อาจลำบากกับข้อความขนาดเล็กที่อ่านได้ กราฟหนาแน่น หรือพื้นผิวละเอียดมาก; ควรพิจารณาโพสต์โปรเซสหรือใช้โมเดลที่มีขีดความสามารถสูงกว่าเมื่อจำเป็น
ขอบเขตการแก้ไข: รองรับการแก้ไข/เติมแต่งภาพ แต่มีข้อจำกัดบางประการเมื่อเทียบกับเครื่องมือบนเว็บของ ChatGPT ที่โต้ตอบได้—การแก้ไขมีประสิทธิภาพในหลายงาน แต่อาจต้องปรับแต่งแบบวนซ้ำ
ข้อจำกัดด้านความปลอดภัยและนโยบาย: เอาต์พุตอยู่ภายใต้การกลั่นกรอง/แนวป้องกันของ OpenAI (เนื้อหาโจ่งแจ้ง ลิขสิทธิ์ ข้อห้ามต่างๆ) นักพัฒนาสามารถควบคุมความไวของการกลั่นกรองผ่านพารามิเตอร์ API หากมีให้ใช้งาน

กรณีใช้งานแนะนำ

การสร้างคอนเทนต์ปริมาณมาก (สื่อการตลาด, thumbnail, งานคอนเซ็ปต์รวดเร็ว) — ที่ให้ความสำคัญกับต้นทุนต่อภาพ
การแก้ไขแบบโปรแกรม/การใช้เทมเพลต — เติมแต่งจำนวนมากหรือสร้างเวอร์ชันจากแอสเซ็ตตั้งต้น
แอปเชิงโต้ตอบที่มีข้อจำกัดงบประมาณ — อินเทอร์เฟซแชตหรือเครื่องมือออกแบบแบบบูรณาการที่ให้ความสำคัญกับความเร็วและต้นทุนมากกว่าความเที่ยงตรงสูงสุด
การทำต้นแบบและการสร้างภาพแบบ A/B — สร้างภาพตัวเลือกจำนวนมากอย่างรวดเร็ว แล้วเลือกอัปสเกลหรือรันใหม่บนโมเดลที่ใหญ่กว่าสำหรับตัวเลือกสุดท้าย
วิธีเข้าถึง gpt-image-1-mini API

ขั้นตอนที่ 1: ลงทะเบียนรับ API Key

รูปภาพ

GPT Image 1 mini

คุณสมบัติหลัก

รายละเอียดเชิงเทคนิค (สถาปัตยกรรมและความสามารถ)

ข้อจำกัด

กรณีใช้งานแนะนำ

ขั้นตอนที่ 1: ลงทะเบียนรับ API Key

ขั้นตอนที่ 2: ส่งคำขอไปยัง gpt-image-1-mini API

ขั้นตอนที่ 3: ดึงและตรวจสอบผลลัพธ์

คุณสมบัติสำหรับ GPT Image 1 mini

ราคาสำหรับ GPT Image 1 mini

โค้ดตัวอย่างและ API สำหรับ GPT Image 1 mini

โมเดลเพิ่มเติม

GPT Image 1 mini

คุณสมบัติหลัก

รายละเอียดเชิงเทคนิค (สถาปัตยกรรมและความสามารถ)

ข้อจำกัด

กรณีใช้งานแนะนำ

ขั้นตอนที่ 1: ลงทะเบียนรับ API Key

ขั้นตอนที่ 2: ส่งคำขอไปยัง gpt-image-1-mini API

ขั้นตอนที่ 3: ดึงและตรวจสอบผลลัพธ์

คุณสมบัติสำหรับ GPT Image 1 mini

ราคาสำหรับ GPT Image 1 mini

โค้ดตัวอย่างและ API สำหรับ GPT Image 1 mini

โมเดลเพิ่มเติม