Home/Models/OpenAI/GPT Image 1 mini
O

GPT Image 1 mini

อินพุต:$6.4/M
เอาต์พุต:$25.6/M
เวอร์ชันที่ปรับให้เหมาะสมด้านต้นทุนของ GPT Image 1 เป็นโมเดลภาษามัลติโมดัลแบบเนทีฟที่รับอินพุตได้ทั้งข้อความและรูปภาพ และสร้างเอาต์พุตเป็นรูปภาพ
ใหม่
ใช้งานเชิงพาณิชย์
ภาพรวม
คุณสมบัติ
ราคา
API

คุณสมบัติหลัก

  • การสร้างภาพจากข้อความ (Text→Image): แปลงพรอมต์ภาษาธรรมชาติเป็นภาพ พร้อมความสามารถในการทำตามคำสั่งได้อย่างแม่นยำ
  • การแก้ไขภาพ/เติมแต่งภาพ (Image editing / inpainting): รองรับภาพอ้างอิงและมาสก์เพื่อการแก้ไขแบบเจาะจง
  • การออกแบบเพื่อประหยัดต้นทุน (“mini”): ขนาดโมเดลเล็กลงที่ OpenAI และผู้สังเกตการณ์อธิบายว่ามีต้นทุนต่อภาพถูกกว่ารุ่นใหญ่ (จากข้อความ OpenAI/DevDay และรายงานช่วงแรก ระบุว่าถูกกว่าประมาณ ~80%)
  • การควบคุมเอาต์พุตที่ยืดหยุ่น: รองรับการกำหนดขนาด รูปแบบเอาต์พุต (JPEG/PNG/WEBP) การบีบอัด และตัวเลือกคุณภาพ (low/medium/high/auto ใน cookbook)

รายละเอียดเชิงเทคนิค (สถาปัตยกรรมและความสามารถ)

  • ตระกูลโมเดลและอินพุต/เอาต์พุต: เป็นสมาชิกของตระกูล gpt-image-1; รองรับพรอมต์ข้อความและอินพุตภาพ (สำหรับการแก้ไข) และส่งคืนภาพที่สร้างขึ้น พารามิเตอร์คุณภาพ/ขนาดควบคุมความละเอียด (ค่าสูงสุดทั่วไป ~1536×1024 ในตระกูลนี้—ดูเอกสารเพื่อขนาดที่รองรับอย่างแม่นยำ)
  • การแลกเปลี่ยนด้านการทำงาน: ออกแบบให้มีขนาดกะทัดรัด—แลกความเที่ยงตรงระดับสูงสุดบางส่วนกับปริมาณงานและต้นทุนที่ดีขึ้น โดยยังคงความสามารถในการทำตามพรอมต์และฟีเจอร์การแก้ไขภาพที่แข็งแรง
  • ความปลอดภัยและเมตาดาตา: ปฏิบัติตามแนวป้องกันความปลอดภัยด้านภาพของ OpenAI และรองรับการฝังเมตาดาตา C2PA เพื่อยืนยันที่มาเมื่อมีให้ใช้งาน

อินพุตและเอาต์พุต — การใช้งานมาตรฐานรองรับ:

  • พรอมต์ข้อความ (string) เพื่อสร้างภาพใหม่
  • ภาพ + มาสก์ เพื่อแก้ไข/เติมแต่งแบบเจาะจง
  • ภาพอ้างอิงเพื่อควบคุมสไตล์หรือองค์ประกอบ
    ใช้งานผ่าน Images API (ชื่อโมเดล gpt-image-1-mini)

ข้อจำกัด

  • ความเที่ยงตรงสูงสุดต่ำกว่า: เมื่อเทียบกับโมเดล gpt-image-1 ขนาดใหญ่ รุ่น mini อาจสูญเสียรายละเอียดจิ๋วและความสมจริงระดับสูงสุดบางส่วน (เป็นการแลกที่คาดหมายได้เพื่อความคุ้มค่า)
  • การเรนเดอร์ข้อความและรายละเอียดเล็กมาก: เช่นโมเดลภาพหลายรุ่น อาจลำบากกับข้อความขนาดเล็กที่อ่านได้ กราฟหนาแน่น หรือพื้นผิวละเอียดมาก; ควรพิจารณาโพสต์โปรเซสหรือใช้โมเดลที่มีขีดความสามารถสูงกว่าเมื่อจำเป็น
  • ขอบเขตการแก้ไข: รองรับการแก้ไข/เติมแต่งภาพ แต่มีข้อจำกัดบางประการเมื่อเทียบกับเครื่องมือบนเว็บของ ChatGPT ที่โต้ตอบได้—การแก้ไขมีประสิทธิภาพในหลายงาน แต่อาจต้องปรับแต่งแบบวนซ้ำ
  • ข้อจำกัดด้านความปลอดภัยและนโยบาย: เอาต์พุตอยู่ภายใต้การกลั่นกรอง/แนวป้องกันของ OpenAI (เนื้อหาโจ่งแจ้ง ลิขสิทธิ์ ข้อห้ามต่างๆ) นักพัฒนาสามารถควบคุมความไวของการกลั่นกรองผ่านพารามิเตอร์ API หากมีให้ใช้งาน

กรณีใช้งานแนะนำ

  • การสร้างคอนเทนต์ปริมาณมาก (สื่อการตลาด, thumbnail, งานคอนเซ็ปต์รวดเร็ว) — ที่ให้ความสำคัญกับต้นทุนต่อภาพ
  • การแก้ไขแบบโปรแกรม/การใช้เทมเพลต — เติมแต่งจำนวนมากหรือสร้างเวอร์ชันจากแอสเซ็ตตั้งต้น
  • แอปเชิงโต้ตอบที่มีข้อจำกัดงบประมาณ — อินเทอร์เฟซแชตหรือเครื่องมือออกแบบแบบบูรณาการที่ให้ความสำคัญกับความเร็วและต้นทุนมากกว่าความเที่ยงตรงสูงสุด
  • การทำต้นแบบและการสร้างภาพแบบ A/B — สร้างภาพตัวเลือกจำนวนมากอย่างรวดเร็ว แล้วเลือกอัปสเกลหรือรันใหม่บนโมเดลที่ใหญ่กว่าสำหรับตัวเลือกสุดท้าย
  • วิธีเข้าถึง gpt-image-1-mini API

ขั้นตอนที่ 1: ลงทะเบียนรับ API Key

ลงชื่อเข้าใช้ที่ cometapi.com หากคุณยังไม่เป็นผู้ใช้ โปรดลงทะเบียนก่อน เข้าสู่ CometAPI console รับคีย์ API สำหรับยืนยันสิทธิ์การเข้าถึง คลิก “Add Token” ที่ API token ในศูนย์ส่วนบุคคล รับคีย์โทเค็น: sk-xxxxx แล้วส่ง

รูปภาพ

ขั้นตอนที่ 2: ส่งคำขอไปยัง gpt-image-1-mini API

เลือกเอ็นด์พอยต์ “\**gpt-image-1-mini \**” เพื่อส่งคำขอ API และกำหนด request body วิธีการและ request body สามารถดูได้จากเอกสาร API บนเว็บไซต์ของเรา เว็บไซต์ของเรายังมีการทดสอบผ่าน Apifox เพื่อความสะดวก แทนที่ <YOUR_API_KEY> ด้วยคีย์ CometAPI จริงจากบัญชีของคุณ

ใส่คำถามหรือคำขอของคุณในฟิลด์ content—นี่คือสิ่งที่โมเดลจะตอบกลับ ประมวลผลการตอบกลับของ API เพื่อรับคำตอบที่สร้างขึ้น

ขั้นตอนที่ 3: ดึงและตรวจสอบผลลัพธ์

ประมวลผลการตอบกลับของ API เพื่อรับคำตอบที่สร้างขึ้น หลังการประมวลผล API จะส่งสถานะงานและข้อมูลผลลัพธ์กลับมา

คุณสมบัติสำหรับ GPT Image 1 mini

สำรวจคุณสมบัติหลักของ GPT Image 1 mini ที่ออกแบบมาเพื่อเพิ่มประสิทธิภาพและความสะดวกในการใช้งาน ค้นพบว่าความสามารถเหล่านี้สามารถเป็นประโยชน์ต่อโครงการของคุณและปรับปรุงประสบการณ์ของผู้ใช้ได้อย่างไร

ราคาสำหรับ GPT Image 1 mini

สำรวจราคาที่แข่งขันได้สำหรับ GPT Image 1 mini ที่ออกแบบมาให้เหมาะสมกับงบประมาณและความต้องการการใช้งานที่หลากหลาย แผนการบริการที่ยืดหยุ่นของเรารับประกันว่าคุณจะจ่ายเฉพาะสิ่งที่คุณใช้เท่านั้น ทำให้สามารถขยายขนาดได้ง่ายเมื่อความต้องการของคุณเพิ่มขึ้น ค้นพบว่า GPT Image 1 mini สามารถยกระดับโปรเจกต์ของคุณได้อย่างไรในขณะที่ควบคุมต้นทุนให้อยู่ในระดับที่จัดการได้
ราคา Comet (USD / M Tokens)ราคาทางการ (USD / M Tokens)ส่วนลด
อินพุต:$6.4/M
เอาต์พุต:$25.6/M
อินพุต:$8/M
เอาต์พุต:$32/M
-20%

โค้ดตัวอย่างและ API สำหรับ GPT Image 1 mini

gpt-image-1-mini เป็นโมเดลภาพแบบมัลติโหมดที่ปรับให้คุ้มค่าจาก OpenAI ซึ่งรองรับอินพุตทั้งข้อความและภาพ และสร้างผลลัพธ์เป็นภาพ โมเดลนี้ถูกวางตำแหน่งให้เป็นรุ่นที่เล็กกว่าและมีต้นทุนต่ำกว่าของตระกูล GPT-Image-1 แบบเต็มของ OpenAI — ออกแบบมาสำหรับการใช้งานโปรดักชันแบบปริมาณงานสูงที่ต้องคำนึงถึงข้อจำกัดด้านต้นทุนและเวลาแฝง โมเดลนี้เหมาะสำหรับงานอย่าง การสร้างภาพจากข้อความ การแก้ไขภาพ / อินเพนต์ และเวิร์กโฟลว์ที่ผนวกรวมภาพอ้างอิง
Python
JavaScript
Curl
import base64
import os
from openai import OpenAI
from PIL import Image
from io import BytesIO

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
client = OpenAI(api_key=COMETAPI_KEY, base_url="https://api.cometapi.com/v1")

# Output directory
OUTPUT_DIR = os.path.join(os.path.dirname(__file__), "..", "output")
os.makedirs(OUTPUT_DIR, exist_ok=True)

prompt = "A cute baby sea otter swimming in the ocean"

# Generate image using gpt-image-1-mini
result = client.images.generate(
    model="gpt-image-1-mini",
    prompt=prompt,
    size="1024x1024",
)

# Save the image
image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode(image_base64)

output_path = os.path.join(OUTPUT_DIR, "output.png")
image = Image.open(BytesIO(image_bytes))
image.save(output_path, format="PNG")

print(f"Image saved to: {output_path}")

โมเดลเพิ่มเติม