Home/Models/OpenAI/GPT Image 1 mini
O

GPT Image 1 mini

Đầu vào:$6.4/M
Đầu ra:$25.6/M
Phiên bản tối ưu hóa chi phí của GPT Image 1. Đây là một mô hình ngôn ngữ đa phương thức gốc, nhận cả văn bản và hình ảnh làm đầu vào và tạo đầu ra là hình ảnh.
Mới
Sử dụng thương mại
Tổng quan
Tính năng
Giá cả
API

Tính năng chính

  • Tạo ảnh từ văn bản: chuyển đổi lời nhắc ngôn ngữ tự nhiên thành hình ảnh với khả năng tuân thủ hướng dẫn cao.
  • Chỉnh sửa hình ảnh / inpainting: nhận ảnh tham chiếu và mặt nạ để thực hiện các chỉnh sửa có mục tiêu.
  • Thiết kế tối ưu chi phí (“mini”): quy mô nhỏ hơn mà OpenAI và các nguồn quan sát mô tả là rẻ hơn nhiều cho mỗi ảnh so với mô hình lớn (thông điệp OpenAI/DevDay và các báo cáo ban đầu cho biết rẻ hơn ~80%).
  • Điều khiển đầu ra linh hoạt: hỗ trợ kích thước, định dạng đầu ra (JPEG/PNG/WEBP), nén và tham số chất lượng (thấp/trung bình/cao/tự động trong cookbook).

Chi tiết kỹ thuật (kiến trúc & khả năng)

  • Họ mô hình & đầu vào/đầu ra: thành viên của họ gpt-image-1; chấp nhận lời nhắc văn bản và đầu vào hình ảnh (để chỉnh sửa) và trả về ảnh đã tạo. Tham số chất lượng/kích thước điều khiển độ phân giải (giới hạn tối đa điển hình ~1536×1024 trong họ này — xem tài liệu để biết kích thước được hỗ trợ chính xác).
  • Cân bằng vận hành: được thiết kế như một mô hình gọn nhẹ — đánh đổi một phần độ trung thực đỉnh để cải thiện thông lượng và chi phí trong khi vẫn giữ khả năng tuân thủ prompt và tính năng chỉnh sửa mạnh mẽ.
  • An toàn & siêu dữ liệu: tuân theo hàng rào an toàn hình ảnh của OpenAI và nhúng tùy chọn siêu dữ liệu C2PA cho nguồn gốc khi khả dụng.

Đầu vào & đầu ra — cách dùng chuẩn hỗ trợ:

  • Lời nhắc văn bản (string) để tạo ảnh mới.
  • Hình ảnh + mặt nạ để thực hiện chỉnh sửa/inpainting có mục tiêu.
  • Ảnh tham chiếu để điều khiển phong cách hoặc bố cục.
    Các chức năng này được cung cấp qua Images API (tên mô hình gpt-image-1-mini).

Hạn chế

  • Độ trung thực tối đa thấp hơn: so với mô hình gpt-image-1 lớn, bản mini có thể mất một số chi tiết rất nhỏ và mức độ chân thực hàng đầu (đây là đánh đổi kỳ vọng để tối ưu chi phí).
  • Kết xuất chữ & chi tiết cực nhỏ: như nhiều mô hình ảnh khác, có thể khó với chữ nhỏ dễ đọc, biểu đồ dày đặc hoặc texture siêu mịn; nên hậu kỳ hoặc dùng mô hình dung lượng cao hơn cho các nhu cầu đó.
  • Phạm vi chỉnh sửa: tính năng chỉnh sửa/inpainting khả dụng nhưng có một số giới hạn so với công cụ ChatGPT trên web — chỉnh sửa hiệu quả cho nhiều tác vụ nhưng có thể cần tinh chỉnh lặp lại.
  • Ràng buộc an toàn & chính sách: đầu ra tuân theo hàng rào an toàn/kiểm duyệt của OpenAI (nội dung nhạy cảm, nội dung có bản quyền, đầu ra bị cấm). Nhà phát triển có thể điều chỉnh độ nhạy kiểm duyệt qua tham số API nếu có.

Trường hợp sử dụng khuyến nghị

  • Tạo nội dung khối lượng lớn (tài sản marketing, ảnh thu nhỏ, phác thảo ý tưởng nhanh) — khi chi phí mỗi ảnh là ưu tiên hàng đầu.
  • Chỉnh sửa theo chương trình / tạo mẫu (templating) — inpainting hàng loạt hoặc tạo biến thể từ một tài nguyên gốc.
  • Ứng dụng tương tác có hạn chế ngân sách — giao diện chat hoặc công cụ thiết kế tích hợp nơi tốc độ phản hồi và chi phí quan trọng hơn độ trung thực tối đa.
  • Dựng mẫu & tạo ảnh A/B — tạo nhiều phương án nhanh rồi chọn lọc nâng cấp độ phân giải hoặc chạy lại trên mô hình lớn hơn cho phương án cuối.
  • Cách truy cập API gpt-image-1-mini

Bước 1: Đăng ký khóa API

Đăng nhập vào cometapi.com. Nếu bạn chưa phải là người dùng của chúng tôi, vui lòng đăng ký trước. Đăng nhập vào bảng điều khiển CometAPI. Lấy khóa truy cập API của giao diện. Nhấp “Add Token” tại API token trong trung tâm cá nhân, lấy token key: sk-xxxxx và gửi.

ảnh

Bước 2: Gửi yêu cầu tới API gpt-image-1-mini

Chọn điểm cuối “\**gpt-image-1-mini \**” để gửi yêu cầu API và thiết lập phần nội dung yêu cầu. Phương thức yêu cầu và phần nội dung yêu cầu được lấy từ tài liệu API trên trang web của chúng tôi. Trang web của chúng tôi cũng cung cấp bài kiểm thử Apifox để bạn tiện sử dụng. Thay thế <YOUR_API_KEY> bằng khóa CometAPI thực tế từ tài khoản của bạn.

Chèn câu hỏi hoặc yêu cầu của bạn vào trường content — đây là nội dung mà mô hình sẽ phản hồi. Xử lý phản hồi API để lấy câu trả lời được tạo.

Bước 3: Truy xuất và xác minh kết quả

Xử lý phản hồi API để lấy câu trả lời được tạo. Sau khi xử lý, API phản hồi với trạng thái tác vụ và dữ liệu đầu ra.

Tính năng cho GPT Image 1 mini

Khám phá các tính năng chính của GPT Image 1 mini, được thiết kế để nâng cao hiệu suất và khả năng sử dụng. Tìm hiểu cách các khả năng này có thể mang lại lợi ích cho dự án của bạn và cải thiện trải nghiệm người dùng.

Giá cả cho GPT Image 1 mini

Khám phá mức giá cạnh tranh cho GPT Image 1 mini, được thiết kế để phù hợp với nhiều ngân sách và nhu cầu sử dụng khác nhau. Các gói linh hoạt của chúng tôi đảm bảo bạn chỉ trả tiền cho những gì bạn sử dụng, giúp dễ dàng mở rộng quy mô khi yêu cầu của bạn tăng lên. Khám phá cách GPT Image 1 mini có thể nâng cao các dự án của bạn trong khi vẫn kiểm soát được chi phí.
Giá Comet (USD / M Tokens)Giá Chính Thức (USD / M Tokens)Giảm giá
Đầu vào:$6.4/M
Đầu ra:$25.6/M
Đầu vào:$8/M
Đầu ra:$32/M
-20%

Mã mẫu và API cho GPT Image 1 mini

gpt-image-1-mini là một mô hình hình ảnh đa phương thức được tối ưu về chi phí từ OpenAI, có thể nhận đầu vào văn bản và hình ảnh và tạo ra đầu ra là hình ảnh. Nó được định vị như một phiên bản nhỏ hơn, rẻ hơn của họ GPT-Image-1 đầy đủ của OpenAI — được thiết kế cho mục đích sản xuất có thông lượng cao, nơi chi phí và độ trễ là những ràng buộc quan trọng. Mô hình này hướng đến các tác vụ như tạo ảnh từ văn bản, chỉnh sửa / inpainting hình ảnh và các quy trình công việc tích hợp hình ảnh tham chiếu.
Python
JavaScript
Curl
import base64
import os
from openai import OpenAI
from PIL import Image
from io import BytesIO

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
client = OpenAI(api_key=COMETAPI_KEY, base_url="https://api.cometapi.com/v1")

# Output directory
OUTPUT_DIR = os.path.join(os.path.dirname(__file__), "..", "output")
os.makedirs(OUTPUT_DIR, exist_ok=True)

prompt = "A cute baby sea otter swimming in the ocean"

# Generate image using gpt-image-1-mini
result = client.images.generate(
    model="gpt-image-1-mini",
    prompt=prompt,
    size="1024x1024",
)

# Save the image
image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode(image_base64)

output_path = os.path.join(OUTPUT_DIR, "output.png")
image = Image.open(BytesIO(image_bytes))
image.save(output_path, format="PNG")

print(f"Image saved to: {output_path}")

Thêm mô hình