Tính năng chính
- Tạo ảnh từ văn bản: chuyển đổi lời nhắc ngôn ngữ tự nhiên thành hình ảnh với khả năng tuân thủ hướng dẫn cao.
- Chỉnh sửa hình ảnh / inpainting: nhận ảnh tham chiếu và mặt nạ để thực hiện các chỉnh sửa có mục tiêu.
- Thiết kế tối ưu chi phí (“mini”): quy mô nhỏ hơn mà OpenAI và các nguồn quan sát mô tả là rẻ hơn nhiều cho mỗi ảnh so với mô hình lớn (thông điệp OpenAI/DevDay và các báo cáo ban đầu cho biết rẻ hơn ~80%).
- Điều khiển đầu ra linh hoạt: hỗ trợ kích thước, định dạng đầu ra (JPEG/PNG/WEBP), nén và tham số chất lượng (thấp/trung bình/cao/tự động trong cookbook).
Chi tiết kỹ thuật (kiến trúc & khả năng)
- Họ mô hình & đầu vào/đầu ra: thành viên của họ gpt-image-1; chấp nhận lời nhắc văn bản và đầu vào hình ảnh (để chỉnh sửa) và trả về ảnh đã tạo. Tham số chất lượng/kích thước điều khiển độ phân giải (giới hạn tối đa điển hình ~1536×1024 trong họ này — xem tài liệu để biết kích thước được hỗ trợ chính xác).
- Cân bằng vận hành: được thiết kế như một mô hình gọn nhẹ — đánh đổi một phần độ trung thực đỉnh để cải thiện thông lượng và chi phí trong khi vẫn giữ khả năng tuân thủ prompt và tính năng chỉnh sửa mạnh mẽ.
- An toàn & siêu dữ liệu: tuân theo hàng rào an toàn hình ảnh của OpenAI và nhúng tùy chọn siêu dữ liệu C2PA cho nguồn gốc khi khả dụng.
Đầu vào & đầu ra — cách dùng chuẩn hỗ trợ:
- Lời nhắc văn bản (string) để tạo ảnh mới.
- Hình ảnh + mặt nạ để thực hiện chỉnh sửa/inpainting có mục tiêu.
- Ảnh tham chiếu để điều khiển phong cách hoặc bố cục.
Các chức năng này được cung cấp qua Images API (tên mô hìnhgpt-image-1-mini).
Hạn chế
- Độ trung thực tối đa thấp hơn: so với mô hình gpt-image-1 lớn, bản mini có thể mất một số chi tiết rất nhỏ và mức độ chân thực hàng đầu (đây là đánh đổi kỳ vọng để tối ưu chi phí).
- Kết xuất chữ & chi tiết cực nhỏ: như nhiều mô hình ảnh khác, có thể khó với chữ nhỏ dễ đọc, biểu đồ dày đặc hoặc texture siêu mịn; nên hậu kỳ hoặc dùng mô hình dung lượng cao hơn cho các nhu cầu đó.
- Phạm vi chỉnh sửa: tính năng chỉnh sửa/inpainting khả dụng nhưng có một số giới hạn so với công cụ ChatGPT trên web — chỉnh sửa hiệu quả cho nhiều tác vụ nhưng có thể cần tinh chỉnh lặp lại.
- Ràng buộc an toàn & chính sách: đầu ra tuân theo hàng rào an toàn/kiểm duyệt của OpenAI (nội dung nhạy cảm, nội dung có bản quyền, đầu ra bị cấm). Nhà phát triển có thể điều chỉnh độ nhạy kiểm duyệt qua tham số API nếu có.
Trường hợp sử dụng khuyến nghị
- Tạo nội dung khối lượng lớn (tài sản marketing, ảnh thu nhỏ, phác thảo ý tưởng nhanh) — khi chi phí mỗi ảnh là ưu tiên hàng đầu.
- Chỉnh sửa theo chương trình / tạo mẫu (templating) — inpainting hàng loạt hoặc tạo biến thể từ một tài nguyên gốc.
- Ứng dụng tương tác có hạn chế ngân sách — giao diện chat hoặc công cụ thiết kế tích hợp nơi tốc độ phản hồi và chi phí quan trọng hơn độ trung thực tối đa.
- Dựng mẫu & tạo ảnh A/B — tạo nhiều phương án nhanh rồi chọn lọc nâng cấp độ phân giải hoặc chạy lại trên mô hình lớn hơn cho phương án cuối.
- Cách truy cập API gpt-image-1-mini
Bước 1: Đăng ký khóa API
Đăng nhập vào cometapi.com. Nếu bạn chưa phải là người dùng của chúng tôi, vui lòng đăng ký trước. Đăng nhập vào bảng điều khiển CometAPI. Lấy khóa truy cập API của giao diện. Nhấp “Add Token” tại API token trong trung tâm cá nhân, lấy token key: sk-xxxxx và gửi.

Bước 2: Gửi yêu cầu tới API gpt-image-1-mini
Chọn điểm cuối “\**gpt-image-1-mini \**” để gửi yêu cầu API và thiết lập phần nội dung yêu cầu. Phương thức yêu cầu và phần nội dung yêu cầu được lấy từ tài liệu API trên trang web của chúng tôi. Trang web của chúng tôi cũng cung cấp bài kiểm thử Apifox để bạn tiện sử dụng. Thay thế <YOUR_API_KEY> bằng khóa CometAPI thực tế từ tài khoản của bạn.
Chèn câu hỏi hoặc yêu cầu của bạn vào trường content — đây là nội dung mà mô hình sẽ phản hồi. Xử lý phản hồi API để lấy câu trả lời được tạo.
Bước 3: Truy xuất và xác minh kết quả
Xử lý phản hồi API để lấy câu trả lời được tạo. Sau khi xử lý, API phản hồi với trạng thái tác vụ và dữ liệu đầu ra.