主要功能
- 文字→圖像生成: 將自然語言提示轉換為圖像,具備強大的指令遵循能力。
- 圖像編輯/修補: 接受參考圖與遮罩以執行針對性編輯。
- 成本優化(“mini”)設計: 更小的佔用,據 OpenAI 與觀察者描述,每張圖像成本遠低於大型模型(OpenAI/DevDay 訊息與早期報告稱約 ~80% 更便宜)。
- 彈性的輸出控制: 支援尺寸、輸出格式(JPEG/PNG/WEBP)、壓縮,以及品質調節(cookbook 中為 low/medium/high/auto)。
技術細節(架構與能力)
- 模型家族與輸入/輸出: 屬於 gpt-image-1 家族;接受 文字提示 與 圖像輸入(用於編輯),並回傳生成的圖像輸出。Quality/size 參數可控制解析度(此家族的常見上限約為 ~1536×1024—確切支援尺寸請參見文件)。
- 運行取捨: 設計為較小體量的模型—以部分頂級逼真度為代價,換取 吞吐與成本 的提升,同時保留穩健的提示遵循與編輯功能。
- 安全與中繼資料: 遵循 OpenAI 的圖像安全護欄,並在可用時嵌入 C2PA 來源證明中繼資料選項。
輸入與輸出 — 典型使用支援:
- 文字提示(字串)以生成新圖像。
- 圖像 + 遮罩 用於執行針對性編輯/修補。
- 參考圖像 用於控制風格或構圖。
這些功能透過 Images API 提供(模型名稱gpt-image-1-mini)。
限制
- 較低的峰值逼真度: 與大型 gpt-image-1 模型相比,mini 可能在微小細節與頂級寫實度上有所下降(為成本所做的預期取捨)。
- 文字渲染與極細節: 與許多圖像模型相同,對於小字體可讀文字、密集圖表或極細紋理可能表現欠佳;此類需求可考慮後製或使用更高容量的模型。
- 編輯範圍: 提供圖像編輯/修補功能,但相較於 ChatGPT 網頁端互動工具可能存在部分編輯限制—對多數任務有效,但可能需要反覆微調。
- 安全與政策限制: 輸出受 OpenAI 內容審核/安全護欄約束(露骨內容、版權內容限制、禁生成項目)。在支援的情況下,開發者可透過 API 參數調整審核靈敏度。
推薦使用場景
- 大量內容生成(行銷素材、縮圖、快速概念圖)—以每張圖像成本為優先。
- 程式化編輯/模板化—基於同一素材進行大量修補或變體生成。
- 有預算約束的互動應用—如聊天介面或整合式設計工具,更重視回應速度與成本而非絕對頂級逼真度。
- 原型設計與 A/B 圖像生成—快速產生大量候選圖像,並對入選者選擇性放大或在更大型模型上重跑。
- 如何存取 gpt-image-1-mini API
步驟 1:註冊取得 API 金鑰
登入 cometapi.com。若您尚未成為我們的使用者,請先註冊。登入您的 CometAPI console。取得該介面的存取憑證 API key。在個人中心的 API token 處點擊 “Add Token”,取得金鑰:sk-xxxxx 並提交。

步驟 2:向 gpt-image-1-mini API 發送請求
選擇 “\**gpt-image-1-mini \**” 端點發送 API 請求並設定請求主體。請求方法與請求主體可從我們網站的 API 說明取得。我們的網站同時提供 Apifox 測試以利使用。將 <YOUR_API_KEY> 替換為您帳戶中的實際 CometAPI 金鑰。
將您的問題或請求填入 content 欄位—模型會根據此內容回應 。處理 API 回應以取得生成的答案。
步驟 3:擷取並驗證結果
處理 API 回應以取得生成的答案。處理完成後,API 會回傳任務狀態與輸出資料。