主な機能
- テキスト→画像生成: 自然言語のプロンプトを画像に変換し、高い指示追従性を備えています。
- 画像編集/インペインティング: 参照画像とマスクを受け取り、対象を絞った編集を行います。
- コスト最適化(“mini”)設計: 小型フットプリントで、1枚あたりのコストが大型モデルより大幅に安価(OpenAI/DevDayでの案内や初期報告では約80%低価格)。
- 柔軟な出力制御: サイズ、出力形式(JPEG/PNG/WEBP)、圧縮、品質ノブ(cookbookでは low/medium/high/auto)をサポート。
技術詳細(アーキテクチャと機能)
- モデルファミリーと入出力: gpt-image-1 ファミリーの一員。テキストプロンプト と編集用の 画像入力 を受け付け、生成された画像を返します。品質/サイズ パラメータで解像度を制御(このファミリーの一般的な最大値は約 1536×1024。正確な対応サイズはドキュメントを参照)。
- 運用上のトレードオフ: 小型フットプリントとして設計され、スループットとコストの改善と引き換えに、最高峰の精細さの一部を犠牲にしつつ、堅牢なプロンプト追従性と編集機能を維持。
- 安全性とメタデータ: OpenAIの画像安全ガードレールに従い、利用可能な場合は出所証跡のためのC2PAメタデータ埋め込みオプションに対応。
入力と出力 — 代表的な利用方法:
- 新しい画像を生成するための テキストプロンプト(文字列)
- 画像+マスク による対象編集/インペインティング
- スタイルや構図を制御する 参照画像
これらは Images API(モデル名gpt-image-1-mini)で提供されます。
制限事項
- ピーク時の精細さの低下: 大型の gpt-image-1 と比較して、微細なディテールや最高レベルの写実性が一部低下する場合があります(コストとのトレードオフ)。
- 文字描画と微小ディテール: 多くの画像モデル同様、小さく可読な文字、密なチャート、極細テクスチャは苦手な傾向。必要に応じて後処理や高容量モデルの利用を検討してください。
- 編集の範囲: 画像編集/インペインティングは可能だが、ChatGPTのWebツールのようなインタラクティブ編集と比べて制約がある想定。多くのタスクで有効だが、反復的な調整が必要となる場合があります。
- 安全性とポリシー制約: 出力はOpenAIのモデレーション/安全ガードレールの対象(露骨なコンテンツ、著作権制限、禁止出力など)。提供される範囲でAPIパラメータによりモデレーション感度を調整可能。
推奨ユースケース
- 大量コンテンツ生成(マーケティング素材、サムネイル、迅速なコンセプトアート)— 1枚あたりのコストを最優先する用途
- プログラム的編集/テンプレート運用 — ベース資産からの一括インペインティングやバリアント生成
- 予算制約のあるインタラクティブアプリ — 最高忠実度より応答速度とコストを重視するチャットUIや統合デザインツール
- プロトタイピング&A/B画像生成 — 多数の候補を素早く生成し、最終候補のみを大型モデルでアップスケール/再生成
- gpt-image-1-mini API へのアクセス方法
手順 1: APIキーにサインアップ
cometapi.com にログインします。未登録の場合は先に登録してください。CometAPI コンソール にサインインします。インターフェースのアクセス認証であるAPIキーを取得します。パーソナルセンターのAPIトークンで “Add Token” をクリックし、トークンキー(sk-xxxxx)を取得して送信します。

手順 2: gpt-image-1-mini API にリクエストを送信
“\**gpt-image-1-mini \**”endpoint を選択してAPIリクエストを送信し、リクエストボディを設定します。リクエストメソッドとリクエストボディは当社ウェブサイトのAPIドキュメントに記載があります。利便性のため、当社サイトでは Apifox テストも提供しています。<YOUR_API_KEY> をアカウントの実際の CometAPI キーに置き換えてください。
content フィールドに質問やリクエストを挿入します—モデルはこの内容に応答します。APIレスポンスを処理して生成結果を取得します。
手順 3: 結果の取得と検証
APIレスポンスを処理して生成結果を取得します。処理後、APIはタスクのステータスと出力データを返します。