Home/Models/OpenAI/GPT Image 1 mini
O

GPT Image 1 mini

Wejście:$6.4/M
Wyjście:$25.6/M
Kosztowo zoptymalizowana wersja GPT Image 1. To natywny multimodalny model językowy, który przyjmuje zarówno tekst, jak i obrazy jako dane wejściowe oraz generuje wynik w postaci obrazów.
Nowy
Użycie komercyjne
Przegląd
Funkcje
Cennik
API

Kluczowe funkcje

  • Generowanie tekst→obraz: przekształca polecenia w języku naturalnym w obrazy, z bardzo dobrym wykonywaniem instrukcji.
  • Edycja obrazów / inpainting: obsługuje obrazy referencyjne i maski, aby przeprowadzać ukierunkowane edycje.
  • Zoptymalizowany kosztowo projekt („mini”): mniejszy rozmiar, który OpenAI i obserwatorzy opisują jako znacznie tańszy na obraz niż duży model (komunikaty OpenAI/DevDay i wczesne raporty mówią o ~80% niższym koszcie).
  • Elastyczne sterowanie wyjściem: obsługuje rozmiar, format wyjściowy (JPEG/PNG/WEBP), kompresję i regulator jakości (low/medium/high/auto w cookbooku).

Szczegóły techniczne (architektura i możliwości)

  • Rodzina modeli i wejście/wyjście: członek rodziny gpt-image-1; akceptuje polecenia tekstowe oraz wejścia obrazów (do edycji) i zwraca wygenerowane obrazy. Parametry Quality/size kontrolują rozdzielczość (typowe maksimum ~1536×1024 w tej rodzinie — szczegółowe obsługiwane rozmiary w dokumentacji).
  • Kompromisy operacyjne: zaprojektowany jako model o mniejszym śladzie — poświęca część najwyższej wierności na rzecz poprawy przepustowości i kosztów, zachowując solidne wykonywanie poleceń i funkcje edycji.
  • Bezpieczeństwo i metadane: przestrzega zabezpieczeń bezpieczeństwa obrazu OpenAI i, gdy dostępne, osadza opcje metadanych C2PA dla poświadczenia pochodzenia.

Wejścia i wyjścia — standardowe użycie obsługuje:

  • Polecenie tekstowe (ciąg znaków) do wygenerowania nowego obrazu.
  • Obraz + maska do wykonania ukierunkowanych edycji/inpaintingu.
  • Obrazy referencyjne do kontrolowania stylu lub kompozycji.
    Są udostępniane przez Images API (nazwa modelu gpt-image-1-mini).

Ograniczenia

  • Niższa maksymalna wierność: w porównaniu z dużym modelem gpt-image-1, wersja mini może tracić część mikroszczegółów i najwyższego fotorealizmu (oczekiwany kompromis kosztowy).
  • Renderowanie tekstu i drobne detale: jak wiele modeli obrazowych, może mieć trudności z niewielkim czytelnym tekstem, gęstymi wykresami lub ultradrobiazgowymi teksturami; należy liczyć się z post‑obróbką lub użyciem modeli o większej pojemności dla takich potrzeb.
  • Zakres edycji: funkcje edycji/inpaintingu są dostępne, ale mają pewne ograniczenia względem interaktywnych narzędzi webowych ChatGPT — edycje są skuteczne w wielu zadaniach, lecz mogą wymagać iteracyjnego dopracowania.
  • Ograniczenia bezpieczeństwa i polityk: wyniki podlegają moderacji/zasadom bezpieczeństwa OpenAI (treści drastyczne, ograniczenia dotyczące praw autorskich, niedozwolone wyniki). Deweloperzy mogą sterować czułością moderacji poprzez parametry API tam, gdzie są oferowane.

Zalecane przypadki użycia

  • Generowanie treści na dużą skalę (zasoby marketingowe, miniatury, szybki concept art) — tam, gdzie kluczowy jest koszt na obraz.
  • Edycja programowa / szablonowanie — masowy inpainting lub generowanie wariantów z zasobu bazowego.
  • Aplikacje interaktywne z ograniczonym budżetem — interfejsy czatowe lub zintegrowane narzędzia projektowe, w których szybkość i koszt są ważniejsze niż absolutnie najwyższa wierność.
  • Prototypowanie i generowanie obrazów do testów A/B — szybkie tworzenie wielu kandydatów i selektywne skalowanie w górę lub ponowne uruchamianie na większych modelach dla finalistów.
  • Jak uzyskać dostęp do gpt-image-1-mini API

Krok 1: Zarejestruj klucz API

Zaloguj się na cometapi.com. Jeśli nie jesteś jeszcze naszym użytkownikiem, zarejestruj się najpierw. Zaloguj się do swojej konsoli CometAPI. Uzyskaj poświadczenie dostępu — klucz API interfejsu. Kliknij „Add Token” przy tokenie API w panelu użytkownika, pobierz klucz tokenu: sk-xxxxx i zatwierdź.

obraz

Krok 2: Wyślij żądania do gpt-image-1-mini API

Wybierz „\**gpt-image-1-mini \**”endpoint, aby wysłać żądanie API i ustawić treść żądania. Metodę i treść żądania znajdziesz w naszej dokumentacji API na stronie. Zapewniamy również testy Apifox dla Twojej wygody. Zamień <YOUR_API_KEY> na rzeczywisty klucz CometAPI ze swojego konta.

Wstaw swoje pytanie lub prośbę do pola content — na to odpowie model. Przetwórz odpowiedź API, aby uzyskać wygenerowany wynik.

Krok 3: Pobierz i zweryfikuj wyniki

Przetwórz odpowiedź API, aby uzyskać wygenerowany wynik. Po przetworzeniu API zwraca status zadania oraz dane wyjściowe.

Funkcje dla GPT Image 1 mini

Poznaj kluczowe funkcje GPT Image 1 mini, zaprojektowane w celu zwiększenia wydajności i użyteczności. Odkryj, jak te możliwości mogą przynieść korzyści Twoim projektom i poprawić doświadczenie użytkownika.

Cennik dla GPT Image 1 mini

Poznaj konkurencyjne ceny dla GPT Image 1 mini, zaprojektowane tak, aby pasowały do różnych budżetów i potrzeb użytkowania. Nasze elastyczne plany zapewniają, że płacisz tylko za to, czego używasz, co ułatwia skalowanie w miarę wzrostu Twoich wymagań. Odkryj, jak GPT Image 1 mini może ulepszyć Twoje projekty przy jednoczesnym utrzymaniu kosztów na rozsądnym poziomie.
Cena Comet (USD / M Tokens)Oficjalna cena (USD / M Tokens)Zniżka
Wejście:$6.4/M
Wyjście:$25.6/M
Wejście:$8/M
Wyjście:$32/M
-20%

Przykładowy kod i API dla GPT Image 1 mini

gpt-image-1-mini to zoptymalizowany kosztowo, multimodalny model obrazowy od OpenAI, który przyjmuje wejścia tekstowe i obrazowe oraz generuje obrazy jako wynik. Pozycjonowany jest jako mniejszy, tańszy odpowiednik pełnej rodziny GPT-Image-1 od OpenAI — zaprojektowany do zastosowań produkcyjnych o wysokiej przepustowości, w których koszty i opóźnienia są istotnymi ograniczeniami. Model jest przeznaczony do zadań takich jak generowanie obrazów z tekstu, edycja obrazów / inpainting oraz przepływy pracy wykorzystujące obrazy referencyjne.
Python
JavaScript
Curl
import base64
import os
from openai import OpenAI
from PIL import Image
from io import BytesIO

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
client = OpenAI(api_key=COMETAPI_KEY, base_url="https://api.cometapi.com/v1")

# Output directory
OUTPUT_DIR = os.path.join(os.path.dirname(__file__), "..", "output")
os.makedirs(OUTPUT_DIR, exist_ok=True)

prompt = "A cute baby sea otter swimming in the ocean"

# Generate image using gpt-image-1-mini
result = client.images.generate(
    model="gpt-image-1-mini",
    prompt=prompt,
    size="1024x1024",
)

# Save the image
image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode(image_base64)

output_path = os.path.join(OUTPUT_DIR, "output.png")
image = Image.open(BytesIO(image_bytes))
image.save(output_path, format="PNG")

print(f"Image saved to: {output_path}")

Więcej modeli