Kluczowe funkcje
- Generowanie tekst→obraz: przekształca polecenia w języku naturalnym w obrazy, z bardzo dobrym wykonywaniem instrukcji.
- Edycja obrazów / inpainting: obsługuje obrazy referencyjne i maski, aby przeprowadzać ukierunkowane edycje.
- Zoptymalizowany kosztowo projekt („mini”): mniejszy rozmiar, który OpenAI i obserwatorzy opisują jako znacznie tańszy na obraz niż duży model (komunikaty OpenAI/DevDay i wczesne raporty mówią o ~80% niższym koszcie).
- Elastyczne sterowanie wyjściem: obsługuje rozmiar, format wyjściowy (JPEG/PNG/WEBP), kompresję i regulator jakości (low/medium/high/auto w cookbooku).
Szczegóły techniczne (architektura i możliwości)
- Rodzina modeli i wejście/wyjście: członek rodziny gpt-image-1; akceptuje polecenia tekstowe oraz wejścia obrazów (do edycji) i zwraca wygenerowane obrazy. Parametry Quality/size kontrolują rozdzielczość (typowe maksimum ~1536×1024 w tej rodzinie — szczegółowe obsługiwane rozmiary w dokumentacji).
- Kompromisy operacyjne: zaprojektowany jako model o mniejszym śladzie — poświęca część najwyższej wierności na rzecz poprawy przepustowości i kosztów, zachowując solidne wykonywanie poleceń i funkcje edycji.
- Bezpieczeństwo i metadane: przestrzega zabezpieczeń bezpieczeństwa obrazu OpenAI i, gdy dostępne, osadza opcje metadanych C2PA dla poświadczenia pochodzenia.
Wejścia i wyjścia — standardowe użycie obsługuje:
- Polecenie tekstowe (ciąg znaków) do wygenerowania nowego obrazu.
- Obraz + maska do wykonania ukierunkowanych edycji/inpaintingu.
- Obrazy referencyjne do kontrolowania stylu lub kompozycji.
Są udostępniane przez Images API (nazwa modelugpt-image-1-mini).
Ograniczenia
- Niższa maksymalna wierność: w porównaniu z dużym modelem gpt-image-1, wersja mini może tracić część mikroszczegółów i najwyższego fotorealizmu (oczekiwany kompromis kosztowy).
- Renderowanie tekstu i drobne detale: jak wiele modeli obrazowych, może mieć trudności z niewielkim czytelnym tekstem, gęstymi wykresami lub ultradrobiazgowymi teksturami; należy liczyć się z post‑obróbką lub użyciem modeli o większej pojemności dla takich potrzeb.
- Zakres edycji: funkcje edycji/inpaintingu są dostępne, ale mają pewne ograniczenia względem interaktywnych narzędzi webowych ChatGPT — edycje są skuteczne w wielu zadaniach, lecz mogą wymagać iteracyjnego dopracowania.
- Ograniczenia bezpieczeństwa i polityk: wyniki podlegają moderacji/zasadom bezpieczeństwa OpenAI (treści drastyczne, ograniczenia dotyczące praw autorskich, niedozwolone wyniki). Deweloperzy mogą sterować czułością moderacji poprzez parametry API tam, gdzie są oferowane.
Zalecane przypadki użycia
- Generowanie treści na dużą skalę (zasoby marketingowe, miniatury, szybki concept art) — tam, gdzie kluczowy jest koszt na obraz.
- Edycja programowa / szablonowanie — masowy inpainting lub generowanie wariantów z zasobu bazowego.
- Aplikacje interaktywne z ograniczonym budżetem — interfejsy czatowe lub zintegrowane narzędzia projektowe, w których szybkość i koszt są ważniejsze niż absolutnie najwyższa wierność.
- Prototypowanie i generowanie obrazów do testów A/B — szybkie tworzenie wielu kandydatów i selektywne skalowanie w górę lub ponowne uruchamianie na większych modelach dla finalistów.
- Jak uzyskać dostęp do gpt-image-1-mini API
Krok 1: Zarejestruj klucz API
Zaloguj się na cometapi.com. Jeśli nie jesteś jeszcze naszym użytkownikiem, zarejestruj się najpierw. Zaloguj się do swojej konsoli CometAPI. Uzyskaj poświadczenie dostępu — klucz API interfejsu. Kliknij „Add Token” przy tokenie API w panelu użytkownika, pobierz klucz tokenu: sk-xxxxx i zatwierdź.

Krok 2: Wyślij żądania do gpt-image-1-mini API
Wybierz „\**gpt-image-1-mini \**”endpoint, aby wysłać żądanie API i ustawić treść żądania. Metodę i treść żądania znajdziesz w naszej dokumentacji API na stronie. Zapewniamy również testy Apifox dla Twojej wygody. Zamień <YOUR_API_KEY> na rzeczywisty klucz CometAPI ze swojego konta.
Wstaw swoje pytanie lub prośbę do pola content — na to odpowie model. Przetwórz odpowiedź API, aby uzyskać wygenerowany wynik.
Krok 3: Pobierz i zweryfikuj wyniki
Przetwórz odpowiedź API, aby uzyskać wygenerowany wynik. Po przetworzeniu API zwraca status zadania oraz dane wyjściowe.