Home/Models/OpenAI/GPT Image 1 mini
O

GPT Image 1 mini

Entrada:$6.4/M
Salida:$25.6/M
Versión optimizada en costos de GPT Image 1. Es un modelo de lenguaje multimodal nativo que admite como entrada tanto texto como imágenes y genera imágenes como salida.
Nuevo
Uso comercial
Resumen
Características
Precios
API

Características clave

  • Generación de Texto→Imagen: convierte indicaciones en lenguaje natural en imágenes con sólido seguimiento de instrucciones.
  • Edición de imágenes / inpainting: admite imágenes de referencia y máscaras para realizar ediciones dirigidas.
  • Diseño optimizado en costos (“mini”): una huella más pequeña que OpenAI y observadores describen como mucho más barata por imagen que el modelo grande (OpenAI/DevDay y reportes tempranos indican ~80% menos costosa).
  • Controles de salida flexibles: admite tamaño, formato de salida (JPEG/PNG/WEBP), compresión y un control de calidad (bajo/medio/alto/auto en el cookbook).

Detalles técnicos (arquitectura y capacidades)

  • Familia del modelo y entrada/salida: miembro de la familia gpt-image-1; acepta prompts de texto e entradas de imagen (para ediciones) y devuelve imágenes generadas. Los parámetros de calidad/tamaño controlan la resolución (máximo típico ~1536×1024 en esta familia—consulte la documentación para conocer los tamaños exactos compatibles).
  • Compensaciones operativas: diseñado como un modelo de menor huella—intercambia algo de fidelidad de primer nivel por mejoras en rendimiento y costo, manteniendo un sólido seguimiento de prompts y funciones de edición.
  • Seguridad y metadatos: sigue las directrices de seguridad de imágenes de OpenAI e incorpora opciones de metadatos C2PA para la procedencia cuando estén disponibles.

Entradas y salidas — el uso canónico admite:

  • Prompt de texto (string) para generar una imagen nueva.
  • Imagen + máscara para realizar ediciones dirigidas/inpainting.
  • Imágenes de referencia para controlar el estilo o la composición.
    Estos se exponen a través de la Images API (nombre del modelo gpt-image-1-mini).

Limitaciones

  • Menor fidelidad máxima: en comparación con el modelo gpt-image-1 grande, mini puede perder algo de microdetalle y fotorrealismo de primer nivel (compensación esperada por el costo).
  • Representación de texto y detalles diminutos: como muchos modelos de imagen, puede tener dificultades con texto pequeño legible, gráficos densos o texturas muy finas; considere posprocesar o usar modelos de mayor capacidad para esas necesidades.
  • Alcance de edición: las funciones de edición/inpainting de imágenes están disponibles pero implican algunas limitaciones de edición en comparación con las herramientas web interactivas de ChatGPT—las ediciones son efectivas para muchas tareas pero pueden requerir refinamiento iterativo.
  • Restricciones de seguridad y políticas: las salidas están sujetas a la moderación/protecciones de seguridad de OpenAI (contenido explícito, restricciones de contenido con derechos de autor, salidas no permitidas). Los desarrolladores pueden controlar la sensibilidad de la moderación mediante parámetros de la API cuando se ofrezcan.

Casos de uso recomendados

  • Generación de contenido a gran escala (activos de marketing, miniaturas, arte conceptual rápido) — donde el costo por imagen es primordial.
  • Edición programática / creación de plantillas — inpainting en lote o generación de variantes a partir de un activo base.
  • Aplicaciones interactivas con restricciones de presupuesto — interfaces de chat o herramientas de diseño integradas donde la velocidad de respuesta y el costo importan más que la fidelidad máxima absoluta.
  • Prototipado y generación de imágenes A/B — generar muchas imágenes candidatas rápidamente y, de forma selectiva, escalar o volver a ejecutar en modelos más grandes para las finalistas.
  • Cómo acceder a la API de gpt-image-1-mini

Paso 1: Regístrese para obtener una clave de API

Inicie sesión en cometapi.com. Si aún no es usuario, regístrese primero. Inicie sesión en su consola de CometAPI. Obtenga la clave de API de credenciales de acceso de la interfaz. Haga clic en “Add Token” en el token de API en el centro personal, obtenga la clave del token: sk-xxxxx y envíe.

imagen

Paso 2: Enviar solicitudes a la API de gpt-image-1-mini

Seleccione el endpoint “\**gpt-image-1-mini \**”para enviar la solicitud de API y configure el cuerpo de la solicitud. El método y el cuerpo de la solicitud se obtienen de la documentación de la API en nuestro sitio web. Nuestro sitio web también ofrece pruebas en Apifox para su comodidad. Reemplace <YOUR_API_KEY> con su clave real de CometAPI de su cuenta.

Inserte su pregunta o solicitud en el campo content—esto es a lo que responderá el modelo. Procese la respuesta de la API para obtener la respuesta generada.

Paso 3: Recuperar y verificar los resultados

Procese la respuesta de la API para obtener la respuesta generada. Tras el procesamiento, la API responde con el estado de la tarea y los datos de salida.

Características para GPT Image 1 mini

Explora las características clave de GPT Image 1 mini, diseñado para mejorar el rendimiento y la usabilidad. Descubre cómo estas capacidades pueden beneficiar tus proyectos y mejorar la experiencia del usuario.

Precios para GPT Image 1 mini

Explora precios competitivos para GPT Image 1 mini, diseñado para adaptarse a diversos presupuestos y necesidades de uso. Nuestros planes flexibles garantizan que solo pagues por lo que uses, facilitando el escalado a medida que crecen tus requisitos. Descubre cómo GPT Image 1 mini puede mejorar tus proyectos mientras mantienes los costos manejables.
Precio de Comet (USD / M Tokens)Precio Oficial (USD / M Tokens)Descuento
Entrada:$6.4/M
Salida:$25.6/M
Entrada:$8/M
Salida:$32/M
-20%

Código de ejemplo y API para GPT Image 1 mini

gpt-image-1-mini es un modelo de imagen multimodal, optimizado en términos de costo, de OpenAI que acepta entradas de texto e imagen y genera salidas de imagen. Se posiciona como un hermano menor y más económico de la familia completa GPT-Image-1 de OpenAI — diseñado para su uso en producción de alto rendimiento, donde el costo y la latencia son restricciones importantes. El modelo está destinado a tareas como la generación de imágenes a partir de texto, la edición de imágenes / inpainting y flujos de trabajo que incorporan imágenes de referencia.
Python
JavaScript
Curl
import base64
import os
from openai import OpenAI
from PIL import Image
from io import BytesIO

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
client = OpenAI(api_key=COMETAPI_KEY, base_url="https://api.cometapi.com/v1")

# Output directory
OUTPUT_DIR = os.path.join(os.path.dirname(__file__), "..", "output")
os.makedirs(OUTPUT_DIR, exist_ok=True)

prompt = "A cute baby sea otter swimming in the ocean"

# Generate image using gpt-image-1-mini
result = client.images.generate(
    model="gpt-image-1-mini",
    prompt=prompt,
    size="1024x1024",
)

# Save the image
image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode(image_base64)

output_path = os.path.join(OUTPUT_DIR, "output.png")
image = Image.open(BytesIO(image_bytes))
image.save(output_path, format="PNG")

print(f"Image saved to: {output_path}")

Más modelos