GPT-4o mini Audio es un modelo multimodal para interacciones de voz y texto. Realiza reconocimiento de voz, traducción y conversión de texto a voz, sigue instrucciones y puede invocar herramientas para acciones estructuradas con respuestas en streaming. Los usos típicos incluyen asistentes de voz en tiempo real, subtitulación y traducción en vivo, resumen de llamadas y aplicaciones controladas por voz. Los aspectos técnicos destacados incluyen entrada y salida de audio, respuestas en streaming, llamadas a funciones y salida JSON estructurada.
Uso comercial
Características
Precios
API
Versiones
Características para GPT-4o mini Audio
Explora las características clave de GPT-4o mini Audio, diseñado para mejorar el rendimiento y la usabilidad. Descubre cómo estas capacidades pueden beneficiar tus proyectos y mejorar la experiencia del usuario.
Precios para GPT-4o mini Audio
Explora precios competitivos para GPT-4o mini Audio, diseñado para adaptarse a diversos presupuestos y necesidades de uso. Nuestros planes flexibles garantizan que solo pagues por lo que uses, facilitando el escalado a medida que crecen tus requisitos. Descubre cómo GPT-4o mini Audio puede mejorar tus proyectos mientras mantienes los costos manejables.
Precio de Comet (USD / M Tokens)
Precio Oficial (USD / M Tokens)
Descuento
Entrada:$0.12/M
Salida:$0.48/M
Entrada:$0.15/M
Salida:$0.6/M
-20%
Código de ejemplo y API para GPT-4o mini Audio
Accede a código de muestra completo y recursos de API para GPT-4o mini Audio para agilizar tu proceso de integración. Nuestra documentación detallada proporciona orientación paso a paso, ayudándote a aprovechar todo el potencial de GPT-4o mini Audio en tus proyectos.
Versiones de GPT-4o mini Audio
La razón por la cual GPT-4o mini Audio tiene múltiples instantáneas puede incluir factores potenciales como variaciones en la salida tras actualizaciones que requieren instantáneas anteriores para mantener la coherencia, ofrecer a los desarrolladores un período de transición para adaptación y migración, y diferentes instantáneas que corresponden a endpoints globales o regionales para optimizar la experiencia del usuario. Para conocer las diferencias detalladas entre versiones, consulte la documentación oficial.