O

GPT-4o mini Audio

Entrada:$0.12/M
Salida:$0.48/M
GPT-4o mini Audio es un modelo multimodal para interacciones de voz y texto. Realiza reconocimiento de voz, traducción y conversión de texto a voz, sigue instrucciones y puede invocar herramientas para acciones estructuradas con respuestas en streaming. Los usos típicos incluyen asistentes de voz en tiempo real, subtitulación y traducción en vivo, resumen de llamadas y aplicaciones controladas por voz. Los aspectos técnicos destacados incluyen entrada y salida de audio, respuestas en streaming, llamadas a funciones y salida JSON estructurada.
Uso comercial

Características para GPT-4o mini Audio

Explora las características clave de GPT-4o mini Audio, diseñado para mejorar el rendimiento y la usabilidad. Descubre cómo estas capacidades pueden beneficiar tus proyectos y mejorar la experiencia del usuario.

Más modelos