GPT-4o mini Audio est un modèle multimodal pour les interactions vocales et textuelles. Il effectue la reconnaissance vocale, la traduction et la synthèse vocale, suit les instructions et peut appeler des outils pour des actions structurées avec des réponses en streaming. Les cas d’utilisation typiques comprennent les assistants vocaux en temps réel, le sous-titrage et la traduction en direct, le résumé d’appels et les applications contrôlées par la voix. Les points forts techniques comprennent l’entrée et la sortie audio, des réponses en streaming, l’appel de fonctions et une sortie JSON structurée.
Usage commercial
Fonctionnalités
Tarification
API
Versions
Fonctionnalités pour GPT-4o mini Audio
Découvrez les fonctionnalités clés de GPT-4o mini Audio, conçues pour améliorer les performances et la facilité d'utilisation. Explorez comment ces capacités peuvent bénéficier à vos projets et améliorer l'expérience utilisateur.
Tarification pour GPT-4o mini Audio
Découvrez des tarifs compétitifs pour GPT-4o mini Audio, conçus pour s'adapter à différents budgets et besoins d'utilisation. Nos formules flexibles garantissent que vous ne payez que ce que vous utilisez, ce qui facilite l'adaptation à mesure que vos besoins évoluent. Découvrez comment GPT-4o mini Audio peut améliorer vos projets tout en maîtrisant les coûts.
Prix de Comet (USD / M Tokens)
Prix officiel (USD / M Tokens)
Remise
Entrée:$0.12/M
Sortie:$0.48/M
Entrée:$0.15/M
Sortie:$0.6/M
-20%
Exemple de code et API pour GPT-4o mini Audio
Accédez à des exemples de code complets et aux ressources API pour GPT-4o mini Audio afin de simplifier votre processus d'intégration. Notre documentation détaillée fournit des instructions étape par étape pour vous aider à exploiter tout le potentiel de GPT-4o mini Audio dans vos projets.
Versions de GPT-4o mini Audio
La raison pour laquelle GPT-4o mini Audio dispose de plusieurs instantanés peut inclure des facteurs potentiels tels que des variations de sortie après des mises à jour nécessitant des instantanés plus anciens pour la cohérence, offrant aux développeurs une période de transition pour l'adaptation et la migration, et différents instantanés correspondant à des points de terminaison globaux ou régionaux pour optimiser l'expérience utilisateur. Pour les différences détaillées entre les versions, veuillez consulter la documentation officielle.