GPT-4o mini Audio は、音声とテキストのインタラクション向けのマルチモーダルモデルです。音声認識、翻訳、音声合成(テキスト読み上げ)を行い、指示に従い、ストリーミング応答で構造化されたアクションのためのツール呼び出しが可能です。代表的な用途には、リアルタイム音声アシスタント、ライブ字幕化と翻訳、通話要約、音声制御アプリケーションが含まれます。技術的な特長には、音声入出力、ストリーミング応答、関数呼び出し、構造化された JSON 出力が含まれます。
商用利用
機能
料金プラン
API
バージョン
GPT-4o mini Audioの機能
GPT-4o mini Audioのパフォーマンスと使いやすさを向上させるために設計された主要機能をご紹介します。これらの機能がプロジェクトにどのようなメリットをもたらし、ユーザーエクスペリエンスを改善するかをご確認ください。
GPT-4o mini Audioの料金
GPT-4o mini Audioの競争力のある価格設定をご確認ください。さまざまな予算や利用ニーズに対応できるよう設計されています。柔軟なプランにより、使用した分だけお支払いいただけるため、要件の拡大に合わせて簡単にスケールアップできます。GPT-4o mini Audioがコストを管理しながら、お客様のプロジェクトをどのように強化できるかをご覧ください。
コメット価格 (USD / M Tokens)
公式価格 (USD / M Tokens)
割引
入力:$0.12/M
出力:$0.48/M
入力:$0.15/M
出力:$0.6/M
-20%
GPT-4o mini AudioのサンプルコードとAPI
GPT-4o mini Audioの包括的なサンプルコードとAPIリソースにアクセスして、統合プロセスを効率化しましょう。詳細なドキュメントでは段階的なガイダンスを提供し、プロジェクトでGPT-4o mini Audioの潜在能力を最大限に活用できるよう支援します。
GPT-4o mini Audioのバージョン
GPT-4o mini Audioに複数のスナップショットが存在する理由としては、アップデート後の出力変動により旧版スナップショットの一貫性維持が必要な場合、開発者に適応・移行期間を提供するため、グローバル/リージョナルエンドポイントに対応する異なるスナップショットによるユーザー体験最適化などが考えられます。各バージョンの詳細な差異については、公式ドキュメントをご参照ください。