GPT-4o mini Audio

輸入:$0.12/M

輸出:$0.48/M

GPT-4o mini Audio is a multimodal model for speech and text interactions. It performs speech recognition, translation, and text-to-speech, follows instructions, and can call tools for structured actions with streaming responses. Typical uses include real-time voice assistants, live captioning and translation, call summarization, and voice-controlled applications. Technical highlights include audio input and output, streaming responses, function calling, and structured JSON output.

商用

功能亮点

定价

API

版本

GPT-4o mini Audio 的功能

了解 GPT-4o mini Audio 的核心能力，帮助提升性能与可用性，并改善整体体验。

GPT-4o mini Audio 的定价

查看 GPT-4o mini Audio 的竞争性定价，满足不同预算与使用需求，灵活方案确保随需求扩展。

Comet 价格 (USD / M Tokens)	官方定价 (USD / M Tokens)	折扣
輸入:$0.12/M 輸出:$0.48/M	輸入:$0.15/M 輸出:$0.6/M	-20%

GPT-4o mini Audio 的版本

GPT-4o mini Audio 可能存在多个快照，原因包括：更新后保持一致性需要保留旧版、给开发者留出迁移窗口，以及全球/区域端点提供的优化差异。具体差异请参考官方文档。

version
gpt-4o-mini-audio-preview
gpt-4o-mini-audio-preview-2024-12-17

GPT-4o mini Audio

GPT-4o mini Audio 的功能

GPT-4o mini Audio 的定价

GPT-4o mini Audio 的示例代码与 API

GPT-4o mini Audio 的版本

更多模型

GPT-4o mini Audio

GPT-4o mini Audio 的功能

GPT-4o mini Audio 的定价

GPT-4o mini Audio 的示例代码与 API

GPT-4o mini Audio 的版本

更多模型