Home/Models/OpenAI/GPT-4o mini Audio
O

GPT-4o mini Audio

輸入:$0.12/M
輸出:$0.48/M
GPT-4o mini Audio is a multimodal model for speech and text interactions. It performs speech recognition, translation, and text-to-speech, follows instructions, and can call tools for structured actions with streaming responses. Typical uses include real-time voice assistants, live captioning and translation, call summarization, and voice-controlled applications. Technical highlights include audio input and output, streaming responses, function calling, and structured JSON output.
商用
功能亮点
定价
API
版本

GPT-4o mini Audio 的功能

了解 GPT-4o mini Audio 的核心能力,帮助提升性能与可用性,并改善整体体验。

GPT-4o mini Audio 的定价

查看 GPT-4o mini Audio 的竞争性定价,满足不同预算与使用需求,灵活方案确保随需求扩展。
Comet 价格 (USD / M Tokens)官方定价 (USD / M Tokens)折扣
輸入:$0.12/M
輸出:$0.48/M
輸入:$0.15/M
輸出:$0.6/M
-20%

GPT-4o mini Audio 的示例代码与 API

获取完整示例代码与 API 资源,简化 GPT-4o mini Audio 的集成流程,我们提供逐步指导,助你发挥模型潜能。

GPT-4o mini Audio 的版本

GPT-4o mini Audio 可能存在多个快照,原因包括:更新后保持一致性需要保留旧版、给开发者留出迁移窗口,以及全球/区域端点提供的优化差异。具体差异请参考官方文档。
version
gpt-4o-mini-audio-preview
gpt-4o-mini-audio-preview-2024-12-17

更多模型