OpenAI の O4-Mini-Deep-Research は、コンパクトでありながら高性能な o4-mini 推論モデルと、エージェント型の Deep Research フレームワークという2つの重要なイノベーションの融合を体現します。2025年6月にローンチされた本ハイブリッドシステムは、フルサイズの同系モデルに比べてコストとレイテンシーを大幅に抑えつつ、自律的で高忠実なリサーチ機能を提供します。Deep Research エージェント内で o4-mini のスリム化されたアーキテクチャを活用することで、開発者や研究者は拡張的なウェブ閲覧、データ統合、複雑な分析ワークフローを、日単位ではなく数分で実行できるようになりました。

機能

軽量アーキテクチャ：レイテンシーと推論コストを抑えるため、コンパクトな o4-mini バリアントを採用。
統合型ウェブ検索：推論パイプラインの内部で検索ツールを呼び出せるため、よりリッチで最新のコンテキストを取得可能。
Python インタープリタへのアクセス：数学的証明、データ処理、対話的クエリのためのオンザフライなコード実行をサポート。
モジュール式エージェント設計：プラガブルなツールインターフェースにより、カスタム検索や外部 APIとのシームレスな統合が可能となり、柔軟性が向上。

技術詳細

O4-Mini-Deep-Research は、トランスフォーマーベースの o4-mini モデルを基盤に、以下をオーケストレーションするエージェント型フレームワークの下でファインチューニングされています。

クエリ分解：複雑なプロンプトをサブタスクに分割。
検索拡張推論：思考連鎖にリトリーバル手順を組み込み、リアルタイムの事実根拠付けを可能にします。
自己検証ループ：自己チェックルーチンを実装して幻覚を低減。ただし一部の不正確さは残存。
インタープリタ呼び出し：計算のためにサンドボックス化された Python ランタイムを動的に起動し、AIME のようなベンチマークでの性能を向上。

ベンチマーク性能

AIME 2025：o4-mini は American Invitational Mathematics Examination において92.7%の正答率を達成し、数学的推論タスクで o3 を上回りました。
GPQA Diamond：博士課程レベルの科学問題で81.4を記録し、科学分野での堅牢な性能を示しました。
BrowseComp Agentic Browsing：エージェント型ブラウジングのベンチマークで45.6%の正答率。Deep Research モードの**51.5%**と比べると、速度と引き換えに一部の深さを犠牲にしています。

モデルのバージョニング

OpenAI は再現性とバージョン管理を確保するため、日付付きのモデル識別子を公開しています。

o4-mini-deep-research-2025-06-26
今後の更新は <model>-<YYYY-MM-DD> の規約に従い、開発者は本番環境で特定のスナップショットをピン留めできるようになります。

制限事項

タイムアウト制約：600秒を超えるクエリはエラーとなり、計算クレジットが返金されます。短く反復的なリサーチサイクルを推奨。
深さと速度のトレードオフ：スループットに最適化されている一方で、o4-mini-deep-research は極めて複雑なクエリに対して、同系統の o3 と比べて網羅性がやや低い合成結果となる場合があります。
リトリーバルへの依存：品質は上流の検索結果に依存します。欠落やペイウォールのある情報源は完全性に影響し得ます。

o4-mini-deep-researc API へのアクセス方法

ステップ 1: API キーの取得

cometapi.com にログインしてください。未登録の場合は、まず登録を行ってください。CometAPI コンソールにサインインします。インターフェースのアクセス認証 API キーを取得します。個人センターの API トークンで「Add Token」をクリックし、トークンキー sk-xxxxx を取得して送信します。

ステップ 2: `o4-mini-deep-research` API にリクエストを送信

API リクエストを送信するために “\**o4-mini-deep-research\**” エンドポイントを選択し、リクエストボディを設定します。リクエストメソッドとリクエストボディは当社サイトの API ドキュメントから取得できます。利便性のため、当社サイトでは Apifox テストも提供しています。<YOUR_API_KEY> をアカウントの実際の CometAPI キーに置き換えてください。

content フィールドに質問またはリクエストを入力します—モデルはその内容に応答します。API レスポンスを処理して生成された回答を取得します。

ステップ 3: 結果の取得と検証

API レスポンスを処理して生成された回答を取得します。処理後、API はタスクのステータスと出力データを返します。

機能

軽量アーキテクチャ：レイテンシーと推論コストを抑えるため、コンパクトな o4-mini バリアントを採用。
統合型ウェブ検索：推論パイプラインの内部で検索ツールを呼び出せるため、よりリッチで最新のコンテキストを取得可能。
Python インタープリタへのアクセス：数学的証明、データ処理、対話的クエリのためのオンザフライなコード実行をサポート。
モジュール式エージェント設計：プラガブルなツールインターフェースにより、カスタム検索や外部 APIとのシームレスな統合が可能となり、柔軟性が向上。

技術詳細

クエリ分解：複雑なプロンプトをサブタスクに分割。
検索拡張推論：思考連鎖にリトリーバル手順を組み込み、リアルタイムの事実根拠付けを可能にします。
自己検証ループ：自己チェックルーチンを実装して幻覚を低減。ただし一部の不正確さは残存。
インタープリタ呼び出し：計算のためにサンドボックス化された Python ランタイムを動的に起動し、AIME のようなベンチマークでの性能を向上。

ベンチマーク性能

AIME 2025：o4-mini は American Invitational Mathematics Examination において92.7%の正答率を達成し、数学的推論タスクで o3 を上回りました。
GPQA Diamond：博士課程レベルの科学問題で81.4を記録し、科学分野での堅牢な性能を示しました。
BrowseComp Agentic Browsing：エージェント型ブラウジングのベンチマークで45.6%の正答率。Deep Research モードの**51.5%**と比べると、速度と引き換えに一部の深さを犠牲にしています。

モデルのバージョニング

OpenAI は再現性とバージョン管理を確保するため、日付付きのモデル識別子を公開しています。

o4-mini-deep-research-2025-06-26
今後の更新は <model>-<YYYY-MM-DD> の規約に従い、開発者は本番環境で特定のスナップショットをピン留めできるようになります。

制限事項

タイムアウト制約：600秒を超えるクエリはエラーとなり、計算クレジットが返金されます。短く反復的なリサーチサイクルを推奨。
深さと速度のトレードオフ：スループットに最適化されている一方で、o4-mini-deep-research は極めて複雑なクエリに対して、同系統の o3 と比べて網羅性がやや低い合成結果となる場合があります。
リトリーバルへの依存：品質は上流の検索結果に依存します。欠落やペイウォールのある情報源は完全性に影響し得ます。

o4-mini-deep-researc API へのアクセス方法

ステップ 1: API キーの取得

ステップ 2: `o4-mini-deep-research` API にリクエストを送信

content フィールドに質問またはリクエストを入力します—モデルはその内容に応答します。API レスポンスを処理して生成された回答を取得します。

ステップ 3: 結果の取得と検証

API レスポンスを処理して生成された回答を取得します。処理後、API はタスクのステータスと出力データを返します。

o4-mini-deep-research

機能

技術詳細

ベンチマーク性能

モデルのバージョニング

制限事項

o4-mini-deep-researc API へのアクセス方法

ステップ 1: API キーの取得

ステップ 2: `o4-mini-deep-research` API にリクエストを送信

ステップ 3: 結果の取得と検証