OpenAI’s O4-Mini-Deep-Research représente la convergence de deux innovations clés : le modèle de raisonnement o4-mini, compact mais puissant, et le cadre agentique Deep Research. Lancé en juin 2025, ce système hybride offre des capacités de recherche autonomes et haute-fidélité pour une fraction du coût et de la latence de ses homologues de grande taille. En tirant parti de l’architecture épurée d’o4-mini au sein de l’agent Deep Research, les développeurs et chercheurs peuvent désormais exécuter des explorations web étendues, des synthèses de données et des workflows d’analyse complexe en minutes, plutôt qu’en jours.
Fonctionnalités
- Architecture légère : utilise la variante o4-mini compacte pour réduire la latence et le coût d’inférence.
- Recherche Web intégrée : capable d’invoquer des outils de recherche au sein de sa chaîne de raisonnement, fournissant un contexte plus riche et à jour.
- Accès à l’interpréteur Python : prend en charge l’exécution de code à la volée pour des démonstrations mathématiques, le traitement de données et des requêtes interactives.
- Conception d’agent modulaire : des interfaces d’outils enfichables permettent une intégration transparente avec une récupération personnalisée ou des API externes, améliorant la flexibilité.
Détails techniques
O4-Mini-Deep-Research s’appuie sur le modèle basé sur l’architecture Transformer o4-mini, affiné dans un cadre agentique qui orchestre :
- Décomposition des requêtes : segmente les requêtes complexes en sous-tâches.
- Raisonnement enrichi par la recherche : intègre des étapes de récupération dans sa chaîne de pensée, permettant un ancrage factuel en temps réel.
- Boucles d’auto-validation : met en œuvre des routines d’auto-vérification pour réduire les hallucinations, bien que certaines inexactitudes persistent.
- Invocation de l’interpréteur : lance dynamiquement un environnement Python isolé (sandbox) pour les calculs, améliorant ses performances sur des benchmarks comme AIME.
Performances de référence
- AIME 2025 : o4-mini a atteint 92.7% de précision sur l’American Invitational Mathematics Examination, surpassant o3 sur les tâches de raisonnement mathématique.
- GPQA Diamond : a obtenu 81.4 sur des questions de niveau doctorat en sciences, démontrant de solides performances dans les domaines scientifiques.
- BrowseComp Agentic Browsing : a délivré 45.6% de précision sur des benchmarks de navigation agentique, contre 51.5% pour le mode deep research — sacrifiant une partie de la profondeur au profit de la vitesse.
Versionnage du modèle
OpenAI publie des identifiants de modèle horodatés pour garantir la reproductibilité et le contrôle de version :
- o4-mini-deep-research-2025-06-26
- Les mises à jour futures suivront la convention
<model>-<YYYY-MM-DD>, permettant aux développeurs de figer des instantanés spécifiques en production.
Limitations
- Contraintes de délai d’expiration : les requêtes dépassant 600 secondes vont échouer et rembourser les crédits de calcul, privilégiant des cycles de recherche plus courts et itératifs.
- Compromis profondeur vs vitesse : bien qu’optimisé pour le débit, o4-mini-deep-research peut produire des synthèses moins exhaustives sur des requêtes ultra-complexes comparé à son homologue o3.
- Dépendance à la récupération : la qualité dépend des résultats de recherche en amont ; des sources manquantes ou payantes peuvent affecter l’exhaustivité.
Comment accéder à l’API o4-mini-deep-research
Étape 1 : Inscrivez-vous pour obtenir une clé API
Connectez-vous à cometapi.com. Si vous n’êtes pas encore utilisateur, veuillez d’abord vous inscrire. Connectez-vous à votre CometAPI console. Récupérez la clé API d’identification de l’interface. Cliquez sur « Add Token » dans la section API token de votre centre personnel, obtenez la clé de jeton : sk-xxxxx et validez.

Étape 2 : Envoyez des requêtes à l’API o4-mini-deep-research
Sélectionnez le point de terminaison “\**o4-mini-deep-research\**” pour envoyer la requête API et définissez le corps de la requête. La méthode et le corps de la requête sont disponibles dans la documentation API de notre site. Notre site propose également un test Apifox pour votre commodité. Remplacez <YOUR_API_KEY> par votre clé CometAPI réelle provenant de votre compte.
Insérez votre question ou demande dans le champ content — c’est à cela que le modèle répondra. Traitez la réponse de l’API pour obtenir la réponse générée.
Étape 3 : Récupérer et vérifier les résultats
Traitez la réponse de l’API pour obtenir la réponse générée. Après traitement, l’API répond avec l’état de la tâche et les données de sortie.