L’O4-Mini-Deep-Research di OpenAI rappresenta la convergenza di due innovazioni fondamentali: il modello di ragionamento o4-mini, compatto ma potente, e il framework agentico Deep Research. Lanciato a giugno 2025, questo sistema ibrido offre capacità di ricerca autonome e ad alta fedeltà a una frazione dei costi e della latenza dei corrispettivi a piena scala. Sfruttando l’architettura snella di o4-mini all’interno dell’agente Deep Research, sviluppatori e ricercatori possono ora eseguire navigazione web estesa, sintesi dei dati e flussi di lavoro di analisi complessi in minuti, anziché giorni.
Caratteristiche
- Architettura leggera: Utilizza la variante compatta o4-mini per ridurre latenza e costi d’inferenza.
- Ricerca web integrata: In grado di richiamare strumenti di ricerca all’interno della propria pipeline di ragionamento, offrendo contesto più ricco e aggiornato.
- Accesso all’interprete Python: Supporta l’esecuzione di codice al volo per dimostrazioni matematiche, elaborazione dati e interrogazioni interattive.
- Progettazione modulare dell’agente: Interfacce di strumenti componibili consentono l’integrazione con recupero personalizzato o API esterne, aumentando la flessibilità.
Dettagli tecnici
O4-Mini-Deep-Research si basa sul modello o4-mini di tipo transformer-based, perfezionato in un quadro agentico che orchestra:
- Decomposizione della query: Suddivide prompt complessi in sotto-attività.
- Ragionamento potenziato dalla ricerca: Integra passaggi di recupero nella propria catena di ragionamento, abilitando un ancoraggio fattuale in tempo reale.
- Cicli di auto-validazione: Implementa routine di auto-verifica per ridurre le allucinazioni, sebbene possano persistere alcune imprecisioni.
- Invocazione dell’interprete: Avvia dinamicamente un runtime Python in sandbox per i calcoli, migliorando le prestazioni in benchmark come AIME.
Prestazioni nei benchmark
- AIME 2025: o4-mini ha raggiunto 92.7% di accuratezza all’American Invitational Mathematics Examination, superando o3 nei compiti di ragionamento matematico.
- GPQA Diamond: Ha totalizzato 81.4 su domande di scienze a livello Ph.D., dimostrando prestazioni solide nei domini scientifici.
- BrowseComp Agentic Browsing: Ha ottenuto 45.6% di accuratezza nei benchmark di navigazione agentica, rispetto al 51.5% della modalità deep research—sacrificando parte della profondità a favore della velocità.
Versionamento del modello
OpenAI pubblica identificatori di modello con data per garantire riproducibilità e controllo di versione:
- o4-mini-deep-research-2025-06-26
- Gli aggiornamenti futuri seguiranno la convenzione
<model>-<YYYY-MM-DD>, consentendo agli sviluppatori di fissare specifici snapshot in produzione.
Limitazioni
- Vincoli di timeout: Le richieste che superano 600 secondi genereranno un errore e rimborseranno i crediti di calcolo, favorendo cicli di ricerca più brevi e iterativi.
- Compromesso profondità vs. velocità: Pur ottimizzato per la throughput, o4-mini-deep-research può produrre sintesi meno esaustive su query ultra-complesse rispetto alla sua controparte o3.
- Dipendenza dal recupero: La qualità dipende dai risultati di ricerca a monte; fonti mancanti o dietro paywall possono ridurre la completezza.
Come accedere all’API o4-mini-deep-research
Passaggio 1: Registrati per la chiave API
Accedi a cometapi.com. Se non sei ancora nostro utente, registrati prima. Accedi alla tua console CometAPI. Ottieni la chiave API di credenziali di accesso dell’interfaccia. Fai clic su “Add Token” nella sezione API token dell’area personale, ottieni la chiave del token: sk-xxxxx e invia.

Passaggio 2: Invia richieste all’API o4-mini-deep-research
Seleziona l’endpoint “\**o4-mini-deep-research\**” per inviare la richiesta API e imposta il body della richiesta. Il metodo della richiesta e il body sono disponibili nella documentazione API del nostro sito. Il nostro sito fornisce anche test Apifox per tua comodità. Sostituisci <YOUR_API_KEY> con la tua chiave CometAPI effettiva del tuo account.
Inserisci la tua domanda o richiesta nel campo content—è a questo che il modello risponderà. Elabora la risposta dell’API per ottenere l’output generato.
Passaggio 3: Recupera e verifica i risultati
Elabora la risposta dell’API per ottenere l’output generato. Dopo l’elaborazione, l’API risponde con lo stato dell’attività e i dati di output.