O O4-Mini-Deep-Research da OpenAI representa a convergência de duas inovações centrais: o modelo de raciocínio compacto porém potente o4-mini e o framework agentic Deep Research. Lançado em junho de 2025, esse sistema híbrido oferece capacidades de pesquisa autônoma e de alta fidelidade a uma fração do custo e da latência de seus equivalentes em tamanho completo. Ao aproveitar a arquitetura enxuta do o4-mini dentro do agente Deep Research, desenvolvedores e pesquisadores podem agora executar navegação estendida na web, síntese de dados e fluxos de trabalho de análise complexa em minutos, em vez de dias.
Recursos
- Arquitetura leve: Utiliza a variante compacta o4-mini para reduzir latência e custo de inferência.
- Busca na Web Integrada: Capaz de invocar ferramentas de busca dentro de seu pipeline de raciocínio, fornecendo contexto mais rico e atualizado.
- Acesso ao Interpretador Python: Suporte à execução de código sob demanda para provas matemáticas, processamento de dados e consultas interativas.
- Design de Agente Modular: Interfaces de ferramentas plugáveis permitem integração contínua com retrieval personalizado ou APIs externas, aumentando a flexibilidade.
Detalhes Técnicos
O O4-Mini-Deep-Research baseia-se no modelo transformer-based o4-mini, ajustado sob um framework agentic que orquestra:
- Decomposição de Consultas: Divide prompts complexos em subtarefas.
- Raciocínio com Busca Auxiliada: Incorpora etapas de recuperação à sua cadeia de raciocínio, permitindo fundamentação de fatos em tempo real.
- Loops de Auto-Validação: Implementa rotinas de autoverificação para reduzir alucinação, embora possam persistir algumas imprecisões.
- Invocação do Interpretador: Inicializa dinamicamente um runtime Python em sandbox para cálculos, elevando seu desempenho em benchmarks como AIME.
Desempenho em Benchmarks
- AIME 2025: o4-mini atingiu 92,7% de acurácia no American Invitational Mathematics Examination, superando o o3 em tarefas de raciocínio matemático.
- GPQA Diamond: Obteve 81,4 em questões de ciências em nível de Ph.D., demonstrando desempenho robusto em domínios científicos.
- BrowseComp Agentic Browsing: Entregou 45,6% de acurácia em benchmarks de navegação agentic, comparado a 51,5% no modo de deep research — sacrificando alguma profundidade por velocidade.
Versionamento do Modelo
A OpenAI publica identificadores de modelo com carimbo de data para garantir reprodutibilidade e controle de versão:
- o4-mini-deep-research-2025-06-26
- Atualizações futuras seguirão a convenção
<model>-<YYYY-MM-DD>, permitindo que desenvolvedores fixem instantâneos específicos em produção.
Limitações
- Restrições de tempo limite: Consultas que excedam 600 segundos irão retornar erro e reembolsar créditos de computação, incentivando ciclos de pesquisa mais curtos e iterativos.
- Trade-off entre profundidade e velocidade: Embora otimizado para throughput, o o4-mini-deep-research pode produzir sínteses menos exaustivas em consultas ultra complexas em comparação com seu equivalente o3.
- Dependência de recuperação: A qualidade depende dos resultados de busca a montante; fontes ausentes ou pagas podem afetar a integridade.
Como acessar a API o4-mini-deep-research
Etapa 1: Cadastre-se para obter a chave de API
Faça login em cometapi.com. Se você ainda não é nosso usuário, registre-se primeiro. Acesse seu CometAPI console. Obtenha a chave de API de acesso da interface. Clique em “Add Token” no token de API no centro pessoal, obtenha a chave do token: sk-xxxxx e envie.

Etapa 2: Envie solicitações para a API o4-mini-deep-research
Selecione o endpoint “\**o4-mini-deep-research\**” para enviar a solicitação de API e defina o corpo da requisição. O método e o corpo da requisição são obtidos na nossa documentação de API no site. Nosso site também disponibiliza testes no Apifox para sua conveniência. Substitua <YOUR_API_KEY> pela sua chave real da CometAPI na sua conta.
Insira sua pergunta ou solicitação no campo content — é isso que o modelo irá responder. Processe a resposta da API para obter a resposta gerada.
Etapa 3: Recupere e verifique os resultados
Processe a resposta da API para obter a resposta gerada. Após o processamento, a API responde com o status da tarefa e os dados de saída.