O4-Mini-Deep-Research dari OpenAI mewakili konvergensi dua inovasi penting: model penalaran o4-mini yang ringkas namun bertenaga dan kerangka kerja Deep Research yang bersifat agentic. Diluncurkan pada Juni 2025, sistem hibrida ini menghadirkan kapabilitas riset otonom dengan fidelitas tinggi pada sebagian kecil biaya dan latensi dibandingkan padanan berukuran penuh. Dengan memanfaatkan arsitektur o4-mini yang ramping di dalam agen Deep Research, pengembang dan peneliti kini dapat menjalankan penjelajahan web yang diperluas, sintesis data, dan alur kerja analisis kompleks dalam hitungan menit, alih-alih hari.
Fitur
- Arsitektur Ringan: Memanfaatkan varian o4-mini yang ringkas untuk menurunkan latensi dan biaya inferensi.
- Pencarian Web Terintegrasi: Mampu memanggil alat pencarian di dalam pipeline penalarannya, menghasilkan konteks yang lebih kaya dan mutakhir.
- Akses Interpreter Python: Mendukung eksekusi kode secara langsung untuk pembuktian matematis, pemrosesan data, dan kueri interaktif.
- Desain Agen Modular: Antarmuka alat yang dapat dipasang memungkinkan integrasi mulus dengan custom retrieval atau API eksternal, meningkatkan fleksibilitas.
Detail Teknis
O4-Mini-Deep-Research dibangun di atas model o4-mini yang berbasis transformer, yang di-fine-tune dalam kerangka kerja agentic yang mengorkestrasi:
- Dekomposisi Kueri: Memecah prompt kompleks menjadi sub-tugas.
- Penalaran Berbantuan Pencarian: Menyisipkan langkah-langkah retrieval ke dalam chain-of-thought-nya, memungkinkan pelandasan fakta secara real-time.
- Loop Validasi Mandiri: Menerapkan rutin pemeriksaan mandiri untuk mengurangi halusinasi, meski beberapa ketidakakuratan tetap ada.
- Pemanggilan Interpreter: Secara dinamis menyalakan runtime Python yang di-sandbox untuk komputasi, meningkatkan performa pada benchmark seperti AIME.
Performa Benchmark
- AIME 2025: o4-mini mencapai akurasi 92.7% pada American Invitational Mathematics Examination, melampaui o3 pada tugas penalaran matematika.
- GPQA Diamond: Meraih skor 81.4 pada pertanyaan sains setingkat Ph.D., menunjukkan performa yang kuat di domain ilmiah.
- BrowseComp Agentic Browsing: Memberikan akurasi 45.6% pada benchmark penjelajahan agentic, dibanding 51.5% untuk mode deep research—menukar sebagian kedalaman untuk kecepatan.
Versi Model
OpenAI menerbitkan pengenal model bertanggal untuk memastikan reprodusibilitas dan kontrol versi:
- o4-mini-deep-research-2025-06-26
- Pembaruan selanjutnya akan mengikuti konvensi
<model>-<YYYY-MM-DD>, memungkinkan pengembang untuk mengunci snapshot tertentu di produksi.
Keterbatasan
- Batas Waktu: Kueri yang melebihi 600 detik akan gagal dan mengembalikan kredit komputasi, mendorong siklus riset yang lebih pendek dan iteratif.
- Pertukaran Kedalaman vs. Kecepatan: Meski dioptimalkan untuk throughput, o4-mini-deep-research dapat menghasilkan sintesis yang kurang menyeluruh pada kueri yang sangat kompleks dibanding padanannya, o3.
- Ketergantungan pada Retrieval: Kualitas bergantung pada hasil pencarian hulu; sumber yang hilang atau berada di balik paywall dapat memengaruhi kelengkapan.
Cara mengakses API o4-mini-deep-researc
Langkah 1: Daftar untuk Kunci API
Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, silakan daftar terlebih dahulu. Masuk ke konsol CometAPI. Dapatkan kunci API kredensial akses untuk antarmuka. Klik “Add Token” pada token API di pusat pribadi, dapatkan kunci token: sk-xxxxx dan kirim.

Langkah 2: Kirim Permintaan ke API o4-mini-deep-research
Pilih endpoint “\**o4-mini-deep-research\**” untuk mengirim permintaan API dan atur body permintaan. Metode dan body permintaan diperoleh dari dokumen API di situs kami. Situs kami juga menyediakan pengujian Apifox untuk kenyamanan Anda. Ganti <YOUR_API_KEY> dengan kunci CometAPI Anda yang sebenarnya dari akun Anda.
Masukkan pertanyaan atau permintaan Anda ke bidang konten—itulah yang akan direspons oleh model. Proses respons API untuk mendapatkan jawaban yang dihasilkan.
Langkah 3: Ambil dan Verifikasi Hasil
Proses respons API untuk mendapatkan jawaban yang dihasilkan. Setelah diproses, API merespons dengan status tugas dan data keluaran.