O4-Mini-Deep-Research của OpenAI thể hiện sự hội tụ của hai đổi mới then chốt: mô hình suy luận o4-mini nhỏ gọn nhưng mạnh mẽ và khung tác tử Deep Research. Ra mắt vào tháng 6 năm 2025, hệ thống lai này cung cấp năng lực nghiên cứu tự động, độ trung thực cao với chi phí và độ trễ chỉ bằng một phần so với các phiên bản đầy đủ. Tận dụng kiến trúc tinh gọn của o4-mini trong tác tử Deep Research, nhà phát triển và nhà nghiên cứu nay có thể thực hiện duyệt web mở rộng, tổng hợp dữ liệu và các quy trình phân tích phức tạp chỉ trong vài phút, thay vì vài ngày.
Tính năng
- Kiến trúc nhẹ: Sử dụng biến thể o4-mini nhỏ gọn để giảm độ trễ và chi phí suy luận.
- Tìm kiếm web tích hợp: Có thể gọi công cụ tìm kiếm trong chính pipeline suy luận, mang lại ngữ cảnh phong phú và luôn cập nhật.
- Truy cập trình thông dịch Python: Hỗ trợ thực thi mã tức thì cho các chứng minh toán học, xử lý dữ liệu và truy vấn tương tác.
- Thiết kế tác tử dạng mô-đun: Giao diện công cụ dạng cắm thêm cho phép tích hợp mượt với truy xuất tùy chỉnh hoặc API bên ngoài, tăng tính linh hoạt.
Chi tiết kỹ thuật
O4-Mini-Deep-Research được xây dựng trên mô hình o4-mini dựa trên transformer, được tinh chỉnh trong một khung tác tử điều phối:
- Phân rã truy vấn: Phân tách các yêu cầu phức tạp thành các tiểu nhiệm vụ.
- Suy luận tăng cường tìm kiếm: Nhúng các bước truy xuất vào chuỗi suy luận, cho phép đối chiếu sự thật theo thời gian thực.
- Vòng lặp tự thẩm định: Triển khai quy trình tự kiểm tra để giảm ảo giác, dù vẫn còn một số sai lệch.
- Gọi trình thông dịch: Tạo động một môi trường chạy Python cách ly cho các phép tính, nâng hiệu suất trên các benchmark như AIME.
Hiệu năng trên benchmark
- AIME 2025: o4-mini đạt 92.7% độ chính xác trên American Invitational Mathematics Examination, vượt o3 ở các bài toán suy luận toán học.
- GPQA Diamond: Đạt 81.4 ở câu hỏi khoa học cấp Tiến sĩ, cho thấy hiệu năng vững chắc trong các lĩnh vực khoa học.
- BrowseComp Agentic Browsing: Đạt 45.6% độ chính xác trong benchmark duyệt web dạng tác tử, so với 51.5% ở chế độ deep research—đánh đổi một phần chiều sâu để lấy tốc độ.
Phiên bản mô hình
OpenAI công bố các định danh mô hình có đóng dấu ngày để đảm bảo khả năng tái lập và kiểm soát phiên bản:
- o4-mini-deep-research-2025-06-26
- Các bản cập nhật sau sẽ theo quy ước
<model>-<YYYY-MM-DD>, cho phép nhà phát triển ghim các bản chụp cụ thể trong môi trường sản xuất.
Hạn chế
- Ràng buộc thời gian chờ: Các truy vấn vượt quá 600 giây sẽ báo lỗi và hoàn lại tín dụng tính toán, nhấn mạnh các vòng nghiên cứu ngắn hơn, lặp dần.
- Đánh đổi giữa độ sâu và tốc độ: Dù tối ưu cho thông lượng, o4-mini-deep-research có thể tạo ra các bản tổng hợp ít toàn diện hơn với truy vấn siêu phức tạp so với bản o3 tương ứng.
- Phụ thuộc vào truy xuất: Chất lượng phụ thuộc vào kết quả tìm kiếm thượng nguồn; nguồn thiếu hoặc bị trả phí có thể ảnh hưởng tới tính đầy đủ.
How to access o4-mini-deep-researc API
Bước 1: Đăng ký khóa API
Đăng nhập vào cometapi.com. Nếu bạn chưa phải là người dùng của chúng tôi, vui lòng đăng ký trước. Đăng nhập vào CometAPI console. Lấy khóa API dùng để truy cập giao diện. Nhấp “Add Token” tại mục API token trong trung tâm cá nhân, lấy khóa token: sk-xxxxx và gửi.

Bước 2: Gửi yêu cầu tới API o4-mini-deep-research
Chọn endpoint “\**o4-mini-deep-research\**” để gửi yêu cầu API và thiết lập phần thân yêu cầu. Phương thức và phần thân yêu cầu được lấy từ tài liệu API trên trang web của chúng tôi. Trang web của chúng tôi cũng cung cấp bài kiểm thử Apifox để bạn thuận tiện. Thay <YOUR_API_KEY> bằng khóa CometAPI thực tế từ tài khoản của bạn.
Chèn câu hỏi hoặc yêu cầu của bạn vào trường content—đây là nội dung mà mô hình sẽ phản hồi. Xử lý phản hồi API để lấy câu trả lời được tạo ra.
Bước 3: Truy xuất và xác minh kết quả
Xử lý phản hồi API để lấy câu trả lời được tạo ra. Sau khi xử lý, API sẽ phản hồi trạng thái tác vụ và dữ liệu đầu ra.