Baik Gemini 3 Pro (Google/DeepMind) maupun Claude Sonnet 4.5 (Anthropic) adalah model unggulan era 2025 yang dioptimalkan untuk alur kerja agen, berhorizon panjang, dan menggunakan alat — dan keduanya sangat menekankan pengodean. Keunggulan yang diklaim berbeda: Google mengklaim Gemini 3 Pro sebagai penalaran multimodal serbaguna yang juga unggul dalam pengodean agen, sementara Anthropic memposisikan Sonnet 4.5 sebagai yang terbaik. pengkodean/agen model di dunia dengan keberhasilan edit/alat yang sangat kuat dan agen yang berjalan lama.
Jawaban singkatnya: kedua model tersebut merupakan yang terbaik untuk tugas rekayasa perangkat lunak pada akhir tahun 2025. Claude Sonnet 4.5 unggul dalam beberapa metrik bangku rekayasa perangkat lunak murni, sementara Gemini 3 Pro (Pratinjau) Google adalah yang lebih luas, multimodal, agen pusat kekuatan—terutama saat Anda peduli dengan konteks visual, penggunaan alat, pekerjaan konteks panjang, dan alur kerja agen yang mendalam.
Saat ini saya menggunakan kedua model tersebut, dan masing-masing memiliki keunggulan berbeda dalam lingkungan pengembangan. Saya akan membandingkannya di artikel ini.
Gemini 3 Pro hanya tersedia untuk pelanggan Google AI Ultra dan pengguna Gemini API berbayar. Namun, kabar baiknya adalah CometAPI, sebagai platform AI all-in-one, telah mengintegrasikan Gemini 3 Pro, dan Anda dapat mencobanya secara gratis.
Apa itu Pratinjau Gemini 3 Pro dan apa saja fitur utamanya?
Ringkasan
Gemini 3 Pro (tersedia awalnya sebagai gemini-3-pro-preview) adalah LLM "perintis" terbaru Google/DeepMind dalam keluarga Gemini 3. Model ini diposisikan sebagai model multimoda bernalar tinggi yang dioptimalkan untuk alur kerja agen (yaitu, model yang dapat beroperasi dengan penggunaan alat, mengorkestrasi subagen, dan berinteraksi dengan sumber daya eksternal). Model ini menekankan penalaran yang lebih kuat, multimodalitas (gambar, bingkai video, PDF), dan kontrol API eksplisit untuk kedalaman "berpikir" internal.
Poin-poin fitur utama (yang ditujukan kepada pengembang)
- Penggunaan alat agen: pemanggilan fungsi dan alat bawaan (eksekusi kode, landasan web, konteks file & URL, penggunaan terminal/alat).
- Dukungan Berpikir / Rantai Pikiran: “berpikir” primitif untuk perencanaan multi-langkah dan tanda-tanda pemikiran internal untuk membuat penalaran multi-langkah lebih eksplisit.
- Masukan/keluaran multimoda: teks, gambar, audio, video, dan keluaran terstruktur dengan penanganan konteks yang panjang.
- Alat eksekusi kode & integrasi IDE: Alat eksekusi kode yang dihosting dan integrasi ke dalam IDE serta IDE agen Google Antigravity yang baru untuk pengodean otonom kolaboratif. Antigravity saat ini dalam pratinjau publik.
- Kontrol berpikir tinggi/luas (
thinking_levelparameter) sehingga Anda dapat memperdagangkan latensi untuk penalaran internal yang lebih mendalam.highadalah default untuk Gemini 3 Pro. - Kontrol multimodal granular (
media_resolution) untuk menyetel kesetiaan gambar/video vs biaya — berguna saat Anda ingin model membaca teks kecil dalam tangkapan layar atau menganalisis bingkai.
Di mana Gemini 3 Pro bersinar untuk pengkodean
- Pengembangan agen: mengorkestrasi tugas-tugas multi-langkah di seluruh editor/terminal/peramban. Sistem artefak Antigravity + perangkat Gemini menjadikannya sangat baik untuk pekerjaan fitur yang lebih besar dan otomatisasi.
- Kombinasi visual + kode: memperbaiki bug UI dari tangkapan layar, menghasilkan rangkaian pengujian UI, atau mengubah gambar desain menjadi kode karena pemahaman gambar-ke-kode yang kuat.
Apa itu Claude Sonnet 4.5 dan apa saja fitur utamanya?
Claude Sonnet 4.5 adalah rilis Anthropic tahun 2025 yang dipasarkan Anthropic sebagai model terkuatnya untuk pengodean, alur kerja agen, dan "penggunaan komputer" (alat kontrol, peramban, terminal, spreadsheet, dll.). Model ini menekankan peningkatan kemampuan edit, keberhasilan alat, pemikiran yang lebih luas, koherensi agen yang tahan lama (30+ jam eksekusi tugas otonom dalam demonstrasi), dan tingkat kesalahan pengeditan kode yang lebih rendah dibandingkan generasi sebelumnya. Anthropic menyebut Sonnet 4.5 sebagai "model pengodean terbaik" mereka dengan peningkatan besar dalam keandalan pengeditan dan koherensi tugas jangka panjang.
Fitur utama (berhadapan dengan pengembang)
- Akurasi pengkodean yang tinggi pada tolok ukur rekayasa dunia nyata:Anthropic melaporkan skor SWE-bench Verified yang canggih dan mengklaim peningkatan besar dalam rasio kesalahan edit dan keberhasilan agen berbasis alat.
- Peningkatan agen dan penggunaan komputerSonnet 4.5 dirancang untuk menjalankan berbagai alat (bash, penyuntingan berkas, otomatisasi peramban) dan untuk mengorkestrasi subagen melalui Claude Agent SDK. Anthropic menyoroti "30+ jam" kerja multi-langkah yang berkelanjutan dalam evaluasi internal mereka.
- Jendela konteks besar: bawaan 200rb token untuk sebagian besar pelanggan, dengan Konteks 1M-token tersedia dalam versi beta untuk organisasi tingkat lebih tinggi (kemampuan 1 juta yang sama yang ditawarkan Gemini dalam pratinjau).
- Alat eksekusi kode & API file:alat dalam produk dan API memungkinkan eksekusi kode yang aman, pembuatan/pengeditan file, dan putaran uji coba.
Di mana Soneta 4.5 bersinar untuk pengkodean
- Tolok ukur rekayasa perangkat lunak murni dan tugas kode terstruktur (pembuatan pengujian unit, pemfaktoran ulang seluruh repositori) di mana ketelitian algoritmik model dan stabilitas jangka panjang menjadi hal penting.
- CLI yang mengutamakan kode dan alur “asisten kode” seperti Claude Code yang menyediakan integrasi terminal yang ketat dan pemindaian repositori secara langsung.
Tabel Perbandingan Cepat
| Aspek | Gemini 3 Pro (Pratinjau) | Claude Soneta 4.5 |
|---|---|---|
| Model / status rilis | gemini-3-pro-preview — Model perbatasan Google/DeepMind (pratinjau). Dirilis November 2025 (pratinjau). | claude-sonnet-4-5 — Model perbatasan kelas Antropik Soneta (GA / diumumkan 29 September 2025). |
| Penentuan posisi target (pengkodean & agen) | Model perbatasan tujuan umum dengan penekanan pada penalaran + multimoda + alur kerja agen; diposisikan sebagai model pengkodean/agen teratas Google. | Dikhususkan untuk pengkodean, agen jangka panjang, dan penggunaan komputer (Anthropic menyebutnya “terbaik untuk pengkodean & agen kompleks”). |
| Fitur pengembang utama | thinking_level kontrol untuk penalaran internal yang lebih mendalam; integrasi alat Google bawaan (Penelusuran dasar, eksekusi kode, konteks file/URL); varian gambar khusus untuk alur kerja teks+gambar. | SDK Agen, integrasi VS Code (Claude Code), alat eksekusi file & kode, penyempurnaan agen jangka panjang (diuji secara eksplisit untuk pengoperasian multi-jam). Penekanan pada alur kerja edit/jalankan/uji berulang dan checkpointing. |
| Jendela konteks (input / output) | 1,000,000 token masukan / Keluaran token 64k untuk gemini-3-pro-preview | 1,000,000 token masukan / Keluaran token 64k |
| Harga (dasar yang dipublikasikan) | $2 / $12 per 1 juta token (input / output) untuk tingkat <200k; tarif lebih tinggi untuk >200k (tampilkan $4 / $18 untuk >200k). | Baseline yang dipublikasikan secara antropik: $3 / $15 per 1 juta token (masukan / keluaran) untuk Soneta 4.5; |
| Kemampuan multimoda (visi/video/audio) | Dukungan multimodal penuh: teks, gambar, audio, bingkai video dengan parameter resolusi gambar/video yang dapat dikonfigurasi; khusus gemini-3-pro-image-previewPenekanan kuat pada OCR gambar/ekstraksi visual untuk pengkodean UI/tangkapan layar. | Mendukung masukan penglihatan (teks+gambar) dan menggunakan penglihatan untuk mendukung alur kerja pengkodean; penekanan utamanya adalah integrasi agen (menggunakan konteks visual di dalam alur agen daripada paritas pembuatan gambar). |
| Kinerja dan persistensi agen cakrawala panjang | Primitif "Berpikir" untuk penalaran internal multi-langkah yang eksplisit; penalaran/matematika yang kuat & penalaran mendalam multimodal. Baik dalam menguraikan tugas-tugas algoritmik yang kompleks. Terbaik untuk penalaran respons tunggal yang berat + analisis multimodal. | Antropik menekankan koherensi agen cakrawala panjang — Anthropic melaporkan pengujian internal di mana Sonnet 4.5 mempertahankan penggunaan alat multi-langkah yang koheren untuk 30 + jam dan meningkatkan stabilitas agen berkelanjutan dibandingkan model sebelumnya. Cocok untuk otomatisasi persisten dan alur kerja agen bergaya CI. |
| Kualitas keluaran untuk pengkodean (pengeditan, pengujian, keandalan) | Penalaran sekali jalan yang sangat kuat + pembuatan kode; alat bawaan untuk menjalankan kode melalui perkakas Google; nilai tinggi pada tolok ukur algoritmik menurut klaim vendor. Keuntungan praktis ketika alur kerja menggabungkan spesifikasi visual + kode. | Dirancang untuk pengulangan edit→jalankan→uji; Sonnet 4.5 menonjolkan keandalan “patching” yang lebih baik (teknik pengambilan sampel/penilaian penolakan untuk memilih patch yang tangguh) dan perkakas yang mendukung alur kerja pengembang berulang (titik pemeriksaan, pengujian). |
Bagaimana arsitektur dan kemampuan inti mereka dibandingkan?
Arsitektur dan maksud desain (tingkat tinggi)
Gemini 3 Pro: Disajikan sebagai model dasar multimoda dan serbaguna dengan rekayasa eksplisit untuk "berpikir" dan penggunaan alat: desainnya menekankan penalaran mendalam, pemahaman video/audio, dan orkestrasi agen melalui pemanggilan fungsi bawaan dan lingkungan eksekusi kode. Google membingkai Gemini 3 Pro sebagai yang "paling cerdas" dalam keluarga ini, dioptimalkan untuk tugas-tugas yang lebih luas di luar kode (meskipun pengodean agen merupakan prioritas).
Claude Soneta 4.5: Dioptimalkan khusus untuk alur kerja dan kode agen: Antropik menekankan kepatuhan terhadap instruksi, keandalan alat, kemahiran edit/koreksi, dan manajemen status jangka panjang. Fokus rekayasanya adalah meminimalkan pengeditan yang destruktif atau halusinasi dan menciptakan interaksi komputer dunia nyata yang kuat.
Takeaway: Gemini 3 Pro dipromosikan sebagai generalis teratas yang didorong keras pada penalaran multimodal dan integrasi agen; Sonnet 4.5 dipromosikan sebagai spesialis untuk pengkodean dan penggunaan alat agen dengan jaminan suntingan/koreksi yang ditingkatkan.
Perkakas dan integrasi
- Gemini: seperangkat alat Google bawaan yang mencakup pembumian pencarian, pencarian berkas, eksekusi kode, dan parameter gambar/video kelas satu;
thinking_levelParameter untuk mengendalikan tradeoff komputasi/latensi internal. Integrasi mendalam ke infrastruktur Google memudahkan tim yang sudah menggunakan Google Cloud. - Claude: SDK agen yang kuat dan penekanan pada komputasi jangka panjang yang stabil (Sonnet melaporkan koherensi lebih dari 30 jam). Anthropic juga menampilkan eksekusi kode, API file, dan UX pengeditan "checkpoints" baru di Claude Code dan ekstensi VS Code — fitur-fitur yang secara signifikan meningkatkan alur kerja pengkodean iteratif.
Apa yang dikatakan spesifikasi teknis dan tolok ukur?

Tolok ukur sedikit bervariasi tergantung pada evaluator dan konfigurasi (satu kali percobaan vs. beberapa kali percobaan, akses alat, pengaturan berpikir yang diperluas). Berikut adalah analisis data Tolok Ukur kemampuan pengkodean:
SWE-bench Terverifikasi (uji rekayasa perangkat lunak dunia nyata)
Claude Soneta 4.5 (dilaporkan Antropik): 77.2% (anggaran pemikiran 200 ribu; 78.2% dalam konfigurasi 1 juta). Anthropic juga melaporkan skor komputasi tinggi sebesar 82.0% menggunakan percobaan paralel/sampel penolakan.
Gemini 3 Pro (pelaporan DeepMind / papan peringkat terkait): ~ 76.2% satu kali percobaan di SWE-bench (tabel vendor). Papan peringkat publik bervariasi (perdagangan Gemini dan Sonnet memiliki margin yang sempit).
Tugas Terminal-Bench & Agentik
Gemini 3 Pro: Jumlah bangku terminal/agen (tabel vendor) menunjukkan kinerja yang kuat (misalnya, Terminal-Bench 54.2% dalam tabel vendor), kompetitif dengan kekuatan agen Sonnet.
Soneta 4.5: unggul dalam orkestrasi alat agen (Anthropic melaporkan peningkatan substansial pada tolok ukur gaya OSWorld dan Terminal dan menyoroti kinerja tugas berkelanjutan yang lebih lama).
Takeaway: kedua model tersebut adalah sangat dekat pada tolok ukur pemahaman dan pembuatan kode modern; Sonnet 4.5 sedikit lebih unggul pada beberapa rangkaian verifikasi rekayasa perangkat lunak (angka yang dipublikasikan Anthropic), sementara Gemini 3 Pro sangat kompetitif dan sering memimpin pada papan peringkat multimoda dan beberapa papan peringkat bergaya kompetisi pengkodean. Selalu validasi dengan konfigurasi evaluasi yang tepat (akses alat, ukuran konteks, anggaran berpikir), karena hal-hal tersebut sangat memengaruhi skor.
Bagaimana kemampuan multimodanya dibandingkan?
Penanganan visi & gambar
- Gemini 3 Pro: kontrol multimodal berbutir halus dengan gambar/video
media_resolution(anggaran token rendah/sedang/tinggi per gambar/bingkai), pembuatan/pengeditan gambar (model pratinjau gambar terpisah), dan panduan eksplisit untuk OCR/detail visual. Hal ini menjadikan Gemini sangat andal ketika tugas pengkodean mengharuskan pembacaan tangkapan layar, mockup UI, atau bingkai video. - Claude Soneta 4.5: mendukung multimodalitas teks+gambar dan integrasi produk Anthropic (aplikasi Claude) memaparkan alur kerja visual; fokus dalam Sonnet 4.5 adalah mengintegrasikan konteks visual ke dalam alur kerja agen daripada paritas sintesis gambar mentah.
Ketika multimodalitas penting untuk pengkodean
Jika alur kerja Anda sangat bergantung pada Tangkapan layar UI, spesifikasi desain dalam gambar, atau panduan video yang harus dianalisis model untuk menghasilkan atau memodifikasi kode, kontrol resolusi gambar khusus Gemini dan varian pembangkitan gambar dapat menjadi keuntungan praktis. Jika alur kerja Anda otomatisasi yang digerakkan oleh agen (mengklik-klik, menjalankan perintah, mengedit berkas di berbagai alat), SDK agen Claude dan perkakas eksekusi kode adalah yang kelas satu.
Penalaran tingkat lanjut & perencanaan jangka panjang — mana yang lebih baik?
Soneta 4.5: ketahanan dan keselarasan
Soneta 4.5 dapat mempertahankan pekerjaan yang koheren untuk lebih dari 30 jam di seluruh tugas multi-tahap yang kompleks (perencanaan, riset, penyusunan litigasi, tugas kode yang berjalan lama). Ketahanan ini, ditambah penekanan pada penyelarasan Anthropic, menjadikan Sonnet pilihan yang menarik untuk otomatisasi menyeluruh di mana model harus melacak tujuan dan mempertahankan perilaku aman.
Gemini 3 Pro: penalaran mendalam + orkestrasi agen
Gemini 3 Pro memperkenalkan varian "Deep Think" dan API pemikiran internal yang lebih kaya untuk perencanaan multi-langkah, yang dipadukan dengan IDE agen Google. Dalam praktiknya, ini berarti Gemini dapat rencana dan menjalankan langkah-langkah agen di seluruh alat (editor, shell, web). Jika otomatisasi Anda memerlukan akses alat eksternal dengan pembuatan artefak, perkakas agen terintegrasi Gemini (Antigravitasi) merupakan nilai tambah yang kuat. Catatan: Deep Think mengorbankan latensi demi kedalaman.
Perbandingan Perencanaan Horizon Panjang: Vending-Bench 2
Dalam uji simulasi "Vending-Bench 2", Gemini 3 mengungguli Claude 4.5 dengan menjalankan perusahaan virtual selama setahun penuh dan tetap menguntungkan. Dalam uji jangka pendek, data Gemini 3 Pro dan Claude 4 Sonnet serupa, tetapi perbedaannya semakin nyata selama periode pengujian yang lebih lama.

Perbedaan praktis
- Untuk tugas penalaran tinggi satu kali (debugging algoritmik kompleks, bukti logis mendalam tertanam dalam kode), Gemini
thinking_leveldan Deep Think menjanjikan kedalaman respons tunggal yang lebih besar. - Untuk otomatisasi jangka panjang yang digerakkan oleh alat (agen persisten yang menjalankan banyak perintah, menulis pengujian, mengulangi, dan mengelola status), fokus cakrawala panjang Claude Sonnet 4.5 dan SDK agen merupakan pembeda yang kuat.
Bagaimana perbandingan akses dan harga API untuk penggunaan pengembang?
Gemini 3 Pro (Google) — akses dan harga
- Akses: Pratinjau Gemini 3 Pro tersedia melalui Google AI Studio dan Vertex AI (model garden). SDK mencakup google-genai untuk Python/JS/Go/dll., ditambah lapisan OpenAI-compat untuk migrasi yang lebih mudah, dengan titik akhir REST dan alat pemanggil fungsi/eksekusi kode. Antigravity menyediakan permukaan IDE yang menggunakan Gemini 3 Pro dalam pratinjau.
- Harga: Pratinjau harga yang tercantum di Google docs: $2 / $12 per 1 juta token (input / output) untuk tingkat <200k; tarif lebih tinggi untuk >200k (contoh dalam dokumen menunjukkan $4 / $18 untuk >200k).
Claude Sonnet 4.5 — akses dan harga
- API & SDK:Anthropic menyediakan API Claude, SDK Agen Claude untuk membangun alur kerja agen, API file, dan alat eksekusi kode (ekstensi VS Code asli, penyempurnaan Claude Code, dan fitur “titik pemeriksaan”).
- Harga: 200k token jendela konteks default, 1 juta token konteks dalam versi beta untuk perusahaan; harga $3 / $15 per 1 juta token (masukan/keluaran masing-masing)
Sebagai pengembang, Anda harus memilih model berdasarkan kebutuhan dan karakteristiknya, bukan hanya yang termurah. Jika tugas tersebut dapat ditangani oleh dua model, putuskan berdasarkan konteksnya.
Jika Anda ingin menggunakan dua model secara bersamaan, saya sarankan API Komet, yang menyediakan keduanya Pratinjau API Gemini 3 Pro dan Claude Soneta 4.5 API, dan dihargai 20% dari harga resmi.
| Pratinjau Gemini 3 Pro | GPT-5.1 | |
| Token Masukan | $1.60 | $2.4.00 |
| Token Keluaran | $9.60 | $12.00 |
Pesan terakhir
Gemini 3 Pro (Pratinjau) dan Claude Sonnet 4.5 keduanya state-of-the-art Pilihan untuk asisten pengkodean di akhir tahun 2025. Sonnet 4.5 mengungguli Gemini dalam tolok ukur verifikasi rekayasa perangkat lunak spesifik dan ketahanan pada tugas jangka panjang, sementara Gemini 3 Pro menghadirkan pemahaman multimodal yang lebih kuat dan perkakas agen yang mendalam yang dapat dijalankan di lingkungan editor/terminal/browser. Pilihan yang tepat bergantung pada apakah kebutuhan utama Anda adalah penalaran dan verifikasi kode murni (Soneta), atau pengembangan multimoda, agen, dan peningkatan alat (Gemini). Untuk penerapan tingkat perusahaan, banyak tim akan lebih memilih pendekatan hibrida, menggunakan model mana pun yang paling kuat untuk tahap tertentu dalam alur kerja pengembangan.
Pengembang dapat mengakses Pratinjau API Gemini 3 Pro dan Claude Soneta 4.5 API melalui CometAPI. Untuk memulai, jelajahi kemampuan modelAPI Komet dalam tempat bermain dan lihat panduan API untuk instruksi detail. Sebelum mengakses, pastikan Anda telah masuk ke CometAPI dan mendapatkan kunci API. cometAPI menawarkan harga yang jauh lebih rendah dari harga resmi untuk membantu Anda berintegrasi.
Siap untuk berangkat?→ Uji coba gratis model Gemini 3 pro dan Claude 4.5 Sonnet !
Jika Anda ingin mengetahui lebih banyak tips, panduan, dan berita tentang AI, ikuti kami di VK, X dan Discord!
