Google Rolls Out Gemini Deep Think Ai, model penalaran yang menguji banyak ide secara paralel

Google DeepMind meluncurkan Gemini 2.5 Think Deepyang menurut perusahaan, adalah model penalaran AI paling canggih, mampu menjawab pertanyaan dengan mengeksplorasi dan mempertimbangkan beberapa ide secara bersamaan dan kemudian menggunakan output tersebut untuk memilih jawaban terbaik.
Pelanggan Google $ 250 per bulan Ultra Langganan akan mendapatkan akses ke Gemini 2.5 Think Deep in the Gemini Aplikasi mulai Jumat.
Pertama kali diluncurkan pada bulan Mei di Google I/O 2025, Gemini 2.5 Deep Think adalah model multi-agen Google yang tersedia untuk umum. Sistem ini memunculkan banyak agen AI untuk menangani pertanyaan secara paralel, suatu proses yang menggunakan sumber daya komputasi yang secara signifikan lebih banyak daripada agen tunggal, tetapi cenderung menghasilkan jawaban yang lebih baik.
Google menggunakan variasi pemikiran Gemini 2.5 Skor medali emas di Olimpiade Matematika Internasional tahun ini (IMO).
Bersamaan dengan pemikiran mendalam Gemini 2.5, perusahaan mengatakan sedang merilis model yang digunakannya di IMO untuk sekelompok matematikawan dan akademisi tertentu. Google mengatakan model AI ini “membutuhkan waktu berjam-jam,” alih-alih detik atau menit seperti kebanyakan model AI yang dihadapi konsumen. Perusahaan berharap model IMO akan meningkatkan upaya penelitian, dan bertujuan untuk mendapatkan umpan balik tentang cara meningkatkan sistem multi-agen untuk kasus penggunaan akademik.
Google mencatat bahwa model Deep Think Gemini 2.5 adalah peningkatan yang signifikan atas apa yang diumumkannya di I/O. Perusahaan juga mengklaim telah mengembangkan “teknik pembelajaran penguatan baru” untuk mendorong pemikiran Gemini 2.5 dalam memanfaatkan jalur penalarannya dengan lebih baik.
“Deep Think dapat membantu orang mengatasi masalah yang membutuhkan kreativitas, perencanaan strategis dan membuat perbaikan langkah demi langkah,” kata Google dalam posting blog yang dibagikan dengan TechCrunch.
Acara TechCrunch
San Francisco
|
27-29 Oktober 2025
Perusahaan mengatakan Gemini 2.5 Think Deep Think mencapai kinerja canggih pada Ujian Terakhir Kemanusiaan (HLE)-tes yang menantang mengukur kemampuan AI untuk menjawab ribuan pertanyaan crowdsourced di seluruh matematika, humaniora, dan sains. Google mengklaim modelnya mencetak 34,8%pada HLE (tanpa alat), dibandingkan dengan Xai's Grok 4, yang mencetak 25,4%, dan Openai's O3, yang mencetak 20,3%.
Google juga mengatakan Gemini 2.5 Think Think mengungguli model AI dari OpenAI, XAI, dan Anthropic di LiveCodebench6, tes yang menantang dari tugas pengkodean kompetitif. Model Google mencetak 87,6%, sedangkan Grok 4 mencetak 79%, dan O3 Openai mencetak 72%.
Gemini 2.5 Pikiran dalam secara otomatis bekerja dengan alat -alat seperti eksekusi kode dan pencarian Google, dan perusahaan mengatakan mereka mampu menghasilkan “tanggapan yang lebih lama” daripada model AI tradisional.
Dalam pengujian Google, model ini menghasilkan tugas pengembangan web yang lebih rinci dan menyenangkan secara estetika dibandingkan dengan model AI lainnya. Perusahaan mengklaim model ini dapat membantu para peneliti dan “berpotensi mempercepat jalan menuju penemuan.”

Tampaknya beberapa laboratorium AI terkemuka berkumpul di sekitar pendekatan multi-agen.
Xai Elon Musk baru-baru ini merilis sistem multi-agen sendiri, Grok 4 beratyang dikatakan mampu mencapai kinerja industri terkemuka di beberapa tolok ukur. Peneliti Openai Noam Brown mengatakan pada a siniar Bahwa model AI yang belum dirilis yang digunakan perusahaan untuk mencapai medali emas di Olimpiade Matematika Internasional (IMO) tahun ini juga merupakan sistem multi-agen. Sementara itu, Agen penelitian Anthropicyang menghasilkan brief penelitian menyeluruh, juga ditenagai oleh sistem multi-agen.
Terlepas dari kinerja yang kuat, tampaknya sistem multi-agen bahkan lebih mahal untuk melayani daripada model AI tradisional. Itu berarti perusahaan teknologi dapat menjaga agar sistem ini tetap terjaga keamanannya di balik rencana langganan mereka yang paling mahal, yang harus dipilih oleh XAI dan sekarang Google.
Dalam beberapa minggu mendatang, Google mengatakan berencana untuk berbagi pemikiran mendalam Gemini 2.5 dengan sekelompok penguji tertentu melalui API Gemini. Perusahaan mengatakan ingin lebih memahami bagaimana pengembang dan perusahaan dapat menggunakan sistem multi-agennya.