DeepMind mengungkapkan Genie 3, model dunia yang bisa menjadi kunci untuk mencapai AGI

Edward Gunawan Agustus 5, 2025

0 3 minutes read

DeepMind mengungkapkan Genie 3, model dunia yang bisa menjadi kunci untuk mencapai AGI

Google DeepMind telah mengungkapkan Genie 3, model dunia fondasi terbarunya yang menurut laboratorium AI menyajikan batu loncatan yang penting di jalan menuju kecerdasan umum buatan, atau kecerdasan seperti manusia.

“Genie 3 adalah model dunia tujuan umum interaktif real-time pertama,” Shlomi Fruchter, seorang direktur penelitian di DeepMind, mengatakan saat briefing pers. “Ini melampaui model dunia sempit yang ada sebelumnya. Ini tidak spesifik untuk lingkungan tertentu. Ini dapat menghasilkan dunia-realistis dan imajiner, dan segala sesuatu di antaranya.”

Genie 3, yang masih dalam pratinjau penelitian dan tidak tersedia untuk umum, dibangun di kedua pendahulunya Genie 2 – yang dapat menghasilkan lingkungan baru untuk agen – dan model pembuatan video terbaru DeepMind Saya melihat 3 – yang menunjukkan pemahaman fisika yang mendalam.

Kredit gambar:Google DeepMind

Dengan prompt teks sederhana, Genie 3 dapat menghasilkan beberapa menit – naik dari 10 hingga 20 detik di Genie 2 – dari lingkungan 3D yang beragam, interaktif, pada 24 frame per detik dengan resolusi 720p. Model ini juga menampilkan “acara dunia yang cepat,” atau kemampuan untuk menggunakan prompt untuk mengubah dunia yang dihasilkan.

Mungkin yang paling penting, simulasi Genie 3 tetap konsisten secara fisik dari waktu ke waktu karena model tersebut dapat mengingat apa yang sebelumnya dihasilkan – kemampuan yang muncul yang tidak secara eksplisit oleh para peneliti secara eksplisit menjadi model.

Fruchter mengatakan bahwa sementara Genie 3 jelas memiliki implikasi untuk pengalaman pendidikan dan media generatif baru seperti bermain game Atau membuat prototipe konsep kreatif, pembuka kunci yang sebenarnya akan bermanifestasi dalam agen pelatihan untuk tugas -tugas tujuan umum, yang katanya penting untuk mencapai AGI.

“Kami pikir model dunia adalah kunci di jalan menuju AGI, khususnya untuk agen yang diwujudkan, di mana mensimulasikan skenario dunia nyata sangat menantang,” Jack Parker-Holder, seorang ilmuwan riset tentang tim terbuka Deepmind, mengatakan saat pengarahan.

Acara TechCrunch

San Francisco
|
27-29 Oktober 2025

Genie 3 dirancang untuk menyelesaikan bottleneck itu. Seperti Veo, itu tidak bergantung pada mesin fisika yang dikodekan. Sebaliknya, itu mengajarkan dirinya bagaimana dunia bekerja – bagaimana objek bergerak, jatuh, dan berinteraksi – dengan mengingat apa yang telah dihasilkan dan penalaran dalam cakrawala waktu yang lama.

“Model ini bersifat otomatis, yang berarti menghasilkan satu bingkai pada satu waktu,” kata Fruchter kepada TechCrunch dalam wawancara terpisah. “Itu harus melihat kembali apa yang dihasilkan sebelumnya untuk memutuskan apa yang akan terjadi selanjutnya. Itu adalah bagian penting dari arsitektur.”

Memori itu menciptakan konsistensi di dunia yang disimulasikan, dan konsistensi itu memungkinkannya untuk mengembangkan semacam pemahaman fisika yang intuitif, mirip dengan bagaimana manusia memahami bahwa kaca yang terhuyung -huyung di tepi meja akan jatuh, atau bahwa mereka harus merunduk untuk menghindari objek yang jatuh.

Kemampuan untuk mensimulasikan lingkungan yang koheren dan masuk akal secara fisik dari waktu ke waktu membuat Genie 3 lebih dari sekadar model generatif. Ini menjadi tempat pelatihan yang ideal untuk agen tujuan umum. Tidak hanya dapat menghasilkan dunia yang tak ada habisnya dan beragam untuk dijelajahi, tetapi juga memiliki potensi untuk mendorong agen ke batas mereka – memaksa mereka untuk beradaptasi, berjuang, dan belajar dari pengalaman mereka sendiri dengan cara yang mencerminkan bagaimana manusia belajar di dunia nyata.

Saat ini, kisaran tindakan yang dapat diambil oleh agen masih terbatas. Misalnya, peristiwa dunia yang cepat memungkinkan berbagai intervensi lingkungan, tetapi mereka tidak harus dilakukan oleh agen itu sendiri. Demikian pula, masih sulit untuk secara akurat memodelkan interaksi kompleks antara beberapa agen independen di lingkungan bersama. Genie 3 juga hanya dapat mendukung beberapa menit interaksi berkelanjutan, ketika jam akan diperlukan untuk pelatihan yang tepat.

Namun, Genie 3 menyajikan langkah yang meyakinkan dalam agen pengajaran untuk melampaui bereaksi terhadap input sehingga mereka dapat merencanakan, mengeksplorasi, mencari ketidakpastian, dan meningkatkan melalui coba-coba-jenis pembelajaran yang didorong oleh diri sendiri, yang diwujudkan yang merupakan kunci dalam bergerak menuju kecerdasan umum.

“Kami belum benar-benar memiliki momen 37 untuk agen yang diwujudkan, di mana mereka benar-benar dapat mengambil tindakan baru di dunia nyata,” kata Parker-Holder, merujuk pada momen legendaris dalam permainan tahun 2016 Go antara agen AI Deepmind Alphago dan World Champion Sedol, di mana Alpha Go memainkan pemahaman yang tidak konvensional dan cemerlang yang menjadi lambang dari AI yang melimpah pada kemampuan AI yang melampaui kemampuan AI yang melampaui kemampuan AI yang tidak konvensional.

“Tapi sekarang, kita berpotensi mengantarkan era baru,” katanya.

Source

Edward Gunawan Agustus 5, 2025

0 3 minutes read