Google membuat data dunia nyata lebih mudah diakses oleh AI-dan jalur pipa pelatihan akan menyukainya

Google mengubah trove data publik yang luas menjadi tambang emas untuk AI dengan debut Data Commons Model Context Protocol (MCP) Server-memungkinkan pengembang, ilmuwan data, dan agen AI untuk mengakses statistik dunia nyata menggunakan bahasa alami dan sistem AI yang lebih baik.
Diluncurkan pada tahun 2018, Google's Data Commons menyelenggarakan kumpulan data publik dari a Rangkaian sumbertermasuk survei pemerintah, data administrasi lokal, dan statistik dari badan global seperti PBB. Dengan rilis server MCP, data ini sekarang dapat diakses melalui bahasa alami, memungkinkan pengembang untuk mengintegrasikannya ke dalam agen atau aplikasi AI.
Sistem AI sering dilatih pada data web yang bising dan tidak diverifikasi. Dikombinasikan dengan mereka kecenderungan untuk “mengisi kekosongan” Saat sumber kurang, ini mengarah ke halusinasi. Akibatnya, perusahaan yang ingin menyempurnakan sistem AI untuk kasus penggunaan tertentu sering kali memerlukan akses ke set data besar berkualitas tinggi. Dengan merilis server MCP secara terbuka untuk datanya, Google bertujuan untuk menangani kedua tantangan.
Server MCP baru Data Commons menjembatani kumpulan data publik – dari angka sensus hingga statistik iklim – dengan sistem AI yang semakin bergantung pada konteks yang akurat dan terstruktur. Dengan membuat data ini dapat diakses melalui petunjuk bahasa alami, rilis ini bertujuan untuk membumikan AI dalam informasi dunia nyata yang dapat diverifikasi.
“Protokol konteks model memungkinkan kami menggunakan kecerdasan model bahasa besar untuk memilih data yang tepat pada waktu yang tepat, tanpa harus memahami bagaimana kami memodelkan data, bagaimana API kami bekerja,” kata Google Data Commons, Prem Ramaswami dalam sebuah wawancara.
Pertama diperkenalkan oleh antropik November laluMCP adalah standar industri terbuka yang memungkinkan sistem AI untuk mengakses data dari berbagai sumber, termasuk alat bisnis, repositori konten, dan lingkungan pengembangan aplikasi, menyediakan kerangka kerja umum untuk memahami permintaan kontekstual. Sejak diluncurkan, perusahaan seperti Openai, MicrosoftDan Google telah mengadopsi standar untuk mengintegrasikan model AI mereka dengan berbagai sumber data.
Sementara perusahaan teknologi lain mengeksplorasi cara menerapkan standar pada model AI mereka, Ramaswami dan timnya di Google mulai menyelidiki bagaimana kerangka kerja dapat digunakan untuk membuat platform data Commons lebih mudah diakses awal tahun ini.
Acara TechCrunch
San Francisco
|
27-29 Oktober 2025
Google juga telah bermitra dengan kampanye One, sebuah organisasi nirlaba yang berfokus pada peningkatan peluang ekonomi dan kesehatan masyarakat di Afrika, untuk meluncurkan satu agen data. Alat AI ini menggunakan server MCP untuk memunculkan puluhan juta titik data keuangan dan kesehatan dalam bahasa yang sederhana.
Kampanye One mendekati tim Google Data Commons dengan implementasi prototipe MCP di server khususnya sendiri. Interaksi itu, Ramaswami mengatakan kepada TechCrunch, adalah titik balik yang membuat tim membangun server MCP khusus pada bulan Mei.
Namun, pengalaman itu tidak terbatas pada satu kampanye. Sifat terbuka dari Data Commons MCP Server membuatnya kompatibel dengan LLM apa pun, dan Google telah menyediakan beberapa cara bagi pengembang untuk memulai. Agen sampel tersedia melalui Kit Pengembangan Agen (ADK) di a Colab Notebookdan server juga dapat diakses secara langsung melalui Gemini Cli atau klien yang kompatibel dengan MCP menggunakan Paket PYPI. Kode contoh juga disediakan pada a Repositori GitHub.