AI baru MIT dapat mengajar dirinya sendiri untuk mengendalikan robot dengan mengawasi dunia melalui mata mereka – hanya membutuhkan satu kamera

Ilmuwan di MIT telah mengembangkan novel berbasis visi kecerdasan buatan (AI) Sistem yang dapat mengajari dirinya sendiri cara mengendalikan hampir semua robot tanpa menggunakan sensor atau pretraining.
Sistem ini mengumpulkan data tentang arsitektur robot yang diberikan menggunakan kamera, dengan cara yang sama seperti manusia menggunakan mata mereka untuk belajar tentang diri mereka sendiri saat mereka bergerak.
Hal ini memungkinkan pengontrol AI untuk mengembangkan model belajar mandiri untuk mengoperasikan robot apa pun-pada dasarnya memberikan mesin kesadaran diri fisik seperti manusia.
Para peneliti mencapai terobosan ini dengan membuat paradigma kontrol baru yang menggunakan kamera untuk memetakan aliran video “Visuomotor Jacobian Field,” penggambaran poin 3D yang terlihat dari mesin, ke aktuator robot.
Model AI kemudian dapat memprediksi gerakan motorik presisi. Hal ini memungkinkan untuk mengubah arsitektur robot non-tradisional, seperti robotika lunak dan yang dirancang dengan bahan yang fleksibel, menjadi unit otonom dengan hanya beberapa jam pelatihan.
“Pikirkan tentang bagaimana Anda belajar mengendalikan jari Anda: Anda menggoyangkan, Anda mengamati, Anda beradaptasi,” jelas Sizhe Lester Liseorang mahasiswa PhD di MIT CSail dan memimpin peneliti pada proyek, di a siaran pers. “Itulah yang dilakukan sistem kami. Ia bereksperimen dengan tindakan acak dan mencari tahu yang mengontrol bagian mana dari robot.”
Solusi robotika khas bergantung pada rekayasa presisi untuk membuat mesin untuk spesifikasi yang tepat yang dapat dikontrol menggunakan sistem pra-terlatih. Ini dapat membutuhkan sensor yang mahal dan model AI yang dikembangkan dengan ratusan atau ribuan jam penyempurnaan untuk mengantisipasi setiap permutasi gerakan yang mungkin. Objek mencengkeram dengan pelengkap seperti tangan, misalnya, tetap menjadi tantangan yang sulit Di arena rekayasa mesin dan kontrol sistem AI.
Memahami dunia di sekitar Anda
Menggunakan solusi kamera pemetaan “Jacobian Field”, sebaliknya, memberikan solusi berbiaya rendah dan kesetiaan tinggi untuk tantangan mengotomatisasi sistem robot.
Tim menerbitkan temuannya 25 Juni di jurnal Alam. Di dalamnya, mereka mengatakan pekerjaan itu dirancang untuk meniru metode otak manusia untuk belajar mengendalikan mesin.
Kemampuan kami untuk belajar dan merekonstruksi konfigurasi 3D dan memprediksi gerakan sebagai fungsi kontrol berasal dari penglihatan saja. Menurut koran, “Orang dapat belajar untuk memilih dan menempatkan benda dalam beberapa menit” saat mengendalikan robot dengan pengontrol video game, dan “satu -satunya sensor yang kita butuhkan adalah mata kita.”
Kerangka kerja sistem dikembangkan menggunakan dua hingga tiga jam video multi-view dari robot yang mengeksekusi perintah yang dihasilkan secara acak yang ditangkap oleh 12 kamera video RGB-D kelas konsumen.
Kerangka kerja ini terdiri dari dua komponen utama. Yang pertama adalah model pembelajaran dalam yang pada dasarnya memungkinkan robot untuk menentukan di mana dan pelengkapnya berada dalam ruang 3 dimensi. Ini memungkinkannya untuk memprediksi bagaimana posisinya akan berubah karena perintah gerakan tertentu dieksekusi. Yang kedua adalah program pembelajaran mesin yang menerjemahkan perintah gerakan generik ke dalam kode yang dapat dipahami dan dijalankan robot.
Tim menguji paradigma pelatihan dan kontrol baru dengan membandingkan efektivitasnya terhadap metode kontrol berbasis kamera tradisional. Solusi Jacobian Field melampaui sistem kontrol 2D yang ada dalam akurasi – terutama ketika tim memperkenalkan oklusi visual yang menyebabkan metode yang lebih lama memasuki keadaan gagal. Mesin yang menggunakan metode tim, bagaimanapun, berhasil membuat peta 3D yang dapat dilayari bahkan ketika adegan sebagian tersumbat dengan kekacauan acak.
Setelah para ilmuwan mengembangkan kerangka kerja, itu kemudian diterapkan pada berbagai robot dengan arsitektur yang sangat bervariasi. Hasil akhirnya adalah program kontrol yang tidak memerlukan intervensi manusia lebih lanjut untuk melatih dan mengoperasikan robot hanya menggunakan satu kamera video.