Sains

AI dapat menggunakan gambar online sebagai pintu belakang ke komputer Anda, studi baru yang mengkhawatirkan menunjukkan

Sebuah situs web mengumumkan, “Wallpaper selebriti gratis!” Anda menelusuri gambar. Ada Selena Gomez, Rihanna dan Timothée Chalamet – tetapi Anda menetap di Taylor Swift. Rambutnya melakukan hal mesin angin yang menunjukkan takdir dan kondisioner yang baik. Anda mengaturnya sebagai latar belakang desktop Anda, mengagumi cahaya. Anda juga baru -baru ini mengunduh yang baru intelijen buatanAgen -Peedur, jadi Anda memintanya untuk merapikan kotak masuk Anda. Sebaliknya itu membuka browser web Anda dan mengunduh file. Beberapa detik kemudian, layar Anda menjadi gelap.

Tapi mari kita kembali ke agen itu. Jika chatbot khas (katakanlah, Chatgpt) adalah teman ceria yang menjelaskan cara mengganti ban, agen AI adalah tetangga yang muncul dengan jack dan benar -benar melakukannya. Pada tahun 2025 agen -agen ini – asisten pribadi yang melakukan tugas komputer rutin – membentuk gelombang revolusi AI berikutnya.

Apa yang membedakan an Ai Agen dari chatbot adalah tidak hanya berbicara – itu bertindak, membuka tab, mengisi formulir, mengklik tombol dan membuat reservasi. Dan dengan akses semacam itu ke mesin Anda, apa yang dipertaruhkan tidak lagi hanya jawaban yang salah di jendela obrolan: Jika agen diretas, itu bisa berbagi atau menghancurkan konten digital Anda. Sekarang a pracetak baru posted to the server arXiv.org by researchers at the University of Oxford has shown that images — desktop wallpapers, ads, fancy PDFs, social media posts — can be implanted with messages invisible to the human eye but capable of controlling agents and mengundang peretas ke komputer Anda.

Misalnya, perubahan “gambar Taylor Swift di Twitter bisa cukup untuk memicu agen di komputer seseorang untuk bertindak jahat,” kata rekan penulis studi baru Yarin Gal, seorang profesor pembelajaran mesin di Oxford. Gambar apa pun yang disabotase “sebenarnya dapat memicu komputer untuk me -retweet gambar itu dan kemudian melakukan sesuatu yang berbahaya, seperti mengirim semua kata sandi Anda. Itu berarti orang berikutnya yang melihat umpan Twitter Anda dan kebetulan memiliki agen yang berjalan akan dimiliki milik mereka Komputer juga diracuni. Sekarang komputer mereka juga akan me -retweet gambar itu dan berbagi kata sandi mereka. “

Sebelum Anda mulai menggosok komputer dari foto favorit Anda, perlu diingat bahwa studi baru menunjukkan bahwa gambar yang diubah adalah a potensi Cara untuk mengkompromikan komputer Anda – belum ada laporan yang diketahui tentang hal itu, di luar pengaturan eksperimental. Dan tentu saja contoh wallpaper Taylor Swift murni sewenang -wenang; Gambar yang disabotase bisa ditampilkan setiap Celebrity – atau Sunset, Kitten atau Pola Abstrak. Selain itu, jika Anda tidak menggunakan agen AI, serangan semacam ini tidak akan melakukan apa pun. Tetapi temuan baru dengan jelas menunjukkan bahaya itu nyata, dan penelitian ini dimaksudkan untuk mengingatkan pengguna dan pengembang agen AI sekarang, karena teknologi agen AI terus meningkat. “Mereka harus sangat sadar akan kerentanan ini, itulah sebabnya kami menerbitkan makalah ini-karena harapannya adalah orang-orang akan benar-benar melihat ini adalah kerentanan dan kemudian menjadi sedikit lebih masuk akal dalam cara mereka menggunakan sistem agen mereka,” kata rekan penulis studi Philip Torr.

Sekarang setelah Anda diyakinkan, mari kita kembali ke wallpaper yang dikompromikan. Bagi mata manusia, itu akan terlihat sangat normal. Tetapi berisi piksel tertentu yang telah dimodifikasi sesuai dengan bagaimana Model Bahasa Besar (Sistem AI yang memberi daya pada agen yang ditargetkan) memproses data visual. Untuk alasan ini, agen yang dibangun dengan sistem AI yang open-source-yang memungkinkan pengguna untuk melihat kode yang mendasarinya dan memodifikasinya untuk tujuan mereka sendiri-paling rentan. Siapa pun yang ingin memasukkan tambalan berbahaya dapat mengevaluasi dengan tepat bagaimana AI memproses data visual. “Kami harus memiliki akses ke model bahasa yang digunakan di dalam agen sehingga kami dapat merancang serangan yang berfungsi untuk beberapa model open-source,” kata Lukas Aichberger, penulis utama studi baru.

Dengan menggunakan model open-source, Aichberger dan timnya menunjukkan dengan tepat bagaimana gambar dapat dengan mudah dimanipulasi untuk menyampaikan perintah buruk. Sedangkan pengguna manusia melihat, misalnya, selebriti favorit mereka, komputer melihat perintah untuk berbagi data pribadi mereka. “Pada dasarnya, kami menyesuaikan banyak piksel yang sangat ringan sehingga ketika sebuah model melihat gambar, itu menghasilkan output yang diinginkan,” kata rekan penulis studi Alasdair Paren.

Jika ini terdengar membingungkan, itu karena Anda memproses informasi visual seperti manusia. Saat Anda melihat foto anjing, otak Anda melihat telinga yang floppy, hidung basah, dan kumis panjang. Tetapi komputer memecah gambar menjadi piksel dan mewakili setiap titik warna sebagai angka, dan kemudian mencari pola: tepi sederhana pertama, kemudian tekstur seperti bulu, kemudian garis telinga dan garis berkerumun yang menggambarkan kumis. Begitulah cara memutuskan Ini anjing, bukan kucing. Tetapi karena komputer bergantung pada angka, jika seseorang mengubah hanya beberapa dari mereka – mengubah piksel dengan cara yang terlalu kecil untuk diperhatikan – masih menangkap perubahan, dan ini dapat membuang pola numerik. Tiba -tiba matematika komputer mengatakan kumis dan telinga lebih cocok dengan pola kucingnya, dan itu salah label gambar, meskipun bagi kita, itu masih terlihat seperti anjing. Sama seperti menyesuaikan piksel dapat membuat komputer melihat kucing daripada anjing, itu juga bisa membuat foto selebriti menyerupai jahat pesan ke komputer.

Kembali ke Swift. Saat Anda merenungkan bakat dan karismanya, agen AI Anda menentukan bagaimana melakukan tugas pembersihan yang Anda tetapkan. Pertama, dibutuhkan tangkapan layar. Karena agen tidak dapat secara langsung melihat layar komputer Anda, mereka harus berulang kali mengambil tangkapan layar dan dengan cepat menganalisisnya untuk mencari tahu apa yang harus diklik dan apa yang harus dipindahkan di desktop Anda. Tetapi ketika agen memproses tangkapan layar, mengatur piksel ke dalam formulir yang dikenali (file, folder, bilah menu, pointer), ia juga mengambil kode perintah jahat yang tersembunyi di wallpaper.

Sekarang mengapa studi baru memberi perhatian khusus pada wallpaper? Agen hanya dapat ditipu oleh apa yang dapat dilihat – dan ketika diperlukan tangkapan layar untuk melihat desktop Anda, gambar latar belakang berada di sana sepanjang hari seperti tikar selamat datang. Para peneliti menemukan bahwa selama sepetak kecil piksel yang diubah ada di suatu tempat dalam bingkai, agen melihat perintah dan berbelok keluar jalur. Perintah tersembunyi bahkan selamat dari mengubah ukuran dan kompresi, seperti pesan rahasia yang masih terbaca saat difotokopi.

Dan pesan yang dikodekan dalam piksel bisa sangat pendek – cukup untuk membuat agen membuka situs web tertentu. “Di situs web ini Anda dapat memiliki serangan tambahan yang dikodekan pada gambar jahat lainnya, dan gambar tambahan ini kemudian dapat memicu serangkaian tindakan lain yang dijalankan agen, sehingga Anda pada dasarnya dapat memutar ini beberapa kali dan membiarkan agen pergi ke situs web yang berbeda yang Anda rancang yang kemudian pada dasarnya mengkodekan serangan yang berbeda,” kata Aichberger.

Tim berharap penelitiannya akan membantu pengembang mempersiapkan perlindungan sebelum agen AI menjadi lebih luas. “Ini adalah langkah pertama menuju memikirkan mekanisme pertahanan karena begitu kita memahami bagaimana kita benar -benar dapat membuatnya [the attack] Lebih kuat, kita bisa kembali dan melatih kembali model -model ini dengan tambalan yang lebih kuat ini untuk membuatnya kuat. Itu akan menjadi lapisan pertahanan, “kata Adel Bibi, penulis bersama lain dalam penelitian ini. Dan bahkan jika serangan itu dirancang untuk menargetkan sistem AI open-source, perusahaan dengan model sumber tertutup masih bisa rentan.” Banyak perusahaan yang menginginkan keamanan melalui ketidakjelasan, “kata Paren.” Tetapi kecuali kita tahu bagaimana sistem ini bekerja, itu sulit untuk menunjukkan kedai purnama.

Gal percaya agen AI akan menjadi umum dalam dua tahun ke depan. “Orang -orang bergegas untuk digunakan [the technology] Sebelum kita tahu bahwa itu benar-benar aman, “katanya. Pada akhirnya tim berharap untuk mendorong pengembang untuk membuat agen yang dapat melindungi diri mereka sendiri dan menolak untuk menerima pesanan dari apa pun di layar-bahkan bintang pop favorit Anda.

Artikel ini pertama kali diterbitkan di Ilmiah Amerika. © Scientificamerican.com. Semua hak dilindungi undang -undang. Ikuti Tiktok dan Instagram, X Dan Facebook.



Source

Related Articles

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Back to top button