Suara AI sekarang tidak dapat dibedakan dari suara manusia nyata

Sebagian besar dari kita kemungkinan telah berpengalaman kecerdasan buatan (AI) Suara melalui asisten pribadi seperti Siri atau Alexa, dengan intonasi datar dan pengiriman mekanis mereka memberi kami kesan bahwa kami dapat dengan mudah membedakan antara suara yang dihasilkan AI dan orang sungguhan. Tetapi para ilmuwan sekarang mengatakan bahwa pendengar rata -rata tidak bisa lagi membedakan antara orang -orang nyata dan suara “Deepfake”.
Dalam sebuah studi baru yang diterbitkan 24 September di jurnal PLoS satupara peneliti menunjukkan bahwa ketika orang-orang mendengarkan suara manusia-di samping versi yang dihasilkan AI dari suara yang sama-mereka tidak dapat secara akurat mengidentifikasi mana yang nyata dan mana yang palsu.
“Suara yang dihasilkan AI ada di sekitar kita sekarang. Kita semua berbicara dengan Alexa atau Siri, atau panggilan kita diambil oleh sistem layanan pelanggan otomatis,” kata penulis utama studi ini Nadine LavanDosen Senior Psikologi di Queen Mary University of London, dalam sebuah pernyataan. “Hal-hal itu tidak terdengar seperti suara manusia yang nyata, tetapi hanya masalah waktu sampai teknologi AI mulai menghasilkan pidato naturalistik dan terdengar manusia.”
Studi ini menyarankan bahwa, sementara suara-suara generik yang dibuat dari awal tidak dianggap realistis, klon suara yang dilatih pada suara orang sungguhan-audio Deepfake-ditemukan sama bisa dipercaya seperti rekan-rekan kehidupan nyata mereka.
Para ilmuwan memberi peserta studi sampel dari 80 suara yang berbeda (40 suara yang dihasilkan AI dan 40 suara manusia nyata) dan meminta mereka untuk memberi label yang mereka pikir nyata dan dihasilkan AI. Rata-rata, hanya 41% dari suara-suara AI dari goresan yang salah diklasifikasikan sebagai manusia, yang menyarankan masih mungkin, dalam banyak kasus, untuk membedakan mereka dari orang sungguhan.
Namun, karena suara AI yang dikloning dari manusia, mayoritas (58%) salah diklasifikasikan sebagai manusia. Hanya sedikit lebih (62%) dari suara manusia yang diklasifikasikan dengan benar sebagai manusia, membuat para peneliti menyimpulkan bahwa tidak ada perbedaan statistik dalam kapasitas kita untuk memberi tahu suara -suara orang sungguhan selain dari klon Deepfake mereka.
Hasilnya berpotensi Implikasi mendalam untuk etika, hak cipta dan keamananKata Lavan. Jika penjahat menggunakan AI untuk mengkloning suara Anda, menjadi jauh lebih mudah untuk memotong protokol otentikasi suara di bank atau untuk menipu orang yang Anda cintai agar mentransfer uang.
Kami sudah melihat beberapa insiden bermain. Pada 9 Juli, misalnya, Sharon Brightwell ditipu dari $ 15.000. Brightwell mendengarkan apa yang menurutnya putrinya menangis di telepon, mengatakan kepadanya bahwa dia mengalami kecelakaan dan bahwa dia membutuhkan uang untuk perwakilan hukum untuk menjauhkannya dari penjara. “Tidak ada seorang pun yang bisa meyakinkan saya bahwa itu bukan dia,” kata Brightwell tentang fabrikasi AI yang realistis pada saat itu.
Suara -suara AI yang hidup juga dapat digunakan untuk mengarang pernyataan oleh, dan wawancara dengan, politisi atau selebriti. Audio palsu dapat digunakan untuk mendiskreditkan individu atau menghasut kerusuhan, menabur pembagian sosial dan konflik. Con Artists baru -baru ini membangun klon AI dari suara perdana menteri Queensland Steven Milesmenggunakan profilnya untuk mencoba membuat orang berinvestasi dalam penipuan bitcoin, misalnya.
Para peneliti menekankan bahwa klon suara yang mereka gunakan dalam penelitian ini bahkan tidak terlalu canggih. Mereka membuatnya dengan perangkat lunak yang tersedia secara komersial dan melatihnya hanya dengan rekaman pidato manusia selama empat menit.
“Proses ini membutuhkan keahlian minimal, hanya beberapa menit rekaman suara, dan hampir tidak ada uang,” kata Navan dalam pernyataannya. “Itu hanya menunjukkan betapa mudahnya teknologi suara AI yang dapat diakses dan canggih.”
Sementara Deepfakes menghadirkan banyak peluang bagi para aktor yang memfitnah, itu tidak semua berita buruk; Mungkin ada lebih banyak peluang positif yang datang dengan kekuatan untuk menghasilkan suara AI pada skala. “Mungkin ada aplikasi untuk peningkatan aksesibilitas, pendidikan, dan komunikasi, di mana suara sintetis berkualitas tinggi yang dipesan lebih dahulu dapat meningkatkan pengalaman pengguna,” kata Navan.