Para peneliti di UC Berkeley dan Georgetown University sangat menyadari hal ini, itulah sebabnya tahun lalu mereka memutuskan untuk melakukannya selidiki dengan tepat seberapa rentannya perangkat lunak pengenalan suara yang mendukung banyak perangkat komputasi kita. Mereka fokus pada Asisten Google, yang aktif di seluruh sistem Android dan dalam aplikasi Google di iOS, serta mengembangkan cara untuk memutarbalikkan perintah suara sehingga Asisten Google dapat memahaminya, namun perintah tersebut tidak dapat dipahami oleh sebagian besar manusia.
Video yang Direkomendasikan
Para peneliti menguji pengenalan beberapa perintah yang dikaburkan, seperti “OK Google,” dan mengukur kemampuan perangkat lunak untuk menguraikan pesan dibandingkan dengan kemampuan manusia. Apa yang mereka temukan, khususnya dalam kasus “OK Google”, adalah bahwa panel peserta hanya mampu untuk mengidentifikasi frasa yang diacak sebanyak 22 persen, namun Asisten memahaminya sebanyak 95 persen waktu. Terlebih lagi, perangkat lunak ini lebih baik dalam memecahkan kode versi yang dikaburkan dibandingkan pengucapan normal “OK Google”, yang menghasilkan tingkat pengenalan hanya 90 persen.
Terkait
- Para ahli memperingatkan asisten AI merugikan perkembangan sosial anak-anak
- Amazon Echo masih menjadi raja di antara speaker pintar meskipun pangsa pasar AS menurun
- Speaker Alexa Anda dapat diretas dengan trek audio berbahaya. Dan laser.
Demo Peretasan Suara
Pada pandangan pertama, banyak dari perintah yang terdistorsi ini mungkin terlihat statis dengan irama ucapan yang tidak jelas, hanya saja dipercepat. Sebagai manusia, ketika kita mengetahui frasa tersebut sebelum kita mendengarnya, akan jauh lebih mudah untuk mengidentifikasinya. Namun tanpa informasi tersebut, dalam banyak kasus, kita menjadi bingung.
Studi ini mencatat bahwa beberapa perintah campur aduk lebih mudah kita pahami dibandingkan yang lain. “Telepon 911”, misalnya, menghasilkan tingkat pengenalan manusia sebesar 94 persen, dibandingkan dengan Google yang hanya 40 persen. Asisten, mungkin karena ini adalah frasa yang sudah dikondisikan oleh sebagian besar penutur bahasa Inggris Amerika mendengar. Namun, kombinasi yang tepat dari perintah khusus diubah secukupnya sehingga asisten pribadi kami dapat menerimanya saat kami sedang bekerja. menggaruk-garuk kepala menimbulkan risiko yang jelas, mengingat kontrol suara di sebagian besar perangkat konsumen tidak memiliki fitur apa pun autentikasi.
Apa yang dapat kami lakukan untuk melindungi diri dari peretasan suara?
Salah satu dari sedikit tindakan pencegahan terhadap manipulasi bertarget suara semacam ini adalah dengan banyak perintah yang meminta asisten untuk meminta konfirmasi setelahnya. Namun, seperti yang ditunjukkan oleh The Atlantic tulisan mereka tentang penelitian ini, itu hanyalah penghalang kecil yang harus diselesaikan dengan jawaban “ya” yang terdistorsi, dan jika semuanya terjadi terlalu cepat bagi pengguna untuk menyadari apa yang sedang terjadi, mereka tidak akan dapat menghentikannya tepat waktu.
Beberapa perintah campur aduk lebih mudah kita pahami dibandingkan yang lain.
Tim menindaklanjuti penemuannya dengan mengusulkan cara-cara layanan seperti Google Assistant, Siri dari Apple, dan Amazon Alexa dapat mencegah serangan-serangan ini, dan ternyata terdapat berbagai metode yang mungkin ingin diterapkan oleh perusahaan. Beberapa pertahanan, seperti CAPTCHA audio, dapat digunakan sebagai konfirmasi akhir untuk membedakan pengguna manusia dari mesin – meskipun para peneliti berpendapat menyadari bahwa algoritme yang mendukung CAPTCHA audio sudah relatif ketinggalan jaman dan belum bisa mengimbangi kemajuan yang dicapai dalam teknologi pengenalan suara. Belum lagi, CAPTCHA sangat menyebalkan untuk ditangani.
Solusi yang lebih rumit adalah menyesuaikan pengenalan dengan suara pemilik, yang sudah banyak digunakan oleh banyak layanan dalam kapasitas terbatas. Namun, laporan tersebut mengakui bahwa proposal tersebut memerlukan pelatihan pada bagian perangkat, dan menimbulkan masalah bagi gadget yang dimaksudkan untuk digunakan oleh banyak orang, seperti Amazon Echo. Tim telah menentukan salah satu pertahanan yang paling praktis dan efektif adalah filter yang sedikit menurunkan kualitas audio kualitas perintah, membuat sebagian besar frasa yang dikaburkan tidak dapat dikenali oleh perangkat sambil membiarkan frasa manusia lewat melalui.
Meskipun laporan serangan berbasis suara semacam ini jarang terjadi, atau bahkan tidak ada sama sekali, hal ini selalu membantu untuk mewaspadai area dimana terdapat kerentanan sehingga dapat diatasi sebelum masalah benar-benar mulai muncul ke atas. Berkat penelitian yang dilakukan di sini, kita akan lebih siap jika ada gelombang bisikan yang terdengar seperti setan yang mulai memberi tahu ponsel pintar kita apa yang harus dilakukan.
Rekomendasi Editor
- Lupakan ChatGPT — Siri dan Asisten Google melakukan 4 hal ini dengan lebih baik
- Siri dan Google Assistant mengatakan mereka sekarang mendukung Black Lives Matter
- Alexa kini bisa lebih menunjukkan emosi saat tim olahraga Anda kalah
- Penelitian baru menemukan bahwa speaker pintar dapat disusupi oleh laser
- Pembaruan privasi baru Google memungkinkan Anda menghapus riwayat perintah suara Asisten
Tingkatkan gaya hidup AndaTren Digital membantu pembaca mengawasi dunia teknologi yang bergerak cepat dengan semua berita terkini, ulasan produk yang menyenangkan, editorial yang berwawasan luas, dan cuplikan unik.