LipNet: Menurut Anda seberapa mudahkah membaca bibir?
Mengetahui bahwa HAL terus-menerus mendengarkan apa yang mereka katakan, mereka mundur ke suatu tempat yang mereka tahu HAL tidak dapat mendengarkan dan setuju untuk memutuskan sambungannya. HAL menggagalkan rencana mereka setelah kedua astronot tersebut gagal memperhitungkannya Kemampuan membaca bibir AI yang unggul.
Hal-hal yang futuristik, ya? Tidak menurut penelitian yang dilakukan peneliti di Universitas Oxford. Mereka telah mengembangkan program kecerdasan buatan yang disebut LipNet, yang mampu menafsirkan secara akurat apa yang dikatakan orang, hanya berdasarkan cara mereka menggerakkan mulut saat berbicara.
Terkait
- Photoshop AI menganggap 'kebahagiaan' adalah senyuman dengan gigi busuk
- Saya menyampaikan ide startup konyol saya kepada robot VC
- Bagaimana kita tahu kapan AI benar-benar menjadi makhluk hidup?
“LipNet melakukan pembacaan bibir pada tingkat kalimat menggunakan pembelajaran mesin,” Brendan Shillingford, salah satu peneliti di kertas, kepada Digital Trends. “Jaringan saraf yang mirip dengan model pengenalan suara canggih memproses rangkaian bingkai video, memetakannya menjadi sebuah kalimat. Pendekatan sebelumnya bekerja dengan memprediksi kata-kata individual, bukan kalimat.”
Video yang Direkomendasikan
Kinerja LipNet sangat unggul jika dibandingkan dengan pakar pembaca bibir manusia di GRID corpus, kumpulan data pembaca bibir tingkat kalimat terbesar yang tersedia untuk umum. Faktanya, ketika pakar manusia hanya mendapat 52 persen, LipNet mendapat 93 persen. Pendekatan berbasis kalimat untuk membaca bibir juga mengalahkan upaya terbaik sebelumnya yang dilakukan mesin, yang berhasil mencapai akurasi 79,6 persen pada kumpulan data yang sama.
Namun, meskipun HAL 9000 fiktif menggunakan kekuatan membaca bibirnya untuk hal yang tidak berguna, tim di balik LipNet memiliki tujuan lain dalam pembuatannya. Sekitar 360 juta orang di seluruh dunia mengalami gangguan pendengaran. Alat seperti LipNet bisa menjadi sangat penting bagi orang-orang ini, dengan membantu menafsirkan ucapan secara akurat sehingga membuat hidup mereka lebih mudah.
“Aplikasi lain yang kami minati termasuk dikte diam-diam di ruang publik, percakapan rahasia, pengenalan suara di lingkungan yang bising, identifikasi biometrik, dan pemrosesan film senyap,” Shillingford lanjutan.
Meskipun pengawasan akan menjadi masalah pada teknologi apa pun seperti ini, Nando de Freitas, yang juga mengerjakan proyek tersebut, mengatakan bahwa ini bukanlah aplikasi yang mereka fokuskan. Namun, dia mengatakan “tidak mengherankan” jika laboratorium lain mencoba mengembangkan pekerjaan serupa untuk tujuan tersebut di masa depan.
“Masyarakat harus menyadari hal ini, dan bergantung pada lembaga hukum demokrasi kita untuk menetapkan undang-undang yang tepat yang melindungi privasi dan martabat kita,” lanjut de Freitas. “Harapan kami adalah dengan menerbitkan karya ini, kami dapat membantu meningkatkan kesadaran, sambil tetap menekankan kegunaan teknologi ini untuk membantu orang-orang yang membutuhkan.”
Rekomendasi Editor
- Saingan Apple ChatGPT mungkin secara otomatis menulis kode untuk Anda
- Meta membuat DALL-E untuk video, dan itu menyeramkan sekaligus menakjubkan
- Ilusi optik dapat membantu kita membangun AI generasi berikutnya
- Laptop pembelajaran mesin Lambda adalah Razer yang menyamar
- Bacalah 'kitab suci sintetik' yang sangat indah dari A.I. yang berpikir itu adalah Tuhan
Tingkatkan gaya hidup AndaTren Digital membantu pembaca mengawasi dunia teknologi yang bergerak cepat dengan semua berita terkini, ulasan produk yang menyenangkan, editorial yang berwawasan luas, dan cuplikan unik.