Kecerdasan buatan (AI) adalah sedang bersenang-senang saat ini, dan angin terus bertiup dengan berita bahwa Microsoft sedang mengerjakan AI yang dapat meniru suara siapa pun setelah diberi sampel singkat berdurasi tiga detik.
Alat baru ini, yang diberi nama VALL-E, telah dilatih pada sekitar 60.000 jam data suara dalam bahasa Inggris, yang menurut Microsoft “ratusan kali lebih besar dari sistem yang ada”. Dengan menggunakan pengetahuan tersebut, penciptanya mengklaim bahwa mereka hanya memerlukan sedikit masukan vokal untuk memahami cara mereplikasi suara pengguna.
Yang lebih mengesankan, VALL-E dapat mereproduksi emosi, nada vokal, dan lingkungan akustik yang ditemukan di setiap sampel, sesuatu yang sulit dilakukan oleh program AI suara lainnya. Hal ini memberikan aura yang lebih realistis dan membawa hasil yang lebih mendekati sesuatu yang dapat dianggap sebagai ucapan manusia yang asli.
Terkait
- GPT-4: cara menggunakan chatbot AI yang mempermalukan ChatGPT
- Google Bard sekarang dapat berbicara, tetapi bisakah ia meredam ChatGPT?
- Perusahaan AI baru Elon Musk bertujuan untuk ‘memahami alam semesta’
Jika dibandingkan dengan pesaing text-to-speech (TTS) lainnya, Microsoft mengatakan VALL-E “secara signifikan mengungguli sistem TTS zero-shot yang canggih dalam hal ucapan. kealamian dan kesamaan pembicara.” Dengan kata lain, VALL-E terdengar lebih mirip manusia sungguhan dibandingkan AI saingannya yang menghadapi input audio yang belum dilatih. pada.
Video yang Direkomendasikan
Di GitHub, Microsoft telah membuat perpustakaan kecil sampel dibuat menggunakan VALL-E. Hasilnya sebagian besar sangat mengesankan, dengan banyak sampel yang mereproduksi nada dan aksen suara pembicara. Beberapa contoh kurang meyakinkan, menunjukkan VALL-E mungkin bukan produk jadi, namun secara keseluruhan keluarannya meyakinkan.
Potensi dan risiko yang sangat besar
Di sebuah makalah memperkenalkan VALL-E, Microsoft menjelaskan bahwa VALL-E “mungkin membawa potensi risiko penyalahgunaan model, seperti spoofing suara identifikasi atau meniru pembicara tertentu.” Alat yang mumpuni untuk menghasilkan pidato yang terdengar realistis momok dari deepfake yang semakin meyakinkan, yang dapat digunakan untuk meniru apa pun mulai dari mantan pasangan hingga tokoh internasional terkemuka.
Untuk mengurangi ancaman tersebut, Microsoft mengatakan “adalah mungkin untuk membangun model deteksi untuk membedakan apakah klip audio disintesis oleh VALL-E.” Perusahaan mengatakan mereka juga akan menggunakan miliknya sendiri Prinsip AI ketika mengembangkan karyanya. Prinsip-prinsip tersebut mencakup bidang-bidang seperti keadilan, keamanan, privasi, dan akuntabilitas.
VALL-E hanyalah contoh terbaru eksperimen Microsoft dengan AI. Baru-baru ini, perusahaan sedang mengerjakannya mengintegrasikan ChatGPT ke Bing, menggunakan AI untuk rekap rapat Teams Anda, dan memasukkan alat-alat canggih ke dalam aplikasi sejenisnya Outlook, Word, dan PowerPoint. Dan menurut Semafor, Microsoft sedang mencarinya investasikan $10 miliar ke pembuat ChatGPT OpenAI, sebuah perusahaan yang telah memberikan dana dalam jumlah besar.
Meskipun ada risiko yang terlihat, alat seperti VALL-E bisa sangat berguna dalam bidang kedokteran, misalnya, untuk membantu orang mendapatkan kembali suara mereka setelah kecelakaan. Kemampuan mereplikasi ucapan dengan masukan sekecil itu bisa sangat menjanjikan dalam situasi ini, asalkan dilakukan dengan benar. Namun dengan banyaknya uang yang dibelanjakan untuk AI – baik oleh Microsoft maupun pihak lain – jelas bahwa hal ini tidak akan hilang dalam waktu dekat.
Rekomendasi Editor
- Penulis terkenal menuntut pembayaran dari perusahaan AI untuk menggunakan karya mereka
- Alat pengeditan video AI terbaik
- Pembuat ChatGPT, OpenAI, menghadapi penyelidikan FTC atas undang-undang perlindungan konsumen
- Terobosan AI bisa datang melalui otak lebah, kata para ilmuwan
- OpenAI membangun tim baru untuk menghentikan AI super cerdas menjadi nakal
Tingkatkan gaya hidup AndaTren Digital membantu pembaca mengawasi dunia teknologi yang bergerak cepat dengan semua berita terbaru, ulasan produk yang menyenangkan, editorial yang berwawasan luas, dan cuplikan unik.