Membuka Kunci Info yang Terjebak dalam Audio Online yang Tidak Dapat Ditelusuri

“Air, air di mana-mana, atau setetes air pun untuk diminum,” merupakan kalimat yang paling terkenal – dan banyak dikutip – dari puisi epik Samuel Taylor Coleridge, “The Rime dari Pelaut Kuno.” Ini menggambarkan kesulitan dikelilingi oleh suatu kuantitas yang Anda cari, namun tidak dapat memanfaatkannya dengan benar.

Isi

  • Dilema pencarian
  • Google untuk audio

Saat ini, dunia sedang tenggelam podcast. Pada bulan Februari 2018, terdapat sebuah diperkirakan 500.000 podcast aktif yang ada. Saat ini, angka itu adalah melebihi 1,7 juta, dengan total lebih dari 43 juta episode. Namun, terlepas dari semua itu, kemampuan podcast untuk dapat ditemukan, dengan kata lain, sangat buruk.

Podz

Di sinilah startup baru mulai muncul. Podz, yang didirikan bersama oleh tim yang pertama kali bertemu saat bekerja di Yahoo, berupaya menemukan cara untuk memecahkan teka-teki kemudahan menemukan yang melanda podcast saat ini. Namun lebih dari itu, ia memiliki desain yang jauh lebih megah dan signifikan: Untuk melakukan hal yang sama seperti yang telah dilakukan Google untuk penelusuran bagi arsip audio dunia. Yakni, mengaturnya dan menjadikannya dapat diakses dan berguna secara universal.

“Kami ingin mengatakan bahwa kita hidup di zaman keemasan audio,” Seye Ojumu, chief technology officer di Podz, mengatakan kepada Digital Trends. “Tetapi beberapa alat yang kita miliki untuk menemukan sesuatu [untuk didengarkan] masih terasa seperti Zaman Batu.”

Audio, kata Ojumu, saat ini sedang dalam tren. Podcast sangat besar. Clubhouse meledak. AirPods dan lainnya perangkat mendengarkan yang dapat dipakai terbang dari rak seolah-olah sudah ketinggalan zaman. Sederhananya, orang suka mendengarkan sesuatu. Atau, seperti ungkapan Ojumu, “semakin banyak orang yang mengalami pengalaman konsumsi pasif yang audiosentris.”

Dilema pencarian

Saat ini, ada beberapa cara orang menemukan podcast — dan tidak ada satupun yang cukup skalabel untuk memenuhi cakupan tantangannya. Mereka direkomendasikan oleh teman-teman, mereka diiklankan di podcast yang sudah kita dengarkan, atau mereka cukup terkenal sehingga muncul dalam budaya pop, seperti halnya lagu hit seukuran planet seperti Serial lakukan beberapa tahun yang lalu.

Ada juga beberapa kemampuan pencarian di aplikasi podcast, tetapi ini cukup mendasar. Meskipun mereka mungkin baik-baik saja untuk menemukan, katakanlah, podcast yang dibawakan oleh komedian favorit Anda, itu adalah batasnya. Tentu, mereka mungkin juga membantu Anda menemukan episode podcast tersebut di mana, misalnya, Joe Rogan mewawancarai Elon Musk — tetapi bagaimana jika, setelah menikmati percakapan Rogan dengan Musk, sekarang Anda ingin menemukan semua wawancara podcast lainnya dengan Tesla dan SpaceX CEO? Itu lebih sulit, tapi masih bisa dicapai.

Podz

Sekarang, bagaimana jika Anda tertarik pada sesuatu yang dikatakan Musk dalam salah satu percakapannya — mungkin tentang hal tersebut hipotesis simulasi — dan ingin mengetahui kapan Musk membicarakan topik ini di podcast? Atau, untuk menambahkan kerutan lain, bagaimana jika Anda ingin mendengarkan setiap kali seseorang dengan pengaruh yang sebanding dengan Musk membahas topik ini. Atau setiap orang dengan pengaruh serupa yang sedang mengobrol dengan pembawa acara yang ceria dengan aksen Inggris, dalam podcast yang direkam pada tahun 2021.

Salah satu dari banyak masalah yang dihadapi oleh orang-orang yang mencoba memecahkan penemuan podcast adalah bahwa podcast cenderung berukuran besar dan luas. Seperti halnya percakapan apa pun, orang berpindah dari satu topik ke topik lainnya. Meskipun semua hal lain di bidang teknologi tampaknya berfokus pada keringkasan – belanja sekali klik, TikTok berdurasi 10 detik, percakapan bernuansa yang disaring menjadi tweet – podcast tetap berbentuk panjang. Bagus untuk pendengar, buruk untuk penelusuran.

Dalam upaya untuk “memperbaiki” kemampuan podcast untuk ditemukan, Podz telah membuat A.I. dilatih dengan 100.000 jam audio, yang menjelajahi 5.000 jam paling populer podcast (itulah sebagian besar podcast yang didengarkan kebanyakan orang) dan membuat cuplikan sampel berdurasi 60 detik yang paling menarik untuk mengisi audio umpan berita.

Seperti rekomendasi musik Spotify, seiring berjalannya waktu, Spotify akan menjadi lebih pintar seiring dengan selera Anda. Pengguna dapat berpindah dari satu sampel ke sampel berikutnya seolah-olah mereka sedang menonton Instagram Stories atau menelusuri calon tanggal di Tinder. Jika mereka menyukai suara podcast tertentu, mereka dapat mendalami dan mendengarkannya.

“Kami pada dasarnya membuat anotasi pada semua audio, sehingga kami tahu — dengan perkiraan pertama, dan itu sedikit editorial — tapi kami memiliki pemahaman dasar tentang kategori audio tersebut,” Ojumu menjelaskan. “Kami memiliki pemahaman dasar tentang pembawa acara yang sebenarnya menjadi pembawa acara. Dan, seiring dengan semakin mahirnya kita dalam hal ini… kita akan mendapatkan gambaran tentang tamu yang sedang berbicara. Dengan informasi tersebut, Anda kini memiliki cara untuk bernavigasi dari satu konten, dari satu audio berdurasi pendek ke audio berdurasi pendek lainnya.”

Google untuk audio

Jika hanya itu saja, Podz akan menjadi ide yang bagus. Tapi bukan hanya itu saja. Terlepas dari namanya, Podz tidak hanya tertarik untuk memecahkan masalah penemuan podcast — ini adalah contoh paling umum dari tantangan yang ada. Berpikir bahwa ini semua tentang podcast sama seperti berpikir bahwa Apple adalah perusahaan yang alasan utamanya adalah menjual iPhone 12 Pro Max. Tentu saja, itulah yang diinginkannya saat ini, tapi itu adalah tujuan kecil jangka pendek dalam misi yang jauh lebih besar. Apa yang benar-benar ingin dilakukan Podz — dan, jika berhasil, ini adalah ide bernilai miliaran dolar — adalah membuat ruang audio dapat dicari seperti halnya ruang teks.

Podz

“Saat ini, [fokusnya] terutama pada podcast,” kata Ojumu. “Tapi bisa apa saja – sumber aslinya bisa berupa video, sumber aslinya bisa berupa pidato yang disampaikan seseorang. Apa pun di mana ada seseorang atau beberapa orang yang berbicara.” Dia menggambarkan tujuan akhir tim sebagai membangun “pencarian audio tujuan umum di mana Anda dapat mencari semua audio yang pernah ada diindeks.”

Meskipun saat ini hal ini masih berupa angan-angan, tujuannya adalah untuk mengembangkan A.I. alat yang bisa menyisir semuanya audio dan ekstrak hanya bagian yang Anda inginkan, diurutkan berdasarkan pembicara, materi pelajaran, emosi, konten faktual, ide, dll. “Kami [secara teoritis] dapat mengindeks semua yang dikatakan yang dicatat oleh siapa pun, di mana pun,” kata Ojumu.

Saat ini, hal tersebut merupakan hal yang “terbang sebelum Anda berjalan” untuk sebuah startup – meskipun startup tersebut memiliki pendanaan yang besar, dengan investor termasuk Katie Couric dan Paris Hilton. Meskipun bukan Podz yang pada akhirnya memecahkan masalah ini, startup atau startup lainlah yang akan memecahkan masalah ini. Dan jika hal ini dilakukan, maka hasilnya bisa sangat signifikan. “[Jika Anda melakukan ini, akan mungkin untuk] memahami sedikit tentang orang yang mengatakan [sesuatu], memahami sedikit tentang nuansanya, memahami konteksnya, mampu memasukkannya ke dalam waktu dan tempat, lalu mampu menelusurinya dengan cerdas,” Ojumu dikatakan.

Imbalannya bisa sangat besar — ​​baik bagi pengguna di mana pun maupun bagi perusahaan mana pun yang mengelolanya. “Jika kamu memilikinya, kamu akan menjadi Google, bukan?” dia berkata. “Anda akan menjadi Google untuk audio.”

Rekomendasi Editor

  • Rumus lucunya: Mengapa humor yang dihasilkan mesin adalah cawan suci A.I.