Odemknutí informací uvězněných v nevyhledatelném online zvuku

„Voda, všude voda, ani kapka k pití,“ zní zdaleka nejslavnější – a široce citovaná – věta z epické básně Samuela Taylora Coleridge „The Rime“. starověkého námořníka." Popisuje těžkou situaci, kdy jste obklopeni množstvím, které hledáte, ale nejste schopni jej náležitě využít.

Obsah

  • Dilema hledání
  • Google pro zvuk

Právě teď se svět topí podcasty. V únoru 2018 došlo k odhadem 500 000 aktivních podcastů v existenci. Dnes je to číslo více než 1,7 milionu, s celkovým počtem více než 43 milionů epizod. A přesto, přes to všechno, je objevitelnost podcastů, hezky řečeno, příšerná.

Podz

Zde vstupuje do obrazu nový startup. Podz, spoluzaložený týmem, který se poprvé setkal při práci ve společnosti Yahoo, se snaží najít způsob, jak vyřešit hlavolam s nalezením, který sužuje dnešní podcasty. Více než to, má však mnohem velkolepější a mnohem významnější návrhy: Udělat pro světové audioarchivy to, co Google udělal pro vyhledávání. Totiž uspořádat ji a učinit ji univerzálně dostupnou a užitečnou.

"Rádi říkáme, že žijeme ve zlatém věku audia,"

Ahoj Ojumu, technologický ředitel společnosti Podz, řekl Digital Trends. "Ale některé nástroje, které máme k nalezení věcí [k poslechu], stále působí jako doba kamenná."

Audio, zdůrazňuje Ojumu, je v současné době v době doby. Podcasty jsou obrovské. Klubovna vybuchuje. AirPods a další nositelná odposlouchávací zařízení létají z regálů, jako by vyšly z módy. Jednoduše řečeno, lidé rádi poslouchají věci. Nebo, jak to říká Ojumu, „lidé se stále častěji ocitají v audiocentrických, pasivních konzumních zážitcích“.

Dilema hledání

V současné době existuje několik způsobů, jak lidé obvykle objevují podcasty – a žádný z nich není dostatečně škálovatelný, aby odpovídal rozsahu výzvy. Doporučují je přátelé, jsou inzerováni v podcastech, které již posloucháme, nebo jsou dostatečně nápadné, že se objevují v éteru popkultury, jako je hit planetární velikosti, jako je např. Seriál udělal před několika lety.

V podcastových aplikacích je také několik možností vyhledávání, ale ty jsou docela základní. I když mohou být v pořádku při hledání, řekněme, podcastu hostovaného vaším oblíbeným komikem, to je asi jejich limit. Jistě, mohou vám pomoci najít epizodu zmíněného podcastu, kde například Joe Rogan dělá rozhovor s Elonem Muskem – ale co když jste si užili Roganův rozhovor s Muskem a nyní chcete najít všechny další podcastové rozhovory s Teslou a SpaceX VÝKONNÝ ŘEDITEL? To je těžší, ale stále dosažitelné.

Podz

Co kdyby vás teď zajímalo něco, co Musk řekl během jednoho ze svých rozhovorů – možná o tom simulační hypotéza — a chtěli jste najít pokaždé, když Musk mluvil o tomto tématu v podcastu? Nebo, abychom přidali další vrásku, co kdybyste chtěli poslouchat pokaždé, když se k tomuto tématu připojí někdo se srovnatelným vlivem jako Musk. Nebo každý člověk se srovnatelným vlivem, který mluví s optimistickým hostitelem s britským přízvukem v podcastu nahraném v roce 2021.

Jedním z mnoha problémů, kterým čelí lidé, kteří se snaží prolomit objevování podcastů, je to, že podcasty bývají velké a rozlehlé. Jako u každé konverzace lidé přeskakují z tématu na téma. Zatímco všechno ostatní v technice se zdá být zaměřeno na stručnost – nakupování jedním kliknutím, 10sekundové TikToky, nuance konverzace destilované do tweetů – podcasty zůstávají vzdorovitě dlouhé. Skvělé pro posluchače, špatné pro vyhledávání.

Ve snaze „opravit“ zjistitelnost podcastů Podz vytvořil A.I. natrénováno na 100 000 hodinách audia, které projde nejpopulárnějšími 5 000 podcasty (to je drtivá většina podcastů, které většina lidí poslouchá) a vytváří nejpoutavější 60sekundové ukázkové úryvky k naplnění zvuku zpravodajský kanál.

Stejně jako u hudebních doporučení Spotify se časem stane chytřejší, když se naučí váš vkus. Uživatel může přeskakovat z jednoho vzorku na druhý, jako by sledoval Instagram Stories nebo procházel potenciálními daty na Tinderu. Pokud se jim líbí zvuk konkrétního podcastu, mohou se ponořit a poslouchat ho.

„V zásadě anotujeme veškerý zvuk, abychom věděli – na první přiblížení a úvodník – ale máme základní představu o kategorii, do které zvuk patří,“ Ojumu vysvětlil. „Máme základní znalosti o hostitelích, kteří ve skutečnosti show pořádají. A jak se v tom budeme zlepšovat, budeme mít představu o hostech, kteří mluví. S těmito informacemi nyní máte možnost procházet z jednoho obsahu, z jednoho krátkého zvuku do jiného krátkého zvuku.“

Google pro zvuk

Kdyby to bylo všechno, Podz by byl skvělý nápad. Ale to není všechno. Navzdory svému jménu se Podz nezajímá pouze o vyřešení problému objevování podcastů – to je náhodou nejrozšířenější příklad této výzvy. Myslet si, že je to všechno o podcastech, je jako myslet si, že Apple je společnost, jejímž důvodem je prodávat iPhone 12 Pro Max. Jasně, to je to, co to teď chce, ale to je jeden malý, krátkodobý cíl v mnohem větší misi. To, co chce Podz skutečně udělat – a pokud se mu to podaří, jde o nápad za mnoho miliard dolarů – je učinit zvukový prostor stejně prohledávatelným jako textový.

Podz

„Dnes se [zaměříme] především na podcasty,“ řekl Ojumu. „Ale může to být cokoli – původním zdrojem může být video, původním zdrojem může být řeč, kterou člověk pronesl. Cokoli, kde mluví osoba nebo osoby." Konečný cíl týmu popsal jako vytvoření „univerzálního vyhledávání zvuku, kde můžete prohledávat veškerý zvuk, který kdy byl indexováno.”

I když je to v současnosti stále jen sen, cílem je vyvinout A.I. nástroje, které dokážou pročesat všechno zvuk a extrahujte jen ty kousky, které chcete, seřazené podle mluvčího, předmětu, emocí, faktického obsahu, nápadů, atd. "Mohli bychom [teoreticky] indexovat vše, co bylo řečeno, co bylo zaznamenáno kýmkoli a kdekoli, " řekl Ojumu.

Právě teď je to „leť, než půjdeš“ pro startup – i když dobře financovaný, s investory včetně Katie Couric a Paris Hilton. Ale i když to není Podz, kdo nakonec tento problém rozlouskne, bude to ten či onen startup, který to udělá. A když tak učiní, výsledky mohou být významné. „[Pokud byste to udělali, bylo by možné] trochu rozumět osobě, která [něco] říká, trochu rozumět o nuancích, porozumět kontextu, umět je zasadit do času a místa a pak to umět inteligentně vyhledávat,“ Ojumu řekl.

Odměny by mohly být obrovské – jak pro uživatele kdekoli, tak pro jakoukoli společnost, která to spravuje. "Pokud to máš, byl bys Google, že?" řekl. "Byli byste Google pro zvuk."

Doporučení redakce

  • Vtipná formulka: Proč je strojově generovaný humor svatým grálem A.I.