«Вода, вода повсюду, и ни капли для питья», — гласит самая известная и широко цитируемая строка из эпической поэмы Сэмюэля Тейлора Кольриджа «Иней». Древнего Мореплавателя». Он описывает затруднительное положение, когда вас окружает количество, которое вы ищете, но вы не можете его правильно использовать.
Содержание
- Дилемма поиска
- Гугл для аудио
Прямо сейчас мир тонет в подкасты. В феврале 2018 года состоялось около 500 000 активных подкастов в существовании. Сегодня эта цифра более 1,7 млн., с общим числом более 43 миллионов эпизодов. И все же, несмотря на все это, доступность подкастов, мягко говоря, ужасающая.
Именно здесь на сцену выходит новый стартап. Подз, соучредителем которой является команда, которая впервые встретилась во время работы в Yahoo, стремится найти способ решить загадку находимости, которая преследует сегодняшние подкасты. Более того, у него гораздо более грандиозные и значимые цели: сделать для мировых аудиоархивов то же, что Google сделал для поиска. А именно, организовать его и сделать общедоступным и полезным.
«Нам нравится говорить, что мы живем в золотой век аудио» Сейе Оджуму, технический директор Podz, рассказал Digital Trends. «Но некоторые из инструментов, которые у нас есть для поиска вещей [чтобы послушать], все еще напоминают каменный век».
Аудио, отмечает Оджуму, в настоящее время соответствует духу времени. Подкасты огромны. Клубный дом взрывается. AirPods и другие носимые подслушивающие устройства разлетаются с полок, как будто выходят из моды. Проще говоря, людям нравится что-то слушать. Или, как это формулирует Оджуму, «люди все чаще оказываются в аудиоцентричном, пассивном потребительском опыте».
Дилемма поиска
В настоящее время существует несколько способов, с помощью которых люди обычно находят подкасты, и ни один из них не является достаточно масштабируемым, чтобы соответствовать масштабу задачи. Их рекомендуют друзья, их рекламируют в подкастах, которые мы уже слушаем, или они настолько заметны, что всплывают в эфире поп-культуры, как такие хиты мирового масштаба, как Серийный сделал несколько лет назад.
В приложениях для подкастов также есть несколько возможностей поиска, но они довольно простые. Хотя они могут найти, скажем, тот подкаст, который ведет ваш любимый комик, это их предел. Конечно, они могут помочь вам найти эпизод указанного подкаста, где, например, Джо Роган берет интервью у Илона Маска, но что, если, насладившись разговором Рогана с Маском, вы теперь захотите найти все остальные интервью в подкастах с Tesla и SpaceX? ГЕНЕРАЛЬНЫЙ ДИРЕКТОР? Это сложнее, но все же достижимо.
А что, если вас заинтересовало что-то, что Маск сказал во время одного из своих разговоров — возможно, о гипотеза моделирования — и хотели найти каждый раз, когда Маск говорил на эту тему в подкасте? Или, чтобы добавить еще одну морщинку, что, если бы вы хотели слушать каждый раз, когда кто-то, обладающий сравнимым с Маском влиянием, вмешивался в эту тему. Или каждый человек с сопоставимым влиянием, который разговаривает с жизнерадостным ведущим с британским акцентом в подкасте, записанном в 2021 году.
Одна из многих проблем, с которыми сталкиваются люди, пытающиеся найти подкасты, заключается в том, что подкасты имеют тенденцию быть большими и разросшимися. Как и в любом разговоре, люди перескакивают с темы на тему. В то время как все остальное в сфере технологий, кажется, сосредоточено на краткости — покупки в один клик, 10-секундные TikToks, тонкие разговоры, преобразованные в твиты — подкасты остаются вызывающе длинными. Отлично подходит для слушателей, плохо для поиска.
В попытке «исправить» возможность обнаружения подкастов Podz создал систему искусственного интеллекта. обучено на 100 000 часов аудио, которое просматривает 5 000 самых популярных подкасты (это подавляющее большинство подкастов, которые слушает большинство людей) и создает наиболее привлекательные 60-секундные фрагменты образцов для наполнения аудио Новостная лента.
Как и в случае с музыкальными рекомендациями Spotify, со временем он станет умнее, изучая ваши вкусы. Пользователь может переходить от одного примера к другому, как если бы он просматривал истории в Instagram или пролистывал потенциальные свидания в Tinder. Если им нравится звучание определенного подкаста, они могут погрузиться в него и послушать.
«По сути, мы аннотируем весь звук, чтобы знать — в первом приближении, и это немного редакционная статья, но у нас есть базовое понимание категории, к которой относится аудио», — Оджуму. объяснил. «У нас есть базовое представление о ведущих, которые на самом деле ведут шоу. И по мере того, как мы будем становиться лучше в этом деле… у нас будет представление о гостях, которые говорят. Благодаря этой информации у вас теперь есть возможность переходить от одного фрагмента контента, от одного короткого аудио к другому короткому аудио».
Гугл для аудио
Если бы это было все, что нужно, Подз был бы отличной идеей. Но это еще не все. Несмотря на свое название, Podz заинтересован не только в решении проблемы поиска подкастов — это просто наиболее распространенный пример этой проблемы. Думать, что все дело в подкастах, — все равно, что думать, что Apple — это компания, смысл существования которой — продавать iPhone 12 Pro Max. Конечно, это то, чего он хочет сейчас, но это одна маленькая краткосрочная цель в гораздо большей миссии. То, что Podz действительно хочет сделать (и, если ему удастся это реализовать, это идея стоимостью в несколько миллиардов долларов), — это сделать аудиопространство таким же доступным для поиска, как и текстовое пространство.
«Сегодня [в центре внимания] в первую очередь будут подкасты», — сказал Оджуму. «Но это может быть что угодно: первоисточником может быть видео, первоисточником может быть речь, произнесенная человеком. Всё, где разговаривает человек или люди». Он описал конечную цель команды как создание «поиска аудио общего назначения, где вы можете искать все аудио, которые когда-либо были индексируется».
Хотя в настоящее время это все еще несбыточная мечта, цель состоит в том, чтобы разработать искусственный интеллект. инструменты, которые могут прочесать все аудио и извлекайте только те фрагменты, которые вам нужны, отсортированные по говорящему, теме, эмоциям, фактическому содержанию, идеям, и т. д. «Мы могли бы [теоретически] проиндексировать все, что было записано кем угодно и где угодно», — сказал Оджуму.
Прямо сейчас для стартапа это «летать, прежде чем идти», хотя и хорошо финансируемый, среди инвесторов есть Кэти Курик и Пэрис Хилтон. Но даже если не Podz в конечном итоге решит эту проблему, это сделает тот или иной стартап. И когда они это сделают, результаты могут быть значительными. «[Если бы вы сделали это, можно было бы] немного понять человека, который говорит [что-то], понять немного о нюансах, понимать контекст, уметь помещать их во время и место, а затем уметь разумно их искать», — Оджуму сказал.
Награды могут быть огромными — как для пользователей во всем мире, так и для любой компании, которая им управляет. «Если бы у вас это было, вы бы были Google, верно?» он сказал. «Вы были бы Google для аудио».
Рекомендации редакции
- Забавная формула: Почему машинный юмор — это Святой Грааль искусственного интеллекта