Desbloqueando as informações presas em áudio on-line inpesquisável

“Água, água por toda parte, nem uma gota para beber”, diz de longe a frase mais famosa – e amplamente citada – do poema épico de Samuel Taylor Coleridge “The Rime do Antigo Marinheiro.” Descreve a situação de estar cercado por uma quantidade que você procura, mas não conseguir fazer uso adequado dela.

Conteúdo

  • O dilema da pesquisa
  • Google para áudio

Neste momento, o mundo está se afogando em podcasts. Em fevereiro de 2018, houve um estimativa de 500.000 podcasts ativos em existência. Hoje, esse número é mais de 1,7 milhão, com um total de mais de 43 milhões de episódios. E, no entanto, apesar de tudo isso, a capacidade de descoberta do podcast é, para dizer o mínimo, horrível.

Podz

É aqui que uma nova startup entra em cena. Podz, cofundada por uma equipe que se conheceu enquanto trabalhava no Yahoo, busca encontrar uma maneira de resolver o enigma da localização que assola os podcasts de hoje. Mais do que isso, porém, tem designs muito mais grandiosos e significativos: fazer pelos arquivos de áudio do mundo o que o Google fez pela pesquisa. Ou seja, organizá-lo e torná-lo universalmente acessível e útil.

“Gostamos de dizer que estamos vivendo na era de ouro do áudio”, Seye Ojumu, diretor de tecnologia da Podz, disse à Digital Trends. “Mas algumas das ferramentas que temos para encontrar coisas [para ouvir] ainda parecem a Idade da Pedra.”

O áudio, ressalta Ojumu, está atualmente no zeitgeist. Os podcasts são enormes. O Clubhouse está explodindo. AirPods e outros dispositivos de escuta vestíveis estão voando das prateleiras como se estivessem saindo de moda. Simplificando, as pessoas gostam de ouvir coisas. Ou, como diz Ojumu, “cada vez mais, as pessoas estão se encontrando em experiências de consumo passivas e audiocêntricas”.

O dilema da pesquisa

Atualmente, existem algumas maneiras pelas quais as pessoas normalmente descobrem podcasts – e nenhuma delas é escalonável o suficiente para estar à altura do escopo do desafio. Eles são recomendados por amigos, são anunciados em podcasts que já ouvimos ou são suficientemente notáveis ​​para aparecerem no éter da cultura pop, da mesma forma que um sucesso de tamanho planetário como Serial fiz há alguns anos.

Existem alguns recursos de pesquisa em aplicativos de podcast também, mas são bastante básicos. Embora eles possam ser bons para encontrar, digamos, aquele podcast apresentado pelo seu comediante favorito, isso é quase o limite deles. Claro, eles podem ajudar você a encontrar o episódio do podcast onde, por exemplo, Joe Rogan entrevista Elon Musk - mas e se, depois de ter gostado da conversa de Rogan com Musk, você agora quiser encontrar todas as outras entrevistas em podcast com Tesla e SpaceX CEO? Isso é mais difícil, mas ainda possível.

Podz

Agora, e se você estivesse interessado em algo que Musk disse durante uma de suas conversas – talvez sobre o hipótese de simulação – e queria saber todas as vezes que Musk falou sobre esse assunto em um podcast? Ou, para acrescentar mais uma questão, e se você quisesse ouvir todas as vezes que alguém com influência comparável a Musk intervém sobre esse assunto? Ou qualquer pessoa com influência comparável que esteja conversando com um apresentador otimista com sotaque britânico, em um podcast gravado em 2021.

Um dos muitos problemas enfrentados pelas pessoas que tentam descobrir podcasts é que os podcasts tendem a ser grandes e extensos. Como acontece com qualquer conversa, as pessoas pulam de um tópico para outro. Embora todo o resto na tecnologia pareça se concentrar na brevidade – compras com um clique, TikToks de 10 segundos, conversas diferenciadas destiladas em tweets – os podcasts permanecem desafiadoramente longos. Ótimo para ouvintes, ruim para pesquisas.

Na tentativa de “consertar” a descoberta do podcast, Podz criou um I.A. treinado em 100.000 horas de áudio, que percorre os 5.000 mais populares podcasts (essa é a esmagadora maioria dos podcasts que a maioria das pessoas ouve) e cria os trechos de amostra mais envolventes de 60 segundos para preencher um áudio notícias.

Tal como acontece com as recomendações musicais do Spotify, com o tempo ele ficará mais inteligente à medida que aprende seus gostos. O usuário pode pular de uma amostra para outra como se estivesse assistindo Instagram Stories ou passando por possíveis datas no Tinder. Se gostarem do som de um podcast específico, podem mergulhar e ouvi-lo.

“Basicamente anotamos todo o áudio, para que saibamos – para uma primeira aproximação, e é um pouco editorial – mas temos uma compreensão básica da categoria em que o áudio está”, Ojumu explicou. “Temos uma compreensão básica dos apresentadores que realmente apresentam o programa. E, à medida que melhorarmos nisso… teremos uma ideia dos convidados que estão falando. Com essas informações, agora você tem uma maneira de navegar de um conteúdo, de um áudio curto para outro áudio curto.”

Google para áudio

Se isso fosse tudo, Podz seria uma ótima ideia. Mas isso não é tudo. Apesar do nome, Podz não está interessado apenas em resolver o problema de descoberta de podcast – esse é o exemplo mais comum desse desafio em questão. Pensar que tudo isso se trata de podcasts é como pensar que a Apple é uma empresa cuja razão de ser é vender o iPhone 12 Pro Max. Claro, é isso que se quer agora, mas é um objectivo pequeno e de curto prazo numa missão muito maior. O que Podz realmente quer fazer – e, se conseguir, esta é uma ideia multibilionária – é tornar o espaço de áudio tão pesquisável quanto o espaço de texto.

Podz

“Hoje, [o foco] serão principalmente os podcasts”, disse Ojumu. “Mas pode ser qualquer coisa – a fonte original pode ser um vídeo, a fonte original pode ser um discurso feito por uma pessoa. Qualquer coisa onde haja uma pessoa ou pessoas conversando.” Ele descreveu o objetivo final da equipe como construindo uma “pesquisa de áudio de uso geral onde você pode pesquisar todo o áudio que já foi indexado.”

Embora isso ainda seja, no momento, um sonho, o objetivo é desenvolver a IA. ferramentas que podem pentear todos áudio e extraia apenas os trechos desejados, classificados por palestrante, assunto, emoção, conteúdo factual, ideias, etc. “Poderíamos [teoricamente] indexar tudo o que foi dito e gravado por qualquer pessoa, em qualquer lugar”, disse Ojumu.

No momento, isso é algo do tipo “voe antes de andar” para uma startup – embora bem financiada, com investidores como Katie Couric e Paris Hilton. Mas mesmo que não seja o Podz quem resolverá esse problema, será uma startup ou outra que o fará. E quando o fizerem, os resultados poderão ser significativos. “[Se você fizesse isso, seria possível] entender um pouco sobre a pessoa que está falando [alguma coisa], entender um pouco sobre a nuance, compreender o contexto, ser capaz de colocá-lo no tempo e no lugar, e então ser capaz de pesquisar isso de forma inteligente”, Ojumu disse.

As recompensas podem ser enormes – tanto para usuários em todos os lugares quanto para qualquer empresa que as gerencie. “Se você tivesse isso, você seria o Google, certo?” ele disse. “Você seria o Google para áudio.”

Recomendações dos Editores

  • A fórmula engraçada: por que o humor gerado por máquina é o Santo Graal da IA