Déverrouiller les informations piégées dans l'audio en ligne impossible à rechercher

« De l’eau, de l’eau partout, ni une goutte à boire », lit-on dans la phrase de loin la plus célèbre – et la plus largement citée – du poème épique de Samuel Taylor Coleridge « The Rime ». de l’ancien marin. Il décrit la situation difficile d’être entouré d’une quantité que vous recherchez, mais de ne pas pouvoir l’utiliser correctement.

Contenu

  • Le dilemme de la recherche
  • Google pour l'audio

En ce moment, le monde se noie podcasts. En février 2018, il y a eu un environ 500 000 podcasts actifs en existence. Aujourd'hui, ce chiffre est plus de 1,7 million, avec un total de plus de 43 millions d'épisodes. Et pourtant, pour autant, la découvrabilité des podcasts est, pour le dire gentiment, horrible.

Podz

C’est là qu’une nouvelle startup entre en scène. Podz, cofondé par une équipe qui s'est rencontrée pour la première fois alors qu'il travaillait chez Yahoo, cherche à trouver un moyen de résoudre le problème de la trouvabilité qui assaille les podcasts d'aujourd'hui. Mais plus encore, il propose des projets bien plus ambitieux et bien plus significatifs: faire pour les archives audio mondiales ce que Google a fait pour la recherche. À savoir, l’organiser et le rendre universellement accessible et utile.

"Nous aimons dire que nous vivons à l'âge d'or de l'audio" Seye Ojumu, directeur de la technologie chez Podz, a déclaré à Digital Trends. "Mais certains des outils dont nous disposons pour trouver des choses [à écouter] ressemblent encore à l'âge de pierre."

L’audio, souligne Ojumu, est actuellement dans l’air du temps. Les podcasts sont énormes. Le club-house explose. AirPod et autres appareils d'écoute portables s’envolent des étagères comme s’ils se démodaient. Pour faire simple, les gens aiment écouter des trucs. Ou, comme le dit Ojumu, « de plus en plus, les gens se retrouvent dans des expériences de consommation passive et audiocentriques ».

Le dilemme de la recherche

Actuellement, il existe plusieurs façons pour les gens de découvrir les podcasts, et aucune d’entre elles n’est suffisamment évolutive pour être à la hauteur de l’ampleur du défi. Ils sont recommandés par des amis, ils sont annoncés sur des podcasts que nous écoutons déjà, ou ils sont suffisamment remarquables pour apparaître dans l'éther de la culture pop, à la manière d'un hit à l'échelle planétaire comme En série l'a fait il y a quelques années.

Il existe également quelques fonctionnalités de recherche dans les applications de podcast, mais celles-ci sont assez basiques. Même s’ils peuvent trouver, par exemple, ce podcast hébergé par votre comédien préféré, c’est à peu près leur limite. Bien sûr, ils pourraient vous aider à trouver l’épisode dudit podcast dans lequel, par exemple, Joe Rogan interviewe Elon Musk – mais et si, après avoir apprécié la conversation de Rogan avec Musk, vous vouliez maintenant retrouver toutes les autres interviews en podcast avec Tesla et SpaceX PDG? C'est plus difficile, mais toujours réalisable.

Podz

Et si vous étiez intéressé par quelque chose que Musk a dit lors d’une de ses conversations – peut-être à propos du hypothèse de simulation – et vous vouliez savoir à chaque fois que Musk avait parlé de ce sujet dans un podcast? Ou, pour ajouter encore un autre problème, que se passerait-il si vous vouliez écouter chaque fois que quelqu'un ayant une influence comparable à celle de Musk intervient sur ce sujet. Ou toute personne ayant une influence comparable qui discute avec un hôte optimiste avec un accent britannique, dans un podcast enregistré en 2021.

L’un des nombreux problèmes rencontrés par les personnes qui tentent de découvrir des podcasts est que les podcasts ont tendance à être volumineux et tentaculaires. Comme pour toute conversation, les gens passent d’un sujet à l’autre. Alors que tout le reste de la technologie semble se concentrer sur la brièveté – achats en un clic, TikToks de 10 secondes, conversation nuancée distillée dans des tweets – les podcasts restent résolument longs. Idéal pour les auditeurs, médiocre pour la recherche.

Pour tenter de « réparer » la découvrabilité des podcasts, Podz a créé un système d'IA. formé sur 100 000 heures d'audio, qui parcourt les 5 000 heures les plus populaires podcasts (c'est l'écrasante majorité des podcasts que la plupart des gens écoutent) et crée les extraits d'échantillons de 60 secondes les plus attrayants pour remplir un audio fil d'actualité.

Comme pour les recommandations musicales de Spotify, au fil du temps, il deviendra plus intelligent à mesure qu'il apprendra vos goûts. L'utilisateur peut passer d'un échantillon à l'autre comme s'il regardait des histoires Instagram ou parcourait des dates potentielles sur Tinder. S’ils aiment le son d’un podcast particulier, ils peuvent s’y plonger et l’écouter.

"En gros, nous annotons tout l'audio, pour que nous sachions - en première approximation, et c'est légèrement éditorial – mais nous avons une compréhension de base de la catégorie dans laquelle se trouve l’audio », Ojumu expliqué. «Nous avons une compréhension de base des animateurs qui animent réellement l'émission. Et, à mesure que nous nous améliorerons dans ce domaine… nous aurons une idée des invités qui parlent. Avec ces informations, vous disposez désormais d’un moyen de naviguer d’un élément de contenu, d’un audio court à un autre audio court.

Google pour l'audio

Si c’était tout ce qu’il y avait à faire, Podz serait une bonne idée. Mais ce n’est pas tout. Malgré son nom, Podz ne s’intéresse pas seulement à la résolution du problème de la découverte des podcasts – il se trouve que c’est l’exemple le plus répandu de ce défi. Penser qu’il s’agit uniquement de podcasts, c’est comme penser qu’Apple est une entreprise dont la raison d’être est de vendre l’iPhone 12 Pro Max. Bien sûr, c’est ce qu’il veut maintenant, mais ce n’est qu’un petit objectif à court terme dans une mission beaucoup plus vaste. Ce que Podz veut vraiment faire – et, s’il y parvient, c’est une idée de plusieurs milliards de dollars – c’est rendre l’espace audio aussi consultable que l’espace texte.

Podz

"Aujourd'hui, [l'accent est] principalement mis sur les podcasts", a déclaré Ojumu. « Mais cela pourrait être n’importe quoi – la source originale pourrait être une vidéo, la source originale pourrait être un discours qu’une personne a prononcé. Tout ce où il y a une ou plusieurs personnes qui parlent. Il a décrit l’objectif final de l’équipe comme créer une « recherche audio à usage général où vous pouvez rechercher tout l'audio qui a déjà été indexé."

Bien qu’il s’agisse encore pour l’instant d’une chimère, l’objectif est de développer l’IA. des outils qui peuvent parcourir tout audio et extrayez uniquement les éléments que vous souhaitez, triés par locuteur, sujet, émotion, contenu factuel, idées, etc. « Nous pourrions [théoriquement] indexer tout ce qui a été dit et enregistré par n'importe qui, n'importe où », a déclaré Ojumu.

À l’heure actuelle, il s’agit de « voler avant de marcher » pour une startup – même si elle est bien financée, avec des investisseurs comme Katie Couric et Paris Hilton. Mais même si ce n’est pas Podz qui résoudra finalement ce problème, ce sera une startup ou une autre qui le fera. Et lorsqu’ils le feront, les résultats pourraient être significatifs. « [Si vous faisiez cela, il serait possible de] comprendre un peu la personne qui dit [quelque chose], comprendre un peu sur la nuance, comprendre le contexte, être capable de la situer dans le temps et dans le lieu, puis d'être capable de la rechercher intelligemment », Ojumu dit.

Les récompenses pourraient être énormes, tant pour les utilisateurs du monde entier que pour l'entreprise qui le gère. « Si vous aviez cela, vous seriez Google, n'est-ce pas? » il a dit. "Vous seriez Google pour l'audio."

Recommandations des rédacteurs

  • La formule amusante: pourquoi l'humour généré par la machine est le Saint Graal de l'IA.