Entsperren Sie die in nicht durchsuchbarem Online-Audio eingeschlossenen Informationen

„Wasser, Wasser überall, kein Tropfen zum Trinken“, lautet die mit Abstand berühmteste – und am häufigsten zitierte – Zeile aus Samuel Taylor Coleridges epischem Gedicht „The Rime des alten Seefahrers.“ Es beschreibt das Dilemma, von einer Menge umgeben zu sein, nach der man sucht, diese aber nicht richtig nutzen zu können.

Inhalt

  • Das Suchdilemma
  • Google für Audio

Im Moment versinkt die Welt darin Podcasts. Im Februar 2018 gab es eine Schätzungsweise 500.000 aktive Podcasts besteht. Heute ist diese Zahl über 1,7 Millionenmit insgesamt mehr als 43 Millionen Folgen. Und dennoch ist die Auffindbarkeit von Podcasts, um es nett auszudrücken, schrecklich.

Podz

Hier kommt ein neues Startup ins Spiel. PodzDas von einem Team mitbegründete Unternehmen, das sich während seiner Arbeit bei Yahoo kennengelernt hat, versucht, einen Weg zu finden, das Problem der Auffindbarkeit zu lösen, das die heutigen Podcasts belastet. Aber darüber hinaus gibt es weitaus größere und bedeutungsvollere Pläne: Für die Audioarchive der Welt das zu tun, was Google für die Suche getan hat. Nämlich, es zu organisieren und allgemein zugänglich und nutzbar zu machen.

„Wir sagen gerne, dass wir im goldenen Zeitalter des Audios leben.“ Seye Ojumu, Chief Technology Officer bei Podz, sagte gegenüber Digital Trends. „Aber einige der Werkzeuge, die wir haben, um Dinge zu finden [zum Anhören], fühlen sich immer noch wie in der Steinzeit an.“

Audio, betont Ojumu, liegt derzeit im Zeitgeist. Podcasts sind riesig. Clubhaus explodiert. AirPods und andere tragbare Hörgeräte fliegen aus den Regalen, als ob sie aus der Mode geraten würden. Um es einfach auszudrücken: Die Leute hören sich gerne Dinge an. Oder, wie Ojumu es ausdrückt: „Menschen finden sich zunehmend in audiozentrischen, passiven Konsumerlebnissen wieder.“

Das Suchdilemma

Derzeit gibt es mehrere Möglichkeiten, Podcasts zu entdecken – und keine davon ist skalierbar genug, um dem Umfang der Herausforderung gerecht zu werden. Sie werden von Freunden empfohlen, sie werden in Podcasts beworben, die wir bereits hören, oder sie sind so bekannt, dass sie im Äther der Popkultur auftauchen, wie etwa ein weltbekannter Hit wie Seriell habe es vor ein paar Jahren gemacht.

Es gibt auch einige Suchfunktionen in Podcast-Apps, diese sind jedoch recht einfach. Auch wenn es für sie vielleicht in Ordnung ist, beispielsweise den von Ihrem Lieblingskomiker moderierten Podcast zu finden, ist das in etwa ihre Grenze. Sicher, sie helfen Ihnen möglicherweise dabei, die Episode des besagten Podcasts zu finden, in der beispielsweise Joe Rogan Elon Musk interviewt – aber Was wäre, wenn Sie, nachdem Sie Rogans Gespräch mit Musk genossen haben, nun alle anderen Podcast-Interviews mit Tesla und SpaceX finden möchten? CEO? Das ist schwieriger, aber immer noch erreichbar.

Podz

Was wäre, wenn Sie sich für etwas interessieren würden, das Musk während eines seiner Gespräche gesagt hat – vielleicht über das? Simulationshypothese – und wollte jedes Mal herausfinden, wann Musk in einem Podcast über dieses Thema gesprochen hat? Oder, um noch einen weiteren Aspekt hinzuzufügen: Was wäre, wenn Sie jedes Mal zuhören würden, wenn sich jemand mit vergleichbarem Einfluss wie Musk zu diesem Thema einmischt? Oder jede Person mit vergleichbarem Einfluss, die sich in einem 2021 aufgezeichneten Podcast mit einem fröhlichen Moderator mit britischem Akzent unterhält.

Eines der vielen Probleme, mit denen Leute konfrontiert sind, die versuchen, die Podcast-Erkennung zu knacken, besteht darin, dass Podcasts dazu neigen, groß und weitläufig zu sein. Wie bei jedem Gespräch springen die Leute von Thema zu Thema. Während sich alles andere in der Technik auf die Kürze zu konzentrieren scheint – One-Click-Shopping, 10-Sekunden-TikToks, differenzierte Konversation in Tweets – bleiben Podcasts trotzig langformatig. Großartig für Zuhörer, schlecht für die Suche.

Um die Auffindbarkeit von Podcasts zu „reparieren“, hat Podz eine KI entwickelt. auf 100.000 Stunden Audio trainiert, die die beliebtesten 5.000 durchforstet Podcasts (das ist die überwiegende Mehrheit der Podcasts, die die meisten Leute hören) und erstellt die fesselndsten 60-Sekunden-Beispielausschnitte, um ein Audio zu füllen Neuigkeiten.

Wie bei den Musikempfehlungen von Spotify wird es mit der Zeit intelligenter, da es Ihren Geschmack lernt. Der Nutzer kann von einem Beispiel zum nächsten springen, als würde er sich Instagram-Storys ansehen oder auf Tinder durch potenzielle Termine scrollen. Wenn ihnen der Klang eines bestimmten Podcasts gefällt, können sie eintauchen und ihn anhören.

„Grundsätzlich kommentieren wir alle Audiodaten, damit wir es wissen – in erster Näherung, und zwar nur geringfügig redaktionell – aber wir haben ein grundlegendes Verständnis der Kategorie, in die sich das Audio einfügt“, Ojumu erklärt. „Wir haben ein grundlegendes Verständnis der Moderatoren, die die Show tatsächlich moderieren. Und wenn wir darin besser werden, werden wir eine Vorstellung von den Gästen bekommen, die sprechen. Mit diesen Informationen haben Sie nun die Möglichkeit, von einem Inhalt, von einem kurzen Audio zu einem anderen kurzen Audio zu navigieren.“

Google für Audio

Wenn das alles wäre, wäre Podz eine gute Idee. Aber das ist noch nicht alles. Trotz seines Namens ist Podz nicht nur an der Lösung des Problems der Podcast-Erkennung interessiert – das ist zufällig auch das häufigste Beispiel für diese Herausforderung. Zu denken, dass es hier nur um Podcasts geht, ist so, als würde man denken, dass Apple ein Unternehmen ist, dessen Existenzberechtigung darin besteht, das iPhone 12 Pro Max zu verkaufen. Klar, das ist es, was es jetzt will, aber das ist ein kleines, kurzfristiges Ziel in einer viel größeren Mission. Was Podz wirklich tun möchte – und wenn es gelingt, ist dies eine Multimilliarden-Dollar-Idee –, ist, den Audiobereich genauso durchsuchbar zu machen wie den Textbereich.

Podz

„Heute liegt der Schwerpunkt hauptsächlich auf Podcasts“, sagte Ojumu. „Aber es könnte alles sein – die Originalquelle könnte ein Video sein, die Originalquelle könnte eine Rede sein, die eine Person gehalten hat. Alles, wo eine oder mehrere Personen reden.“ Er beschrieb das letztendliche Ziel des Teams als Erstellen einer „Allzweck-Audiosuche, bei der Sie alle jemals vorhandenen Audiodaten durchsuchen können.“ indiziert.“

Während dies derzeit noch ein Wunschtraum ist, besteht das Ziel darin, KI zu entwickeln. Werkzeuge, die alles durchkämmen können Audio und extrahieren Sie genau die Teile, die Sie wollen, sortiert nach Sprecher, Thema, Emotion, Sachinhalt, Ideen, usw. „Wir könnten [theoretisch] alles indizieren, was von irgendjemandem und überall aufgezeichnet wurde“, sagte Ojumu.

Im Moment ist das für ein Start-up „Fly before you walk“ – wenn auch ein gut finanziertes, mit Investoren wie Katie Couric und Paris Hilton. Aber selbst wenn es nicht Podz ist, das dieses Problem letztendlich löst, wird es das eine oder andere Startup sein, das es schafft. Und wenn sie es tun, könnten die Ergebnisse signifikant sein. „[Wenn Sie dies tun würden, wäre es möglich,] ein wenig über die Person zu verstehen, die [etwas] sagt, ein wenig zu verstehen über die Nuance, den Kontext verstehen, in der Lage sein, ihn in Zeit und Ort einzuordnen und dann in der Lage zu sein, danach intelligent zu suchen“, Ojumu sagte.

Die Vorteile könnten enorm sein – sowohl für Benutzer überall als auch für das Unternehmen, das es verwaltet. „Wenn du das hättest, wärst du Google, oder?“ er sagte. „Für Audio wären Sie Google.“

Empfehlungen der Redaktion

  • Die lustige Formel: Warum maschinengenerierter Humor der heilige Gral der KI ist