Lippenlesende KI übertrifft Menschen bei der Interpretation stiller Sätze

LipNet: Wie einfach ist Lippenlesen Ihrer Meinung nach?

Einer der denkwürdigsten Teile von Stanley Kubricks Science-Fiction-Meisterwerk 2001: Odyssee im Weltraum ist eine Handlung, in der zwei Mitglieder der Entdeckung Eins Die Raumschiffbesatzung wird zunehmend misstrauisch gegenüber dem Verhalten des KI-Assistenten des Schiffs, HAL 9000.

Da sie wissen, dass HAL ständig zuhört, was sie sagen, ziehen sie sich an einen Ort zurück, von dem sie wissen, dass HAL nicht zuhören kann, und stimmen zu, ihn zu trennen. HAL bringt ihren Plan ins Wanken, nachdem die beiden Astronauten dies nicht berücksichtigt haben Die überlegenen Fähigkeiten der KI zum Lippenlesen.

Futuristisches Zeug, oder? Nicht so laut Untersuchungen von Forschern der Universität Oxford. Sie haben ein künstliches Intelligenzprogramm namens LipNet entwickelt, das in der Lage ist, das Gesagte der Menschen allein anhand der Art und Weise, wie sie beim Sprechen ihren Mund bewegen, genau zu interpretieren.

Verwandt

  • Photoshop AI denkt, „Glück“ sei ein Lächeln mit faulen Zähnen
  • Ich habe meine lächerliche Startup-Idee einem Roboter-VC vorgestellt
  • Woher wissen wir, wann eine KI tatsächlich empfindungsfähig wird?

„LipNet führt mithilfe maschinellen Lernens Lippenlesen auf Satzebene durch.“ Brendan Shillingford, einer der Forscher auf dem Papier, sagte Digital Trends. „Ein neuronales Netzwerk, das modernen Spracherkennungsmodellen ähnelt, verarbeitet eine Folge von Videobildern und ordnet diese einem Satz zu. Frühere Ansätze arbeiteten mit der Vorhersage einzelner Wörter und nicht mit Sätzen.“

Empfohlene Videos

Die Leistung von LipNet schneidet im Vergleich zu menschlichen Lippenleseexperten im GRID-Korpus, dem größten öffentlich verfügbaren Lippenlesedatensatz auf Satzebene, unglaublich gut ab. Während menschliche Experten lediglich 52 Prozent erreichten, erreichte LipNet 93 Prozent. Sein satzbasierter Ansatz zum Lippenlesen übertraf auch den besten vorherigen Versuch einer Maschine, die bei demselben Datensatz eine Genauigkeit von 79,6 Prozent erreichte.

Doch während der fiktive HAL 9000 seine Lippenlesefähigkeiten nutzlos einsetzt, hat das Team hinter LipNet andere Ziele bei der Erschaffung. Weltweit leiden etwa 360 Millionen Menschen an einem Hörverlust, der zu Behinderungen führt. Tools wie LipNet könnten für diese Personen von großer Bedeutung sein, da sie dabei helfen, Sprache genau zu interpretieren und ihnen so das Leben zu erleichtern.

„Andere Anwendungen, an denen wir interessiert sind, umfassen stilles Diktieren im öffentlichen Raum, verdeckte Gespräche, Spracherkennung in lauten Umgebungen, biometrische Identifizierung und Stummfilmverarbeitung“, Shillingford Fortsetzung.

Während Überwachung bei jeder Technologie wie dieser ein Problem darstellen wird, Nando de Freitas, der ebenfalls an dem Projekt mitgearbeitet hat, sagte, dass es sich nicht um eine Anwendung handele, auf die sie sich konzentriert hätten. Er sagte jedoch, dass es „nicht überraschend“ wäre, wenn andere Labore in Zukunft versuchen würden, auf solchen Arbeiten zu diesem Zweck aufzubauen.

„Die Öffentlichkeit muss sich dessen bewusst sein und sich darauf verlassen, dass unsere rechtsstaatlichen demokratischen Institutionen geeignete Gesetze erlassen, die unsere Privatsphäre und Würde schützen“, fuhr de Freitas fort. „Wir hoffen, dass wir durch die Veröffentlichung dieser Arbeit dazu beitragen, das Bewusstsein zu schärfen und gleichzeitig den Nutzen dieser Technologie hervorzuheben, um Menschen in Not zu helfen.“

Empfehlungen der Redaktion

  • Der ChatGPT-Konkurrent von Apple schreibt möglicherweise automatisch Code für Sie
  • Meta hat DALL-E für Videos gemacht und es ist sowohl gruselig als auch erstaunlich
  • Optische Täuschungen könnten uns beim Aufbau der nächsten Generation der KI helfen
  • Lambdas Laptop für maschinelles Lernen ist ein getarnter Razer
  • Lesen Sie die unheimlich schöne „synthetische Schrift“ einer KI. das denkt, es sei Gott

Werten Sie Ihren Lebensstil aufDigital Trends hilft Lesern mit den neuesten Nachrichten, unterhaltsamen Produktrezensionen, aufschlussreichen Leitartikeln und einzigartigen Einblicken, den Überblick über die schnelllebige Welt der Technik zu behalten.