Lippenlesende KI übertrifft Menschen bei der Interpretation stiller Sätze

LipNet: Wie einfach ist Lippenlesen Ihrer Meinung nach?

Einer der denkwürdigsten Teile von Stanley Kubricks Science-Fiction-Meisterwerk 2001: Odyssee im Weltraum ist eine Handlung, in der zwei Mitglieder der Entdeckung Eins Die Raumschiffbesatzung wird zunehmend misstrauisch gegenüber dem Verhalten des KI-Assistenten des Schiffs, HAL 9000.

Da sie wissen, dass HAL ständig zuhört, was sie sagen, ziehen sie sich an einen Ort zurück, von dem sie wissen, dass HAL nicht zuhören kann, und stimmen zu, ihn zu trennen. HAL bringt ihren Plan ins Wanken, nachdem die beiden Astronauten dies nicht berücksichtigt haben Die überlegenen Fähigkeiten der KI zum Lippenlesen.

Futuristisches Zeug, oder? Nicht so laut Untersuchungen von Forschern der Universität Oxford. Sie haben ein künstliches Intelligenzprogramm namens LipNet entwickelt, das in der Lage ist, das Gesagte der Menschen allein anhand der Art und Weise, wie sie beim Sprechen ihren Mund bewegen, genau zu interpretieren.

Verwandt

Photoshop AI denkt, „Glück“ sei ein Lächeln mit faulen Zähnen

Ich habe meine lächerliche Startup-Idee einem Roboter-VC vorgestellt
Woher wissen wir, wann eine KI tatsächlich empfindungsfähig wird?

„LipNet führt mithilfe maschinellen Lernens Lippenlesen auf Satzebene durch.“ Brendan Shillingford, einer der Forscher auf dem Papier, sagte Digital Trends. „Ein neuronales Netzwerk, das modernen Spracherkennungsmodellen ähnelt, verarbeitet eine Folge von Videobildern und ordnet diese einem Satz zu. Frühere Ansätze arbeiteten mit der Vorhersage einzelner Wörter und nicht mit Sätzen.“

Empfohlene Videos

Die Leistung von LipNet schneidet im Vergleich zu menschlichen Lippenleseexperten im GRID-Korpus, dem größten öffentlich verfügbaren Lippenlesedatensatz auf Satzebene, unglaublich gut ab. Während menschliche Experten lediglich 52 Prozent erreichten, erreichte LipNet 93 Prozent. Sein satzbasierter Ansatz zum Lippenlesen übertraf auch den besten vorherigen Versuch einer Maschine, die bei demselben Datensatz eine Genauigkeit von 79,6 Prozent erreichte.

Doch während der fiktive HAL 9000 seine Lippenlesefähigkeiten nutzlos einsetzt, hat das Team hinter LipNet andere Ziele bei der Erschaffung. Weltweit leiden etwa 360 Millionen Menschen an einem Hörverlust, der zu Behinderungen führt. Tools wie LipNet könnten für diese Personen von großer Bedeutung sein, da sie dabei helfen, Sprache genau zu interpretieren und ihnen so das Leben zu erleichtern.

„Andere Anwendungen, an denen wir interessiert sind, umfassen stilles Diktieren im öffentlichen Raum, verdeckte Gespräche, Spracherkennung in lauten Umgebungen, biometrische Identifizierung und Stummfilmverarbeitung“, Shillingford Fortsetzung.

Während Überwachung bei jeder Technologie wie dieser ein Problem darstellen wird, Nando de Freitas, der ebenfalls an dem Projekt mitgearbeitet hat, sagte, dass es sich nicht um eine Anwendung handele, auf die sie sich konzentriert hätten. Er sagte jedoch, dass es „nicht überraschend“ wäre, wenn andere Labore in Zukunft versuchen würden, auf solchen Arbeiten zu diesem Zweck aufzubauen.

„Die Öffentlichkeit muss sich dessen bewusst sein und sich darauf verlassen, dass unsere rechtsstaatlichen demokratischen Institutionen geeignete Gesetze erlassen, die unsere Privatsphäre und Würde schützen“, fuhr de Freitas fort. „Wir hoffen, dass wir durch die Veröffentlichung dieser Arbeit dazu beitragen, das Bewusstsein zu schärfen und gleichzeitig den Nutzen dieser Technologie hervorzuheben, um Menschen in Not zu helfen.“

Empfehlungen der Redaktion

Der ChatGPT-Konkurrent von Apple schreibt möglicherweise automatisch Code für Sie
Meta hat DALL-E für Videos gemacht und es ist sowohl gruselig als auch erstaunlich
Optische Täuschungen könnten uns beim Aufbau der nächsten Generation der KI helfen
Lambdas Laptop für maschinelles Lernen ist ein getarnter Razer
Lesen Sie die unheimlich schöne „synthetische Schrift“ einer KI. das denkt, es sei Gott

Werten Sie Ihren Lebensstil aufDigital Trends hilft Lesern mit den neuesten Nachrichten, unterhaltsamen Produktrezensionen, aufschlussreichen Leitartikeln und einzigartigen Einblicken, den Überblick über die schnelllebige Welt der Technik zu behalten.

Lippenlesende KI übertrifft Menschen bei der Interpretation stiller Sätze

Empfehlungen der Redaktion

Kategorien

Kürzlich

Facebooks Twitter-Konto von der Hackergruppe OurMine gehackt

Gates Foundation und Amazon Care könnten Coronavirus-Kits bereitstellen

Das offizielle Xbox Magazine wird nach 18 Dienstjahren eingestellt