Teaser – Obama synthetisieren: Lippensynchronisation aus Audio lernen
Nun, es tut uns leid, Ihnen mitteilen zu müssen, dass die Dinge noch viel, viel schlimmer werden werden!
Empfohlene Videos
Zumindest basiert das auf einer ehrlich gesagt verrückten Demonstration künstlicher Intelligenz durchgeführt von Informatikern der University of Washington. Mit modernster Technik künstliche neuronale Netz, haben sie eine KI entwickelt, die in der Lage ist, neues Videomaterial der Rede des ehemaligen Präsidenten Barack Obama zu produzieren, das perfekt mit den aufgezeichneten Audioaufnahmen von ihm übereinstimmt.
„Wir haben einen Algorithmus entwickelt, der aus seiner Stimme ein glaubwürdiges Video von Obama generieren kann, basierend auf a wiederkehrendes neuronales Netzwerk, das lernt, wie das geht, indem es Stunden von Obamas wöchentlicher Ansprache analysiert Filmmaterial,"
Dr. Supasorn Suwajanakorn, ein Forscher des Projekts, sagte gegenüber Digital Trends. „Im Gegensatz zu früheren Arbeiten benötigen wir nie einen Scan des Probanden oder eine Sprachdatenbank, die aus Videos vieler Menschen besteht, die vorgegebene Sätze sagen. Wir erfahren dies aus nur vorhandenem Filmmaterial. Dies hat das Potenzial, mit minimalem Aufwand auf jeden anwendbar zu sein.“
Warum wählten die Forscher angesichts dieser Tatsache Leute wie Barack Obama aus, um die atemberaubende Tech-Demo durchzuführen? Nein, es hat keine parteipolitischen Gründe. „Die von uns verwendete Technik – Deep Learning – erfordert viele Daten“, fuhr Suwajanakorn fort. „Und dieser Datensatz ist gut geeignet, weil er umfangreich ist: über 20 Stunden, einfach zu sammeln, enthält nur Obama in hoher Auflösung und ist gemeinfrei, was für Forscher kostenlos nutzbar ist.“
Es ist erwähnenswert, dass die Forscher keine CGI-Version von Obama von Grund auf erstellen. Stattdessen machen sie eine anspruchsvollere Version dessen, was die Filmemacher hinter a filmartig Forrest Gump mit Archivmaterial gemacht: Nehmen Sie ein vorhandenes Video und bearbeiten Sie es dann, um es an den neuen Dialog anzupassen. In diesem Fall bedeutet das, Obamas Mund so zu bewegen, dass er zu dem passt, was er im Audio sagt – und zwar die ganze Zeit Dabei wird alles einbezogen, was die KI über seine einzigartigen Mundbewegungen gelernt hat, um es erscheinen zu lassen authentisch.
Wir sind fasziniert – wenn auch beunruhigt – zu sehen, was passiert, wenn jemand die Forschung der University of Washington damit vermischt vorheriges Projekt, mithilfe eines neuronalen Netzwerks die Stimme (unter anderem) von Präsident Obama nachahmen.
Sehen Sie, was wir über die Zukunft von Fake News gesagt haben?
Empfehlungen der Redaktion
- Photoshop AI denkt, „Glück“ sei ein Lächeln mit faulen Zähnen
- Optische Täuschungen könnten uns beim Aufbau der nächsten Generation der KI helfen
- Rückblick auf den Aufstieg der KI: Wie weit ist die künstliche Intelligenz seit 2010 gekommen?
- Der Hausgutachter der Zukunft ist wahrscheinlich eine KI. Algorithmus
- K.I. kann Galaxienhaufen erkennen, die Millionen von Lichtjahren entfernt sind
Werten Sie Ihren Lebensstil aufDigital Trends hilft Lesern mit den neuesten Nachrichten, unterhaltsamen Produktrezensionen, aufschlussreichen Leitartikeln und einzigartigen Einblicken, den Überblick über die schnelllebige Welt der Technik zu behalten.