Diese KI kann Ihre Stimme bereits nach drei Sekunden fälschen

Künstliche Intelligenz (KI) ist Ich habe gerade einen Moment Zeit, und der Wind weht weiter in seinen Segeln mit der Nachricht, dass Microsoft an einer KI arbeitet, die die Stimme eines jeden nachahmen kann, nachdem ihm ein kurzes dreisekündiges Sample zugeführt wird.

Das neue Tool mit dem Namen VALL-E wurde mit rund 60.000 Stunden Sprachdaten in englischer Sprache trainiert, die laut Microsoft „Hunderte Male größer sind als bestehende Systeme“. Mithilfe dieses Wissens behaupten die Entwickler, dass nur ein paar Spracheingaben erforderlich sind, um zu verstehen, wie die Stimme eines Benutzers nachgebildet werden kann.

Mann spricht ins Telefon
Fizkes/Shutterstock

Noch beeindruckender ist, dass VALL-E die Emotionen, Stimmtöne und die akustische Umgebung jedes Samples reproduzieren kann, womit andere Sprach-KI-Programme Probleme hatten. Das verleiht ihm eine realistischere Aura und bringt seine Ergebnisse näher an etwas heran, das als echte menschliche Sprache gelten könnte.

Verwandt

  • GPT-4: So verwenden Sie den KI-Chatbot, der ChatGPT in den Schatten stellt
  • Google Bard kann jetzt sprechen, aber kann es ChatGPT übertönen?
  • Elon Musks neues KI-Unternehmen will „das Universum verstehen“

Im Vergleich zu anderen Text-to-Speech (TTS)-Konkurrenten übertrifft VALL-E laut Microsoft „das hochmoderne Zero-Shot-TTS-System in Bezug auf Sprache deutlich.“ Natürlichkeit und Sprecherähnlichkeit.“ Mit anderen Worten: VALL-E klingt viel mehr wie echte Menschen als konkurrierende KIs, die auf Audioeingaben stoßen, die ihnen nicht beigebracht wurden An.

Empfohlene Videos

Auf GitHub hat Microsoft eine erstellt kleine Probenbibliothek erstellt mit VALL-E. Die Ergebnisse sind größtenteils sehr beeindruckend, mit vielen Samples, die den Akzent und die Betonung der Stimmen der Sprecher reproduzieren. Einige der Beispiele sind weniger überzeugend, was darauf hindeutet, dass VALL-E wahrscheinlich kein fertiges Produkt ist, aber insgesamt ist das Ergebnis überzeugend.

Riesiges Potenzial – und Risiken

Eine Person führt einen Videoanruf auf einem Microsoft Surface-Gerät mit Windows 11.
Microsoft/Unsplash

In einem Papier zur Einführung von VALL-EMicrosoft erklärt, dass VALL-E „potenzielle Risiken bei Missbrauch des Modells bergen kann, wie zum Beispiel Sprachfälschung.“ Identifizierung oder Nachahmung eines bestimmten Sprechers.“ Solch ein leistungsfähiges Werkzeug zum Erzeugen realistisch klingender Sprachansagen das Gespenst von Immer überzeugendere Deepfakes, das verwendet werden könnte, um alles nachzuahmen, von einem ehemaligen romantischen Partner bis hin zu einer prominenten internationalen Persönlichkeit.

Um diese Bedrohung zu mindern, sagt Microsoft: „Es ist möglich, ein Erkennungsmodell zu erstellen, um zu unterscheiden, ob ein Audioclip von VALL-E synthetisiert wurde.“ Das Unternehmen sagt, dass es auch seine eigenen nutzen wird KI-Prinzipien bei der Entwicklung seiner Arbeit. Diese Grundsätze umfassen Bereiche wie Fairness, Sicherheit, Datenschutz und Rechenschaftspflicht.

VALL-E ist nur das jüngste Beispiel für Microsofts Experimente mit KI. Vor kurzem hat das Unternehmen daran gearbeitet Integration von ChatGPT in Bing, mithilfe von KI Fassen Sie Ihre Teams-Besprechungen noch einmal zusammenund das Einbinden erweiterter Tools in Apps wie Outlook, Word und PowerPoint. Und laut Semafor ist Microsoft dabei Investieren Sie 10 Milliarden US-Dollar in den ChatGPT-Hersteller OpenAI, ein Unternehmen, in das es bereits erhebliche Mittel gesteckt hat.

Trotz der offensichtlichen Risiken könnten Tools wie VALL-E insbesondere in der Medizin nützlich sein, etwa um Menschen nach einem Unfall dabei zu helfen, ihre Stimme wiederzuerlangen. Die Möglichkeit, Sprache mit einem so kleinen Eingabesatz zu reproduzieren, könnte in solchen Situationen äußerst vielversprechend sein, vorausgesetzt, es wird richtig gemacht. Aber angesichts all des Geldes, das sowohl von Microsoft als auch von anderen für KI ausgegeben wird, ist klar, dass es so schnell nicht verschwinden wird.

Empfehlungen der Redaktion

  • Top-Autoren verlangen von KI-Firmen eine Bezahlung für die Nutzung ihrer Arbeit
  • Die besten KI-Videobearbeitungstools
  • Der ChatGPT-Hersteller OpenAI steht vor einer FTC-Untersuchung wegen Verbraucherschutzgesetzen
  • KI-Durchbrüche könnten über das Gehirn von Bienen erfolgen, sagen Wissenschaftler
  • OpenAI baut neues Team auf, um zu verhindern, dass superintelligente KI abtrünnig wird

Werten Sie Ihren Lebensstil aufDigital Trends hilft Lesern mit den neuesten Nachrichten, unterhaltsamen Produktrezensionen, aufschlussreichen Leitartikeln und einzigartigen Einblicken, den Überblick über die schnelllebige Welt der Technik zu behalten.