Tämä tekoäly voi huijata äänesi jo kolmen sekunnin kuluttua

Tekoäly (AI) on hetkinen juuri nyt, ja tuuli jatkaa purjeissaan, kun uutinen kertoo, että Microsoft työskentelee tekoälyn parissa, joka voi jäljitellä kenen tahansa ääntä sen jälkeen, kun sille on syötetty lyhyt kolmen sekunnin näyte.

Uusi työkalu, nimeltään VALL-E, on koulutettu noin 60 000 tunnin puhedataan englannin kielellä, mikä Microsoftin mukaan on "satoja kertoja suurempi kuin olemassa olevat järjestelmät". Tätä tietämystä hyödyntäen sen tekijät väittävät, että se tarvitsee vain pienen äänenvoimakkuuden ymmärtääkseen, kuinka käyttäjän ääni toistetaan.

mies puhuu puhelimeen — Fizkes/Shutterstock

Vieläkin vaikuttavampi, VALL-E voi toistaa jokaisessa näytteessä esiintyvät tunteet, lauluäänet ja akustisen ympäristön, minkä kanssa muut ääni-AI-ohjelmat ovat kamppailleet. Se antaa sille realistisemman auran ja tuo sen tulokset lähemmäksi jotain, mikä voisi olla aito ihmispuhe.

Liittyvät

GPT-4: kuinka käyttää AI-chatbotia, joka saa ChatGPT: n häpeään
Google Bard voi nyt puhua, mutta voiko se tukahduttaa ChatGPT: n?
Elon Muskin uuden tekoälyyrityksen tavoitteena on "ymmärtää maailmankaikkeus"

Verrattuna muihin tekstistä puheeksi (TTS) kilpailijoihin, Microsoft sanoo, että VALL-E "suorittaa huomattavasti huippuluokan nollakuvan TTS-järjestelmän puheen suhteen luonnollisuus ja puhujien samankaltaisuus." Toisin sanoen VALL-E kuulostaa paljon enemmän oikeilta ihmisiltä kuin kilpailevilta tekoälyiltä, jotka kohtaavat äänituloja, joita ei ole koulutettu päällä.

Suositellut videot

Microsoft on luonut GitHubissa a pieni näytekirjasto luotu VALL-E: llä. Tulokset ovat enimmäkseen erittäin vaikuttavia, ja monet näytteet toistavat kaiuttimien äänen sävytyksiä ja aksenttia. Jotkut esimerkit ovat vähemmän vakuuttavia, mikä osoittaa, että VALL-E ei todennäköisesti ole valmis tuote, mutta kokonaisuutena tulos on vakuuttava.

Valtava potentiaali ja riskit

Henkilö, joka soittaa videopuhelua Microsoft Surface -laitteella, jossa on Windows 11. — Microsoft/Unsplash

Jonkin sisällä paperi esittelee VALL-EMicrosoft selittää, että VALL-E "saattaa sisältää mahdollisia riskejä mallin väärinkäytöstä, kuten äänen huijaamisesta tietyn puhujan tunnistaminen tai esiintyminen." Tällainen pätevä työkalu realistiselta kuulostavan puhekorotusten luomiseen haamu yhä vakuuttavampia syväväärennöksiä, jota voitaisiin käyttää jäljittelemään mitä tahansa entisestä romanttisesta kumppanista näkyvään kansainväliseen persoonaan.

Tämän uhan lieventämiseksi Microsoft sanoo, että "on mahdollista rakentaa tunnistusmalli, joka erottaa, onko äänileikkeen syntetisoinut VALL-E". Yhtiö kertoo käyttävänsä myös omaansa AI periaatteet työtään kehittäessään. Nämä periaatteet kattavat esimerkiksi oikeudenmukaisuuden, turvallisuuden, yksityisyyden ja vastuullisuuden.

VALL-E on vain viimeisin esimerkki Microsoftin AI-kokeilusta. Viime aikoina yhtiö on työskennellyt integroida ChatGPT Bingiin, käyttämällä tekoälyä Kertaa Teams-kokouksetja varustamalla edistyneitä työkaluja sovelluksiin, kuten Outlook, Word ja PowerPoint. Ja Semaforin mukaan Microsoft pyrkii siihen sijoittaa 10 miljardia dollaria ChatGPT: n valmistajaan OpenAI: han, yritys, johon se on jo kynnyt merkittäviä varoja.

Ilmeisistä riskeistä huolimatta VALL-E: n kaltaiset työkalut voivat olla erityisen hyödyllisiä esimerkiksi lääketieteessä auttamaan ihmisiä saamaan äänensä takaisin onnettomuuden jälkeen. Mahdollisuus toistaa puhetta niin pienellä syöttöjoukolla voi olla erittäin lupaavaa näissä tilanteissa, jos se tehdään oikein. Mutta koska kaikki rahat käytetään tekoälyyn – sekä Microsoft että muut – on selvää, että se ei katoa pian.

Toimittajien suositukset

Huippukirjailijat vaativat tekoälyyrityksiltä maksua työnsä käytöstä
Parhaat AI-videonmuokkaustyökalut
ChatGPT-valmistaja OpenAI kohtaa FTC: n tutkinnan kuluttajansuojalaeista
Tekoälyn läpimurto voi tulla mehiläisten aivojen kautta, tutkijat sanovat
OpenAI rakentaa uutta tiimiä estääkseen superälykkään tekoälyn huijauksen

Päivitä elämäntapasiDigital Trends auttaa lukijoita pysymään tekniikan nopeatempoisessa maailmassa uusimpien uutisten, hauskojen tuotearvostelujen, oivaltavien toimitusten ja ainutlaatuisten kurkistusten avulla.

Tämä tekoäly voi huijata äänesi jo kolmen sekunnin kuluttua

Valtava potentiaali ja riskit

Toimittajien suositukset

Luokat

Viimeaikaiset

Fortnite Views Twitch Fallissa, Apex Legendsissä ei ole 10 parasta pelattua peliä

Cyberpunk 2077 sisältää ei-heteroseksuaalisia NPC-romanttisia vaihtoehtoja

Sony korostaa suhteita suurten pelien julkaisijoiden kanssa PS5:lle