Tekoäly (AI) on hetkinen juuri nyt, ja tuuli jatkaa purjeissaan, kun uutinen kertoo, että Microsoft työskentelee tekoälyn parissa, joka voi jäljitellä kenen tahansa ääntä sen jälkeen, kun sille on syötetty lyhyt kolmen sekunnin näyte.
Uusi työkalu, nimeltään VALL-E, on koulutettu noin 60 000 tunnin puhedataan englannin kielellä, mikä Microsoftin mukaan on "satoja kertoja suurempi kuin olemassa olevat järjestelmät". Tätä tietämystä hyödyntäen sen tekijät väittävät, että se tarvitsee vain pienen äänenvoimakkuuden ymmärtääkseen, kuinka käyttäjän ääni toistetaan.
Vieläkin vaikuttavampi, VALL-E voi toistaa jokaisessa näytteessä esiintyvät tunteet, lauluäänet ja akustisen ympäristön, minkä kanssa muut ääni-AI-ohjelmat ovat kamppailleet. Se antaa sille realistisemman auran ja tuo sen tulokset lähemmäksi jotain, mikä voisi olla aito ihmispuhe.
Liittyvät
- GPT-4: kuinka käyttää AI-chatbotia, joka saa ChatGPT: n häpeään
- Google Bard voi nyt puhua, mutta voiko se tukahduttaa ChatGPT: n?
- Elon Muskin uuden tekoälyyrityksen tavoitteena on "ymmärtää maailmankaikkeus"
Verrattuna muihin tekstistä puheeksi (TTS) kilpailijoihin, Microsoft sanoo, että VALL-E "suorittaa huomattavasti huippuluokan nollakuvan TTS-järjestelmän puheen suhteen luonnollisuus ja puhujien samankaltaisuus." Toisin sanoen VALL-E kuulostaa paljon enemmän oikeilta ihmisiltä kuin kilpailevilta tekoälyiltä, jotka kohtaavat äänituloja, joita ei ole koulutettu päällä.
Suositellut videot
Microsoft on luonut GitHubissa a pieni näytekirjasto luotu VALL-E: llä. Tulokset ovat enimmäkseen erittäin vaikuttavia, ja monet näytteet toistavat kaiuttimien äänen sävytyksiä ja aksenttia. Jotkut esimerkit ovat vähemmän vakuuttavia, mikä osoittaa, että VALL-E ei todennäköisesti ole valmis tuote, mutta kokonaisuutena tulos on vakuuttava.
Valtava potentiaali ja riskit
Jonkin sisällä paperi esittelee VALL-EMicrosoft selittää, että VALL-E "saattaa sisältää mahdollisia riskejä mallin väärinkäytöstä, kuten äänen huijaamisesta tietyn puhujan tunnistaminen tai esiintyminen." Tällainen pätevä työkalu realistiselta kuulostavan puhekorotusten luomiseen haamu yhä vakuuttavampia syväväärennöksiä, jota voitaisiin käyttää jäljittelemään mitä tahansa entisestä romanttisesta kumppanista näkyvään kansainväliseen persoonaan.
Tämän uhan lieventämiseksi Microsoft sanoo, että "on mahdollista rakentaa tunnistusmalli, joka erottaa, onko äänileikkeen syntetisoinut VALL-E". Yhtiö kertoo käyttävänsä myös omaansa AI periaatteet työtään kehittäessään. Nämä periaatteet kattavat esimerkiksi oikeudenmukaisuuden, turvallisuuden, yksityisyyden ja vastuullisuuden.
VALL-E on vain viimeisin esimerkki Microsoftin AI-kokeilusta. Viime aikoina yhtiö on työskennellyt integroida ChatGPT Bingiin, käyttämällä tekoälyä Kertaa Teams-kokouksetja varustamalla edistyneitä työkaluja sovelluksiin, kuten Outlook, Word ja PowerPoint. Ja Semaforin mukaan Microsoft pyrkii siihen sijoittaa 10 miljardia dollaria ChatGPT: n valmistajaan OpenAI: han, yritys, johon se on jo kynnyt merkittäviä varoja.
Ilmeisistä riskeistä huolimatta VALL-E: n kaltaiset työkalut voivat olla erityisen hyödyllisiä esimerkiksi lääketieteessä auttamaan ihmisiä saamaan äänensä takaisin onnettomuuden jälkeen. Mahdollisuus toistaa puhetta niin pienellä syöttöjoukolla voi olla erittäin lupaavaa näissä tilanteissa, jos se tehdään oikein. Mutta koska kaikki rahat käytetään tekoälyyn – sekä Microsoft että muut – on selvää, että se ei katoa pian.
Toimittajien suositukset
- Huippukirjailijat vaativat tekoälyyrityksiltä maksua työnsä käytöstä
- Parhaat AI-videonmuokkaustyökalut
- ChatGPT-valmistaja OpenAI kohtaa FTC: n tutkinnan kuluttajansuojalaeista
- Tekoälyn läpimurto voi tulla mehiläisten aivojen kautta, tutkijat sanovat
- OpenAI rakentaa uutta tiimiä estääkseen superälykkään tekoälyn huijauksen
Päivitä elämäntapasiDigital Trends auttaa lukijoita pysymään tekniikan nopeatempoisessa maailmassa uusimpien uutisten, hauskojen tuotearvostelujen, oivaltavien toimitusten ja ainutlaatuisten kurkistusten avulla.