Ta sztuczna inteligencja może sfałszować Twój głos już po trzech sekundach

click fraud protection

Sztuczna inteligencja (AI) tak mieć teraz chwilę, a wiatr w dalszym ciągu wiał w żagle wraz z wiadomością, że Microsoft pracuje nad sztuczną inteligencją, która może imitować głos dowolnej osoby po otrzymaniu krótkiej, trzysekundowej próbki.

Nowe narzędzie, nazwane VALL-E, zostało przeszkolone na podstawie około 60 000 godzin danych głosowych w języku angielskim, co według Microsoftu jest „setki razy większe niż istniejące systemy”. Korzystając z tej wiedzy, twórcy twierdzą, że wystarczy niewielka ilość głosu, aby zrozumieć, jak odtworzyć głos użytkownika.

mężczyzna rozmawiający przez telefon
Fizkesa/Shutterstocka

Co bardziej imponujące, VALL-E może odtworzyć emocje, tony wokalne i środowisko akustyczne występujące w każdej próbce, z czym borykały się inne programy głosowe AI. Nadaje mu to bardziej realistyczną aurę i zbliża rezultaty do czegoś, co mogłoby uchodzić za autentyczną ludzką mowę.

Powiązany

  • GPT-4: jak korzystać z chatbota AI, który zawstydza ChatGPT
  • Google Bard może teraz mówić, ale czy może zagłuszyć ChatGPT?
  • Nowa firma Elona Muska zajmująca się sztuczną inteligencją ma na celu „zrozumienie wszechświata”

W porównaniu z innymi konkurentami zajmującymi się zamianą tekstu na mowę (TTS) Microsoft twierdzi, że VALL-E „znacznie przewyższa najnowocześniejszy system TTS typu zero-shot pod względem mowy naturalność i podobieństwo głośników.” Innymi słowy, VALL-E brzmi znacznie bardziej jak prawdziwi ludzie niż konkurencyjne AI, które napotykają wejścia audio, których nie przeszkolono NA.

Polecane filmy

W serwisie GitHub firma Microsoft utworzyła plik mała biblioteka próbek utworzone przy użyciu VALL-E. Wyniki są w większości bardzo imponujące, z wieloma próbkami odtwarzającymi śpiew i akcent głosów mówiących. Niektóre przykłady są mniej przekonujące, co wskazuje, że VALL-E prawdopodobnie nie jest gotowym produktem, ale ogólnie wynik jest przekonujący.

Ogromny potencjał — i ryzyko

Osoba prowadząca rozmowę wideo na urządzeniu Microsoft Surface z systemem Windows 11.
Microsoft/Unsplash

W artykuł przedstawiający VALL-EMicrosoft wyjaśnia, że ​​VALL-E „może wiązać się z potencjalnym ryzykiem związanym z niewłaściwym użyciem modelu, takim jak fałszowanie głosu identyfikacji lub podszywania się pod konkretnego mówcę.” Takie skuteczne narzędzie do generowania realistycznie brzmiących dźwięków mowy widmo coraz bardziej przekonujące deepfakes, którego można użyć do naśladowania wszystkiego, od byłego partnera romantycznego po wybitną osobistość międzynarodową.

Aby złagodzić to zagrożenie, Microsoft twierdzi, że „można zbudować model wykrywania pozwalający na rozróżnienie, czy klip audio został zsyntetyzowany przez VALL-E”. Firma twierdzi, że wykorzysta również własne Zasady sztucznej inteligencji podczas rozwijania swojej pracy. Zasady te obejmują takie obszary, jak uczciwość, bezpieczeństwo, prywatność i odpowiedzialność.

VALL-E to tylko najnowszy przykład eksperymentów Microsoftu ze sztuczną inteligencją. Ostatnio firma podjęła prace nad integracja ChatGPT z Bing, używając sztucznej inteligencji do podsumuj spotkania w aplikacji Teamsi przeszczepianie zaawansowanych narzędzi do aplikacji takich jak Outlooka, Worda i PowerPointa. A według Semafora Microsoft tego szuka zainwestuj 10 miliardów dolarów w OpenAI, twórcę ChatGPT, firmie, w którą zainwestował już znaczne środki.

Pomimo oczywistych zagrożeń narzędzia takie jak VALL-E mogą być szczególnie przydatne w medycynie, na przykład pomagając ludziom odzyskać głos po wypadku. Możliwość odtworzenia mowy przy tak małym zestawie wejściowym może być niezwykle obiecująca w takich sytuacjach, pod warunkiem, że zostanie wykonana prawidłowo. Jednak biorąc pod uwagę wszystkie pieniądze wydawane na sztuczną inteligencję – zarówno przez Microsoft, jak i inne firmy – jasne jest, że nie zniknie ona w najbliższym czasie.

Zalecenia redaktorów

  • Czołowi autorzy żądają zapłaty od firm zajmujących się sztuczną inteligencją za korzystanie z ich pracy
  • Najlepsze narzędzia do edycji wideo AI
  • Twórca ChatGPT, OpenAI, staje przed dochodzeniem FTC w sprawie przepisów dotyczących ochrony konsumentów
  • Naukowcy twierdzą, że przełomowe rozwiązania w zakresie sztucznej inteligencji mogą nastąpić dzięki mózgom pszczół
  • OpenAI buduje nowy zespół, aby powstrzymać superinteligentną sztuczną inteligencję przed zbuntowaniem się

Ulepsz swój styl życiaDigital Trends pomaga czytelnikom śledzić szybko rozwijający się świat technologii dzięki najnowszym wiadomościom, zabawnym recenzjom produktów, wnikliwym artykułom redakcyjnym i jedynym w swoim rodzaju zajawkom.