AI za čitanje s usana razbija ljude u tumačenju tihih rečenica

LipNet: Što mislite koliko je jednostavno čitanje s usana?

Jedan od najupečatljivijih dijelova znanstveno-fantastičnog remek-djela Stanleyja Kubricka 2001: Odiseja u svemiru je zaplet u kojem dva člana Otkriće jedan posada svemirskog broda postaje sve sumnjičavija u vezi s ponašanjem brodskog AI pomoćnika, HAL 9000.

Znajući da HAL stalno sluša što govore, povlače se negdje gdje znaju da HAL ne može slušati i pristaju isključiti ga. HAL razotkriva njihov plan nakon što dva astronauta ne uzmu u obzir AI-jeve superiorne mogućnosti čitanja s usana.

Futurističke stvari, ha? Ne prema istraživanju koje su proveli istraživači sa Sveučilišta Oxford. Razvili su program umjetne inteligencije nazvan LipNet, koji može točno protumačiti što ljudi govore, isključivo na temelju načina na koji pomiču usta dok govore.

Povezano

  • Photoshop AI misli da je 'sreća' osmijeh s pokvarenim zubima
  • Predložio sam svoju smiješnu ideju pokretanja robotu VC-u
  • Kako ćemo znati kada umjetna inteligencija stvarno postane osjećajna?

"LipNet izvodi čitanje s usana na razini rečenice pomoću strojnog učenja," Brendan Shillingford, jedan od istraživača na papir, rekao je za Digital Trends. “Neuronska mreža slična najsuvremenijim modelima prepoznavanja govora obrađuje slijed video okvira, preslikavajući ih u rečenicu. Prethodni pristupi radili su na temelju predviđenih pojedinačnih riječi, a ne rečenica.”

Preporučeni videozapisi

Performanse LipNeta nevjerojatno su povoljne u usporedbi sa stručnjacima za čitanje s usana na GRID korpusu, najvećem javno dostupnom skupu podataka za čitanje s usana na razini rečenice. Zapravo, tamo gdje su ljudski stručnjaci dobili samo 52 posto, LipNet je postigao 93 posto. Njegov pristup čitanju s usana temeljen na rečenicama također je razbio najbolji prethodni pokušaj stroja, koji je postigao 79,6 posto točnosti na istom skupu podataka.

Međutim, dok fiktivni HAL 9000 koristi svoje moći čitanja s usana ni za što dobro, tim koji stoji iza LipNeta ima druge ciljeve za njihovo stvaranje. Oko 360 milijuna ljudi diljem svijeta ima oštećenje sluha. Alati kao što je LipNet mogli bi biti od velike važnosti za ove pojedince, pomažući u točnom tumačenju govora na način koji im olakšava život.

“Druge aplikacije koje nas zanimaju uključuju tiho diktiranje u javnim prostorima, tajne razgovore, prepoznavanje govora u bučnim okruženjima, biometrijska identifikacija i obrada nijemog filma,” Shillingford nastavio.

Dok će nadzor biti problem s bilo kojom ovakvom tehnologijom, Nando de Freitas, koji je također radio na projektu, rekao je da to nije aplikacija na koju su se fokusirali. Međutim, rekao je da "ne bi bilo iznenađujuće" da drugi laboratoriji pokušaju nadograditi takav rad u tu svrhu u budućnosti.

"Javnost mora biti svjesna toga i osloniti se na naše pravne demokratske institucije da uspostave odgovarajuće zakone koji štite našu privatnost i dostojanstvo", nastavio je de Freitas. "Nadamo se da ćemo objavljivanjem ovog rada pomoći u podizanju svijesti, dok još uvijek naglašavamo korisnost ove tehnologije za pomoć ljudima u potrebi."

Preporuke urednika

  • Appleov rival ChatGPT može automatski napisati kod za vas
  • Meta je napravio DALL-E za video, i to je i jezivo i nevjerojatno
  • Optičke iluzije mogle bi nam pomoći u izgradnji sljedeće generacije umjetne inteligencije
  • Lambdin laptop za strojno učenje prerušen je Razer
  • Pročitajte jezivo lijepe 'sintetičke spise' umjetne inteligencije. koji misli da je Bog

Nadogradite svoj životni stilDigitalni trendovi pomažu čitateljima da prate brzi svijet tehnologije sa svim najnovijim vijestima, zabavnim recenzijama proizvoda, pronicljivim uvodnicima i jedinstvenim brzim pregledima.