Kalbos atpažinimo tekstai 3 kartus greičiau, nei galite įvesti

Stenfordo eksperimentas rodo, kad kalbos atpažinimas rašo tekstus greičiau nei nykščiai

Diktavimas kompiuteriu yra daug geresnis nei prieš dešimtmetį, bet kiek geriau? Tai buvo iššūkis kompiuterių mokslininkams iš Stanfordo universiteto, Vašingtono universiteto ir Kinijos technologijų milžino Baidu Neseniai ėmėsi eksperimento, supriešinančio žmones su naujausia pažangia kalbos atpažinimo programine įranga ir greičiu, ir tikslumu.

Stanfordo kompiuterių mokslų profesorius Jamesas Lenday sakė, kad tyrimas prasidėjo kaip „pokalbis kavinėje“ tarp jo ir Stanfordo docento Andrius Ng, šiuo metu vyriausiasis Baidu mokslininkas. „Andrew sakė, kad Baidu kalbos atpažinimo įrankiai darosi tikrai puikūs, bet jie nežinojo tinkamo eksperimento, kad būtų galima jį kiekybiškai įvertinti“, – „Digital Trends“ pasakojo Landay.

Rekomenduojami vaizdo įrašai

„Baidu's Deep Speech 2“ debesies pagrindu sukurta kalbos atpažinimo programinė įranga yra pagrįsta gilaus mokymosi neuroniniu tinklu: įspūdingas mašininio mokymosi įrankis, galintis lavinti save analizuodamas didžiulius realių duomenų rinkinius kalba.

Susijęs

  • A.I. gali pasakyti, ar esate geras chirurgas, tiesiog nuskaitęs smegenis
  • A.I. mokslininkai sukuria šimpanzių veido atpažinimo sistemą

„Anksčiau neturėjome duomenų ir skaičiavimo galimybių sukurti šiuos modelius, kad kompiuteris galėtų suprasti skirtingus kalbos akcentus ir modelius“, – tęsė Landay.

Galų gale atsitiktinis Landy ir Ng pokalbis virto visapusišku eksperimentu, kuriame dalyvavo 32 dalyviai, kalbantys kiniškai arba angliškai. Visi dalyviai buvo užaugę tekstiniais pranešimais ir abu naudojo standartines klaviatūras, kurios yra su „iPhone“.

Anglakalbiams tai reiškė įprastą iOS QWERTY klaviatūrą, o mandarinų kalbos garsiakalbiai naudojo Apple Pinyin klaviatūrą. Abiem atvejais kalbos atpažinimas buvo maždaug tris kartus greitesnis, nei vartotojai sugebėjo įvesti tekstą, kol įvyko klaida anglų kalbos atpažinimo rodiklis buvo 20,4 proc. mažesnis, o mandarinų kalbos atpažinimo – 63,4 proc. lygiavertis.

„Tikėjausi, kad kalba bus greitesnė nei tekstas“, – sakė Landėjus. „Mes tai žinome, nes galite kalbėti greičiau nei rašyti. Anksčiau problema buvo ta, kad gaudavote daug kalbos atpažinimo klaidų, o tai sulėtino. Maniau, kad kalba pasirodys greičiau. Ko nesitikėjau, buvo tai, kad jis baigsis tris kartus greičiau. Maniau, gal greičiau gausime 50 procentų. Vietoj to, tai buvo daug daugiau.

Žinoma, testas nėra 100 procentų išsamus. Šiuo metu greičiausia pasaulyje mobilioji klaviatūra (bent jau anglų kalba) yra trečiosios šalies Fleksy klaviatūra. 2014 m. Gineso rekordas už sparčiausią žinučių siuntimą vartotojas galėjo įvesti a 126 raidžių sakinys vos per 18,44 sekundės. Tačiau Landay pažymėjo, kad šis tyrimas pasirinko įprastą „iPhone“ klaviatūrą, nes ji gerai parodo tipišką mašinėją. „Dauguma žmonių neskiria laiko mokytis alternatyvių klaviatūrų“, – sakė jis.

Kalbant apie tyrimo reikšmę, Landay teigia, kad tai yra svarbus kalbos atpažinimo etalonas. „Dar yra kur tobulėti, bet manome, kad tam tikras posūkio taškas buvo pasiektas“, – sakė jis. „Tolimesni patobulinimai bus pavadinimų atpažinimo, geresnio veikimo triukšmingoje aplinkoje ir kt.

Tai, pasak jo, atveria daugiau galimybių kūrėjams rimčiau galvoti apie kalbos atpažinimo įtraukimą į savo sistemas be rūpesčių. „Vis labiau prasminga pasikliauti kalba“, – sakė jis. „Pavyzdžiui, multimodalinės sąsajos, jungiančios kalbą su kitais elementais, kad padėtų žmonėms naršyti. Tačiau didžiausias iššūkis bus suprasti prasmė žodžių ir sakinių. Ta dalis dar turi ką nuveikti.

Redaktorių rekomendacijos

  • „Alexa“ naudojimas yra sudėtingas, jei turite kalbos negalią. Voiceitt galėtų tai išspręsti
  • Kinijos įmonė, dirbanti veido atpažinimo srityje, galinti jus atpažinti po kauke
  • „Google“ „Gboard“ kalbos atpažinimas bus daug geresnis

Atnaujinkite savo gyvenimo būdąSkaitmeninės tendencijos padeda skaitytojams stebėti sparčiai besivystantį technologijų pasaulį – pateikiamos visos naujausios naujienos, smagios produktų apžvalgos, įžvalgūs vedamieji leidiniai ir unikalūs žvilgsniai.