Stanfordin kokeilu osoittaa, että puheentunnistus kirjoittaa tekstiä nopeammin kuin peukalot
Stanfordin tietojenkäsittelytieteen professori James Landay sanoi, että tutkimus alkoi "kahvilakeskusteluna" hänen ja Stanfordin dosentin välillä Andrew Ng, tällä hetkellä Baidun johtava tutkija. "Andrew sanoi, että Baidun puheentunnistustyökalut olivat tulossa todella mahtaviksi, mutta he eivät tienneet oikeaa kokeilua sen kvantifioimiseksi", Landay kertoi Digital Trendsille.
Suositellut videot
Baidun Deep Speech 2 pilvipohjainen puheentunnistusohjelmisto perustuu syväoppivaan hermoverkkoon: vaikuttava koneoppimistyökalu, joka pystyy kouluttamaan itseään analysoimalla valtavia todellisia tietojoukkoja puhetta.
Liittyvät
- A.I. voit kertoa oletko hyvä kirurgi vain skannaamalla aivosi
- A.I. tutkijat luovat simpanssien kasvojentunnistusjärjestelmän
"Aiemmin meillä ei ollut dataa ja laskentakykyä näiden mallien rakentamiseen, jotta tietokone voisi ymmärtää erilaisia aksentteja ja puhemalleja", Landay jatkoi.
Lopulta Landayn ja Ngin välinen rento keskustelu muuttui täydelliseksi kokeiluksi, johon osallistui 32 osallistujaa, jotka puhuivat joko kiinaa tai englantia. Kaikki osallistujat olivat varttuneet tekstiviestien lähettämiseen, ja molemmat käyttivät iPhonen mukana tulleita tavallisia näppäimistöjä.
Englanninkielisille tämä tarkoitti tavallista iOS QWERTY -näppäimistöä, kun taas mandariinikiinalaiset käyttivät Applen Pinyin-näppäimistöä. Molemmissa tapauksissa puheentunnistus oli noin kolme kertaa nopeampi kuin käyttäjät pystyivät kirjoittamaan - virheen aikana englannin puheentunnistuksen osuus oli 20,4 prosenttia ja mandariinikiinan 63,4 prosenttia pienempi. vastaava.
"Odotin, että puhe olisi nopeampaa kuin teksti", Landay sanoi. "Tiedämme tämän, koska voit puhua nopeammin kuin kirjoittaa. Aiemmin ongelma oli, että sait paljon virheitä puheentunnistuksessa, ja tämä hidasti toimintaasi. Luulin puheen käyvän nopeammin. En odottanut, että se päätyisi kolme kertaa nopeammin. Ajattelin, että ehkä saamme 50 prosenttia nopeammin. Sen sijaan se oli paljon enemmän."
Testi ei tietenkään ole 100-prosenttisesti kattava. Tällä hetkellä maailman nopein mobiilinäppäimistö (ainakin englanniksi) on kolmannen osapuolen Fleksy-näppäimistö. Vuonna 2014 nopeimman tekstiviestien Guinnessin maailmanennätyskirjassa käyttäjä pystyi kirjoittamaan a 126-kirjaiminen lause vain 18,44 sekunnissa. Landay kuitenkin huomautti, että tässä tutkimuksessa valittiin tavallinen iPhone-näppäimistö, koska se antaa hyvän kuvan tyypillisestä konekirjoittajasta. "Useimmat ihmiset eivät käytä aikaa vaihtoehtoisten koskettimien oppimiseen", hän sanoi.
Mitä tulee tutkimukseen, Landayn mukaan se on tärkeä vertailukohta puheentunnistuksessa. "Parannettavaa on vielä, mutta uskomme, että jonkinlainen käännekohta on ohitettu", hän sanoi. "Lisäparannuksia tulee nimien tunnistamiseen, suorituskykyyn meluisissa ympäristöissä jne."
Hän sanoi, että tämä avaa kehittäjille enemmän mahdollisuuksia harkita vakavammin puheentunnistuksen sisällyttämistä järjestelmiinsä huoletta. "Se, mikä on yhä järkevämpää, on luottaa puheeseen", hän sanoi. ”Esimerkiksi multimodaaliset rajapinnat, joissa puhe yhdistetään muihin elementteihin, jotka auttavat ihmisiä navigoimaan. Suurin haaste on kuitenkin sen ymmärtäminen merkitys sanoista ja lauseista. Tällä osuudella on vielä matkaa."
Toimittajien suositukset
- Alexan käyttäminen on hankalaa, jos sinulla on puhevamma. Voiceitt voisi korjata sen
- Kiinalainen yritys, joka työskentelee kasvojentunnistuksen parissa, joka tunnistaa sinut maskin alla
- Googlen Gboard on tulossa paljon paremmaksi puheentunnistuksessa
Päivitä elämäntapasiDigital Trends auttaa lukijoita pysymään tekniikan nopeatempoisessa maailmassa uusimpien uutisten, hauskojen tuotearvostelujen, oivaltavien toimitusten ja ainutlaatuisten kurkistusten avulla.