Taligenkänningstexter 3 gånger snabbare än du kan skriva

click fraud protection

Stanford-experiment visar att taligenkänning skriver texter snabbare än tummar

Datordiktering är mycket bättre än för ett decennium sedan, men exakt hur mycket bättre? Det var en utmaning för datavetare från Stanford University, University of Washington och den kinesiska teknikjätten Baidu tog nyligen upp i ett experiment som ställde människor mot den senaste spjutspetsiga programvaran för taligenkänning i både hastighet och noggrannhet.

Stanford professor i datavetenskap James Landay sade att studien började som en "kafékonversation" mellan honom själv och Stanford adjungerad professor Andrew Ng, för närvarande chefsforskare vid Baidu. "Andrew sa att Baidus taligenkänningsverktyg blev riktigt bra, men att de inte kände till rätt experiment för att kvantifiera det", sa Landay till Digital Trends.

Rekommenderade videor

Baidus Deep Speech 2 molnbaserad programvara för taligenkänning är baserad på ett neuralt nätverk för djupinlärning: ett imponerande maskininlärningsverktyg som kan träna sig själv genom att analysera enorma datamängder av verklig Tal.

Relaterad

  • A.I. kan se om du är en bra kirurg bara genom att skanna din hjärna
  • A.I. forskare skapar ett ansiktsigenkänningssystem för schimpanser

"Tidigare hade vi inte data och beräkningsförmåga att bygga dessa modeller, så att en dator kunde förstå olika accenter och talmönster," fortsatte Landay.

Till slut förvandlades det tillfälliga samtalet mellan Landay och Ng till ett fullständigt experiment, där 32 deltagare talade antingen kinesiska eller engelska. Alla deltagare hade vuxit upp med textmeddelanden och båda använde standardtangentbord som följer med iPhone.

För de engelsktalande innebar detta det vanliga iOS QWERTY-tangentbordet, medan mandarinhögtalarna använde Apples Pinyin-tangentbord. I båda fallen var taligenkänning cirka tre gånger snabbare än vad användarna kunde skriva - medan felet frekvensen var 20,4 procent lägre för den engelska taligenkänningen och 63,4 procent lägre för mandarin likvärdig.

"Min förväntan var att tal skulle vara snabbare än text," sa Landay. "Vi vet det här, för du kan prata snabbare än du kan skriva. Problemet förr var att du fick många fel med taligenkänning, och detta saktade ner dig. Jag trodde att tal skulle visa sig snabbare. Vad jag inte förväntade mig var att det skulle sluta bli tre gånger snabbare. Jag tänkte att vi kanske skulle bli 50 procent snabbare. Istället var det mycket mer än så."

Testet är naturligtvis inte 100 procent heltäckande. För närvarande är världens snabbaste mobiltangentbord (åtminstone på engelska) Fleksy-tangentbordet från tredje part. I ett Guinness världsrekord 2014 för snabbaste sms kunde en användare skriva ett 126 bokstäver mening på bara 18,44 sekunder. Landay noterade dock att denna studie valde ett vanligt iPhone-tangentbord eftersom det ger en bra indikation på den typiska maskinskrivaren. "De flesta tar sig inte tid att lära sig alternativa tangentbord," sa han.

När det gäller vad studien betyder, föreslår Landay att den representerar ett viktigt riktmärke för taligenkänning. "Det finns fortfarande utrymme att förbättra, men vi tror att någon form av böjningspunkt har passerats," sa han. "Ytterligare förbättringar kommer att komma i att känna igen namn, prestera bättre i bullriga miljöer, etc."

Detta, sade han, öppnar upp fler möjligheter för utvecklare att tänka mer seriöst på att införliva taligenkänning i sina system utan att behöva oroa sig. "Vad som blir alltmer vettigt är att förlita sig på tal," sa han. "Till exempel multimodala gränssnitt som kombinerar tal med andra element för att hjälpa människor att navigera. Den största utmaningen kommer dock att vara att förstå menande av ord och meningar. Den delen har fortfarande en väg att gå.”

Redaktörens rekommendationer

  • Att använda Alexa är knepigt om du har ett talsvårigheter. Voiceitt skulle kunna fixa det
  • Kinesiskt företag som arbetar med ansiktsigenkänning som kan identifiera dig under en mask
  • Googles Gboard är på väg att bli mycket bättre på taligenkänning

Uppgradera din livsstilDigitala trender hjälper läsare att hålla koll på den snabba teknikvärlden med alla de senaste nyheterna, roliga produktrecensioner, insiktsfulla redaktioner och unika smygtittar.