Une expérience de Stanford montre que la reconnaissance vocale permet d'écrire des textes plus rapidement que les pouces
Professeur d'informatique à Stanford James Landay a déclaré que l’étude avait commencé comme une « conversation dans un café » entre lui et le professeur adjoint de Stanford. Andrew Ng, actuellement scientifique en chef chez Baidu. "Andrew a déclaré que les outils de reconnaissance vocale de Baidu devenaient vraiment géniaux, mais qu'ils ne connaissaient pas la bonne expérience pour les quantifier", a déclaré Landay à Digital Trends.
Vidéos recommandées
Le logiciel de reconnaissance vocale basé sur le cloud Deep Speech 2 de Baidu est basé sur un réseau neuronal d'apprentissage profond: un outil d'apprentissage automatique impressionnant, capable de s'auto-entraîner en analysant d'énormes ensembles de données réelles. discours.
En rapport
- I.A. je peux savoir si vous êtes un bon chirurgien simplement en scannant votre cerveau
- I.A. des chercheurs créent un système de reconnaissance faciale pour les chimpanzés
"Auparavant, nous n'avions pas les données ni la capacité informatique nécessaires pour construire ces modèles, de sorte qu'un ordinateur puisse comprendre différents accents et modèles de discours", a poursuivi Landay.
En fin de compte, la conversation informelle entre Landay et Ng s'est transformée en une expérience à part entière, impliquant 32 participants parlant chinois ou anglais. Tous les participants avaient grandi avec la messagerie texte et tous deux utilisaient les claviers standard fournis avec l'iPhone.
Pour les anglophones, cela signifiait le clavier QWERTY iOS standard, tandis que les locuteurs mandarin utilisaient le clavier Pinyin d'Apple. Dans les deux cas, la reconnaissance vocale était environ trois fois plus rapide que ce que les utilisateurs étaient capables de taper, tandis que l'erreur le taux était inférieur de 20,4 pour cent pour la reconnaissance vocale en anglais et de 63,4 pour cent pour le mandarin. équivalent.
"Je m'attendais à ce que la parole soit plus rapide que le texte", a déclaré Landay. « Nous le savons, car vous pouvez parler plus vite que vous ne pouvez écrire. Le problème dans le passé était que vous aviez beaucoup d’erreurs avec la reconnaissance vocale, ce qui vous ralentissait. Je pensais que la parole serait plus rapide. Ce à quoi je ne m’attendais pas, c’est que cela finirait par être trois fois plus rapide. Je pensais que nous pourrions peut-être obtenir 50 pour cent plus vite. Au lieu de cela, c’était bien plus que cela.
Bien entendu, le test n’est pas complet à 100 %. Actuellement, le clavier mobile le plus rapide au monde (du moins en anglais) est le clavier Fleksy tiers. Dans un record du monde Guinness 2014 pour l'envoi de SMS le plus rapide, un utilisateur a pu taper un Phrase de 126 lettres en seulement 18,44 secondes. Cependant, Landay a noté que cette étude a choisi un clavier iPhone classique car il donne une bonne indication du dactylographe typique. "La plupart des gens ne prennent pas le temps d'apprendre des claviers alternatifs", a-t-il déclaré.
Quant à la signification de l'étude, Landay suggère qu'elle représente une référence importante pour la reconnaissance vocale. « Il y a encore place à l’amélioration, mais nous pensons qu’une sorte de point d’inflexion a été franchi », a-t-il déclaré. "D'autres améliorations concerneront la reconnaissance des noms, de meilleures performances dans des environnements bruyants, etc."
Selon lui, cela ouvre davantage de possibilités aux développeurs pour réfléchir plus sérieusement à l'intégration sans souci de la reconnaissance vocale dans leurs systèmes. « Ce qui aura de plus en plus de sens, c’est de s’appuyer sur la parole », a-t-il déclaré. « Par exemple, des interfaces multimodales combinant la parole avec d’autres éléments pour aider les gens à naviguer. Le plus grand défi, cependant, sera de comprendre le signification de mots et de phrases. Cette partie a encore du chemin à parcourir.
Recommandations des rédacteurs
- Utiliser Alexa est délicat si vous avez un trouble de la parole. Voiceitt pourrait résoudre ce problème
- Une entreprise chinoise travaille sur une reconnaissance faciale capable de vous identifier sous un masque
- Le Gboard de Google est sur le point de s'améliorer en matière de reconnaissance vocale
Améliorez votre style de vieDigital Trends aide les lecteurs à garder un œil sur le monde en évolution rapide de la technologie avec toutes les dernières nouvelles, des critiques de produits amusantes, des éditoriaux perspicaces et des aperçus uniques.