სტენფორდის ექსპერიმენტმა აჩვენა, რომ მეტყველების ამოცნობა წერს ტექსტებს უფრო სწრაფად, ვიდრე თითები
სტენფორდის კომპიუტერული მეცნიერების პროფესორი ჯეიმს ლენდეი თქვა, რომ კვლევა დაიწყო, როგორც „ყავის საუბრის“ მისა და სტენფორდის თანაშემწე პროფესორს შორის ანდრია ნგ, ამჟამად Baidu-ს მთავარი მეცნიერი. „ენდრიუმ თქვა, რომ Baidu-ს მეტყველების ამოცნობის ხელსაწყოები მართლაც მშვენიერი ხდებოდა, მაგრამ მათ არ იცოდნენ სწორი ექსპერიმენტი მისი რაოდენობრივი დასადგენად“, განუცხადა ლანდეიმ Digital Trends-ს.
რეკომენდებული ვიდეოები
Baidu-ს Deep Speech 2 ღრუბელზე დაფუძნებული მეტყველების ამოცნობის პროგრამული უზრუნველყოფა დაფუძნებულია ღრმა სწავლის ნერვულ ქსელზე: მანქანათმცოდნეობის შთამბეჭდავი ინსტრუმენტი, რომელსაც შეუძლია საკუთარი თავის მომზადება რეალური მონაცემთა უზარმაზარი ნაკრების ანალიზით მეტყველება.
დაკავშირებული
- ა.ი. შეგიძლიათ გაიგოთ, ხართ თუ არა კარგი ქირურგი მხოლოდ თქვენი ტვინის სკანირებით
- ა.ი. მკვლევარები შიმპანზეების სახის ამოცნობის სისტემას ქმნიან
„ადრე ჩვენ არ გვქონდა მონაცემები და გამოთვლითი უნარი ამ მოდელების შესაქმნელად, რათა კომპიუტერს შეეძლო გაეგო მეტყველების სხვადასხვა აქცენტები და ნიმუშები“, - განაგრძო ლანდეიმ.
საბოლოოდ, ლანდეისა და ნგ-ის შემთხვევითი საუბარი გადაიზარდა სრულყოფილ ექსპერიმენტად, რომელშიც მონაწილეობდა 32 მონაწილე, რომლებიც საუბრობდნენ ჩინურად ან ინგლისურად. ყველა მონაწილე გაიზარდა ტექსტური შეტყობინებებით და ორივე იყენებდა სტანდარტულ კლავიატურას, რომელიც მოყვება iPhone-ს.
ინგლისურად მოლაპარაკეებისთვის ეს ნიშნავდა ჩვეულებრივ iOS QWERTY კლავიატურას, ხოლო მანდარინი იყენებდა Apple-ის პინინის კლავიატურას. ორივე შემთხვევაში, მეტყველების ამოცნობა იყო დაახლოებით სამჯერ უფრო სწრაფი, ვიდრე მომხმარებლებს შეეძლოთ აკრიფოთ - ხოლო შეცდომა მაჩვენებელი 20.4 პროცენტით დაბალი იყო ინგლისური მეტყველების ამოცნობისთვის, ხოლო 63.4 პროცენტით დაბალი მანდარინისთვის. ექვივალენტი.
”ჩემი მოლოდინი იყო, რომ გამოსვლა უფრო სწრაფი იქნებოდა ვიდრე ტექსტი”, - თქვა ლანდეიმ. ”ჩვენ ვიცით ეს, რადგან თქვენ შეგიძლიათ ისაუბროთ იმაზე სწრაფად, ვიდრე შეგიძლიათ აკრიფოთ. წარსულში პრობლემა ის იყო, რომ მეტყველების ამოცნობის დროს უამრავ შეცდომას გქონდათ და ამან შეანელა. მე მეგონა, რომ მეტყველება უფრო სწრაფად დამტკიცდებოდა. რასაც არ ველოდი ის იყო, რომ ის სამჯერ უფრო სწრაფი იქნებოდა. ვფიქრობდი, რომ 50 პროცენტით უფრო სწრაფად მივიღებდით. ამის ნაცვლად, ეს იყო ბევრად მეტი. ”
ტესტი, რა თქმა უნდა, არ არის 100 პროცენტით ყოვლისმომცველი. ამჟამად მსოფლიოში ყველაზე სწრაფი მობილური კლავიატურა (მინიმუმ ინგლისურად) არის მესამე მხარის Fleksy კლავიატურა. 2014 წლის გინესის მსოფლიო რეკორდში ყველაზე სწრაფი ტექსტური შეტყობინებით, მომხმარებელმა შეძლო აკრიფოს a 126-ასოიანი წინადადება სულ რაღაც 18,44 წამში. თუმცა, ლენდეიმ აღნიშნა, რომ ამ კვლევამ აირჩია ჩვეულებრივი iPhone კლავიატურა, რადგან ის კარგ მითითებას იძლევა ტიპიური ბეჭდვის შესახებ. ”ადამიანთა უმეტესობა დროს არ უთმობს ალტერნატიული კლავიატურების სწავლას,” - თქვა მან.
რაც შეეხება იმას, თუ რას ნიშნავს კვლევა, ლენდეი ვარაუდობს, რომ ის წარმოადგენს მნიშვნელოვან ეტალონს მეტყველების ამოცნობისთვის. ”გაუმჯობესების ადგილი ჯერ კიდევ არის, მაგრამ ვფიქრობთ, რომ გარკვეული გადახრის წერტილი გადალახულია,” - თქვა მან. შემდგომი გაუმჯობესება მოხდება სახელების ამოცნობაში, ხმაურიან გარემოში უკეთესად შესრულებაში და ა.შ.
მისი თქმით, ეს უფრო მეტ შესაძლებლობას უხსნის დეველოპერებს, რომ უფრო სერიოზულად იფიქრონ თავიანთ სისტემებში მეტყველების ამოცნობის ჩართვაზე ფიქრის გარეშე. ”რაც სულ უფრო მეტად იქნება აზრი, არის მეტყველებაზე დაყრდნობა”, - თქვა მან. მაგალითად, მულტიმოდალური ინტერფეისები, რომლებიც აერთიანებს მეტყველებას სხვა ელემენტებთან, რათა დაეხმაროს ადამიანებს ნავიგაციაში. თუმცა, ყველაზე დიდი გამოწვევა იქნება ამის გაგება მნიშვნელობა სიტყვებისა და წინადადებების. ამ ნაწილს ჯერ კიდევ გზა აქვს გასავლელი“.
რედაქტორების რეკომენდაციები
- Alexa-ს გამოყენება სახიფათოა, თუ მეტყველების შეზღუდვა გაქვთ. Voiceitt-ს შეეძლო ამის გამოსწორება
- ჩინური ფირმა, რომელიც მუშაობს სახის ამოცნობაზე, რომელსაც შეუძლია თქვენი ამოცნობა ნიღბის ქვეშ
- Google-ის Gboard ბევრად უკეთესი გახდება მეტყველების ამოცნობაში
განაახლეთ თქვენი ცხოვრების წესიDigital Trends ეხმარება მკითხველს თვალყური ადევნონ ტექნოლოგიების სწრაფ სამყაროს ყველა უახლესი სიახლეებით, სახალისო პროდუქტების მიმოხილვებით, გამჭრიახი რედაქციებითა და უნიკალური თვალით.