ახალი მეტყველების ამოცნობის მეთოდი სწავლობს სურათების საშუალებით

ანდროიდის შეტყობინებები აუმჯობესებს ტელეფონებს ერთმანეთს ტექსტური შეტყობინებით
ოლგა ლებედევა/123RF.com
მეტყველების ამოცნობის სისტემები შეიძლება ჯერ კიდევ არ იყოს სრულყოფილი, მაგრამ როგორც Amazon Echo-ის მსგავსი სისტემა აჩვენებს, ისინი ყოველთვის უკეთესები და ყველგან არიან გავრცელებული.

ახალი კვლევის ნაწილი მასაჩუსეტსის ტექნოლოგიური ინსტიტუტის კომპიუტერული მეცნიერებისა და ხელოვნური ინტელექტის გამომძიებლების მიერ ლაბორატორია (CSAIL) გვთავაზობს ამ სისტემების სწავლების ახალ ტექნიკას - მათ სწავლის გზით სურათები.

რეკომენდებული ვიდეოები

„ეს არის მცდელობა, რომ მანქანებმა მოითხოვონ ნაკლები ზედამხედველობითი ტრენინგი სალაპარაკო ენის შესასწავლად. ჯიმ გლასიციფრულ ტენდენციებს განუცხადა CSAIL-ის უფროსმა მკვლევარმა მეცნიერმა. „სიტყვის ამოცნობის სისტემების მომზადების ჩვეულებრივი გზა არის ხალხის საუბრის ჩანაწერების გამოყენება და თითოეული გამოთქმისთვის ნათქვამი სიტყვების ზუსტად გადაწერა. იდეალურ შემთხვევაში, თქვენ გაქვთ ასობით ან ათასობით საათის საუბრის დრო, რათა სისტემამ სწორად იმუშაოს. ზოგიერთი უმსხვილესი კომპანია, რომელიც აკეთებს ამას - როგორიცაა Baidu და Google - იყენებს ათიათასობით საათს ტრენინგისთვის. რაც უფრო მეტი ანოტირებული მონაცემები აქვთ, მით უკეთესია ეს სისტემები.

მაშ, რა არის ამაში ცუდი? ყოველივე ამის შემდეგ, როგორც აღინიშნა, მეტყველების ამოცნობის ტექნოლოგია მუდმივად უმჯობესდება. რასაც კომპიუტერული მეცნიერები აკეთებენ, აშკარად მუშაობს.

ეს შეიძლება მართალია, მაგრამ ეს ახალი მიდგომა საინტერესოა რამდენიმე მიზეზის გამო. უპირველეს ყოვლისა, ხსნის აპარატის უნარს, მოამზადოს საკუთარი თავის გაგება კომბინირებული სურათებისა და აუდიოს ნახვით (საბოლოოდ, თქვენ წარმოიდგინეთ, რომ ის ვარჯიშობს YouTube-ის ყურებით) ბევრად უფრო ახლოსაა იმ გზასთან, რასაც ჩვენ როგორც ადამიანები ვსწავლობთ არსებები.

მეორე - და, სავარაუდოდ, უფრო მნიშვნელოვანი - არის ის ფაქტი, რომ მას შეუძლია დაეხმაროს მეტყველების ამოცნობას მსოფლიოს იმ ნაწილებში, რომლებიც შეიძლება დიდად ისარგებლონ ამ ტიპის ტექნოლოგიით.

”ანოტირებული მონაცემების წარმოება ძვირია,” - განაგრძო გლასმა. „მეტყველების ამოცნობა ათწლეულების განმავლობაში მიმდინარეობდა და მისი უმეტესი ნაწილი იყო იმ ქვეყნების ენებისთვის, რომლებსაც შეუძლიათ ამ ტიპის რესურსებში ინვესტირება. რაც შეეხება ენას, ეს არის ის, რაც კომპანიების აზრით, დაეხმარება მათ მოგების მიღებაში. ინგლისურმა ყველაზე მეტი ყურადღება მიიპყრო, რასაც მოჰყვება დასავლეთ ევროპის ენები და სხვა ენები, როგორიცაა იაპონური და მანდარინი. პრობლემა ის არის, რომ მსოფლიოში დაახლოებით 7000 ენაა მოსაუბრე და დაახლოებით 300 ენაზე, რომელზეც 1 მილიონზე მეტი ადამიანი ლაპარაკობს. ბევრ მათგანს უბრალოდ დიდი ყურადღება არ მიუქცევია - ასეთის არსებობის შემთხვევაში.

მსოფლიოს იმ ნაწილებში, სადაც წიგნიერების დონე დაბალია, ადვილია იმის დანახვა, თუ როგორ შეიძლება მეტყველების ამოცნობა შეცვალოს ადამიანებისთვის ინფორმაციაზე წვდომის უზრუნველყოფის თვალსაზრისით. იმედია, ეს ტექნოლოგია დაგეხმარებათ ამ მიზნის მიღწევაში.

რამდენადაც საინტერესოა კვლევა, თუმცა, გლასი აღნიშნავს, რომ ის ჯერ კიდევ ძალიან ადრეულ ეტაპზეა. ამჟამად, CSAIL-ის მკვლევარები თავიანთ სისტემას კვებავენ 1000 სურათისგან შემდგარი მონაცემთა ბაზით, თითოეულს თავისუფალი ფორმის სიტყვიერი აღწერილობით, რომელიც გარკვეულწილად უკავშირდება მას. შემდეგ ისინი ამოწმებენ სისტემას ჩანაწერის მიცემით და სთხოვენ მას 10 სურათის ამოღებას, რომლებიც საუკეთესოდ ემთხვევა იმას, რაც ისმის.

დროთა განმავლობაში, იმედია, რომ მეტყველების ამოცნობის ასეთი მიდგომები გააუმჯობესებს მათ ეფექტურობას იმ დონემდე, რომ მეტყველების ტრენინგის მონაცემების შრომატევადი მარკირება აღარ განიხილება აუცილებლობად.

თუ ყველაფერი გეგმის მიხედვით მიდის, ეს ყველასთვის უკეთესი უნდა იყოს – იქნება თუ არა ინგლისური მოლაპარაკე აშშ-ში თუ Xhosa-ს მოლაპარაკე სამხრეთ აფრიკაში.

რედაქტორების რეკომენდაციები

  • ჭკვიანი ახალი A.I. სისტემა გპირდებათ გაწვრთნას თქვენს ძაღლს, სანამ სახლიდან შორს ხართ
  • MIT-ის ახალი „ჩრდილოვანი“ კვლევა იყენებს ჩრდილებს, რათა დაინახოს ის, რაც კამერებს არ შეუძლიათ
  • ა.ი. მკვლევარები შიმპანზეების სახის ამოცნობის სისტემას ქმნიან
  • MIT, Adobe-ის ახალი A.I. შეიძლება მოიტანოს ერთი დაწკაპუნებით ფონის მოცილება, სოციალური ფილტრები

განაახლეთ თქვენი ცხოვრების წესიDigital Trends ეხმარება მკითხველს თვალყური ადევნონ ტექნოლოგიების სწრაფ სამყაროს ყველა უახლესი სიახლეებით, სახალისო პროდუქტების მიმოხილვებით, გამჭრიახი რედაქციებითა და უნიკალური თვალით.

კატეგორიები

Ბოლო

Acer Aspire One AOD255 ნეტბუქის პაკეტებს ორბირთვიანი Atom

Acer Aspire One AOD255 ნეტბუქის პაკეტებს ორბირთვიანი Atom

კომპიუტერების მწარმოებელი Acer გამოუშვებს თავი...

ჩინეთის Zhurong Rover ეწვია თავის პარაშუტს და ზურგს

ჩინეთის Zhurong Rover ეწვია თავის პარაშუტს და ზურგს

ჩინეთის ჟურონ როვერი 12 ივლისს სტუმრობს თავის პ...