AR-ის მომავალი არის ყურსასმენები და არა სათვალე

ყურსასმენის ილუსტრაცია პირის ყურში
Genevieve Poblano/Digital Trends Graphics

რომიტ როი ჩოუდჰური ყურებამდე დიდია. მაგრამ არა შიგნით რომ გზა. როი ჩუდჰური, ილინოისის უნივერსიტეტის ელექტროინჟინერიისა და კომპიუტერული მეცნიერების პროფესორი, მტკიცედ სწამს პარადიგმის შეცვლის პოტენციალის, რასაც ის უწოდებს. ყურმილი (არა, არა ტარებადი) გამოთვლა.

შინაარსი

  • გონების საკითხავი ყურსასმენები?
  • ჩატვირთვა ყურებამდე
  • დორმელის კანონი
  • აცვიათ ხელსაწყოების დაპირება

ეს ნიშნავს, რომ ჩაერთოთ უზარმაზარ შესაძლებლობებში ტექნიკისა და პროგრამული უზრუნველყოფისთვის, რომელიც მუშაობს ამ ორი ლამაზი მოსასმენი ხვრელის გამოყენებით თქვენი თავის გვერდებზე. და დაეხმარეთ ყველაფრის შემუშავებას, კონფიდენციალურობისა და უსაფრთხოების აპლიკაციებიდან სამედიცინო დიაგნოზებამდე ინსტრუმენტები, რომლებიც ორიენტირებულია გაფართოებული რეალობის მომავალზე, ის აგროვებს ექსპერტთა ჯგუფს მის დასახმარებლად.

რეკომენდებული ვიდეოები

”მე შემიძლია თითქმის ნებისმიერი გამოვიყენო კომპიუტერულ მეცნიერებაში და ელექტრო ინჟინერიაში,” - განუცხადა მან Digital Trends-ს. "ჩემს რადარზე არსებული პრობლემების სპექტრი უზარმაზარია."

დაკავშირებული

  • გაწუხებთ FBI-ის ღრმა ყალბი გაფრთხილება? მიჰყევით ექსპერტების ამ რჩევებს
  • OpenAI-ის ახალი ChatGPT აპი უფასოა iPhone-ისა და iPad-ისთვის
  • ახლა შეგიძლიათ ვიდეო ჩატი ChatGPT AI-ით – აი, როგორ გამოიყურება
Apple AirPods Pro და Samsung Galaxy Buds Live
იარონ შნაიდერი / ციფრული ტენდენციები

ყურსასმენები უკვე დიდი ბაზარია. Apple-ის AirPods, მისი უსადენო ყურსასმენების ხაზი, მხოლოდ 2019 წელს გაიყიდა 60 მილიონი ერთეული. გასულ წელს ეს რიცხვი იყო სავარაუდოდ 85 მილიონამდე გაიზრდება. დღეს ბევრი კომპანია აწარმოებს სმარტ ყურსასმენებს, რომლებიც გთავაზობთ ხმაურის აქტიურ გაუქმებას, A.I. ჭკვიანი ასისტენტები და სხვა.

AirPods-მდე რამდენიმე ათწლეულით ადრე, ჯერ კიდევ 1980-იან წლებში, არსებობდა Walkman, ალბათ პირველი თანამედროვე ტარების ტექნოლოგია, რომელიც მომხმარებლებს საშუალებას აძლევდა, თან წაეღოთ მუსიკა სადაც არ უნდა წასულიყვნენ. Walkman-მა მომხმარებლებს აძლევდა ბატონობას არა მხოლოდ იმაზე, რასაც უსმენდნენ (ვთქვათ, The Smiths), არამედ იმის გამო, რომ პლასტიკური ყურსასმენები მათ ყურებს უჭერდა, რასაც ისინი არ უსმენდნენ (ვთქვათ, მათი მშობლები). ეს საშუალებას აძლევდა ადამიანებს შეექმნათ და ეკონტროლებინათ თავიანთი ცხოვრების საუნდტრეკი, რაც გვაძლევდა მნიშვნელობის ყველა ჩვენს ინდივიდუალურ ბუშტებს. მიუხედავად იმისა, რომ ბუმბოქსი მიზნად ისახავდა სხვებისთვის ჩვენი მუსიკის მოსმენის უფლებას - ან, ზოგიერთ შემთხვევაში, იძულებას, Walkman-მა მოსმენა ფუნდამენტურად პირად, იზოლირებულ გამოცდილებად აქცია.

ფლორიან შმეტცი / Unsplash

მაგრამ როი ჩოუდჰურის და მის გუნდს ამაზე შორს წასვლა სურთ. ისინი ცდილობენ გარდაქმნან დღევანდელი ყურსასმენები სრულიად ახალ გამოთვლით პლატფორმად, რომელსაც შეუძლია, ზოგიერთ შემთხვევაში, ჩაანაცვლოს თქვენი წვდომის საჭიროება სმარტფონი ან კომპიუტერი. თუ Walkman-მა ყველას გამოსცა საკუთარი ხმის ბუშტი, რომ ისიამოვნოს ქუჩაში სეირნობისას, ამ ასაკში უფრო ჭკვიანი ტექნოლოგია და პერსონალიზაცია, იგივე ბუშტები შეიძლება გამოიყენონ ახალ, საინტერესო და - ზოგჯერ - ოდნავ უცნაურში გზები.

გონების საკითხავი ყურსასმენები?

„ჩასაცმელი გამოთვლითი ბაზრის უმეტესობა [ჯერჯერობით] ორიენტირებულია მოწყობილობებზე, რომლებსაც ატარებენ სხეულის ქვედა ნაწილზე, ძირითადად ჯიბეებში ან მაჯაზე, შესაძლოა ფეხსაცმელში“, - თქვა როი ჩოუდჰურიმ. ”ეს ნიშნავს, რომ თქვენ გრძნობთ სხეულის ქვედა ნაწილს, მაგალითად, რას აკეთებთ ხელებით, მაჯებით, ფეხებით. მაგრამ არის ბევრი ინფორმაცია, რომელიც წარმოიქმნება სხეულის ზედა ნაწილზე, ძირითადად თქვენს თავზე – მაგ. მოსმენა, ლაპარაკი, ჭამა, სახის ემოციები, სამედიცინოსთან დაკავშირებული ინფორმაციის პოტენციური მინიშნებები - ეს შეიძლება იყოს ფასდაუდებელი. წმინდა გრაალი, ამის საბოლოო საზღვარი, შეიძლება იყოს კიდეც ტვინის სიგნალების აღქმა შენს თავთან ახლოს“.

იდეა იმისა, რომ შეგეძლოს არა მხოლოდ პასიურად მოუსმინო ყურის მოწყობილობას, არამედ ისაუბრო მას, არის საფუძველი ჭკვიანი ასისტენტების უკან, როგორიცაა Siri. მაგრამ მეტყველება, როგორც გამოიყენება დღევანდელ A.I. თანაშემწეები, მიზანმიმართულად არაღრმაა. სურათთან შედარებით (ათასი სიტყვის ღირებულების), Siri საუკეთესოდ არის ინფორმაციის სწრაფი აფეთქებით, როგორიცაა ამინდის პროგნოზის პოვნა ან სამზარეულოში ტაიმერის დაყენება. მაგრამ ეს დაახლოებით ლიმიტია. საყურადღებო გამოთვლების იდეაა ვიპოვოთ გზები, რათა გადმოვტვირთოთ ზოგიერთი სხვა რამ, რისთვისაც ამჟამად უნდა მივხედოთ ეკრანებს და ჩავდოთ ისინი ჩვენს ყურებზე (და ყურებში).

სიმღერის ამოცნობა აი
კრიშნა პ. მიაპურამი

”ყველაფერს, რასაც აკეთებთ ვიზუალურ ეკრანზე, თქვენ მთელ კოგნიტურ ყურადღებას აქცევთ”, - თქვა მან. „კითხვისთვის - თუნდაც ეს სულელური ხუმრობა იყოს, რომელსაც კითხულობთ ეკრანზე - თქვენ არ შეგიძლიათ ყურადღება გაამახვილოთ სხვაზე. კითხვა იკავებს თქვენს სრულ შემეცნებით ყურადღებას. ჩემი რწმენაა, რომ ბევრი ასეთი რამ არ იმსახურებს თქვენს სრულ შემეცნებით ყურადღებას. ჩვენ შეგვიძლია გამოვიყვანოთ ისინი ვიზუალური დომენიდან და მივიყვანოთ ისინი გამოუყენებელ და არამონოპოლიზებული აუდიო დომენისკენ, სადაც ადამიანის ტვინი ბუნებრივად ძალიან კარგად განვითარდა. მულტიპლექსი ასეთ აუდიო ინფორმაციას შორის… რატომ არ აიღოთ ეს მარტივი საგნები და არ გადაიტანოთ ისინი თქვენი შემეცნებითი, ვიზუალური შემეცნებითი არხიდან და აკუსტიკაში გამტარუნარიანობა?”

გუნდის მიერ ჩატარებული ბოლოდროინდელი ექსპერიმენტი მოიცავდა იმ გზებს, რომლებშიც შეგვეძლო ტექსტის უფრო მნიშვნელოვნად გამოყენება გასაგონი ფორმა. თუ თქვენ კითხულობთ სტატიას, შეიძლება დაინახოთ თქვენთვის საინტერესო საკვანძო სიტყვა და ამ მომენტში დაიწყოთ კითხვა. თუმცა, ამის გაკეთების მარტივი გზა არ არსებობს, როდესაც, მაგალითად, უსმენთ პოდკასტს.

”ერთ-ერთი რამ, რის გაკეთებასაც ჩვენ ვცდილობთ ჩვენს ლაბორატორიაში, არის [ვკითხოთ], შემიძლია დავაჩქარო სტატიის მოსმენა?” თქვა როი ჩოუდჰურიმ.

ჩატვირთვა ყურებამდე

ჯგუფის კონცეფციის დამადასტურებელი დემონსტრირებისას, მსმენელს სტატიაში ერთდროულად წაუკითხავს რამდენიმე აბზაცი. ამ სამუშაოს შესრულების ხრიკი არის სიგნალის დამუშავების გამოყენება, რათა ყოველი აბზაცი ჟღერდეს, თითქოს ის სხვა მიმართულებით მოდის - ეს ცოტათი ჰგავს ჯდომას. რესტორანში და ოთხი საუბარი მიმდინარეობს მიმდებარე მაგიდებთან, მაგრამ აკრიფეთ ერთში, რადგან ოკუპანტები ახსენებენ ადამიანს, რომ თქვენ ვიცი. იმისათვის, რომ ეს უკეთესად იმუშაოს, ჯგუფმა დააჭირა ინერციული საზომი ერთეული (IMU) ყურსასმენებში ისე, რომ მომხმარებელს შეუძლია აწიოს კონკრეტული ხმა (ტექსტის ერთი ნაწილი) ამაში თავის ოდნავ შებრუნებით მიმართულება.

„ამ პროექტს ვეძახი „კითხვა აკუსტიკური დომენში“, სადაც მე ვუყურებ მესამე აბზაცის ხმის მიმართულებას და ეს ხმა უფრო ხმამაღალი ხდება და სხვა ხმები ცოტათი იკლებს“, - თქვა მან.

ეს ყველაფერი არც მეტყველებაზეა. ჯგუფმა ასევე დაადგინა, რომ როგორც მიკროფონი, ასევე IMU ყურსასმენებში შეიძლება გამოყენებულ იქნას სახეზე წარმოუდგენლად დახვეწილი ვიბრაციების ამოსაცნობად, როგორც პატარა ადამიანი კბილებს კრაჭუნებს ან სახის კუნთები შუბლშეკრული ან იღიმება. არა, თქვენ ალბათ არ დაანებებთ თქვენს სმარტფონს კბილებით მორზეს კოდით შეტყობინებების ჩასაწერად. მაგრამ იდეა, რომ სახის ეს წვრილი შეკუმშვა, როგორიცაა მარჯვენა კბილების სრიალება, შეიძლება გამოყენებულ იქნას შეასრულეთ ბრძანებები - ან თუნდაც იმოქმედოთ როგორც პირადობის დადასტურება ორფაქტორიანი ავთენტიფიკაციისთვის - რა თქმა უნდა საინტერესო.

„ყველას კარგად იცნობს Siri, მაგრამ წარმოიდგინეთ, რამდენი პოტენციური გამოყენება შეიძლება იყოს Siri-სთვის, თუ მას აქვს სივრცითი განზომილება, ისევე როგორც პარკუჭის მოყვარული, რომელსაც შეუძლია თავისი ხმის ამოღება“.

ეს ასევე შეიძლება სასარგებლო იყოს გრძივი მონაცემების მისაღებად ისეთი საკითხებისთვის, როგორიცაა სამედიცინო დიაგნოზი. მაგალითად, შფოთვითი აშლილობები შეიძლება დადგინდეს კბილების მოძრაობაში გამოვლენილი გარკვეული შაბლონებიდან. როი ჩოუდჰურიმ ასევე აღნიშნა, რომ მკვლევარები მუშაობენ ისეთ პრობლემებზე, როგორიცაა ყურებში სისხლის ნაკადის გაზომვა გულისცემის, გლუკოზის დონის, კუნთების აქტივობის გასაზომად და სხვა.

გსურთ სხვა შესაძლო გამოყენება? Რას ფიქრობთ გასაგონი გაძლიერებული რეალობა? გაძლიერებული რეალობა ამჟამად ყველაზე ცნობილია კომპიუტერის მიერ გენერირებული ობიექტების რეალურ სამყაროზე გადაფარვით. მაგრამ არ არსებობს მიზეზი, რის გამოც გადიდებები უნდა მოხდეს მხოლოდ ვიზუალურ სპექტრზე. როი ჩოუდჰურის გუნდი აღფრთოვანებულია სიგნალის დამუშავების ტექნოლოგიის გამოყენების პერსპექტივით, რათა გამოიყენოს გარკვეული ხმები თქვენს ლანდშაფტზე, რათა ნავიგაცია გაიაროთ აეროპორტი, მუზეუმი ან ნებისმიერი სხვა საჯარო სივრცე შეიძლება მოიცავდეს სიარულის ხმას, რომელიც ამბობს „გამომყევი“, რომელიც, როგორც ჩანს, მოდის იმ მიმართულებიდან, სადაც უნდა წახვიდე. in.

სირი

Siri-ს ყველა იცნობს, მაგრამ წარმოიდგინეთ, რამდენი პოტენციური გამოყენება შეიძლებოდა გაეხსნა Siri-სთვის, თუ მას მხოლოდ სივრცითი განზომილება ჰქონოდა, როგორც პარკუჭის მოყვარული, რომელსაც შეუძლია თავისი ხმის ამოღება. ეს სივრცითი გაფართოება ასევე ხელს შეუწყობს დიდი ვირტუალური შეხვედრების გაუმჯობესებას, თითოეული ადამიანის ხმა კონკრეტულ ადგილას, რაც გაადვილებს დაუყოვნებლივ თქვას, ვინ საუბრობს.

ყველა ეს არ მოხდება, რა თქმა უნდა. ისინი კოპირაიტერის საინჟინრო ვერსიაა, რომელიც ასახავს იდეებს რეკლამისთვის. ბევრმა მათგანმა შეიძლება ვერ შეძლოს გაჭრა, მაგრამ ერთი ან ორი მაგალითი შეიძლება იყოს ღრმად გამოსადეგი.

დორმელის კანონი

ეს არის კიდევ ერთი მიზეზი, რის გამოც როი ჩოუდჰური ასე აღფრთოვანებულია უწყვეტი ყურსასმენი გამოთვლის პოტენციალით და რეალურ სამყაროში წარმატების შანსებით. საზოგადოების პასუხები იმაზე მეტს გვკარნახობს იმაზე, თუ რომელ ტექნოლოგიებს იჭერენ, ვიდრე ტექნოლოგები აუცილებლად მოისურვებენ. ახალი ტექნოლოგიები, განმარტებით, ახალია. ახალი შეიძლება გაუტოლდეს უცნაურს. ჩემი საკუთარი ფორმულირების გამოსაყენებლად (მოდით დავარქვათ მას დორმელის კანონი, შთამომავლობისთვის დარტყმისთვის), ნებისმიერი ახალი ტექნოლოგიის უაზრო სარგებლობა ორმაგად უნდა ანაზღაურებდეს მისი გამოყენების თანდაყოლილ სისულელეს.

”ეს არის პრობლემა, რადგან ძალიან ცოტა ტექნოლოგია ჩნდება სრულად ჩამოყალიბებული.”

პერსონალური კომპიუტერი, რომელსაც ხალხი საკუთარ სახლებში იყენებდა, ბაზარზე პირველი რამდენიმე წლის განმავლობაში ნაკლებად გამოიყენებოდა, რადგან მისი გამოყენების სოციალური ფსონები ძალიან დაბალი იყო. ლეპტოპი, რომელიც გამოიყენება საჯაროდ, ოდნავ უფრო მაღალი იყო. ჩასაცმელი სამოსი, რომელიც განსაკუთრებით გამორჩეულია ტანზე ტარების გამო, უფრო შესამჩნევად უცნაურია, ვიდრე სხვა ტექნიკური საშუალებები. ტექნიკური ნაწილი, რომელიც თავზე დარჩება და გამოიყურება როგორც კიბერნეტიკური იმპლანტი Borg-ის თვითმფრინავზე, უნდა იყოს ბრწყინვალე და დაუყოვნებლივ გამოსადეგი, თუ მომხმარებელი აპირებს ჩათვალოს, რომ ღირს ნახვის საზიანო სოციალური გავლენა მისი ტარება.

იარონ შნაიდერი / ციფრული ტენდენციები

ეს არის პრობლემა, რადგან ძალიან ცოტა ტექნოლოგია ჩნდება სრულად ჩამოყალიბებული. უმეტეს შემთხვევაში, პროდუქტის პირველი რამდენიმე თაობა აგებულია არასწორ დაპირებაზე, სანამ უფრო დამაჯერებელი შეთავაზება გამოჩნდება სადღაც მესამე გამეორების გარშემო. თუ უაღრესად თვალსაჩინო პროდუქტი პირველივე დღიდან ვერ მიიწოდებს, მისი წარმატების შანსები გრძელვადიან პერსპექტივაში შეიძლება ჩაიშალა, მაშინაც კი, თუ ის საბოლოოდ გადაიქცევა კარგ პროდუქტად. ძველი ტექნოლოგიების მოყვარულებისთვის, გაითვალისწინეთ პორტატული Apple Newton მოწყობილობა და მისი ადრეული დარტყმა ხელნაწერის ამოცნობაში. ახალგაზრდა თაყვანისმცემლებისთვის, დორმელის კანონი შეიძლება ახსნას Google Glass-ის წარუმატებლობა, რომელიც მოჰყვა უზარმაზარ სოციალურ სტიგმას და განსჯას და მუშაობდა... თითქმის კარგად.

ყურსასმენები, როგორც როი ჩოუდჰურიმ აღნიშნა, განსხვავებულია. როგორიც არ უნდა იყოს ოდესღაც ბრძოლები მათ შესახებ, მეტ-ნაკლებად უკვე მოგებული იყო. ”საზოგადოებამ უკვე მიიღო ყურსასმენების მქონე ადამიანები,” - თქვა მან. „... გარკვეული გაგებით, ახლა მხოლოდ ალგორითმები და სენსორები და აპარატურა უნდა განახლდეს. ეს მხოლოდ ტექნოლოგიური ბარიერია და აღარ არის სოციალური, ფსიქოლოგიური ბარიერი“.

აცვიათ ხელსაწყოების დაპირება

ის ფაქტი, რომ ყურსასმენები მიიღეს, ამცირებს ფსონებს და ნიშნავს, რომ აღარ არის საჭირო დაუყოვნებლივი ორობითი შედეგი. მაშინაც კი, თუ როი ჩოუდჰურის აღწერილი ყველაზე მაღალი მიზნები დიდი ხნის განმავლობაში არ არის მიღწეული, თანდათანობითი გაუმჯობესება ხელსაყრელობას შემატებს დადასტურებულ ფორმას.

„მაღლა ჩამოკიდებული ხილი [ეს არის ისეთი რამ, როგორიცაა] „კბილების ჟესტებიდან, მე შემიძლია აღმოვაჩინო კრუნჩხვები“ ან „ჩემიგან სახის ჟესტებით, მე შემიძლია გავიგო ადამიანის განწყობა ისე, რომ ეს განწყობის ფიტბიტივით გახდეს,“ განაცხადა. „მაგრამ ეს რომც ვერ მოხერხდეს, ეს არ აფერხებს პროდუქტის მილსადენს. თუმცა, თუ ისინი წარმატებულები არიან, ეს უბრალოდ გარდაქმნის პროდუქტს რაღაც ფანტასტიურად. ”

ყურმილიანი გამოთვლის პოტენციალი, როი ჩოუდჰურის აზრით, თითქმის უსაზღვროა. ”ვფიქრობ, წინ გზა მეტყველების ფარგლებს სცილდება,” - თქვა მან. „მე ვიტყოდი, რომ მეტყველება არის ყველაზე შინაგანი წრე, რომელიც დგას [ამ ტექნოლოგიის] ბირთვში. ამ ურთიერთქმედების გარეთ არის ზოგადად აკუსტიკა. და გარე აკუსტიკა არის ყველა სახის სხვა სენსორი და შესაძლებლობები. თუ ფიქრობთ, როგორ ვაპირებთ ამ პლატფორმის მშენებლობას, დაბალ დაკიდებული ხილია მეტყველებაზე დაფუძნებული ურთიერთქმედება: „დააყენე ტაიმერი“, „ჰეი სირი, როგორი ამინდია დღეს?“ მაგრამ მას შეუძლია შორს, შორს წავიდეს ამის მიღმა“.

სხვა მკვლევარები, რომლებიც მუშაობენ როი ჩოუდჰურთან ერთად აცვიათ კომპიუტერზე ჟიჯიან იანგი, იუ-ლინ ვეი, ჯეი პრაკაში, და ზიუე ლი.

რედაქტორების რეკომენდაციები

  • ChatGPT-ის iPhone აპს ახლა აქვს ჩაშენებული Bing
  • Apple-მა არ შექმნა Siri ChatGPT მკვლელად WWDC-ზე - და ეს მეშინია
  • დაივიწყეთ ChatGPT – Siri და Google ასისტენტი უკეთესად აკეთებენ ამ 4 საქმეს
  • Apple ამზადებს AI ჯანმრთელობის მწვრთნელს Apple Watch-ისთვის, ნათქვამია მოხსენებაში
  • ამ უცნაურმა AI მოწყობილობამ შესაძლოა შეცვალოს თქვენი სმარტფონი მომავალში

კატეგორიები

Ბოლო

როგორ ალაპარაკებდნენ ყველა ცხოველს "ჯუნგლების წიგნში"

როგორ ალაპარაკებდნენ ყველა ცხოველს "ჯუნგლების წიგნში"

დისნეიყოველწლიურად ხუთი ფილმი ნომინირებულია აკა...