Romit Roy Choudhury는 귀가 넓습니다. 하지만 안에는 없어 저것 방법. 로이 초우드리일리노이 대학교 어바나-샴페인 캠퍼스의 전기 공학 및 컴퓨터 과학 교수인 그는 자신이 말하는 패러다임 변화의 잠재력을 굳게 믿고 있습니다. 귀에 댈 수 있는(아니요, 착용할 수 없는) 컴퓨팅.
내용물
- 마음을 읽는 이어폰?
- 귀로 전달
- 도멜의 법칙
- 웨어러블의 약속
이는 머리 측면에 있는 두 개의 멋진 청취 구멍을 사용하여 실행되는 하드웨어와 소프트웨어의 엄청난 가능성을 연결한다는 의미입니다. 개인 정보 보호 및 보안 애플리케이션부터 의료 진단에 이르기까지 모든 개발을 지원합니다. 그는 증강 현실의 미래에 초점을 맞춘 도구를 사용하여 자신을 돕기 위해 전문가들로 구성된 팀을 구성하고 있습니다.
추천 동영상
그는 Digital Trends에 “저는 컴퓨터 과학과 전기 공학 분야의 누구에게나 도움을 줄 수 있습니다.”라고 말했습니다. "내 레이더에 있는 문제의 범위는 엄청납니다."
관련된
- FBI의 딥페이크 경고가 걱정되시나요? 전문가의 조언을 따르세요
- OpenAI의 새로운 ChatGPT 앱은 iPhone 및 iPad에서 무료입니다
- 이제 ChatGPT AI로 영상 채팅을 할 수 있습니다. 그 모습은 다음과 같습니다.
이어폰은 이미 거대한 시장이다. 애플의 에어팟, 무선 이어버드 라인은 2019년에만 6천만 개가 판매되었습니다. 작년에 이 숫자는 8500만명으로 늘어날 것으로 예상. 오늘날 많은 회사에서는 능동형 소음 제거 기능인 A.I.를 제공하는 스마트 이어버드를 만들고 있습니다. 스마트 어시스턴트 등.
AirPods가 출시되기 수십 년 전인 1980년대에 Walkman이 있었습니다. 아마도 최초의 현대적인 웨어러블 기술이었을 것입니다. 이를 통해 사용자는 어디를 가든지 음악을 가지고 다닐 수 있었습니다. Walkman은 사용자가 듣는 것(예: The Smiths)뿐만 아니라 귀를 막는 플라스틱 이어버드로 사용자가 듣지 않는 것(예: 부모)에 대한 통제권을 부여했습니다. 이를 통해 사람들은 자신의 삶에 대한 사운드트랙을 만들고 제어할 수 있게 되었으며, 우리 모두에게 개인의 의미 거품을 제공했습니다. 붐박스가 다른 사람들에게 우리 음악을 듣게 하거나 어떤 경우에는 강요하는 것인 반면, Walkman은 듣는 것을 근본적으로 개인적이고 고립된 경험으로 만들었습니다.
그러나 Roy Choudhury와 그의 팀은 그 이상을 원합니다. 그들은 오늘날의 이어버드를 어떤 경우에는 사용자가 원하는 기능을 대체할 수 있는 완전히 새로운 컴퓨팅 플랫폼으로 전환하려고 합니다. 스마트 폰 또는 컴퓨터. 워크맨이 모든 사람에게 자신만의 사운드 버블을 제공하여 거리를 걸을 때 즐길 수 있다면, 이 시대에는 더 스마트한 기술과 개인화를 통해 동일한 버블을 새롭고 흥미롭고 때로는 약간 이상한 방식으로 활용할 수 있습니다. 방법.
마음을 읽는 이어폰?
Roy Choudhury는 "대부분의 웨어러블 컴퓨팅 시장은 지금까지 주로 주머니나 손목, 신발 등 하반신에 착용하는 장치에 중점을 두었습니다."라고 말했습니다. “그 말은 손으로, 손목으로, 다리로 무엇을 하는지 등 하반신을 감각하게 된다는 뜻이에요. 하지만 신체의 상체, 주로 머리에서 생성되는 정보는 많습니다. 듣기, 말하기, 먹기, 얼굴 감정, 잠재적으로 의료 관련 정보에 대한 단서 등 매우 귀중한. 이 최후의 개척지인 성배는 아마도 뇌 신호를 감지 머리 가까이에서요.”
인이어 장치를 수동적으로 듣는 것뿐만 아니라 대화도 할 수 있다는 아이디어는 Siri와 같은 스마트 비서의 기반입니다. 그러나 오늘날의 AI에서 사용되는 음성은 다음과 같습니다. 조수는 의도적으로 얕습니다. 천 마디 말의 가치가 있는 사진에 비해 Siri는 일기 예보를 찾거나 부엌에 타이머를 설정하는 등의 정보를 빠르게 전달하는 데 가장 뛰어납니다. 그러나 그것은 한계에 관한 것입니다. 이어블 컴퓨팅의 아이디어는 현재 우리가 화면을 응시해야 하는 다른 것들 중 일부를 오프로드하여 귀에(및) 배치하는 방법을 찾는 것입니다.
“시각적 화면에서 하는 모든 일은 인지적 관심 전체를 집중하는 것입니다.”라고 그는 말했습니다. “읽는다는 것은 화면에서 읽는 어리석은 농담이라 할지라도 다른 것에 집중할 수 없습니다. 독서는 완전한 인지적 주의를 요합니다. 나는 당신의 완전한 인지적 관심을 받을 자격이 없는 것들이 많이 있다고 믿습니다. 우리는 그것들을 시각적 영역에서 꺼내어 인간의 두뇌가 자연적으로 매우 잘 진화한 미개척되고 독점되지 않은 오디오 영역으로 밀어 넣을 수 있습니다. 그러한 오디오 정보 사이의 다중화... 이 간단한 것들을 인지적, 시각적 인지적 채널에서 벗어나 청각적 정보로 옮기는 것은 어떨까요? 대역폭?”
팀이 최근 수행한 실험에는 텍스트를 보다 의미 있게 소비할 수 있는 방법을 탐구하는 것이 포함되었습니다. 들리는 형태. 기사를 읽다 보면 관심 있는 키워드가 보이고, 그 시점부터 읽기 시작할 수도 있습니다. 그러나 예를 들어 팟캐스트를 듣는 경우에는 이를 수행하는 쉬운 방법이 없습니다.
"저희 연구실에서 하려고 하는 일 중 하나는 [질문]입니다. 기사를 더 빨리 들을 수 있습니까?" Roy Choudhury가 말했습니다.
귀로 전달
그룹의 개념 증명 시연에서 청취자는 기사의 여러 단락을 동시에 읽어줍니다. 이 작업을 수행하는 비결은 신호 처리를 사용하여 각 단락이 다른 방향에서 오는 것처럼 들리게 만드는 것입니다. 마치 앉아 있는 것과 같습니다. 레스토랑에서 주변 테이블에서 네 번의 대화를 나누다가 점유자가 당신이 언급한 사람을 언급했기 때문에 한 번에 전화를 걸었습니다. 알다. 이 작업을 더 잘 수행하기 위해 팀은 이어버드의 관성 측정 장치(IMU)를 탭하여 사용자는 고개를 약간 돌리면 특정 음성(텍스트의 한 부분)을 높일 수 있습니다. 방향.
"저는 이 프로젝트를 '음향 영역 읽기'라고 부릅니다. 세 번째 문단의 목소리 방향을 보면 그 목소리는 커지고 다른 목소리는 좀 어두워집니다."라고 그는 말했습니다.
연설에 관한 전부도 아닙니다. 또한 팀은 이어폰의 마이크와 IMU를 모두 사용하여 얼굴의 아주 작은 진동을 포착할 수 있다는 사실도 발견했습니다. 이를 악물고 있는 사람 또는 얼굴 근육이 눈살을 찌푸리거나 웃고 있습니다. 아니요, 치아로 모스 부호를 통해 메시지를 대화하기 위해 스마트폰을 버리지 않을 것입니다. 하지만 오른쪽 치아가 미끄러지는 것과 같은 미세한 얼굴 뒤틀림이 명령을 실행하거나 이중 인증을 위한 신원 확인 역할을 하는 것은 확실히 흥미로운.
"모두가 Siri에 대해 잘 알고 있습니다. 하지만 목소리를 낼 수 있는 복화술사처럼 Siri가 공간적 차원만 갖고 있다면 얼마나 많은 잠재적인 용도가 Siri에 열릴 수 있는지 상상해 보세요."
이는 의료 진단과 같은 종단적 데이터를 캡처하는 데에도 유용할 수 있습니다. 예를 들어, 불안 장애는 치아 움직임에서 감지되는 특정 패턴을 통해 진단될 수 있습니다. Roy Choudhury는 또한 심박수, 포도당 수치, 근육 활동 등을 측정하기 위해 귀를 통한 혈류를 측정하는 것과 같은 문제를 연구하는 연구자들이 있다고 언급했습니다.
다른 용도로 사용하고 싶으십니까? 어때? 들을 수 있는 증강현실? 증강 현실은 현재 현실 세계 위에 컴퓨터로 생성된 객체를 오버레이하는 것으로 가장 잘 알려져 있습니다. 하지만 증강이 순전히 시각적 스펙트럼에서만 이루어져야 할 이유는 없습니다. Roy Choudhury 팀은 신호 처리 기술을 사용하여 특정 소리를 풍경에 매핑하여 길을 탐색할 수 있다는 점에 매우 기대하고 있습니다. 공항, 박물관 또는 기타 공공 장소에서는 당신이 가야 할 방향에서 나오는 것처럼 보이는 "나를 따르라"라는 목소리를 향해 걸어가는 것이 포함될 수 있습니다. 안에.
모든 사람이 Siri에 대해 잘 알고 있지만, 목소리를 낼 수 있는 복화술사와 같이 Siri가 공간적 차원만 갖고 있다면 얼마나 많은 잠재적인 용도가 Siri에 열릴 수 있는지 상상해 보십시오. 이러한 공간적 확대는 각 사람의 음성이 특정 위치에 매핑되어 누가 말하고 있는지 즉시 알 수 있게 함으로써 대규모 가상 회의를 개선하는 데도 도움이 될 수 있습니다.
물론 이 모든 것이 실현되는 것은 아닙니다. 그들은 광고에 대한 아이디어를 낙서하는 카피라이터의 엔지니어링 버전입니다. 그 중 다수는 적합하지 않을 수도 있지만 한두 가지 예가 매우 유용할 수 있습니다.
도멜의 법칙
이것이 Roy Choudhury가 계속해서 이어블 컴퓨팅의 잠재력과 실제 성공 가능성에 대해 열광하는 또 다른 이유입니다. 사회적 반응은 기술자들이 반드시 원하는 것보다 어떤 기술이 인기를 얻는지에 대해 훨씬 더 많은 것을 지시합니다. 신기술은 정의상 새로운 것입니다. 새로운 것은 이상한 것과 동일할 수 있습니다. 내 자신의 공식(후손을 찌르기 위해 Dormehl의 법칙이라고 부르자)을 사용하려면 모든 새로운 기술의 기본 유용성이 그것을 사용하는 데 내재된 멍청함을 두 배로 상쇄해야 합니다.
"완전히 형성된 기술이 거의 없기 때문에 이것이 문제가 됩니다."
사람들이 집에서 사용하는 개인용 컴퓨터는 사용에 따른 사회적 이해관계가 너무 낮기 때문에 시장에 출시된 처음 몇 년 동안 거의 사용할 수 없었습니다. 공공장소에서 사용되는 노트북의 지분율은 약간 높았습니다. 몸에 착용하기 때문에 특히 눈에 띄는 웨어러블은 대부분의 기술보다 눈에 띄게 이상합니다. 보그(Borg) 드론의 사이버네틱 임플란트처럼 머리에 고정될 기술은 다음과 같아야 합니다. 사용자가 눈에 띄어 사회적으로 해로운 영향을 미칠 만큼 가치가 있다고 생각한다면 훌륭하고 즉각적으로 유용합니다. 그것을 입고.
이는 완전히 형성된 기술이 거의 없기 때문에 문제가 됩니다. 대부분의 경우, 제품의 처음 몇 세대는 결함이 있는 약속을 바탕으로 구축되었으며, 세 번째 반복 쯤에 더 매력적인 제품이 등장합니다. 눈에 잘 띄는 제품이 첫날부터 제공에 실패하면 결국 좋은 제품으로 변하더라도 장기적으로 성공할 가능성이 낮아질 수 있습니다. 오래된 기술 팬이라면 휴대용 Apple Newton 장치와 초기 필기 인식 기능을 고려해보세요. 젊은 팬의 경우 Dormehl의 법칙은 엄청난 사회적 낙인과 판단을 수반하고 효과가 있었던 Google Glass의 실패를 설명할 수 있습니다.
Roy Choudhury가 지적했듯이 이어버드는 다릅니다. 한때 그들과 관련된 전투가 무엇이든 간에 이미 어느 정도 승리했습니다. “사회는 이미 이어폰을 착용하는 사람들을 받아들였습니다.”라고 그는 말했습니다. “... 어떤 의미에서 이제 업그레이드해야 할 것은 알고리즘과 센서, 하드웨어뿐입니다. 이는 기술적 병목 현상일 뿐 더 이상 사회적, 심리적 병목 현상이 아닙니다.”
웨어러블의 약속
이어버드가 승인되었다는 사실은 위험을 낮추며 더 이상 즉각적인 바이너리 결과가 필요하지 않음을 의미합니다. Roy Choudhury가 설명한 가장 높은 목표가 오랫동안 달성되지 않더라도 점진적인 개선을 통해 입증된 폼 팩터에 유용성이 추가될 것입니다.
“높이 매달린 과일은 '이빨 동작으로 발작을 감지할 수 있다' 또는 '내 몸에서 발작을 감지할 수 있다'와 같은 것입니다. 표정 제스처까지 그 사람의 기분을 알 수 있어서 기분에 맞는 핏빗이 되는 것 같다”고 말했다. 말했다. “그러나 그것이 실패하더라도 제품 파이프라인을 방해하지는 않습니다. 그러나 성공한다면 제품이 환상적인 것으로 변모했을 뿐입니다.”
Roy Choudhury는 이어블 컴퓨팅의 잠재력이 거의 무한하다고 믿습니다. 그는 “앞으로 나아갈 길은 말로 표현할 수 없을 만큼 멀다고 생각한다”고 말했다. “저는 연설이 [이 기술의] 핵심인 가장 안쪽의 원이라고 말하고 싶습니다. 그 상호 작용 외부에는 일반적으로 음향이 있습니다. 그리고 외부 음향에는 모든 종류의 센서와 기능이 포함됩니다. 우리가 이 플랫폼 구축을 어떻게 시작할 것인지 생각해보면, 쉽게 얻을 수 있는 성과는 다음과 같습니다. 음성 기반 상호 작용: '타이머 설정', 'Siri야, 오늘 날씨는 어때?' 하지만 훨씬 더 멀리까지 갈 수 있습니다. 그 이상으로요.”
Roy Choudhury와 함께 웨어러블 컴퓨팅을 연구하는 다른 연구자들은 다음과 같습니다. 양 지젠, 유린 웨이, 제이 프라카시, 그리고 리 지웨.
편집자의 추천
- ChatGPT의 iPhone 앱에는 이제 Bing이 내장되어 있습니다.
- Apple은 WWDC에서 Siri를 ChatGPT 킬러로 만들지 않았습니다. 그래서 두렵습니다.
- ChatGPT는 잊어버리세요 — Siri와 Google Assistant는 이 4가지 기능을 더 잘 수행합니다
- Apple이 Apple Watch용 AI 건강 코치를 구축하고 있다고 주장
- 이 기괴한 AI 기기가 미래에 스마트폰을 대체할 수도 있다