착시 현상은 차세대 AI를 구축하는 데 도움이 될 수 있습니다

원형 점 격자 위에 검은색 원의 이미지가 표시됩니다. 흰색 망사 소재에 구멍이 뚫려 있는 것과 비슷하지만 실제로는 화면이나 종이 위에 납작하고 정지된 이미지입니다. 하지만 당신의 두뇌는 그런 것을 이해하지 못합니다. 낮은 수준의 환각 경험처럼, 당신의 마음은 밖으로 나갑니다. 정적 이미지를 자신을 향해 움직이는 검은 터널의 입구로 인식합니다.

내용물

  • 진화적 우위
  • 머신비전이 점점 좋아지고 있다
  • 머신 비전을 위한 튜링 테스트
  • 당신의 환상을 활용하세요
  • 일반 비전 달성

효과의 진실성에 반응하여 신체는 무의식적으로 반응하기 시작합니다. 눈의 동공이 확장되어 가능한 한 최상의 결과를 보장하기 위해 어둠 속으로 뛰어들려고 할 때 조정되는 것과 마찬가지로 더 많은 빛을 들어오게 합니다. 비전.

블랙홀 착시

문제의 효과는 다음에 의해 생성되었습니다. 키타오카 아키요시, 일본 고베 리츠메이칸 대학의 심리학자. 이는 그가 오랜 경력을 통해 만들어낸 수십 개의 착시 현상 중 하나입니다. (좋아하는 것이 있느냐는 디지털트렌드의 질문에 그는 “다 좋아한다”고 답했다.)

추천 동영상

이 새로운 환상은 최근 발표된 연구의 주제였습니다. 인간 신경과학의 개척지(Frontiers in Human Neuroscience) 저널에 게재됨. 논문의 초점은 새로운 효과(우리 중 약 86%가 경험하게 될 것으로 밝혀짐)에 대한 인간의 생리학적 반응에 확고히 맞춰져 있지만, 전반적인 주제는 기계 지능의 미래와 관련하여 많은 관련성을 가질 수도 있습니다. 연구원 중 한 명이 Digital에 설명하기를 열망했습니다. 동향.

진화적 우위

프레이저 나선으로 알려진 착시 현상
언뜻 보면 이 이미지는 중앙을 향해 굽이치는 나선형을 보여주는 것처럼 보일 수 있습니다. 그러나 안쪽으로 휘어져 있는 것처럼 보이는 선 중 하나를 따라가려고 하면 전혀 나선형이 아니라는 것을 깨닫게 될 것입니다.

당신의 두뇌에 뭔가 문제가 있습니다. 적어도 그것은 인간의 두뇌가 착시를 인식하는 방식에서 도출할 수 있는 쉬운 결론 중 하나입니다. 뇌가 완전히 다른 것으로 인식하는 2차원의 정적 이미지에 대해 다른 설명이 있을까요? 오랫동안 주류 심리학은 그것을 정확하게 이해했습니다.

"처음에 사람들은 '그래, 우리 뇌는 완벽하지 않아... 항상 옳은 것은 아니야'라고 생각했어요. 그건 실패죠, 그렇죠?" 말했다 브루노 랭, 오슬로 대학교 심리학과 교수이자 앞서 언급한 연구의 첫 번째 저자입니다. "그 경우 환상은 기계의 불완전성을 드러낼 것이기 때문에 흥미로웠습니다."

뇌는 [실제로] 밖에 무엇이 있는지 알 수 없습니다.”

심리학자들은 더 이상 그들을 그런 식으로 보지 않습니다. 오히려 이와 같은 연구는 시각 시스템이 단순한 카메라가 아니라는 점을 강조합니다. "Illusory Expanding Hole" 착시 현상은 눈이 물리적 에너지보다는 인지된, 심지어 상상한 빛과 어둠에 적응한다는 것을 분명히 보여줍니다.

가장 중요한 것은 우리가 시각 시스템으로 세상을 멍청하게 기록하는 것이 아니라, 대신 약간의 진화를 얻기 위해 일련의 지속적인 과학 실험을 수행합니다. 이점. 우리에게 제시된 데이터를 분석하여 문제가 발생하기 전에 선제적으로 해결하려고 노력하는 것이 목표입니다.

Laeng은 “뇌는 [실제로] 밖에 무엇이 있는지 알 수 있는 방법이 없습니다.”라고 말했습니다. “그것이 하는 일은 밖에 있을 수 있는 일종의 가상 현실을 구축하는 것입니다. 약간의 추측이 있습니다. 이런 점에서 뇌는 일종의 확률론적 기계라고 생각할 수 있다. 당신은 그것을 베이지안 원한다면 기계를 사용하세요. 몇 가지 사전 가설을 사용하고 그것이 작동하는지 확인하기 위해 항상 테스트하려고 노력하고 있습니다.”

Laeng은 태양에서 나오는 빛의 느낌에 기초하여 우리의 눈이 조정을 하는 예를 제시합니다. 구름 덮개나 머리 위의 나뭇잎을 통해 보이는 경우에도 마찬가지입니다. 혹시라도.

“진화에서 중요한 것은 그것이 [그 순간] 사실이라는 것이 아니라, 그럴 가능성이 있다는 것입니다.”라고 그는 계속했습니다. “동공을 수축함으로써 신체는 이미 단기간에 일어날 가능성이 매우 높은 상황에 적응하고 있습니다. [갑자기 해가 나오면] 눈이 부시다는 것입니다. Dazzled는 일시적으로 무능력하다는 뜻입니다. 그것은 당신이 먹잇감이든 포식자이든 엄청난 결과를 가져옵니다. 특정 상황에서는 1초도 안되는 순간을 놓치고 살아남지 못할 수도 있습니다.”

우리의 시각 시스템이 추측해야 하는 것은 빛과 어둠뿐만이 아닙니다. 공이 빠른 속도로 이동하는 테니스 게임을 생각해 보십시오. 주어진 순간에 시각 시스템이 수신하는 내용에 전적으로 우리 행동의 기초를 둔다면, 우리는 현실보다 뒤쳐져 공을 돌려주지 못할 것입니다. “우리는 과거에 갇혀 있어도 현재를 인지할 수 있습니다.”라고 Laeng은 말했습니다. “그것을 할 수 있는 유일한 방법은 미래를 예측하는 것입니다. 약간 단어 게임처럼 들리지만 간단히 말해서 그게 전부입니다.”

머신비전이 점점 좋아지고 있다

얼굴 인식
izusek/게티 이미지

그렇다면 이것이 컴퓨터 비전과 어떤 관련이 있습니까? 잠재적으로 모든 것. 예를 들어, 로봇이 현실 세계에서 효과적으로 기능하려면 이러한 종류의 조정을 즉석에서 수행할 수 있어야 합니다. 컴퓨터는 매우 빠른 계산을 수행할 수 있다는 점에서 장점이 있습니다. 그들에게는 수백만 년의 진화가 없습니다.

그럼에도 불구하고 최근 몇 년 동안 머신 비전은 엄청난 발전을 이루었습니다. 실시간 비디오 스트림에서 얼굴이나 걸음걸이를 식별할 수 있습니다. 잠재적으로는 수많은 군중 속에서도 가능합니다. 유사한 이미지 분류 및 기술 도구를 사용하면 다른 물체의 존재도 인식할 수 있습니다. 객체 분할 혁신을 통해 다양한 객체의 내용을 더 잘 이해할 수 있습니다. 장면. 또한 2D 장면에서 3D 이미지를 추정하는 분야에서도 상당한 진전이 있었습니다. 이를 통해 기계는 장면에서 깊이와 같은 3차원 정보를 "읽을" 수 있습니다. 이는 현대 컴퓨터 비전을 인간의 이미지 인식에 더 가깝게 만듭니다.

그러나 최고의 머신 비전 알고리즘과 대다수의 인간이 어린 나이부터 수행할 수 있는 비전 기반 기능 사이에는 여전히 격차가 존재합니다. 이러한 비전 기반 작업을 수행하는 방법을 정확히 설명할 수는 없지만(헝가리-영국 박식가 Michael Polanyi의 말을 인용하면 "우리는 알 수 있습니다. 우리가 말할 수 있는 것보다 더 많은 것”) 그럼에도 불구하고 우리는 시력을 다양하고 스마트하게 활용할 수 있는 인상적인 일련의 작업을 수행할 수 있습니다. 방법.

머신 비전을 위한 튜링 테스트

연구원과 엔지니어가 적어도 시각적인 기능과 동등하게 작동하는 컴퓨터 비전 시스템을 만들고자 한다면 웨트웨어 두뇌의 처리 능력, 착시 현상을 이해할 수 있는 알고리즘을 구축하는 것도 나쁘지 않은 시작이다 가리키다. 최소한 이는 머신 비전 시스템이 우리 자신의 두뇌에 얼마나 잘 작동하는지 측정하는 좋은 방법이 될 수 있습니다. 신화에 대한 답이 아닐 수도 있다. 인공일반지능, 그러나 이것이 General Vision을 잠금 해제하는 열쇠일 수 있습니다.

뇌를 속여 잘못된 색상을 보게 만드는 착시 현상
믿거나 말거나, 이 공들은 모두 같은 회색 음영이며, 뇌는 공들을 가로지르는 색상 선의 상황적 단서에 따라 공들을 서로 다른 색상으로 해석합니다.

“누군가가 언젠가 똑같은 환상 인식 오류를 범하는 인공 시각 시스템을 개발한다면 그렇게 하면 이 시점에서 그들이 우리 뇌가 어떻게 작동하는지에 대한 훌륭한 시뮬레이션을 [달성]하고 있다는 것을 알게 될 것입니다.” Laeng 말했다. “일종의 튜링 테스트가 될 것입니다. 우리처럼 환상에 속는 인공 네트워크가 있다면 우리는 뇌 자체의 기본 계산을 이해하는 데 매우 가까워질 것입니다.”

송이제영국 서리대학교 비전 음성 및 신호 처리 센터의 컴퓨터 비전 및 기계 학습 독자인 는 이 가설에 동의합니다. “시각 알고리즘에 착시 현상을 일반적인 주제로 이해하도록 요청하는 것은 커뮤니티에 큰 가치가 있습니다.”라고 Digital Trends에 말했습니다. “기계에게 [인식]을 요구하는 현재 커뮤니티의 초점을 뛰어넘어 한계를 더 뛰어넘고 기계에게 추론을 요구합니다. 이러한 추진은 시각적 개념에 대한 주관적인 해석이 수용되어야 하는 '일반 비전'을 향한 중요한 진전을 의미합니다.”

당신의 환상을 활용하세요

현재까지 이 목표에 대한 일부 제한적인 연구가 있었지만 아직은 비교적 초기 단계에 머물러 있습니다. Nasim Nematzadeh 박사 학위를 보유한 연구원입니다. 인공 지능 및 로봇 공학 - 저수준 비전 모델을 갖춘 한 사람입니다. 이 주제에 관해 출판된 작품.

“우리는 낮은 수준의 망막 처리와 초기 단계 [심층 신경]의 가우스 커널에서 단순한 가우스 유사 모델의 역할에 대한 추가 탐구가 가능하다고 믿습니다. 네트워크], 그리고 지각 환상의 상실에 대한 예측은 보다 정확한 컴퓨터 비전 기술과 모델로 이어질 것입니다.”라고 Nematzadeh는 Digital Trends에 말했습니다. "[이는] 깊이와 모션 처리에 대한 더 높은 수준의 모델에 기여하고 자연 이미지에 대한 컴퓨터 이해를 일반화하는 데 기여할 수 있습니다."

움직이지 않는 원의 움직임 (착시현상) !

데이터 세트를 컴파일하는 데 도움을 준 AI 연구원 Max Williams 수천 개의 착시 이미지 컴퓨터 비전 시스템에 대해 일반적인 시각과 착시 사이의 관계를 가장 간결하게 설명합니다. “환상이 존재하는 이유는 우리의 눈과 뇌가 혼란스럽고 우리가 거의 완전히 차단된 물리적 세계에 의해 생성된, 이해할 수 없는 빛 필드에서 시각적 장면을 추출하는 임시 프로세스입니다.”라고 그들은 Digital에 말했습니다. 동향. “환상이 없는 ‘지각’으로 간주될 만큼 표현력이 풍부한 시각적 시스템을 만드는 것은 불가능하다고 생각합니다.”

일반 비전 달성

분명히 말하면, AI에 대한 인간 수준(또는 그 이상)의 일반 비전을 달성하는 것은 단순히 표준 착시를 인식하도록 훈련하는 것이 아닙니다. 예를 들어 0.001초 안에 99.9%의 정확도로 Magic Eye 환상을 해독하는 초특수 능력은 수백만 년의 인간 진화를 대체할 수 없습니다.

(흥미롭게도 머신 비전에는 이미 적대적인 모델의 형태로 자체적인 착시 버전이 있어서 실수를 저지를 수 있습니다. 3D 프린팅으로 제작한 소총용 장난감 거북이. 그러나 이것들은 인간에게 작용하는 착시와 동일한 진화적 이점을 제공하지 않습니다.)

그럼에도 불구하고 기계가 인간의 착시 현상을 이해하고 우리가 하는 방식으로 반응하도록 하는 것은 매우 유용한 연구가 될 수 있습니다.

그리고 한 가지 확실한 것은 General Vision AI가 ~이다 달성한다면 그것은 우리와 같은 종류의 착시 현상에 빠지게 될 것입니다. 적어도 Illusory Expanding Hole의 경우에는 우리 중 86%입니다.

편집자의 추천

  • Wix는 ChatGPT를 사용하여 전체 웹사이트를 빠르게 구축하도록 돕습니다.
  • OpenAI는 초지능 AI의 사기 행위를 막기 위해 새로운 팀을 구성합니다.
  • 이러한 독창적인 아이디어는 AI를 조금 덜 사악하게 만드는 데 도움이 될 수 있습니다.
  • Google의 AI 이미지 감지 도구가 작동할 것 같은 느낌
  • AI는 채용 중단의 일환으로 IBM에서 약 7,800개의 일자리를 대체할 수 있습니다.