Защо учените учат роботи да играят на криеница

Изкуствен общ интелект, идеята за интелигентен ИИ. агент, който е в състояние да разбере и научи всяка интелектуална задача, която хората могат да изпълнят, отдавна е част от научната фантастика. Както A.I. става все по-умен и по-умен – особено с пробиви в инструментите за машинно обучение, които могат да пренапишат своите код за учене от нови преживявания - това е все по-широко част от истинските разговори за изкуствен интелект като добре.

Съдържание

  • Изграждане на светове
  • Правила на играта
  • Трудните неща са лесни, лесните неща са трудни

Но как да измерим AGI, когато пристигне? През годините изследователите са изложили редица възможности. Най-известният остава тестът на Тюринг, при който човешки съдия взаимодейства, невидим за очите, както с хора, така и с машина, и трябва да опита и да познае кое е кое. Други двама, студентският тест на колежа за роботи на Бен Гьорцел и Нилс Дж. Тестът за заетост на Нилсон се стреми да тества на практика способностите на ИИ, като види дали може да получи диплома от колеж или да изпълнява работни места на работното място. Друг, който аз лично бих искал да отстъпя, твърди, че интелигентността може да бъде измерена чрез успешната способност за сглобяване на плоски мебели в стил Ikea без проблеми.

Препоръчани видеоклипове

Една от най-интересните мерки за AGI беше предложена от съоснователя на Apple Стив Возняк. Уоз, както е известен на приятели и почитатели, предлага теста за кафе. Обща интелигентност, каза той, би означавала робот, който е в състояние да влезе във всяка къща по света, да намери кухнята, да свари чаша прясно кафе и след това да го налее в чаша.

Свързани

  • Аналогов AI? Звучи налудничаво, но това може да е бъдещето
  • Ето какво анализира тенденцията A.I. смята, че ще бъде следващото голямо нещо в технологиите
  • Бъдещето на ИИ: 4 големи неща, за които да следите през следващите няколко години

Както при всеки A.I. тест за интелигентност, можете да спорите колко широки или тесни са параметрите. Въпреки това идеята, че интелигентността трябва да бъде свързана със способността за навигация в реалния свят, е интригуваща. Това също е нещо, което нов изследователски проект се стреми да тества.

Изграждане на светове

„През последните няколко години ИИ. общността направи огромен напредък в обучението на ИИ. агенти за изпълнение на сложни задачи,” Лука Вайс, изследовател в Института Алън за изкуствен интелект, лаборатория за изкуствен интелект, основана от покойния съосновател на Microsoft Пол Алън, каза пред Digital Trends.

Задачи AI2-Thor
Алън Институт за ИИ

Weihs цитира разработката на DeepMind за A.I. агенти, които могат да се научат играйте класически игри Atari и победете човешки играчи в Go. Въпреки това Weihs отбеляза, че тези задачи са „често отделени“ от нашия свят. Покажете картина на реалния свят на A.I. обучен да играе игри на Atari и няма да има представа какво гледа. Именно тук изследователите от института Алън вярват, че имат какво да предложат.

Институтът Алън за изкуствен интелект е изградил нещо като империя за недвижими имоти. Но това не е физически недвижим имот, колкото виртуален имот. Той е разработил стотици виртуални стаи и апартаменти – включително кухни, спални, бани и всекидневни – в които A.I. агентите могат да взаимодействат с хиляди обекти. Тези пространства могат да се похвалят с реалистична физика, поддръжка за множество агенти и дори състояния като горещо и студено. Като позволи на A.I. агентите играят в тези среди, идеята е, че те могат да изградят по-реалистично възприятие за света.

Алън Институт за ИИ

„В [новата ни] работа искахме да разберем как ИИ. агентите биха могли да научат за реалистична среда, като играят интерактивна игра в нея“, каза Weihs. „За да отговорим на този въпрос, ние обучихме двама агенти да играят Cache, вариант на криеница, използвайки състезателно подсилващо обучение в рамките на високопрецизното AI2-THOR среда. Чрез този геймплей открихме, че нашите агенти са се научили да представят отделни изображения, доближавайки се до ефективността на методите изисквайки милиони ръчно етикетирани изображения - и дори започна да разработва някои когнитивни примитиви, често изучавани от [developmental] психолози.”

Правила на играта

За разлика от обикновената криеница, в Cache ботовете се редуват да крият обекти като бутала за тоалетни чинии, хляб, домати и други, всеки от които има своя индивидуална геометрия. Двамата агенти - единият се крие, а другият търсач - след това се състезават, за да видят дали единият може успешно да скрие обекта от другия. Това включва редица предизвикателства, включително изследване и картографиране, разбиране на перспектива, скриване, манипулиране на обекти и търсене. Всичко е точно симулирано, дори до изискването скриващият се да може да манипулира предмета в ръката си и да не го изпуска.

Използване на задълбочено обучение с подсилване — парадигма за машинно обучение, базирана на научаване за предприемане на действия в среда за максимизиране на възнаграждението — ботовете стават все по-добри и по-добри в скриването на обектите, както и в търсенето ги вън.

„Това, което прави това толкова трудно за ИИ, е, че те не виждат света по начина, по който го виждаме ние“, каза Уейхс. „Милиарди години еволюция са направили така, че дори като бебета мозъците ни ефективно да превеждат фотоните в концепции. От друга страна, A.I. започва от нулата и вижда своя свят като огромна мрежа от числа, които след това трябва да се научи да декодира в значение. Освен това, за разлика от шаха, където светът е спретнато поместен в 64 квадрата, всяко изображение, видяно от агента, улавя само малка част от околната среда и затова трябва да интегрира своите наблюдения във времето, за да формира съгласувано разбиране на свят.”

ИИ Резултати от динамичен експеримент на криеница
Алън Институт за ИИ

За да бъде ясно, тази последна работа не е за изграждането на свръхинтелигентен ИИ. Във филми като Терминатор 2: Денят на страшния съд, суперкомпютърът Skynet постига самосъзнание точно в 2.14 ч. сутринта източно време на 29 август 1997 г. Независимо от датата, сега почти четвърт век в нашето колективно огледало за обратно виждане, изглежда малко вероятно да има толкова точна повратна точка, когато обикновеният ИИ. става AGI. Вместо това, все повече и повече изчислителни плодове - ниско висящи и високо висящи - ще бъдат откъснати, докато най-накрая имаме нещо, което се доближава до обобщена интелигентност в множество домейни.

Трудните неща са лесни, лесните неща са трудни

Изследователите традиционно гравитират към сложни проблеми за ИИ. за решаване въз основа на идеята, че ако трудните проблеми могат да бъдат сортирани, лесните не трябва да изостават твърде много. Ако можете да симулирате вземането на решения от възрастен, могат ли идеи като постоянството на обекта (идеята, че обектите все още съществуват, когато не можем да ги видим), че детето се учи през първите няколко месеца от живота си, наистина доказват това труден? Отговорът е да - и този парадокс, че когато става въпрос за ИИ, трудните неща често са лесни, а лесните неща са трудни, е това, което работи като тази, за да се справи.

„Най-разпространената парадигма за обучение на ИИ. агентите [включват] огромни, ръчно етикетирани набори от данни, тясно фокусирани върху една задача - например разпознаване на обекти," каза Weihs. „Въпреки че този подход имаше голям успех, мисля, че е оптимистично да вярваме, че можем ръчно да създадем достатъчно набори от данни, за да създадем ИИ. агент, който може да действа интелигентно в реалния свят, да комуникира с хората и да решава всякакви проблеми, с които не се е сблъсквал преди. За да направим това, вярвам, че ще трябва да позволим на агентите да научат основните когнитивни примитиви, които приемаме за даденост, като им позволим свободно да взаимодействат с техния свят. Нашата работа показва, че използването на геймплей за мотивиране на ИИ. агенти, с които да взаимодействат и да изследват техния свят, води до това, че започват да учат тези примитиви - и по този начин показва, че геймплеят е обещаваща посока далеч от ръчно белязани набори от данни и към опитен изучаване на."

А документ, описващ тази работа ще бъдат представени на предстоящата през 2021 г. Международна конференция за представяне на обучението.

Препоръки на редакторите

  • Оптичните илюзии могат да ни помогнат да изградим следващото поколение AI
  • Забавната формула: Защо машинно генерираният хумор е свещеният граал на ИИ
  • Прочетете зловещо красивото „синтетично писание“ на A.I. който мисли, че е Бог
  • Алгоритмична архитектура: Трябва ли да оставим A.I. проектират сгради за нас?
  • Емоционален ИИ е тук и може да бъде на следващото ви интервю за работа