Дослідники Массачусетського технологічного інституту розробляють нову техніку, яка навчає роботів навчати

Навчання роботів навчати роботів

Люди сприймають навчання як належне. Чудово, як швидко ми можемо взятися за нове завдання, просто спостерігаючи, як це виконує хтось інший. Тим часом роботам це не так просто, але дослідники з Лабораторії комп’ютерних наук і штучного інтелекту (CSAIL) Массачусетського технологічного інституту (MIT) готові допомогти. Вони вчать роботів навчати один одного.

Нова система, C-LEARN, поєднує в собі два традиційні елементи роботизованого навчання — навчання на основі демонстрації та те, що називається плануванням руху, дії, які мають бути жорстко закодовані розробниками. Вони кажуть, що ця нова техніка покликана полегшити роботам виконання широкого спектру завдань з меншим програмуванням.

«Роботи могли б дуже допомогти, якби більше людей могли ними користуватися», Клаудія Перес-Д’Арпіно, доктор філософії, який працював над проектом, розповів Digital Trends. Вона пояснила, що мотив команди полягав у тому, щоб підтримувати деякі з навичок високого рівня, надані найсучаснішими програмістами, водночас дозволяючи системі навчатися через демонстрацію.

Рекомендовані відео

Програмування роботів для виконання навіть одного завдання може бути складним, включаючи точні інструкції, кодування яких потребує часу. Натомість Перес-Д’Арпіно та її команда розробили C-LEARN, щоб дозволити експертам зосередитися на завданнях, найбільш відповідних їхнім галузям. За допомогою цієї системи некодувальники можуть надавати роботам фрагменти даних про дію, а потім заповнювати прогалини, показуючи роботу демонстрацію поточного завдання.

Джейсон Дорфман / MIT CSAIL

«Ми хотіли… надати [експертам] можливість навчити роботів планувати завдання, які є критично важливими в їхній сфері застосування», — сказав Перес-Д’Арпіно. «Прогрес останніх років у навчанні на демонстраціях рухається в цьому напрямку»,

C-LEARN працює шляхом накопичення певного досвіду, який дослідники називають базою знань. Ця база містить геометричну інформацію про те, як досягати та хапати предмети. Далі людина-оператор показує роботу тривимірну демонстрацію поставленого завдання. Пов’язуючи свою базу знань із дією, яку він спостерігав, робот може вносити пропозиції щодо того, як найкраще виконувати дії, а оператор може затверджувати або редагувати пропозиції на свій розсуд.

«Цю базу знань можна передавати від одного робота до іншого», — сказав Перес-Д’Арпіно. «Уявіть, що ваш робот завантажує «додаток» для навичок маніпулювання. «Додаток» може адаптуватися до нового робота з іншим тілом завдяки гнучкості вивчених обмежень, які є математичними представлення основної геометричної вимоги завдання, яка відрізняється від вивчення конкретного шляху, який може бути нездійсненним у новий корпус робота».

Іншими словами, C-LEARN дозволяє передавати ці знання та адаптувати їх до контексту — подібно до того, як спортсмен може навчитися навички в одному виді спорту і трохи змінити його, щоб краще виступати в іншому виді спорту, без необхідності повністю вивчати заново дію.

Дослідники випробували C-LEARN на Optimus, невеликому дворукому роботі, призначеному для знешкодження бомб, перш ніж успішно передати навички Atlas, гуманоїду заввишки шість футів. Вони вважають, що система може допомогти покращити продуктивність роботів у виробництві та наданні допомоги при стихійних лихах, щоб дозволити швидше реагувати в критичних ситуаціях.

Дослідники Массачусетського технологічного інституту розробляють нову техніку, яка навчає роботів навчати

Рекомендації редакції

Категорії

Останні

Обмежене видання Bugatti Divo обіцяє керованість світового класу за 5,6 млн доларів

Techart випускає пакет тюнінгу для фото Porsche 911 Turbo

Toshiba представляє нові знімні ноутбуки-трансформери та бюджетні планшети