Най-новият ИИ на MIT е невероятен в определянето на случващото се във видеоклиповете

Как мрежата за времеви връзки разбира какво се случва там

Само няколко кадъра информация, разказваща история, са всичко, от което се нуждаем, за да разберем какво се случва. В края на краищата това е основата за комиксите - които предоставят достатъчно от важните сюжетни ритми, за да проследим какво се е случило. За съжаление роботите, оборудвани с технология за компютърно зрение, се борят да направят това. Поне до сега.

Препоръчани видеоклипове

Наскоро Масачузетският технологичен институт (MIT) демонстрира нов тип изкуствен интелект система, която използва невронна мрежа, за да запълни празните места във видеокадрите, за да определи каква дейност се извършва място. Резултатите го правят удивително добър при определяне на случващото се във видеоклип.

„Новоразработените модули за времева връзка дават възможност на A.I. система за анализиране на няколко ключови кадъра и оценка на времето връзка между тях, за да разберем какво се случва във видеото - като например купчина предмети, [които] са съборени,"

Болей Джоу, бивш доктор по философия. студент в Лабораторията за компютърни науки и изкуствен интелект (CSAIL) на Масачузетския технологичен институт, който сега е асистент по компютърни науки в Китайския университет в Хонконг, каза пред Digital Trends. „Тъй като моделът работи с оскъдни ключови кадри от входящото видео, ефективността на обработката е значително подобрена, позволявайки разпознаване на активност в реално време.“

Друго вълнуващо свойство на A.I. модел е, че може да предвиди и прогнозира какво ще се случи рано, като гледа кадри от видео. Например, ако види човек да държи бутилка, алгоритъмът предвижда, че той може да вземе питие или евентуално да го изстиска. Такива способности за предвиждане ще бъдат от съществено значение за изкуствения интелект, използван в области като автономно шофиране, където може проактивно да предотвратява инциденти, като отгатва какво ще се случи всеки момент.

„Той [може също] да се използва за наблюдение на човешкото поведение, като например домашен робот асистент, който може да предвиди намерението ви, като достави нещата предварително“, продължи Джоу. „Той [може да се използва допълнително] за анализиране на огромния [брой] видеоклипове онлайн, за по-добро разбиране на видео и извличане на видео.“

Следващата стъпка от проекта ще включва увеличаване на способността на AI да разпознава по-голям брой обекти и дейности. Екипът също така работи с изследователи в областта на роботиката, за да внедри това разпознаване на дейност в роботизирани системи. Те биха могли да видят подобрено възприятие и умения за визуално разсъждение като резултат.

Препоръки на редакторите

  • Никой не иска да купува Zen 4 чиповете на AMD - какво става?
  • ИИ на Zoom технология за откриване на емоции по време на разговори разстройва критиците
  • Забавната формула: Защо машинно генерираният хумор е свещеният граал на ИИ
  • Nvidia намалява бариерата за навлизане в A.I. с Fleet Command и LaunchPad
  • ИИ на IBM Корабът Mayflower пресича Атлантическия океан и можете да го гледате на живо

Надградете начина си на животDigital Trends помага на читателите да следят забързания свят на технологиите с всички най-нови новини, забавни ревюта на продукти, проницателни редакционни статии и единствени по рода си кратки погледи.