Najnowsza sztuczna inteligencja MIT jest niesamowity w określaniu, co dzieje się w filmach

click fraud protection

Jak sieć relacji czasowych rozumie, co się w niej dzieje

Wystarczy kilka klatek informacji przedstawiających jakąś historię, aby zrozumieć, co się dzieje. W końcu na tym opierają się komiksy, które dostarczają wystarczającej ilości ważnych wątków fabularnych, abyśmy mogli śledzić, co się wydarzyło. Niestety roboty wyposażone w technologię widzenia komputerowego mają trudności z osiągnięciem tego celu. Przynajmniej do tej pory.

Polecane filmy

Niedawno Massachusetts Institute of Technology (MIT) zademonstrował nowy rodzaj sztucznej inteligencji system wykorzystujący sieć neuronową do wypełniania pustych miejsc w klatkach wideo w celu sprawdzenia, jaka aktywność jest wykonywana miejsce. Wyniki sprawiają, że zdumiewająco dobrze potrafi określić, co dzieje się w filmie.

„Nowo opracowane moduły relacji czasowych umożliwiają A.I. system do analizy kilku klatek kluczowych i oszacowania czasu relacji między nimi, aby zrozumieć, co dzieje się na filmie – na przykład [przewracanie] stosu przedmiotów”,

Bolei Zhou, były doktorant. studentka Laboratorium Informatyki i Sztucznej Inteligencji (CSAIL) MIT, obecnie adiunkt informatyki na Chińskim Uniwersytecie w Hongkongu, powiedział Digital Trends. „Ponieważ model współpracuje z klatkami kluczowymi słabo próbkowanymi z przychodzącego wideo, wydajność przetwarzania jest znacznie poprawiona, umożliwiając rozpoznawanie aktywności w czasie rzeczywistym”.

Kolejna ekscytująca właściwość A.I. model polega na tym, że może przewidywać i prognozować to, co się stanie na wczesnym etapie, oglądając klatki wideo. Na przykład, jeśli widzi osobę trzymającą butelkę, algorytm przewiduje, że może ona wypić napój lub ewentualnie go wycisnąć. Takie zdolności przewidywania będą niezbędne dla sztucznej inteligencji wykorzystywanej w takich dziedzinach jak autonomiczna jazda, gdzie mógłby aktywnie zapobiegać wypadkom poprzez odgadywanie, co się wydarzy z chwili na chwilę.

„Może być również używany do monitorowania ludzkich zachowań, na przykład asystent robota domowego, który będzie w stanie przewidzieć Twoje zamiary, dostarczając rzeczy z wyprzedzeniem” – kontynuował Zhou. „Można to [dodatkowo zastosować] do analizy ogromnej [liczby] filmów wideo w Internecie, aby lepiej zrozumieć i odszukać nagrania wideo”.

Kolejnym etapem projektu będzie zwiększenie zdolności sztucznej inteligencji do rozpoznawania większej liczby obiektów i działań. Zespół współpracuje także z badaczami zajmującymi się robotyką, aby wdrożyć rozpoznawanie aktywności w systemach robotycznych. W rezultacie mogą one zaobserwować lepszą percepcję i umiejętności wizualnego rozumowania.

Zalecenia redaktorów

  • Nikt nie chce kupować układów AMD Zen 4 – co się dzieje?
  • Sztuczna inteligencja Zooma technologia wykrywania emocji podczas rozmów denerwuje krytyków
  • Zabawna formuła: dlaczego humor generowany maszynowo jest świętym Graalem sztucznej inteligencji?
  • Nvidia obniża barierę wejścia do AI. z Fleet Command i LaunchPadem
  • Sztuczna inteligencja IBM Statek Mayflower przepływa przez Atlantyk i można go oglądać na żywo

Ulepsz swój styl życiaDigital Trends pomaga czytelnikom śledzić szybko rozwijający się świat technologii dzięki najnowszym wiadomościom, zabawnym recenzjom produktów, wnikliwym artykułom redakcyjnym i jedynym w swoim rodzaju zajawkom.