Nejnovější A.I. je úžasný v určování toho, co se děje ve videích

Jak síť Temporal Relation Network rozumí tomu, co se tam děje

K tomu, abychom porozuměli tomu, co se děje, potřebujeme jen několik rámců informací vyprávějících příběh. To je koneckonců základem pro komiksy – které poskytují právě tolik důležitých příběhových rytmů, abychom mohli sledovat, co se stalo. Roboty vybavené technologií počítačového vidění bohužel s tím mají potíže. Až teď.

Doporučená videa

Nedávno Massachusetts Institute of Technology (MIT) předvedl nový typ umělé inteligence systém, který využívá neuronové sítě k vyplnění prázdných míst ve video snímcích, aby zjistil, jakou aktivitu provádí místo. Výsledky umožňují překvapivě dobře určit, co se ve videu odehrává.

„Nově vyvinuté moduly časových vztahů umožňují A.I. systém analyzovat několik klíčových snímků a odhadnout čas vztah mezi nimi, abychom porozuměli tomu, co se ve videu děje – například srážení hromady předmětů,“ Bolei Zhou, bývalý Ph.D. Studentka MIT Computer Science and Artificial Intelligence Laboratory (CSAIL), která je nyní docentkou informatiky na Čínské univerzitě v Hong Kongu, řekla Digital Trends. „Protože model pracuje s klíčovými snímky řídce navzorkovanými z příchozího videa, výrazně se zlepšila efektivita zpracování, což umožňuje rozpoznání aktivity v reálném čase.“

Další vzrušující vlastnost A.I. model spočívá v tom, že dokáže předvídat a předvídat, co se stane na začátku sledováním snímků videa. Pokud například vidí osobu držící láhev, algoritmus předpokládá, že by se mohla napít nebo ji případně zmáčknout. Tyto předvídatelné schopnosti budou nezbytné pro umělou inteligenci používanou v doménách, jako je např autonomní řízení, kde by mohla proaktivně předcházet nehodám tím, že bude každou chvíli hádat, co se stane.

„Dalo by se to také použít k monitorování lidského chování, jako je domácí robotický asistent, který by mohl předvídat váš záměr tím, že předem dodá věci,“ pokračoval Zhou. "Mohlo by být navíc použito k analýze obrovského [počtu] videí online, aby bylo možné lépe porozumět videu a získat video."

Další krok projektu bude zahrnovat zvýšení schopnosti AI rozpoznávat širší počet objektů a aktivit. Tým také spolupracuje s výzkumníky v oblasti robotiky na nasazení tohoto rozpoznávání aktivit do robotických systémů. V důsledku toho mohli vidět zlepšené vnímání a vizuální uvažování.

Doporučení redakce

  • Nikdo nechce kupovat čipy Zen 4 od AMD – co se děje?
  • Zoom A.I. technologie pro detekci emocí během hovorů rozčiluje kritiky
  • Vtipná formulka: Proč je strojově generovaný humor svatým grálem A.I.
  • Nvidia snižuje bariéru vstupu do A.I. s Fleet Command a LaunchPad
  • IBM A.I. Loď Mayflower přeplouvá Atlantik a vy ji můžete sledovat živě

Upgradujte svůj životní stylDigitální trendy pomáhají čtenářům mít přehled o rychle se měnícím světě technologií se všemi nejnovějšími zprávami, zábavnými recenzemi produktů, zasvěcenými úvodníky a jedinečnými náhledy.