Möt Facebooks kraftfulla nya bildigenkänning SEER A.I.

Om Facebook har en inofficiell slogan, en motsvarighet till Googles "Don't Be Evil" eller Apples "Think Different", är det "Move Fast and Göra sönder saker." Det betyder, åtminstone i teorin, att man ska iterera för att prova nyhetssaker och inte vara rädd för möjligheten att fel. Men 2021, med sociala medier som för närvarande får skulden för en uppsjö av samhällssjukdomar, borde frasen kanske ändras till: "Förflytta dig snabbt och fixa saker."

Innehåll

  • Välkommen till den självövervakade revolutionen
  • Andra möjliga tillämpningar

Ett av många områden sociala medier, inte bara Facebook, har slängts för är dess spridning av vissa bilder online. Det är ett utmanande problem oavsett fantasi: Cirka 4 000 fotouppladdningar görs till Facebook varje sekund. Det motsvarar 14,58 miljoner bilder per timme, eller 350 miljoner bilder varje dag. Att hantera detta jobb manuellt skulle kräva varenda en Facebook anställd att arbeta 12-timmarsskift, godkänna eller lägga in sitt veto mot en uppladdad bild var nionde sekund.

facebook hackad
Digital trendgrafik

Det kommer sannolikt inte att hända inom kort. Det är därför jobbet med att klassificera bilder överlämnas till system för artificiell intelligens. En ny del av Facebook-forskning, publicerad idag, beskriver en ny, storskalig datorseende modell som heter SEER (det är "SJÄLVövervakad" i den hopplöst förvanskade tradition som teknikfolk älskar att omfamning). Utbildad på över 1 miljard offentliga bilder på Instagram kan den överträffa de mest banbrytande självövervakande bildigenkänningssystem, även när bilderna är av låg kvalitet och därmed svåra att läsa.

Relaterad

  • A.I. nått några stora milstolpar under 2020. Här är en sammanfattning

Det är en utveckling som, hävdar dess skapare, kan "bana väg för mer flexibla, exakta och anpassningsbara datorseendemodeller." Det kan användas till bättre håll "skadliga bilder eller memes borta från vår plattform." Det kan vara lika användbart för att automatiskt generera alt-text-beskrivande bilder för synskadade människor, överlägsen automatisk kategorisering av varor som ska säljas på Marketplace eller Facebook-butiker och en mängd andra applikationer som kräver förbättrade datorsyn.

Rekommenderade videor

Välkommen till den självövervakade revolutionen

"Genom att använda självövervakning kan vi träna på vilken slumpmässig bild som helst," Priya Goyal, en mjukvaruingenjör på Facebook AI Research (FAIR), där företaget bedriver massor av innovativ bildigenkänningsforskning, berättade för Digital Trends. "[Det] betyder att, när det skadliga innehållet utvecklas, kan vi snabbt träna en ny modell på den data som utvecklas och som ett resultat reagera snabbare på situationerna."

Självövervakningen Goyal hänvisar till är ett varumärke för maskininlärning som kräver mindre mänsklig insats. Semisupervised learning är ett förhållningssätt till maskininlärning som ligger någonstans mellan övervakat och oövervakat lärande. I övervakat lärande är träningsdata helt märkta. I oövervakat lärande finns det inga märkta träningsdata. I semisupervised learning … ja, du förstår idén. Det är, för maskininlärning, vad att hålla ett halvt öga på ditt barn medan de laddar självständigt runt en park är att vara föräldraskap. Självövervakad inlärning har använts för transformativa effekter i en värld av naturlig språkbehandling för allt från maskinöversättning till frågesvar. Nu tillämpas det också på bildigenkänning.

hjärnan nätverk på vener illustration
Chris DeGraw/Digital Trends, Getty Images

"Oövervakat lärande är ett mycket brett begrepp som antyder att lärandet inte använder någon övervakning alls," sa Goyal. "Självövervakad inlärning är en delmängd - eller mer specifikt fall - av oövervakad inlärning, eftersom självövervakning härleder övervakningssignalerna automatiskt från träningsdata."

Vad självövervakat lärande betyder för Facebook är att dess ingenjörer kan träna modeller på slumpmässiga bilder, och göra det snabbt samtidigt som de uppnår bra prestanda på många uppgifter.

"Att kunna träna på vilken slumpmässig internetbild som helst gör att vi kan fånga världens visuella mångfald", sa Goyal. "Övervakat lärande kräver å andra sidan datakommentarer, vilket begränsar den visuella förståelsen av världen eftersom modellen är tränad att lära sig endast mycket begränsade visuella annoterade koncept. Att skapa kommenterade datauppsättningar begränsar också mängden datamängder som våra system kan tränas på, därför är övervakade system sannolikt mer partiska."

Vad detta betyder är A.I. system som bättre kan lära av all information de ges, utan att behöva förlita sig på kurerade och märkta datamängder som lär dem hur man känner igen specifika objekt i en Foto. I en värld som rör sig lika snabbt som den online är det viktigt. Det borde innebära smartare bildigenkänning som agerar snabbare.

Andra möjliga tillämpningar

"Vi kan använda de självövervakade modellerna för att lösa problem i domäner som har mycket begränsad data eller ingen metadata, som medicinsk bildbehandling", sa Goyal. "Genom att kunna träna högkvalitativa, självövervakade modeller från bara slumpmässiga, omärkta och okurerade bilder, kan vi träna modeller på alla internetbild, och detta gör att vi kan fånga mångfald av visuellt innehåll och mildra de fördomar som annars introduceras av data kuration. Eftersom vi inte kräver några etiketter eller datakurering för att träna en självövervakad modell, kan vi snabbt skapa och distribuera nya modeller för att lösa problem.”

Som med allt FAIRs arbete är detta just nu stadigt i forskningsstadierna, snarare än att vara teknik som kommer att rulla ut på ditt Facebook-flöde under de närmaste veckorna. Det betyder att detta inte kommer att distribueras omedelbart för att lösa problemet med att skadliga bilder sprids online. Samtidigt innebär det att samtal om användningen av A.I. att ytterligare identifiera fina detaljer i uppladdade bilder är för tidigt.

Men om du gillar det eller inte, bildklassificerande A.I. verktygen blir smartare. Den stora frågan är om de är vana vid att bryta saker ytterligare eller börja fixa dem igen.

Redaktörens rekommendationer

  • A.I. brukar inte glömma någonting, men det gör Facebooks nya system. Här är varför
  • Facebooks nya A.I. tar bildigenkänning till en helt ny nivå