Mød Facebooks kraftfulde nye billedgenkendelse SEER A.I.

Hvis Facebook har et uofficielt slogan, svarende til Googles "Don't Be Evil" eller Apples "Think Different", er det "Move Fast and Bryd tingene." Det betyder, i hvert fald i teorien, at man skal iterere for at prøve nyhedsting og ikke være bange for muligheden for fiasko. Men i 2021, hvor sociale medier i øjeblikket får skylden for en overflod af samfundssygdomme, bør sætningen måske modificeres til: "Bevæg dig hurtigt og fiks ting."

Indhold

  • Velkommen til den selvstyrede revolution
  • Andre mulige anvendelser

Et af de mange områder sociale medier, ikke kun Facebook, er blevet pillet for, er dens spredning af visse billeder online. Det er et udfordrende problem af enhver fantasi: Der bliver lavet omkring 4.000 fotouploads til Facebook hvert eneste sekund. Det svarer til 14,58 millioner billeder i timen eller 350 millioner billeder hver dag. Håndtering af dette job manuelt ville kræve hver enkelt Facebook medarbejder til at arbejde 12-timers vagter, godkende eller nedlægge veto mod et uploadet billede hvert niende sekund.

facebook hacket
Digital Trends grafik

Det vil sandsynligvis ikke ske i den nærmeste fremtid. Dette er grunden til, at opgaven med at klassificere billeder er overdraget til kunstige intelligenssystemer. Et nyt stykke Facebook-forskning, offentliggjort i dag, beskriver en ny, storstilet computersynsmodel kaldet SEER (det er "selv-supERvised" i den håbløst ødelagte bagronym-tradition, som teknologifolk elsker at omfavne). Trænet på over 1 milliard offentlige billeder på Instagram, kan den overgå de mest banebrydende selvovervågende billedgenkendelsessystem, selv når billederne er af lav kvalitet og dermed vanskelige at læse.

Relaterede

  • A.I. nået nogle store milepæle i 2020. Her er en opsummering

Det er en udvikling, der kunne, hævder dets skabere, "[bane] vejen for mere fleksible, præcise og tilpasningsdygtige computervisionsmodeller." Det kan bruges til bedre hold "skadelige billeder eller memer væk fra vores platform." Det kunne være lige så nyttigt til automatisk at generere alt-tekst-beskrivende billeder for synshandicappede mennesker, overlegen automatisk kategorisering af varer, der skal sælges på Marketplace eller Facebook-butikker, og et væld af andre applikationer, der kræver forbedrede computersyn.

Anbefalede videoer

Velkommen til den selvstyrede revolution

"Ved at bruge selvovervågning kan vi træne på ethvert tilfældigt billede," Priya Goyal, en softwareingeniør hos Facebook AI Research (FAIR), hvor virksomheden udfører masser af innovativ billedgenkendelsesforskning, fortalte Digital Trends. "[Det] betyder, at efterhånden som det skadelige indhold udvikler sig, kan vi hurtigt træne en ny model på de udviklende data og som et resultat reagere hurtigere på situationerne."

Den selvopsyn Goyal refererer til er et brand af maskinelæring der kræver mindre menneskelig input. Semisuperviseret læring er en tilgang til maskinlæring, der ligger et sted mellem overvåget og uovervåget læring. I superviseret læring er træningsdata fuldt mærket. I uovervåget læring er der ingen mærkede træningsdata. I semisupervised læring … ja, du forstår ideen. For maskinlæring er det at holde et halvt øje med dit barn, mens de oplader autonomt rundt i en park, at være forældre. Selvovervåget læring er blevet brugt til transformative effekter i verden af ​​naturlig sprogbehandling til alt fra maskinoversættelse til besvarelse af spørgsmål. Nu bliver det også brugt til billedgenkendelse.

hjerne netværk på vener illustration
Chris DeGraw/Digital Trends, Getty Images

"Usuperviseret læring er et meget bredt begreb, der tyder på, at læringen slet ikke bruger supervision," sagde Goyal. "Selvovervåget læring er en delmængde - eller mere specifikt tilfælde - af uovervåget læring, da selvsupervision udleder overvågningssignalerne automatisk fra træningsdataene."

Hvad selvovervåget læring betyder for Facebook er, at dets ingeniører kan træne modeller på tilfældige billeder og gøre det hurtigt, mens de opnår god præstation på mange opgaver.

"At være i stand til at træne på et hvilket som helst tilfældigt internetbillede giver os mulighed for at fange den visuelle mangfoldighed i verden," sagde Goyal. ”Superviseret læring kræver på den anden side dataannoteringer, hvilket begrænser den visuelle forståelse af verden, da modellen er trænet til kun at lære meget begrænsede visuelt kommenterede begreber. Oprettelse af kommenterede datasæt begrænser også mængden af ​​data, som vores systemer kan trænes på, og overvågede systemer vil derfor sandsynligvis være mere partiske."

Hvad dette betyder er A.I. systemer, der bedre kan lære af den information, de får, uden at skulle stole på kurerede og mærkede datasæt, der lærer dem at genkende specifikke objekter i en Foto. I en verden, der bevæger sig lige så hurtigt som den online, er det vigtigt. Det skulle betyde smartere billedgenkendelse, der virker hurtigere.

Andre mulige anvendelser

"Vi kan bruge de selvovervågede modeller til at løse problemer i domæner, som har meget begrænsede data eller ingen metadata, som f.eks. medicinsk billeddannelse" sagde Goyal. "Ved at være i stand til at træne selvkontrollerede modeller af høj kvalitet fra blot tilfældige, umærkede og ukurerede billeder, kan vi træne modeller på ethvert internetbillede, og dette giver os mulighed for at fange mangfoldigheden af ​​visuelt indhold og afbøde de skævheder, der ellers introduceres af data kuration. Da vi ikke kræver etiketter eller datakurering for at træne en selvovervåget model, kan vi hurtigt oprette og implementere nye modeller for at løse problemer."

Som med alt FAIRs arbejde, er dette lige nu fast i forskningsstadierne, snarere end at være teknologi, der vil rulle ud på dit Facebook-feed i løbet af de næste par uger. Det betyder, at dette ikke umiddelbart vil blive implementeret for at løse problemet med skadelige billeder, der spredes online. Det betyder samtidig, at samtaler om brugen af ​​A.I. Det er for tidligt at identificere fine detaljer i uploadede billeder.

Men kan man lide det eller ej, billedklassificerende A.I. værktøjer bliver smartere. Det store spørgsmål er, om de er vant til at bryde tingene yderligere eller begynde at reparere dem igen.

Redaktørens anbefalinger

  • A.I. plejer ikke at glemme noget, men det gør Facebooks nye system. Her er hvorfor
  • Facebooks nye A.I. tager billedgenkendelse til et helt nyt niveau