Hvis Facebook har et uoffisielt slagord, tilsvarende Googles «Don't Be Evil» eller Apples «Think Different», er det «Move Fast and Bryt ting.» Det betyr, i hvert fall i teorien, at man bør iterere for å prøve nyhetsting og ikke være redd for muligheten for feil. I 2021, men med sosiale medier som for tiden får skylden for en mengde samfunnslidelser, bør uttrykket kanskje endres til: "Flytt raskt og fiks ting."
Innhold
- Velkommen til den selvstyrte revolusjonen
- Andre mulige bruksområder
Et av mange områder sosiale medier, ikke bare Facebook, har blitt pillorized for er spredningen av visse bilder på nettet. Det er et utfordrende problem uansett fantasi: Rundt 4000 bilder lastes opp til Facebook hvert eneste sekund. Det tilsvarer 14,58 millioner bilder i timen, eller 350 millioner bilder hver dag. Å håndtere denne jobben manuelt ville kreve hver enkelt
Det vil neppe skje med det første. Dette er grunnen til at jobben med å klassifisere bilder overlates til systemer for kunstig intelligens. Et nytt stykke Facebook-forskning, publisert i dag, beskriver en ny, storskala datasynsmodell kalt SEER (som er "selvovervåket" i den håpløst ødelagte bakronym-tradisjonen som teknologifolk elsker å omfavne). Opplært på over 1 milliard offentlige bilder på Instagram, kan den overgå de mest banebrytende selvovervåkende bildegjenkjenningssystem, selv når bildene er av lav kvalitet og dermed vanskelige å lese.
I slekt
- A.I. nå noen store milepæler i 2020. Her er en oppsummering
Det er en utvikling som kan, hevder skaperne, "[bane] vei for mer fleksible, presise og tilpasningsdyktige datasynsmodeller." Det kan brukes til bedre hold "skadelige bilder eller memer unna plattformen vår." Det kan være like nyttig for automatisk å generere alt-tekst-beskrivende bilder for synshemmede personer, overlegen automatisk kategorisering av varer som skal selges på Marketplace eller Facebook-butikker, og en rekke andre applikasjoner som krever forbedrede datamaskin syn.
Anbefalte videoer
Velkommen til den selvstyrte revolusjonen
"Ved å bruke selvtilsyn kan vi trene på et hvilket som helst tilfeldig bilde," Priya Goyal, en programvareingeniør ved Facebook AI Research (FAIR), hvor selskapet utfører massevis av nyskapende bildegjenkjenningsforskning, fortalte Digital Trends. "[Det] betyr at etter hvert som det skadelige innholdet utvikler seg, kan vi raskt trene opp en ny modell på de utviklende dataene og som et resultat reagere raskere på situasjonene."
Selvtilsynet Goyal referer til er en merkevare av maskinlæring som krever mindre menneskelig innsats. Semisupervised læring er en tilnærming til maskinlæring som sitter et sted mellom veiledet og uovervåket læring. I veiledet læring er treningsdata fullstendig merket. I uovervåket læring er det ingen merket treningsdata. I semisupervised læring … vel, du skjønner ideen. Det er, for maskinlæring, det å holde et halvt øye med barnet ditt mens de lader autonomt rundt i en park å være foreldre. Selvstyrt læring har blitt brukt til transformative effekter i verden av naturlig språkbehandling for alt fra maskinoversettelse til spørsmålssvar. Nå brukes den også på bildegjenkjenning.
"Usupervised læring er et veldig bredt begrep som antyder at læringen ikke bruker noen veiledning i det hele tatt," sa Goyal. "Selvovervåket læring er en undergruppe - eller mer spesifikt tilfelle - av uovervåket læring, ettersom selvtilsyn utleder veiledningssignalene automatisk fra treningsdataene."
Hva selvstyrt læring betyr for Facebook er at ingeniørene kan trene modeller på tilfeldige bilder, og gjøre det raskt samtidig som de oppnår god ytelse på mange oppgaver.
"Å kunne trene på et hvilket som helst tilfeldig internettbilde lar oss fange det visuelle mangfoldet i verden," sa Goyal. "Supportert læring krever derimot datakommentarer, noe som begrenser den visuelle forståelsen av verden ettersom modellen er opplært til å lære kun svært begrensede visuelle annoterte konsepter. Oppretting av kommenterte datasett begrenser også datamengden som systemene våre kan trenes på, og derfor vil overvåkede systemer sannsynligvis være mer partiske."
Hva dette betyr er A.I. systemer som bedre kan lære av den informasjonen de får, uten måtte stole på kuraterte og merkede datasett som lærer dem hvordan de gjenkjenner spesifikke objekter i en bilde. I en verden som beveger seg like raskt som den online, er det viktig. Det burde bety smartere bildegjenkjenning som virker raskere.
Andre mulige bruksområder
"Vi kan bruke de selvovervåkede modellene til å løse problemer i domener som har svært begrensede data eller ingen metadata, som medisinsk bildediagnostikk", sa Goyal. "Ved å være i stand til å trene høykvalitets, selvkontrollerte modeller fra bare tilfeldige, umerkede og ukuraterte bilder, kan vi trene modeller på alle internettbilde, og dette lar oss fange opp mangfold av visuelt innhold, og redusere skjevhetene som ellers introduseres av data kurasjon. Siden vi ikke krever etiketter eller datakurering for å trene en selvovervåket modell, kan vi raskt lage og distribuere nye modeller for å løse problemer.»
Som med alt FAIRs arbeid, er dette akkurat nå i forskningsfasen, i stedet for å være teknologi som vil rulle ut på Facebook-feeden din i løpet av de neste par ukene. Det betyr at dette ikke umiddelbart vil bli distribuert for å løse problemet med skadelige bilder som spres på nettet. Samtidig betyr det at samtaler om bruk av A.I. Det er for tidlig å identifisere fine detaljer i opplastede bilder.
Liker det eller ikke, bildeklassifisering A.I. verktøy blir smartere. Det store spørsmålet er om de er vant til å bryte ting ytterligere eller begynne å fikse dem igjen.
Redaktørenes anbefalinger
- A.I. glemmer vanligvis ikke noe, men Facebooks nye system gjør det. Her er hvorfor
- Facebooks nye A.I. tar bildegjenkjenning til et helt nytt nivå