Facebook åpner opp sin bildegjenkjennings-AI for alle

facebook messenger virus malware windows chrome facebookcomp head
AI-forskningsavdelingen på Facebook åpner for programvare for bildegjenkjenning med sikte på å fremme teknologien slik at den en dag kan brukes på direktesendt video. Facebook sine DeepMask, SharpMask, og MultiPathNet programvare er nå tilgjengelig for alle på GitHub.

Facebook har tidligere lagt ut sine bildegjenkjenningssystemer i en rekke forskningsartikler, som også blir gjort tilgjengelig for publikum sammen med demoene. For tiden fungerer selskapets algoritmer sammen med MultiPathNet-konvolusjonelle nevrale nettverk - en AI som mates enormt datamengder til den autonomt kan gjenkjenne andre data – slik at Facebook kan forstå et bilde basert på hver piksel det inneholder.

Anbefalte videoer

For å klassifisere og merke objektene i et bilde, kobler Facebook sitt DeepMask-segmenteringsrammeverk med sin SharpMask-segmentavgrensningsmodul. Det siste stadiet i Facebooks maskinsynssystem bruker MultiPathNet deep learning AI for å merke hvert objekt på bildet.

I slekt

  • OpenAI avslører plasseringen av sin første internasjonale utpost
  • Photoshop AI mener «lykke» er et smil med råtne tenner
  • Optiske illusjoner kan hjelpe oss med å bygge neste generasjon AI

Ifølge Facebook har AI machine vision-programvare utviklet seg i store sprang de siste årene, noe som tillater den typen bildeklassifisering som ikke en gang eksisterte for en kort stund siden. Facebook hevder at åpen kildekode for programvaren er avgjørende for utviklingen.

Eksempelbilder skannet av Facebooks komplette bildegjenkjenningssystem
Eksempelbilder skannet av Facebooks komplette bildegjenkjenningssystem

Dyplæringsteknikker dukker opp over hele den store blå giganten. AI driver Facebooks (kontroversielle) ansiktsgjenkjenningsfunksjon, administrerer kurasjon på nyhetsstrømmen, og brukes til og med i sin digital assistent for Messenger.

Dette er ikke første gang Facebook har åpen kildekode sin AI. Faktisk er selskapet noe av en banebryter når det gjelder å dele teknologien sin. I desember, Facebook leverte sin toppmoderne dataserver dedikert til AI til Open Compute Project - en gruppe bestående av teknologigiganter, som Apple og Microsoft, som deler designene til sine respektive datainfrastrukturer.

Facebook forutsier allerede fremtidige brukstilfeller for bildegjenkjenningsteknologien. Selskapet avslører at det potensielt kan hjelpe det med å bygge videre på sine eksisterende AI-genererte bildebeskrivelser for synshemmede.

"For øyeblikket hører synshemmede brukere som blar gjennom bilder på Facebook bare navnet på personen som delte bildet, etterfulgt av begrepet «bilde» når de kommer over et bilde i nyhetsstrømmen deres», skriver Piotr Dollar, forsker. på Facebook AI Research (FAIR), i en blogg innlegg. "I stedet tar vi sikte på å tilby rikere beskrivelser, for eksempel "Fotoet inneholder strand, trær og tre smilende mennesker."

I tillegg hevder Facebook at den neste utfordringen er å bruke sine bildegjenkjenningsteknikker på video, "der objekter beveger seg, samhandler og endrer seg over tid," og til og med Facebook Direktesendinger. "Sanntidsklassifisering kan bidra til å vise relevante og viktige live-videoer Facebook, mens bruk av mer raffinerte teknikker for å oppdage scener, objekter og handlinger over rom og tid kan en dag tillate sanntidsfortelling," legger Dollar til.

Redaktørenes anbefalinger

  • Til og med OpenAI har gitt opp forsøket på å oppdage ChatGPT-plagiat
  • De beste AI-bildegeneratorene for å lage kunst fra tekst
  • Meta laget DALL-E for video, og det er både skummelt og fantastisk
  • Tre grunner til at Facebook/Meta legger ned ansiktsgjenkjenningssystemet
  • The BigSleep A.I. er som Google Bildesøk etter bilder som ikke eksisterer ennå

Oppgrader livsstilen dinDigitale trender hjelper leserne å følge med på den fartsfylte teknologiverdenen med alle de siste nyhetene, morsomme produktanmeldelser, innsiktsfulle redaksjoner og unike sniktitter.