Facebook öppnar upp sin AI för bildigenkänning för alla

facebook messenger virus malware windows chrome facebookcomp head
AI-forskningsavdelningen på Facebook öppnar upp sin mjukvara för bildigenkänning i syfte att utveckla tekniken så att den en dag kan tillämpas på livevideo. Facebooks DeepMask, SharpMask, och MultiPathNet programvara är nu tillgänglig för alla på GitHub.

Facebook har tidigare lagt ut sina bildigenkänningssystem i ett antal forskningsartiklar, som också görs tillgängliga för allmänheten tillsammans med dess demos. För närvarande fungerar företagets algoritmer i kombination med dess MultiPathNet konvolutionella neurala nätverk - en AI som matas enormt mängder data tills den självständigt kan känna igen annan data – vilket gör att Facebook kan förstå en bild baserat på varje pixel den innehåller.

Rekommenderade videor

För att klassificera och märka objekten i en bild, kopplar Facebook ihop sitt DeepMask-segmenteringsramverk med sin SharpMask-segmentförfiningsmodul. Det sista steget i Facebooks maskinseendesystem använder sin MultiPathNet djupinlärning AI för att märka varje objekt på bilden.

Relaterad

  • OpenAI avslöjar platsen för sin första internationella utpost
  • Photoshop AI tycker att "lycka" är ett leende med ruttna tänder
  • Optiska illusioner kan hjälpa oss att bygga nästa generations AI

Enligt Facebook har AI machine vision-programvara utvecklats med stormsteg under de senaste åren, vilket tillåter den typ av bildklassificering som inte ens existerade för en kort stund sedan. Facebook hävdar att öppen källa för programvaran är avgörande för dess utveckling.

Exempelbilder skannade av Facebooks kompletta bildigenkänningssystem
Exempelbilder skannade av Facebooks kompletta bildigenkänningssystem

Tekniker för djupinlärning dyker upp över hela den stora blå giganten. AI driver Facebooks (kontroversiell) ansiktsigenkänningsfunktion, hanterar kuration på sitt nyhetsflöde och används till och med inom dess digital assistent för Messenger.

Det här är inte första gången Facebook har öppnat sin AI. Faktum är att företaget är något av en banbrytare när det gäller att dela sin teknik. I december, Facebook lämnat in sin toppmoderna datorserver tillägnad AI till Open Compute Project — en grupp bestående av teknikjättar, som Apple och Microsoft, som delar designen av sina respektive datorinfrastrukturer.

Facebook förutspår redan framtida användningsfall för tekniken för bildigenkänning. Företaget avslöjar att det potentiellt kan hjälpa det att bygga vidare på sina befintliga AI-genererade bildbeskrivningar för synskadad.

"För närvarande hör synskadade användare som bläddrar i bilder på Facebook bara namnet på personen som delade bilden, följt av termen "foto", när de kommer på en bild i deras nyhetsflöde, skriver Piotr Dollar, forskare på Facebook AI Research (FAIR), i en blogginlägg. "Istället strävar vi efter att erbjuda rikare beskrivningar, som "Fotot innehåller strand, träd och tre leende människor."

Dessutom hävdar Facebook att dess nästa utmaning är att tillämpa sina bildigenkänningstekniker på video, "där objekt rör sig, interagerar och förändras över tiden", och till och med Facebook Livesändningar. "Realtidsklassificering kan hjälpa till att visa relevanta och viktiga livevideor Facebook, medan användning av mer raffinerade tekniker för att upptäcka scener, objekt och handlingar över rum och tid kan en dag möjliggöra berättelser i realtid”, tillägger Dollar.

Redaktörens rekommendationer

  • Till och med OpenAI har gett upp försöken att upptäcka ChatGPT-plagiat
  • De bästa AI-bildgeneratorerna för att skapa konst från text
  • Meta gjorde DALL-E för video, och det är både läskigt och fantastiskt
  • Tre anledningar till att Facebook/Meta stänger av sitt ansiktsigenkänningssystem
  • The BigSleep A.I. är som Google Bildsökning efter bilder som inte finns ännu

Uppgradera din livsstilDigitala trender hjälper läsare att hålla koll på den snabba teknikvärlden med alla de senaste nyheterna, roliga produktrecensioner, insiktsfulla redaktioner och unika smygtittar.