Facebook apre a tutti la sua intelligenza artificiale per il riconoscimento delle immagini

facebook messenger virus malware windows chrome facebookcomp head
La divisione di ricerca sull'intelligenza artificiale di Facebook sta rendendo open source il suo software di riconoscimento delle immagini con l'obiettivo di far avanzare la tecnologia in modo che un giorno possa essere applicata ai video in diretta. Quello di Facebook DeepMask, SharpMask, E MultiPathNet il software è ora disponibile per tutti su GitHub.

Facebook ha precedentemente presentato i suoi sistemi di riconoscimento delle immagini in una serie di documenti di ricerca, che vengono anche resi disponibili al pubblico insieme alle sue demo. Al momento, gli algoritmi dell’azienda funzionano in combinazione con le sue reti neurali convoluzionali MultiPathNet, un’intelligenza artificiale alimentata da enormi quantità di dati fino a quando non riesce a riconoscere autonomamente altri dati, consentendo a Facebook di comprendere un'immagine in base a ciascun pixel contiene.

Video consigliati

Per classificare ed etichettare gli oggetti in un'immagine, Facebook accoppia il suo framework di segmentazione DeepMask con il modulo di perfezionamento del segmento SharpMask. La fase finale del sistema di visione artificiale di Facebook utilizza la sua intelligenza artificiale di deep learning MultiPathNet per etichettare ogni oggetto nella foto.

Imparentato

  • OpenAI rivela l'ubicazione del suo primo avamposto internazionale
  • L’intelligenza artificiale di Photoshop pensa che la “felicità” sia un sorriso con i denti marci
  • Le illusioni ottiche potrebbero aiutarci a costruire la prossima generazione di intelligenza artificiale

Secondo Facebook, negli ultimi anni i software di visione artificiale basati sull’intelligenza artificiale hanno fatto passi da gigante, consentendo un tipo di classificazione delle immagini che fino a poco tempo fa non esisteva nemmeno. Facebook sostiene che l'open source del software è fondamentale per il suo progresso.

Immagini di esempio scansionate dal sistema completo di riconoscimento delle immagini di Facebook
Immagini di esempio scansionate dal sistema completo di riconoscimento delle immagini di Facebook

Le tecniche di deep learning stanno emergendo in tutto il grande colosso blu. L’intelligenza artificiale alimenta Facebook (controverso) funzione di riconoscimento facciale, gestisce la curation del suo feed di notizie e viene utilizzato anche al suo interno assistente digitale per Messaggero.

Questa non è la prima volta che Facebook rende open source la sua intelligenza artificiale. In effetti, l’azienda è in qualche modo un pioniere quando si tratta di condividere la propria tecnologia. In dicembre, Facebook ha presentato il suo stato dell’arte Server dedicato all'intelligenza artificiale all'Open Compute Project, un gruppo composto da giganti della tecnologia, come Apple e Microsoft, che condividono i progetti delle rispettive infrastrutture informatiche.

Facebook sta già prevedendo i futuri casi d’uso della tecnologia di riconoscimento delle immagini. L'azienda rivela che potrebbe potenzialmente aiutarla a basarsi sulle descrizioni delle immagini generate dall'intelligenza artificiale esistenti per ipovedente.

“Attualmente, gli utenti ipovedenti che sfogliano le foto su Facebook sentono solo il nome della persona che ha condiviso la foto, seguito dal termine “foto”, quando trovano un’immagine nel loro feed di notizie”, scrive Piotr Dollar, ricercatore A Facebook Ricerca sull'intelligenza artificiale (FAIR), in a post sul blog. "Il nostro obiettivo è invece offrire descrizioni più ricche, come ad esempio "La foto contiene spiaggia, alberi e tre persone sorridenti".

Inoltre, Facebook afferma che la sua prossima sfida sarà quella di applicare le sue tecniche di riconoscimento delle immagini ai video, “dove gli oggetti si muovono, interagiscono e cambiano nel tempo”, e persino Facebook Trasmissioni in diretta. “La classificazione in tempo reale potrebbe aiutare a far emergere video live rilevanti e importanti Facebook, mentre l’applicazione di tecniche più raffinate per rilevare scene, oggetti e azioni nello spazio e nel tempo potrebbe un giorno consentire la narrazione in tempo reale”, aggiunge Dollar.

Raccomandazioni degli editori

  • Anche OpenAI ha rinunciato a cercare di rilevare il plagio di ChatGPT
  • I migliori generatori di immagini AI per creare arte dal testo
  • Meta ha realizzato DALL-E per i video ed è allo stesso tempo inquietante e sorprendente
  • Tre ragioni per cui Facebook/Meta sta chiudendo il suo sistema di riconoscimento facciale
  • L'A.I. è come la ricerca di immagini di Google per immagini che ancora non esistono

Migliora il tuo stile di vitaDigital Trends aiuta i lettori a tenere d'occhio il frenetico mondo della tecnologia con tutte le ultime notizie, divertenti recensioni di prodotti, editoriali approfonditi e anteprime uniche nel loro genere.