Facebook abre sua IA de reconhecimento de imagem para todos

facebook messenger vírus malware windows chrome facebookcomp cabeça
A divisão de pesquisa de IA do Facebook está abrindo o código-fonte de seu software de reconhecimento de imagem com o objetivo de aprimorar a tecnologia para que um dia possa ser aplicada a vídeos ao vivo. do Facebook DeepMask, SharpMask, e MultiPathNet o software agora está disponível para todos no GitHub.

Facebook expôs anteriormente seus sistemas de reconhecimento de imagem em uma série de artigos de pesquisa, que também estão sendo disponibilizados ao público junto com suas demonstrações. Atualmente, os algoritmos da empresa trabalham em conjunto com suas redes neurais convolucionais MultiPathNet – uma IA que é alimentada por enormes quantidades de dados até que possa reconhecer autonomamente outros dados – permitindo que o Facebook entenda uma imagem com base em cada pixel que ela contém.

Vídeos recomendados

Para classificar e rotular os objetos em uma imagem, o Facebook combina sua estrutura de segmentação DeepMask com seu módulo de refinamento de segmento SharpMask. O estágio final do sistema de visão mecânica do Facebook utiliza sua IA de aprendizado profundo MultiPathNet para rotular cada objeto na foto.

Relacionado

  • OpenAI revela localização de seu primeiro posto avançado internacional
  • Photoshop AI acha que ‘felicidade’ é um sorriso com dentes podres
  • Ilusões de ótica podem nos ajudar a construir a próxima geração de IA

De acordo com o Facebook, o software de visão artificial de IA progrediu muito nos últimos anos, permitindo o tipo de classificação de imagens que nem existia há pouco tempo. Facebook afirma que o código aberto do software é fundamental para seu avanço.

Exemplos de imagens digitalizadas pelo sistema completo de reconhecimento de imagens do Facebook
Exemplos de imagens digitalizadas pelo sistema completo de reconhecimento de imagens do Facebook

Técnicas de aprendizagem profunda estão surgindo em todo o grande gigante azul. A IA alimenta o Facebook (controverso) recurso de reconhecimento facial, gerencia a curadoria em seu feed de notícias e é até utilizado em seu assistente digital para Mensageiro.

Esta não é a primeira vez que o Facebook abre o código de sua IA. Na verdade, a empresa é pioneira quando se trata de compartilhar sua tecnologia. Em dezembro, Facebook apresentou seu estado da arte servidor de computador dedicado à IA no Open Compute Project — um grupo formado por gigantes da tecnologia, como Apple e Microsoft, que compartilham os designs de suas respectivas infraestruturas computacionais.

O Facebook já está prevendo os futuros casos de uso da tecnologia de reconhecimento de imagem. A empresa revela que poderia potencialmente ajudá-la a desenvolver as descrições de imagens existentes geradas por IA para o deficiente visual.

“Atualmente, os usuários com deficiência visual que navegam nas fotos no Facebook ouvem apenas o nome da pessoa que compartilhou a foto, seguido pelo termo “foto”, quando encontram uma imagem em seu feed de notícias”, escreve Piotr Dollar, cientista pesquisador no Facebook AI Research (FAIR), em um postagem no blog. “Em vez disso, pretendemos oferecer descrições mais ricas, como ‘A foto contém praia, árvores e três pessoas sorridentes’”.

Além disso, o Facebook afirma que seu próximo desafio é aplicar suas técnicas de reconhecimento de imagem ao vídeo, “onde os objetos se movem, interagem e mudam ao longo do tempo” e até mesmo Facebook Transmissões ao vivo. “A classificação em tempo real pode ajudar a exibir vídeos ao vivo relevantes e importantes em Facebook, ao mesmo tempo que a aplicação de técnicas mais refinadas para detectar cenas, objetos e ações no espaço e no tempo poderá um dia permitir a narração em tempo real”, acrescenta Dollar.

Recomendações dos Editores

  • Até a OpenAI desistiu de tentar detectar o plágio do ChatGPT
  • Os melhores geradores de imagens de IA para criar arte a partir de texto
  • Meta criou DALL-E para vídeo, e é assustador e incrível
  • Três razões pelas quais o Facebook/Meta está encerrando seu sistema de reconhecimento facial
  • A IA do BigSleep é como a Pesquisa de imagens do Google para imagens que ainda não existem

Atualize seu estilo de vidaDigital Trends ajuda os leitores a manter o controle sobre o mundo acelerado da tecnologia com as últimas notícias, análises divertidas de produtos, editoriais criteriosos e prévias únicas.