Meta fez DALL-E para vídeo, e é assustador e incrível

Meta revelou um modelo maluco de inteligência artificial que permite aos usuários transformar suas descrições digitadas em vídeo. O sistema é chamado Faz um video e é o que há de mais recente em uma tendência de conteúdo gerado por IA na web.

O sistema aceita descrições curtas como “um robô surfando uma onda no oceano” ou “peixe-palhaço nadando no recife de coral” e gera dinamicamente um pequeno GIF da descrição. Existem até três estilos diferentes de vídeos para escolher: surreal, realista e estilizado.

O pincel de um artista pintando em uma tela de perto

De acordo com um Postagem no Facebook pelo CEO da Meta, Mark Zuckerberg, traduzir texto escrito em vídeo é muito mais difícil porque o vídeo requer movimento:

Vídeos recomendados

“É muito mais difícil gerar vídeos do que fotos porque além de gerar corretamente cada pixel, o sistema também precisa prever como eles vão mudar ao longo do tempo. Make-A-Video resolve isso adicionando uma camada de aprendizagem não supervisionada que permite ao sistema compreender o movimento no mundo físico e aplicá-lo à geração tradicional de texto para imagem.”

Um jovem casal caminhando sob uma forte chuva

A equipe de pesquisa de IA da Meta escreveu um papel descrevendo como o sistema funciona e como ele difere dos métodos atuais de texto para imagem (T2I). Ao contrário de outros modelos de linguagem de máquina, o método Text-to-Video (T2V) do Meta não usa pares texto-vídeo predefinidos. Por exemplo, não combina “homem caminhando” com um vídeo de um homem real caminhando.

Se isso se parece muito com o DALL-E, o popular aplicativo T2I, você não estaria longe. Outras aplicações T2I foram lançadas desde que o DALL-E ganhou popularidade. TikTok lançou um filtro em agosto, chamado AI Greenscreen, que gera imagens em estilo de pintura com base nas palavras que você digita.

Um bebê preguiça fofo com um chapéu de malha laranja tentando descobrir um laptop fechando uma tela de iluminação de estúdio altamente detalhada refletindo em seus olhos

O conteúdo gerado por IA tornou-se bastante popular nos últimos anos. Tecnologia falsa profunda, técnicas de aprendizado de máquina para substituir o rosto de uma pessoa por outro, é usado até mesmo por estúdios de efeitos visuais para programas de grande orçamento como O Mandaloriano.

Em julho, o The Times noticiou erroneamente sobre uma mulher ucraniana no meio da guerra Rússia-Ucrânia. O problema é ela não era real.

A ameaça da IA ​​provavelmente não é uma ameaça real, mas projetos como DALL-E e Make-A-Video são explorações divertidas de algumas das possibilidades interessantes.

Recomendações dos Editores

  • O rival ChatGPT da Apple pode escrever código automaticamente para você
  • O Bing Image Creator traz imagens geradas por DALL-E AI para o seu navegador
  • Eu vi o futuro (distante) da pesquisa na web com IA – é aqui que ela é incrível e onde ela enfrenta dificuldades
  • AI Dall-E de geração de imagens agora é gratuito para qualquer um brincar
  • Apresentei minha ideia ridícula de startup para um robô VC

Atualize seu estilo de vidaDigital Trends ajuda os leitores a manter o controle sobre o mundo acelerado da tecnologia com as últimas notícias, análises divertidas de produtos, editoriais criteriosos e prévias únicas.