Meta revelou um modelo maluco de inteligência artificial que permite aos usuários transformar suas descrições digitadas em vídeo. O sistema é chamado Faz um video e é o que há de mais recente em uma tendência de conteúdo gerado por IA na web.
O sistema aceita descrições curtas como “um robô surfando uma onda no oceano” ou “peixe-palhaço nadando no recife de coral” e gera dinamicamente um pequeno GIF da descrição. Existem até três estilos diferentes de vídeos para escolher: surreal, realista e estilizado.
De acordo com um Postagem no Facebook pelo CEO da Meta, Mark Zuckerberg, traduzir texto escrito em vídeo é muito mais difícil porque o vídeo requer movimento:
Vídeos recomendados
“É muito mais difícil gerar vídeos do que fotos porque além de gerar corretamente cada pixel, o sistema também precisa prever como eles vão mudar ao longo do tempo. Make-A-Video resolve isso adicionando uma camada de aprendizagem não supervisionada que permite ao sistema compreender o movimento no mundo físico e aplicá-lo à geração tradicional de texto para imagem.”
A equipe de pesquisa de IA da Meta escreveu um papel descrevendo como o sistema funciona e como ele difere dos métodos atuais de texto para imagem (T2I). Ao contrário de outros modelos de linguagem de máquina, o método Text-to-Video (T2V) do Meta não usa pares texto-vídeo predefinidos. Por exemplo, não combina “homem caminhando” com um vídeo de um homem real caminhando.
Se isso se parece muito com o DALL-E, o popular aplicativo T2I, você não estaria longe. Outras aplicações T2I foram lançadas desde que o DALL-E ganhou popularidade. TikTok lançou um filtro em agosto, chamado AI Greenscreen, que gera imagens em estilo de pintura com base nas palavras que você digita.
O conteúdo gerado por IA tornou-se bastante popular nos últimos anos. Tecnologia falsa profunda, técnicas de aprendizado de máquina para substituir o rosto de uma pessoa por outro, é usado até mesmo por estúdios de efeitos visuais para programas de grande orçamento como O Mandaloriano.
Em julho, o The Times noticiou erroneamente sobre uma mulher ucraniana no meio da guerra Rússia-Ucrânia. O problema é ela não era real.
A ameaça da IA provavelmente não é uma ameaça real, mas projetos como DALL-E e Make-A-Video são explorações divertidas de algumas das possibilidades interessantes.
Recomendações dos Editores
- O rival ChatGPT da Apple pode escrever código automaticamente para você
- O Bing Image Creator traz imagens geradas por DALL-E AI para o seu navegador
- Eu vi o futuro (distante) da pesquisa na web com IA – é aqui que ela é incrível e onde ela enfrenta dificuldades
- AI Dall-E de geração de imagens agora é gratuito para qualquer um brincar
- Apresentei minha ideia ridícula de startup para um robô VC
Atualize seu estilo de vidaDigital Trends ajuda os leitores a manter o controle sobre o mundo acelerado da tecnologia com as últimas notícias, análises divertidas de produtos, editoriais criteriosos e prévias únicas.