O modelo de linguagem Midjourney v5 adiciona realismo às mãos humanas

Midjourney v5 é o modelo de linguagem mais recente do popular gerador de texto para imagem conhecido por suas criações realistas.

O atualização lançada à base de clientes pagos da Midjourney na quarta-feira e muitos usuários, incluindo a designer gráfica Julie Wieland, compartilharam suas novas obras de arte geradas por IA. Os detalhes de IA que o modelo de linguagem v5 traz consigo incluem melhor “eficiência, coerência e qualidade”, disse Midjourney em seu site.

Apenas um aviso: a IA do Midjourney agora pode fazer as mãos corretamente. Seja extremamente crítico com qualquer imagem política (especialmente fotografia) que você vê online que esteja tentando incitar uma reação. pic.twitter.com/ebEagrQAQq

- Del Walker (@TheCartelDel) 16 de março de 2023

Muitos usuários notaram especialmente as atualizações nos detalhes das mãos humanas, com indivíduos mais propensos a ter cinco dedos por mão. Nos modelos anteriores, as mãos humanas eram frequentemente geradas com um número incorreto de dígitos, entre quatro e sete e dez. Aqueles que puderam testar o Midjourney v5 ficaram impressionados com as atualizações visuais.

Vídeos recomendados

“O mais recente modelo Midjourney v5 é extremamente impressionante/assustador e além de fascinante”, disse Wieland PetaPixel.

“Sua capacidade de recriar detalhes e texturas intrincadas, como textura de pele/características faciais realistas e iluminação, é incomparável”, acrescentou ela.

Embora Midjourney seja um modelo de linguagem único, ele funciona de maneira semelhante a outros geradores de texto para imagem, como Difusão Estável e DALL-E, utilizando descritores de prompt redigidos para criar imagens, conforme o modelo, que é treinado tendo como referência a arte feita pelo homem, conforme ArsTechnica.

Tem havido um debate contínuo sobre se a arte gerada pela IA é legal ou ética; no entanto, muitos usuários do Midjourney v5 consideram que, com atualizações contínuas, ele pode ser indistinguível da arte e fotografia reais. Wieland considera que os geradores de imagens de IA, como o Midjourney, provavelmente serão companheiros dos fotógrafos, e não substitutos.

O meio da jornada v5 está aqui! (de verdade desta vez, haha)

Aqui estão alguns dos meus prompts lado a lado, v4 vs v5, bem como alguns novos prompts e fotos da multidão. Acrescentarei mais à medida que experimento.

🧵 pic.twitter.com/qSEZWQBXou

-Nick St. Pierre (@nickfloats) 15 de março de 2023

No entanto, Midjourney v5 tem seus erros. O criador de imagens de IA, Nick St. Pierre, compartilhou muitos de seus trabalhos, para os quais ele usou os mesmos prompts no Midjourney v4 e Midjourney v5 anteriores. Uma imagem era uma foto fascinante de mulheres jovens no estilo de rua dos anos 1960, que lembra um ensaio fotográfico de moda ao ar livre. Após uma inspeção mais detalhada, você pode ver as mãos flutuantes não presas aos corpos e os rostos disformes ao fundo.

Com seu modelo v5 mais recente, o fundador da Midjourney, David Holz, recomendou no Discord da marca que os usuários evitem avisos curtos em favor de “textos mais longos e explícitos” para obter melhores resultados.

Atualize seu estilo de vidaDigital Trends ajuda os leitores a manter o controle sobre o mundo acelerado da tecnologia com as últimas notícias, análises divertidas de produtos, editoriais criteriosos e prévias únicas.