A atualização do modelo de linguagem Midjourney v5 adiciona realismo às mãos humanas
Midjourney v5 é o mais recente modelo de linguagem do popular gerador de texto para imagem conhecido por suas criações realistas.
A atualização foi lançada na base de clientes pagos da Midjourney na quarta-feira e muitos usuários, incluindo a designer gráfica Julie Wieland, compartilharam sua nova arte gerada por IA. Os detalhes de IA que o modelo de linguagem v5 traz incluem “eficiência, coerência e qualidade aprimoradas”, disse a Midjourney em seu site .
Muitos usuários notaram especialmente as atualizações nos detalhes da mão humana, com indivíduos mais propensos a ter cinco dedos por mão. Nos modelos anteriores, as mãos humanas geralmente eram geradas com um número incorreto de dígitos, de quatro a sete e dez. Aqueles que puderam testar o Midjourney v5 ficaram impressionados com as atualizações visuais.
“O mais recente modelo Midjourney v5 é extremamente avassalador/assustador e além de fascinante”, disse Wieland à PetaPixel .
“Sua capacidade de recriar detalhes e texturas complexos, como textura realista da pele/recursos faciais e iluminação, é incomparável”, acrescentou ela.
Embora Midjourney seja um modelo de linguagem único, ele funciona de maneira semelhante a outros geradores de texto para imagem, como Stable Diffusion e DALL-E , usando descritores de prompt expressos para criar imagens, de acordo com o modelo, que é treinado usando humanos – fez arte como referência, segundo a ArsTechnica .
Há um debate contínuo sobre se a arte gerada por IA é legal ou ética; no entanto, muitos usuários do Midjourney v5 consideram que, com atualizações contínuas, pode ser indistinguível de arte e fotografia reais. Wieland considera que os geradores de imagem de IA, como o Midjourney, provavelmente serão companheiros para os fotógrafos, e não substitutos.
No entanto, Midjourney v5 tem seus problemas. O criador de imagens de IA, Nick St. Pierre, compartilhou muitos de seus trabalhos, para os quais usou os mesmos prompts no Midjourney v4 e Midjourney v5 anteriores. Uma das imagens era uma foto fascinante de mulheres jovens no estilo de rua dos anos 1960, que lembra uma sessão de fotos de moda ao ar livre. Após uma inspeção mais detalhada, você pode identificar as mãos flutuantes não presas a corpos e rostos disformes no fundo.
Com seu modelo v5 mais recente, o fundador da Midjourney, David Holz, recomendou no Discord da marca que os usuários evitem prompts curtos em favor de “textos mais longos e explícitos” para obter melhores resultados.