Clique e arraste a edição de imagem AI pode mudar tudo

O mais recente desenvolvimento em inteligência artificial é uma ferramenta que permite editar uma imagem já gerada de acordo com suas especificações.

Digamos que você queira “alterar as dimensões de um carro ou transformar um sorriso em uma carranca com um simples clique e arrastar”, você poderia fazer isso com este modelo chamado DragGAN.

Arraste sua GAN: manipulação interativa baseada em pontos no coletor de imagens generativas

página de papel: https://t.co/Gjcm1smqfl pic.twitter.com/XHQIiMdYOA

— AK (@_akhaliq) 19 de maio de 2023

A Generative Adversarial Network (GAN) está atualmente na forma de um trabalho de pesquisa, no entanto, atraiu tanta atenção dos interessados ​​em ver suas demonstrações que a página inicial da equipe de pesquisa sofreu falhas devido ao tráfego intenso.

O The Verge comparou o DragGAN à ferramenta Warp no Photoshop, acrescentando que é muito mais poderoso, pois não “comprime pixels”, mas “regenera o objeto subjacente” e pode até girar imagens 3D.

O potencial dessa ferramenta reside no fato de que a IA geradora de texto para imagem nem sempre produz o que você deseja. Assim, você pode voltar depois e fazer edições em uma imagem existente, em vez de gerar automaticamente uma nova imagem.

Algumas demonstrações que fazem parte do trabalho de pesquisa incluem adicionar altura a uma montanha, alterar o posicionamento de uma modelo e editar o comprimento e a forma de suas roupas, abrir ou fechar a boca de um leão e mudar o rosto de uma pessoa de um visual simples para um sorriso. Com muitas ferramentas de IA atualmente disponíveis, os usuários precisam regenerar uma imagem com um prompt mais específico para obter um resultado mais desejável.

A equipe de pesquisa observou em seu artigo que novos detalhes podem ser adicionados na regeneração dos aspectos editados das imagens que são benéficos para a atualização. “Nossa abordagem pode alucinar conteúdo oculto, como os dentes dentro da boca de um leão, e pode se deformar seguindo a rigidez do objeto, como a dobra de uma perna de cavalo.”

Existem muitas marcas que estão tentando oferecer opções de edição para conteúdo generativo de IA. No entanto, a maioria não chega a permitir a edição real das imagens, mas sim aspectos como a edição em torno das imagens. Por exemplo, o aplicativo Designer da Microsoft permite gerar imagens AI a partir de um prompt de texto e você pode selecionar seu favorito entre três resultados e levá-lo ao estúdio de design, onde pode criar uma série de projetos baseados em criatividade e produtividade, como postagens de mídia social, convites, cartões postais digitais ou gráficos com a imagem como ponto focal. No entanto, você não pode editar a imagem gerada por IA.

Com a ferramenta DragGAN ainda sendo uma demonstração por enquanto, não há como dizer qual seria a qualidade de uma tecnologia prontamente disponível, ou se seria possível, especialmente porque as demos são baseadas em vídeos de baixa resolução. No entanto, é um exemplo interessante da rapidez com que a IA continua a se desenvolver.