Comparei a geração de imagens do ChatGPT com a do Nano Banana e apenas um deles gerou fotos de banco de imagens úteis.

Um hobby pessoal meu é fazer a mesma pergunta para dois chatbots diferentes e ver qual deles dá a melhor resposta. Como um professor que testa os alunos (algo que às vezes faço como voluntário na vida real), avalio se o bot está delirando e inventando fatos ou se fornece uma resposta inteligente, coerente e realmente útil.

“Inteligência” e “coerência” não são as palavras que eu usaria para descrever o que os chatbots costumam gerar em termos de imagens. Conhecidas como “sujeira de IA” , essas estranhas criações — frequentemente com um fundo desfocado, um humano perfeito com cabelo impecável e talvez alguns polegares extras — estão por toda parte nas redes sociais e até aparecem como imagem principal em artigos como este.

Imagens de banco de imagens já têm má fama. Este vídeo com Emilia Clarke continua sendo uma das minhas paródias favoritas de fotos de banco de imagens e me faz rir, mesmo tendo sido lançado muito antes da era da IA:

Os tempos mudaram. A OpenAI atualizou recentemente o modelo de geração de imagens ChatGPT para competir com o Google Gemini e o Nano Banana Pro .

Surpreendentemente, as imagens não usam mais aquele desfoque característico e, nos meus testes, muitas vezes parecem muito mais realistas do que antes.

Decidi usar exatamente as mesmas perguntas com os dois chatbots e ver qual deles produzia os resultados mais úteis. Estou falando de: uma imagem que você poderia usar em uma campanha publicitária ou em um artigo, algo que você postaria nas redes sociais com uma legenda espirituosa.

O ChatGPT me impressionou com sua velocidade — nenhuma das imagens de banco de imagens parecia lixo gerado por computador. No entanto, o Nano Banana Pro leva vantagem porque gerou imagens mais realistas de forma consistente nos meus testes. Aqui estão as perguntas que usei e as imagens geradas por ambos os bots para que você possa julgar por si mesmo. (As imagens do Nano Banana estão à esquerda.)

1. Pessoa ouvindo um podcast

Prompt utilizado: Crie uma imagem de banco de imagens de alguém ouvindo um podcast em um escritório moderno.

Pedi aos dois bots que criassem uma imagem de alguém ouvindo um podcast em um escritório. O Nano Banana foi o vencedor indiscutível, embora a imagem do Nano Banana tenha um leve desfoque no fundo que poderia ser um grande indício de falsidade. No entanto, a IA está aprendendo a evitar a perfeição absoluta. Honestamente, eu teria dificuldade em dizer que a mulher no escritório na foto do Nano Banana não é real. O cabelo dela está um pouco bagunçado (como alguém na vida real). Na foto do ChatGPT, a pessoa ouvindo o podcast não parece muito real — a foto está um pouco perfeita demais.

2. Crie uma imagem promocional para o meu livro.

Sugestão utilizada: Coloque esta capa de livro nas mãos de alguém que esteja realmente interessado em lê-lo.

Para este teste, carreguei a capa do meu próprio livro e pedi aos bots que criassem uma imagem de alguém lendo-o. O Nano Banana exagerou um pouco, já que a imagem gerada por IA mostra alguém com entusiasmo excessivo. Mesmo assim, a imagem do ChatGPT ainda tem uma qualidade sobrenatural (e digo isso no mau sentido) que não parece real. Tudo na imagem do ChatGPT é perfeito demais — a iluminação, a pose, etc. — e ainda grita "CGI".

3. Crie uma imagem de banco de imagens para usar em um artigo.

Prompt utilizado: Crie uma imagem de banco de imagens para acompanhar um artigo sobre geração de imagens por IA.

Desta vez, o Nano Banana não venceu todas as batalhas. Pedi aos dois bots que criassem uma imagem para acompanhar este artigo. O ChatGPT produziu uma imagem razoavelmente útil, embora ainda um pouco artificial, mas o Nano Banana Pro quebrou a quarta parede com uma imagem gerada por computador que sobrepõe um cérebro e um pincel em um iPad da Apple. Em outras palavras: não é nada útil.

4. Dificuldades de liderança

Prompt utilizado: Mostre alguém com dificuldades para atingir um objetivo de liderança, mas faça com que pareça muito realista.

Uma das fotos de banco de imagens mais comuns mostra alguém se esforçando para alcançar um objetivo — por exemplo, escalando uma montanha, erguendo os braços para o céu ou saltando sobre um desfiladeiro. O motivo pelo qual essa imagem é tão popular é porque as fotos são identificáveis ​​— todos nós lutamos para ter sucesso. Eu diria que tanto o Nano Banana Pro quanto o ChatGPT produziram resultados abaixo da média. As imagens que eles criaram mostram alguém frustrado em um escritório com papéis amassados. Mesmo assim, o Nano Banana tem uma aparência um pouco mais realista.

5. Emilia Clarke sorrindo para a câmera

Prompt utilizado: Crie uma nova imagem de banco de imagens mostrando Emilia Clarke sorrindo para a câmera em um escritório.

Para um teste final, pedi aos dois bots que criassem uma nova imagem de Emilia Clarke sorrindo para a câmera em um escritório. Fiquei surpreso que o ChatGPT se recusou a criar a imagem, dizendo que Clarke é uma "pessoa real e identificável", enquanto o Nano Banana prontamente atendeu ao pedido. Com alguma insistência, pedi ao ChatGPT que gerasse uma imagem de alguém parecido com Clarke. A imagem do Nano Banana não ficou tão ruim — não parece completamente falsa.

Considerações finais

A geração de imagens por IA evoluiu bastante. Nenhuma das fotos produzidas pelo Nano Banana Pro ou pelo ChatGPT mostrava alguém com seis dedos ou três braços. Todas pareciam semirrealistas. Algumas das imagens do Nano Banana eram realistas o suficiente para que eu pudesse usá-las em redes sociais ou para outros fins, e o ChatGPT está definitivamente melhorando. Meu palpite? Daqui a um ano, não conseguiremos mais distinguir uma foto real de uma falsa.

O artigo "Comparei a geração de imagens do ChatGPT com a do Nano Banana e apenas um deles gerou fotos de banco de imagens úteis" foi publicado originalmente no Digital Trends .