O Nano Banana 2 ficou disponível no mercado por apenas uma hora antes de ser retirado, superando com facilidade testes que fizeram com que toda a IA falhasse.

A Nano Banana, que se tornou uma sensação viral na internet, está agora lançando a versão 2.0.

Quão potente é o novíssimo Nano Banana 2? Observe o relógio às 11h15 e a taça de vinho tinto cheia na imagem abaixo.

▲Fonte da imagem: x@synthwavedd

Por que essa foto é tão impressionante? No campo das imagens geradas por IA, existe um teste extremamente desafiador que nenhuma IA consegue realizar de forma confiável atualmente: o teste do relógio e da taça de vinho tinto cheia .

Digite a mensagem " 11:15 no relógio e uma taça de vinho cheia até a borda " para testar se a sua imagem gerada por IA é inteligente o suficiente.

Tentamos várias vezes na arena de modelos grandes, no Seedream e na versão 1.0 do Nano Banana, mas nenhuma IA conseguiu exibir com precisão as marcações do relógio e uma taça de vinho tinto quase transbordando.

O Nano Banana 2 alcançou esse objetivo. Comparado à versão atual do Nano Banana, suas capacidades de renderização de texto foram aprimoradas, permitindo a escrita direta de texto e o processamento de diferentes estilos e idiomas; seu conhecimento de mundo também foi ampliado, possibilitando a geração precisa de diversos infográficos; e sua capacidade de resposta a comandos também é mais notável.

▲ Escrita em quadro-negro mais realista|Fonte da imagem: x@testingcatalog

Diferentemente da Nano Banana, que foi inicialmente introduzida no cenário de modelos grandes por meio de um sistema gacha, o modelo da Nano Banana 2 vazou no media.io, onde os usuários podem experimentar a Nano Banana 2.

▲ A Media AI (medio.io) atualmente só possui outros modelos de imagem com inteligência artificial, como o nano banana e o Seedream.

No entanto, esse modelo, conhecido como Nano Banana 2, foi rapidamente retirado do ar. No Reddit, alguns usuários mencionaram que a Media AI ofereceu acesso por um curto período de pouco mais de uma hora.

No entanto, nesse curto período de tempo, os internautas descobriram que a qualidade da imagem sem edição era de fato comparável à do Nano Banana 2.0 , e a notícia se espalhou rapidamente nas redes sociais. Todos compartilhavam os resultados da pré-visualização do Nano Banana 2, constatando uma diferença significativa em comparação com a versão Nano Banana 1.0.

Você consegue identificar qual destas duas imagens, das versões 1.0 e 2.0, é do Nano Banana 2?

▲ Fonte da imagem: x@Azinha810

Ambas as fotos mostram modelos de carros em uma rodovia costeira, mas a primeira imagem é claramente mais precisa em termos de cor e estilo, sem a aparência "artificial" frequentemente associada a fotos geradas por IA.

▲ Fonte da imagem: x@Azinha810

A diferença é ainda mais pronunciada nessas duas imagens de estilo ficção científica. A segunda imagem tem uma atmosfera cinematográfica mais forte e sua qualidade visual mostra detalhes mais precisos do que a primeira. Por exemplo, o painel de controle do dispositivo na primeira imagem é claramente diferente do da segunda ; o painel gerado pelo Nano Banana ainda apresenta um estilo nitidamente de IA.

Segundo informações divulgadas pelo blogueiro testingcatalog no X, o Nano Banana 2 ainda é baseado na memória flash Gemini 2.5 e ainda não utiliza totalmente a Gemini 3.0 Pro.

Isso significa que a data de lançamento do modelo gráfico Nano Banana 2 pode ser anterior à do Gemini 3. Reunimos os vazamentos mais recentes sobre o Nano Banana 2, que destacam os seguintes pontos.

1. Ele pode lidar com tarefas mais complexas , como coloração precisa, controle avançado de ponto de vista ou ângulo e correção de elementos de texto em imagens geradas, tarefas que não são suportadas na versão atual 1.0.

▲ Digite o comando para deixar a água rosa. As imagens mostradas são as imagens originais, Nano Banana 1 e Nano Banana 2. | Fonte da imagem: x@Angaisb_

2. Com um fluxo de trabalho de geração multietapas totalmente novo , o nano banana deixou de ser apenas um "gerador de imagens com um clique" e passou a se assemelhar mais ao trabalho de um designer.

  1. Planejamento: Uma quantidade considerável de tempo é dedicada ao planejamento do conteúdo a ser produzido.
  2. Gerar: Gerar uma imagem preliminar.
  3. Análise: Autocensura por meio de recursos integrados de análise de imagem.
  4. Correção: Identifique e corrija quaisquer erros.
  5. Iteração: Repita conforme necessário e, finalmente, entregue o resultado.

3. Geração de imagens com resolução mais alta e proporções de aspecto mais abrangentes , incluindo uma gama mais ampla de proporções, como 1:1, 2:3, 3:2, 3:4, 4:3, 9:16, 16:9 e 21:9, enquanto as informações vazadas indicam que existem vários modos de resolução, como 1K, 2K e 4K.

▲Interface de fluxo de trabalho ComfortUI

Dentre os recursos, o fluxo de trabalho em várias etapas é provavelmente o maior diferencial da atualização do nano banana . Já podemos ter ouvido falar de ferramentas como o ComfyUI, que criam fluxos de trabalho para gerar imagens e vídeos em formato RAW. Mas agora, isso pode ser feito diretamente pelo nano banana, o que representa um grande avanço na geração de imagens de alta precisão.

O desempenho real depende das imagens geradas. Vejamos alguns casos de teste do Nano Banana 2.

Renderização de texto aprimorada

Primeiro, temos a captura de tela real do computador. O Nano Banana 2 pode gerar diretamente uma captura de tela de um computador Windows, mostrando o navegador acessando o site do YouTube e especificando que a miniatura do vídeo é do Mr. Beast.

▲ Envie uma captura de tela do seu computador Windows diretamente. Instruções: Gere uma captura de tela da área de trabalho do Windows 11, com o Google Chrome aberto, mostrando a miniatura do vídeo do Mr. Beast no YouTube (http://YouTube.com). | Fonte da imagem: x@synthwavedd

Para configurações mais complexas, o Nano Banana 2 consegue até gerar uma captura de tela de uma página da web do Google DeepMind. O texto denso não apresenta caracteres distorcidos, o que é realmente impressionante.

▲Fonte da imagem: x@synthwavedd

No entanto, alguns internautas atentos notaram que o desempenho do Nano Banana 2 não era perfeito, apresentando erros de digitação na imagem, como "Gemini 31" e "Google DeepMind – Nevdscl".

Sem uma análise cuidadosa, é muito difícil detectar erros apenas olhando para os títulos e subtítulos principais. No entanto, ao processar quantidades menores de texto, a probabilidade de erros no Nano Banana 2 é muito menor.

Esta imagem, captada durante uma transmissão televisiva ao vivo, mostra que o texto no ecrã está correto e formatado de forma uniforme; apresenta inclusive corretamente o texto refletido no chão.

▲Fonte da imagem: x@synthwavedd

Da mesma forma, aqui está uma captura de tela de uma transmissão de TV ao vivo, com o apresentador no lado direito da tela, a clássica faixa de avisos na parte inferior do noticiário e todo o texto renderizado corretamente.

▲ Palavras-chave: Transmissão ao vivo com grande orçamento em 50mm, fotografia em 8k, close-up de uma atraente apresentadora de notícias italiana de 30 anos com um olhar irônico. Ela está em uma bancada de notícias e, em uma tela atrás dela, há uma banana geneticamente modificada com o texto “Nano Banana 2 ao vivo na Media.IO?”. Transmissão ao vivo. Há um ícone vermelho e azul na parte inferior da imagem que diz “Últimas Notícias: Nano Banana 2 na Media.IO?”. Fonte da imagem: @BrentLynch

Também tivemos o mesmo problema com o processo atual da nano banana.

Esta foto não parece ter sido gerada por IA em excesso, mas o fundo desfocado faz com que pareça menos uma cena de telejornal, e os reflexos no texto também parecem um pouco artificiais, enfatizando a imagem do apresentador.

Com conhecimento do mundo, eles podem compreender melhor nossas instruções.

Assim como o relógio marcando 11:15 e a taça cheia de vinho tinto na imagem de abertura, internautas postaram suas próprias imagens sem edição usando outros modelos, como Grok e ChatGPT, na seção de comentários, mas nenhuma delas foi tão precisa quanto a nano banana 2.

Alguns internautas também compartilharam suas experiências usando o Nano Banana 2 para "transformar" um hambúrguer em vidro, e foi o único que conseguiu transformar o hambúrguer inteiro em vidro; enquanto o Seedream e o Riverflow, da ByteDance, transformaram apenas o pão do hambúrguer em vidro.

▲ Desafio: Faça um hambúrguer de vidro; A Imagem 1 é uma imagem gerada pelo nano banana 2 | Fonte da imagem: x@Angaisb_

Os avanços no conhecimento global permitem que o Nano Banana 2 entenda melhor as instruções, garantindo o cumprimento rigoroso das mesmas e, ao mesmo tempo, simplificando-as.

Por exemplo, quando um usuário testou a geração de um trailer de GTA 6, o nano banana 2 forneceu diretamente a ele uma página completa do YouTube, e até mesmo reconheceu o logotipo real de GTA 6.

▲ Fonte da imagem: x@jewgibor

Ele também testou um conjunto de comandos: "One Piece live-action Netflix". O resultado foi que o nano banana não só conhecia o logotipo da Netflix, como também sabia quem eram os atores da versão live-action.

Combinando conhecimento do mundo real com renderização de texto, o Nano Banana 2 pode até resolver problemas para nós em um quadro-negro, o que é muito mais confortável do que analisar longos raciocínios matemáticos em uma caixa de bate-papo.

▲Fonte da imagem: x@MagusWazir

A comparação entre o Nano Banana versão 1.0 e o Nano Banana 2 é a seguinte.

▲ Fonte da imagem: https://www.reddit.com/r/singularity/comments/1osolhn/nano_banana_2_vs_nano_banana_comparison_output/

Existem muitos casos semelhantes em que um Nano Banana 2 é usado para resolver problemas de matemática e, em seguida, as respostas são escritas no quadro-negro.

▲ Fonte da imagem: x@Liam06972452

Desta vez, não só as capacidades de edição, como também a possibilidade de produzir fotos sem edição foram aprimoradas.

A versão prévia do teste foi exibida brevemente na plataforma Media AI.

▲Pistas: Ken Kaneki carregando seu amigo nos braços na neve, Tokyo Ghoul | Fonte da imagem: x@legit_api

A cena de Kaneki Ken abraçando seu amigo na neve, de Tokyo Ghoul, foi gerada de forma tão natural. Além do estilo anime e cyberpunk consistentemente bem executado, as imagens não editadas de Nano Banana 2 também têm uma qualidade incrível.

▲ Descrição: Robô hacker cyberpunk trabalhando em frente a vários monitores | Fonte da imagem: x@testingcatalog

Existem também todos os tipos de imagens de retratos "paródias".

▲ Fonte da imagem: x@MicahBerkley

E essas fotos de grupo com um forte estilo cinematográfico.

▲ Fonte da imagem: x@rpnickson

No entanto, alguém comentou: "Este não é o Nano Banana; a Media AI é uma empresa chinesa. Assim como quando o DeepSeek foi lançado, também pensamos que era da OpenAI; essa é a tática usual deles."

Quando o Nano Banana 1 surgiu pela primeira vez no mercado de modelos grandes, ninguém tinha certeza se o modelo era realmente da Google, mas no final, contanto que as imagens brutas fossem impressionantes o suficiente, nós o compraríamos.

A julgar pela qualidade da imagem atual, sem edição, chamá-la de Nano Banana 2 é perfeitamente aceitável.

#Siga a conta oficial do iFanr no WeChat: iFanr (ID do WeChat: ifanr), onde você encontrará conteúdo ainda mais interessante o mais breve possível.

ifanr | Link original · Ver comentários · Sina Weibo