Espera aí, essas imagens foram geradas pelo GPT-Image-2?!

No passado, quando se tratava de fofocar, buscar reparação e fornecer provas concretas na internet, nos baseávamos em cinco palavras: "Uma imagem vale mais que mil palavras".
Embora as imagens geradas por IA estejam por toda parte, basta que layouts chineses complexos ou a interface real de um determinado software apareçam na imagem para que a IA seja imediatamente desmascarada e se torne completamente "analfabeta".

▲ Fonte da imagem: X@ hx831126
Mas agora, essa era chegou ao fim.
A era da identificação de imagens por IA através da detecção de erros de digitação e falhas na interface do usuário chegou a um fim abrupto com o lançamento completo do modelo de imagem do ChatGPT, o GPT Image 2.
A APPSO realizou imediatamente testes de estresse utilizando os cenários e necessidades comerciais mais desafiadores da China. Sem precisar revelar as cartas, todas se mostraram surpreendentemente boas.

Para usar o GPT Image 2, abra o ChatGPT, clique no sinal de "+", selecione "Criar Imagem" ou encontre "Imagens" na barra lateral direita. Atualmente, qualquer plano de assinatura, incluindo usuários gratuitos, pode usá-lo diretamente.
As provas de matemática podem ser falsificadas; a tradução para o chinês se torna a nova norma.
Inicialmente, o Nano Banana ganhou destaque como um "deus" no campo da renderização de texto gerada por IA, graças às suas capacidades de processamento de texto. No entanto, apesar de seu processamento de texto superior em comparação com outros modelos, o Nano Banana ainda apresenta alguns desalinhamentos e um layout de texto um tanto rígido quando confrontado com quantidades excessivas de texto.
Agora, o surgimento do GPT Image 2 mudou completamente essa situação. Ele não só entende caracteres chineses, como também tipos de letra chineses extremamente complexos.
Usando o GPT Image 2, nem mesmo instruções excessivamente complexas são necessárias; nossos testes consistiram em apenas uma ou duas frases de descrição simples da imagem.
Por exemplo, pode ser usado para gerar uma prova de matemática para o ensino fundamental em Guangzhou.

▲ Instrução: Gerar prova de matemática para o Ensino Fundamental de Guangzhou
O resultado foi impressionante. O título, as questões sublinhadas com lacunas para preencher, as figuras geométricas e até mesmo o estilo de fonte exclusivo de Song/Kai da prova foram reproduzidos com precisão. À primeira vista, parecia exatamente uma foto tirada com um celular diretamente na prova original.
Se usar uma fonte padronizada já não for difícil o suficiente, podemos tentar desafiá-la usando a caligrafia tradicional chinesa.

▲ Instrução: Gere uma imagem da caligrafia original "O caminho para Shu é difícil".
A segunda imagem do GPT indica que isso ainda não é um desafio para mim. As imagens geradas de caligrafia autêntica não são apenas precisas em seu texto, mas também capturam as linhas fluidas e os traços vigorosos que uma obra caligráfica deve ter. Até mesmo a textura envelhecida do papel e alguns selos são reproduzidos com fidelidade.
Em alguns testes de layout com muitos elementos gráficos e texto, o GPT Image 2 teve um desempenho impecável, sem textos ilegíveis ou fontes sobrepostas. 
▲ Exemplo: Uma cópia amarelada do AI Evening News de hoje, datada de 21 de abril de 2049.
Quando um modelo de IA consegue gerar provas com questões de forma realista e reproduzir calendários chineses com perfeição, o velho ditado "ver para crer" é verdadeiramente e completamente desfeito.
Acredito que se você mostrasse essa prova do quarto ano para um aluno do ensino fundamental, ele realmente não conseguiria encontrar nenhuma falha.
Em conjunto com texto, todo o mundo digital pode ser recriado em escala 1:1.
A renderização em chinês é apenas um complemento ao básico; o que é ainda mais surpreendente na Imagem 2 do GPT é a profundidade do conhecimento de mundo que ela revela.
Incluindo as imagens que viralizaram nos recentes vazamentos do GPT Image 2, como Musk comprando molho de pimenta Lao Gan Ma no TikTok e Ultraman competindo com a plataforma, todas elas são baseadas nos poderosos recursos de renderização de texto e no conhecimento de mundo do GPT Image 2.
O conceito de "conhecimento de mundo" tornou-se popular quando o Nano Banana viralizou. Isso significa que até mesmo modelos de imagem simples possuem conhecimento de modelos gerais, conseguem pesquisar online e pensar. Ele realmente sabe como são as telas que usamos diariamente, os jogos que jogamos e as transmissões ao vivo que assistimos.
Entramos aleatoriamente em um cenário muito característico da internet.

▲ Prompt: Uma bela streamer está transmitindo ao vivo no Douyin.
A imagem resultante não só continha pessoas, como, ainda mais alarmante, replicava completamente a interface do usuário do Douyin (TikTok). A seção de comentários no canto inferior esquerdo, os botões de curtir e compartilhar à direita, o número de visualizações e a faixa de destaque no topo — a lógica hierárquica de todos os elementos interativos estava correta.
Os jogadores podem sentir isso ainda mais profundamente. Quando pedimos que recriasse uma cena de luta em equipe de League of Legends, o programa não apenas desenhou o terreno do Rift, mas também capturou perfeitamente as barras de vida acima das cabeças dos heróis, a iluminação e as sombras dos efeitos das habilidades e a moldura da interface do minimapa.

▲Dica: Tela de jogo do League of Legends, mapa Summoner's Rift, visão isométrica clássica de cima para baixo, vários heróis envolvidos em uma intensa luta em equipe.
Conhece até os momentos mais famosos do mundo da tecnologia como a palma da sua mão. Com apenas uma frase, consegue recriar com precisão as feições de Sam Altman, a iluminação minimalista do palco da OpenAI e a interface de transmissão ao vivo disfarçada de reprodutor de vídeo.

▲Dica: Veja as imagens da transmissão ao vivo do evento de lançamento do GPT-Image-2, com a participação de Sam Altman.
O GPT Image 2 possui uma compreensão das leis visuais do mundo digital mais profunda do que imaginávamos.
XX está morto, revolucionando mais uma vez o design, o marketing e a publicidade…
Por trás do rápido avanço da tecnologia está o fim de diversos fluxos de trabalho antigos.
A IA ultrapassou as barreiras do texto e da interface do usuário, e a criação de imagens brutas transcendeu completamente o âmbito da "criação artística", tornando-se uma ferramenta essencial de produtividade comercial. Neste teste prático, as capacidades de aplicação comercial do GPT Image 2 são suficientes para deixar muitos designers inquietos.
Na área de design industrial e de produto, estruturas mecânicas complexas e modelagem costumam levar muito tempo, mas agora levam apenas alguns segundos.

▲ Instruções: Elabore um diagrama de decomposição de produto interessante para as motocicletas da "Zhang Xue Motorcycles".
A disposição flutuante das peças e a iluminação e sombras altamente tecnológicas podem fornecer instantaneamente referências de protótipos de alta qualidade para imagens que antes exigiam que modeladores 3D trabalhassem por dias.

▲ Fonte da imagem: X@ hx831126
Em termos de recursos visuais para comércio eletrônico e publicidade, ele lida com facilidade com a estética moderna e sofisticada dos produtos da Apple, ou com as imagens de alta saturação e otimizadas para a internet, com textos promocionais em chinês, exigidas pelas plataformas de comércio eletrônico.

▲ Prompt: Anúncio comercial de alta qualidade do iPhone 16 Pro Max

▲Palavras-chave: Foto de anúncio de produto, boia, atraente, alta taxa de cliques, proporção 16:9, em chinês.
Em termos de marketing e criação de propriedade intelectual, o GPT Image 2 também demonstra excelente lógica de layout e extração de recursos. Fontes chinesas podem ser usadas diretamente, a lógica do storyboard é clara e até mesmo os recursos de logotipo de vários modelos grandes podem ser transformados em extensões de propriedade intelectual com forte apelo para a internet.

▲ Desafio: Crie um pôster horizontal para o filme "The Rescue Plan" (embora ele não soubesse do plano de resgate de Gosling, os atores que ele escolheu eram de fato estrelas de filmes de grande orçamento).

▲Dica: Páginas clássicas de histórias em quadrinhos, incluindo layouts de painéis, animações de personagens e balões de fala.

▲ Desafio: Gere uma série de diferentes modelos de linguagem de IA (Gemini, DeepSeek, ChatGPT, Claude, Grok, etc.) para o design de emojis.
Antigamente, quando os designers recebiam um projeto com base em requisitos, precisavam buscar diversas referências, construir estruturas de design complexas e aprimorar layouts e tipografia. Hoje em dia, basta um pedido claro e simples para criar um produto final que pode ser usado diretamente em propostas comerciais, campanhas de e-commerce ou até mesmo em produção em massa.
Durante nossos testes, tanto as contas Plus quanto as gratuitas conseguiram acessar a Imagem 2 do GPT. Você pode experimentar na sua janela de bate-papo do ChatGPT.
No entanto, ainda haverá um aviso de limite de taxa. Quando enviamos a palavra de comando com frequência, solicitando ao ChatGPT que gere a imagem, ele responderá diretamente com um código de erro, exibindo: "Sua imagem está sendo gerada muito rapidamente. Para garantir a melhor experiência para todos, temos um limite de taxa. Por favor, gere em 13 minutos."

É preciso reconhecer que, sempre que pensamos que a OpenAI estagnou, ela consegue surpreender com uma novidade quando menos esperamos.
Nos últimos meses, a empresa foi criticada por lançar novos modelos aos poucos, desativar o Sora e pelo navegador ChatGPT Atlas não ter impressionado, como se a outrora invencível gigante da IA tivesse realmente se tornado incompetente.
O surgimento do GPT Image 2 hoje pode ser visto como uma resposta poderosa a esses pessimistas.

Quando um modelo consegue gerar provas de matemática de uma forma indistinguível da realidade e replicar completamente a interface de uma transmissão ao vivo do TikTok, é difícil dizer à primeira vista que "isso foi feito por IA".
Aquela época em que "uma imagem vale mais que mil palavras" realmente acabou para sempre.
#Siga a conta oficial do iFanr no WeChat: iFanr (ID do WeChat: ifanr), onde você encontrará conteúdo ainda mais interessante o mais breve possível.

