Resultados reais dos testes com o GPT-5.2: Ligeiro aumento na capacidade de prever aumentos de preço. O que o torna capaz de competir com o Gemini?

O GPT 5.2, projetado para superar o Gemini, foi lançado oficialmente hoje de manhã e disponibilizado para todos os usuários.

Cancelei minha assinatura do ChatGPT Plus no mês passado e mudei para o Gemini. Preciso voltar para o Gemini agora por causa do GPT-5.2?

Após ler essas experiências reais de usuários compartilhadas por internautas e testar o APPSO na prática, você poderá encontrar uma resposta.

▲Desta vez, finalmente, não desenhei a tabela errada.

O GPT 5.2 atualiza, na verdade, três modelos: GPT-5.2 Instant, Thinking e Pro. Se você está acostumado com a análise cuidadosa de cada pergunta e resposta no Gemini 3.0 Pro, perceberá que a velocidade de raciocínio do ChatGPT é mais lenta e demorada ao começar a usar o GPT-5.2 Thinking/Pro.

Este também é o feedback compartilhado pela maioria dos usuários que tiveram acesso antecipado nas redes sociais. Em outras palavras, o GPT-5.2 é uma melhoria em relação ao 5.1 em todos os aspectos, e o GPT-5.2 Pro é muito adequado para tarefas de inferência profissional que exigem um longo tempo de execução; no entanto, o tempo de espera pelos resultados aumenta.

Por exemplo, um usuário relatou que, ao inserir a solicitação "Ajude-me a desenhar um gráfico das pontuações do teste HLE", o GPT-5.2 Pro levou 24 minutos para gerar o gráfico.

▲Fonte da imagem: https://x.com/emollick/status/1999185755617300796/photo/1

Felizmente, todas as informações estavam corretas, e até mesmo o melhor resultado no gráfico ainda mostrava o Gemini 3.0 Pro.

Isso também se deve ao fato de a data de expiração do conhecimento para o GPT-5.2 ter sido alterada para agosto de 2025 , enquanto a data de expiração do conhecimento para o GPT-5.1 era setembro de 2024 e a data de expiração do conhecimento para o Gemini 3.0, que foi lançado no mês passado, é 2025,1.

Quando usamos o GPT-5.2 Thinking para gerar um gráfico do histórico de versões de modelos da OpenAI, o processo foi rápido e as informações bastante precisas. Para tarefas simples, o tempo gasto com o modelo Thinking difere significativamente do tempo gasto com o modelo Pro.

▲ Instrução: Gere um gráfico de barras mostrando a evolução das versões de modelos da OpenAI ao longo do tempo.

Com seu raciocínio de "ultra-alta intensidade" e conhecimento mundial atualizado, combinado com a capacidade de compreensão e raciocínio multimodal de imagens, o GPT 5.2 rapidamente ascendeu ao segundo lugar no cenário de modelos de grande porte. O GPT-5.2-High ficou em segundo lugar no projeto WebDev (desenvolvimento web) , enquanto o GPT-5.2 ficou em sexto. Em comparação, o Gemini 3.0 Pro ficou em terceiro lugar, com Claude ainda mantendo a primeira posição.

A LMArena também divulgou um vídeo de teste mostrando o uso do GPT-5.2 para concluir uma série de tarefas de modelagem 3D com um altíssimo nível de precisão. No entanto, alguns internautas comentaram: "Isso ainda é 2003?".

▲Fonte do vídeo: https://x.com/arena/status/1999189215603753445

Este efeito 3D, obtido com o three.js, exige um alto grau de compreensão multimodal e capacidade de raciocínio do modelo, além de otimização no desenvolvimento e design da programação; o GPT-5.2 justifica plenamente esta atualização para a versão 0.1.

Atualmente, muitos testes compartilhados por internautas se concentram principalmente na construção de motores 3D completos, e o GPT-5.2 apresenta um desempenho excelente. Por exemplo, existem testes que utilizam o modo de raciocínio de alta dificuldade do GPT-5.2 Thinking, que, em um único arquivo, construiu um modelo 3D de um reino de gelo nevado que suporta controle interativo e pode ser exportado em resolução 4K.

▲ https://x.com/skirano/status/1999182295685644366

Existem também edifícios urbanos góticos turbulentos em 3D criados usando o GPT-5.2 Pro.

▲Palavra-chave: crie um shader visualmente interessante que possa ser executado no twigl-dot-app, representando uma cidade infinita de torres neogóticas parcialmente submersa em um oceano tempestuoso com grandes ondas.|Fonte: https://x.com/emollick/status/1999185085719887978?s=20

Em relação às capacidades de compreensão e raciocínio 3D, também utilizamos a mesma sugestão que Ian Goodfellow usou após o lançamento do Gemini 3.0 Pro, que consiste em carregar uma imagem e, em seguida, instruir o modelo a gerar uma bela cena de aplicação de página única em voxel art com Three.js, baseada nessa imagem.

▲ Como o ChatGPT não gerou o código para mim dentro da tela, copiei o código gerado na caixa de diálogo e o abri na Visualização HTML, como mostrado na imagem à direita.

A diferença é bastante óbvia. Embora o ChatGPT também tenha lido o conteúdo da imagem enviada — um livro rosa, um campo verde, um objeto cinza afundando e água branca — a animação 3D gerada foi um tanto rudimentar em comparação com o Gemini 3.0 Pro.

Tudo o que posso dizer é que o fato de Ultraman emitir esse "alerta vermelho" demonstra a verdadeira qualidade da Gemini.

Testar habilidades de programação inevitavelmente envolve simulações clássicas de física com bolas hexagonais. Um blogueiro aumentou a dificuldade usando bolas 3D totalmente iluminadas de vermelho. O efeito é muito legal, e muitos internautas estão perguntando como foi conseguido; no entanto, alguns apontaram que essas bolas parecem não ser afetadas pela gravidade.

Então, alguns internautas responderam que isso era uma simulação do espaço.

▲Fonte do vídeo: https://x.com/flavioAd/status/1999183432203567339

Há também um teste de código SVG e um pelicano andando de bicicleta.

▲ Fonte da imagem: https://arena.jit.dev/

Alguns internautas também compartilharam que criaram um simulador de incêndio florestal usando o GPT-5.2, que pode ajustar a velocidade, o tamanho da área e o alcance da queima do fogo, etc.

▲Fonte da imagem: https://x.com/1littlecoder/status/1999191170581434557?s=20

Criamos uma página web para sinais planetários, com um layout quase idêntico ao desta página web de visualização de incêndios florestais. A única diferença é que o conteúdo exibido no lado esquerdo foi alterado de estrelas dispersas para corpos celestes.

▲Desafio: Crie uma simulação interativa em HTML, CSS e JavaScript de um sistema de satélite que transmite sinais para receptores terrestres. A simulação deve mostrar um satélite orbitando a Terra e enviando periodicamente sinais que são recebidos por múltiplos receptores.

Também usamos a câmera instantânea que construímos com a Gemini 3 para testar o GPT-5.2. Inserimos os mesmos comandos, pedindo que ele desenvolvesse um aplicativo web no estilo de uma câmera instantânea retrô.

▲Desafio: Desenvolva um aplicativo de câmera de página única com estilo retrô e design esqueumórfico. O fundo da página deve ser um painel de cortiça ou um material com textura de madeira escura. Um modelo de câmera instantânea esqueumórfica, desenhado inteiramente com CSS ou SVG, deve ser fixado no canto inferior esquerdo, com a área da lente exibindo a visão da câmera do usuário em tempo real. Em termos de lógica de interação, quando o usuário clicar no botão do obturador, um efeito sonoro de obturador deve ser reproduzido e uma imagem com borda branca deve emergir lentamente da parte superior da câmera. Utilize filtros CSS para que a foto emergente fique inicialmente muito desfocada e em preto e branco, fazendo uma transição suave para um estado nítido e colorido em até 5 segundos. Por fim, todas as fotos reveladas devem ser arrastáveis, permitindo que os usuários as posicionem livremente em qualquer lugar da página, com ângulos de rotação e sombras aleatórios. Clicar em uma foto deve colocá-la no topo, criando uma colagem de fotos realista e de formato livre.

De forma um tanto surpreendente, o ChatGPT também consegue tirar fotos instantâneas de uma só vez.

Quando testamos o Gemini 3.0 Pro anteriormente, suas funcionalidades mais poderosas eram a programação e o fato de não exigir que inserissemos muitos comandos. Bastava fornecer uma captura de tela ou um vídeo e pedir que ele o replicasse, e o Gemini fazia isso.

Desta vez, também incluímos um vídeo e pedimos que o programa replicasse a página web que gera esse poema antigo.

▲ https://chatgpt.com/canvas/shared/693b6d1b8fa881919c6298a4aed05581

Em comparação com o GPT-5.1, que desconhecia completamente o esquema de cores dos meus vídeos enviados, desta vez parece ter aprendido algo. No entanto, como as páginas web geradas pelo Gemini podem incorporar funcionalidades de IA diretamente através da sua API, o ChatGPT ainda não integrou IA nessas páginas web geradas. Portanto, os poemas aqui apresentados são apenas alguns dos que já foram escritos.

Além dos testes clássicos de habilidades em programação e da simples criação de um arquivo HTML de página única, alguns usuários também o utilizam para escrever código em Python.

A sugestão inserida pelo usuário foi: "escreva um código em Python que visualize como funciona um semáforo em uma rua de mão única com carros entrando em ritmo aleatório."

Ele testou tanto o GPT 5.2 Extended Thinking quanto o Claude Opus 4.5, e os resultados foram óbvios. Podemos afirmar com segurança que frequentemente nos perguntam qual modelo de programação é o melhor, e há um motivo para o Claude ser tão popular entre os desenvolvedores.

▲ Abaixo está o GPT-5.2, fonte: https://x.com/diegocabezas01/status/1999228052379754508

Além disso, a maior desvantagem do modelo Claude era o seu alto preço. O Claude Opus 4.5 custava US$ 5 por milhão de tokens de entrada e US$ 25 por milhão de tokens de saída. Agora, o preço do GPT-5.2 alcançou esse patamar, sendo cerca de 40% mais caro que o GPT-5.1. O GPT-5.2 Pro custa US$ 21 por token de entrada e US$ 168 por token de saída.

Em seu blog oficial de lançamento, a OpenAI mencionou que o GPT-5.2 também aprimorou suas capacidades de processamento de imagens.

O GPT-5.2 Thinking é o nosso modelo visual mais poderoso até o momento, reduzindo a taxa de erros em cerca de metade no raciocínio gráfico e na compreensão de interfaces de software.

Também fornece um exemplo de uso de IA para adicionar marcações em forma de caixa a uma placa-mãe que parece borrada; em comparação com o GPT-5.1, o GPT-5.2, embora também cometa erros, marca mais áreas.

Mas e o Nano Banana Pro? Alguns usuários usaram o Nano Banana Pro para remover anotações das imagens e depois solicitaram que ele adicionasse novas caixas de localização de destino. Qual você acha melhor?

▲Da esquerda para a direita: GPT-5.1, GPT-5.2, Nano Banana Pro | Fonte da imagem: https://x.com/bcaine/status/1999212747213656072

A minha impressão é que o ChatGPT está se "humilhando" em áreas onde outros se destacam. O Nano Banana é agora o líder indiscutível em trabalhos relacionados a imagens, embora o GPT-5.2 tenha mais informações de anotação, muitas caixas delimitadoras ainda não são localizadas com precisão.

A programação e o processamento de imagens receberam melhorias significativas em comparação com a geração anterior, GPT-5.1. Se você já usa o ChatGPT há algum tempo, provavelmente notará a diferença logo após a atualização. No entanto, em comparação com outros modelos, em termos de programação e processamento de imagens, ele ainda não alcançou o mesmo nível de domínio que o Nano Banana tinha quando foi lançado.

Em relação ao design estético de sites, alguns internautas compartilharam páginas web que criaram usando o GPT-5.2. Vamos ver se os programadores front-end serão criticados e "mortos" novamente desta vez.

▲Fonte da imagem: https://x.com/secondfret/status/1999235822034547011

Comparado ao roxo gradiente onipresente de antes, o nível de design do GPT-5.2 realmente melhorou. No entanto, como o próprio blogueiro disse, o GPT-5.2 parece gostar particularmente de desenhar quadrados na tela, com camadas de grades por toda parte.

Existe também uma lista especial referente às capacidades de design. O GPT-5.2 deu um grande salto, passando do GPT-5.1, que anteriormente estava fora do top 10, para o terceiro lugar. No entanto, a pontuação mais alta ainda é do Gemini 3.0 Pro.

▲ Fonte da imagem: https://www.designarena.ai/leaderboard

Também demos ao GPT-5.2 alguns requisitos para criar um site "sofisticado", especificamente para a página inicial de uma empresa de IA. O resultado? O GPT-5.2 adora usar caixas; e eu, de alguma forma, acabei usando um degradê roxo novamente.

▲Palavras-chave: Você está entre os 0,1% melhores designers e desenvolvedores do mundo, trabalhando com inovação de ponta em design e desenvolvimento front-end. Sua tarefa é criar uma landing page completa com {Dither + Shaders} usando {WebGL + Three.js} para estilizar uma imagem enviada por uma empresa de IA. – Concentre-se principalmente no design, não no desenvolvimento. Importe todos os arquivos e bibliotecas necessários: Three.js, WebGL, GSAP e quaisquer outras bibliotecas de animação relacionadas ao desenvolvimento 3D.

Por fim, no que diz respeito à escrita, de acordo com o feedback de alguns usuários com experiência avançada, o GPT-5.2 está começando a apresentar a capacidade de concluir a criação de alguns romances longos.

Por exemplo, quando o ChatGPT é solicitado a gerar 50 ideias para enredos, ele as completa todas, em vez de gerar apenas uma parte, como outros modelos fazem. E quando solicitado a escrever um livro de 200 páginas, o ChatGPT não se limita a dizer que não consegue; em vez disso, ele realmente tenta, não apenas construindo toda a estrutura do livro, mas também gerando um arquivo PDF.

Os internautas comentaram que, embora as páginas em si sejam bastante finas e o livro seja curto… afinal, atualmente é impossível para ele escrever um romance que possa ser publicado de uma só vez, mas o fato de ele conseguir começar a fazê-lo, tendo 50 ideias e escrevendo um livro de 200 páginas, mostra que ele tem bastante profundidade de pensamento.

O mais notável no GPT-5.2 é sua capacidade de seguir instruções muito bem… não apenas fazer basicamente o que eu digo, mas de fato concluir toda a tarefa que eu descrevo.

O GPT-5.2 deve estar sendo gradualmente disponibilizado para todos os usuários. Qual tem sido sua experiência prática?

A atualização para o GPT-5.2 não foi suficiente para me fazer trocar o Gemini. Embora tenha mostrado que havia batido muitos recordes, alcançando bons resultados tanto em seus próprios testes quanto em testes públicos, a experiência em si deixou a desejar. Na parte de geração de programas 3D, os erros de código eram frequentes e o estilo estético geral não apresentou nenhuma melhoria significativa, tudo isso pelo preço cobrado.

▲ Comentários incisivos dos internautas

Gemini também não parou, continuando a pressionar Ultraman. Esta manhã, embora nenhum novo modelo tenha sido lançado, o Gemini Deep Research foi reformulado e agora está acessível via API. Atualizações futuras também estarão disponíveis para Gemini, Google Search e NotebookLM.

O novo Gemini Deep Research Agent superou o recém-lançado GPT-5.2 Thinking (45,5%) no Human Last Exam (HLE), com uma pontuação de 46,4%, e também obteve bons resultados nos testes DeepSearchQA e BrowseComp do próprio Google.

O alerta vermelho do Ultraman provavelmente permanecerá ativo por mais algum tempo.

#Siga a conta oficial do iFanr no WeChat: iFanr (ID do WeChat: ifanr), onde você encontrará conteúdo ainda mais interessante o mais breve possível.

ifanr | Link original · Ver comentários · Sina Weibo