Lançamento do GPT-5: seis vezes eu disse “uau”, mas três vezes “hmmmm”

A equipe da OpenAI, liderada por Sam Altman, finalmente revelou o GPT-5, com cerca de 600.000 pessoas assistindo à transmissão ao vivo do lançamento, seja ao vivo ou durante as primeiras três horas ( e você também pode fazer o mesmo se perdeu). Embora isso fique atrás de certas fotos espaciais e eventos da Copa do Mundo, o público demonstra enorme interesse na versão mais recente do ChatGPT. O YouTube não é totalmente transparente com os dados de audiência, mas apenas dois ou três eventos da Apple tiveram um número significativamente maior de pessoas assistindo à transmissão ao vivo.

Eu testei o GPT-5 antes do lançamento e praticamente tudo o que esperávamos foi anunciado. Abaixo, falarei sobre o que me surpreendeu/impressionou e o que me deixou intrigado.

Uau #1. Eles percorreram um longo caminho em 2 anos e meio

Muitos escritores, incluindo eu, reclamaram de alucinações, erros e outras gafes. Tudo verdade. Mas também precisamos respirar fundo e reconhecer o tremendo progresso que a OpenAI fez desde a primeira versão pública do ChatGPT. Essa versão era mais um brinquedo do que uma ferramenta. As versões atualmente disponíveis — 4.0, 4.1 e 4.5 — são muito poderosas e mais úteis. Se o GPT-5 cumprir pelo menos metade das promessas que fizeram hoje, representará um grande salto à frente. O Wow 1.5 surgiu quando Sam Altman disse que agora eles têm 700 milhões de usuários. Aplaudo a ambição deles e me lembro de uma citação de Leo Burnett (que está no Monte Rushmore da publicidade): " Quando você alcança as estrelas, pode não conseguir uma, mas também não encontrará um punhado de lama." A OpenAI está claramente alcançando as estrelas.

Uau #2: Eles estão desativando modelos antigos e movendo todos para o GPT-5

Se você olhasse o menu no topo da página do ChatGPT antes do lançamento, veria várias opções para diferentes modelos. Havia uma ou duas palavras sobre o que cada modelo deveria fazer bem. Sempre foi confuso, pelo menos para mim. Agora eles estão migrando todos para o GPT-5 e desativando os modelos mais antigos. Este gráfico resume as diferenças entre o GPT-4 e o GPT-5. Altman disse que, se o GPT-3 fosse para um estudante do ensino médio e o GPT-4 para um estudante universitário, o GPT-5 operaria em nível de doutorado. Esta versão estará disponível para todos os usuários comerciais em breve (empresariais e educacionais posteriormente). Usuários gratuitos terão seu uso limitado e serão migrados para um modelo menos potente quando excederem o limite.

Recurso GPT-4 GPT-5 (Esperado)
Capacidade de raciocínio Lacunas lógicas fortes e ocasionais Raciocínio próximo ao nível de doutorado
Multimodalidade Texto, imagens, voz Texto, imagens, voz, vídeo
Memória de Contexto Até ~128 mil tokens Até ~1 milhão de tokens
Autonomia do Agente Limitado, precisa de entrada frequente Tarefas mais independentes e multietapas
Opções de velocidade Um modelo principal Versões Flagship, Mini e Nano
Suporte de mídia Sem suporte de vídeo Compreensão e geração de vídeo completo

Uau #3: Menos alucinações

A OpenAI enfatizou que o GPT-5 passará menos tempo na Fantasyland do que as versões anteriores. Isso é uma boa notícia, supondo que seja verdade. Eles fizeram referências às porcentagens de forma mais clara, mas não mostraram seu trabalho. Meu instinto diz que será direcionalmente (e provavelmente significativamente) melhor, mas ainda não é perfeito.

Uau #4: Integração de voz muito mais forte

Algumas pessoas usaram a voz para acessar o ChatGPT em versões anteriores. Claramente, houve um grande esforço para elevar a voz ao mesmo nível da entrada de texto. Ainda não sei quanto isso representará para elas, mas é definitivamente uma ótima opção. Meu ceticismo se baseia, em parte, em meu otimismo excessivo quanto à rapidez com que a Alexa revolucionaria o comércio para a Amazon. Imaginei um mundo onde as pessoas na cozinha estariam pedindo comida enquanto cozinhavam, mas não vi isso acontecer. Digitar ainda pode ser o método de entrada preferido para muitas pessoas.

Uau #5: Desenvolvimento de código mais poderoso

Isto se enquadrará em ambas as categorias. Eles tentaram demonstrar como é fácil desenvolver aplicações web usando GPT-5. Um colega "desenvolveu" um aplicativo para ensinar a namorada a falar francês com a família. Funcionou até certo ponto, mas parecia um projeto de ensino médio. Eles alegam que programadores preferem trabalhar com GPT-5, mas não mostraram seu trabalho ou fontes. Também mostraram como o GPT-5 poderia ajudar na depuração. Coloque isso na categoria de "ótimo se realmente acontecer".

Uau #6: Grandes avanços contra maus atores

Primeiro, não causar danos. Parece que a OpenAI está levando a sério suas responsabilidades com a sociedade. Houve uma discussão sobre como o GPT-5 responderia a buscas problemáticas. Isso fornecerá mais contexto sobre por que algo está errado, é antiético ou perigoso. Eles estão chamando isso de "conclusão segura". Valerá a pena continuar monitorando isso ao longo do tempo.

Hmmm #1: Isso parecia uma apresentação de classe, não um lançamento de produto de uma grande empresa

Talvez a Apple e outras empresas tenham nos mimado, mas a apresentação em si foi amadora. Eles fizeram o pessoal de produto entrar e sair do palco nervoso em segmentos de três minutos. Muitas das "piadas" soaram improvisadas e estranhas. Eu sei que é sobre o produto, não sobre a embalagem, mas parece que está na hora de eles melhorarem.

Hmmm #2: Eles precisam de ajuda para traduzir sua excitação e pensamentos para o inglês

Um exemplo muito interessante mostrou como um pai poderia ajudar seu filho do ensino médio com um relatório científico sobre o efeito Bernoulli. Até aqui, tudo bem. A apresentadora então perguntou: "Não seria ótimo ter uma animação que mostrasse isso?" Sim! E, se ela tivesse continuado a explicar em termos leigos, teria sido ótimo. Em vez disso, ela disse: "crie um SVG usando o Canva" e mostrou um monte de código Python. Ainda há uma oportunidade de tornar o poder do ChatGPT 5.0 mais acessível ao usuário comum, mas precisa ser apresentado nesse nível.

Hmmm #3: Eles afirmam ter avançado a evolução da IA em dois ou três anos

Um dos principais cientistas de IA é Daniel Kokotajlo . Ele era um dos principais engenheiros da OpenAI antes de sair. Ele também é o autor principal do AI 2027 , um estudo muito bem documentado e fundamentado sobre o caminho do desenvolvimento da IA. De acordo com o artigo, ainda levará dois ou três anos para que a IA realmente faça grande parte do trabalho de um desenvolvedor. A OpenAI praticamente afirmou que está caminhando para esse objetivo com o GPT-5. Não tenho certeza se acredito nisso. Novamente, talvez em termos de direção. Até o fim? Não até eu ver mais.