Experimente o GPT-5 gratuitamente! Todos podem usá-lo gratuitamente, e Musk está insatisfeito

agosto 8, 2025 gurinho

Se há algum produto de tecnologia que ainda consegue fazer as pessoas assistirem a transmissões ao vivo no início da manhã após ter sido amplamente vazado, além do iPhone da Apple, é o ChatGPT da OpenAI.

Por muito tempo após seu lançamento, o GPT-4 permaneceu como o único concorrente real de seus concorrentes de IA. O mundo está gradualmente se conformando com o fato de que a IA está superando as capacidades humanas em um número crescente de tarefas.

Hoje, o GPT-5 finalmente fez sua estreia, elevando o padrão conhecido como "linha de passagem" a uma dimensão mais alta.

Experimente o GPT-5 gratuitamente! Todos podem usá-lo gratuitamente, e Musk está insatisfeito

Também começamos com o GPT-5 e pedimos que ele escrevesse um poema para o seu próprio aniversário. A nota máxima é 10. Quantos pontos você acha que ele consegue?

Ainda no segmento de cartões meteorológicos clássicos, a qualidade estética da interface do usuário do GPT-5 é bastante impressionante.

Também testamos os recursos de programação do GPT-5 no Flowith.

Para mais detalhes, clique no link para acessar: Experimente o GPT-5 em primeira mão! Todos podem usá-lo gratuitamente, Musk expressou insatisfação

O CEO da OpenAI, Sam Altman, elogiou o GPT-5, chamando-o de um grande avanço em relação a todos os modelos anteriores. Na opinião dele, ter um sistema de IA como o GPT-5 seria inimaginável em qualquer momento da história.

▲ (Interface principal)

No entanto, a coletiva de imprensa também teve sua cota de "travamentos", com erros óbvios de "fabricação" aparecendo nas seções de gráficos e dados, e até mesmo Ultraman não conseguiu evitar postar uma postagem autodepreciativa.

É claro que Musk não perdeu esta excelente oportunidade de "aproveitar a popularidade".

Ele disse que o Grok 4 derrotou o GPT-5 no teste ARC-AGI e aproveitou a oportunidade para criticá-lo e revelou que o Grok 5 será lançado antes do final deste ano e deverá ter um desempenho ainda melhor.

O GPT-5 está aqui, com melhorias significativas nas habilidades de programação e escrita, e também pode ser seu médico de IA

O GPT-5 alcança melhorias significativas em áreas como codificação, matemática, escrita, saúde e percepção visual, ao mesmo tempo em que faz progressos significativos na redução de alucinações, melhora no acompanhamento de instruções e redução da bajulação.

O GPT-5 usa um novo design de sistema unificado com três componentes principais: um modelo base eficiente para lidar com problemas de rotina, um modelo de "pensamento GPT-5" com recursos de raciocínio profundo especificamente para tarefas complexas e um roteador em tempo real responsável por selecionar o modelo apropriado com base em fatores como complexidade da conversação e requisitos de ferramentas.

Este "sistema de roteamento" aprende continuamente os comportamentos de troca dos usuários, as preferências de feedback e a precisão das respostas, otimizando continuamente a estratégia de alocação. Quando os usuários atingem o limite de uso, o sistema alterna automaticamente para uma versão simplificada de cada modelo para continuar atendendo.

O GPT-5 é o modelo de codificação mais poderoso da OpenAI até o momento, capaz de lidar com desenvolvimento front-end complexo e depurar grandes bases de código. Altman afirmou: "O conceito de software gerado sob demanda será um recurso fundamental da era GPT-5."

Por exemplo, ele pode criar sites, aplicativos e jogos totalmente funcionais e com um design elegante a partir de um único prompt. Considerando o prompt a seguir, o GPT-5 criou com sucesso um jogo chamado "Jumping Ball Runner", completo com todos os recursos necessários, incluindo aumento de velocidade, sistema de pontuação, efeitos sonoros e um fundo com rolagem parallax.

Dica: Para criar um aplicativo de página única, os requisitos são os seguintes, todos escritos em um arquivo HTML:
– Nome: Corredor de Bola Saltitante
– Objetivo: Pular obstáculos e sobreviver o máximo de tempo possível.
– Características: aumento gradual da velocidade, registro de pontuação máxima, botão de repetição e efeitos sonoros divertidos para ações e eventos.
– A interface deve ser colorida com um fundo de rolagem parallax.
– Os personagens devem parecer cartunescos e divertidos de assistir.
– Os jogos devem ser divertidos para todos.”

Quando se trata de escrita, o GPT-5 é capaz de transformar ideias básicas em texto com profundidade e ritmo literários.

É mais confiável ao lidar com formulários escritos complexos, como a manutenção de métricas, ao mesmo tempo em que equilibra padrões formais e clareza. Essas melhorias tornam o ChatGPT mais prático para tarefas cotidianas, como processamento de documentos e redação de e-mails.

Além disso, o GPT-5 é o modelo de melhor desempenho da OpenAI em problemas relacionados à saúde.

Na avaliação do HealthBench, baseada em cenários do mundo real e padrões médicos, o GPT-5 superou significativamente todos os modelos anteriores. O novo modelo identifica proativamente possíveis problemas, faz perguntas direcionadas e fornece recomendações personalizadas com base no histórico, nível de conhecimento e localização do usuário.

Altman foi o responsável por apresentar a parte de saúde do GPT-5. Na coletiva de imprensa, ele convidou Carolina e Filipe para compartilharem suas experiências pessoais.

Carolina foi diagnosticada com três tipos diferentes de câncer em uma semana. Depois de enviar esses relatórios repletos de termos médicos para o ChatGPT, o ChatGPT traduziu o conteúdo complexo para uma linguagem simples e compreensível para ela em segundos, ajudando-a a se comunicar melhor com o médico.

Quando confrontada com a questão de se submeter ou não à radioterapia, uma questão sobre a qual nem mesmo os médicos conseguiam chegar a um consenso, o ChatGPT forneceu a ela uma análise detalhada das nuances do caso, riscos e benefícios, etc. Ela disse que isso a beneficiou mais do que uma conversa de 30 minutos com um médico.

É claro que o ChatGPT não substitui um profissional médico e é recomendável ter cautela.

Os resultados de benchmark mostram que o GPT-5 estabelece novos recordes em vários benchmarks:

Capacidade matemática: pontuação de 94,6% no teste AIME 2025 (sem ferramentas)
Capacidade de programação: SWE-bench Verified (com raciocínio) pontuação 74,9%, Aider Polyglot (com raciocínio) pontuação 88%
Compreensão multimodal: MMMU obteve 84,2%
Saúde: HealthBench Hard score 46,2%

O GPT-5 também aprimorou sua capacidade de executar instruções e chamar ferramentas de forma autônoma. Ele pode concluir solicitações multietapas com mais estabilidade, coordenar múltiplas ferramentas com flexibilidade e ajustar estratégias comportamentais de forma inteligente com base no contexto, demonstrando maior adaptabilidade às tarefas.

O GPT-5 também obteve um desempenho impressionante em diversos benchmarks multimodais, abrangendo reconhecimento visual, compreensão de vídeo, julgamento espacial e raciocínio científico. Graças às suas capacidades aprimoradas de percepção e raciocínio, o ChatGPT agora pode processar imagens e outras entradas não textuais com mais precisão.

Nos testes de benchmark internos da OpenAI, o GPT-5 atingiu ou excedeu os níveis de especialista em aproximadamente 50% das tarefas complexas de trabalho de conhecimento, abrangendo mais de 40 campos profissionais, como direito, logística, vendas, engenharia, etc., e teve um desempenho melhor que o o3 e o ChatGPT Agent.

A OpenAI enfatizou especificamente que o GPT-5 foi treinado no supercomputador Azure AI da Microsoft.

Além disso, o GPT-5 também alcançou avanços na eficiência do raciocínio. Em tarefas como raciocínio visual, codificação e resolução de problemas científicos de nível de pós-graduação, o GPT-5 superou o OpenAI o3, reduzindo o número de tokens de saída em 50-80%.

Alucinações sempre foram um grande problema para a IA. Em comparação com os modelos anteriores da OpenAI, a possibilidade de alucinações no GPT-5 foi significativamente reduzida, e o modelo é mais adequado para lidar com problemas complexos e abertos.

Em testes anônimos representativos do tráfego de produção do ChatGPT, o GPT-5 atingiu uma taxa de erro factual aproximadamente 45% menor que o GPT-4o e uma taxa de erro aproximadamente 80% menor que o OpenAI o3 quando a inferência foi habilitada.

Nos testes de referência de precisão de fatos abertos LongFact e FActScore, a taxa de alucinação do "pensamento GPT-5" é cerca de seis vezes menor do que a do o3, marcando uma melhoria significativa na precisão da geração de conteúdo longo.

Além da precisão factual aprimorada, o GPT-5 (que tem a capacidade de pensar) pode transmitir seu comportamento e recursos aos usuários com mais honestidade. De acordo com Alex Beutel, chefe de pesquisa de segurança de modelos, a OpenAI testou o GPT-5 por "mais de 5.000 horas" para entender seus riscos de segurança.

O GPT-5 também introduz um novo método de treinamento seguro chamado "Conclusão Segura", que permite que o modelo forneça respostas úteis, mantendo os limites de segurança. Quando uma solicitação precisa ser rejeitada, o GPT-5 explica o motivo de forma transparente e oferece uma alternativa segura.

Em termos de experiência do usuário, o GPT-5 reduz o comportamento excessivamente responsivo, reduzindo a taxa de respostas elogiosas em um teste de elogio especialmente desenvolvido de 14,5% para menos de 6%. O novo modelo utiliza menos emojis desnecessários e suas respostas são mais detalhadas e ponderadas.

Além disso, a OpenAI lançou quatro personalidades predefinidas para todos os usuários: Cínico, Robô, Ouvinte e Nerd. Essas personalidades estão inicialmente disponíveis para bate-papo por texto e, posteriormente, estarão disponíveis para bate-papo por voz. Os usuários podem ajustar o estilo de interação do ChatGPT às suas preferências pessoais.

Na demonstração ao vivo, a interação por voz se tornou muito natural e controlável.

Pesquisadores da OpenAI pediram ao GPT-5 que respondesse às perguntas com apenas uma palavra a partir de agora. Quando solicitado a compartilhar uma palavra de sabedoria, o GPT-5 respondeu: "Paciência". Todos no evento de lançamento riram, e o apresentador sugeriu que essa poderia ser a maneira do modelo agradecer a todos pela paciência em aguardar o lançamento do GPT-5.

Usuários gratuitos também podem usá-lo, e também há um modelo realmente perfumado

Substituindo o OpenAI o3-pro, a OpenAI também lançou o GPT-5 pro, uma variante do GPT-5 que é capaz de pensar por mais tempo e usa computação de tempo de teste paralelo escalonado, mas eficiente, para fornecer respostas da mais alta qualidade e mais abrangentes.

Em uma avaliação de mais de 1.000 prompts de raciocínio práticos economicamente valiosos, especialistas externos preferiram o GPT-5 Pro em 67,8% dos casos. Sua taxa de erros graves foi 22% menor que a do GPT-5, e ele teve um bom desempenho em saúde, ciências, matemática e codificação, recebendo elogios unânimes dos especialistas.

O GPT-5 agora é o novo modelo padrão para o ChatGPT, sendo implementado para todos os usuários Plus, Pro, Team e Free, com usuários Enterprise e Edu ganhando acesso uma semana depois.

Usuários gratuitos podem enviar 10 mensagens a cada 5 horas, enquanto usuários Plus podem enviar 80 mensagens a cada 3 horas.

Usuários Pro têm acesso ilimitado ao GPT-5 e ao GPT-5 Pro, enquanto usuários gratuitos migram automaticamente para o GPT-5 mini ao atingir o limite de uso. Usuários Pro, Plus e Team também podem acessar a CLI do Codex via ChatGPT e chamar o GPT-5 de dentro do seu ambiente de desenvolvimento para realizar tarefas como codificação e depuração.

Embora o GPT-5 já esteja disponível para todos os usuários, os usuários gratuitos do ChatGPT não terão acesso imediato à experiência completa do GPT-5. Assim que os usuários gratuitos atingirem o limite de uso do GPT-5, serão transferidos para um modelo menor, mais rápido e simplificado, o GPT-5 mini.

Para desenvolvedores, a OpenAI também lançou três versões diferentes da plataforma de API: gpt-5, gpt-5-mini e gpt-5-nano. Os desenvolvedores podem escolher com flexibilidade de acordo com os diferentes requisitos do projeto em termos de desempenho, custo e velocidade de resposta.

O GPT-5 suporta interfaces tradicionais, como a API de Resposta e a API de Conclusão de Chat, e agora é o modelo padrão para a CLI do Codex. Todas as versões incluem controle sobre os parâmetros reasoning_effort e verbosity, além de recursos de ferramentas personalizadas.

Além dos recursos básicos de conversação, o GPT-5 também integra funções principais, como chamadas de ferramentas paralelas, ferramentas integradas (pesquisa na web, processamento de arquivos, geração de imagens), processamento de streaming, saída estruturada e recursos de otimização de custos, como cache de prompt e API em lote.

A API GPT-5 também apresenta quatro novos recursos principais que melhoram significativamente a experiência do desenvolvedor.

Primeiro, o parâmetro reasoning_effort permite que os desenvolvedores alternem com flexibilidade entre as configurações mínima, baixa, média e alta, com base em diferentes cenários de tarefas. Usar a configuração mínima para respostas rápidas a tarefas simples e a alta para um pensamento mais profundo em perguntas complexas permite que os desenvolvedores encontrem o equilíbrio ideal entre qualidade e velocidade das respostas.

O parâmetro de verbosidade suporta três configurações: baixa, média e alta, ajudando você a controlar o nível de detalhes das suas respostas. Por exemplo, para a pergunta "Por que o céu é azul?", uma configuração baixa fornece uma resposta concisa e clara, enquanto uma configuração alta inclui uma explicação científica detalhada.

O novo recurso de ferramenta personalizada oferece suporte à formatação de texto simples, eliminando o incômodo dos caracteres de escape JSON. Os desenvolvedores não precisam mais se preocupar com erros de formatação ao processar grandes quantidades de código ou documentos longos.

Vale ressaltar que todo o processo de execução é rastreável. O GPT-5 emitirá atualizações de progresso ativamente ao executar chamadas de ferramentas, permitindo que os desenvolvedores entendam o plano de execução e o status atual da IA.

Além disso, diferentemente do sistema GPT-5 no ChatGPT, a versão da API é especialmente otimizada para as necessidades do desenvolvedor e é mais adequada para cenários de programação e tarefas de agentes.

Ferramentas e plataformas de desenvolvimento conhecidas, incluindo Windsurf, Vercel e JetBrains, deram avaliações positivas ao GPT-5. A Windsurf observou que o GPT-5 alcançou desempenho de ponta em sua avaliação, atingindo "metade da taxa de erro de chamada de ferramenta de outros modelos de ponta".

O lançamento do GPT-5 pode ser um golpe fatal para Claude.

De acordo com o The Information, mais de 60% da receita anual de US$ 5 bilhões da Anthropic vem de APIs, com o Cursor e o GitHub Copilot contribuindo sozinhos com US$ 1,4 bilhão. Essa estrutura de receita unificada expõe a vulnerabilidade da Anthropic.

A crueldade do mercado de ferramentas de programação é que o desempenho é tudo. Mesmo um aumento de 5% na precisão significa que os desenvolvedores economizam horas de depuração todos os dias. No passado, Claude conseguiu ascender rapidamente na área de programação, em grande parte porque o ChatGPT era relativamente atrasado em termos de recursos de codificação.

Mas a janela de oportunidade acabará se fechando. Com a melhoria do GPT-5 em tarefas de programação de código e recursos de agentes, combinada com a vinculação ecológica e os canais de distribuição de produtos mais fortes da OpenAI, o retorno do Cursor e do Copilot à OpenAI impactará significativamente a receita da Anthropic.

Talvez em breve veremos a chegada de Claude 5.

Autores: Li Chaofan, Mo Chongyu, Zhang Zihao

#Bem-vindo a seguir a conta pública oficial do WeChat do iFaner: iFaner (ID do WeChat: ifanr), onde mais conteúdo interessante será apresentado a você o mais breve possível.

iFanr | Link original · Ver comentários · Sina Weibo