Veja por que as pessoas estão afirmando que o GPT-4 é bom novamente

Parece que a OpenAI está ocupada limpando seus modelos de linguagem GPT após acusações de que o GPT-4 está ficando “preguiçoso”, “burro” e está enfrentando erros fora do normal para o chatbot ChatGPT que circulou nas redes sociais no final de novembro.

Alguns estão até especulando que o GPT-4.5 foi lançado secretamente para alguns usuários, com base em algumas respostas do próprio ChatGPT. Independentemente de isso ser verdade ou não, definitivamente houve algumas mudanças internas positivas no passado por trás do GPT-4.

Mais GPUs, melhor desempenho?

As postagens começaram a chegar já na última quinta-feira notando a melhoria no desempenho do GPT-4. O professor da Wharton, Ethan Mollick, que comentou anteriormente sobre a forte queda no desempenho do GPT-4 em novembro, também notou uma revitalização no modelo, sem ver qualquer prova de uma mudança para o GPT-4.5 para si mesmo. Usando consistentemente um intérprete de código para corrigir seu código, ele descreveu a mudança como “noite e dia, tanto para velocidade quanto para qualidade de resposta” depois de perceber que o ChatGPT-4 era “não confiável e um pouco enfadonho por semanas”.

Enquanto isso acontecia, a OpenAI reabriu silenciosamente suasassinaturas do ChatGPT Plus na última quarta-feira, cujo registro estava desativado desde 14 de novembro. Altman declarou em um post X: “Obrigado por sua paciência enquanto encontramos mais GPUs”.

Não se sabe se existe uma correlação entre o restabelecimento das inscrições do ChatGPT Plus e a melhoria do GPT-4, mas o momento é interessante. Notavelmente, as inscrições para a versão paga foram encerradas logo após o primeiro DevDay Developers da OpenAI, onde a empresa revelou uma série de novas funções para a versão paga do chatbot AI. A empresa criou uma lista de espera para assinaturas do ChatGPT Plus devido às inscrições pós-DevDay excederem a capacidade do serviço de processar funções.

Pouco depois disso, os usuários começaram a relatar comportamentos incomuns do GPT-4, além das piadas tradicionais de IA que já são conhecidas. Uma reclamação comum era que o GPT-4 “respondia” aos usuários ou exigia múltiplas explicações de um comando antes de poder executar a consulta. Outra reclamação era que o modelo explicaria aos usuários como executar seu comando em vez de executar a tarefa.

A degradação do GPT-4 remonta pelo menos a julho, quando um estudo observou um declínio acentuado na precisão entre março e junho. Muitos, incluindo o vice-presidente de produtos da OpenAI, Peter Welinder, sugeriram que a qualidade da resposta pode parecer insuficiente como um fenômeno psicológico à medida que o modelo é atualizado. Alguns acrescentaram que os usuários podem se beneficiar alterando suas consultas para obter os resultados desejados.

Embora a OpenAI tenha mantido silêncio sobre seu funcionamento interno, a postagem X de Altman sobre GPUs foi provavelmente um grande indicador do que está acontecendo nos bastidores. Relatórios de abril indicaram que a OpenAI precisaria de mais de 30.000 unidades de GPU para manter seu desempenho comercial até o final do ano. Isso foi antes do aumento do interesse em novembro.

Testes secretos do GPT-4.5 ou apenas alucinações?

Além disso, as especulações sobre o GPT-4.5 aumentaram com vários outros detalhes sobre um possível vazamento de uma nova versão do GPT.

O fundador do boletim informativo @therundownai,Rowan Cheung , compartilhou recentemente no X (anteriormente Twitter) detalhes de preços vazados para um novo modelo GPT-4.5 que a OpenAI está em desenvolvimento. Os detalhes incluem novos níveis de preços e informações sobre recursos multimodais avançados.

Cheung perguntou ao CEO da OpenAI, Sam Altman, por meio da plataforma de mídia social, sobre a validade do vazamento, ao que ele respondeu: “Nah”.

No entanto, vários usuários que lidaram com a atualização proposta estão convencidos de que estão usando o GPT-4.5 e que ele é novo e melhor do que nunca. Alguns perguntaram ao chatbot, que eles acreditavam estar executando o GPT-4, qual era o seu modelo – e ele respondeu “GPT-4.5 Turbo”.

Isso levou muitos a acreditar que a OpenAI tem testado o GPT-4.5, principalmente em seus aplicativos móveis, na esperança de escapar de usuários experientes. No entanto, nem todos foram capazes de recriar esses resultados, e o modelo dirá que a versão mais recente é simplesmente GPT-4. O funcionário da OpenAI, Will Depue, também comentou sobre o assunto, chamando-o de “alucinação muito estranha e estranhamente consistente”.

Cheung notou uma postagem da página oficial do ChatGPT X, com emojis do cérebro e da cabeça nas nuvens, que ele acredita ser a forma vaga da OpenAI de reiterar que as respostas são alucinações.

Notavelmente, OpenAI oferece acesso antecipado e exclusivo a seus usuários pagos, que incluem usuários ChatGPT Plus , usuários de API de desenvolvedor e usuários corporativos. Quando os recursos são anunciados, eles estão entre os primeiros a experimentar as versões mais recentes do GPT e seus recursos. Muitos que estão mexendo nos modelos e percebendo as mudanças sutis provavelmente têm alguma forma de acesso à API do desenvolvedor ou estão usando o serviço para testar o código e estão compartilhando suas opiniões com o público.

Mesmo que a OpenAI esteja testando o GPT-4.5, não há como dizer quando uma atualização poderá ocorrer, especialmente quando a empresa está se recuperando do serviço e da desestabilização organizacional. Além disso, a empresa e o produto ainda são novos e ainda não está claro como é um ciclo de atualização de rotina. Por enquanto, suponho que não importa em qual “versão” do ChatGPT estamos, porque as melhorias parecem reais.