GPT-4: tudo o que você precisa saber sobre o modelo padrão de IA do ChatGPT

As pessoas ficaram maravilhadas quando o ChatGPT foi lançado, impressionadas com suas habilidades de linguagem natural como um chatbot de IA originalmente desenvolvido com o modelo de linguagem grande GPT-3.5. Mas quando o tão aguardado modelo de linguagem grande GPT-4 foi lançado, ele revelou o que pensávamos ser possível com a IA, com alguns chamando-o de os primeiros vislumbres da AGI (inteligência artificial geral) .

O que é GPT-4?

GPT-4 é o mais novo modelo de linguagem criado pela OpenAI que pode gerar texto semelhante à fala humana. Ele avança a tecnologia usada pelo ChatGPT, que anteriormente era baseada no GPT-3.5, mas foi atualizada desde então. GPT é a sigla para Generative Pre-trained Transformer, uma tecnologia de aprendizagem profunda que usa redes neurais artificiais para escrever como um humano.

De acordo com a OpenAI, este modelo de linguagem de próxima geração é mais avançado que o ChatGPT em três áreas principais: criatividade, entrada visual e contexto mais longo. Em termos de criatividade, a OpenAI afirma que o GPT-4 é muito melhor tanto na criação quanto na colaboração com usuários em projetos criativos. Exemplos disso incluem música, roteiros, redação técnica e até mesmo “aprender o estilo de escrita de um usuário”.

O contexto mais longo também influencia isso. O GPT-4 agora pode processar até 128 mil tokens de texto do usuário. Você pode até enviar um link da web para o GPT-4 e solicitar que ele interaja com o texto dessa página. A OpenAI afirma que isso pode ser útil para a criação de conteúdo extenso, bem como para “conversas prolongadas”.

O GPT-4 agora também pode receber imagens como base para interação. No exemplo fornecido no site do GPT-4, o chatbot recebe uma imagem de alguns ingredientes de panificação e é questionado sobre o que pode ser feito com eles. Atualmente não se sabe se o vídeo também pode ser usado da mesma forma.

Imagem usada com permissão do detentor dos direitos autorais

Por último, a OpenAI também afirma que o GPT-4 é significativamente mais seguro de usar do que a geração anterior. Segundo informações, ele pode produzir 40% mais respostas factuais nos próprios testes internos da OpenAI, ao mesmo tempo que tem 82% menos probabilidade de “responder a solicitações de conteúdo não permitido”.

A OpenAI afirma que foi treinada com feedback humano para fazer esses avanços, alegando ter trabalhado com “mais de 50 especialistas para feedback inicial em domínios que incluem segurança e proteção de IA”.

Nas primeiras semanas após seu lançamento, os usuários postaram algumas das coisas incríveis que fizeram com ele , incluindo inventar novas linguagens, detalhar como escapar para o mundo real e criar animações complexas para aplicativos do zero. Aparentemente, um usuário fez o GPT-4 criar uma versão funcional do Pong em apenas sessenta segundos, usando uma mistura de HTML e JavaScript.

Como usar o GPT-4

Bing Chat mostrado em um laptop.
Jacob Roach / Tendências Digitais

O GPT-4 está disponível para todos os usuários em todos os níveis de assinatura que a OpenAI oferece. Os usuários do nível gratuito terão acesso limitado ao modelo GPT-4 completov (cerca de 80 bate-papos em um período de 3 horas) antes de serem transferidos para o GPT-4o mini menor e menos capaz até que o cronômetro de resfriamento seja reiniciado. Para obter acesso adicional ao GPT-4, bem como poder gerar imagens com Dall-E, é necessário atualizar para ChatGPT Plus. Para acessar a assinatura paga de US$ 20, basta clicar em “Atualizar para Plus” na barra lateral do ChatGPT. Depois de inserir as informações do seu cartão de crédito, você poderá alternar entre o GPT-4 e versões mais antigas do LLM.

Se você não quiser pagar, existem outras maneiras de ter uma ideia de quão poderoso é o GPT-4. Primeiro, você pode experimentá-lo como parte do Bing Chat da Microsoft. A Microsoft revelou que está usando GPT-4 no Bing Chat, que é totalmente gratuito. No entanto, alguns recursos do GPT-4 estão faltando no Bing Chat e ele foi claramente combinado com algumas das tecnologias proprietárias da Microsoft. Mas você ainda terá acesso a esse LLM expandido (modelo de linguagem grande) e à inteligência avançada que o acompanha. Deve-se observar que embora o Bing Chat seja gratuito, ele está limitado a 15 chats por sessão e 150 sessões por dia.

Existem muitos outros aplicativos que também usam GPT-4 , como o site de respostas a perguntas Quora.

Quando o GPT-4 foi lançado?

Um laptop aberto no site ChatGPT.
Shutterstock

O GPT-4 foi anunciado oficialmente em 13 de março, conforme confirmado antecipadamente pela Microsoft , e foi disponibilizado pela primeira vez aos usuários por meio de uma assinatura do ChatGPT-Plus e do Microsoft Copilot. O GPT-4 também foi disponibilizado como uma API “para desenvolvedores criarem aplicativos e serviços”. Algumas das empresas que já integraram o GPT-4 incluem Duolingo, Be My Eyes, Stripe e Khan Academy. A primeira demonstração pública do GPT-4 foi transmitida ao vivo no YouTube, mostrando suas novas capacidades.

O que é GPT-4o mini?

GPT-4o mini é a mais nova iteração da linha de modelos GPT-4 da OpenAI. É uma versão simplificada do modelo GPT-4o maior que é mais adequado para tarefas simples, mas de alto volume, que se beneficiam mais de uma velocidade de inferência rápida do que do aproveitamento do poder de todo o modelo.

O GPT-4o mini foi lançado em julho de 2024 e substituiu o GPT-3.5 como o modelo padrão com o qual os usuários interagem no ChatGPT assim que atingem o limite de três horas de consultas com o GPT-4o . De acordo com os dados da Análise Artificial , o 4o mini supera significativamente modelos pequenos de tamanho semelhante, como o Gemini 1.5 Flash do Google e o Claude 3 Haiku da Anthropic no benchmark de raciocínio MMLU.

O GPT-4 é melhor que o GPT-3.5?

A versão gratuita do ChatGPT foi originalmente baseada no modelo GPT 3.5; no entanto, a partir de julho de 2024, o ChatGPT agora funciona em GPT-4o mini. Esta versão simplificada do modelo maior do GPT-4o é muito melhor até mesmo do que o GPT-3.5 Turbo. Ele pode compreender e responder a mais informações, possui mais salvaguardas, fornece respostas mais concisas e é 60% mais barato de operar .

A API GPT-4

Conforme mencionado, o GPT-4 está disponível como uma API para desenvolvedores que fizeram pelo menos um pagamento bem-sucedido à OpenAI no passado. A empresa oferece diversas versões do GPT-4 para desenvolvedores usarem por meio de sua API, junto com modelos legados do GPT-3.5. Ao lançar o GPT-4o mini , a OpenAI observou que o GPT-3.5 permanecerá disponível para uso pelos desenvolvedores, embora eventualmente seja colocado offline. A empresa não definiu um cronograma para quando isso poderia realmente acontecer.

A API concentra-se principalmente em desenvolvedores que criam novos aplicativos, mas também causou alguma confusão para os consumidores. Plex permite integrar ChatGPT ao reprodutor de música Plexamp do serviço, que exige uma chave de API ChatGPT. Esta é uma compra separada do ChatGPT Plus, então você precisará se inscrever em uma conta de desenvolvedor para obter acesso à API, se desejar.

O GPT-4 está piorando?

Por mais que o GPT-4 tenha impressionado as pessoas quando foi lançado, alguns usuários notaram uma degradação em suas respostas nos meses seguintes. Ele foi notado por figuras importantes da comunidade de desenvolvedores e até postado diretamente nos fóruns da OpenAI. Porém, era tudo anedótico, e um executivo da OpenAI até recorreu ao Twitter para dissuadir a premissa. De acordo com a OpenAI, está tudo na nossa cabeça.

Em seguida, foi publicado um estudo que mostrou que houve, de fato, piora na qualidade das respostas com futuras atualizações do modelo. Ao comparar o GPT-4 entre os meses de março e junho, os pesquisadores conseguiram verificar que o GPT-4 passou de 97,6% de precisão para 2,4%.

Não é uma arma fumegante, mas certamente parece que o que os usuários estão percebendo não está apenas sendo imaginado.

Onde está a entrada visual no GPT-4?

Um dos recursos mais esperados do GPT-4 é a entrada visual, que permite ao ChatGPT Plus interagir com imagens e não apenas com texto, tornando o modelo verdadeiramente multimodal. Carregar imagens para GPT-4 analisar e manipular é tão fácil quanto carregar documentos – basta clicar no ícone de clipe de papel à esquerda da janela de contexto, selecionar a fonte da imagem e anexar a imagem ao seu prompt.

Quais são as limitações do GPT-4?

Ao discutir os novos recursos do GPT-4, a OpenAI também observa algumas das limitações do novo modelo de linguagem. Como as versões anteriores do GPT, a OpenAI diz que o modelo mais recente ainda tem problemas com “preconceitos sociais, alucinações e solicitações adversárias”.

Em outras palavras, não é perfeito. Ele ainda receberá respostas erradas, e muitos exemplos foram mostrados on-line que demonstram suas limitações. Mas a OpenAI diz que todas essas são questões que a empresa está trabalhando para resolver e, em geral, o GPT-4 é “menos criativo” com respostas e, portanto, menos propenso a inventar fatos.

A outra limitação principal é que o modelo GPT-4 foi treinado em dados da Internet até dezembro de 2023 (GPT-4o e 4o mini cut off em outubro daquele ano). No entanto, como o GPT-4 é capaz de realizar pesquisas na web e não simplesmente depender de seu conjunto de dados pré-treinado, ele pode facilmente pesquisar e rastrear fatos mais recentes na Internet.

GPT-4o é a versão mais recente, é claro, e o GPT-5 ainda está chegando.