Veja como Claude 3.5 Sonnet e GPT-4o se comparam diretamente

julho 6, 2024 gurinho

No cenário cada vez maior de modelos de linguagem grande (LLMs), dois líderes se destacam do resto da corrida: Claude 3.5 Sonnet da Anthropic e GPT-4o da OpenAI (o “o” significa “Omni”). Ambas as IAs possuem capacidades impressionantes, mas qual reina suprema? Este guia se aprofunda no Claude 3.5 Sonnet e no GPT-4o, dissecando seus pontos fortes e fracos em várias tarefas.

Não apenas exploraremos sua precisão relativa e velocidades de resposta, mas também desvendaremos suas estruturas de preços e níveis de serviço. Ao final deste artigo, você estará munido do conhecimento necessário para tomar uma decisão informada sobre qual LLM melhor atende às suas necessidades e orçamento específicos.

Preços e níveis

Os usuários do ChatGPT podem acessar o modelo GPT-4o gratuitamente, mas o número de consultas que você pode fazer em um período de três horas é limitado. Exceder esse limite fará com que você passe a usar o GPT-3.5, o modelo mais antigo e menos capaz do OpenAI, até que o temporizador de resfriamento seja reiniciado.

Os usuários precisarão pagar pela assinatura ChatGPT Plus de US$ 20 por mês, uma assinatura do Teams de US$ 30 por mês ou um sub Enterprise de taxa de mercado se quiserem usar o GPT-4o o quanto quiserem. Pagar pelo acesso não apenas aumenta drasticamente o limite de taxa para usar o modelo de IA, mas também concede acesso a recursos adicionais, como geração de imagens Dall-E.

uma captura de tela dos níveis de preços do Claude — Antrópico

O acesso a Claude é configurado da mesma maneira. No nível gratuito, os usuários podem conversar com o chatbot na web ou por meio do aplicativo iOS. Eles também podem fazer upload de imagens e documentos para o servidor Anthropic e consultar a IA sobre seu conteúdo, além de aproveitar o uso limitado do novo modelo Claude 3.5 Sonnet.

Pagar $ 20 por mês por uma conta Pro oferece tudo, desde o nível gratuito, bem como limites de uso mais altos, acesso a Claude 3 Opus e Haiku, largura de banda e disponibilidade prioritárias e a capacidade de criar projetos com a IA centrada em um conjunto de documentos ou arquivos. Pagar US$ 30 por mês por pessoa (mínimo 5 pessoas) por uma conta do Teams oferece limites de uso ainda mais altos e a capacidade de compartilhar bate-papos entre colegas de equipe.

Vantagens de usar Claude

Embora Claude possa não desfrutar do mesmo grau de reconhecimento de nome que o GPT-4o, o mais recente modelo de IA da Anthropic apresenta uma série de vantagens sobre seu rival – e não apenas em benchmarks de desempenho . Por um lado, Claude possui uma janela de contexto significativamente maior do que o ChatGPT (200.000 caracteres versus 128.000).

Isso significa que ele pode lembrar e analisar uma parte muito maior de conversas ou textos anteriores, levando a respostas mais matizadas e relevantes, especialmente em interações mais longas. Claude também é treinado para priorizar a precisão em detrimento da criatividade em suas respostas.

Pode ser um pouco difícil gerar haicais divertidos, mas Claude é excelente em resumir trabalhos de pesquisa e gerar relatórios com base em dados carregados. Claude também tem uma data limite de conhecimento mais recente do que GPT-4o: abril de 2024 versus outubro de 2023.

uma captura de tela do soneto de Claude 3.5 com a tela lateral de Artefatos — Antrópico

Além disso, a Anthropic treinou seus modelos Claude como IAs constitucionais. Isto significa que o sistema implementa um conjunto de princípios para fazer julgamentos sobre os resultados gerados, orientando efetivamente o modelo em direção ao tipo de comportamento ético ditado pela constituição. Isso inclui evitar resultados tóxicos ou discriminatórios, bem como evitar descrever ou defender atividades ilegais ou antiéticas.

Vantagens de usar GPT-4o

O GPT-4o, por outro lado, oferece aos usuários uma variedade maior de funções, uma base de conhecimento maior e opções de login mais flexíveis do que o Claude.

Ao contrário da oferta da Anthropic, o ChatGPT pode gerar imagens (embora esse recurso exija uma assinatura) e acessar a web para encontrar as informações mais atualizadas disponíveis, não apenas os dados nos quais foi treinado. E ao contrário do processo de inscrição com Claude, os usuários do GPT-4o não terão que fornecer seu número de telefone para verificação, ou mesmo qualquer credencial, para começar a usar o modelo. E, graças à sua maior base de conhecimento, GPT-4o é mais hábil na geração de conteúdo criativo através de imagens, texto e áudio do que Claude.

O site ChatGPT também tende a ficar sobrecarregado com solicitações de usuários em uma taxa muito menor do que a de Claude.

Comparação de velocidade e precisão

Ambos os modelos são capazes de gerar uma ampla variedade de resultados de texto, desde o refinamento da prosa escrita pelo usuário até a criação de códigos de computador e algoritmos de planilhas. Quando solicitados a gerar um “pedaço de código Python que medirá a área de um círculo e gerará um gráfico da função”, ambos retornaram trechos estruturados de forma semelhante. GPT-4o produziu o seguinte:

importar numpy como np
importar matplotlib.pyplot como plt

#Função para calcular a área de um círculo
def calcular_area(raio):
retornar np.pi * raio ** 2

# Gera um intervalo de valores de raio
raios = np.linspace(0, 10, 100) # raios de 0 a 10 com 100 pontos

# Calcule os valores da área correspondente
áreas = calcular_área(raios)

# Plotando a função
plt.figura(figsize=(10, 6))
plt.plot(raios, áreas, label='Área = πr²')
plt.title('Área de um círculo em função do raio')
plt.xlabel('Raio')
plt.ylabel('Área')
plt.legenda()
plt.grid(Verdadeiro)
plt.show()

Enquanto isso, a resposta de Claude foi um pouco mais detalhada:

importar matemática
importar numpy como np
importar matplotlib.pyplot como plt

def área_círculo(raio):
retornar math.pi * raio ** 2

# Gera raios de 0 a 10 com 100 pontos
raios = np.linspace(0, 10, 100)

# Calcular áreas para cada raio
áreas = [circle_area(r) para r em raios]

# Crie o enredo
plt.figura(figsize=(10, 6))
plt.plot(raios, áreas, 'b-', largura de linha = 2)
plt.title('Área de um círculo em função do raio')
plt.xlabel('Raio')
plt.ylabel('Área')
plt.grid(Verdadeiro)

# Adicione alguns pontos interessantes
plt.plot(0, Circle_area(0), 'ro', rótulo='r = 0′)
plt.plot(1, Circle_area(1), 'ro', rótulo='r = 1′)
plt.plot(5, círculo_area(5), 'ro', rótulo='r = 5′)
plt.plot(10, círculo_area(10), 'ro', rótulo='r = 10′)

plt.legenda()
plt.show()

Em termos de identificação de imagem, os dois modelos são bastante semelhantes. Quando solicitados a identificar os vários aspectos da imagem a seguir, tanto o GPT-4o quanto o Claude 3.5 foram facilmente capazes de encontrar e descrever cada um dos 21 itens presentes.

uma série de imagens geradas em 3D feitas por Meta 3D Gen — meta

O GPT-4o tem a vantagem de fornecer informações sobre eventos recentes, dada a sua capacidade de pesquisar na web notícias mais recentes do que seus dados de treinamento. Perguntar a Claude “o que aconteceu ontem no Luxemburgo” apenas lhe dá uma nota que diz: “Peço desculpa, mas não tenho acesso a notícias ou informações em tempo real sobre eventos específicos que ocorreram ontem no Luxemburgo. Meu limite de conhecimento é em abril de 2024 e não tenho informações sobre eventos após essa data.” A IA oferece uma série de recomendações úteis sobre onde você pode encontrar as informações solicitadas.

Achei que comparar os dois sistemas era um desafio, principalmente porque só consegui fazer meia dúzia de solicitações a Claude antes que o sistema me bloqueasse por três horas. Mesmo no nível gratuito do ChatGPT, não ficarei totalmente fora do sistema – só terei que conversar com um modelo ligeiramente inferior por um tempo.

Qual é melhor?

Em última análise, a melhor escolha depende das suas necessidades específicas. Se você prioriza a precisão factual, o processamento demorado de documentos e tem um orçamento apertado, Claude pode ser uma opção melhor.

No entanto, se você precisar de uma gama mais ampla de funcionalidades criativas e estiver disposto a pagar por recursos adicionais, o ChatGPT ainda é a melhor opção.