Nvidia: sua nova IA supera ChatGPT-4o e é de código aberto

O ChatGPT em breve será ultrapassado pela concorrência: o novo projeto de inteligência artificial da Nvidia supera todos!

A inteligência artificial (IA) é hoje uma das forças motrizes mais poderosas no cenário tecnológico global. Desde carros autónomos a sistemas de assistência por voz, desde plataformas de recomendação a chatbots, a IA está a transformar rapidamente a forma como vivemos, trabalhamos e comunicamos. As suas aplicações são tão vastas e diversificadas que vão da medicina às finanças, do entretenimento à educação. No entanto, o que realmente caracteriza a IA não é apenas a sua ampla gama de utilizações, mas a sua capacidade de evoluir e melhorar com uma velocidade sem precedentes.

Um dos aspectos mais interessantes desta evolução é a competição constante entre empresas de tecnologia para desenvolver os modelos de IA mais avançados e eficientes. Neste contexto, a Nvidia recentemente ganhou as manchetes com o lançamento de um novo modelo de inteligência artificial que poderá redefinir o desempenho e a eficácia dos sistemas atuais.

Nvidia lança o novo modelo Llama-3.1-Nemotron-70B-Instruct

Em 15 de outubro de 2024, a Nvidia surpreendeu o mundo da IA ​​com o lançamento de um novo modelo chamado Llama-3.1-Nemotron-70B-Instruct , uma versão avançada baseada no modelo Llama-3.1-70B de código aberto da Meta. O modelo, que não foi apresentado com nenhum anúncio importante, mas que rapidamente chamou a atenção de especialistas do setor, já provou ter desempenho superior aos sistemas de IA mais avançados, incluindo GPT-4o e Claude-3 Anthropic da OpenAI.

De acordo com uma postagem compartilhada em comparação em testes de desempenho e funcionalidade. O modelo não é apenas uma atualização do modelo Meta básico, mas incorpora importantes melhorias desenvolvidas pela Nvidia, que o tornam particularmente poderoso.

O papel da Nvidia no desenvolvimento do Nemotron

O próprio nome do modelo reflete a integração entre Meta e Nvidia. Enquanto a parte “Llama-3.1-70B-Instruct” se refere ao modelo básico do Meta, a adição do termo “Nemotron” destaca a contribuição tecnológica da Nvidia. Meta criou o chamado “rebanho” de modelos Llama, destinado a ser um recurso de código aberto para os desenvolvedores trabalharem e melhorarem. A Nvidia aceitou este desafio e aprimorou o modelo original com novas técnicas de ajuste e uso de hardware e conjuntos de dados próprios, projetando uma versão que pode estar entre as de melhor desempenho do mercado.

Segundo a Nvidia, o Nemotron foi desenvolvido com o objetivo de ser mais “útil” do que outros modelos emblemáticos como ChatGPT e Claude-3. A empresa empregou conjuntos de dados altamente selecionados e implementou técnicas avançadas de treinamento para tornar o modelo extremamente eficaz em vários cenários.

Inteligência artificial
Inteligência Artificial (Foto Pixabay) – www.systemcue.it

Uma comparação com modelos existentes

Medir o desempenho de um modelo de IA não é uma tarefa simples. Ao contrário dos parâmetros científicos objetivos, como a temperatura, o desempenho da IA ​​é influenciado por uma série de fatores subjetivos e contextuais. Pesquisadores e desenvolvedores usam testes de benchmarking para determinar quão bem um modelo responde a determinadas perguntas, mas a avaliação final geralmente depende do julgamento humano.

Neste contexto, a Nvidia afirma que o Llama-3.1-Nemotron-70B-Instruct supera significativamente modelos já conhecidos como GPT-4o e Claude-3. Embora ainda não apareça oficialmente no ranking do Chatbot Arena, um engenheiro da Nvidia disse que o modelo obteve 85 pontos em um teste automatizado “Hard”. Esta pontuação, se confirmada, posicionaria o Nemotron como um dos modelos de melhor desempenho disponíveis atualmente.

Curiosamente, o modelo básico usado pela Nvidia, o Llama-3.1-70B da Meta, não é o maior da sua classe. Na verdade, existe uma versão ainda maior, Llama-3.1-405B, que incorpora um número muito maior de parâmetros. No entanto, a Nvidia conseguiu otimizar um modelo de tamanho médio, levando-o para competir com gigantes como o GPT-4o, que estima-se que utilize mais de 1 trilhão de parâmetros.

O artigo Nvidia: sua nova IA supera ChatGPT-4o e é open source foi escrito em: Tech CuE | Engenharia de perto .