O ‘sistema de treinamento de IA mais poderoso do mundo’ acaba de ficar online
A corrida pela supremacia da IA está mais uma vez acelerando quando o CEO da xAI, Elon Musk, anunciou via Twitter que sua empresa colocou online com sucesso seu cluster de treinamento Colossus AI, que Musk considera o “mais poderoso” do mundo, no fim de semana.
Neste fim de semana, a equipe @xAI colocou online nosso cluster de treinamento Colossus 100k H100. Do início ao fim, foi feito em 122 dias.
Colossus é o sistema de treinamento de IA mais poderoso do mundo. Além disso, dobrará de tamanho para 200k (50k H200s) em alguns meses.
Excelente…
— Elon Musk (@elonmusk) 2 de setembro de 2024
“Neste fim de semana, a equipe @xAI colocou online nosso cluster de treinamento Colossus 100k H100. Do início ao fim, foi feito em 122 dias. Colossus é o sistema de treinamento de IA mais poderoso do mundo. Além disso, dobrará de tamanho para 200k (50k H200s) em alguns meses. Excelente trabalho da equipe, da Nvidia e de nossos diversos parceiros/fornecedores”, escreveu Musk em um post no X.
A afirmação “mais poderosa” de Musk é baseada no número de GPUs empregadas pelo sistema. Com 100.000 Nvidia H100 dirigindo-o, estima-se que o Colossus seja maior do que qualquer outro sistema de IA desenvolvido até hoje.
Musk começou a comprar dezenas de milhares de GPUs em abril de 2023 para acelerar os esforços de IA de sua empresa, logo após escrever uma carta aberta pedindo uma “pausa” de seis meses em todo o setor no desenvolvimento de IA. Em março daquele ano, Musk afirmou que a empresa aproveitaria a IA para “detectar e destacar a manipulação da opinião pública” no Twitter, embora o supercomputador GPU provavelmente também seja aproveitado para treinar seu grande modelo de linguagem (LLM), Grok .
Grok foi introduzido pela xAI em 2023 em resposta ao sucesso de rivais como ChatGPT, Gemini, Llama 3.1 e Claude. A empresa lançou o Grok-2 atualizado como beta em agosto. “Apresentamos o Grok-2, posicionando-nos na vanguarda do desenvolvimento de IA”, escreveu xAI em uma postagem recente no blog . “Nosso foco está no avanço dos principais recursos de raciocínio com nosso novo cluster de computação. Teremos muito mais desenvolvimentos para compartilhar nos próximos meses.”
Musk afirma que também pode transformar Tesla em “um líder em IA e robótica”, no entanto, um relatório recente da CNBC sugere que Musk tem desviado remessas das tão procuradas GPUs da Nvidia da montadora elétrica para xAI e Twitter. Isso poderia atrasar os esforços da Tesla para instalar os recursos computacionais necessários para desenvolver sua tecnologia de veículos autônomos e o robô humanóide Optimus.
“Elon priorizando a implantação do cluster de GPU X H100 em X versus Tesla, redirecionando 12k de GPUs H100 enviadas originalmente programadas para Tesla para X”, diz um memorando da Nvidia de dezembro obtido pela CNBC. “Em troca, os pedidos originais X de 12k H100 programados para [janeiro] e junho serão redirecionados para Tesla.”