Após 9 anos, Huang Renxun mais uma vez entregou na porta de Musk, e o supercomputador pessoal de IA que foi adiado por mais de meio ano finalmente chegou


Hoje, o décimo primeiro voo da Starship foi concluído com sucesso e, inesperadamente, Jensen Huang também apareceu no local.

Acontece que Huang Renxun voou pessoalmente até a Starbase no Texas, ao lado da nave estelar, apenas para entregar uma "bomba nuclear" recém-produzida a Musk.

É isso que todos estavam esperando desde o começo do ano : o supercomputador pessoal de IA NVIDIA DGX Spark .

Essa cena imediatamente trouxe de volta memórias para todos os geeks de tecnologia, transportando-os de volta para 2016. Naquela época, Musk ainda era o cofundador da OpenAI e, antes que ele e Altman se desentendessem, Huang entregou pessoalmente o primeiro supercomputador DGX-1 do mundo ao escritório da startup deles.

Huang Renxun brincou na época:

Se este for o único produto a ser entregue, o projeto custará até US$ 2 bilhões.

Essa "máquina de US$ 2 bilhões" mais tarde inaugurou a era dos modelos grandes.

No ano seguinte, o Google anunciou uma nova arquitetura de treinamento de rede neural, o Transformer.

Esse novo avanço foi aproveitado novamente por Sutskever, levando a OpenAI a construir o primeiro modelo GPT, todo construído no supercomputador da Nvidia.

Nove anos se passaram, Musk se tornou um nome constante na lista dos homens mais ricos do mundo, e Jensen Huang já comandou a empresa com o maior valor de mercado do mundo.

O DGX que a NVIDIA apresentou desta vez não é mais um gigante, mas um monstro de desempenho que pode ser colocado na sua mesa. Mais uma vez, a NVIDIA anunciou da maneira mais incrível possível: a era da supercomputação com IA para todos começa aqui.

Alerta de spoiler: o DGX Spark da APPSO também está a caminho. Traremos mais detalhes da experiência no futuro, então fique ligado.

Para ser honesto, não foi fácil para este DGX Spark ser entregue com sucesso a Lao Ma.

Desde sua estreia impressionante na CES em janeiro, sob o nome "Project Digits", a Nvidia perdeu suas datas de lançamento originais de maio e verão e ainda não enviou uma única unidade. Essa espera de seis meses deixou muitos inquietos, com alguns desenvolvedores até especulando que o produto pode ser totalmente adiado.

Embora as autoridades permaneçam em segredo, especulações da indústria apontam para o chip Grace Blackwell GB10 como seu núcleo. Este chip é uma "combinação de forças", com a GPU Blackwell (a mesma arquitetura da conhecida placa de vídeo 5090) já pronta. No entanto, a CPU Grace, desenvolvida em conjunto com a MediaTek, tem demorado a entrar em produção, prejudicando todo o projeto.

A história de "tudo pronto, exceto a CPU" aconteceu inesperadamente com a NVIDIA.

Então, quando concorrentes como o M3 Ultra Mac Studio estão chamando a atenção com sua alta largura de banda de memória, ainda vale a pena esperar pelo DGX Spark, que está atrasado e US$ 1.000 mais caro do que o inicialmente especulado?

A resposta é: vale muito a pena! Porque a abordagem é única e vai direto aos pontos problemáticos.

Depois de mais de meio ano de espera, o que torna o DGX Spark tão popular? A APPSO explica o processo.

A alma de toda a máquina é o super chip Grace Blackwell GB10.

Ele combina uma CPU ARM Grace de 20 núcleos e uma poderosa GPU Blackwell em um único superchip, oferecendo até 1 petaflop de desempenho de computação de IA, proporcionando potência de nível de data center em seu desktop.

O DGX Spark tem outro recurso incrível: CPU e GPU via NVIDIA NVLink ™ – A tecnologia C2C se conecta perfeitamente, compartilhando um enorme pool de memória unificada de 128 GB.

Essa tecnologia de conexão oferece cinco vezes a largura de banda do PCIe tradicional de quinta geração, garantindo transferência de dados em alta velocidade entre a CPU e a GPU com praticamente nenhuma latência. Embora sua largura de banda de memória (273 GB/s) seja, em teoria, significativamente menor que a do Mac Studio M3 Ultra (819 GB/s), a filosofia da NVIDIA é "aproveitar ao máximo a potência".

Em tarefas de IA, especialmente ao executar modelos grandes, o valor estratégico de poder encaixar o modelo inteiro na memória de uma só vez excede em muito a mera largura de banda. Isso significa que você pode executar sem problemas um modelo de linguagem massivo com até 200 bilhões de parâmetros diretamente na sua mesa, sem a necessidade de particionamentos complexos de modelos. Essa experiência é incomparável.

A GPU Blackwell é equipada com Tensor Cores de quinta geração e suporta formatos de precisão ultrabaixa, como FP4/FP8, com desempenho aprimorado em 5 vezes em comparação à geração anterior FP8.

Isso é como ativar um modo "turbo" para computação de IA, o que aumenta drasticamente a velocidade de inferência ao mesmo tempo em que atinge uma eficiência energética incrível.

Uma máquina não é suficiente? O DGX Spark também conta com uma interface de rede NVIDIA ConnectX®-7 de 200 Gb/s integrada. Você pode conectar facilmente duas máquinas para criar um microcluster com 256 GB de memória compartilhada.

A Nvidia disse que essa combinação é suficiente para lidar com modelos gigantes com até 400 bilhões de parâmetros, o que está além da imaginação de desenvolvedores individuais.

Deixando o hardware de lado, não se esqueça do ponto mais forte da NVIDIA: o ecossistema de software. O DGX Spark vem pré-instalado com o conjunto completo de software de IA da NVIDIA, incluindo bibliotecas CUDA, TensorRT e vários NVIDIA NIM. ™ Microsserviços, tudo é integrado em um DGXOS personalizado (baseado no Ubuntu) e ajustado para você.

Isso significa que você não precisa mais perder tempo se preocupando com compatibilidade e pode entrar no modo de combate imediatamente após desembalar o jogo. Para os desenvolvedores, a economia de tempo é imensurável.

Essa "virada do século" que está acontecendo na base da nave estelar é apenas o começo.

A partir de 15 de outubro, o DGX Spark estará disponível oficialmente no site oficial da NVIDIA e em parceiros globais por aproximadamente US$ 4.000. Quase todas as gigantes do PC, incluindo Acer, Asus, Dell e Lenovo, já aderiram à tendência.

Para ser sincero, esse preço é US$ 1.000 a mais do que os US$ 3.000 prometidos originalmente, e é praticamente o mesmo de um Mac Studio M3 Ultra topo de linha. No entanto, o posicionamento deles é completamente diferente: o DGX Spark vem pré-instalado com o DGXOS (baseado no Ubuntu) e não pode ser instalado no Windows ou macOS. É uma "máquina de batalha" pura, preparada para desenvolvedores de IA e entusiastas hardcore.

Seu apelo reside no fato de que, por US$ 4.000, você obtém o superpoder de domar um modelo de 200 bilhões de parâmetros localmente, além do suporte total de todo o ecossistema CUDA por trás dele. Para profissionais que precisam processar dados confidenciais localmente, buscam desempenho extremo ou desejam controlar totalmente seus fluxos de trabalho de IA, esse preço é bastante competitivo.

O que você acha deste dispositivo "tendencioso", com pontos fortes e fracos distintos? Se tiver mais detalhes que gostaria de saber sobre ele, deixe-nos saber na seção de comentários.

#Bem-vindo a seguir a conta pública oficial do WeChat do iFaner: iFaner (ID do WeChat: ifanr), onde mais conteúdo interessante será apresentado a você o mais breve possível.

iFanr | Link original · Ver comentários · Sina Weibo