Huang Renxun se transformou no Capitão América e lançou a nova “bomba nuclear” RTX 5090! Com preço de 14.600, há também um supercomputador AI CES 2025 |

janeiro 8, 2025 gurinho

Como um importante cata-vento na indústria de tecnologia, a IA dominou todo o foco da CES 2025, tanto que os produtos que não envolvem IA quase se tornaram atípicos na feira de Las Vegas.

A IA é a protagonista, e o CEO da Nvidia, Huang Renxun, também assume a liderança sem hesitação.

Como a "esperança de toda a aldeia", ele fez um emocionante discurso de abertura e uma série de lançamentos de sucesso de novos produtos de IA, tornando a abertura da CES 2025 a primeira explosão do novo ano no círculo de IA.

Durante o discurso, Huang, que vestiu uma nova jaqueta de couro, também posou e fez cosplay do Capitão América, o que causou risadas na plateia.

Não tivemos que esperar muito. Huang Renxun lançou rapidamente a placa gráfica da série RTX 50 de nova geração baseada na arquitetura Blackwell que esperávamos há muito tempo.

Entre eles, a GPU RTX 5090 é a GPU GeForce RTX mais rápida até o momento. Está equipada com 92 bilhões de transistores e pode atingir mais de 3.352 trilhões de operações de IA por segundo. Seu desempenho é quase o dobro do da geração anterior RTX 4090.

O RTX 5080 foi projetado para oferecer o dobro do desempenho do RTX 4080 e está equipado com 16 GB de memória GDDR7, largura de banda de memória de 960 GB/s e 10.752 núcleos CUDA. A Nvidia promete que o RTX 5080 estará significativamente à frente da geração anterior RTX 4080 em desempenho.

Huang Renxun enfatizou isso em seu discurso:

Percebemos que a IA não é apenas uma aplicação que traz novas oportunidades de negócio, mas também aprendizagem automática implementada por transformadores que mudarão fundamentalmente a forma como a computação é feita.

O lançamento da série RTX 50 ocorre dois anos após o lançamento do RTX 4090 e RTX 4080. As GPUs da série RTX 40 se concentram em melhorar o desempenho do ray tracing e lançar Deep Learning Super Sampling (DLSS) 3.

A série RTX 50 apresenta uma nova geração de tecnologia DLSS, DLSS 4.

O avanço da nova geração da tecnologia DLSS faz com que a IA não seja mais apenas uma simples geração de frames, mas tenha a capacidade de “prever o futuro”, o que também terá um impacto importante nas áreas de desenvolvimento de jogos e criação de conteúdo.

Especificamente, o DLSS 4 estreia a geração de vários quadros, que melhora as taxas de quadros usando IA para gerar até 3 quadros para cada quadro renderizado. Ele funciona com o conjunto de tecnologia DLSS para melhorar o desempenho em até 8x em comparação com a renderização tradicional, mantendo a capacidade de resposta por meio da tecnologia NVIDIA Reflex.

O DLSS 4 também apresenta o primeiro aplicativo de arquitetura de modelo Transformer em tempo real da indústria gráfica.

Os modelos de super-resolução e reconstrução de luz DLSS baseados em transformador usam 2x mais parâmetros e 4x mais poder de computação para fornecer maior estabilidade, menos fantasmas, detalhes mais altos e imunidade aprimorada em cenas de jogos.

O DLSS 4 oferecerá suporte a mais de 75 jogos e aplicativos no dia do lançamento e estará disponível nas GPUs GeForce RTX Série 50.

Tomemos como exemplo jogos conhecidos como "Cyberpunk 2077" e "Black Myth: Wukong" e a tecnologia de geração de vários quadros pode melhorar significativamente o desempenho desses jogos.

É relatado que os jogadores equipados com GeForce RTX 5090 ainda podem desfrutar de uma experiência suave de 240 quadros em resolução 4K, mesmo quando o traçado de raio completo está ativado e todas as configurações de qualidade de imagem estão ajustadas ao máximo.

O desempenho aumentou significativamente e o preço aumentou naturalmente. Os preços específicos das quatro placas gráficas são os seguintes:

RTX 5090: US$ 1.999 (atualmente cerca de 14.647 yuans)
RTX 5080: $ 999 (atualmente cerca de 7.319 yuans)
RTX 5070Ti: US$ 749 (atualmente cerca de 5.488 yuans)
RTX 5070: $ 549 (atualmente cerca de 4.022 yuans)

Preço de venda do Banco da China:

RTX 5090D começa em 16.499 yuans
RTX 5080 começa em 8.299 yuans
RTX 5070 Ti custa a partir de US$ 749
RTX 5070 começa em US$ 549

Quando a lei do dimensionamento parece ter atingido um muro, Huang Renxun, que suporta as expectativas dos crentes na IA, também elogiou a IA.

Huang Renxun acredita que a lei de escalonamento não falhou, desde que recursos computacionais suficientes sejam investidos e algoritmos mais complexos sejam adotados, o nível de inteligência da IA pode continuar a melhorar.

Pode-se até dizer que a lei de escalonamento está passando por diferentes estágios de ajuste:

Fase de escalonamento pré-treinamento. À medida que a quantidade de dados da Internet duplica todos os anos, especialmente o crescimento explosivo de dados multimodais (vídeo, imagem, som), fornece uma base de dados em constante crescimento para a formação em IA.
Fase de escalonamento pós-treinamento. Através de tecnologias como a aprendizagem por reforço e o feedback humano, os sistemas de IA podem otimizar-se continuamente, como se tivessem um “mentor”. Este processo é semelhante à educação continuada após a formatura. A IA pode ser ajustada para áreas específicas e melhorar sua capacidade de resolver problemas práticos.
Fase de escalonamento do tempo de teste. Os sistemas de IA podem alocar recursos de computação de maneira flexível durante o uso e melhorar a qualidade da resolução de problemas por meio do raciocínio, do pensamento de longo prazo e da decomposição de problemas.

NVLink72, a tecnologia de interconexão da arquitetura Blackwell, também foi oficialmente revelada. Ela combina poderosas capacidades de GPU, CPU, memória, rede e processamento de dados, e é adequada para aplicações que exigem capacidades extremamente altas de computação e processamento de dados, como IA, científicas. computação e análise de dados.

Os destaques específicos são os seguintes:

Contém 72 GPUs Blackwell,
Capaz de fornecer desempenho TF FP4 de 1,4 ExaFLOPS (exaFLOPS),
Equipado com 576 chips de memória com capacidade total de 14 TB (terabytes),
Possui largura de banda de memória de 1,2 PB/s (petabytes por segundo).
Contém 18 switches NVLink com 130 bilhões de transistores,
Contém 2592 núcleos de CPU Grace, 72 placas de interface de rede (NICs) ConnectX-8,
18 unidades de processamento de dados (DPUs) BlueField

Agente de IA se tornou uma palavra-chave importante em 2025 e também é a próxima tendência importante de IA.

A NVIDIA também propôs uma nova visão de desenvolvimento para isso. Esta nova geração de sistemas de IA não estará mais limitada ao simples modo de perguntas e respostas, mas será capaz de compreender necessidades, interagir e resolver problemas complexos como funcionários reais.

Ele pode chamar uma variedade de ferramentas, desde pesquisa na web até leitura de PDF, desde o uso de calculadoras até a geração de gráficos, e concluir tarefas por meio da colaboração de vários modelos.

Para atingir esse objetivo, a Nvidia lançou uma solução completa que inclui a plataforma de microsserviços Nims e o sistema Nvidia Nemo. O Nims empacota e otimiza tecnologias subjacentes complexas, suportando vários modelos de IA, como visão, linguagem e voz, para execução em várias plataformas de nuvem.

O sistema Nemo pode ser chamado de “sistema de treinamento de integração” para Agentes de IA. Ele pode realizar treinamentos customizados de acordo com as necessidades específicas da empresa, incluindo um mecanismo completo de feedback de avaliação e grades de segurança. Lao Huang acredita que, no futuro, os departamentos de TI corporativos se transformarão gradualmente em "departamentos de recursos humanos de agentes de IA".

Lao Huang disse:

Com mil milhões de trabalhadores do conhecimento no mundo, os Agentes de IA podem ser a próxima indústria robótica e podem muito bem ser uma oportunidade no valor de biliões de dólares.

Na conferência de imprensa, Huang Renxun também anunciou o lançamento da plataforma de modelo básico mundial – "NVIDIA Cosmos", com foco na compreensão e simulação do mundo físico.

Após 20 milhões de horas de treinamento em vídeo, a plataforma concentra-se principalmente na dinâmica física, incluindo cenas como movimento natural, comportamento humano e manipulação de objetos, e está comprometida em ensinar IA a compreender como funciona o mundo físico.

Inclui componentes como modelos de regressão automática, bases de difusão, etiquetadores avançados e pipelines de dados acelerados por IA, e pode gerar estados de mundo virtual fisicamente compatíveis com base em dicas de texto, imagem ou vídeo.

Da automação industrial aos carros autônomos, o NVIDIA Universe possui uma gama extremamente ampla de aplicações.

No setor industrial, pode simular operações fabris e gerar dados sintéticos para treinamento de robôs. No campo da condução autônoma, pode escalar milhares de dados reais de condução em bilhões de quilômetros de dados de treinamento.

O "momento ChatGPT" para robôs de uso geral está chegando e espera-se que promova um progresso revolucionário na tecnologia robótica nos próximos anos.

Os supercomputadores não são mais exclusivos dos data centers, eles estão entrando no bolso de todos.

No início, Huang Renxun apresentou certa vez o primeiro supercomputador DGX-1 AI do mundo para a OpenAI.

Como um sistema especialmente projetado para aprendizagem profunda, o DGX-1 integra hardware, software de aprendizagem profunda e ferramentas de desenvolvimento, permitindo aos usuários implantá-lo de forma simples e rápida, e também desempenha um grande papel na promoção da onda atual de IA.

Depois de muitos anos, em comparação com o supercomputador do ano do tamanho de uma "caixa", os dígitos do projeto que Jen-Hsun Huang mostrou na coletiva de imprensa e que podiam ser segurados com uma mão foram surpreendentes para o público.

Equipado com o novo superchip GB10 Grace Blackwell da NVIDIA, o Project Digits foi projetado para pesquisadores de IA, cientistas de dados e estudantes, fornecendo desempenho de computação de nível petaflop para prototipagem, ajuste fino e execução de modelos de IA.

Desenvolvido em parceria com a MediaTek, o GB10 possui uma GPU NVIDIA Blackwell conectada a uma CPU NVIDIA Grace de 20 núcleos.

Dentro do gabinete do Project Digits, o chip está conectado a um conjunto de memória de 128 GB e até 4 TB de armazenamento flash.

A Nvidia afirma que uma única unidade Project Digits pode executar modelos com até 200 bilhões de parâmetros e, se o trabalho exigir, duas máquinas Project Digits podem ser conectadas entre si para executar modelos com até 405 bilhões de parâmetros.

E não só pode ser usado como uma plataforma de computação em nuvem privada, mas também se transformar em uma estação de trabalho profissional em segundos, verdadeiramente “pronta para uso”. O Project Digits estará disponível através dos principais parceiros da NVIDIA em maio deste ano, ao preço de US$ 3.000.

Uma conferência de imprensa não pode descrever as ambições de IA da Nvidia.

Dos data centers aos desktops pessoais, a onda de IA está varrendo todos os terminais de computação, e a NVIDIA está espalhando o fogo dessa revolução em todos os computadores pessoais.

Quando as placas gráficas da série RTX 50 permitem que os jogadores experimentem o superdesempenho da IA, e quando o Project Digits torna a supercomputação não mais inatingível, o futuro da IA em todos os lugares está se tornando claro. E esta pode ser a visão que a Nvidia tem se esforçado para perseguir.

# Bem-vindo a seguir a conta pública oficial do WeChat do aifaner: aifaner (WeChat ID: ifanr). Mais conteúdo interessante será fornecido a você o mais rápido possível.

Ai Faner | Link original · Ver comentários · Sina Weibo |