A Nvidia vira o jogo; o Windows finalmente ganha um PC com verdadeira IA.

O pessoal que usa PCs com Windows não enfrenta um intruso realmente significativo há muito tempo.

▲Usuários do Windows provavelmente

Ao longo das últimas quatro décadas, a divisão básica do trabalho neste mercado permaneceu relativamente estável: a Microsoft define o sistema operacional e o ponto de entrada do software, a Intel e a AMD detêm há muito tempo a plataforma de processadores x86, e a Nvidia começou com a computação gráfica e, posteriormente, elevou a aceleração de IA a um nível ainda mais alto.

Em seu recente discurso de abertura na COMPUTEX 2026, a NVIDIA explorou a infraestrutura de IA como um tema central, expandindo-se para aspectos mais essenciais de vários setores.

Além de tópicos já conhecidos como GPUs, fábricas de IA e IA física, há também o RTX Spark, que a Microsoft e a ARM vêm promovendo com grande alarde, anunciando-o como "Uma nova era para PCs". Todos esses produtos giram em torno da mesma palavra-chave:

Agente, agente e mais agente.

Em parceria com a Microsoft, a Nvidia pretende redefinir o PC pessoal.

Na narrativa do Agente, o personagem do jogador é colocado em uma nova posição.

Durante quarenta anos, o Windows, o BIOS aberto, os chipsets, os drivers e as APIs multimídia moldaram a computação pessoal. O Windows 95 transformou o PC de um dispositivo empresarial em um produto eletrônico de consumo, tornando-o uma necessidade para quase todos.

Agora, a Microsoft e a Nvidia estão redefinindo o PC com IA, com o objetivo de permitir que os PCs executem agentes inteligentes nativamente, transformando os computadores pessoais de gateways de aplicativos tradicionais em plataformas pessoais de IA.

O processador NVIDIA RTX Spark, lançado hoje, é o núcleo dessa nova arquitetura de PC.

Ele conta com uma GPU Blackwell RTX com desempenho de IA FP4 atingindo 1 petaflop; a CPU é uma Grace personalizada de 20 núcleos desenvolvida em conjunto com a MediaTek; possui 128 GB de memória unificada e oferece largura de banda de 600 GB/s via NVLink C2C. No lado do software, o conjunto completo inclui CUDA, TensorRT, NVFP4, Ray Tracing RTX, DLSS, Reflex e G-SYNC.

Em termos de formato do produto, a NVIDIA projetou o RTX Spark em um tamanho mais próximo ao dos PCs Windows convencionais:

Os laptops têm apenas 14 mm de espessura e pesam cerca de 1,4 kg, com modelos de 14 a 16 polegadas; o chassi é feito de liga de alumínio usinada com precisão, e a tela é equipada com OLED tandem de cores precisas e suporta NVIDIA G-SYNC, atendendo tanto ao trabalho criativo quanto a jogos e experiências visuais de alta taxa de quadros.

Em outras palavras, o RTX Spark não se destina apenas a assistentes de voz de ponta ou cenários de escritório leves; ele busca incorporar algumas capacidades de IA de data center, recursos gráficos para jogos e recursos criativos profissionais em um formato de computador pessoal.

Jensen Huang afirmou que este computador precisa executar "tudo". Aplicativos tradicionais do Windows precisam funcionar, o conjunto de softwares CUDA precisa funcionar, e fluxos de trabalho gráficos, biologia digital, processamento sísmico, astrofísica, genômica e aplicações de IA também precisam continuar rodando. Ele pode se conectar a modelos locais, bem como a modelos na nuvem.

No vídeo de demonstração no local, após o usuário fornecer o terreno, esboços, referências de estilo e requisitos, a IA executada no RTX Spark utiliza o Rhino para elaborar o projeto arquitetônico e de interiores, importando-o em seguida para o Blender e o Flux 2 para gerar renderizações em múltiplos ângulos. O usuário pode modificar o projeto a qualquer momento durante o processo.

A mensagem transmitida pela demonstração é autoexplicativa: os PCs passarão da operação manual de software para agentes inteligentes que agendam ferramentas com base em objetivos. Um exemplo típico é que aplicativos como o Adobe Photoshop e o Premiere estão sendo otimizados para o RTX Spark e conectados a agentes inteligentes locais por meio do MCP, tornando-se parte de fluxos de trabalho automatizados.

O RTX Spark é apenas o começo de uma nova linha de produtos para PC. Jensen Huang também apresentou três formatos: laptops, desktops e estações de trabalho. Todos são compatíveis com Windows, CUDA e softwares de IA, mas atendem a diferentes casos de uso.

Os laptops são adequados para trabalho de escritório móvel, jogos e trabalho criativo.

Ele pode executar o Nemotron 3 Ultra localmente ou conectar-se ao Claude, Codex ou outros modelos baseados em nuvem. A versão para desktop funciona mais como um host de IA pessoal em casa, capaz de executar um agente inteligente 24 horas por dia, 7 dias por semana, e conectar-se a laptops, monitores, câmeras, sistemas de segurança, eletrodomésticos e outros dispositivos.

A estação de trabalho foi projetada para desenvolvedores de modelos e desenvolvedores de agentes.

O DGX Station para Windows está equipado com 748 GB de memória, 20 petaflops de poder computacional e 8 TB de largura de banda de memória por segundo, permitindo a execução de modelos com trilhões de parâmetros em um ambiente de desktop. Os desenvolvedores podem concluir o desenvolvimento, a depuração e os testes do modelo localmente antes de implantá-lo na nuvem.

Jensen Huang compara essa mudança à transformação dos telefones celulares em smartphones, onde fazer chamadas deixou de ser a função mais importante. Ele acredita que os PCs passarão por uma transformação semelhante em 10 anos. Eles evoluirão de ferramentas para abrir aplicativos, clicar e digitar para supercomputadores de IA em fluxos de trabalho domésticos e pessoais.

A mudança mais direta que podemos perceber é que os futuros computadores com Windows poderão se tornar verdadeiros computadores com inteligência artificial.

Para quem deseja executar o LLM localmente e precisa de grandes quantidades de memória e forte poder de computação de IA, o surgimento do RTX Spark pode se tornar uma opção além do Mac.

Chegou a era da IA ​​útil; tudo é projetado para agentes.

Se tivéssemos que resumir as mudanças do setor nos últimos dois anos em uma frase, seria que a IA útil chegou. E o primeiro cenário de aplicação para IA agente é o desenvolvimento de software.

Existem entre 30 e 40 milhões de desenvolvedores profissionais em todo o mundo, e o número de commits no GitHub continua a crescer: aproximadamente 300 milhões em 2023, cerca de 400 milhões em 2024, chegando a 500 milhões nos primeiros meses de 2025 e quase triplicando nos primeiros meses de 2026.

Jensen Huang usou esse argumento para refutar a afirmação de que "a IA reduzirá empregos". Em sua visão, a IA aumenta a produtividade dos engenheiros, tornando as empresas mais dispostas a contratar mais profissionais da área. O motivo é que os mesmos custos com recursos humanos podem gerar maior produtividade, e o valor do desenvolvimento de software continuará a crescer.

As mudanças mais profundas ocorrem na forma de aplicativos.

No passado, o software era composto por aplicativos, código e sistemas operacionais, mas o método de computação na era dos agentes inteligentes mudou para um processo diferente: o usuário define o objetivo, o modelo compreende a intenção, o ambiente de execução agenda o processo, a ferramenta executa a tarefa, o sistema de memória salva o contexto e, finalmente, o resultado é produzido.

Todo o processo inclui observação, compreensão, raciocínio, planejamento, ação e uso de ferramentas.

Nesse contexto, o LLM é meramente o "módulo de pensamento" em um sistema agente. Um agente inteligente completo também requer uma infraestrutura (harpware), que é a camada de agendamento e orquestração; ferramentas como navegadores, planilhas, bancos de dados, compiladores, software CAD e mecanismos de processamento de dados; e memória de curto prazo, memória de longo prazo e um ambiente de execução. Esse modelo de LLM + infraestrutura = agente, mais ferramentas, memória e um ambiente de execução, será a base para aplicações na próxima década.

À medida que os agentes inteligentes se tornam uma nova forma de aplicação, a infraestrutura computacional que suporta seu funcionamento também precisa ser redesenhada.

Na conferência de imprensa, Jensen Huang anunciou que a plataforma de superchip de IA de próxima geração da NVIDIA, Vera Rubin, entrou em produção em larga escala. Trata-se de uma das maiores plataformas de nível POD da NVIDIA até o momento e um sistema central para a fábrica de IA de próxima geração projetada para IA Agente.

O Vera Rubin consiste em uma GPU Rubin, uma CPU Vera, NVLink 72, BlueField, ConnectX 9, Ethernet Spectrum X, sistema de processamento de armazenamento, sistema de processamento de segurança e um conjunto completo de softwares, com o objetivo de suportar a operação de sistemas de IA em nível de fábrica.

É voltado para todo o processo de um agente inteligente, desde a entrada de dados até a execução.

Quando um agente processa solicitações, compreende o contexto, raciocina e planeja, aciona ferramentas, acessa bancos de dados, executa código e recupera memória de longo prazo, ele envolve simultaneamente GPUs, CPUs, redes, memória, armazenamento e sistemas de segurança. Portanto, a GPU Rubin é responsável pela computação principal, a CPU Vera é responsável pelo agendamento e pelos pipelines de dados, o BlueField 4 lida com o isolamento de segurança e o armazenamento, e o Spectrum X é responsável pela rede em larga escala.

Após a apresentação sobre Vera Rubin, Jensen Huang também fez uma palestra separada sobre a CPU Vera.

Em sua visão, as CPUs tradicionais serviam principalmente aos usuários humanos e eram alugadas por meio da computação em nuvem tradicional, com recursos computacionais alugados por núcleo ou por tempo, e a velocidade de resposta medida em segundos. No entanto, o ritmo operacional dos agentes inteligentes é completamente diferente:

Eles frequentemente invocam ferramentas, acessam bancos de dados, executam código e recuperam dados da memória, sendo que cada etapa requer menor latência.

Isso torna o papel da CPU nas fábricas de IA ainda mais crítico. Quanto mais agentes existirem e quanto mais frequentemente as ferramentas forem chamadas e os dados fluírem, maior a probabilidade de a CPU se tornar um gargalo. Em particular, as GPUs se tornaram os ativos mais caros nas fábricas de IA, e a latência e a taxa de transferência da CPU afetam diretamente a utilização da GPU, impactando, em última análise, a produção de tokens.

Essa é a lógica de projeto por trás da CPU Vera.

Embora as CPUs tenham tradicionalmente servido aos humanos, a CPU Vera foi projetada para agentes inteligentes em número muito superior ao dos humanos. Ela utiliza um núcleo Olympus personalizado, com foco em desempenho de thread único, largura de banda entre núcleos, largura de banda total e eficiência energética. Possui um preditor de ramificação neural, um mecanismo de decodificação de 10 vias, um grande mecanismo de execução fora de ordem e um mecanismo avançado de pré-busca. A memória utiliza LPDDR5X e suporta múltiplos mecanismos de correção de erros.

Este processador contém 88 núcleos Olympus conectados por meio de uma arquitetura de malha monolítica, em vez de distribuir os núcleos por vários chiplets. Esse design reduz a latência associada à comunicação entre chips. Ele suporta PCI Express Gen 6, atingindo uma capacidade de comunicação interna de 3,6 TB/s e uma largura de banda de memória de 1,2 TB/s.

Em comparação com CPUs x86, o Vera reduz a latência máxima de memória em 40% em alguns cenários, alcança um desempenho 1,8 vezes superior ao do sandbox do agente, 3 vezes superior ao do SQL e 6 vezes superior ao do processamento de fluxo em tempo real.

Os agentes representam uma nova carga de trabalho, e o papel da CPU está mudando em conformidade. Ela não é mais apenas um núcleo de uso geral alugável na nuvem, mas um componente essencial na fábrica de IA que gerencia modelos, ferramentas, memória, bancos de dados e sistemas de segurança.

Comprar computadores hoje em dia é para construir fábricas de IA.

Jensen Huang tem enfatizado repetidamente que a lógica de negócios da IA ​​mudou. No passado, o poder computacional era frequentemente visto como um custo, mas agora os tokens são unidades que podem gerar receita. Contanto que os tokens possam gerar receita, o poder computacional se torna capacidade produtiva.

Se você quer ganhar dinheiro com tokens, dê uma olhada na fábrica de IA da NVIDIA. O NVIDIA DSX é um projeto e modelo de referência para construir e operar uma fábrica de IA. Baseado no Omniverse, ele usa gêmeos digitais para simular antecipadamente o layout, a energia, o resfriamento, a rede e a integração de sistemas de uma fábrica de IA.

Jensen Huang mencionou que o investimento em uma fábrica de IA de escala 1 GW poderia chegar a US$ 50 bilhões, US$ 60 bilhões ou até mesmo a US$ 80 bilhões ou US$ 100 bilhões. Quanto maior o custo de capital, mais críticas se tornam a velocidade de implantação, a eficiência de produção, a confiabilidade e o ciclo de vida do sistema.

RTX era para nossas GPUs, DGX era para nossos sistemas e, agora, DSX forma o núcleo de toda a infraestrutura.

O ecossistema NVIDIA DSX abrange um grande número de empresas de serviços em nuvem e infraestrutura de IA, incluindo CoreWeave, Nebius, Nscale, Naver Cloud e outras, e atende clientes como Cursor, World Labs, Revolut, Shopify e Google, ajudando todos os usuários corporativos a gerar receita usando tokens.

Além do hardware, outra área de foco é como as empresas podem realmente utilizar agentes inteligentes.

Jensen Huang categoriza as capacidades necessárias para que as empresas criem agentes inteligentes em quatro tipos: modelos, sistemas de agendamento, ferramentas e habilidades, e ambientes operacionais. Em termos de produtos, estes correspondem a Nemotron, OpenShelf, bibliotecas CUDA X e plataformas de IA.

O Nemotron 3 Ultra é um novo modelo aberto lançado recentemente. Ele adota o modelo de espaço de estados SSM e a arquitetura híbrida especializada MoE, com o objetivo de tornar o modelo mais rápido e reduzir o custo de inferência.

Segundo relatos in loco, em comparação com outros modelos abertos como Kimi K2.6, Qwen 3.5 e Zhipu GLM 5.1, ele é 5 vezes mais rápido e apresenta uma redução geral nos custos operacionais de cerca de 30%.

Jensen Huang também mencionou que o modelo Nemotron 3 Ultra, os scripts de treinamento e os dados de treinamento serão disponibilizados, permitindo que as empresas adicionem seus próprios dados do setor e conhecimento proprietário.

Ao final de seu discurso, Jensen Huang reconduziu toda a apresentação a uma estrutura central: modelo, infraestrutura, ferramentas, habilidades e ambiente operacional.

Este modelo pode ser executado na nuvem ou localmente dentro de uma empresa; pode ser executado em PCs, bem como em veículos, robôs, satélites, estações base de comunicação, fábricas e dispositivos de borda. Diferentes cenários usarão diferentes modelos, estruturas, ferramentas e ambientes de execução, mas o modelo de computação permanece o mesmo.

A nuvem precisa de Vera Rubin e fábricas de IA. Os PCs precisam do RTX Spark e da plataforma de agentes inteligentes do Windows. As empresas precisam do Nemotron, do OpenShelf e do conjunto de ferramentas CUDA X. Os automóveis precisam do Alpamayo, do Hyperion e de sistemas de condução autônoma. Os robôs humanoides precisam do Isaac Groot, do Thor, de simulação e de sistemas de geração de dados.

Ao assistirmos ao discurso completo juntos, percebemos que se trata de uma apresentação extensa de quase duas horas, e os tópicos abordados por Huang Renxun foram além do lançamento típico de um novo produto.

Os PCs com IA e o RTX Spark são projetados para dispositivos pessoais, levando agentes inteligentes para os desktops e residências dos usuários. O Vera Rubin é projetado para data centers, lidando com cargas de trabalho de agentes inteligentes em larga escala. As CPUs Vera resolvem problemas de latência quando os agentes inteligentes invocam ferramentas e acessam dados.

O DSX foi projetado para a construção de fábricas com IA, integrando sistemas de energia, refrigeração, redes e logística. As bibliotecas Nemotron, OpenShelf e CUDA X são para o desenvolvimento de agentes corporativos. O Cosmos 3 traz os agentes para o mundo físico. O Alpamayo 2 e o Hyperion são para direção autônoma, enquanto o Isaac Groot incorpora robôs humanoides na mesma lógica de plataforma.

A identidade central da NVIDIA costumava ser a de fornecedora de GPUs, depois tornou-se uma empresa de sistemas e agora está tentando se tornar uma empresa de infraestrutura de IA.

O que Huang Renxun quis deixar claro nesta conferência foi precisamente isto: a competição em IA expandiu-se dos modelos para um sistema computacional completo, abrangendo computadores pessoais, software empresarial, centros de dados e dispositivos físicos.

Por Mo Chongyu e Zhang Zihao

#Siga a conta oficial do iFanr no WeChat: iFanr (ID do WeChat: ifanr), onde você encontrará conteúdo ainda mais interessante o mais breve possível.