Nvidia RTX 4080: O que aprendemos com o GTC 2022

O CEO da Nvidia, Jensen Huang, acabou de encerrar sua primeira palestra do GTC de 2022 e, durante ela, o executivo anunciou a arquitetura Hopper de última geração da Nvidia. Ele está sendo lançado no H100, uma poderosa GPU restrita ao uso de data center, mas o anúncio também contém algumas dicas para o RTX 4080 e as placas gráficas de consumo de última geração da Nvidia.

A Nvidia não falou sobre a RTX 4080 na GTC, e não usará a arquitetura Hopper, pelo menos com base em rumores. Alguns anos atrás, antes do lançamento das placas gráficas da série RTX 30, rumores sugeriam que a Nvidia usaria a arquitetura Hopper para suas placas gráficas da série RTX 40. Agora, parece que a Nvidia lançará duas gerações em 2022: Hopper para o data center e Ada Lovelace para os consumidores. Mas isso não significa que não podemos obter informações dos anúncios.

Arquiteturas duplas

Duas placas gráficas em cima uma da outra.

Esta é apenas a segunda vez que a Nvidia divide seus produtos de consumidor e data center. Entre Pascal e Turing, a Nvidia introduziu a arquitetura Volta para data centers. Foi uma espécie de paliativo, permitindo que a Nvidia passasse para um pequeno processo de fabricação em seus produtos de data center em preparação para a próxima geração de produtos de consumo.

Isso mudou com a série RTX 30, onde a Nvidia unificou ambas as suas gamas de produtos sob a arquitetura Ampere. Tudo isso para dizer que não há muitos precedentes para o que a Nvidia está fazendo aqui. Esta é a primeira vez que realmente vimos duas arquiteturas da Nvidia ao vivo lado a lado.

Para Hopper, aprendemos que ele usará o processo de fabricação N4 da TSMC e que a Nvidia está visando a eficiência. O interessante é que há rumores de que a Nvidia usa o processo N5 da TSMC para o 4080, não o processo menor e mais eficiente que as GPUs Hopper estão usando.

N5 e N4 vivem na mesma família, mas N4 é um pouco mais eficiente que N5. Com base nos rumores que vimos sobre os enormes requisitos de energia para as placas gráficas da série RTX 40, o N5 parece mais provável para a faixa de consumo. Isso se baseia na sugestão dos leakers de que o RTX 4080 terá grandes problemas de eficiência .

Nvidia RTX 2080 Super em um PC para jogos.

Poderíamos estar vendo uma repetição da situação Pascal/Volta/Turing. A Nvidia parece estar liderando com o Hopper, apresentando uma arquitetura mais eficiente, a fim de configurar a geração após o RTX 4080. É possível que passemos para um processo menor até então, mas parece que as placas de consumo ainda ficarão atrás dos dados os centrais.

O processo de fabricação é o maior desenvolvimento, mas Hopper também tem algumas outras pistas.

Interconexão NVLink

Placa gráfica Hopper H100.

A Nvidia focou na escalabilidade com a quarta geração do NVLink. Esta é uma interconexão que só é relevante hoje no data center da Nvidia, mas Huang anunciou que está chegando aos clientes e parceiros.

Com o NVLink sendo aberto, a Nvidia diz que o objetivo é que outras empresas projetem chips semi-personalizados que funcionem com os produtos da Nvidia. Isso pode ser relevante para as próximas placas gráficas de consumo da Nvidia. Rumores sugerem que a AMD está adotando um design de módulo multichip (MCM) para placas gráficas RX 7000 , essencialmente combinando vários clusters de computação separados em um único chip.

A abertura do NVLink pode lançar as bases para a Nvidia fazer algo semelhante. Rumores sugerem que a AMD, pela primeira vez, ultrapassará a Nvidia com suas placas gráficas RX 7000, e isso pode ser devido ao design do MCM. Não está claro se o RTX 4080 usará um design MCM, mas o lançamento do Hopper sugere que não.

A última dica vem do H100 CNX, que é uma versão da GPU H100 que vem acoplada a um Nvidia ConnectX-7 SmartNIC. Isso é para reduzir a latência e melhorar a taxa de transferência para a GPU, eliminando os gargalos da CPU nos servidores.

Isso não é relevante para uma GPU de desktop, mas podemos ver uma abordagem semelhante com a RTX 4080. A Nvidia e a IBM se uniram para melhorar a largura de banda e o rendimento da memória conectando um SSD diretamente à GPU. Nós assumimos que isso era uma tecnologia distante, mas a GTC sugere que isso pode aparecer mais cedo ou mais tarde.

Em última análise, porém, o RTX 4080 ainda é um grande ponto de interrogação. Temos vazamentos sobre desempenho e eficiência, além de algumas dicas de Hopper, mas teremos que esperar até o lançamento do cartão para saber tudo sobre ele. Atualmente, há rumores de que será lançado neste outono, embora a Nvidia não tenha confirmado essa linha do tempo.