DLSS 4 pode ser incrível, e a Nvidia precisa que seja

junho 30, 2024 gurinho

GPU Nvidia GeForce RTX 4090. — Jacob Roach / Tendências Digitais

Não vou mentir: a Nvidia fez um bom trabalho com Deep Learning Super Sampling (DLSS) 3 , e quase não há como esse sucesso não ter contribuído para as vendas. O DLSS 3, com sua capacidade de transformar uma GPU de médio porte em algo muito mais capaz, é bastante inovador e é um forte ponto de venda, se é que já existiu.

O que vem a seguir? A série RTX 40 está quase no fim e em breve haverá novas GPUs para a Nvidia tentar vender – potencialmente sem o incentivo adicional da tecnologia de upscaling exclusiva da geração. O DLSS 3 será um ato difícil de seguir, e se os rumores sobre suas próximas placas gráficas se revelarem verdadeiros, a Nvidia pode realmente precisar do DLSS 4 para ser um sucesso estrondoso.

Quando a GPU pouco importa

RTX 4060 Ti em um fundo rosa. — Jacob Roach / Tendências Digitais

Como estamos à beira de uma nova geração de GPU, parece seguro olhar para trás, para a série RTX 40 e julgá-la pelo que era: não sem falhas, mas ainda assim enorme.

Seguindo os passos da série RTX 30, não houve muito que a Nvidia precisasse fazer para vender novas GPUs. Afinal, o mercado acabou de passar por uma enorme escassez. O padrão estava muito baixo – os consumidores queriam GPUs que fossem acessíveis, fizessem o trabalho e estivessem disponíveis sem muitos problemas. Supondo que esse fosse o critério para muitos jogadores, a Nvidia conseguiu cumprir dois dos três. A série RTX 40 é fácil de encontrar e algumas das GPUs desta geração são verdadeiramente impressionantes. Esse ponto que falta, porém – é aí que fica mais complicado.

A Nvidia lançou a série RTX 40 com duas GPUs que custam US$ 1.600 e US$ 1.200, respectivamente, e, estranhamente, a placa mais cara oferece melhor custo-benefício. As GPUs que se seguiram não foram todas fantásticas, com o fator desempenho por dólar ficando aquém do que você esperaria ver em uma nova geração. Algumas placas, como a RTX 4060 Ti , acabaram oferecendo quase o mesmo desempenho de suas contrapartes de última geração. Não é isso que você deseja ver em um produto de última geração.

Mas a Nvidia teve uma grande graça salvadora nesta geração, independentemente da placa específica: DLSS 3.

Temos muitos exemplos de como o DLSS 3 pode ser transformador para uma placa gráfica de nível básico a médio. Nos títulos que o suportam, o DLSS 3 oferece desempenho muito acima do esperado em algumas placas.

Benchmark do RTX 4070 Super em 4K com DLSS 3 habilitado. — Jacob Roach / Tendências Digitais

Vejamos o RTX 4070 Super, por exemplo. Quando tentamos rodar Cyberpunk 2077 em 4K com ray tracing habilitado, a GPU teve dificuldades, puxando apenas 19 quadros por segundo (fps). Ative o DLSS 3 e de repente ele estará rodando a suaves 77 fps. Para rodar esse jogo confortavelmente em 4K sem DLSS, você precisaria de uma GPU muito mais cara. Duas vezes mais caro.

A Nvidia adquiriu uma boa tecnologia com DLSS e foi inteligente nisso. Ele o bloqueou atrás de um acesso pago para acabar com todos os acessos pagos, tornando-o disponível apenas em uma única geração de GPUs. Embora a iteração anterior do DLSS esteja disponível para todos os proprietários de uma placa RTX, o DLSS 3 é exclusivo da série RTX 40. Que tal isso como incentivo para atualizar?

Dado que está muito longe do DLSS 2, não há como o DLSS 3 não ter sido suficiente para motivar alguns compradores a optar pela placa de última geração ou mesmo pela Nvidia. Pessoalmente, quando avaliei as diferenças entre o RTX 4080 e o AMD RX 7900 XTX, o DLSS 3 desempenhou um papel importante na minha decisão de ficar com a Nvidia.

Algumas placas da série RTX 40 são excelentes. Alguns são apenas recipientes para DLSS 3 e, graças ao poder da geração de frames da Nvidia, ainda são vendidos. O DLSS 3 fez com que a placa gráfica em si importasse muito menos, e a Nvidia pode ter que repetir isso para a série RTX 50 .

Especulações sombrias

Chips Nvidia Blackwell. — Verificação de notebook / Nvidia

Apesar de haver rumores de que a série RTX 50 será lançada ainda este ano, ainda não sabemos muito sobre ela que não seja baseada em especulações. Na verdade, além do fato de a geração se chamar Blackwell, não tenho certeza se a Nvidia alguma vez confirmou alguma coisa. Então, recorremos aos vazadores para nos fornecer informações que podem ou não ser verdadeiras, e nem tudo é bom.

Os vazamentos mais cobiçados em relação à série RTX 50 são sobre as especificações, já que é um pouco cedo para esperar uma visão geral do preço. Para esse fim, o vazamento mais recente vem de kopite7kimi, e Law Is Dead de Moore apresentou algumas especulações de sua autoria.

O vazador revelou a suposta contagem de multiprocessadores de streaming (SM) para cada GPU, variando do GB202 topo de linha ao GB207 básico, mostrando o número de clusters de processamento gráfico (GPCs) multiplicados por clusters de processamento de textura (TPCs). Dobrar esse número nos dá o número total de SMs. Isso, por sua vez, nos diz quantos núcleos CUDA cada GPU possui, e é um bom indicador de como ela será comparada aos seus antecessores.

Cálculos à parte, o que estamos potencialmente vendo na série RTX 50 parece uma repetição da série RTX 40. A GPU superior, GB202, deve oferecer uma melhoria massiva em todas as áreas, com 192 SMs relatados (contra 142 SMs no AD102), ou uma melhoria de 33% nos SMs. Passando para o GB203, que supostamente foi reduzido significativamente e pode aparecer no RTX 5080, há apenas uma melhoria de 5%.

A GPU GB205 é onde tudo fica realmente arriscado. Não é apenas que não há aumento de SM – na verdade há um downgrade de 17% em comparação com AD104 (não há GB204 nesta geração), de 60 SMs para 50. Em seguida, diz-se que GB206 ostenta exatamente a mesma contagem de SM, enquanto GB207 mais uma vez apresenta uma diminuição de 17% nos SMs: de 24 para 20.

Se isso for confirmado, estamos observando melhorias sutis em todas as áreas, além do RTX 5090. Mesmo assim, não está claro quanto do chip a placa de vídeo realmente utilizará; o RTX 4090 não aproveitou toda a potência do chip AD102, então a contagem final de SM pode ser menor no produto final.

GB202 12*8 GDDR7 de 512 bits
GB203 7*6 GDDR7 de 256 bits
GB205 5*5 GDDR7 de 192 bits
GB206 3*6 GDDR7 de 128 bits
GB207 2*5 GDDR6 de 128 bits
— kopite7kimi (@kopite7kimi) 11 de junho de 2024

É claro que há mais benefícios para a nova geração do que apenas um aumento no poder computacional. A Lei de Moore está morta especula que o chip GB203 (RTX 5080) deve oferecer um aumento de até 10% na velocidade do clock, melhores instruções por bloqueio (IPC) e um grande aumento na largura de banda. Este último decorre do fato de que a Nvidia está mudando para uma memória GDDR7 mais rápida, então isso por si só deve ajudar muito.

Essas previsões são mais otimistas. O YouTuber estima um aumento de 15-30% em todos os níveis abaixo do RTX 5090 e, para o carro-chefe, podemos ver um aumento de até 60%. Porém, isso ainda é menos do que o RTX 3090 em relação ao RTX 4090, e um aumento de 15% pode não ser suficiente para atrair novos compradores. Depende do preço e, embora a Nvidia pareça ter aprendido a lição com as placas RTX 40 Super , não espero que a série RTX 50 seja barata.

Se as previsões se concretizarem e conseguirmos novas GPUs com uma atualização não tão significativa no desempenho dos jogos, mas com um aumento de preço, a Nvidia precisará de outro ponto de venda. Será necessário DLSS 4 e deve ser excelente.

O que podemos esperar do DLSS 4?

DLSS 3 da Nvidia em Cyberpunk 2077. — Nvidia

Assim como a série RTX 50, a próxima geração da tecnologia de upscaling de IA da Nvidia está repleta de mistério. Sabemos que é muito provável que isso aconteça, mas será este ano? O que isso trará? Temos que recorrer à especulação mais uma vez, mas desta vez, ela é alimentada pelo próprio Jensen Huang, CEO da Nvidia.

Em uma sessão de perguntas e respostas pós-Computex (compartilhada por More Than Moore ), Huang falou sobre o uso de IA em jogos. Todos sabemos que a Nvidia adora IA e, com coisas como o G-Assist no horizonte, só veremos mais IA nos jogos daqui para frente.

“No futuro, vamos até gerar texturas e objetos, e os objetos podem ser de qualidade inferior e podemos torná-los mais bonitos. Também geraremos personagens nos jogos – pense em um grupo de seis pessoas, duas podem ser reais e as outras podem ser IAs de uso de longo prazo”, disse Huang.

O uso esmagador da IA continuou ao longo de sua resposta. Ele acrescentou: “Os jogos serão feitos com IA, eles terão IA dentro e você ainda fará com que o PC se torne IA usando o G-Assist. Você pode usar o PC como um assistente de IA para ajudá-lo no jogo.”

A resposta de Huang não menciona o DLSS, mas foi uma resposta a uma pergunta sobre o DLSS e o Nvidia ACE. Mas esses recursos acabarão no DLSS 4? Eles só serão totalmente realizados a tempo do DLSS 5? Eles se tornarão algo completamente diferente? É muito cedo para dizer, mas está claro que a Nvidia espera fazer da IA a base da sua experiência de jogo.

Gerar ativos no jogo em vez de apenas frames pode não parecer algo que possa melhorar o desempenho, mas pode. Isso mudará parte do trabalho dos núcleos CUDA para núcleos tensores, que são feitos para lidar com cargas de trabalho de IA e aprendizado de máquina. Como resultado, a GPU deve ter mais recursos disponíveis para simplesmente focar no desempenho, enquanto os núcleos tensores cuidam do lado da IA.

A geração de ativos é mais um passo em relação à geração de frames que conhecemos do DLSS 3. Não são apenas os ativos do jogo que a Nvidia espera gerar, mas também os NPCs, presumivelmente alimentados pela Nvidia ACE para trazê-los à vida. Se metade dessas coisas chegar ao DLSS 4, a Nvidia pode ter uma verdadeira joia em mãos e já está se aproximando. O DLSS 3 é agora, na verdade, DLSS 3.7 ; a versão 3.5 nos trouxe a reconstrução de raios , enquanto a 3.7 ofereceu mais atualizações menores.

Compatibilidade com versões anteriores? Provavelmente não

RTX4090. — Jacob Roach / Tendências Digitais

Vamos supor que o DLSS 4 será lançado em breve – dentro de um ano (e isso se baseia apenas na suposição de que será lançado junto com a série RTX 50, então não me cite sobre isso). Vamos supor também que será excelente. O DLSS 4 será compatível com versões anteriores da série RTX 40? Esse é um trecho em que não estou disposto a apostar. Deixando de lado todas as considerações de hardware, acho difícil acreditar que a Nvidia possa perder a oportunidade de aproveitar todo o seu potencial do DLSS 4 assim que chegar ao mercado.

A AMD tem uma abordagem diferente para a Nvidia. Sua tecnologia de upscaling está disponível em GPUs de todos os fornecedores, embora o FSR 3.0 esteja sofrendo uma adoção muito lenta. Enquanto isso, o DLSS 3 está lenta mas seguramente abrindo caminho para cada vez mais jogos. O DLSS 4 pode zerar o contador e começar do zero, aparecendo em títulos selecionados antes de se tornar mais difundido.

De uma forma ou de outra, para impressionar as massas, a Nvidia pode precisar de uma jogada ousada neste momento – um aumento de 15% de geração em geração nos jogos não será suficiente quando houver outras opções disponíveis. Deveria haver uma concorrência bastante acirrada do RDNA 4 da AMD na faixa intermediária, então placas como a RTX 5070 poderiam usar a ajuda extra para justificar seus preços.

Se o DLSS 4 chegar a tempo, não ficarei surpreso se ele se tornar um RTX 50 exclusivo, trabalhando duro nos bastidores para transformar GPUs “meh” em algo bastante brilhante. Teremos que esperar para ver.