Revisão da Nvidia GeForce RTX 4090: a melhor maneira de desperdiçar US $ 1.600
A RTX 4090 é um completo desperdício de dinheiro e a placa gráfica mais poderosa já fabricada. É certo que isso o torna um produto difícil de avaliar, especialmente considerando quanto o jogador médio de PC pretende gastar em uma atualização para seu sistema.
Estreando a nova arquitetura Ada Lovelace da Nvidia, o RTX 4090 foi envolto em controvérsia e citado como o garoto-propaganda do aumento dos preços das GPUs . Por mais que custe, ele oferece desempenho, especialmente com os aprimoramentos fornecidos pelo DLSS 3. Você deve economizar seus centavos e vender seu carro por essa besta de GPU? Provavelmente não. Mas é definitivamente uma vitrine empolgante de até onde essa tecnologia pode realmente ir.
Revisão de vídeo
Especificações da Nvidia RTX 4090
Como mencionado, o RTX 4090 apresenta a nova arquitetura Ada Lovelace da Nvidia, bem como o processo de fabricação N4 mais eficiente da fabricante de chips TSMC. Embora seja impossível comparar o RTX 4090 especificação por especificação com a geração anterior, podemos obter alguns insights sobre o que a Nvidia priorizou ao projetar Ada Lovelace.
O foco principal: velocidades de clock. O RTX 3090 Ti atingiu cerca de 1,8 GHz, mas o RTX 4090 mostra a eficiência do novo nó com um clock de impulso de 2,52 GHz. Isso é com a mesma potência da placa de 450 watts, mas está rodando em mais núcleos. O RTX 3090 Ti tinha apenas 11.000 núcleos CUDA, enquanto o RTX 4090 oferece 16.384 núcleos CUDA.
RTX 4090 | RTX 3090 | |
Arquitetura | Ada Lovelace | Ampere |
Nó de processo | 5nm TSMC | 8nm Samsung |
Núcleos CUDA | 16.384 | 10.496 |
Núcleos de rastreamento de raios | 144 3ª geração | 82 2ª geração |
Núcleos tensores | 576 4ª geração | 328 3ª geração |
Velocidade de clock base | 2235MHz | 1394MHz |
Aumente a velocidade do clock | 2520MHz | 1695MHz |
VRAM GDDR6X | 24 GB | 24 GB |
Velocidade da memória | 21 Gbps | 19,5 Gbps |
Largura do ônibus | 384 bits | 384 bits |
TDP | 450 W | 350 W |
É difícil dizer o quanto esses núcleos extras são importantes, especialmente para jogos. Abaixo da pilha, o RTX 4080 de 16 GB tem um pouco mais da metade dos núcleos que o RTX 4090, enquanto o RTX 4080 de 12 GB tem ainda menos. As velocidades de clock permanecem altas, mas as especificações da família RTX 40-series agora sugerem que a contagem de núcleos aumentada não será um grande ponto de venda, pelo menos para jogos.
Sintético e renderização
Antes de entrar no conjunto completo de benchmarks, vamos dar uma olhada no desempenho de alto nível. Port Royal e Time Spy da 3D Mark mostram como o mais recente carro-chefe da Nvidia se adapta bem, mostrando um ganho de 58% sobre o RTX 3090 Ti em Time Spy, bem como um aumento de 102% sobre o RTX 3090 em Port Royal.
É importante notar que o 3DMark não é a melhor maneira de avaliar o desempenho, pois influencia muito mais sua CPU do que a maioria dos jogos (especialmente em 4K). No caso do RTX 4090, porém, o 3DMark mostra bem o dimensionamento. Na verdade, meus resultados de jogos reais são na verdade um pouco mais altos do que esse benchmark sintético sugere, pelo menos fora do ray tracing.
Também testei o Blender para avaliar algumas tarefas de criação de conteúdo com o RTX 4090, e as melhorias são surpreendentes. O Blender é acelerado pelos núcleos CUDA da Nvidia, e o RTX 4090 parece particularmente otimizado para esses tipos de cargas de trabalho, com mais que o dobro da pontuação do RTX 3090 e RTX 3090 Ti nas cenas Monster e Junkshop, e quase o dobro em a cena da sala de aula. As GPUs da AMD, que não possuem CUDA, não chegam nem perto.
Desempenho de jogos 4K
Para os pedaços suculentos. Todos os meus testes foram feitos com um Ryzen 9 7950X e 32GB de memória DDR5-6000 em uma bancada de testes ao ar livre. Mantive a BAR redimensionável ligada durante os testes ou, no caso de GPUs AMD, Smart Access Memory.
O RTX 4090 é um monstro fisicamente, mas também é um monstro quando se trata de desempenho em jogos 4K. No meu conjunto de testes, excluindo Bright Memory Infinite e Horizon Zero Dawn, para os quais tenho dados incompletos, o RTX 4090 foi 68% mais rápido que o RTX 3090 Ti. Comparado com o RTX 3090, você está vendo um aumento de quase 89%.
Esse é um grande salto, muito maior do que o aumento de 30% que vimos geração a geração com o lançamento do RTX 3080 . E nenhum desses números é fator de upscaling. Este é um desempenho bruto, incluindo ray tracing, e o RTX 4090 está mostrando uma grande vantagem em relação à geração anterior.
Talvez a exibição mais impressionante tenha sido o Cyberpunk 2077. O RTX 4090 é pouco mais de 50% mais rápido que o RTX 3090 Ti em 4K com configurações no máximo, o que é bastante impressionante. É o fato de que o RTX 4090 quebra 60 quadros por segundo (fps) que se destaca. Mesmo as placas gráficas mais poderosas da geração anterior não conseguiam passar de 60 fps sem a ajuda do Deep Learning Super Sampling (DLSS) . O RTX 4090 pode quebrar essa barreira ao renderizar cada pixel, e faz isso com bastante vantagem.
Gears Tactics também mostra o poder do RTX 4090, vencendo o RTX 3090 Ti com 73% de vantagem. Em um título Vulkan como Red Dead Redemption 2, os ganhos são menores, mas o RTX 4090 ainda conseguiu uma vantagem de 52% com base nos meus testes. Este é um grande salto geracional no desempenho, embora ainda esteja abaixo do que a Nvidia prometeu originalmente.
A Nvidia comercializou o RTX 4090 como “duas a quatro vezes mais rápido” que o RTX 3090 Ti, e isso não é verdade. É muito mais rápido que o top dog anterior, mas a afirmação da Nvidia só faz sentido quando você considera o DLSS 3. O DLSS 3 é impressionante, e falarei sobre ele mais tarde nesta análise. Mas não está em todos os jogos e ainda precisa de algum trabalho. Felizmente, com o desempenho bruto do RTX 4090, o DLSS é mais "bom de ter" e menos "necessário".
Em títulos promovidos pela AMD como Assassin's Creed Valhalla e Forza Horizon 5, o RTX 4090 ainda mostra seu poder, embora agora contra o RX 6950 XT da AMD . Em Valhalla em 4K, o RTX 4090 conseguiu uma vantagem de 63% sobre o RX 6950 XT. As margens foram mais apertadas no Forza Horizon 5, que parece escalar muito bem com as ofertas atuais da AMD. Mesmo com menos vantagem, porém, o RTX 4090 está 48% à frente do RX 6950 XT.
Essas comparações são impressionantes, mas o RTX 4090 não está em pé de igualdade com seus concorrentes. Por US $ 1.600, o mais recente carro-chefe da Nvidia é significativamente mais caro do que as GPUs mais caras disponíveis hoje. Com o desempenho que o RTX 4090 está oferecendo, na verdade, é um negócio melhor do que um RTX 3090 ou RTX 3090 Ti mais barato.
Em termos de custo por quadro, você está olhando para o mesmo preço de um RTX 3080 10GB por US$ 700. Esta não é a melhor maneira de avaliar o valor – assume que você ainda tem dinheiro extra para gastar no RTX 4090 em primeiro lugar, e não leva em conta recursos como DLSS 3 – mas, por mais louco que pareça, US $ 1.600 é um preço bastante justo para o desempenho 4K que o RTX 4090 oferece.
Desempenho de jogos em 1440p
Se você está comprando o RTX 4090 para 1440p, está desperdiçando seu dinheiro (leia nosso guia sobre as melhores placas de vídeo 1440p ). Embora ainda proporcione uma grande melhoria em relação à geração anterior, as margens são muito menores. Você está vendo um aumento de 48% em relação à RTX 3090 Ti e um aumento de 68% em relação à RX 6950 XT. Esses ainda são grandes saltos geracionais, mas o RTX 4090 realmente brilha em 4K.
Você começa a se tornar um pouco limitado à CPU em 1440p, e se descer para 1080p, os resultados são ainda mais apertados. E, francamente, o desempenho extra em 1440p simplesmente não se destaca como em 4K. No Gears Tactics, por exemplo, o RTX 4090 é 36% mais rápido que o RTX 3090 Ti, abaixo dos 73% de liderança que a placa mais recente da Nvidia mostrou em 4K. As taxas de quadros reais também são menos impressionantes. Claro, o RTX 4090 está muito à frente do RTX 3090 Ti, mas é difícil imaginar que alguém precise de mais de 200 fps no Gears Tactics quando uma GPU que custa US $ 500 mais barata já está acima de 160 fps.
Em 4K, o RTX 4090 atinge grandes marcos – acima de 60 fps no Cyberpunk 2077 sem DLSS, perto da marca de 144Hz para monitores de alta taxa de atualização em Assassin's Creed Valhalla, etc. Em 1440p, o RTX 4090 certamente tem um número maior, mas esse número é muito mais impressionante no papel do que na tela real.
Traçado de raios
A Nvidia é a campeã do ray tracing desde a geração Turing, mas Ada Lovelace é a primeira geração em que está passando por uma grande reformulação. No coração do RTX 4090 está um núcleo de ray tracing redesenhado que aumenta o desempenho e introduz o Shader Execution Reordering (SER). O SER é basicamente uma maneira mais eficiente de processar operações de ray tracing, permitindo que sejam executadas à medida que a energia da GPU se torna disponível, em vez de em uma linha reta, onde gargalos podem ocorrer. Também requer que você ative o agendamento de GPU acelerado por hardware no Windows.
E funciona. As margens com ray tracing geralmente são muito mais finas, mas o RTX 4090 na verdade mostra ganhos maiores com o ray tracing ativado. No Cyberpunk 2077, por exemplo, o RTX 4090 é quase 71% mais rápido que o RTX 3090 Ti com a predefinição Ultra RT. E isso antes de fatorar o DLSS. As GPUs da AMD, que estão muito mais atrasadas no desempenho do ray tracing, mostram diferenças ainda maiores. O RTX 4090 é 152% mais rápido que o RX 6950 XT neste benchmark.
Da mesma forma, o Metro Exodus Enhanced Edition mostrou um aumento de 80% para o RTX 4090 sobre o RTX 3090 Ti, e o Bright Memory Infinite mostrou o RTX 4090 93% à frente do RTX 3090. A afirmação da Nvidia de “duas a quatro vezes mais rápido” que o RTX 3090 Ti pode não aguentar sem DLSS 3, mas o desempenho do ray tracing fica muito mais próximo dessa marca.
E assim como o desempenho em 4K, o RTX 4090 mostra melhorias de desempenho que realmente fazem a diferença quando o ray tracing está ativado. No Bright Memory Infinite, o RTX 4090 é a diferença entre tirar vantagem de uma alta taxa de atualização e quase quebrar 60 fps. E no Cyberpunk 2077, o RTX 4090 é literalmente a diferença entre jogável e não jogável.
DLSS 3 testado
O DLSS tem sido um recurso superstar para as GPUs RTX nas últimas gerações, mas o DLSS 3 é uma grande mudança para a tecnologia. Ele introduz a geração de quadros AI de fluxo óptico , que se resume ao modelo AI gerando um quadro completamente único a cada outro quadro. Teoricamente, isso significa que mesmo um jogo 100% limitado pela CPU e não veria nenhum benefício com uma resolução mais baixa terá o dobro do desempenho.
Essa não é bem a situação no mundo real, mas o DLSS 3 ainda é muito impressionante. Comecei com o teste DLSS 3 do 3DMark, que apenas executa o benchmark Port Royal com o DLSS desligado e ligado. Meu objetivo era levar o recurso o mais longe possível, então configurei o DLSS para o modo Ultra Performance e a resolução para 8K. Esta é a melhor vitrine do que o DLSS 3 é capaz, com a tecnologia aumentando a taxa de quadros em 578%. Isso é insano.
Em jogos reais, os ganhos não são tão gritantes, mas o DLSS 3 ainda é impressionante. A Nvidia forneceu uma versão inicial de A Plague Tale: Requiem, e o DLSS conseguiu aumentar a taxa de quadros média em 128% em 4K com as configurações no máximo. E isso foi com o modo Auto para DLSS. Com predefinições de qualidade de imagem mais agressivas, os ganhos são ainda maiores.
A Plague Tale: Requiem expõe um aspecto importante do DLSS 3, no entanto: incorre em uma quantidade razoável de sobrecarga. DLSS 3 é duas partes. A primeira parte é DLSS Super Resolution, que é o mesmo DLSS que você viu nas gerações RTX anteriores. Ele continuará a funcionar com GPUs RTX série 20 e série 30, para que você ainda possa usar DLSS 3 Super Resolution em jogos com placas de geração anterior.
A geração de quadros DLSS é a segunda parte e é exclusiva das GPUs da série RTX 40. A IA gera um novo quadro a cada dois quadros, mas isso é computacionalmente caro. Por causa disso, o Nvidia Reflex é forçado sempre que você ativa o Frame Generation e não pode desativá-lo.
Se você raciocinar sobre como a geração de quadros funciona, ela deve fornecer o dobro da taxa de quadros do que você está obtendo apenas com a super resolução, mas esse não é o caso. Como você pode ver no Cyberpunk 2077 abaixo, o resultado da geração de quadros significa que a GPU está renderizando apenas cerca de 65 quadros – o restante vem da IA. Com a Super Resolução por si só, esse resultado aumenta em quase 30 fps. Essa é a sobrecarga de geração de quadros DLSS em jogo.
Obviamente, a geração de quadros oferece o melhor desempenho, mas não considera a super resolução como obsoleta. Embora pareça que a Geração de Quadros dobra as taxas de quadros DLSS, na verdade está muito mais perto da Super Resolução por conta própria na prática.
Você não pode falar sobre DLSS além da qualidade de imagem e, embora o DLSS 3 seja impressionante, ainda precisa de algum trabalho no departamento de qualidade de imagem. Como todos os outros quadros são gerados na GPU e enviados diretamente para a tela, ele não pode ignorar elementos como o HUD. Esses são parte do quadro gerado e estão prontos para artefatos, como você pode ver em Cyberpunk 2077 abaixo. O marcador de missão em movimento engasga à medida que se move pela tela, com o modelo de IA sem saber ao certo onde colocar pixels à medida que o elemento se move. Normalmente, os elementos HUD não fazem parte do DLSS, mas a geração de quadros significa que você precisa incluí-los.
Esse mesmo comportamento também aparece na cena real. Em A Plague Tale: Requiem, por exemplo, você pode ver como correr pela grama produz uma fina camada de purgatório de pixels enquanto a IA luta para descobrir onde colocar a grama e onde colocar as pernas. Da mesma forma, Port Royal mostrou bordas suaves e muita instabilidade de pixel.
Esses artefatos são melhor vistos em movimento, então capturei várias imagens em 4K a 120 fps, que você pode assistir abaixo. Diminuí as comparações de DLSS em 50% para que você possa ver o maior número possível de quadros, mas lembre-se da compactação do YouTube e do fato de que é difícil obter uma comparação de qualidade verdadeira ao capturar o jogo. É melhor ver na carne.
Durante a reprodução, as penalidades de qualidade de imagem incorridas pelo DLSS 3 são facilmente compensadas pelos ganhos de desempenho que ele oferece. Mas a geração de quadros não é uma configuração que você deve sempre ativar. Está no seu melhor quando você está empurrando o ray tracing e todos os sinos e assobios visuais. Espero que melhore também. Estou confiante de que a Nvidia continuará a refinar o aspecto Frame Generation, mas no momento, ainda mostra algumas bordas desgastadas.
Potência e térmicas
Antes do anúncio do RTX 4090, oboato correu desenfreado com especulações sobre demandas obscenas de energia. O RTX 4090 consome muita energia – 450W para a Founder's Edition e ainda mais para placas de parceiros como o Asus ROG Strix RTX 4090 – mas não é mais do que o RTX 3090 Ti atraiu. E com base em meus testes, o RTX 4090 realmente desenha um pouco menos.
O gráfico abaixo mostra o consumo máximo de energia que medi durante o teste. Esta não é a potência máxima – um teste de estresse dedicado levaria o RTX 4090 ainda mais – mas os jogos não são testes de estresse e você nem sempre atingirá a potência máxima (ou mesmo chegará perto). Comparando outros modelos da Founder's Edition, o RTX 4090 consumiu cerca de 25W a menos que o RTX 3090 Ti. As placas parceiras com overclock vão subir mais alto, portanto, tenha isso em mente.
Para térmicas, o RTX 4090 atingiu um pico de 64 graus Celsius no meu conjunto de testes, que é exatamente onde deveria ficar. A RTX 3080 Ti menor, com suas velocidades de clock e contagem de núcleos aumentadas, mostrou os resultados térmicos mais altos, chegando a 78 graus. Todos esses números foram coletados em um banco de testes ao ar livre, portanto, as temperaturas serão mais altas quando o RTX 4090 estiver no estojo.
Você deve comprar a Nvidia RTX 4090?
Se você tem US$ 1.600 para gastar em uma GPU, sim, você deve comprar a RTX 4090. A maioria das pessoas não tem US$ 1.600 para gastar em uma placa de vídeo, e é aí que a RTX 4090 fica complicada.
Posso mostrar gráfico após gráfico mostrando o quão poderoso é o RTX 4090, como US $ 1.600 é um preço relativamente justo a ser pedido e como o DLSS 3 melhora massivamente o desempenho dos jogos. Mas o fato é que o RTX 4090 custa mais do que muitos PCs para jogos completos. Isso está longe de ser a placa gráfica para a maioria das pessoas. Não é nem a placa gráfica para a maioria dos entusiastas.
O RTX 4090 vale a pena, mas isso não significa que você deva comprá-lo . Ainda temos uma visão muito incompleta da próxima geração – os modelos RTX 4080 estão chegando em novembro, e a AMD deve lançar suas GPUs RX 7000 em 3 de novembro. Para a maioria das pessoas, a melhor opção é esperar. Não estamos indo para outrafalta de GPU , então não há razão para acreditar que o RTX 4090 se tornará mais caro quando essas placas forem lançadas.
Se você está na pequena porcentagem de pessoas que querem o melhor simplesmente porque é o melhor, o RTX 4090 está segurando firmemente esse título. A RTX 4090 é muito mais cara do que o jogador médio de PC deseja gastar, mas, novamente, é muito mais do que uma placa gráfica média.