A NVIDIA é conhecida por lançar uma arquitetura de placa gráfica de nova geração a cada dois anos. Em 2018, lançou o chip Turing para as GPUs GTX série 16 e RTX série 20. Então, em 2020, introduziu os chips Ampere para a GPU RTX 3000.
E, como esperado, durante a NVIDIA GPU Technology Conference em setembro de 2022, o CEO da NVIDIA, Jensen Huang finalmente anunciou a microarquitetura Ada Lovelace que alimentará a 3ª geração do RTX GPU.
Então, quais melhorias a microarquitetura Ada Lovelace traz para a GPU RTX 4000?
1. Um nó de processo totalmente novo
A microarquitetura Ada Lovelace é baseada na tecnologia 4nm N4 da TSMC, tornando-a metade do tamanho do chip Ampere da geração anterior baseado no processo de 8nm da Samsung. Esse nm menor trazido pela melhoria no processo do nó permite que a série RTX 4000 forneça mais energia com eficiência.
Isso significa que mesmo as variantes intermediárias que a NVIDIA lançará no futuro podem competir com os chips da série 30 de primeira linha, como o 3090 Ti.
2. Reordenação da Execução do Shader
Por causa de sua estrutura paralela, uma GPU é ótima para usar vários núcleos de seus processadores para lidar com a mesma tarefa. No entanto, o traçado de raios é completamente diferente da renderização de cenas. Isso ocorre porque os raios de luz são refletidos em todos os lugares, exigindo cálculos diferentes para cada superfície que atinge e em cada direção que segue. Isso significa que as GPUs são menos eficientes ao processar muitos shaders diferentes.
Mas com Shader Execution Reordering (SER), o chip Lovelace pode reprogramar sua carga de trabalho, garantindo que shaders semelhantes sejam processados juntos. Isso permite que os multiprocessadores de streaming funcionem com mais eficiência, pois trabalham simultaneamente nos mesmos dados.
3. DLSS 3.0
O RTX é uma tarefa que consome muitos recursos, especialmente se você estiver trabalhando com resoluções mais altas, como 4K e superior. É por isso que a NVIDIA desenvolveu DLSS (Super amostragem de aprendizado profundo). A tecnologia DLSS usa IA para prever o próximo pixel, ajudando a reduzir a carga de trabalho na GPU.
Mas com o DLSS 3.0 da arquitetura Ada Lovelace, a NVIDIA expande a previsão de pixels para quadros. Isso permite que a GPU preveja o próximo quadro, mesmo sem olhar para os dados da imagem ainda a serem renderizados. Isso melhora o desempenho de jogos pesados de GPU e CPU, que Huang afirma ser até quatro vezes melhor do que a renderização de força bruta.
4. Núcleos tensores
A NVIDIA está tentando se destacar no espaço de computação de IA e mostra isso em seu chip de última geração. A microarquitetura Ada Lovelace usa 4ª geração Núcleos tensores, capaz de fornecer 1.400 Tensor TFLOPs - mais de quatro vezes mais rápido que o 3090 Ti, que tinha apenas 320 Tensor TFLOPs.
Essa nova geração de Tensor Cores é provavelmente o motivo pelo qual o DLSS 3.0 tem um desempenho muito melhor do que suas iterações anteriores. Também pode ser por isso que os chips comparativamente inferiores da série 4000 superam os modelos de primeira linha das GPUs da série 3000.
5. Potência e eficiência aprimoradas
A NVIDIA afirma que os chips Ada são duas vezes mais rápidos para jogos rasterizados e até quatro vezes mais rápidos para jogos com rastreamento de raio. Além disso, eles dizem que seus chips mais recentes oferecem mais que o dobro do desempenho para a mesma classificação de potência.
E por causa dessas melhorias, você pode fazer overclock das GPUs Lovelace além de 3 GHz - mas isso vem com o preço de um consumo colossal de energia: até 450 watts para o RTX 4090.
No entanto, essas melhorias também podem ser o motivo pelo qual o RTX 4070 é tão poderoso quanto o RTX 3090 Ti, e o RTX 4090 oferece o dobro da potência do 3090 Ti no mesmo consumo de energia.
O coração das GPUs da série RTX 4000
A microarquitetura Ada Lovelace é outro salto em potência, desempenho e eficiência da GPU da NVIDIA. E como esse chip é o coração das GPUs de consumidor da série RTX 4000, esperamos que essas placas de entrada ofereçam desempenho excepcional.
No entanto, essas são apenas afirmações teóricas até colocarmos as mãos no RTX 4090 em 12 de outubro de 2022 e no RTX 4080 no mês seguinte. Portanto, estamos prendendo a respiração e esperando para ver os benchmarks reais quando as unidades de varejo chegarem às prateleiras das lojas.