TECH

AMD & NVIDIA nästa generations flaggskepps-GPU:er Detaljerad: RDNA 3 Radeon RX 7900 XT med 15360 kärnor, Ada Lovelace GeForce RTX 4090 med 18432 kärnor

AMD RDNA 3 & NVIDIA Ada Lovelace GPU-driven nästa generations flaggskepp Radeon RX 7900 XT & GeForce RTX 4090 grafikkort Detaljerade

Ryktade specifikationer för nästa generations AMD RDNA 3-drivna Radeon RX 7900 XT & NVIDIA Ada Lovelace-drivna GeForce RTX 4090-grafikkort har återigen detaljerats. Ryktena kommer från greymon55 som aktivt har publicerat detaljer om kommande hårdvara som CPU:er och GPU:er på sitt Twitter-flöde ett tag nu.

AMD RDNA 3 & NVIDIA Ada Lovelace GPU-driven nästa generations flaggskepp Radeon RX 7900 XT & GeForce RTX 4090 grafikkort Detaljerade

De AMD RDNA 3-drivna Navi 31 och Ada Lovelace-drivna AD102 GPU:erna förväntas ge enorma prestandaförbättringar och kommer också att vara de mest strömkrävande chipsen som någonsin gjorts. Medan NVIDIA siktar på ett monolitiskt tillvägagångssätt med sin Ada Lovelace-arkitektur, kommer AMD att använda en komplett MCM-design som man redan har tagit ledningen i med lanseringen av den CDNA 2-drivna MI200-serien "Aldebaran". AMD kommer att utnyttja samma MCM-teknik för konsument- och spel-GPU:er nu. Så låt oss prata om de senaste ryktade specifikationerna som vi har fått från läckaren:

AD102
5 nm TSMC
144SM 18432CUDA
384bit 24G GDDR6X 21Gbps?
2.3~2.5GHz?
85~92T FP32?

- Greymon55 (@greymon55) November 9, 2021

AMD Radeon RX 7900 XT grafikkort – RDNA 3-driven Navi 31 flaggskepps-GPU

AMD Navi 31 GPU, flaggskeppet RDNA 3-chip, skulle driva nästa generations Radeon RX 7900 XT-grafikkort. Vi har hört att AMD kommer att släppa CU (Compute Units) till förmån för WGP (Work Group Processors) på sin nästa generations RDNA 3 GPU:er. Eftersom Navi 31 är en MCM GPU kommer den att ha två nyckel-IP:er, en GCD (Graphics Core Die) baserad på TSMC:s 5nm process och en MCD (Multi-Cache Die) baserad på TSMC 6nm processnoden. Tidigare rykten tyder på att AMD har har redan tappat ut sin Navi 31 GPU-matris.

Navi 31 GPU-konfigurationen som visas här har två GCD:s (Graphics Core Die) och en enda MCD (Multi-Cache Die). Varje GCD har 3 Shader Engines (6 totalt) och varje Shader Engine har 2 Shader Arrays (2 per SE / 6 per GCD / 12 totalt). Varje Shader Array består av 5 WGPs (10 per SE / 30 per GCD / 60 totalt) och varje WGP har 8 SIMD32-enheter med 32 ALU:er (40 SIMD32 per SA / 80 per SE / 240 per GCD / 480 totalt). Dessa SIMD32-enheter utgör tillsammans 7,680 15,360 kärnor per GCD och totalt XNUMX XNUMX kärnor.

Prestandamässigt förväntas grafikprocessorn ha en klockhastighet på 2.4 – 2.5 GHz, vilket sätter dess teoretiska prestanda på cirka 75 TFLOPs (FP32). Detta är en galen förbättring på 226 % jämfört med ett Radeon RX 6900 XT grafikkort.

Navi 31 (RDNA 3) MCD kommer att länkas till de dubbla GCD:erna via en nästa generations Infinity Fabric-interconnect och har 256-512 MB Infinity Cache. Varje GPU bör också ha 4 minnesanslutningslänkar (32-bitars). Det är totalt 8 32-bitars minneskontroller för ett 256-bitars bussgränssnitt. Det anges att kortet kommer att ha upp till 32 GB GDDR6-minne som körs med 18 Gbps pin-hastigheter och som ger upp till 576 GB/s bandbredd. Ett annat rykte som dök upp nyligen tyder på att AMD kommer att använda 3D Infinity Cache-teknik på sin RDNA 3-linje som kommer att integrera den nya cachen i vertikala stackar på GPU:erna, liknande hur Vermeer-X-chips kommer att stapla L3-cache över CCD:n.

AMD RDNA GPU (Generationsjämförelse) Preliminär:

GPU-namn Navi 10 Navi 21 Navi 31
GPU-process 7nm 7nm 5nm (6nm?)
GPU-paket Monolitisk Monolitisk MCD (Multi-Chiplet Die)
Shader-motorer 2 4 6
GPU WGP 20 40 30 (per MCD)
60 (Totalt)
SP per WGP 128 128 256
Beräkna enheter (per die) 40 80 120 (per MCD)
240 (totalt)
Kärnor (per die) 2560 5120 7680
Kärnor (totalt) 2560 5120 15360 (2 x MCD)
Minnesbuss 256-bitars 256-bitars 256-bitars
Minnestyp GDDR6 GDDR6 GDDR6
Minneskapacitet 8 GB 16 GB 32 GB
Infinity cache N / A 128 MB 256-512MB
Flaggskepps-SKU Radeon RX 5700 XT Radeon RX 6900 XTX Radeon RX 7900 XT
TBP 225W 330W 350-550W
Starta Q3 2019 Q4 2020 Q4 2022

NVIDIA GeForce RTX 4090 grafikkort – Ada Lovelace-driven AD102 flaggskepps-GPU

Baserat på tidigare rykten har det förekommit viskningar om att NVIDIA skulle använda TSMC:s N5 (5nm) processnod för sina Ada Lovelace GPU:er. Detta inkluderar även AD102 SKU som kommer att vara en helt monolitisk design. I hans senaste tweet som talar om de specifika GPU-konfigurationerna, sägs AD102 GPU ha en klockhastighet så hög som 2.5 GHz (2.3 GHz genomsnittlig ökning). Den specifika tweeten säger att GPU-klockan för Ada Lovelace 'AD102' kan vara 2.3 GHz eller högre så låt oss ta det som en baslinje och tidigare läckta specifikationer för att ta reda på var prestandan ska landa.

NVIDIA AD102 "ADA GPU" verkar ha 18432 CUDA-kärnor baserat på de preliminära specifikationerna (som kan ändras), inrymt inom 144 SM-enheter. Detta är nästan dubbelt så många kärnor som finns i Ampere som redan var ett stort steg upp från Turing. En klockhastighet på 2.3-2.5 GHz skulle ge oss upp till 85 till 92 TFLOP:s beräkningsprestanda (FP32). Detta är mer än dubbelt så mycket FP32-prestandan som den befintliga RTX 3090 som har 36 TFLOP:s FP32-beräkningskraft.

NVIDIA GeForce RTX 3090 Ti kommer att ha en helt ny kortdesign med enkelsidigt minne

Prestandahoppet på 150 % ser enormt ut men man bör komma ihåg att NVIDIA redan gav ett stort hopp i FP32-siffror den här generationen med Ampere. Ampere GA102 GPU (RTX 3090) erbjuder 36 TFLOPs medan Turing TU102 GPU (RTX 2080 Ti) erbjöd 13 TFLOPs. Det är över 150 % ökning av FP32 Flops, men den verkliga spelprestandaökningen för RTX 3090 var i genomsnitt cirka 50-60 % snabbare jämfört med RTX 2080 Ti. Så en sak vi inte bör glömma är att Flops inte är lika med GPU-spelprestanda nu för tiden. Dessutom vet vi inte om 2.3-2.5 GHz är den genomsnittliga boosten eller toppförstärkningen med det förra som betyder att det kan finnas ännu högre beräkningspotential för AD102.

Bortsett från det säger läckaren också att flaggskeppet NVIDIA GeForce RTX 40 skulle behålla ett 384-bitars bussgränssnitt, liknande RTX 3090. Vad som är intressant är dock att läckaren nämner G6X vilket betyder att NVIDIA inte kommer att flytta till en ny minnesstandard tills efter Ada Lovelace och utnyttja de högre pin-hastigheterna hos G6X på 21 Gbps för nästa generations kort innan vi ser en nyare standard (t.ex. GDDR7). Kortet kommer att ha 24 GB minne så vi kan antingen förvänta oss enkelsidiga 16 Gb DRAM eller dubbelsidiga 8 Gb DRAM-moduler.

NVIDIA CUDA GPU (RYKTADE) Preliminär:

GPU TU102 GA102 AD102
arkitektur Turing Ampere Ada Lovelace
Behandla TSMC 12nm NFF Samsung 8nm 5nm
Graphics Processing Clusters (GPC) 6 7 12
Texture Processing Clusters (TPC) 36 42 72
Strömmande multiprocessorer (SM) 72 84 144
CUDA Cores 4608 10752 18432
Teoretiska TFLOPs 16.1 37.6 ~90 TFLOPs?
Minnestyp GDDR6 GDDR6X GDDR6X
Minnesbuss 384-bitars 384-bitars 384-bitars
Minneskapacitet 11 GB (2080 Ti) 24 GB (3090) 24 GB (4090?)
Flaggskepps-SKU RTX 2080 Ti RTX 3090 RTX4090?
TGP 250W 350W 450-650W?
Släpp September 2018 September 20 2022 (TBC)

NVIDIA Ada Lovelace GPU:erna kommer att driva nästa generations GeForce RTX 40-grafikkort som kommer att gå direkt med AMD:s RDNA 3-baserade Radeon RX 7000-grafikkort. Det finns fortfarande en del spekulationer angående användningen av MCM av NVIDIA. Hopper GPU, som främst är inriktad på Datacenter & AI-segmentet, är påstås spelas ut snart och kommer att ha en MCM-arkitektur. NVIDIA kommer inte att använda en MCM-design på sina Ada Lovelace GPU:er så de kommer att behålla den traditionella monolitiska designen.

Vilka nästa generations GPU:er ser du mest fram emot?

  • AMD RDNA 3 (Navi 3X Radeon RX GPU)
  • NVIDIA Ada Lovelace (GeForce RTX GPU)
  • Intel ARC Alchemist (ARC grafikkort)

Visa resultatPollalternativ är begränsade eftersom JavaScript är inaktiverat i din webbläsare.

Posten AMD & NVIDIA nästa generations flaggskepps-GPU:er Detaljerad: RDNA 3 Radeon RX 7900 XT med 15360 kärnor, Ada Lovelace GeForce RTX 4090 med 18432 kärnor by Hassan Mukhtaba visades först på Wccftech.

Ursprungliga artikel

Sprid så fler får veta :)
Visa mer

Relaterade artiklar

Kommentera uppropet

E-postadressen publiceras inte. Obligatoriska fält är markerade *

Tillbaka till toppen knappen