Detalizēta informācija par AMD un NVIDIA nākamās paaudzes vadošajiem GPU: RDNA 3 Radeon RX 7900 XT ar 15360 kodoliem, Ada Lovelace GeForce RTX 4090 ar 18432 kodoliem

AMD RDNA 3 un NVIDIA Ada Lovelace GPU darbina nākamās paaudzes vadošais Radeon RX 7900 XT un GeForce RTX 4090 grafikas kartes.

Baumas par nākamās paaudzes AMD RDNA 3 darbināmo Radeon RX 7900 XT un NVIDIA Ada Lovelace darbināmo GeForce RTX 4090 grafisko karšu specifikācijām ir vēlreiz detalizētas. Baumas nāk no Greymons55 kurš jau kādu laiku savā Twitter plūsmā ir aktīvi publicējis informāciju par gaidāmo aparatūru, piemēram, CPU un GPU.

AMD RDNA 3 un NVIDIA Ada Lovelace GPU darbina nākamās paaudzes vadošais Radeon RX 7900 XT un GeForce RTX 4090 grafikas kartes.

Paredzams, ka AMD RDNA 3 darbināmie Navi 31 un Ada Lovelace AD102 GPU nodrošinās milzīgus veiktspējas uzlabojumus, kā arī tie būs visvairāk enerģijas izsalkuši mikroshēmas, kas jebkad ražotas. Kamēr NVIDIA cenšas panākt monolītu pieeju ar savu Ada Lovelace arhitektūru, AMD izmantos pilnu MCM dizainu, kurā tā jau ir uzņēmusies vadību, izlaižot ar CDNA 2 darbināmo MI200 sēriju “Aldebaran”. AMD tagad izmantos to pašu MCM tehnoloģiju patērētāju un spēļu GPU. Tātad, parunāsim par jaunākajām baumām specifikācijām, kuras esam saņēmuši no nopludinātāja:

AD102
5nm TSMC
144SM 18432CUDA
384 bitu 24G GDDR6X 21Gbps?
2.3 ~ 2.5 GHz?
85 ~ 92T FP32?

- Greymon55 (@greymon55) Novembris 9, 2021

AMD Radeon RX 7900 XT grafikas karte — ar RDNA 3 darbināms Navi 31 vadošais GPU

AMD Navi 31 GPU, vadošā RDNA 3 mikroshēma, darbinātu nākamās paaudzes Radeon RX 7900 XT grafisko karti. Mēs esam dzirdējuši, ka AMD atteiksies no CU (Compute Units) par labu WGP (darba grupas procesoriem) savos nākamās paaudzes RDNA 3 GPU. Tā kā Navi 31 ir MCM GPU, tam būs divi galvenie IP — GCD (Graphics Core Die), kura pamatā ir TSMC 5 nm process, un MCD (Multi-Cache Die), kura pamatā ir TSMC 6 nm procesa mezgls. Iepriekšējās baumas liecina, ka AMD ir jau ir izmantojis savu Navi 31 GPU.

Šeit parādītajā Navi 31 GPU konfigurācijā ir divi GCD (Graphics Core Die) un viens MCD (Multi-Cache Die). Katram GCD ir 3 ēnotāju dzinēji (kopā 6), un katram Shader Engine ir 2 ēnotāju masīvi (2 uz SE / 6 uz GCD / 12 kopā). Katrs Shader Array sastāv no 5 WGP (10 uz SE / 30 uz GCD / 60 kopā), un katrā WGP ir 8 SIMD32 vienības ar 32 ALU (40 SIMD32 uz SA / 80 uz SE / 240 uz GCD / 480 kopā). Šīs SIMD32 vienības kopā veido 7,680 kodolus uz vienu GCD un kopā 15,360 XNUMX kodolus.

Veiktspējas ziņā ir paredzams, ka GPU takts frekvence ir 2.4–2.5 GHz, kas nodrošina tā teorētisko veiktspēju aptuveni 75 TFLOP (FP32). Tas ir ārprātīgs 226% uzlabojums salīdzinājumā ar Radeon RX 6900 XT grafisko karti.

Navi 31 (RDNA 3) MCD tiks savienots ar diviem GCD, izmantojot nākamās paaudzes Infinity Fabric starpsavienojumu, un tam būs 256-512 MB Infinity Cache. Katram GPU jābūt arī 4 atmiņas savienojuma saitēm (32 bitu). Tas ir pavisam 8 32 bitu atmiņas kontrolleri 256 bitu kopnes interfeisam. Tiek norādīts, ka kartei būs līdz 32 GB GDDR6 atmiņa, kas darbosies ar 18 Gbps kontaktu ātrumu un nodrošina līdz 576 GB/s joslas platumu. Vēl viena bauma, kas parādījās nesen, liecina, ka AMD izmantos 3D Infinity Cache tehnoloģiju savā RDNA 3 klāstā, kas integrēs jauno kešatmiņu GPU vertikālās kaudzēs, līdzīgi kā Vermeer-X mikroshēmas uzliks L3 kešatmiņu virs CCD.

AMD RDNA GPU (paaudžu salīdzinājums) sākotnējais:

GPU nosaukums	Navi 10	Navi 21	Navi 31
GPU process	7nm	7nm	5nm (6nm?)
GPU pakotne	monolīts	monolīts	MCD (Multi-Chiplet Die)
Shader dzinēji	2	4	6
GPU WGP	20	40	30 (par MCD) 60 (kopā)
SP uz WGP	128	128	256
Aprēķināt vienības (katram)	40	80	120 (par MCD) 240 (kopā)
serdeņi (katram diegā)	2560	5120	7680
serdeņi (kopā)	2560	5120	15360 (2 x MCD)
Atmiņas kopne	256-bit	256-bit	256-bit
Atmiņas veids	GDDR6	GDDR6	GDDR6
Atmiņas ietilpība	8 GB	16 GB	32 GB
Bezgalības kešatmiņa	N / A	128 MB	256–512 MB
Galvenais SKU	Radeon RX 5700 XT	Radeon RX 6900 XTX	Radeon RX 7900 XT
TBP	225W	330W	350-550W
Sākt	Q3 2019	Q4 2020	Q4 2022

NVIDIA GeForce RTX 4090 grafikas karte — Ada Lovelace darbināms AD102 vadošais GPU

Pamatojoties uz iepriekšējām baumām, ir bijuši čuksti, ka NVIDIA saviem Ada Lovelace GPU izmantos TSMC N5 (5nm) procesa mezglu. Tas ietver arī AD102 SKU, kas būs pilnībā monolīts dizains. Savā jaunākajā tvītā, kurā runāts par konkrētajām GPU konfigurācijām, AD102 GPU ir aprīkots ar pat 2.5 GHz takts frekvenci (2.3 GHz vidējais pastiprinājums). Konkrētajā tvītā teikts, ka Ada Lovelace 'AD102' GPU pulkstenis varētu būt 2.3 GHz vai lielāks, tāpēc pieņemsim to kā bāzes līniju un iepriekš nopludinātās specifikācijas, lai noskaidrotu, kur vajadzētu sasniegt veiktspēju.

Šķiet, ka NVIDIA AD102 "ADA GPU" ir 18432 CUDA kodoli, pamatojoties uz sākotnējām specifikācijām (kas var mainīties), un tie ir izvietoti 144 SM vienībās. Tas ir gandrīz divreiz lielāks nekā Amperē esošais kodols, kas jau bija milzīgs solis uz priekšu, salīdzinot ar Tjūringu. 2.3–2.5 GHz takts frekvence nodrošinātu līdz pat 85–92 TFLOP skaitļošanas veiktspējas (FP32). Tas ir vairāk nekā divas reizes lielāks par FP32 veiktspēju nekā esošajam RTX 3090, kurā ir 36 FP32 skaitļošanas jaudas TFLOP.

150% veiktspējas lēciens izskatās milzīgs, taču jāatceras, ka NVIDIA jau sniedza lielu FP32 skaitļu lēcienu šajā paaudzē ar Ampere. Ampere GA102 GPU (RTX 3090) piedāvā 36 TFLOP, savukārt Turing TU102 GPU (RTX 2080 Ti) piedāvā 13 TFLOP. Tas ir vairāk nekā 150% pieaugums FP32 Flops, bet reālās pasaules spēļu veiktspējas pieaugums RTX 3090 bija vidēji par 50–60% ātrāks nekā RTX 2080 Ti. Tāpēc nevajadzētu aizmirst vienu lietu, ka Flops mūsdienās nav līdzvērtīgs GPU spēļu veiktspējai. Turklāt mēs nezinām, vai 2.3–2.5 GHz ir vidējais pastiprinājums vai maksimālais pastiprinājums, kas nozīmē, ka AD102 varētu būt vēl lielāks skaitļošanas potenciāls.

Papildus tam nopludinātājs arī norāda, ka NVIDIA GeForce RTX 40 flagmanis saglabās 384 bitu kopnes interfeisu, līdzīgi kā RTX 3090. Interesanti ir tas, ka informācijas nopludinātājs piemin G6X, kas nozīmē, ka NVIDIA nepāriet uz jauns atmiņas standarts līdz pat pēc Ada Lovelace un izmantot lielāku G6X pin-ātrumu 21 Gbps tās nākamās paaudzes kartēm, pirms mēs ieraudzīsim jaunāku standartu (piemēram, GDDR7). Kartei būs 24 GB atmiņa, tāpēc mēs varam sagaidīt vai nu vienpusējus 16 Gb DRAM, vai divpusējus 8 Gb DRAM moduļus.

NVIDIA CUDA GPU (BAUMOTĀS) sākotnējā informācija:

GPU	TU102	GA102	AD102
arhitektūra	Tjūringa	ampērs	Ada Lovelace
Process	TSMC 12nm NFF	Samsung 8nm	5nm
Grafikas apstrādes klasteri (GPC)	6	7	12
Tekstūru apstrādes klasteri (TPC)	36	42	72
Straumēšanas daudzprocesori (SM)	72	84	144
CUDA serdes	4608	10752	18432
Teorētiskie TFLOP	16.1	37.6	~90 TFLOP?
Atmiņas veids	GDDR6	GDDR6X	GDDR6X
Atmiņas kopne	384-bit	384-bit	384-bit
Atmiņas ietilpība	11 GB (2080 Ti)	24 GB (3090)	24 GB (4090?)
Galvenais SKU	RTX 2080 Ti	RTX 3090	RTX4090?
TGP	250W	350W	450-650W?
Atlaidiet	2018 septembris	Septembris 20	2022 (TBC)

NVIDIA Ada Lovelace GPU darbinās nākamās paaudzes GeForce RTX 40 grafiskās kartes, kas darbosies kopā ar AMD Radeon RX 3 sērijas grafiskajām kartēm, kuru pamatā ir RDNA 7000. Joprojām pastāv dažas spekulācijas par MCM izmantošanu NVIDIA. Hopper GPU, kas galvenokārt ir paredzēts datu centra un AI segmentam, ir it kā drīz tiks nofilmēts un tajā būs MCM arhitektūra. NVIDIA neizmantos MCM dizainu savos Ada Lovelace GPU, tāpēc tie saglabās tradicionālo monolītu dizainu.

Kurus nākamās paaudzes GPU jūs gaidāt visvairāk?