Baumas par nākamās paaudzes AMD RDNA 3 darbināmo Radeon RX 7900 XT un NVIDIA Ada Lovelace darbināmo GeForce RTX 4090 grafisko karšu specifikācijām ir vēlreiz detalizētas. Baumas nāk no Greymons55 kurš jau kādu laiku savā Twitter plūsmā ir aktīvi publicējis informāciju par gaidāmo aparatūru, piemēram, CPU un GPU.
AMD RDNA 3 un NVIDIA Ada Lovelace GPU darbina nākamās paaudzes vadošais Radeon RX 7900 XT un GeForce RTX 4090 grafikas kartes.
Paredzams, ka AMD RDNA 3 darbināmie Navi 31 un Ada Lovelace AD102 GPU nodrošinās milzīgus veiktspējas uzlabojumus, kā arī tie būs visvairāk enerģijas izsalkuši mikroshēmas, kas jebkad ražotas. Kamēr NVIDIA cenšas panākt monolītu pieeju ar savu Ada Lovelace arhitektūru, AMD izmantos pilnu MCM dizainu, kurā tā jau ir uzņēmusies vadību, izlaižot ar CDNA 2 darbināmo MI200 sēriju “Aldebaran”. AMD tagad izmantos to pašu MCM tehnoloģiju patērētāju un spēļu GPU. Tātad, parunāsim par jaunākajām baumām specifikācijām, kuras esam saņēmuši no nopludinātāja:
AD102
5nm TSMC
144SM 18432CUDA
384 bitu 24G GDDR6X 21Gbps?
2.3 ~ 2.5 GHz?
85 ~ 92T FP32?- Greymon55 (@greymon55) Novembris 9, 2021
AMD Radeon RX 7900 XT grafikas karte — ar RDNA 3 darbināms Navi 31 vadošais GPU
AMD Navi 31 GPU, vadošā RDNA 3 mikroshēma, darbinātu nākamās paaudzes Radeon RX 7900 XT grafisko karti. Mēs esam dzirdējuši, ka AMD atteiksies no CU (Compute Units) par labu WGP (darba grupas procesoriem) savos nākamās paaudzes RDNA 3 GPU. Tā kā Navi 31 ir MCM GPU, tam būs divi galvenie IP — GCD (Graphics Core Die), kura pamatā ir TSMC 5 nm process, un MCD (Multi-Cache Die), kura pamatā ir TSMC 6 nm procesa mezgls. Iepriekšējās baumas liecina, ka AMD ir jau ir izmantojis savu Navi 31 GPU.
Šeit parādītajā Navi 31 GPU konfigurācijā ir divi GCD (Graphics Core Die) un viens MCD (Multi-Cache Die). Katram GCD ir 3 ēnotāju dzinēji (kopā 6), un katram Shader Engine ir 2 ēnotāju masīvi (2 uz SE / 6 uz GCD / 12 kopā). Katrs Shader Array sastāv no 5 WGP (10 uz SE / 30 uz GCD / 60 kopā), un katrā WGP ir 8 SIMD32 vienības ar 32 ALU (40 SIMD32 uz SA / 80 uz SE / 240 uz GCD / 480 kopā). Šīs SIMD32 vienības kopā veido 7,680 kodolus uz vienu GCD un kopā 15,360 XNUMX kodolus.
Veiktspējas ziņā ir paredzams, ka GPU takts frekvence ir 2.4–2.5 GHz, kas nodrošina tā teorētisko veiktspēju aptuveni 75 TFLOP (FP32). Tas ir ārprātīgs 226% uzlabojums salīdzinājumā ar Radeon RX 6900 XT grafisko karti.
Navi 31 (RDNA 3) MCD tiks savienots ar diviem GCD, izmantojot nākamās paaudzes Infinity Fabric starpsavienojumu, un tam būs 256-512 MB Infinity Cache. Katram GPU jābūt arī 4 atmiņas savienojuma saitēm (32 bitu). Tas ir pavisam 8 32 bitu atmiņas kontrolleri 256 bitu kopnes interfeisam. Tiek norādīts, ka kartei būs līdz 32 GB GDDR6 atmiņa, kas darbosies ar 18 Gbps kontaktu ātrumu un nodrošina līdz 576 GB/s joslas platumu. Vēl viena bauma, kas parādījās nesen, liecina, ka AMD izmantos 3D Infinity Cache tehnoloģiju savā RDNA 3 klāstā, kas integrēs jauno kešatmiņu GPU vertikālās kaudzēs, līdzīgi kā Vermeer-X mikroshēmas uzliks L3 kešatmiņu virs CCD.
AMD RDNA GPU (paaudžu salīdzinājums) sākotnējais:
GPU nosaukums | Navi 10 | Navi 21 | Navi 31 |
---|---|---|---|
GPU process | 7nm | 7nm | 5nm (6nm?) |
GPU pakotne | monolīts | monolīts | MCD (Multi-Chiplet Die) |
Shader dzinēji | 2 | 4 | 6 |
GPU WGP | 20 | 40 | 30 (par MCD) 60 (kopā) |
SP uz WGP | 128 | 128 | 256 |
Aprēķināt vienības (katram) | 40 | 80 | 120 (par MCD) 240 (kopā) |
serdeņi (katram diegā) | 2560 | 5120 | 7680 |
serdeņi (kopā) | 2560 | 5120 | 15360 (2 x MCD) |
Atmiņas kopne | 256-bit | 256-bit | 256-bit |
Atmiņas veids | GDDR6 | GDDR6 | GDDR6 |
Atmiņas ietilpība | 8 GB | 16 GB | 32 GB |
Bezgalības kešatmiņa | N / A | 128 MB | 256–512 MB |
Galvenais SKU | Radeon RX 5700 XT | Radeon RX 6900 XTX | Radeon RX 7900 XT |
TBP | 225W | 330W | 350-550W |
Sākt | Q3 2019 | Q4 2020 | Q4 2022 |
NVIDIA GeForce RTX 4090 grafikas karte — Ada Lovelace darbināms AD102 vadošais GPU
Pamatojoties uz iepriekšējām baumām, ir bijuši čuksti, ka NVIDIA saviem Ada Lovelace GPU izmantos TSMC N5 (5nm) procesa mezglu. Tas ietver arī AD102 SKU, kas būs pilnībā monolīts dizains. Savā jaunākajā tvītā, kurā runāts par konkrētajām GPU konfigurācijām, AD102 GPU ir aprīkots ar pat 2.5 GHz takts frekvenci (2.3 GHz vidējais pastiprinājums). Konkrētajā tvītā teikts, ka Ada Lovelace 'AD102' GPU pulkstenis varētu būt 2.3 GHz vai lielāks, tāpēc pieņemsim to kā bāzes līniju un iepriekš nopludinātās specifikācijas, lai noskaidrotu, kur vajadzētu sasniegt veiktspēju.
Šķiet, ka NVIDIA AD102 "ADA GPU" ir 18432 CUDA kodoli, pamatojoties uz sākotnējām specifikācijām (kas var mainīties), un tie ir izvietoti 144 SM vienībās. Tas ir gandrīz divreiz lielāks nekā Amperē esošais kodols, kas jau bija milzīgs solis uz priekšu, salīdzinot ar Tjūringu. 2.3–2.5 GHz takts frekvence nodrošinātu līdz pat 85–92 TFLOP skaitļošanas veiktspējas (FP32). Tas ir vairāk nekā divas reizes lielāks par FP32 veiktspēju nekā esošajam RTX 3090, kurā ir 36 FP32 skaitļošanas jaudas TFLOP.
150% veiktspējas lēciens izskatās milzīgs, taču jāatceras, ka NVIDIA jau sniedza lielu FP32 skaitļu lēcienu šajā paaudzē ar Ampere. Ampere GA102 GPU (RTX 3090) piedāvā 36 TFLOP, savukārt Turing TU102 GPU (RTX 2080 Ti) piedāvā 13 TFLOP. Tas ir vairāk nekā 150% pieaugums FP32 Flops, bet reālās pasaules spēļu veiktspējas pieaugums RTX 3090 bija vidēji par 50–60% ātrāks nekā RTX 2080 Ti. Tāpēc nevajadzētu aizmirst vienu lietu, ka Flops mūsdienās nav līdzvērtīgs GPU spēļu veiktspējai. Turklāt mēs nezinām, vai 2.3–2.5 GHz ir vidējais pastiprinājums vai maksimālais pastiprinājums, kas nozīmē, ka AD102 varētu būt vēl lielāks skaitļošanas potenciāls.
Papildus tam nopludinātājs arī norāda, ka NVIDIA GeForce RTX 40 flagmanis saglabās 384 bitu kopnes interfeisu, līdzīgi kā RTX 3090. Interesanti ir tas, ka informācijas nopludinātājs piemin G6X, kas nozīmē, ka NVIDIA nepāriet uz jauns atmiņas standarts līdz pat pēc Ada Lovelace un izmantot lielāku G6X pin-ātrumu 21 Gbps tās nākamās paaudzes kartēm, pirms mēs ieraudzīsim jaunāku standartu (piemēram, GDDR7). Kartei būs 24 GB atmiņa, tāpēc mēs varam sagaidīt vai nu vienpusējus 16 Gb DRAM, vai divpusējus 8 Gb DRAM moduļus.
NVIDIA CUDA GPU (BAUMOTĀS) sākotnējā informācija:
GPU | TU102 | GA102 | AD102 |
---|---|---|---|
arhitektūra | Tjūringa | ampērs | Ada Lovelace |
Process | TSMC 12nm NFF | Samsung 8nm | 5nm |
Grafikas apstrādes klasteri (GPC) | 6 | 7 | 12 |
Tekstūru apstrādes klasteri (TPC) | 36 | 42 | 72 |
Straumēšanas daudzprocesori (SM) | 72 | 84 | 144 |
CUDA serdes | 4608 | 10752 | 18432 |
Teorētiskie TFLOP | 16.1 | 37.6 | ~90 TFLOP? |
Atmiņas veids | GDDR6 | GDDR6X | GDDR6X |
Atmiņas kopne | 384-bit | 384-bit | 384-bit |
Atmiņas ietilpība | 11 GB (2080 Ti) | 24 GB (3090) | 24 GB (4090?) |
Galvenais SKU | RTX 2080 Ti | RTX 3090 | RTX4090? |
TGP | 250W | 350W | 450-650W? |
Atlaidiet | 2018 septembris | Septembris 20 | 2022 (TBC) |
NVIDIA Ada Lovelace GPU darbinās nākamās paaudzes GeForce RTX 40 grafiskās kartes, kas darbosies kopā ar AMD Radeon RX 3 sērijas grafiskajām kartēm, kuru pamatā ir RDNA 7000. Joprojām pastāv dažas spekulācijas par MCM izmantošanu NVIDIA. Hopper GPU, kas galvenokārt ir paredzēts datu centra un AI segmentam, ir it kā drīz tiks nofilmēts un tajā būs MCM arhitektūra. NVIDIA neizmantos MCM dizainu savos Ada Lovelace GPU, tāpēc tie saglabās tradicionālo monolītu dizainu.
Kurus nākamās paaudzes GPU jūs gaidāt visvairāk?
- AMD RDNA 3 (Navi 3X Radeon RX GPU)
- NVIDIA Ada Lovelace (GeForce RTX GPU)
- Intel ARC Alchemist (ARC grafikas kartes)
View ResultsPoll opcijas ir ierobežotas, jo pārlūkprogrammā JavaScript ir atspējota.
Ziņa Detalizēta informācija par AMD un NVIDIA nākamās paaudzes vadošajiem GPU: RDNA 3 Radeon RX 7900 XT ar 15360 kodoliem, Ada Lovelace GeForce RTX 4090 ar 18432 kodoliem by Hasans Mujtaba parādījās vispirms uz Wccftech.