TECH

Detalizēta informācija par AMD un NVIDIA nākamās paaudzes vadošajiem GPU: RDNA 3 Radeon RX 7900 XT ar 15360 kodoliem, Ada Lovelace GeForce RTX 4090 ar 18432 kodoliem

AMD RDNA 3 un NVIDIA Ada Lovelace GPU darbina nākamās paaudzes vadošais Radeon RX 7900 XT un GeForce RTX 4090 grafikas kartes.

Baumas par nākamās paaudzes AMD RDNA 3 darbināmo Radeon RX 7900 XT un NVIDIA Ada Lovelace darbināmo GeForce RTX 4090 grafisko karšu specifikācijām ir vēlreiz detalizētas. Baumas nāk no Greymons55 kurš jau kādu laiku savā Twitter plūsmā ir aktīvi publicējis informāciju par gaidāmo aparatūru, piemēram, CPU un GPU.

AMD RDNA 3 un NVIDIA Ada Lovelace GPU darbina nākamās paaudzes vadošais Radeon RX 7900 XT un GeForce RTX 4090 grafikas kartes.

Paredzams, ka AMD RDNA 3 darbināmie Navi 31 un Ada Lovelace AD102 GPU nodrošinās milzīgus veiktspējas uzlabojumus, kā arī tie būs visvairāk enerģijas izsalkuši mikroshēmas, kas jebkad ražotas. Kamēr NVIDIA cenšas panākt monolītu pieeju ar savu Ada Lovelace arhitektūru, AMD izmantos pilnu MCM dizainu, kurā tā jau ir uzņēmusies vadību, izlaižot ar CDNA 2 darbināmo MI200 sēriju “Aldebaran”. AMD tagad izmantos to pašu MCM tehnoloģiju patērētāju un spēļu GPU. Tātad, parunāsim par jaunākajām baumām specifikācijām, kuras esam saņēmuši no nopludinātāja:

AD102
5nm TSMC
144SM 18432CUDA
384 bitu 24G GDDR6X 21Gbps?
2.3 ~ 2.5 GHz?
85 ~ 92T FP32?

- Greymon55 (@greymon55) Novembris 9, 2021

AMD Radeon RX 7900 XT grafikas karte — ar RDNA 3 darbināms Navi 31 vadošais GPU

AMD Navi 31 GPU, vadošā RDNA 3 mikroshēma, darbinātu nākamās paaudzes Radeon RX 7900 XT grafisko karti. Mēs esam dzirdējuši, ka AMD atteiksies no CU (Compute Units) par labu WGP (darba grupas procesoriem) savos nākamās paaudzes RDNA 3 GPU. Tā kā Navi 31 ir MCM GPU, tam būs divi galvenie IP — GCD (Graphics Core Die), kura pamatā ir TSMC 5 nm process, un MCD (Multi-Cache Die), kura pamatā ir TSMC 6 nm procesa mezgls. Iepriekšējās baumas liecina, ka AMD ir jau ir izmantojis savu Navi 31 GPU.

Šeit parādītajā Navi 31 GPU konfigurācijā ir divi GCD (Graphics Core Die) un viens MCD (Multi-Cache Die). Katram GCD ir 3 ēnotāju dzinēji (kopā 6), un katram Shader Engine ir 2 ēnotāju masīvi (2 uz SE / 6 uz GCD / 12 kopā). Katrs Shader Array sastāv no 5 WGP (10 uz SE / 30 uz GCD / 60 kopā), un katrā WGP ir 8 SIMD32 vienības ar 32 ALU (40 SIMD32 uz SA / 80 uz SE / 240 uz GCD / 480 kopā). Šīs SIMD32 vienības kopā veido 7,680 kodolus uz vienu GCD un kopā 15,360 XNUMX kodolus.

Veiktspējas ziņā ir paredzams, ka GPU takts frekvence ir 2.4–2.5 GHz, kas nodrošina tā teorētisko veiktspēju aptuveni 75 TFLOP (FP32). Tas ir ārprātīgs 226% uzlabojums salīdzinājumā ar Radeon RX 6900 XT grafisko karti.

Navi 31 (RDNA 3) MCD tiks savienots ar diviem GCD, izmantojot nākamās paaudzes Infinity Fabric starpsavienojumu, un tam būs 256-512 MB Infinity Cache. Katram GPU jābūt arī 4 atmiņas savienojuma saitēm (32 bitu). Tas ir pavisam 8 32 bitu atmiņas kontrolleri 256 bitu kopnes interfeisam. Tiek norādīts, ka kartei būs līdz 32 GB GDDR6 atmiņa, kas darbosies ar 18 Gbps kontaktu ātrumu un nodrošina līdz 576 GB/s joslas platumu. Vēl viena bauma, kas parādījās nesen, liecina, ka AMD izmantos 3D Infinity Cache tehnoloģiju savā RDNA 3 klāstā, kas integrēs jauno kešatmiņu GPU vertikālās kaudzēs, līdzīgi kā Vermeer-X mikroshēmas uzliks L3 kešatmiņu virs CCD.

AMD RDNA GPU (paaudžu salīdzinājums) sākotnējais:

GPU nosaukums Navi 10 Navi 21 Navi 31
GPU process 7nm 7nm 5nm (6nm?)
GPU pakotne monolīts monolīts MCD (Multi-Chiplet Die)
Shader dzinēji 2 4 6
GPU WGP 20 40 30 (par MCD)
60 (kopā)
SP uz WGP 128 128 256
Aprēķināt vienības (katram) 40 80 120 (par MCD)
240 (kopā)
serdeņi (katram diegā) 2560 5120 7680
serdeņi (kopā) 2560 5120 15360 (2 x MCD)
Atmiņas kopne 256-bit 256-bit 256-bit
Atmiņas veids GDDR6 GDDR6 GDDR6
Atmiņas ietilpība 8 GB 16 GB 32 GB
Bezgalības kešatmiņa N / A 128 MB 256–512 MB
Galvenais SKU Radeon RX 5700 XT Radeon RX 6900 XTX Radeon RX 7900 XT
TBP 225W 330W 350-550W
Sākt Q3 2019 Q4 2020 Q4 2022

NVIDIA GeForce RTX 4090 grafikas karte — Ada Lovelace darbināms AD102 vadošais GPU

Pamatojoties uz iepriekšējām baumām, ir bijuši čuksti, ka NVIDIA saviem Ada Lovelace GPU izmantos TSMC N5 (5nm) procesa mezglu. Tas ietver arī AD102 SKU, kas būs pilnībā monolīts dizains. Savā jaunākajā tvītā, kurā runāts par konkrētajām GPU konfigurācijām, AD102 GPU ir aprīkots ar pat 2.5 GHz takts frekvenci (2.3 GHz vidējais pastiprinājums). Konkrētajā tvītā teikts, ka Ada Lovelace 'AD102' GPU pulkstenis varētu būt 2.3 GHz vai lielāks, tāpēc pieņemsim to kā bāzes līniju un iepriekš nopludinātās specifikācijas, lai noskaidrotu, kur vajadzētu sasniegt veiktspēju.

Šķiet, ka NVIDIA AD102 "ADA GPU" ir 18432 CUDA kodoli, pamatojoties uz sākotnējām specifikācijām (kas var mainīties), un tie ir izvietoti 144 SM vienībās. Tas ir gandrīz divreiz lielāks nekā Amperē esošais kodols, kas jau bija milzīgs solis uz priekšu, salīdzinot ar Tjūringu. 2.3–2.5 GHz takts frekvence nodrošinātu līdz pat 85–92 TFLOP skaitļošanas veiktspējas (FP32). Tas ir vairāk nekā divas reizes lielāks par FP32 veiktspēju nekā esošajam RTX 3090, kurā ir 36 FP32 skaitļošanas jaudas TFLOP.

NVIDIA GeForce RTX 3090 Ti būs pilnīgi jauns plates dizains ar vienpusēju atmiņu

150% veiktspējas lēciens izskatās milzīgs, taču jāatceras, ka NVIDIA jau sniedza lielu FP32 skaitļu lēcienu šajā paaudzē ar Ampere. Ampere GA102 GPU (RTX 3090) piedāvā 36 TFLOP, savukārt Turing TU102 GPU (RTX 2080 Ti) piedāvā 13 TFLOP. Tas ir vairāk nekā 150% pieaugums FP32 Flops, bet reālās pasaules spēļu veiktspējas pieaugums RTX 3090 bija vidēji par 50–60% ātrāks nekā RTX 2080 Ti. Tāpēc nevajadzētu aizmirst vienu lietu, ka Flops mūsdienās nav līdzvērtīgs GPU spēļu veiktspējai. Turklāt mēs nezinām, vai 2.3–2.5 GHz ir vidējais pastiprinājums vai maksimālais pastiprinājums, kas nozīmē, ka AD102 varētu būt vēl lielāks skaitļošanas potenciāls.

Papildus tam nopludinātājs arī norāda, ka NVIDIA GeForce RTX 40 flagmanis saglabās 384 bitu kopnes interfeisu, līdzīgi kā RTX 3090. Interesanti ir tas, ka informācijas nopludinātājs piemin G6X, kas nozīmē, ka NVIDIA nepāriet uz jauns atmiņas standarts līdz pat pēc Ada Lovelace un izmantot lielāku G6X pin-ātrumu 21 Gbps tās nākamās paaudzes kartēm, pirms mēs ieraudzīsim jaunāku standartu (piemēram, GDDR7). Kartei būs 24 GB atmiņa, tāpēc mēs varam sagaidīt vai nu vienpusējus 16 Gb DRAM, vai divpusējus 8 Gb DRAM moduļus.

NVIDIA CUDA GPU (BAUMOTĀS) sākotnējā informācija:

GPU TU102 GA102 AD102
arhitektūra Tjūringa ampērs Ada Lovelace
Process TSMC 12nm NFF Samsung 8nm 5nm
Grafikas apstrādes klasteri (GPC) 6 7 12
Tekstūru apstrādes klasteri (TPC) 36 42 72
Straumēšanas daudzprocesori (SM) 72 84 144
CUDA serdes 4608 10752 18432
Teorētiskie TFLOP 16.1 37.6 ~90 TFLOP?
Atmiņas veids GDDR6 GDDR6X GDDR6X
Atmiņas kopne 384-bit 384-bit 384-bit
Atmiņas ietilpība 11 GB (2080 Ti) 24 GB (3090) 24 GB (4090?)
Galvenais SKU RTX 2080 Ti RTX 3090 RTX4090?
TGP 250W 350W 450-650W?
Atlaidiet 2018 septembris Septembris 20 2022 (TBC)

NVIDIA Ada Lovelace GPU darbinās nākamās paaudzes GeForce RTX 40 grafiskās kartes, kas darbosies kopā ar AMD Radeon RX 3 sērijas grafiskajām kartēm, kuru pamatā ir RDNA 7000. Joprojām pastāv dažas spekulācijas par MCM izmantošanu NVIDIA. Hopper GPU, kas galvenokārt ir paredzēts datu centra un AI segmentam, ir it kā drīz tiks nofilmēts un tajā būs MCM arhitektūra. NVIDIA neizmantos MCM dizainu savos Ada Lovelace GPU, tāpēc tie saglabās tradicionālo monolītu dizainu.

Kurus nākamās paaudzes GPU jūs gaidāt visvairāk?

  • AMD RDNA 3 (Navi 3X Radeon RX GPU)
  • NVIDIA Ada Lovelace (GeForce RTX GPU)
  • Intel ARC Alchemist (ARC grafikas kartes)

View ResultsPoll opcijas ir ierobežotas, jo pārlūkprogrammā JavaScript ir atspējota.

Ziņa Detalizēta informācija par AMD un NVIDIA nākamās paaudzes vadošajiem GPU: RDNA 3 Radeon RX 7900 XT ar 15360 kodoliem, Ada Lovelace GeForce RTX 4090 ar 18432 kodoliem by Hasans Mujtaba parādījās vispirms uz Wccftech.

Original pants

Padalies ar Citiem
Rādīt vairāk

Saistītie raksti

Atstāj atbildi

Jūsu e-pasta adrese netiks publicēta. Obligātie lauki ir atzīmēti ar *

Atpakaļ uz augšu pogu