26

Gerüchteküche: nVidia AD102-450 mit 142 Shader-Clustern, 48 GB GDDR6X und bis zu 800W TBP

Nachdem Twitterer & Leaker 'Kopite7kimi' zuletzt eine (nahezu) Maximal-Variante des AD102-Chips bereits angedeutet hatte, gibt es nunmehr die Hardware-Daten hierzu. Ein Verkaufsname läßt sich noch nicht nennen, vorerst muß man mit dem Grafikchip-Codenamen "AD102-450" vorlieb nehmen – welcher aufgrund der Höhe des Suffix bereits eine maximal ausgereizte Gaming-Lösung andeutet (die professionellen Modelle von nVidia laufen unter dem 800er Suffix-Kreis). AD102-450 soll dann mit 18'176 FP32-Einheiten samt 48 GB GDDR6X-Speicher auf 24 Gbps Datenrate zu einer TBP von um die 800 Watt (!) antreten. Hierbei handelt es sich ergo um die Realisierung jener früherer Gerüchte, welche den AD102-Chip bereits auf diesen hohen Wattagen eingeordnet hatten. Final sind diese Daten natürlich noch nicht, es handelt sich allein um den aktuellen Stand dieses Hardware-Projekts.

"the beast"
PG137-SKU0
AD102-450-A1
18176FP32
48G 24Gbps GDDR6X
total board power ~800W

Quelle:  Kopite7kimi @ Twitter am 25. Juli 2022

Zu erkennen an den Hardware-Daten sind dabei mehrere Dinge: So kommt auch diese Grafikkarte nicht ganz im Vollaubau des zugrundeliegenden AD102-Chips daher, es sind "nur" 142 von maximal möglich 144 Shader-Clustern. Womöglich handelt nVidia an dieser Stelle aus reinen Salvage-Überlegungen heraus derart: Auf so einem großen Chip wie dem AD102 (derzeit auf 600-610mm² Chipfläche geschätzt) spielen 2 von 144 Shader-Clustern aus Performance-Gründen auch keine große Rolle mehr, verbessern jedoch zweifellos die Fertigungsausbeute. Die 48 GB GDDR6X ergeben logischerweise wiederum das volle 384-Bit-Speicherinterface des AD102-Grafikchips. Verbaubar sind gleich 48 GB VRAM derzeit aber nur im Clamshell-Modus: Jeweils zwei Stück 2-GByte-Speicherchips pro 32-Bit-Teilinterface. Von der Performance her macht dies keinen Unterschied, doch die entsprechenden Grafikboards werden dadurch etwas aufwendigerer und teurer.

Performance-relevant ist hingegen die 24 Gbps GDDR6X-Datenrate von AD102-450, was 14% mehr Speicherbandbreite zwischen GeForce RTX 4090 und AD102-450 ergibt. Dabei ist wohl auch der GDDR6X-Speicher der GeForce RTX 4090 für selbige hohe Datenrate spezifiziert, wird von nVidia bei dieser "normalen" AD102-Lösung dann jedoch nur niedriger getaktet eingesetzt (21 Gbps). Und letztlich bekommt AD102-450 sein eigenes Grafikboard ("PG137"), abweichend von der GeForce RTX 4090: Zum einen ist die Speicherbestückung anders, zum anderen muß deutlich mehr Stromaufnahme gewährleistet werden bei einer TBP von bis zu 800 Watt. Inwiefern jene tatsächlich erreicht wird, bleibt allerdings noch abzuwarten bzw. hängt auch davon ab, mit welcher Performance nVidia jene AD102-450 letztlich in den Markt schicken will.

Und dies ermisst sich primär daran, auf welchem Performance-Niveau AMDs Navi 31 herauskommt – ob hierfür bereits die GeForce RTX 4090 ausreicht oder ob nVidia noch nachlegen muß. An dieser Maßgabe entscheidet sich wahrscheinlich, ob nVidia AD102-450 hochprügeln muß oder aber mit vergleichsweise "maßvoller" TDP laufen läßt. Demzufolge ist aus unserer Sicht derzeit noch alles von 600 bis 800 Watt drin, die genannten 800 Watt sind keineswegs bereits in Stein gemeißelt. Twitterer AGF weisst zudem auf den Punkt hin, dass mit den 800 Watt für AD102-450 auch nur die reine Belastungsgrenze für das Grafikboard gemeint sein könnte – sprich nicht dass, was man später als offizielle TDP ansetzt. Auch wenn es hierzu noch mehrere unterschiedliche Meinungen gibt, sollte man diesen Einwand mit in die Kalkulation aufnehmen. Denn egal der tatsächlich herauskommenden TDP: Das Board-Design von AD102-450 ist wohl durchaus in der Lage, mit 800 Watt zu laufen.

Sad. People are still confused by board max TGP and average TDP.
800W TGP AD102 board exists for testing purpose but no plan right now to bring anything above 600W TDP, even in 48GB variant.

Quelle:  AGF @ Twitter am 26. Juli 2022

Es handelt sich hierbei also sinngemäß um das gleiche, was innerhalb der Ampere-Generation die "GeForce RTX 3090 Ti" darstellt – eine auf die letzte Rille hochgeprügelte Ausführung des zugrundeliegenden Grafikchips (oder auch die Erfüllung eins früheren April-Scherzes). Wie hoch nVidia dabei geht, hängt von der Navi-31-Performance ab und kann daher derzeit noch gar nicht bestimmt werden. Allenfalls kann man sagen, dass AD102-450 das Potential hat, im Rahmen von ca. 15-25% schneller als eine GeForce RTX 4090 herauszukommen. Als Namensvorschläge stehen "GeForce RTX 4090 Ti" oder "ADA Titan" im Raum, Launch-Termin dürfte irgendwann im Jahr 2023 sein – in jedem Fall nach Navi 31. Und mit einiger Sicherheit dürfte diese AD102-Lösung dann den Preis-"Rekord" der GeForce RTX 3090 Ti ($1999 bzw. 2249€) überbieten, wird aus Preis/Leistungs-Sicht wiederum eine Lösung "jenseits von Gut & Böse" werden.

GeForce RTX 4070 GeForce RTX 4080 GeForce RTX 4090 "AD102-450"
Chip-Basis nVidia AD104-275 nVidia AD103-300 nVidia AD102-300 nVidia AD102-450
Referenz-Board PG141-SKU341 PG139-SKU360 PG139-SKU330 PG137-SKU0
Raster-Engines 5 GPC 7 GPC vermtl. 11 GPC 12 GPC
Recheneinheiten 56 Shader-Cluster, 7168 FP32 + 3584 INT32 (10'752 Recheneinheiten insgesamt) 80 Shader-Cluster, 10'240 FP32 + 5120 INT32 (15'360 Recheneinheiten insgesamt) 128 Shader-Cluster, 16'384 FP32 + 8192 INT32 (24'576 Recheneinheiten insgesamt) 142 Shader-Cluster, 18'176 FP32 + 9088 INT32 (27'264 Recheneinheiten insgesamt)
Taktraten ? ? 2235/2520 MHz ?
ROPs vermtl. 160 vermtl. 224 vermtl. 352 vermtl. 384
Level2-Cache ≤48 MB ≤64 MB ≤96 MB 96 MB
Speicherinterface 160 Bit GDDR6 256 Bit GDDR6X 384 Bit GDDR6X 384 Bit GDDR6X
Speicher 10 GB GDDR6 @ 18 Gbps 16 GB GDDR6X @ 21 Gbps 24 GB GDDR6X @ 21 Gbps 48 GB GDDR6X @ 24 Gbps
Rohleistungen ca. 37-42 TFlops & 360 GB/sec ca. 53-59 TFlops & 672 GB/sec 82,6 TFlops & 1008 GB/sec ca. 98-105 TFlops & 1152 GB/sec
Stromverbrauch 300W TDP 420W TDP 450W TDP 600-800W TDP
Performance-Level 3070→4070: ca. 1,6-1,8fache 3080→4080: ca. 1,6-1,8fache 3090→4090: ca. 1,8-2,0fache 3090Ti→AD102-450: ca. 1,9-2,3fache
Listenpreis ? ? ? ?
Launch Anfang 2023 Anfang 2023 Oktober 2022 irgendwann 2023
Vorgänger GeForce RTX 3070: GA104, 6 GPC, 46 SM @ 256 Bit, 20,3 TFlops & 448 GB/sec, 96 ROPs, 8 GB GDDR6, $499 GeForce RTX 3080: GA102, 6 GPC, 68 SM @ 320 Bit, 29,8 TFlops & 760 GB/sec, 96 ROPs, 10 GB GDDR6X, $699 GeForce RTX 3090: GA102, 7 GPC, 82 SM @ 384 Bit, 35,7 TFlops & 936 GB/sec, 112 ROPs, 24 GB GDDR6X, $1499 GeForce RTX 3090 Ti: GA102, 7 GPC, 84 SM @ 384 Bit, 40,0 TFlops & 1008 GB/sec, 112 ROPs, 24 GB GDDR6X, $1999
Anmerkung: alle Angaben zu noch nicht vorgestellter Hardware basieren auf Gerüchten & Annahmen

Nachtrag vom 27. Juli 2022

nVidias AD102-450, welche allgemein schon als "ADA Titan" tituliert wird, hat es in den Augen der Kommenatoren schwer: Allgemein wird der wirklich abgehobene Stromverbrauch kritisiert – und zugleich natürlich auch extreme Preise befürchtet. Dabei ist wahrscheinlich egal, ob es jetzt keine 800 Watt, sondern "nur" 600 Watt werden – auch dass trifft heuer nicht mehr den Zeitgeist, welcher eher in Richtung Energieeffizienz geht. Für nVidia ist das ganze natürlich primär ein Prestige-Objekt im ewigen Performance-Wettrennen mit AMD – welches man auf keinen Fall verlieren will, selbst wenn dafür die ganz heißen Eisen ausgepackt werden müssen. Ob dies grundsätzlich gelingen kann, bleibt allerdings die weitere Entwicklung abzuwarten: Denn neben Navi 31 steht ja immer noch ein Dual-Chip Navi 32 im Raum – welcher mit einem Drittel mehr Hardware-Einheiten gegenüber Navi 31 selbst AD102-450 vor Probleme stellen sollte.

AD102-450 Navi 31 Dual Navi 32
Recheneinheiten 142 SM mit 18'176 FP32-Einheiten, zzgl. 9088 INT32-Einheiten 64 WGP mit 16'384 FP32-Einheiten ≤96 WGP mit ≤24'576 FP32-Einheiten
FP32-Rohleistung um die 100 TFlops um die 75 TFlops um die 100 TFlops
große Caches 96 MB Level2-Cache 192 MB + optional ≤192 MB Infinity Cache 256 MB + optional ≤256 MB Infinity Cache
Speicherinterface 384 Bit GDDR6X 384 Bit GDDR6 2x256 Bit GDDR6
Performance-Projektion ca. 1,9-2,3fache ggü 3090Ti
(Hochrechnung aufgrund 4090er Benchmarks)
ca. 1,7-1,9fache ggü 3090Ti
(Performance-Zielsetzung von AMD)
ca. 2,1-2,4fache ggü 3090Ti
(Hochrechnung aufgrund N31-Performanceziel)

Die Hochrechnungen hierzu sind natürlich noch arg grob und damit fehleranfällig. Aber wenn man grundsätzlich davon ausgeht, dass AD102 und Navi 31 im selben Performance-Feld spielen, dann sollte ein um ein Drittel mächtigerer Dual-Chip Navi 32 eigentlich an AD102 vorbeiziehen können. Die unterschiedliche hohe FP32-Rechenleistung zwischen AD102 und Navi 31 spielt dabei wohl keine Rolle, sondern entspricht auch schon der Situation bei den aktuellen Ampere/RDNA2-Grafikchips. Die kritische Frage ist eher, ob man mittels des DualChip-Ansatzes nicht einiges an Rechen-Effizienz einbüßt, der herauskommende Performance-Sprung nicht vielleicht deutlich unterhalb des Rohleistungs-Sprungs rangiert. Unter anderen Gesichtspunkten könnte der DualChip-Ansatz hingegen wieder vorteilhaft sein: Zwei Navi 32 lassen sich eventuell etwas höher takten als ein Navi 31 (größerer Die) – was dann die Spanne der denkbaren Performance-Ergebnisse nur noch weiter erhöht.

Vom reinen Performance-Punkt abgesehen stellt sich zudem die Frage, ob AMD dieselbe Performance-Klasse nicht deutlich energieeffizienter hinbekommt als nVidia. Die letzte – sicherlich um einiges zurückliegende – Wasserstandsmeldung zur TDP von Navi 31 belief sich auf unterhalb 400 Watt. Sofern AMD dies tatsächlich nicht überschreitet, hätte man einen gravierenden Vorteil in der Hand – denn selbst in Enthusiasten-Kreisen werden Grafikkarten á 600 oder 800 Watt nicht wohlgelitten sein. Dies sieht man inzwischen allgemein schon als alleinigen Versuch, auf Teufel komm raus unbedingt vorn zu bleiben, egal der Nebenwirkungen. Aber natürlich sind all dies noch ungelegte Eier: Genauso wenig wie der Stromverbrauch von AD102-450 sicher ist, gilt selbiges für Performance-Punkt und Stromverbrauch von Navi 31 sowie das tatsächliche Erscheinen einer DualChip-Lösung basierend auf Navi 32.