15

News des 15. November 2023

Twitter & Leaker Kopite7kimi hat seine frühere Aussage zugunsten eines 512-Bit-Speicherinterfaces bei "Gaming-Blackwell" korrigiert – nunmehr sollen es 384 Bit GDDR7 beim GB202-Chip sein. Die frühere Angabe wurde seinerzeit schon bezweifelt, da dies für Consumer-Chips zumindest im Gaming-Bereich einfach zu breit ist, zudem durch die Hinzunahme von GDDR7-Speicher eigentlich bereits ein großer Bandbreiten-Boost zur Verfügung steht. Mittels der klaren Aussage "384 Bit GDDR7" ergibt dies dann alles einen besseren Sinn, denn auf 32 Gbps Datenrate (wie seitens Micron angekündigt) kommt man an einem 384-Bit-Interface auf eine Speicherbandbreite von 1536 GB/sec – was wiederum perfekt zu einem anderen Leak passt, welcher von einer 52%igen Steigerung der Speicherbandbreite gegenüber der GeForce RTX 4090 sprach.

I think I probably made an empirical mistake. I mistakenly applied the ratio of Ada Lovelace's L2 and MC to Blackwell.
Quelle:  Kopite7kimi @ Twitter am 15. November 2023
 
So 384 Bit for GB202?
Quelle:  RawMango @ Twitter am 15. November 2023
 
And GDDR7.
Quelle:  Kopite7kimi @ Twitter am 15. November 2023

So gesehen ändert sich mit dieser Spezifikations-Korrektur auch nicht viel, denn es handelt sich nur um einen anderen Weg, um die Ziel-Speicherbandbreite zu erreichen. Die grundsätzlichen Rohdaten zum GB202-Chip zeigen somit nach wie vor eine Steigerung der Rechenleistung um +53% sowie eine Steigerung der Speicherbandbreite um +52% an – bezogen auf den Chip-Vergleich AD102 vs GB202. Insofern man es auf die GeForce RTX 4090 als derzeit stärkste AD102-Ausführung des Gaming-Segments beziehen will, käme der GB202-Chip im Vollausbau auf +73% Rechenleistung sowie +52% Speicherbandbreite – wobei nicht dafür garantiert werden kann, dass es einen GB202 im Vollausbau jemals zu kaufen gibt. Diese Rohdaten sind natürlich vor etwaigen Architektur-Änderungen, welche über eine bessere Auslastung der Recheneinheiten auch noch einiges herausholen können. Dennoch ist davor zu warnen, diese bestenfalls +73% mehr Rechenleistung als Ansatz zur Ermittlung der voraussichtlichen Mehrperformance zu benutzen.

Zwischen GeForce RTX 3090 Ti und 4090 liegen grob +110% mehr Rechenleistung, die real erreichte Mehrperformance liegt dagegen nur bei +55%. Logischerweise ist es Architektur-spezifisch, wie gut die Skalierung jeweils ausfällt, aber bei (bestenfalls) +73% mehr Rechenleistung zwischen GeForce RTX 4090 und GB202-Chip im Vollausbau sind +70% Mehrperformance einfach zu hoch gegriffen. Gemäß der zuletzt erreichten Skalierung wäre jedes Ergebnis oberhalb von +40% Mehrperformance schon gutklassig. Selbst dies könnte allerdings schon schwierig erreichbar sein, wenn nVidia den GB202-Chip ähnlich stark beschnitten wie die GeForce RTX 4090 in den Markt entläßt (–11% Shader-Cluster gegenüber Vollausbau). Das nominelle Potential zwischen den jeweiligen Spitzen-Chips ist zwischen Ada Lovelace und Blackwell in jedem Fall bemerkbar kleiner als zwischen Ampere und Ada Lovelace.

GeForce RTX 4090 AD102 (Vollausbau) GB202 (Vollausbau) Chip-Differenz
GPCs 11 12 angeblich 12 ±0
Shader-Cluster 128 144 angeblich 192 +33%
Chip-Takt nominell 2520 MHz, real ~2.7 GHz - angeblich ca. ~2.9 GHz +15%
Rechenpower nominell 83 TFlops, real 88 TFlops auf RTX4090-Takrate: nominell 93 TFlops, real 100 TFlops nominell ~143 TFlops +53%
ROPs 176 192 angeblich 384 oder 768 +100% oder +300%
Level2-Cache 72 MB 96 MB angeblich 128 MB +33%
Speicherinterface 384 Bit GDDR6X 384 Bit GDDR6X angeblich 384 Bit ±0
Speicherbandbreite 1008 GB/sec (21 Gbps GDDR6X @ 384 Bit) - angeblich 1536 GB/sec (whrschl. 32 Gbps GDDR7 @ 384 Bit) +52%
Hinweis: Angaben zu noch nicht offiziell vorgestellter Hardware basierend auf Gerüchten & Annahmen

Die Benutzung eines 384-bit-Interfaces beim GB202-Chip hat dabei womöglich die größten Auswirkungen sogar auf die kleineren Blackwell-Chips – denn jene können somit nicht mehr auf ebenfalls breitere Speicherinterfaces hoffen, sondern dürften auf dem Stand von "Ada Lovelace" verbleiben. Denkbarerweise tritt somit GB203 mit 256 Bit an, GB205 mit 192 Bit sowie GB206 & GB207 dann mit 128 Bit. Sollte dies so zutreffen, dann wird es für nVidia nahezu zwingend, bei den kleinsten Blackwell-Chips mit 3-GByte-Speicherchips zu arbeiten, welche GDDR7 schließlich mitbringen soll. Nur damit ist an einem 128-Bit-Speicherinterface eine sinnvolle Speichermenge à 12 GByte möglich. Die einzige Alternative bestände in einer glatten Verdopplung auf 16 GB, über welche man für Grafikkarten des Jahres 2025 durchaus genauso nachdenken kann, was allerdings wenig zur (bisherigen) Strategie von nVidia in VRAM-Fragen passt.

Interface VRAM @ 2GB-Chips VRAM @ 3GB-Chips
GB202 angeblich 384 Bit 24 GB 36 GB
GB203 whrschl. 256 Bit 16 GB 24 GB
GB205 denkbar 192 Bit 12 GB 18 GB
GB206 denkbar 128 Bit 8 GB 12 GB
GB207 whrschl. 128 Bit 8 GB 12 GB
Hinweis: Angaben zu noch nicht offiziell vorgestellter Hardware basierend auf Gerüchten & Annahmen

Nachzutragen zum Raptor Lake Refresh und in Bezug auf einen kommenden Core i9-14900KS vielleicht ganz interessant sind die tendentiell eher schlechten Performance-Ergebnisse des Core i9-13900KS aus den Launch-Reviews zum Raptor Lake Refresh. Dieses Sondermodell wurde vergleichsweise selten getestet, zeigte in den wenigen vorhandenen Tests aber üblicherweise eine geringfügige, dennoch meßtechnisch bemerkbar schlechtere Performance als der Core i9-14900K – und dies trotz gleicher Hardware und Taktraten sowie sogar einer geringeren TDP auf Seiten des neueren Prozessoren-Modells (wobei die TDP/PBP bei diesen Prozessoren eigentlich keine Wirkung mehr entfalten sollte). Anders formuliert hat Intel beim Core i9-14900K trotz identischer Spezifikationen ein klein Wenig mehr herausgeholt als ein halbes Jahr vorher beim Core i9-13900KS.

Core i9-13900K vs ... 13900KS: Anwend. 14900K: Anwend. 13900KS: Spiele 14900K: Spiele
Hardware & Co +0,7% +2,1% +0,9% +2,5%
PC Games Hardware +1,3% +2,2% +0,9% +1,1%
QuasarZone +2,3% +4,6% +1,4% +1,7%
TechPowerUp +3,4% +2,9% +1,6% +4,4%

Nicht jeder Benchmark bestätigt dies, denn es gibt auch Tests, welche (minimal) zugunsten des Core i9-13900KS ausfallen. Aber ein schnell gezogener Durchschnitt sieht sowohl den Core i9-14900KS vorn, als auch die Mehrheit der Tests zugunsten des neueren Modells ausfallen. Eine gute Erklärung hierfür gibt es derzeit nicht, denkbarerweise war jene Taktstufe zum Jahresanfang 2023 für Intel schlicht schwieriger zu erreichen als jetzt. Für den nachfolgenden Core i9-14900KS dürfte dies bedeuten, dass man da die Mehrperformance genauso mit der Lupe wird suchen müssen. Ähnlich wie im Verhältnis zwischen Core i9-13900K und 13900KS dürfte es unterdurchschnittlich an Mehrperformance geben, eigentlich kaum der Rede wert für ein neues Prozessoren-Modell mit voraussichtlich wiederum überzogenen Preispunkt.