11

Gerüchteküche: nVidias GB202-Chip doppelt so groß wie der GB203-Chip

Der in Fragen von nVidia-Hardware sicherlich maßgebliche Leaker 'Kopite7kimi' hat sich mit mehreren Tweets erneut zur Hardware von "Gaming"-Blackwell zur Wort gemeldet, diesesmal primär bezogen auf den Spitzen-Chip "GB202". Jener soll nun doch gleich ein 512 Bit breites Speicherinterface tragen, zuzüglich des Sprungs auf GDDR7-Speicher mit 28 Gbps Datenrate. Jenes vergrößerte Speicherinterface (der AD102-Chip hat "nur" ein 384-Bit-Interface) war letzten Juli schon einmal im Gespräch, was allerdings letzten November zurückgezogen wurde. So gesehen kommt das vergrößerte Speicherinterface doch wieder etwas überraschend – vor allem da die kleineren Blackwell-Grafikchips augenscheinlich nicht nachziehen, sondern mehrheitlich dem von der Ada-Lovelace-Generation gesetztem Standard folgen sollen. Natürlich besteht durchaus das Risiko, dass nVidia das große GB202-Speicherinterface im Gaming-Segment gar nicht ausfährt, sondern es den Vollausbau exklusiv nur für die entsprechenden Profi-Lösungen gibt.

I think my persistence is correct. So the difference is that GB202 is 512-bit and AD102 is 384-bit.
Quelle:  Kopite7kimi @ Twitter am 11. März 2024
 
28Gbps.
Quelle:  Kopite7kimi @ Twitter am 11. März 2024

Zugleich soll der GB202-Chip die doppelte Hardware des GB203-Chips tragen, in diesem Fall wohl bezogen auf die Recheneinheiten. Dies trägt einem Tweet desselben Leakers von letzter Woche Rechnung, wo der GB203-Chip bereits mit 6 Raster-Engines (GPC) beschrieben wird, gemäß früher bekannt gewordener GB202-Daten somit die Hälfte des GB202-Chips (12 GPC, 192 SM) ergebend. Sofern der GPC/SM-Aufbau des GB203-Chips nicht abweichend vom GB202-Chip ist, würde der GB203-Chip somit auf 96 Shader-Cluster kommen, was eben die Hälfte des GB202-Chips bedeutet. Eine größere Anzahl von Shader-Clustern per Raster Engines beim GB203-Chip ist somit inzwischen unwahrscheinlich, in diesem Fall würde man dies schwerlich als "half of GB202" bezeichnen können. In allen wichtigen Kern-Daten wäre der GB203 somit eine Halbierung des GB202: Raster-Engines, Shader-Cluster und Speicherinterface.

I think GB203 is half of GB202, just like GB102 and GB100. But I don't know if GB202 has a multi chip package.
Quelle:  Kopite7kimi @ Twitter am 11. März 2024
 
I am just thinking that GB203 may only have 6 GPCs.
Quelle:  Kopite7kimi @ Twitter am 6. März 2024

Dies läßt natürlich neue Spekulationen ins Kraut schießen, dass der GB202-Chip vielleicht doch ein MultiChip-Konstrukt darstellt, ergo schlicht aus zwei GB203-Chips besteht. 'Kopite7kimi' verneint diese Möglichkeit derzeit, im MCM-Ansatz soll nur der HPC/AI-Chip "GB100" erscheinen. Dennoch wäre es nochmals mysteriöser, wenn nVidia den GB202-Chip als perfekte Verdopplung des GB203 auflegt und trotzdem beim monolithischen Ansatz bleibt. Immerhin wäre dies eine günstige Gelegenheit, um Erfahrungen mit MCM-Konstruktionen im Gaming-Bereich zu sammeln, gerade da nVidia zumindest in der Blackwell-Generation keinen ernsthaften Wettbewerb an der Leistungsspitze zu befürchten hat. Aber natürlich könnte nVidia hier dennoch (vorerst) beim einfachsten Weg bleiben, sprich rein monolithischen Chips für das Consumer-Segment.

I don't think any Blackwell GPUs will go MCM.
Quelle:  Shmitapz @ Twitter am 11. März 2024
 
GB100 will. I don't think GB202 will.
Quelle:  Kopite7kimi @ Twitter am 11. März 2024

Sicher sind diese Angaben leider allesamt noch nicht, zumindest läßt die Wortwahl des Leakers weiterhin nicht auf tatsächliche Gewißheiten zu diesen Daten schließen. Unter Vorbehalt der Korrektheit der Angaben speziell zum GB203-Chip läßt sich das mögliche "Blackwell" Chip-Portfolio jedoch inzwischen genauer skizzieren. Schließlich lassen die Daten zum GB203-Chip kaum noch besonders große Gestaltungs-Möglichkeiten für die kleineren Blackwell-Chips übrig, zumindest wenn man ein halbwegs rundes Chip-Portfolio anstrebt. So lassen sich beispielsweise die Anzahl der Raster-Engines von GB205, GB206 & GB207 mit einiger Wahrscheinlichkeit erraten, gleiches gilt für die jeweilige Anzahl der Shader-Cluster. Hierbei dürfte nVidia vermutlich dem grundsätzlichen Ansatz von 16 Shader-Clustern per Raster-Engine weiterhin folgen, denkbar auch nur 14 SM per GPC bei den kleinsten Blackwell-Chip (eine kürzlich von 'RedGamingTech' ins Spiel gebrachte Möglichkeit).

Treffen diese Annahmen zu und bringt nVidia nicht eventuell eher (noch) mehr Shader-Cluster per Raster-Engine, dann zeigt sich das Portfolio der Blackwell-Grafikchips als ziemlich handzahme Verbesserung gegenüber der Ada-Lovelace-Generation. An der Leistungsspitze geht dies beim GB202-Chip mit +33% Shader-Clustern noch in Ordnung, darunter dürften die (reinen) Hardware-Zuwächse oftmals erheblich geringer ausfallen. Der primäre Punkt, wie Gaming-Blackwell auf Touren kommen kann, dürfte somit weniger in der nominellen Hardware-Ansetzung zu finden sein, sondern muß wo anders liegen. Hier könnte ein gewisser Taktraten-Sprung weiterhelfen, auch Architektur-Verbesserungen und damit eine höhere IPC wären hilfreich. In der Summe kann es fast nur eine Kombination dieser drei Effekte sein, welcher Gaming-Blackwell nach vorn bringt, denn rein auf Ebene der nominellen Hardare-Einheiten sieht dies für den Augenblick nicht besonders prall aus.

Raster-Engines Shader-Cluster Speicherinterface Ada-Vorgänger SM vs Vorg.
GB202 angbl. 12 angbl. 192 angbl. 512 Bit AD102: 12 GPC, 144 SM, 384 Bit +33%
GB203 angbl. 6 angbl. 96 whrschl. 256 Bit AD103: 7 GPC, 80 SM, 256 Bit +20%
GB205 whrschl. 4 whrschl. 64 whrschl. 192 Bit AD104: 5 GPC, 60 SM, 192 Bit +7%
GB206 whrschl. 3 möglw. 42 oder 48 whrschl. 128 Bit AD106: 3 GPC, 36 SM, 128 Bit +17/33%
GB207 whrschl. 2 möglw. 28 oder 32 96 oder 128 Bit AD107: 3 GPC, 24 SM, 128 Bit +17/33%
Hinweis: Angaben zu noch nicht offiziell vorgestellter Hardware basieren auf Gerüchten & Annahmen

Logischerweise können die diesen Annahmen zugrundeliegenden Informationen auch falsch sein, oder auch die getroffenen Annahmen inkorrekt sein. Eine gewisse Chance auf eine größere Hardware-Ansetzung von Gaming-Blackwell (unterhalb des GB202-Chips) ist somit nach wie vor gegeben. Bleibt es hingegen bei diesen Daten, so wäre dies auch nicht besonders verwunderlich: Denn nVidia muß faktisch erst jetzt zur finalen Design-Zielsetzung bei den kleineren Blackwell-Chips schreiten, kann sich somit bereits vom nahezu sicher bekannten Wissen leiten lassen, dass AMDs RDNA4 und Intels Battlemage eher nur Midrange-Territorium besetzen werden. Demzufolge dürfte nVidia-intern durchaus die Überlegung existieren, bei den kleineren Blackwell-Chips nur so hoch zu springen, wie man springen muß. Dies gilt um so mehr, als dass größere Chips auch entsprechend mehr kosten und nVidia sehr wohl dafür bekannt ist, sehr Margen-trächtig zu arbeiten.

Einen zu kleinen Sprung kann man sich allerdings auch nicht leisten, dies unterminiert die bombastische Marktstellung nVidias. Allerdings hat nVidia neben der reinen Hardware-Gestaltung auch andere Möglichkeiten, einen gewissen Sprung zwischen den Generationen zu erzielen: Sei es mit der Konzentration auf den größten Chip und dessen Mehrperformance – was bei "Ada Lovelace" gut funktioniert hat, vom Glanz der GeForce RTX 4090 profitiert die ganze RTX40-Serie. Oder auch mittels weiterer nVidia-eigener Features, möglicherweise einer neuen DLSS-Version – nachdem dies bislang gut funktioniert hat und "DLSS" derzeit einen wirklich guten Ruf innerhalb der ganzen Gamer-Gemeinde genießt. Selbst wenn Hardware- und Performance-Sprung in der Breite des Blackwell-Portfolios also vielleicht kleiner als gedacht ausfallen, kann man sich ziemlich sicher sein, dass nVidia irgendetwas zur Ehrenrettung der GeForce RTX 50 Serie aufbieten wird.