3

Gerüchteküche: nVidias GB205 & GB203 wohl nicht mit stärkerer Hardware als AD103 & AD104

Nachdem nVidias inoffizielle Computex-Keynote aus Sicht von Gaming-Hardware eher denn einschläfernd war, hat sich Twitterer & Leaker 'Kopite7kimi' mit einer Änderung an den bisher bekannten Spezifikationen von "Gaming-Blackwell" zu Wort gemeldet. So sollen die Blackwell-Chips außerhalb von GB207 dieselbe Anzahl an Raster-Engines wie bei den vergleichbaren Chips von "Ada Lovelace" tragen. Bei GB203 und GB205 würde dies auf eine Raster-Engine mehr gegenüber dem bisherigen Gerüchtestand hinauslaufen, was erst einmal dankbar entgegengenommen wird. Allerdings soll der GB203-Chip dennoch weniger Shader-Cluster tragen, diesbezüglich nunmehr wie der AD103-Chip aussehen: 7 Raster-Engines (GPC) mit jeweils 6 TPCs, welche immer 2 Shader-Cluster (SM) beinhalten – und somit 84 Shader-Cluster insgesamt.

I found some friends getting bored with Jensen's presentation today.
I will say GB20x will have the same GPC count than AD10x except GB207 and AD107.

Quelle:  Kopite7kimi @ X am 2. Juni 2024
 
GB202 is still 12*8.
Quelle:  Kopite7kimi @ X am 2. Juni 2024
 
Due to the order of product development, we will not see finished products other than GB202 and GB203 in the short term, we will not discuss GB205, GB206, and GB207 at this time.
I feel sorry to everyone, GB203 is not 6*8, but 7*6, similar to AD103.

Quelle:  Kopite7kimi @ X am 2. Juni 2024

Dies entspricht dem bekannten AD103-Chip von GeForce RTX 4070 Ti Super, 4080 und 4080 Super, womit der GB203-Chip somit nur dieselbe Anzahl an Hardware-Einheiten aufbieten würde. Da der GB202-Chip in seiner Hardware mit 12 Raster-Engines und 192 Shader-Clustern jedoch bestätigt wurde ("12*8" bedeutet 12 GPC x 8 TPC x 2 SM/TPC = 192 SM insgesamt), würde auch die Symetrie zwischen GB203 und GB202 wegfallen – ein GB202 wäre somit nicht mehr zwei GB203. Die Differenzen liegen nicht nur bei den Shader-Clustern (2x 84 SM ist weniger als 192 SM), sondern auch bei den Raster-Engines (2x 7 GPC ist mehr als 12 GPC), ergo lassen sich auch mit Abspeckungen keine zwei GB203-Chips aus einem GB202 gewinnen. Die diesbezügliche Gerüchtemeldung ist somit ebenfalls inkorrekt. Dabei dürfte es durchaus weiterhin so sein, dass der GB202 aus zwei gleichartigen Chip-Hälften besteht und somit nVidias Vorbereitung für MCM im Consumer-Markt darstellt – nur die Sache mit dem Durchsägen dürfte man wohl lassen bzw. führt eben nicht zum GB203-Chip.

So GB202 is not 2x GB203 confirmed?
Quelle:  Muxim @ X am 2. Juni 2024
 
Yes.
Quelle:  Kopite7kimi @ X am 2. Juni 2024

Jene Konstruktion des GB203-Chips mit nur 44% so viel Shader-Clustern wie der direkt darüberliegende GB202-Chip wäre zudem arg seltsam. Da muß man schon sehr weit zurückgehen in der Geschichte der 3D-Grafikkarten, um ein solches Verhältnis eventuell wiederfinden zu können. Normalerweise gilt eigentlich die doppelte Anzahl an Recheneinheiten als goldene Regel für den nächstgrößeren Chip, in den letzten Jahren gab es zudem einige Beispiele, wo der nächstgrößere Chip nur um die 40-70% mehr Recheneinheiten erhalten hat. Mit einem wie dargestellt (nominell) schwachen GB203-Chip kann nVidia eigentlich nicht viel reißen bzw. muß man sich enorm auf die Effekte von eventuellem Mehrtakt sowie von Architektur-Verbesserungen verlassen, um mit dem GB203-Chip noch eine beachtbare Mehrleistung gegenüber der GeForce RTX 4080 Super auf die Beine stellen zu können. Natürlich sind diese beiden Effekt derzeit unbekannt, ergo existieren doch noch gewisse Möglichkeiten.

Das eigentliche Problem an dieser Leaker-Aussage ist allerdings, dass sich diese ungünstige Ansetzung weiter durchs Blackwell-Portfolio nach unten ziehen dürfte. Wenn die Blackwell-Chips fast durchgehend dieselbe Anzahl an Raster-Engines tragen sollen und GB203 mit 84 Shader-Clustern schon feststeht, dann können die unteren Blackwell-Chips kaum mehr Shader-Cluster als ihre jeweiligen Ada-Lovelace-Vorgänger tragen. Zumindest beim GB205 sind somit 60 Shader-Cluster schon nahezu feststehend – mehr kann es kaum sein, denn dies würde den Abstand zum GB203-Chip zu sehr verengen. Eher denkbar könnten GB206 & GB207 maßvoll mehr Shader-Cluster als AD106 & AD107 mitbringen. Insbesondere der GB206-Chip könnte einen etwas kleineren Abstand zum GB205-Chip vertragen, nachdem sich in der Praxis zwischen AD106 und AD104 wohl doch ein zu großer Abstand aufgetan hat (36 → 60 SM, 128-bit → 192-bit).

GB207 GB206 GB205 GB203 GB202
bisheriger Stand wahrscheinlich 2 GPC, 28/32 SM, 96/128-bit wahrscheinlich 3 GPC, 42/48 SM, 128-bit wahrscheinlich 4 GPC, 64 SM, 192-bit angeblich 6 GPC, 96 SM, 256-bit angeblich 12 GPC, 192 SM, 512-bit
neuer Stand wahrscheinlich 2 GPC, 24/28 SM, 96/128-bit angeblich 3 GPC, 36/42 SM, 128-bit angeblich 5 GPC, 60 SM, 192-bit angeblich 7 GPC, 84 SM, 256-bit angeblich 12 GPC, 192 SM, 512-bit
Änderung weniger SM als frühere Gerüchte, keine bis geringe Verbesserung gegenüber Ada weniger SM als frühere Gerüchte, keine Verbesserung gegenüber Ada weniger SM als frühere Gerüchte, marginale Verbesserung gegenüber Ada keine

Diese Auslegung würde allerdings auch bedeuten: Bis auf den GB202-Chip bewegt sich bei Gaming-Blackwell an der nominellen Hardware sehr wenig, nur mit einer gewissen Chance auf geringe Verbesserungen bei den kleinsten Blackwell-Chips. Unsicher ist noch die Frage des Level2-Caches, hier könnte nVidia natürlich doch noch zulegen, dieser Punkt ist bislang bei keiner Gerüchtemeldung ausgebreitet worden. Dennoch würde hiermit gelten: Bis auf GB202 müssten alle Blackwell-Chips weitergehend mit Mehrtakt und Architektur-Verbesserungen auskommen, die große Hardware-Offensive wäre Gaming-Blackwell somit nicht. Und dies käme dann doch überraschend, weil derartig schwache Hardware-Verbesserungen ist man von nVidia eigentlich nicht gewohnt, da gab es immer doch wenigstens mittelprächtige Zugewinne.

Denkbarerweise ruht nVidia sich hier stark auf den einmal errungenen Lorbeeren aus, weiss um seine sichere Marktposition und die geringe Durchschlagskraft der kommenden Grafik-Projekte von AMD & Intel (RDNA4 & Battlemage). In einer sicheren Lage Luft zu holen, Gewinne mitzunehmen (über niedrige Kosten wegen geringem Hardware-Aufwand) und dann die nachfolgende Generation um so glänzender aussehen zu lassen, kann durchaus eine Strategie sein. Allerdings würde jene Strategie hiermit gänzlich auf die Spitze getrieben werden, gerade nachdem Gaming-Blackwell letztlich auch nur unter einem 5nm-Derivat gefertigt wird – wie Ada Lovelace und damit ein weiterer Punkt, wo es keinen großen Verbesserungs-Schritt geben würde.

Vorerst verbleibt noch das Prinzip Hoffnung: Dass nVidia bei Mehrtakt und Architektur-Verbesserungen erhebliches gelingen möge. Dass die Einheiten-Anzahl nichts zur Performance aussagt, weil vielleicht mehr eigentliche Recheneinheiten in den Shader-Clustern enthalten sind (rein spekulativ). Oder dass Kopite7kimi sich hierbei irrt und nVidia nicht mit einem derartigen "Mager-Konzept" antreten würde. Noch ist dies alles offen, was hiermit wiedergegeben wurde, ist nur der aktuelle Stand der (fehlbaren) Gerüchteküche. Allerdings scheint es diesesmal nicht mehr ganz so gut zu klappen mit zielführenden Chip-Spezifikationen vorab, so wie man dies von "Ampere" und "Ada Lovelace" inzwischen gewohnt war. Denn GB202 & GB203 haben ihren Tape-Out bereits hinter sich, die restlichen Blackwell-Chips dürften ihr Design-Ende auch schon erreicht haben – und dennoch gibt dato noch keinen Leak mit vollständigen sowie feststehenden Chip-Spezifikationen hierzu.

Raster-Engines Shader-Cluster Speicherinterface max. Speicher Ada-Vorgänger SM vs Vorg.
GB202 angeblich 12 angeblich 192 angeblich 512 Bit 32 GB AD102: 12 GPC, 144 SM, 384 Bit, 24 GB GDDR6X +33%
GB203 angeblich 7 angeblich 84 angeblich 256 Bit 16 GB AD103: 7 GPC, 80 SM, 256 Bit, 16 GB GDDR6X +5%
GB205 angeblich 5 wahrscheinlich 60 angeblich 192 Bit 12 GB AD104: 5 GPC, 60 SM, 192 Bit, 12 GB GDDR6X ±0
GB206 angeblich 3 wahrscheinlich 36 oder 42 wahrscheinlich 128 Bit 8/16 GB AD106: 3 GPC, 36 SM, 128 Bit, 8 GB GDDR6 ±0/+17%
GB207 wahrscheinlich 2 wahrscheinlich 24 oder 28 96 oder 128 Bit 6-16 GB AD107: 3 GPC, 24 SM, 128 Bit, 8 GB GDDR6 ±0/+17%
Hinweis: Angaben zu noch nicht offiziell vorgestellter Hardware basieren auf Gerüchten & Annahmen ... "max. Speicher" bezogen auf 2GByte-Chips