28

Gerüchteküche: nVidias GB203 könnte auch mittels Durchsägen des GB202-Chips gewonnen werden

Aussagen von Twitterer & Leaker 'Kopite7kimi' haben die Diskussion neu angestoßen, wie die beiden Top-Chips von "Gaming-Blackwell" GB202 & GB203 zu verstehen sind. Wie bekannt, trägt der GB202-Chip die glatt doppelte Hardware des GB203-Chips – was immer schon die Vermutung ins Kraut hat schießen lassen, nVidia würde beim GB202 auf ein MultiChip-Konstrukt setzen. Dem gegenüber hatte der Leaker kürzlich aber noch einmal die monolithische Fertigung des GB202-Chips betont. In einem Nachtrag bezeichnete der Leaker den GB202-Chip allerdings auch als "logischerweise" zweimal GB203 entsprechend. Und dies dürfte ganz wörtlich zu verstehen sein: GB202 muß somit wie zwei zusammengepappte GB203 aufgebaut sein – nur wird dies alles zusammen als ein Chip gefertigt und nicht aus zwei Einzelchips kreiiert.

Do we know if GB202 is a MCM or monolithic design?
Quelle:  Dalton Mariano @ X am 23. Mai 2024
 
physically monolithic
Quelle:  Kopite7kimi @ X am 23. Mai 2024
 
Are they some kind of 2 x gb203?
Quelle:  CRSC @ X am 27. Mai 2024
 
Logically.
Quelle:  Kopite7kimi @ X am 27. Mai 2024

Ein weiterer Twitterer hat sich hiermit auseinandergesetzt und zeigt spekulativ auf, wie so etwas konkret aussehen könnte: Beide Chip-Hälften des GB202-Chips enthalten faktisch die komplette Hardware des GB203-Chips und sind über Interconnects miteinander verbunden. Bezüglich Cache und Speicherinterface stehen beiden Chiphälften jeweils nur die Hälfte des Gesamtchips zur Verfügung, was somit durchaus nicht so stark bzw. effektiv ist wie ein doppelt so großer Level2-Cache bzw. ein doppelt so breites Speicherinterface. Aber nVidia kann sich diesen gewissen Effizienz-Verlust gerade in dieser Chip-Generation leisten, da von AMD & Intel keinerlei Gegenwehr an der Leistungsspitze zu erwarten ist. Jene spekulative Beschreibung passt recht gut zu den Aussage von 'Kopite7kimi', wonach GB203 zwar physikalisch monolithisch ist, aber logisch gesehen doch wie aus zwei Einzelchips bestehend daherkommt.

I guess imagine a single chip, with a thin line that is splits the internal structures into 2. The cache is also split but is interconnected by a crossbar structure. The entire design is fanned as one chip so monolithic but logically it may as well be MCM.
Quelle:  MonkeyDrSentech @ X am 28. Mai 2024
 
Each internal island has access to half the cache, 256 bit bus and 16GB VRAM at high speed than accessing the other half with a latency penalty. As for scheduling, I have no idea how they redesigned the gigathread engine but gaming Blackwell would likely have just one normal one.
Quelle:  MonkeyDrSentech @ X am 28. Mai 2024

Natürlich darf sich hieran die Frage nach dem Sinn anschließen – welcher lange Zeit im verborgenen lag und nunmehr erst durch die Diskussion über diese Chip-Gestaltung langsam auf die wahrscheinlich richtige Spur einbiegt. Zum einen handelt es sich sicherlich um eine gewisse Vorarbeit auf die MCM-Zukunft auch bei Consumer-Grafikchips. Ein Beispiel hierfür ist das Aufbau des früheren GA100-Chips der Ampere-Generation, welcher gemäß der annotierten Die-Shots von Locuza @ Substack grob wie ein DualChip-Konstrukt wirkt, gegossen aber eben in einen einzelnen Chip. Seinerzeit hat nVidia die augenscheinliche Vorabeit für die jetzigen MCM-Konstrukte im HPC/AI-Segment geliefert – wie wenn der GB100-Chip aus zwei Einzelchips besteht, welche mittels leistungsfähigem Die-to-Die-Interconnect verbunden sind. Selbige MCM-Lösungen sind somit zukünftig auch für Consumer-Grafikchips zu erwarten, wenn nVidia hierfür mittels GB202 die technologische Vorarbeit leistet.

Daneben gibt es aber auch eine praktische wie auch jetzt schon wirkende Bewandtnis: Denn zwar kann nVidia hiermit nicht einen GB202-Chip aus zwei GB203-Chips zusammenkleben. Jedoch kann nVidia zwei GB203-Chips aus einem GB202-Chip generieren, wenn man letzteren genau in der Mitte (beim Interconnect zwischen den beiden Chiphälften) durchsägt. Was sich zuerst etwas schräg anhört, ist Arbeits-technisch das normalste von der Welt, schließlich werden alle Einzelchips aus kompletten Wafern (mit vielen Chips) herausgeschnitten. Natürlich muß der halbierte Chip darauf vorbereitet sein, als Einzelchip arbeiten zu können: Dafür muß jener alle benötigten Chip-Teile mitbringen, sprich normalerweise nur singulär vorhandene Einheiten wie beispielsweise der Display-Controller müssten beim GB202-Chip tatsächlich doppelt vorhanden sein. Gleichzeitig darf an der Schnittkante nichts liegen, was noch gebraucht würde – wie eben der Interconnect, welcher nur vom GB202 benötigt wird. Der Gag an dieser durchaus wild klingenden These ist, dass jene von einer nicht nennbaren Quelle gegenüber 3DCenter ausdrücklich bestätigt wurde:

For GB202, maybe they cut the chip in real to get two GB203. Right idea?
3DCenter-Frage an Gerüchte-Quelle am 28. Mai 2024
 
yeah
Gerüchte-Quelle gegenüber 3DCenter am 28. Mai 2024

nVidia könnte somit durchaus komplett auf eine eigenständige Fertigung des GB203-Chips verzichten – und einfach nur GB202-Chips fertigen und jene dann nach Bedarf in GB203-Chips umwandeln. Dies kostet beim GB203-Silizium durchaus mehr Transistoren (für den Interconnect sowie alle singulären Chipteile in doppelter Ausführung) und bringt auch einen leicht größeren Verschnitt mit sich. Normalerweise denkt man nicht an so eine Möglichkeit, weil der Anteil der singulär notwendigen Chipteile (Display-Engine/Interface, PCIe-Controller/Interface, Video-Einheit, anderes) gar nicht einmal so wenig ist. Bei den ganz großen Grafikchips wie eben einem GB202 reduziert sich deren Anteil allerdings prozentual, da könnte diese Rechnung eventuell doch wieder aufgehen.

Denn immerhin könnte man sich damit den Tape-Out eines ganzen Grafikchips (GB203) einsparen, was heutzutage nicht wenig kostet (angeblich mindestens im achtstelligen Bereich, eventuell mehr). Die extra Validierungs-Arbeit muß aber wahrscheinlich trotzdem für einen "zusammengeschnittenen" GB203-Chip getan werden. Doch auch in der Massenfertigung ist ein Chip mit größerer Stückzahl leicht günstiger als zwei Chips, welche sich dieselbe Waferfläche teilen müssen. Sicher ist es allerdings überhaupt nicht, dass nVidia diesen Fertigungs-Weg geht – dies könnte auch nur ein Spielfeld für die nVidia-Ingenieure sein und für den wirklichen Bedarf legt nVidia lieber konventionell auch einen extra GB203-Chip auf. Technisch machbar soll diese Herstellungsform des GB203-Chips allerdings tatsächlich sein – was eine Art umgekehrtes MCM ergibt: Anstatt aus zwei kleineren Chips einen größeren zu formen, gewinnt man hier zwei kleinere Chips aus einem großen.

Raster-Engines Shader-Cluster Speicherinterface max. Speicher Ada-Vorgänger SM vs Vorg.
GB202 angbl. 12 angbl. 192 angbl. 512 Bit 32 GB AD102: 12 GPC, 144 SM, 384 Bit, 24 GB GDDR6X +33%
GB203 angbl. 6 angbl. 96 angbl. 256 Bit 16 GB AD103: 7 GPC, 80 SM, 256 Bit, 16 GB GDDR6X +20%
GB205 whrschl. 4 whrschl. 64 angbl. 192 Bit 12 GB AD104: 5 GPC, 60 SM, 192 Bit, 12 GB GDDR6X +7%
GB206 whrschl. 3 möglw. 42 oder 48 whrschl. 128 Bit 8/16 GB AD106: 3 GPC, 36 SM, 128 Bit, 8 GB GDDR6 +17/33%
GB207 whrschl. 2 möglw. 28 oder 32 96 oder 128 Bit 6-16 GB AD107: 3 GPC, 24 SM, 128 Bit, 8 GB GDDR6 +17/33%
Hinweis: Angaben zu noch nicht offiziell vorgestellter Hardware basieren auf Gerüchten & Annahmen ... "max. Speicher" bezogen auf 2GByte-Chips

Nachtrag vom 28. Mai 2024

Eine andere Begründung, wieso nVidia beim GB203-Chip auf das System eines "umgekehrten MCM" gehen könnte, kommt aus dem 3DCenter-Forum: Hierbei wird die These aufgestellt, dass GB202 tatsächlich als MCM geplant war, diese Konzeption dann allerdings wegen der limitierten Advanced-Packaging-Kapazitäten aufgegeben wurde – jene werden wie bekannt dringend für die HPC/KI-Chips von nVidia benötigt. Der Ausweg aus diesem einmal vorhandenem Chip-Konzept (ohne eine komplette Neugestaltung) wäre schlicht gewesen, anstatt viele einzelne GB203 zu fertigen, jene im Dual-Pack als GB202 herzustellen und den GB203 durch aufsägen zu gewinnen. Dies spart primär das "Advanced Packaging" ein, weil GB202 somit weiterhin monolithisch gefertigt ist, auch wenn es logisch gesehen ein DualChip-Konstrukt ist. All dies sind derzeit natürlich nur bessere Thesen. Beweisen lassen wird sich dies erst durch explizite Aussagen nVidias – oder aber wenn der GB203-Chip geometrisch exakt so geformt ist, dass zwei GB203 zur Fläche von einem GB202 passen.

Vielleicht war GB202 tatsaechlich einmal als MCM Aufbau (= 2x GB203) geplant. Allerdings hat man ja schon seit einiger Zeit das Problem, dass eher das Packaging, als die Fertigung der Chips an sich, die Produktionskapazitaet limitiert. Darum nutzt man die wertvollen MCM-Packaging-Kapazitaeten lieber fuer die professionellen Produkte, wo man keine andere Moeglichkeit hat.
Im Gegenzug hat man bei GB202 den Interconnect einfach mit auf den Wafer geholt, was zwar die Produktion verteuert, aber dafuer keine MCM-Kapazitaeten belegt. Und nachdem man bei Ada schon festgestellt hat, dass die "Enthusiast"-Nutzer offenbar relativ schmerzfrei sind, was den Preis angeht, kann man die Mehrkosten auch einfach auf den Preis umlegen, ohne die Marge zu senken.

Quelle:  Reaping_Ant @ 3DCenter-Forum am 28. Mai 2024