Leaker Kopite7kimi @ X [1] hat nun endlich die grundsätzlichen Hardware-Daten der Consumer-Chips von nVidias "Blackwell"-Generation [2] bekanntgegeben, denkbarerweise basierend auf finalen Informationen beispielsweise nach den ersten abgeschlossenen Tape-Outs. Die Gerüchteküche hatte sich vorab zwar schon im Fall der beiden größeren Chips an den aktuellen Stand herangerobbt, musste dafür aber dennoch den einen oder anderen Irrweg nehmen – was nunmehr hoffentlich vorbei ist. Gegenüber dem letzten Stand [3] ändert sich nur etwas dort, wo noch keine Gerüchtedaten vorlagen und man sich daher mit Annahmen weiterhelfen musste. Jene Annahmen lagen beim GB206-Chip richtig, bei den GB205- und GB207-Chip hingegen falsch: Insbesondere die GB205-Hardware ist nochmals etwas kleiner als bislang angenommen, womit sich nunmehr zumindest eine solide Erklärung der Namenswahl ergibt.
GB202 12*8 512-bit GDDR7
GB203 7*6 256-bit GDDR7
GB205 5*5 192-bit GDDR7
GB206 3*6 128-bit GDDR7
GB207 2*5 128-bit GDDR6
Quelle: Kopite7kimi @ X [1] am 11. Juni 2024
Zu lesen sind diese Daten im Sinne von "GPC x TPC", sprich Raster-Engines mal Texturen-Cluster. Da jeder Texturen-Cluster bei nVidia traditionell zwei Shader-Cluster enthält, ergeben sich beispielsweise aus den Daten des GB202-Chip somit 12 Raster-Engines mit je 8 Texturen-Cluster und 16 Shader-Cluster, ergo 192 Shader-Cluster insgesamt. Nicht irritieren lassen muß man sich im übrigen von der Angabe "GDDR6" beim GB207-Chip: Laut Nachfrage soll der Grafikchip selber nicht an diese Speichersorte gebunden sein, kann also denkbarerweise auch GDDR7 unterstützen. Möglicherweise nutzt nVidia diese Möglichkeit schlicht nur nicht bei den anfänglichen Desktop-Modellen aus. Ein anderer Hinweis auf die GDDR7-Fähigkeit von GB207 kommt von der kürzlichen Clevo-nVidia-Roadmap [4]: Da dort die Grafikchip-Codenamen jedoch nicht explizit genannt wurden und die Roadmap zudem einigermaßen alt ist, ergibt sich daraus noch keine erschöpfende Gewißheit.
GB207 is limited to GDDR6?
Quelle: MEGAsizeGPU @ X [5] am 11. Juni 2024
Probably not.
Quelle: Kopite7kimi @ X [6] am 11. Juni 2024
In der Summe der Dinge tritt somit der GB202-Chip wie erwartet mit einigermaßen stärkerer Hardware an, der GB203-Chip wie auf seinen zuletzt heruntergestuften Spezifikationen, der GB205-Chip deutlich kleiner als erwartet und vor allem kleiner als der AD104-Chip, der GB206-Chip nur auf dem Niveau von dessen Ada-Lovelace-Vorgänger und der GB207-Chip dann sogar noch leicht unterhalb des Niveaus seines Ada-Lovelace-Vorgängers. Außerhalb des GB202 ist das Chip-Portfolio von "Gaming-Blackwell" somit eher ein Trauerspiel: 1x gibt es dieselbe Hardware wie bei "Ada Lovelace", 1x nur minimal mehr (aber auch nur begünstig durch einen Fehler im AD103-Design, welcher bei GB203 dann behoben ist) und 2x sogar beachtbar weniger Hardware als in der Vorgänger-Generation. Selbstverständlich ist die Anzahl der Recheneinheiten (bei weitem) nicht alles, aber mit einem derart schwachen Hardware-Sprung ist nVidia eigentlich noch nie angetreten.
Chip | Raster-Engines | Shader-Cluster | Speicherinterface | max. Speicher | Ada-Vorgänger | SM vs Vorg. |
---|---|---|---|---|---|---|
GB202 | angeblich 12 | angeblich 192 | angeblich 512 Bit GDDR7 | 32 GB | AD102: 12 GPC, 144 SM, 384 Bit, 24 GB GDDR6X | +33% |
GB203 | angeblich 7 | angeblich 84 | 256 Bit GDDR7 | 16 GB | AD103: 7 GPC, 80 SM, 256 Bit, 16 GB GDDR6X | +5% |
GB205 | angeblich 5 | angeblich 50 | 192 Bit GDDR7 | 12 GB | AD104: 5 GPC, 60 SM, 192 Bit, 12 GB GDDR6X | –17% |
GB206 | angeblich 3 | angeblich 36 | 128 Bit GDDR7 | 8/16 GB | AD106: 3 GPC, 36 SM, 128 Bit, 8 GB GDDR6 | ±0 |
GB207 | angeblich 2 | angeblich 20 | 128 Bit GDDR7 | 8/16 GB | AD107: 3 GPC, 24 SM, 128 Bit, 8 GB GDDR6 | –17% |
Hinweis: Angaben zu noch nicht offiziell vorgestellter Hardware basieren auf Gerüchten & Annahmen ... "max. Speicher" bezogen auf 2GByte-Chips |
Vor allem überrascht dabei das Ungleichgewicht des Hardware-Sprungs innerhalb jenes Blackwell-Portfolios: Bei den vier kleineren Grafikchips ändert sich nichts oder wird es weniger, beim Spitzen-Chip gibt nVidia dann allerdings doch ein Drittel mehr Shader-Cluster sowie ein größeres Speicherinterface hinzu. Letzteres wäre eigentlich nicht notwendig, wenn nVidia angenommenerweise einen riesigen Sprung bei IPC und/oder Taktraten erreicht hätte. Die Existenz jenes Hardware-Sprungs beim GB202-Chip deutet somit eher nicht darauf hin, dass nVidia hier einen besonders großen IPC-Sprung hinlegt, bei den Taktraten ist dies auf Basis der 4nm-Fertigung schon per se nicht zu erwarten. Damit kommt der GB202-Chip in einer frühen Performance-Prognose zwischen mittelprächtig und gutklassig heraus, alle kleineren Blackwell-Grafikchips hingegen zwischen schwach bis bestenfalls unterdurchschnittlich.
Um hieraus dennoch ein griffiges Grafikkarten-Angebot (mit echter Mehrperformance auf allen Positionen) zu machen, müsste nVidia wahrscheinlich zum Mittel des Hochsetzens der Grafikchips innerhalb des Portfolio-Aufbaus greifen. Sprich, unterhalb der GeForce RTX 5090 müssten alle weiteren RTX50-Modelle die gegenüber dem Ada-Lovelace-Vorgänger jeweils um eine Stufe verbesserte Grafikchip-Ausführungen erhalten – so die GeForce RTX 5080 nicht auf dem zweitbesten Grafikchip, sondern einer Salvage-Variante des stärksten Chips basieren. Hiermit würde nVidia auch die Problematik eines VRAM-Stillstands ersticken, da es dann wenigstens ab der GeForce RTX 5060 Ti jeweils mehr Speicher sowie wenigstens ab 12 GB VRAM geben würde. Ob nVidia ein solches "inspirierendes" Blackwell-Portfolio auflegt, ist derzeit natürlich rein spekulativ. Allerdings dürfte man die grundsätzliche Richtung wohl schon vergleichsweise früh erkennen können: Kommt die GeForce RTX 5080 auf Basis des GB203-Chips, geht es in Richtung des konventionellen Portfolios. Ist die Chip-Basis hingegen der GB202, steht alles zugunsten des "inspirierenden" Portfolios.
(initiales) Ada-Lovelace-Portfolio | konventionelles Blackwell-Portfolio | "inspirierendes" Blackwell-Portfolio |
---|---|---|
GeForce RTX 4090 AD102, 128 SM @ 384 Bit, 24 GB GDDR6X |
GeForce RTX 5090 GB202, 150-170 SM @ 448 Bit, 28 GB GDDR7 |
GeForce RTX 5090 GB202, 160-170 SM @ 448 Bit, 28 GB GDDR7 |
GeForce RTX 4080 AD103, 76 SM @ 256 Bit, 16 GB GDDR6X |
GeForce RTX 5080 GB203, ~80 SM @ 256 Bit, 16 GB GDDR7 |
GeForce RTX 5080 GB202, ~120-130 SM @ 256/320 Bit, 16-20 GB GDDR7 |
GeForce RTX 4070 Ti AD104, 60 SM @ 192 Bit, 12 GB GDDR6X |
GeForce RTX 5070 Ti GB203, ~60 SM @ 192/256 Bit, 12/16 GB GDDR7 |
GeForce RTX 5070 Ti GB203, ~80 SM @ 256 Bit, 16 GB GDDR7 |
GeForce RTX 4070 AD104, 46 SM @ 192 Bit, 12 GB GDDR6X |
GeForce RTX 5070 GB205, 48 SM @ 192 Bit, 12 GB GDDR7 |
GeForce RTX 5070 GB203, ~60 SM @ 192/256 Bit, 12/16 GB GDDR7 |
GeForce RTX 4060 Ti AD106, 34 SM @ 128 Bit, 8/16 GB GDDR6 |
GeForce RTX 5060 Ti GB206, 34 SM @ 128 Bit, 8/16 GB GDDR7 |
GeForce RTX 5060 Ti GB205, 48 SM @ 192 Bit, 12 GB GDDR7 |
GeForce RTX 4060 AD107, 24 SM @ 128 Bit, 8 GB GDDR6 |
GeForce RTX 5060 GB207/GB206, 20-24 SM @ 128 Bit, 8 GB GDDR6 |
GeForce RTX 5060 GB206, 34 SM @ 128 Bit, 8/16 GB GDDR7 |
Hinweis: rein hypothetischer Aufbau des "Blackwell"-basierten Portfolios an Desktop-Grafikkarten |
Verweise:
[1] https://x.com/kopite7kimi/status/1800437391519551830
[2] http://www.3dcenter.org/news/nvidia-blackwell
[3] http://www.3dcenter.org/news/geruechtekueche-nvidias-gb205-gb203-wohl-nicht-mit-staerkerer-hardware-als-ad103-ad104
[4] http://www.3dcenter.org/news/clevo-roadmap-bestaetigt-die-unveraenderte-speicherinterface-breite-der-kleineren-blackwell-chi
[5] https://x.com/Zed__Wang/status/1800442609976115618
[6] https://x.com/kopite7kimi/status/1800444962838032394