1

Gerüchteküche: Mögliche Hardware-Daten zu nVidias Ada-Lovelace-Grafikchips aufgetaucht

Twitterer Kopite7kimi hat im Zuge der mit dem nVidia-Hack öffentlich gewordenen nVidia-internen Dokumente eine hochinteressante Aussage zur grundsätzlichen Hardware-Ansetzung der Grafikchips von nVidias "Ada"-Architektur (bisher bekannt als "Lovelace"-Architektur) getätigt: Danach sollen die Ada-Chips (augenscheinlich von oben nach unten gezählt) über 144, 96, 48 und 32 Shader-Cluster verfügen. Da zum "Ada"-Topchip AD102 dessen 144 Shader-Cluster bereits seit langem bekannt sind, treffen die nachfolgenden Angaben somit augenscheinlich auf die weiteren "Ada"-Chips AD103, AD104 und AD106 zu. Fehlend sind somit noch Angaben zu den "Ada"-Chips AD107 und AD10B, wobei letzterer sowieso nur in Tegra-Gefilde gehen soll.

The early configs are 144, 96, 48, 32SMs.
Quelle:  Kopite7kimi @ Twitter am 1. März 2022

Hardware Interface Speicher Grafikkarten Vorgänger
AD102 12 GPC, 144 SM  (18'432 FP32) 384 Bit 24 GB womögl. GeForce RTX 4080 & 4090 GA102: 84 SM @ 384 Bit
AD103 96 SM  (12'288 FP32) womögl. 320 Bit womögl. 20 GB womögl. GeForce RTX 4060 Ti & 4070 GA103: 60 SM @ 320 Bit
AD104 48 SM  (6144 FP32) womögl. 256 Bit womögl. 16 GB womögl. GeForce RTX 4060 GA104: 48 SM @ 256 Bit
AD106 32 SM  (4096 FP32) womögl. 192 Bit womögl. 12 GB womögl. GeForce RTX 4050 GA106: 30 SM @ 192 Bit
Anmerkung: Angaben zu noch nicht vorgestellter Hardware basieren auf Gerüchten & Annahmen

Leider wird aus dem Tweet nicht ganz klar, inwiefern diese Angaben tatsächlich aus jenem nVidia-Hack stammen. Allerdings kennt sich der Twitterer erwiesenermaßen in solcherart Dingen aus und veröffentlich üblicherweise nur ziemlich handfeste Angaben. Eine hundertprozentige Gewissheit gibt es somit noch nicht, aber zumindest hören sich diese Hardware-Daten erst einmal nicht gänzlich absurd an. Auffallend ist sicherlich der große Unterschied zwischen AD103 und AD104 mit der doppelten Anzahl an Shader-Clustern. Aber sofern nVidia den AD103-Chip nicht wie in der Ampere-Generation (GA103) reichlich verspätet bringt, könnte jener AD103 schlicht das Performance-Segment der 70er Lösungen bei nVidia (in diesem Fall die "GeForce RTX 4070") deutlich nach oben bringen. Eine GeForce RTX 4070 auf Basis des AD104-Chips scheint hingegen kaum vorstellbar, denn der AD104-Chip trägt letztlich nur die gleiche Hardware wie der GA104-Chip der GeForce RTX 3070.

Ergo ist die einzige logische Auflösung, dass alle Grafikkarten außerhalb von GeForce RTX 4080 & 4090 jeweils eine Chip-Klasse nach oben rutschen – erst dann ergibt sich auch für die kleineren Ada-Grafikkarten ein gehöriger Sprung bei der Anzahl der Hardware-Einheiten, so wie zwischen den GA102- und AD102-Chips an der Leistungsspitze. Eine GeForce RTX 4050 tritt dann mit (bis zu) 32 Shader-Clustern an (bislang 20 SM bei der GeForce RTX 3050), eine GeForce RTX 4060 mit (bis zu) 48 Shader-Clustern (bislang 28 SM bei der GeForce RTX 3060) und eine GeForce RTX 4070 mit (bis zu) 96 Shader-Clustern (bislang 46 SM bei der GeForce RTX 3070). Allerdings steht zu erwarten, dass nVidia aus Yield-Gründen bei der Chipfertigung kaum eine GeForce RTX 40 Grafikkarte im Vollausbau des jeweiligen Grafikchips ins Rennen schickt – es sind durchgehend Abspeckungen von 2-4 Shader-Cluster gegenüber dem Vollausbau des zugrundeliegenden Grafikchips zu erwarten.

Ampere / GeForce RTX 30 Ada / GeForce RTX 40
GeForce RTX 3090:  82 SM GeForce RTX 4090:  140-142 SM  (+71+73%)
GeForce RTX 3070:  46 SM GeForce RTX 4070:  92-94 SM  (+100+104%)
GeForce RTX 3060:  28 SM GeForce RTX 4060:  44-46 SM  (+57-64%)
GeForce RTX 3050:  20 SM GeForce RTX 4050:  28-30 SM  (+40-50%)
Anmerkung: Rein spekulative Ausgestaltung des GeForce RTX 40 Portfolios!

Hinzu kommt zu diesem deutlich höheren Hardware-Ansatz dann natürlich noch der Taktraten-Sprung, welchen nVidia durch den Wechsel von Samsungs 8nm-Fertigung zu TSMCs 5nm-Fertigung erzielen kann. Im Gespräch sind derzeit Taktraten von um die 2.2 GHz – was grob dem von AMD bei der RDNA2-Generation erzielten Niveau entspricht. In Verbindung von beiden Effekte sollte grob eine Verdopplung der Rohleistung der Ada-Generation gegenüber der Ampere-Generation herauskommen – in einigen Grafikkarten-Vergleichen je nach Chip-Ansetzung vielleicht auch mehr als dass (Hinweis: Rohleistung ist nicht gleich Spiele-Performance). Unsicher ist, mit wieviel Stromverbrauch das ganze dann einhergeht, die bisherigen Hinweise hierzu deuten eher auf ziemliche Schluckspechte innerhalb der Ada-Generation hin. Unklar ist genauso, wie nVidia die Speicherbandbreite für so viel Rohleistung zur Verfügung stellen will, wenn man weiterhin mit einem 384-Bit-Interface beim AD102-Chip rechnen soll und die kleineren Chips demzufolge auch keine größeren Interface erhalten werden.

Sicherlich kann nVidia durch höhere Speichertaktraten noch einiges mehr an Speicherbandbreite erzielen, allerdings ist dieser Weg auch endlich und zugleich wiederum mit steigendem Stromverbrauch verbunden (auf Seiten des Speicherinterfaces, nicht direkt beim Speicher). Eventuell bekommt ein früherer Tweet somit nochmals eine größere Bedeutung, in welchem Kopite7kimi bereits Ende 2020 von "größeren Caches" bei der Ada-Architektur sprach. Womöglich geht nVidia hier den Weg von AMD mit der RDNA2-Architektur und deren "Infinity Cache", welcher AMD zweifelsfrei gravierend dabei geholfen hat, die bei AMD eigentlich traditionell größeren Speicherinterface speziell bei den RDNA2-Chips vergleichsweise klein zu halten. Wie bekannt, ist mit dem Start von nVidias "Ada"-Generation über den Release des AD102-Chips im September 2022 zu rechnen, die restlichen GeForce RTX 40 Grafiklösungen sollten dann bis in das Frühjahr 2023 hinein erscheinen.

    nVidia "Ada" Architektur

  • benannt nach "Ada Lovelace"
  • Zielsetzung: Gaming-Grafikkarten
  • Grafikchips: AD102, AD103, AD104, AD106, AD107 & AD10B (letzterer wohl nur für Tegra)
  • 5nm-Fertigung von TSMC
  • keine grundsätzlich gegenüber "Ampere" abweichende Grafikchip-Architektur (allerdings "größere Caches")
  • deutlich höhere Taktraten durch den Wechsel zu Chipfertiger TSMC
  • Verkaufsname: GeForce RTX 40 Serie
  • Release: Ada-Start zu erwarten im September 2022, die komplette Grafikkarten-Serie dürfte dann bis Anfang 2023 ausgebreitet werden

Nachtrag vom 1. März 2022

Das kürzlich ausgebreitete spekulative GeForce RTX 40 Portfolio basiert zwar auf den seitens Kopite7kimi @ Twitter genannten Hardware-Spezifikationen der "Ada"-Generation, setzt allerdings auch maßgeblich auf die unbestätigte Annahme, die GeForce RTX 4080 würde wiederum auf dem Top-Chip des Portfolios basieren, in diesem Fall dem AD102-Chip. Dies gilt bislang sogar als allgemeine Annahme, muß aber letztlich gar nicht derart passieren. nVidia könnte auch den ungewöhnlich starken AD103-Chip für die GeForce RTX 4080 benutzen – so, wie der GA103-Chip einmal für die GeForce RTX 3080 gedacht war, nVidia sich dann jedoch für eine etwas stärkere Hardware auf Basis des GA102-Chips entschied. Im Fall des GeForce RTX 40 Portfolio muß dies nicht wieder passieren, der AD103-Chip erscheint stark genug für eine GeForce RTX 4080 – womit GeForce RTX 4060 Ti & 4070 jeweils eine Hardware-Stufe nach unten rutschen würden.

Hardware Portfolio-Idee #1 Portfolio-Idee #2
AD102 144 SM @ 384 Bit GeForce RTX 4090:  ~140 SM @ 384 Bit, 24 GB
GeForce RTX 4080:  ~116 SM @ 320 Bit, 20 GB
GeForce RTX 4090:  ~140 SM @ 384 Bit, 24 GB
AD103 96 SM @ 320 Bit GeForce RTX 4070:  ~90 SM @ 320 Bit, 20 GB
GeForce RTX 4060 Ti:  ~68 SM @ 256 Bit, 16 GB
GeForce RTX 4080:  ~94 SM @ 320 Bit, 20 GB
GeForce RTX 4070:  ~78 SM @ 256 Bit, 16 GB
GeForce RTX 4060 Ti:  ~60 SM @ 256 Bit, 16 GB
AD104 48 SM @ 256 Bit GeForce RTX 4060:  ~46 SM @ 256 Bit, 16 GB GeForce RTX 4060:  ~46 SM @ 256 Bit, 16 GB
AD106 32 SM @ 192 Bit GeForce RTX 4050:  ~30 SM @ 192 Bit, 12 GB GeForce RTX 4050:  ~30 SM @ 192 Bit, 12 GB
Anmerkung: Rein spekulative Ausgestaltungen des GeForce RTX 40 Portfolios!

Der einzige Nachteil dieses zweiten denkbaren Portfolios wäre, dass der AD102-Chip somit allein für die GeForce RTX 4090 produziert werden würde, abseits einer eventuellen, bislang unbestätigten "GeForce RTX 4080 Ti". Ansonsten erscheint diese zweite denkbare Portfolio-Ausgestaltung (auf Basis dieser Hardware-Spezifikationen der Ada-Grafikchips) sogar als besser ausgewogen als die erste. Stimmen muß hieran natürlich gar nichts: Weder sind die Spezifikationen der einzelnen Ada-Grafikchips gesichert (vielleicht abseits des AD102, welcher schon lange mit 144 Shader-Cluster vermeldet wird), noch dürfte nVidia derzeit überhaupt schon die Spezifikationen der einzelnen GeForce-40-Grafikkarten wirklich festgezimmert haben. Dies wird die Aufgabe der entsprechenden Produkt-Teams nach dem (erfolgreichen) Tape-Out samt Validierung jener Ada-Grafikchips sein – deren Tape-Outs zwar derzeit stattfinden sollten, von denen man allerdings immer noch nichts gehört hat.

Nachtrag vom 2. März 2022

Dieser Artikel wird mit einem nachfolgenden Artikel vom 2. März mit aktualisierten & korrigierten Hardware-Daten zu nVidias "Ada" Grafikchip-Generation obsolet.