23

Offizielle Chip-Daten zu nVidias AD103 & AD104

AnandTech-Mitarbeiter Ryan Smith gibt auf Twitter die offiziellen Chip-Daten zu den weiteren Ada-Lovelace-Grafikchips AD103 und AD104 bekannt, nachdem nVidia selbiges bislang nur für den AD102-Chip getan hatte. Die Daten stammen laut Hardwareluxx-Mitarbeiter Andreas Schilling augenscheinlich aus dem nVidia-Whitepaper zur Ada-Lovelace-Generation, sind also absolut offiziell. Notiert wird hiermit die Hardware dieser beiden Grafikchips im jeweiligen Vollausbau, zuzüglich Transistorenmenge und Chipfläche. Als Ergänzung kommt von Kopite7kimi noch eine (inoffizielle) Angabe zur AD106-Chipfläche von ~190mm², wobei zu diesem kleineren Ada-Chip noch keinerlei offizielle Hardware-Daten vorliegen.

AD103
Transistor count: 45.9B
80 SMs (10,240 CUDA cores)
64MB L2 cache
112 ROPs
Die size: 378.6mm2

Quelle:  Ryan Smith @ Twitter am 23. September 2022

AD104
Transistor count: 35.8B
60 SMs (7680 CUDA cores)
48MB L2 cache
80 ROPs
Die size: 294.5mm2
RTX 4080 12GB is a full AD104

Quelle:  Ryan Smith @ Twitter am 23. September 2022

Die offiziellen Hardware-Daten zu AD103 & AD104 entsprechend hingegen bis auf eine Abweichung komplett den aktuellen Vorhersagen von Kopite7kimi. Die einzige Abweichung liegt in der Anzahl der Shader-Cluster des AD103-Chips: Im nVidia-Whitepaper werden explizit 7 Raster-Engines mit 40 TPC und 80 Shader-Cluster angegeben, die Vorhersage belief sich auf 7 Raster-Engines mit jedoch 42 TPC und 84 Shader-Cluster. Was die letztgenannte Auslegung weiterhin stützt ist der Punkt, dass 80 Shader-Cluster nicht in 7 Raster-Engines passen, dies ergibt eine ungerade Anzahl (beispielsweise 5 GPC mit je 12 SM zuzüglich 2 GPC mit je 10 SM). So etwas baut man üblicherweise auf Chip-Ebene nicht – so dass dieser Punkt derzeit ein wenig in der Schwebe bleiben muß. Gänzlich unmöglich ist eine solche "krumme" Konstruktion keineswegs, aber auch ein einfacher Fehler bei der Erstellung des nVidia-Whitepapers bleibt möglich.

Für die aktuelle Hardware hat diese Frage zur exakten Anzahl der Shader-Cluster des vollen AD103-Chips keine Bewandtnis, die "GeForce RTX 4080 16GB" ist (mit 76 SM) so oder so eine Salvage-Ausführung dieses Grafikchips. Erkennen läßt sich mittels dieser Chip-Daten unter anderem die enorme Transistoren-Dichte, welche nVidia und Chipfertiger TSMC bei "Ada Lovelace" erreicht haben: Satte 121-125 Millionen Transistoren pro mm² Chipfläche, je nach Grafikchip. Hier dürfte natürlich der hochgezogene Level2-Cache seine Rolle gespielt haben, da sich Cache immer sehr gut packen läßt. Gleichfalls hat nVidia bei diesen Gaming-Grafikchips an den (deutlich schlechter packbaren) Interfaces gespart, so gibt es kein NVLink mehr und weiterhin nur PCI Express 4.0. Ein monströser Fertigungs-technischer Schritt gegenüber "Ampere" ergibt sich damit dennoch.

Pascal Turing Ampere Ada Lovelace
TSMC 16nm (2016) TSMC 12nm (2018) Samsung 8nm (2020) TSMC "4N" (2022)
GP102
12 Mrd. Tr. auf 471mm² (25M Tr./mm²)
TU102
18,6 Mrd. Tr. auf 754mm² (25M Tr./mm²)
GA102
28,3 Mrd. Tr. auf 628mm² (45M Tr./mm²)
AD102
76,3 Mrd. Tr. auf 608,5mm² (125M Tr./mm²)
- - GA103
? Mrd. Tr. auf ~496mm²
AD103
45,9 Mrd. Tr. auf 378,6mm² (121M Tr./mm²)
GP104
7,2 Mrd. Tr. auf 314mm² (23M Tr./mm²)
TU104
13,6 Mrd. Tr. auf 545mm² (25M Tr./mm²)
GA104
17,4 Mrd. Tr. auf 392mm² (44M Tr./mm²)
AD104
35,8 Mrd. Tr. auf 294,5mm² (122M Tr./mm²)
GP106
4,4 Mrd. Tr. auf 200mm² (22M Tr./mm²)
TU106
10,6 Mrd. Tr. auf 445mm² (24M Tr./mm²)
GA106
12,0 Mrd. Tr. auf 276mm² (43M Tr./mm²)
AD106
? Mrd. Tr. auf ~190mm²
"Tr." = Transistoren ...... GA103 & AD106: inoffizielle Angaben

Die Chip-Daten helfen zudem entscheidend weiter bei der Einordnung von nVidias RTX40-Portfolio, selbst wenn hierzu derzeit noch die unteren Modelle fehlen. Aber auch so läßt sich schon erkennen, dass nVidia letztlich wieder auf die Chipgrößen der "Pascal"-Ära zurück will – nachdem es bei "Turing" mangels besserer Fertigung sehr viel größere Chips gab und mittels "Ampere" dieser Größenanstieg nur maßvoll zurückgedreht werden konnte. In der Leistungsspitze sind die Ada-Chips zwar immer noch größer als seinerzeit bei "Pascal", aber nVidia versucht dagegen bei den mittleren und kleineren Grafikkarten die benutzten Chips und damit die verwendete Chipfläche wieder auf ein normales Maß zurückzubringen. So kommt der AD104-Chip auf gerade noch 294,5mm², ist somit sogar kleiner als der GP104-Chip mit seinerzeit 314mm².

Davon, dass nVidia damit nun eine "GeForce RTX 4080 12GB" kreiiert, sollte man sich allerdings nicht täuschen lassen. Praktisch gesehen handelt sich bei dieser Karte um die übliche 70er Klasse, nur mit (bewußt) "falsch" gewählten Namen. nVidia versucht damit die höhere Preislage dieser Karte zu rechtfertigen, gleichfalls hat diese Namenswahl (für nVidia) Vorteile bei den noch kommenden kleineren Lösungen des Portfolios: Ein (klarer) AD104-Salvage sollte somit zur "GeForce RTX 4070" werden, während der AD106-Chip als "GeForce RTX 4060" vermarktet werden dürfte. Damit bekommt nVidia dann endlich wieder seine 60er Massen-Lösung auf unter 200mm² Chipfläche gebacken – wenngleich unter Inkaufnahme des geringsten Performance-Vorteils der gesamten RTX40-Generation.

Pascal Turing Ampere Ada Lovelace
1080Ti
GP102 (Salvage)
471mm² (16nm)
2080Ti
TU102 (Salvage)
754mm² (12nm)
3090
GA102 (nahezu Vollausbau)
628mm² (8nm)
4090
AD102 (Salvage)
608,5mm² (4nm)
1080
GP104 (Vollausbau)
314mm² (16nm)
2080
TU104 (nahezu Vollausbau)
545mm² (12nm)
3080 10GB
GA102 (Salvage)
628mm² (8nm)
4080 16GB
AD103 (Salvage)
378,6mm² (4nm)
1070
GP104 (Salvage)
314mm² (16nm)
2070
TU106 (Vollausbau)
445mm² (12nm)
3070
GA104 (nahezu Vollausbau)
392mm² (8nm)
4080 12GB
AD104 (Vollausbau)
294,5mm² (4nm)
1060
GP106 (Vollausbau)
200mm² (16nm)
2060
TU106 (Salvage)
445mm² (12nm)
3060
GA106 (nahezu Vollausbau)
276mm² (8nm)
?

Für nVidia scheint dies die große Maßgabe bei Konzeption & Design der Ada-Lovelace-Generation gewesen zu sein: Die Kosten dürfen nicht aus dem Ruder laufen, ergo müssen die Chipflächen runter und die Preise nach oben. Ausnahmen gibt es nur dort, wo sowieso schon Apotheker-Preise genommen wurden, sprich bei der 90er Klasse. nVidia ist hierbei womöglich Gefangener und Getriebener der Ampere-Ära mit den großen Effekten der Chipkrise sowie des Cryptomining-Hypes. Somit versucht man die Kosten herunterzudrücken (weil man erwartet, dass es in der Fertigung dann trotzdem teurer wird) und hat sich gleichzeitig an die Verdienst-Situation der Jahre 2020-2022 gewöhnt (wo ja nicht nur Cryptominer gekauft haben, sondern auch viele normale Gamer). Zudem konnte nVidia in der Konzeptions- und Design-Phase die heutige, mehr oder weniger um 180 Grad gedrehte Marktsituation, natürlich nicht vorhersehen.

Denn letztlich kann man ab einem gewissen Zeitpunkt nichts mehr an der vorhandenen Hardware ändern, spätestens ab Jahresanfang 2022 war dieser Zug (mittels der entsprechenden Tape-Outs) abgefahren. Aber nVidia konnte (vor der offiziellen Vorstellung) immer noch die Einordnung der konkreten Ada-Grafikkarten maßgeblich bestimmen anhand Namenswahl und Preispunkt. In dieser Frage hat sich nVidia weiterhin für die Hochpreis-Strategie entschieden, wahrscheinlich stark vertrauend auf seinen Markennamen und der Erfahrung aus der Zeit des Cryptomining-Hypes, dass die Gamer letztlich trotzdem kaufen. Ob dies bei der Ada-Lovelace-Generation wirklich durchgeht, bleibt abzuwarten – und natürlich braucht es dafür wenigstens die Launchreviews zur GeForce RTX 4090, um eine halbwegs solide Performance-Einordnung der RTX40-Generation bei der Hand zu haben.

AD106 AD104 AD103 AD102
Chip-Daten ? Mrd. Tr. auf ~190mm² 35,8 Mrd. Tr. auf 294,5mm² 45,9 Mrd. Tr. auf 378,6mm² 76,3 Mrd. Tr. auf 608,5mm²
Vollausbau 3 GPC, 36 SM, 4608 FP32, 48 ROPs, 32 MB L2-Cache, 128-Bit-Interface 5 GPC, 60 SM, 7680 FP32, 80 ROPs 48 MB L2-Cache, 192-Bit-Interface 7 GPC, 80/84 SM, 10'240/10'752 FP32, 112 ROPs, 64 MB L2-Cache, 256-Bit-Interface 12 GPC, 144 SM, 18'432 FP32, 192 ROPs, 96 MB L2-Cache, 384-Bit-Interface
VRAM für Vollausbau 8 GB GDDR6 12 GB GDDR6X 16 GB GDDR6X 24 GB GDDR6X
offizielle Grafikkarten - GeForce RTX 4080 12GB (60 SM, 285W) GeForce RTX 4080 16GB (76 SM, 320W) GeForce RTX 4090 (128 SM, 450W)
zu erwartende Grafikkarten "GeForce RTX 4060" (34-36 SM) "GeForce RTX 4070" (~50 SM) - "GeForce RTX 4090 Ti" (142-144 SM)
offizielle Daten bei AD102, AD103 & AD104 (SM-Menge bei AD103 vakant) — inoffizielle Daten bei AD106 sowie bei allen noch nicht vorgestellten Grafikkarten