20

nVidia stellt die "Ada Lovelace" Generation mit drei Modellen zu GeForce RTX 4080 & 4090 vor

Mittels seiner GTC-Keynote (auf Twitch & YouTube) hat Grafikchip-Entwickler nVidia die "Ada Lovelace" Grafikchip-Generation für Gamer-Grafikkarten offiziell vorgestellt. Hierbei wurden auch die ersten drei entsprechenden Grafikkarten der kommenden "GeForce RTX 40" Generation angekündigt: Die GeForce RTX 4090 startet am 12. Oktober, zwei Ausführungen zur GeForce RTX 4080 dann zu einem noch bekanntzugebenden Termin im November. Die Livestream-Ankündigung wurde verhältnismäßig knapp gehalten – teilweise zu knapp, denn insbesondere zu den drei vorgestellten Grafikkarten gab es nur arg wenige Details. nVidias neue Produkt-Webseite zur GeForce RTX 40 Serie liefert dann einige der fehlenden Informationen nach, viele andere bleiben vorerst offen.

    nVidia "Ada Lovelace"

  • basierend auf TSMCs "4N" Fertigung (einer nVidia-Anpassung von TSMCs N5-Node)
  • 76 Mrd. Transistoren, über 18'000 FP32-Einheiten und 90 TeraFlops für den größten Ada-Chip (=AD102)
  • "Shader Execution Reordering" zur besseren Auslastung der Recheneinheiten
  • DLSS3 mit augenscheinlicher Zwischenbild-Berechnung
  • (an der Spitze) 2x Raster- und 4x RayTracing-Performance gegenüber "Ampere"
  • GeForce RTX 4090 mit 24 GB GDDR6X-Speicher und 16'384 CUDA-Cores auf 2.52 GHz am 12. Oktober 2022 für $1599 / 1949€
  • GeForce RTX 4080 mit 16 GB GDDR6X-Speicher und 9728 CUDA-Cores auf 2.51 GHz im November 2022 für $1199 / 1469€
  • GeForce RTX 4080 mit 12 GB GDDR6X-Speicher und 7680 CUDA-Cores auf 2.61 GHz im November 2022 für $899 / 1099€

Grundsätzlich liegt erst einmal alles so, wie es die Gerüchteküche zuletzt zu berichten wusste: Der AD102-Chip mit über 18'000 FP32-Einheiten (sprich die vorab genannten 144 Shader-Cluster) wird derzeit für eine GeForce RTX 4090 mit 128 freigeschalteten Shader-Clustern bzw. 16'384 FP32-Einheiten auf 2.52 GHz Boost-Takt und damit nominell 82,6 TFlops FP32-Rechenleistung genutzt. Die zur Keynote genannten 90 TFlops beziehen sich hingegen auf den vollen AD102-Chip, zu welchem es sicherlich später noch eine extra Grafikkarte geben wird. Darunter gibt es die GeForce RTX 4080 in zwei Ausführungen: Einmal mit 76 Shader-Clustern und 16 GB GDDR6X-Speicher und einmal mit 60 Shader-Clustern und 12 GB GDDR6X-Speicher – ganz genau wie erst kürzlich vorhergesagt. nVidia hat dabei die Chip-Basis aller drei Ada-Grafikkarten nicht konkret erwähnt, aber natürlich dürften jene "kleineren" Modelle kaum auch AD102-basiert sein, sondern hingegen auf AD103 sowie AD104 aufbauen.

Die Konzentration von nVidias GTC-Vortrag lag eher darauf, die Fortschritte der Ada-Lovelace-Architektur zu skizzieren, genauere Ausführungen hierzu dürften dann Aufgabe der kommenden Launch-Reviews sein. Vorerst sind zwei hauptsächliche Innovationen zu benennen: Mittels "Shader Execution Reordering" will nVidia eine bessere Auslastung der Recheneinheiten erreichen, während DLSS3 für einen erneuten heftigen Performance-Boost durch AI-Einbindung steht. Dabei liegt der Clou von DLSS3 augenscheinlich in einer klassischen Zwischenbild-Berechnung, basierend auf den vorhandenen "echten" Bildern. Nominell kann man hiermit eine Frameraten-Verdopplung ohne großen Rechenaufwand erreichen, welcher sogar unter CPU-limitierten Spielen funktioniert. In der Praxis stehen die somit erzeugten Zwischenframes (eventuell) außerhalb der Spiele-Engine, womit Seiteneffekte auf Steuerbarkeit, Physik-Effekte und Spiel-Logik denkbar wären.

GeForce RTX 4080 12GB GeForce RTX 4080 16GB GeForce RTX 4090
Chip-Basis nVidia AD104 oder AD103 (unsicher) nVidia AD103-300 nVidia AD102-300
Raster-Engines vermtl. 5 GPC 7 GPC vermtl. 11 GPC
Recheneinheiten 60 Shader-Cluster, 7680 FP32 + 3584 INT32 (10'752 Recheneinheiten insgesamt) 76 Shader-Cluster, 9728 FP32 + 4864 INT32 (14'592 Recheneinheiten insgesamt) 128 Shader-Cluster, 16'384 FP32 + 8192 INT32 (24'576 Recheneinheiten insgesamt)
Taktraten 2.31/2.61 GHz 2.21/2.51 GHz 2.23/2.52 GHz
ROPs vermtl. 160 80 vermtl. 224 112 vermtl. 352 176-192
Level2-Cache 48 MB 64 MB 72 MB
Speicherinterface 192 Bit GDDR6X 256 Bit GDDR6X 384 Bit GDDR6X
Speicher 12 GB GDDR6X @ 21 Gbps 16 GB GDDR6X @ 22.5 Gbps 24 GB GDDR6X @ 21 Gbps
Rohleistungen 40,1 TFlops & 504 GB/sec 48,7 TFlops & 720 GB/sec 82,6 TFlops & 1008 GB/sec
Stromverbrauch 285W TDP 320W TDP 450W TDP
max. Power-Limit für OC 366W 516W 660W
PCI Express PCIe 4.0 x16 PCIe 4.0 x16 PCIe 4.0 x16
Listenpreis $899 / 1099€ $1199 / 1469€ $1599 / 1949€
Release November 2022 November 2022 12. Oktober 2022
Vorgänger GeForce RTX 3070: GA104, 6 GPC, 46 SM @ 256 Bit, 20,3 TFlops & 448 GB/sec, 96 ROPs, 8 GB GDDR6, $499 GeForce RTX 3080: GA102, 6 GPC, 68 SM @ 320 Bit, 29,8 TFlops & 760 GB/sec, 96 ROPs, 10 GB GDDR6X, $699 GeForce RTX 3090: GA102, 7 GPC, 82 SM @ 384 Bit, 35,7 TFlops & 936 GB/sec, 112 ROPs, 24 GB GDDR6X, $1499
Anmerkung: alle Angaben bis auf Kartennamen, FP32-Anzahl, Chiptakt, Speichermenge, Listenpreis und Releasetermin entstammen nach wie vor der Gerüchteküche

Sehr wenige griffige Informationen gab es zum sicherlich wichtigsten Thema, der Performance: Generell soll die Ada-Generation für die doppelte Performance unter Raster-Titeln sowie die vierfache Performance unter RayTracing-Titeln stehen. Dies dürfte allerdings nur für das Spitzenmodell "GeForce RTX 4090" gelten, mit den kleineren Modellen ist dies (aufgrund deren technischer Ansetzung) kaum denkbar. Natürlich kann sich nVidia jedes Performance-Ergebnis zurechtzaubern, wenn man wie auf der eigenen Produkt-Webseite GeForce RTX 30 mit DLSS2 gegen GeForce RTX 40 mit DLSS3 samt Frameraten-Generierung vergleicht. Was da unter normalen Spielen bei Feature-Waffengleichheit herauskommt, läßt sich mittels dieser Benchmarks und den knappen nVidia-Aussagen derzeit nicht ermessen.

Damit bleiben zu einer vorläufigen Einschätzung wieder nur die Benchmarks aus der Gerüchteküche – wenngleich man jenen etwas Spielraum nach oben geben sollte, nVidia redet ja nun selber schon von einer doppelten Performance bei "Ada Lovelace". Aber dennoch eignen sich die bekannten TimeSpy-Werte vielleicht noch am ehesten, die genannten (hohen) Listenpreise der GeForce RTX 40 Modelle besser einzuordnen. Denn nur die GeForce RTX 4090 kommt wohl mit einem satten Performance-Sprung zu gleichzeitig nahezu unverändertem Listenpreis heraus. Bei der GeForce RTX 4080 geht der Sprung an Mehrperformance und damit auch das Preis/Leistungs-Verhältnis hingegen deutlich nach unten: So dürfte die GeForce RTX 4080 16GB ca. 44% Mehrperformance (oder besser) auf die GeForce RTX 3080 Ti zum gleichen Listenpreis oben drauf legen – nicht schlecht, aber weit weg vom Performance-Sprung der GeForce RTX 4090.

GeForce RTX 30 GeForce RTX 40
GeForce RTX 3090
82 SM @ 384 Bit   —   TSE: 10'208   —   $1499
GeForce RTX 4090
128 SM @ 384 Bit   —   TSE: >19'000   —   $1599
+56% SM   —   +86% TSE   —   +7% Preis
GeForce RTX 3080 Ti
80 SM @ 384 Bit   —   TSE: 9690   —   $1199
GeForce RTX 4080 16GB
76 SM @ 256 Bit   —   TSE: ca. 14'000   —   $1199
–5% SM   —   +44% TSE   —   ±0 Preis
GeForce RTX 3080 10GB
68 SM @ 320 Bit   —   TSE: 8798   —   $699
GeForce RTX 4080 12GB
60 SM @ 192 Bit   —   TSE: <11'000   —   $899
–12% SM   —   +25% TSE   —   +29% Preis
TSE-Werte derzeit inoffiziell, womöglich auch zu niedrig angesetzt bei GeForce RTX 40

Und die GeForce RTX 4080 12GB hat dann das schwerste Brot zu knabbern: Die Karte dürfte in Richtung +25% Mehrperformance (oder besser) zur GeForce RTX 3080 10GB gehen, wird dafür allerdings auch gleich +29% mehr kosten. Auf diesen Werten hat die GeForce RTX 4080 12GB keinerlei besseres Preis/Leistungs-Verhältnis gegenüber der GeForce RTX 30 Serie – etwas, was immer das Merkmal neuer Grafikkarten-Generationen war und was man normalerweise bei jedem einzelnen Modell nachweisen können sollte. In diesem Fall scheint nVidia jedoch zu versuchen, mit dem Glanz der GeForce RTX 4090 die hochgezogenen Preise der beiden GeForce RTX 4080 Modelle zu überdecken. Jene schieben die GeForce RTX 4080 nicht nur weiter in Richtung des Enthusisasten-Segments, sondern lassen auch vermuten, dass es darunter innerhalb der GeForce RTX 40 Serie nur noch ähnlich schlechte Preis/Leistungs-Verhältnisse geben wird.

All dies sind allerdings auf Basis von TimeSpy-Werten aus der Gerüchteküche ziemlich riskante Aussagen, auf welche man somit keine Wetten abschließen sollte. Zu vieles ist noch offen an den GeForce RTX 40 Grafikkarten, zu deren Stromverbrauchs-Werten hat sich nVidia beispielsweise (oder wohlweislich?) noch gar nicht offenbart. Der Launch der GeForce RTX 4090 am 12. Oktober dürfte erste Hinweise geben, wohin es generell geht. Der wirklich interessante Launch wird aber jener der GeForce RTX 4080 zu einem Termin irgendwann im November sein – denn damit dürfte der Rahmen festgesteckt werden, in welchem die kleineren Ada-Lovelace-Modelle aus Preis/Leistungs-Sicht operieren. Für den Augenblick sieht es jedoch ganz danach aus, als hätten die Schwarzmaler Recht behalten und nVidia zieht mit der GeForce RTX 40 Serie insbesondere die Preise der Grafikkarten unterhalb des Top-Modells (deutlich) nach oben.