19

Gerüchteküche: nVidias AD102-Chip soll mit gleich +122% mehr Rechenleistung antreten

Twitterer Greymon55 hat mal wieder einen Informationsfetzen zu den NextGen-Grafikkarten von sich gegeben, diesesmal bezogen auf nVidias Lovelace-Spitzenchip "AD102". Jener Grafikchip, dem 144 Shader-Cluster und damit +71% mehr gegenüber dem aktuellen GA102-Chip der Ampere-Generation nachgesagt werden, soll nunmehr auch mit erheblich stärkerem Chiptakt von ≥2.2 GHz antreten. Da nVidia derzeit (mangels Tape-Out) noch keine echten AD102-Chips haben dürfte, kann es sich nur um eine Projektion seitens nVidia handeln – sprich, dies will man erreichen. Üblicherweise dürfte es sich zudem um eine Angabe auf Basis des (offiziellen) Boost-Takts handeln, mittels welchen nVidia seine offiziellen Rechenleistungs-Angaben ermittelt. Dies bedeutet, dass der Vergleichswert aus der Ampere-Generation die 1700 MHz offizieller Boost-Takt der GA102-basierten GeForce RTX 3090 sein werden. Demgegenüber würde eine AD102-basierte Grafikkarte mit 2200 MHz Boost-Takt dann nominell um immerhin +29,4% beim Takt zulegen.

ad102 frequency : ≥2.2ghz
Quelle:  Greymon55 @ Twitter am 19. September 2021

Zusammen mit dem Hardware-Sprung von +71,4% mehr Shader-Einheiten (verglichen Vollausbau zu Vollausbau) ergäbe sich eine Rohleistungs-Steigerung um satte +122% (oder mehr). Im Vollausbau des AD102-Chips ergäbe sich auf dieser Taktrate zudem eine FP32-Rechenleistung von immerhin 81 TFlops (GeForce RTX 3090: 35,7 TFlops). Damit ergibt sich letztlich auch eine Erklärung für einen kürzlichen Tweet desselben Twitterers, nach welchem eine Performance-Verdopplung gegenüber einer GeForce RTX 3090 eher "konservativ" gedacht wäre. Dabei ist die Nennung einer solch hohen Taktrate für den AD102-Chip noch nicht einmal gänzlich neu, seitens Twitterer 'TtLexington' gab es bereits eine ähnliche Vorhersage, wenngleich die Quelle dieser älteren Meldung halt noch "ungeprüft" ist. Eine genaue Performance-Abschätzung läßt sich daraus natürlich noch nicht ziehen, da zum einen Architektur-Verbesserungen positiv mit hineinspielen können, genauso aber auch eine mangelhafte Speicherbandbreite eine negative Beeinflußung ergeben könnte. In dieser Frage hat Greymon55 @ Twitter nochmals betont, dass der AD102-Chip mit einem 384bittigem GDDR6X-Interface antreten wird:

n31:5nm+6nm 256bit gddr6
n32 5nm+6nm 192bit gddr6
n33 6nm 128bit gddr6 perf>6900xt

ad102 5nm 384bit gddr6x
ad103 ?
ad104 ?
ad106 ?

Quelle:  Greymon55 @ Twitter am 19. September 2021

Genauso wurden auch die Speicherinterfaces zu den AMD-Chips Navi 31, Navi 32 & Navi 33 samt deren Fertigungsverfahren erneut genannt, was jedoch durchgehend bereits bekannte Daten sind (und kürzlich erst thematisiert wurde). In beiden Fällen – nVidias Lovelace und AMDs RDNA3 – fällt dabei auf, dass die Speicherinterface jeweils gleich zur jeweiligen Vorgänger-Generation sind, trotz beiderseits wie bekannt erheblicher Zuschläge bei der Rechenleistung. Zu den weiteren Lovelace-Chips AD103, AD104 und AD106 liegen hingegen diesbezüglich noch keine Daten vor – was etwas verwundert, denn nVidia müsste jene sicherlich schon längst in der Designphase haben. Sicher scheint derzeit nur deren Existenz zu sein, wohingegen noch kleinere Lovelace-Chips wie AD107 und AD108 laut einem weiteren Tweet von Greymon55 derzeit reine Spekulation sind: Jene können durchaus noch nachfolgen, derzeit liegt aber noch nicht einmal in der Gerücheküche etwas zu diesen kleineren Lovelace-Chips vor.

I can confirm 102-106, 107 and 108 are unknown for the time being.
Quelle:  Greymon55 @ Twitter am 19. September 2021

Zurückkommend auf den AD102-Chip bzw. die größeren Lovelace-Chips läßt sich sagen, dass angesichts von (nominell) +122% höherer Rechenleistung (oder mehr) die Aussichten auf einen waschechten Generationssprung spürbar zugenommen haben. Dabei war ein derart hoher Takt durchaus schon Gegenstand wohlfeiler Spekulationen, welche ausgehend von nVidias Wechsel der Chipfertiger von Samsung auf TSMC hochgerechnet haben, was dies für die Lovelace-Taktraten bringen könnte. Realisiert nVidia eine solche Taktrate in der Praxis und schafft somit wirklich einen Rohleistungssprung von +122%, dürfte einer tatsächlichen Performance-Verdopplung nicht mehr viel im Weg stehen. Selbst Skalierungs-Effekte und eventuell mangelhafte Speicherbandbreite wären kaum zu einem krass niedrigeren Endergebnis in der Lage, immerhin darf man ja auch noch einen gewissen Architektur-Vorteil mit einrechnen (selbst wenn es sich dabei nur um Optimierungen des Ampere-Designs handeln sollte).

AMD Navi 21 → Navi 31 nVidia GA102 → AD102
Architektur augenscheinlich deutlich veränderte Architektur (nicht nur wegen MCM), Wegfall der CUs (WGPs als neue hauptsächliche Ordnungseinheit), anscheinend 4 → 6 Shader-Engines, anscheinend 128 → 256 FP32 pro WGP vermutlich vergleichweise ähnliche Grundarchitektur, 7 → 12 Raster-Engines (GPC), erwartbarer Taktraten-Sprung wegen Wechsels von Samsung auf TSMC
FP32-Recheneinheiten 5'120 → 15'360  (+200%) 10'752 → 18'432  (+71%)
(hochgerechnete) Rohpower 21 TFlops → ~75-80 TFlops  (+257-281%) 36 TFlops → ~80 TFlops  (+122%)
Performance-Target 2,5 bis 2,7fache  (+150-170%) 2,0 bis ~2,2fache  (+100-120%)
Terminlage angeblich Oktober 2022 angeblich Oktober 2022
Anmerkung: reine Wiedergabe von Gerüchten – keine offiziellen Daten

Am überraschendste ist dabei vielleicht nicht einmal der Punkt, dass dies möglich sein soll – sondern eher, dass dies nVidia tatsächlich so angesetzt hat. In letzter Zeit war nVidia eher für mittlere Performance-Sprünge zwischen den Chip-Generationen bekannt, überhaupt nicht in der Nähe einer Performance-Verdopplung liegend. Sicherlich hing dies auch damit zusammen, dass nVidia nicht wirklich musste, man auch so den Markt dominierte. Nun aber bringt das wiedererstarkte AMD nVidia augenscheinlich unter Druck – und nVidia feuert demzufolge aus allen Rohren, will unbedingt seine Performance-Spitzenposition behalten. Dies ist in einem Markt, welcher deutlich stärker von DIY-Käufern getrieben wird als beispielsweise der Prozessoren-Markt, eine durchaus nachvollziehbare Entscheidung – nachdem nVidia mit ansehen konnte, wie AMD innerhalb weniger Jahre Intel im DIY-Markt der Prozessoren klar die Butter vom Brot genommen hat. Der Wettbewerb zwischen Unternehmen zeigt sich hier mal von seiner besten Seite – wenngleich angesichts der aktuellen Grafikkarten-Preise nicht gerade zum allerbesten Zeitpunkt, denn Spitzen-Produkte am Rande des technisch Machbaren sind kaum ein Anlaß für zurückgehende Preislagen.

4K-Perf vs. Vorgänger GeForce xx60 GeForce xx70 GeForce xx80 GeForce xx80Ti
TuringAmpere +34% +61% +72% +48%
PascalTuring +62% +45% +45% +43%
MaxwellPascal +81% +70% +71% +73%
basierend auf den Angaben des 3DCenter UltraHD/4K Performance-Index, ohne Refresh-Generationen