3

nVidias Ampere-Generation soll +50% Mehrperformance und doppelte Energieeffizienz bieten

Viel beachtet wird derzeit eine Meldung der taiwanesischen Taipei Times, welche sich zwar eigentlich um die taiwanesischen Grafikkarten-Hersteller dreht, als deren Geschäfts-Vorantreiber im Jahr 2020 allerdings explizit nVidias Ampere-Generation notiert. Hierzu gibt man dann auch eine breit zitierte Performance-Aussage zu Ampere zum besten: Angeblich soll Ampere 50% mehr Performance und zudem die Hälfte des Stromverbrauchs mit sich bringen – erreicht durch die Verwendung der 7nm-Fertigung. Netzweit und in unserem Forum rätselt man nun darüber, wie diese Aussage zu verstehen ist: Denn wenn man beide Angaben zusammenzieht, ergäbe sich schließlich eine gegenüber Turing gesteigerte Energieeffizienz von gleich +200% – was dann wiederum eher unrealistisch klingt. Einzurechnen wäre hierbei allerdings, wer diese Nachricht transportiert und wer die Original-Aussage (mutmaßlich) von sich gegeben hat. Die Taipei Times sind eher ein Wirtschaftsmagazin, können also mit der Technik des ganzen wenig anfangen – und die Original-Aussage ist vermutlich eine Marketing-Aussage seitens nVidia, sprich muß ohne die entsprechend rosarote Brille gesehen werden.

Nvidia’s next-generation GPU based on the Ampere architecture is to adopt 7-nanometer technology, which would lead to a 50 percent increase in graphics performance while halving power consumption.
Quelle:  Taipei Times vom 2. Januar 2020

Andererseits ergibt allein die Formulierung der Taipei Times schon einen guten Hinweis darauf, was hier wirklich Sache ist: nVidia wird natürlich keine Grafikchips mit halbem Stromverbrauch bringen, sprich keine GeForce RTX 3080 Ti mit nur 130 Watt TDP. Mit der Stromverbrauchs-Aussage will man viel mehr sagen, das ein Ampere-Grafikchip mit gleicher Performance wie ein Turing-Grafikchip nur noch halb so viel verbraucht. Dies stellt den anzustrebenden Idealzustand bei einer neuen Grafikchip-Generation auf Basis einer neuen Fertigungstechnologie dar und wurde in der Vergangenheit oftmals (grob) auch so erreicht. Die Formulierung der Taipei Times dürfte also eine verkürzte Wiedergabe der originalen nVidia-Aussage sein, welche etwa so lautet: Ampere bringt +50% Mehrperformance und (bei gleicher Performance) die Hälfte des Stromverbrauchs. Die Energieeffizienz von Ampere steigt somit um +100% auf das Doppelte – und nicht um +200% (auf das Dreifache), wie man basierend auf der Meldung der Taipei Times (und allen blind abschreibenden Magazinen) eventuell rechnen könnte.

Desweiteren wäre wichtig zu erwähnen, das sich solcherart frühe Meldungen in aller Regel nur auf das jeweilige Erstlingswerk beziehen – sprich den GA100-Chip für HPC-Bedürfnisse (auch die Taipei Times spricht immer nur von einem einzelnen Chip und nicht jedoch einer Chip-Familie). Eine exakte Aussage zu den Kern-Daten der Ampere-Familie stellt dies also nicht dar – wobei natürlich die nachfolgenden kleineren Ampere-Chips durchaus in den üblichen Abstufungen zu erwarten sind, sprich jene nicht grundsätzlich anders als jener GA100-Chip herauskommen sollten. Geht man also davon aus, das jene Kern-Daten auch für die komplette Ampere-Generation gelten, dann gewinnen frühere Spekulationen von dieser Stelle erneutes Gewicht – welche die Ampere-Generation bereits mit grob um +50% mehr Shader-Einheiten vorhergesagt hatten. Gänzlich aus der Luft gegriffen waren diese Spekulationen natürlich nicht, jene gingen von einem Leak zum GA100-Chip aus, welcher augenscheinlich 8192 Shader-Einheiten haben dürfte. Und dies sind dann +52% zum vorhergehenden GV100-Chip der Volta-Generation – womit sich auf den ersten Blick alles zusammenzufügen scheint. Gut möglich also, das die nachfolgende Auflistungen mit spekulativen Ampere-Spezifikationen halbwegs nahe an die Realität herankommt:

Segment Chipfläche mögliche Grafikkarten Technik Vorgänger-Chip(s)
GA100  (alt. "AM100") HPC ~800mm² Tesla & Titan 8192 SE @ 6144 Bit HBM2 GV100: 5376 SE @ 4096 Bit HBM2
GA101  (alt. "AM101") HPC ~450mm² Tesla & Titan 4096 SE @ 3072 Bit HBM2 -
GA102  (alt. "AM102") Enthusiast 600-700mm² GeForce RTX 3080 Ti ca. 6000-7000 Shader-Einheiten TU102: 4608 SE @ 384 Bit GDDR6
GA104  (alt. "AM104") HighEnd 450-500mm² GeForce RTX 3070 & 3080 ca. 4000-5000 Shader-Einheiten TU104: 3072 SE @ 256 Bit GDDR6
GA106  (alt. "AM106") Midrange 300-350mm² GeForce RTX 3060 ca. 2500-3000 Shader-Einheiten TU106: 2304 SE @ 256 Bit GDDR6
TU116: 1536 SE @ 192 Bit GDDR6
GA107  (alt. "AM107") Mainstream 200-250mm² GeForce RTX/GTX 3050 ca. 1500-1800 Shader-Einheiten TU117: 1024 SE @ 128 Bit GDDR5
GA108  (alt. "AM108") LowCost 140-170mm² GeForce RTX/GTX 3040 ca. 1000 Shader-Einheiten -
Die Angaben dieser Tabelle zu Ampere-Chips sind voll spekulativ.

Damit würde nVidia natürlich erneut eine Grafikchip-Generation auflegen, welche nicht mit doppelter Anzahl an Shader-Einheiten und damit grob verdoppelter Performance daherkommt. Allerdings geht das Augenmerk bei Ampere augenscheinlich eher in andere Richtungen: Im HPC-Bereich geht es (schon seit einiger Zeit) teilweise weg von höchstmöglicher Grundperformance, werden spezielle Rechenaufgaben mit geringeren Genauigkeiten immer wichtiger – dort könnte Ampere dann mehr bieten als nur jene +50%. Und im Gaming-Bereich dürfte nVidia sicherlich die RayTracing-Performance maßgeblich zu steigern versuchen, dafür dann mehr Chipfläche und Ingenieursarbeit opfern. Darauf deutet bereits der Punkt hin, dass der GA100-Chip die doppelte Anzahl an Tensor-Cores pro Shader-Cluster aufweisen soll – gegenüber dem GV100-Chip dann also mit grob der dreifachen Anzahl an Tensor-Cores antreten würde. nVidia scheint sich hier bewußt bezüglich der gewöhnlichen Gaming-Performance zu limitieren und anstatt noch mehr (gewöhnliche) Shader-Einheiten lieber mehr Hardware-Einheiten zugunsten von RayTracing zu verbauen (bzw. bei den HPC-Chip zugunsten von AI-Kalkulationen).

So gesehen könnte Ampere schon einen deutlichen Schritt in die RayTracing-Zukunft darstellen, denn die angenommenen Chipflächen würden ansonsten sicherlich ausreichend sein, weit mehr gewöhnliche Shader-Einheiten (ohne RayTracing-Funktionalität) zu verbauen. nVidia kann sich diesen "Verzicht" allerdings wohl leisten, da der Wettbewerb mit AMD im HighEnd/Enthusiasten-Segment derzeit nach wie vor schwach ist und letztlich auch AMD zukünftig Chipfläche für eine RayTracing-Funktionalität (bei den Navi-2X-Chips der RDNA2-Architektur) opfern muß. Da Ampere dann allerdings anfängt, wirklich substantiell Chipfläche hierfür zu belegen (bei Turing sind es wohl eher nur 10-20%, bei Ampere dürfte es entsprechend mehr sein), sollte damit natürlich auch Software-seitig der Gewinn der RayTracing-Funktionalität für den Spieler bzw. Grafikkarten-Käufer sichtbarer werden. In dieser Frage arbeitet logischerweise auch die Zeit für die Ampere-Generation, welche zudem kaum vor dem Sommer 2020 zu erwarten ist. Den Anfang dürfte sicherlich der HPC-Chip GA100 machen – und erst etwas nach dessen Ankündigung wird dann die Zeit reif für die Gaming-Grafikchips der Ampere-Generation – vermutlich eher Richtung Herbst 2020.