3

nVidias GM200 kommt scheinbar als (nahezu) reiner Gamerchip

Die japanischen 4Gamer (maschinelle Übersetzung ins Deutsche) berichten über eine nVidia-Pressekonferenz am 24. Dezember 2014 in Tokio, bei welcher ein hoher nVidia-Manager zum Thema zukünftiger Supercomputer und der nVidia-Chips für jene Auskunft gab. Dabei ging es vorwiegend um die zukünftigen Grafikchip-Architekturen "Volta" und "Pascal", wobei beide als sehr ähnlich beschrieben wurden. Womöglich ist Volta schlicht eine Unter- oder Vorform von Pascal, bis zur Enthüllung von Pascal stand schließlich Volta auf früheren nVidia-Roadmaps an exakt der Stelle von Pascal.

Fast im Nebensatz gab es dagegen eine bedeutsame Aussage zum demnächst anstehenden großen Maxwell-Chip GM200: Jenem fehlen offenbar die extra DoublePrecision-Einheiten, womit jener Grafikchip nicht für das Tesla-Segment geplant ist und daher nahezu ausschließlich in den Gaming-Bereich gehen würde. Eine Nebennutzung im Quadro-Segment ist genauso möglich, aber zumindest für das Supercomputer-Segment dürfte der GM200-Chip somit ausfallen. Normalerweise wäre eine solche Aussage überaus unglaubwürdig – aber wenn sie direkt von nVidia kommt, läßt sich daran kaum etwas herumdeuteln (der klareren Übersetzung wegen maschinell ins Englische übersetzt:)

Maxwell will not be used in such a way of Tesla because there is no double-precision.
(Aussage Kenichi Hayashi von nVidia)

Wenn wir abseits von eher unwahrscheinlichen Varianten wie einer Fehlinformation oder aber fehlerhaften DoublePrecision-Einheiten beim GM200-Chip einmal davon ausgehen wollen, daß dies alles so passt und so geplant war – dann stellt sich die Frage, wieso nVidia den GM200-Chip derart beschneidet? Dafür könnte es eine sehr plausible Erklärung in schlicht der limitierten Chipgröße samt keinem neuen Fertigungsverfahren geben. Wenn nVidia den GM200-Chip wirklich mit 3072 Shader-Einheiten herausbringen will – immerhin auch nur 7% mehr als beim GK110-Chip – und die Maxwell-Architektur wie bekannt ihre Mehrtransistoren benötigt, könnte es für nVidia womöglich zu eng gewesen sein, den GM200-Chip mit dieser hohen Anzahl an Shader-Einheiten und DoublePrecision-Fähigkeiten gleichzeitig auszustatten. Womöglich wollte nVidia auch einfach nicht über gewisse Chipflächen gehen – und musste daher irgendwo abspecken.

Denn schließlich gilt, daß die Maxwell-Architektur in ihrer Konzeptphase sicherlich für die 20nm-Fertigung geplant war, als Architektur- und Fertigungstechnolgie-Nachfolger der in der 28nm-Fertigung hergestellten Kepler-Architektur. Unter der 20nm-Fertigung wäre der GM204-Chip dann deutlich kleiner ausgefallen, wären auch mehr Funktionen in den GM200-Chip zu einer vertretbaren Chipfläche packbar gewesen. Der Ausfall der 20nm-Fertigung ist beim GM204-Chip noch verkraftbar, der Chip wurde halt einfach größer als einstmals geplant. Beim GM200-Chip würde ein solches Vorgehen dagegen einfach an Grenzen stoßen – womöglich musste irgendetwas raus aus dem Chip. Da man auf die höhere Anzahl an Shader-Einheiten aus Gründen der Schlagkräftigkeit im Gamer-Segment unmöglich verzichten konnte, wurde eben augenscheinlich auf die Tesla-Fähigkeiten verzichtet. Ein indirekter Hinweis auf eine solcherart Entwicklung kommt im übrigen aus nVidias verschiedenen Roadmaps: Wurden auf jenen früher noch die verschiedenen nVidia-Architekturen bezüglich deren DoublePrecision-Rechenkraft verglichen, vergleichen die neueren Roadmaps nur noch nach der SinglePrecision-Rechenkraft.

Und am Ende ist die DoublePrecision-Fähigkeit und damit die Möglichkeit zum Einsatz im Tesla-Segment beim GM200-Chip vielleicht auch gar nicht so wichtig. Die taktnormierte Rechenleistung steigt beim Sprung von GK110 (2880 Shader-Einheiten) auf GM200 (3072 Shader-Einheiten) nur minimal an – mittels höherer Taktraten und einer besseren Energieeffizienz kann man sicherlich noch etwas herausholen, aber ein Dimensionssprung wird das niemals. Ein GM200-Chip mit DoublePrecision-Fähigkeit wäre diesbezüglich womöglich gar nicht viel schneller, als es der GK110-Chip in dieser Disziplin derzeit schon ist. All zu viel verliert nVidia mit dieser Entscheidung also nicht – viel mehr Performance auf diesem Feld ist nur über Grafikchips basierend auf einer neuen Fertigungstechnologie zu erwarten. Zumindest wird nun klarer, weshalb nVidia dann doch noch einen GK210-Chip aufgelegt hat – als in kleinen, nur für den Supercomputer-Einsatz relevanten Features überarbeiteten GK110-Nachfolger, welcher wegen des Ausfalls des GM200-Chips für das Tesla-Segment noch eine ganze Weile nVidias Topangebot für Tesla-Bedürfnisse sein wird.

Nachtrag vom 4. Januar 2015

Zur Meldung über nVidias GM200 als (nahezu) reinen Gamerchip wäre noch die Bedeutung des ganzen für das Gamer-Segment zu würdigen: Denn obgleich der Nachteile für das professionelle Segment hat die Entscheidung nVidias, dem G200-Chip augenscheinlich keine dedizierte DoublePrecision-Hardware mitzugeben, durchaus seine Vorteile im Gaming-Segment: Schließlich muß nVidia somit keine Chipfläche rein für professionelle Zwecke opfern, jene kann nun durchgehend mit für den Gaming-Einsatz relevanten Dingen belegt werden. Zudem ergibt sich damit auch die Chance auf ansprechende Taktraten, nachdem die letzten Enthusiasten-Chips von nVidia diesbezüglich immer etwas zurücklagen und einiges an Potential durch ihre niedrigeren Taktraten verloren. Am Ende wurde sich im Gamer-Umfeld schon des längerem ein reiner (großer) Gamer-Grafikchip gewünscht – und nVidia scheint selbigen nunmehr bedingt durch die Umstände zu liefern.

Nachtrag vom 8. Februar 2015

Zu nVidias GM200-Chip kommt aus unserem Forum leider die klare Bestätigung von einem informierten Nutzer (um das Posting richtig deuten zu können, muß man den vorherigen Thread verfolgt haben), daß der GM200-Chip keine DoublePrecision-Einheiten tragen wird bzw. daß die DoublePrecision-Leistung deutlich unter dem liegt, was man ansonsten von nVidias Enthusiasten-Chips gewohnt ist. Hierzu gab es mal eine sogar nVidia-basierte Meldung gleichen Inhalts – allein, man konnte dies bisher noch nicht wirklich glauben und wartete daher eine entsprechende Bestätigung ab, welche nunmehr vorliegt. Dies hat Vor- und Nachteile: Für die professionellen Anwender fällt ein Hauptargument weg, AMD könnte hier also – gerade wenn der Fiji-Chip mit 4096 Shader-Einheiten daherkommt – einigen Boden in diesem Marktsegment gutmachen. Im Gamer-Segment hat ein GM200 als reiner Gaming-Chip aber den Vorteil, daß jener sehr viel effizienter in dieser Aufgabe sein kann – was sich insbesondere in den angesetzten Taktraten niederschlagen dürfte.

Wenn man es beispielsweise zwischen GK104 und GK110 vergleicht, dann hat der GK110 zwar 87,5% mehr Shader-Einheiten, aber nur 60,4% mehr Rechenleistung – eben wegen der niedrigeren Taktraten des GK110-Chips. Beim GM200-Chip könnte nVidia durch den Wegfall der DoublePrecision-Einheiten hingegen in der Lage sein, ähnliche Taktraten wie beim GM204-Chip zu bieten und damit die höhere Anzahl an Shader-Einheiten zwischen GM204 (2048 SE) und GM200 (wohl 3072 SE) besser auszunutzen. Mehr Hardware-Einheiten werden durch diese Design-Entscheidung aber leider nicht in den GM200-Chip passen, eine kurze Überschlagsrechnung in unserem Forum auf Basis der bekannten Chipflächen von GM204 & GM206 ergibt, daß ein GM200-Chip ohne jede extra Einheiten für professionelle Zwecke auf 3072 Shader-Einheiten an einem 384 Bit DDR Speicherinterface um die 570mm² Chipfläche belegen sollte – exakt da, wo die bisherigen Schätzungen zur GM200-Chipfläche hingehen. Die 3072 Shader-Einheiten des GM200-Chip sind also schon das Plus, was man durch den Verzicht auf die DoublePrecision-Einheiten gewonnen hat – hätte man letztere doch eingebaut, müssten es weniger Shader-Einheiten (unterhalb von 600mm² Chipfläche) sein.