13

nVidias Maxwell-Architektur bringt deutliche Änderungen an den Shader-Clustern

Eine bedeutsame Erkenntnis der Meldung seitens Videocardz zu den Hardware-Spezifikationen des nVidia GM107-Chips ist jene ob der deutlichen Änderungen der Shader-Cluster bei nVidias Maxwell-Architektur. Dabei gehen wir davon aus, daß das mit dem GM107-Chip vorgestellte Shader-Cluster-Modell von nVidia für die weiteren Grafikchips der Maxwell-Architektur (und eventuell auch darüber hinaus) weiterverwendet werden wird, da solcherart Shader-Cluster faktische "Grundeinheiten" einer Grafikchip-Architektur sind und im gewöhnlichen nicht zwischen Grafikchips derselben Architektur verändert werden.

Zur Erinnerung: nVidias Shader-Cluster der Kepler-Architektur basieren darauf, daß ein Shader-Cluster immer 192 Shader-Einheiten samt 16 Textureneinheiten umfasst. Das Verhältnis zwischen Anzahl der Shader-Einheiten und Anzahl der Textureneinheiten liegt bei Kepler bei 12:1 – was mehr ist als bei AMDs GCN-Architektur, wo ein Shader-Cluster immer 64 Shader-Einheiten samt 4 Textureneinheiten umfasst und selbiges Verhältnis somit bei 16:1 liegt. Kurz formuliert: nVidias Kepler-Grafikchips haben bei gleicher Anzahl an Shader-Einheiten immer 33% mehr Textureneinheiten aufzubieten. Dies muß man allerdings nicht zwingend als großen Vorteil ansehen, da in den letzten Jahren die Bedeutung der Textureneinheiten immer weiter abgenommen hat bzw. das Verhältnis zwischen Shader- und Textureneinheiten immer weiter (zugunsten von verhältnismäßig mehr Shader-Einheiten) zugenommen hat.

Wohl aus dieser Perspektive heraus hat sich nVidia nunmehr zum grundlegenden Redesign der Shader-Cluster bei der Maxwell-Architektur entschlossen: Jene tragen laut dem GM107-Chip nunmehr 128 Shader-Einheiten samt 8 Textureneinheiten – das Verhältnis zwischen Shader- und Textureneinheiten liegt somit bei 16:1 und somit identisch zu AMDs GCN-Architektur. Faktisch nähert sich die Maxwell-Architektur in dieser Frage sehr deutlich der GCN-Architektur an, ein Shader-Cluster von Maxwell entspricht glatt zwei Shader-Clustern von GCN.

Architektur Aufbau Shader-Cluster Verhältnis Shader- und Textureneinheiten
AMD VLIW5
(Radeon HD 5000/6000)
80 Shader-Einheiten + 4 TMUs 20:1
AMD VLIW4
(Radeon HD 6900)
64 Shader-Einheiten + 4 TMUs 16:1
AMD GCN
(Radeon HD 7000 & R200)
64 Shader-Einheiten + 4 TMUs 16:1
nVidia Maxwell
(GeForce 700/800)
128 Shader-Einheiten + 8 TMUs 16:1
nVidia Kepler
(GeForce 600/700)
192 Shader-Einheiten + 16 TMUs 12:1
nVidia Fermi
(GeForce 400/500)
48 Shader-Einheiten + 8 TMUs 12:1
(wegen des doppelten Chiptakts in den Shader-Einheiten)
nVidia Fermi (GF100/GF110)
(GeForce 465/470/480/570/580)
32 Shader-Einheiten + 4 TMUs 16:1
(wegen des doppelten Chiptakts in den Shader-Einheiten)

Diese Änderung nähert nicht nur die modernen Grafikchip-Architekturen von AMD und nVidia weiter an, sondern sorgt rein praktisch auch dafür, daß nVidia relativ gesehen mehr Chipfläche für Shader-Einheiten übrig hat und in der Folge dessen zukünftig wohl auch deutlich mehr Shader-Einheiten aufbieten wird. Die Bedeutung der Textureneinheiten wird weiter zurückgedrängt, obwohl man angesichts deren schierer Anzahl (240 Stück beim GK110-Chip) immer noch lange nicht an dem Punkt angekommen ist, wo man auf diese fest verdrahteten Spezialeinheiten komplett verzichten und deren Aufgabe in die (hierfür natürlich nicht so effizienten) Shader-Einheiten auslagern könnte.

Eine weitere bedeutsame Änderung der Maxwell-Architektur liegt in der mehr als deutlichen Aufstockung des Level2-Caches auf satte 2 MB beim GM107-Chip – welcher einer der kleinsten Grafikchips auf Basis der Maxwell-Architektur darstellen wird. Zum Vergleich: Der GK107 kommt auf 256 kB, der GK106 auf 384 kB, der GK104 auf 512 kB (jeweils 128 kB pro 64-Bit-Speicherinterface) und der GK110 auf immerhin 1,5 MB. Inwiefern nVidia die größeren Grafikchips der Maxwell-Architektur ausgehend von den bekannten 2 MB Level2-Cache beim GM107 ähnlich stark nach oben skaliert, bliebe abzuwarten – in jedem Fall dürften sich aber auch bei diesen Maxwell-Chips deutliche Vergrößerungen des Level2-Caches ergeben.

Weitere Grafik-bezogene Änderungen der Maxwell-Architektur liegen laut Videocardz in Verbesserungen der Lastverteilung, des Schedulers sowie der Anzahl der abarbeitbaren Instruktionen per Takzyklus. Andere Maxwell-Änderungen betreffen eine schnellere H.264-Verarbeitung sowie eine weitere Stromsparstufe. Zwar wurde Maxwell teilweise schon als nur leicht verbesserter Kepler-Refresh beschrieben und dürfte sowieso erst mit der Verfügbarkeit der 20nm-Fertigung richtig zu Hochform auflaufen können, die jüngste Meldung, wonach der GM107-Chip seine Performance nur mit 640 Shader-Einheiten erbringt, deutet jedoch auf eine klar verbesserte Effizienz der Maxwell-Architektur im reinen Grafik-Betrieb hin.