31

nVidias GK106-Chip kommt mit ~240mm² Chip-Fläche und möglicherweise doch sechs Shader-Clustern

nVidias am 6. September zu erwartende GeForce GTX 660 basiert wie bekannt auf dem lange vermissten GK106-Chip – dem Kepler-Chip zwischen GK107 und GK104. Dabei hat nVidia den GK106-Chip entgegen der ursprünglichen Planungen von 4 Shader-Clustern (= 768 Shader-Einheiten) auf 5 Shader-Cluster (= 960 Shader-Einheiten) aufgebohrt, um besser mit der Radeon HD 7850 konkurrieren zu können. Dabei ist allerdings auch die Chip-Fläche bemerkbar nach oben gegangen: Konnte man den GK106-Chip in seiner ursprünglichen Fassung mit 4 Shader-Clustern noch auf ~200mm² Chip-Fläche erwarten, sind nun nach Berechnungen aus unserem Forum runde 240mm² Chip-Fläche daraus geworden.

Diese Chip-Fläche ist dann verhältnismäßig viel, wenn man selbige mit anderen Grafikchips vergleicht: Der Pitcairn-Chip von AMDs Radeon HD 7800 Serie bringt es gerade einmal auf 212mm² und bietet dafür etwas mehr Shader-Einheiten und ein größeres Speicherinterface (1280 Shader-Einheiten an einem 256 Bit DDR Speicherinterface), die Radeon HD 7870 dürfte zudem in jedem Fall schneller als die GeForce GTX 660 sein. Und zum anderen ist nVidias GK104-Chip gemäß dieser Berechnung auch nur ~54mm² größer als der GK106-Chip, bietet aber weit mehr Hardware-Einheiten (1536 Shader-Einheiten an einem 256 Bit DDR Speicherinterface) respektive einer deutlich höheren Performance. So gesehen erscheint der GK106-Chip von der Chip-Fläche her viel zu nahe an der Chip-Fläche des GK104-Chips zu liegen.

AMD nVidia
HighEnd R1000/Tahiti
4,31 Mrd. Transistoren in 28nm auf 365mm² Chip-Fläche
2 Raster-Engines, 16 Shader-Cluster, 2048 Shader-Einheiten, 128 TMUs, 32 ROPs, 384 Bit DDR Speicherinterface
Modell-Palette:
Radeon HD 7970 "GHz Edition" (Perf.Index: 370%)
Radeon HD 7970 (Perf.Index: 340%)
Radeon HD 7950 "Boost Edition" (Perf.Index: ~310%)
Radeon HD 7950 (Perf.Index: 290%)
GK104
3,54 Mrd. Transistoren in 28mn auf 294mm² Chip-Fläche
4 Raster-Engines, 8 Shader-Cluster, 1536 Shader-Einheiten, 128 TMUs, 32 ROPs, 256 Bit DDR Speicherinterface
Modell-Palette:
GeForce GTX 690 (Perf.Index: 590%)
GeForce GTX 680 (Perf.Index: 360%)
GeForce GTX 670 (Perf.Index: 330%)
GeForce GTX 660 Ti (Perf.Index: 290%)
Performance Pitcairn
2,8 Mrd. Transistoren in 28nm auf 212mm² Chip-Fläche
2 Raster-Engines, 10 Shader-Cluster, 1280 Shader-Einheiten, 80 TMUs, 32 ROPs, 256 Bit DDR Speicherinterface
Modell-Palette:
Radeon HD 7870 (Perf.Index: 260%)
Radeon HD 7850 (Perf.Index: 220%)
GK106
? Mrd. Transistoren in 28mn auf ~240mm² Chip-Fläche
2 Raster-Engines, 5 (oder 6) Shader-Cluster, 960 (oder 1152) Shader-Einheiten, 80 (oder 96) TMUs, 24 ROPs, 192 Bit DDR Speicherinterface
Modell-Palette:
GeForce GTX 660 (Perf.Index: 220-230%)
GeForce GTX 650 Ti
Mainstream Cape Verde
1,5 Mrd. Transistoren in 28nm auf 123mm² Chip-Fläche
1 Raster-Engine, 5 Shader-Cluster, 640 Shader-Einheiten, 40 TMUs, 16 ROPs, 128 Bit DDR Speicherinterface
Modell-Palette:
Radeon HD 7770 (Perf.Index: 145%)
Radeon HD 7750 "900 MHz Edition" (Perf.Index: 120%)
Radeon HD 7750 (Perf.Index: 110%)
GK107
1,3 Mrd. Transistoren in 28mn auf 118mm² Chip-Fläche
1 Raster-Engine, 2 Shader-Cluster, 384 Shader-Einheiten, 32 TMUs, 16 ROPs, 128 Bit DDR Speicherinterface
Modell-Palette:
GeForce GTX 650 (Perf.Index: 100-110%)
GeForce GT 640 (Perf.Index: 75%)

Demzufolge kann man weiterhin durchaus die Vermutung aufstellen, daß der GK106-Chip bei der kommenden GeForce GTX 660 vielleicht noch nicht alles zeigt, was in ihm steckt und möglicherweise doch über 6 Shader-Cluster aka 1152 Shader-Einheiten verfügt – wovon bei der GeForce GTX 660 dann ein Shader-Cluster deaktiviert wäre, um auf die bewussten 960 Shader-Einheiten zu kommen. Derzeit ist dies natürlich nur eine bessere Vermutung – jene würde aber besser zu der relativ großen Chip-Fläche des GK106-Chips passen. Denn wenn man einen Shader-Cluster von nVidias Kepler-Architektur auf 20 bis 30mm² Chip-Fläche (viel größere oder viel kleinere Schätzungen passen nicht zu den bekannten bekannten Daten von GK107 & GK104) einschätzt, dann passen in die ~240mm² Chip-Fläche des GK106 viel besser sechs anstatt fünf Shader-Cluster hinein:

GK107 GK104 GK106
Chip-Fläche 118mm² 294mm² ~240mm²
Aufbau bei angenommen 20mm² pro Shader-Cluster 40mm² für zwei Shader-Cluster, 78mm² für den Rest 160mm² für acht Shader-Cluster, 134mm² für den Rest benötigt werden ca. 100-110mm² für den Rest, bei 20mm² pro Shader-Cluster passen also 6,5 bis 7,0 Shader-Cluster in insgesamt 240mm² Chip-Fläche hinein
Aufbau bei angenommen 25mm² pro Shader-Cluster 50mm² für zwei Shader-Cluster, 68mm² für den Rest 200mm² für acht Shader-Cluster, 94mm² für den Rest benötigt werden ca. 75-85mm² für den Rest, bei 25mm² pro Shader-Cluster passen also 6,2 bis 6,6 Shader-Cluster in insgesamt 240mm² Chip-Fläche hinein
Aufbau bei angenommen 30mm² pro Shader-Cluster 60mm² für zwei Shader-Cluster, 58mm² für den Rest 240mm² für acht Shader-Cluster, 54mm² für den Rest benötigt werden ca. 55mm² für den Rest, bei 30mm² pro Shader-Cluster passen also 6,2 Shader-Cluster in insgesamt 240mm² Chip-Fläche hinein
Der "Rest" sind die Raster-Engine(s), das Speicherinterface und der 2D/Video-Teil eines Grafikchips. Dieser Rest sollte bei größeren Chips größer werden, weil Raster-Engine und Speicherinterface bei diesen größeren Chips auch entsprechend breiter ausgelegt sind – aber keinesfalls so stark skalieren wie der Rest des Chips, da der 2D/Video-Teil (und andere kleinere Teile) bei allen Chips identisch sein dürfte.

Ein Aufbau des GK106-Chips mit gleich sechs Shader-Clustern würde letztlich auch besser zur Geschichte von dessen Neufassung passen, wonach der GK106-Chip ursprünglich mit nur 768 Shader-Einheiten geplant war und dann aufgrund der Stärke der Radeon HD 7800 Serie entsprechend umdesignt wurde. Ein Redesign von 768 auf 960 Shader-Einheiten erscheint dabei etwas zaghaft, weil man damit zum einen maximal die Radeon HD 7850 erreichen kann – nicht aber die Radeon HD 7870. Zum anderen würde sich notfalls die Performance der jetzt kommenden GeForce GTX 660 mit deren 960 Shader-Einheiten wohl auch über den originalen GK106-Chip mit nur 768 Shader-Einheiten erreichen lassen – der Hardware-Abstand ist nicht übermäßig, jener wäre über (richtig) hohe Taktfrequenzen wohl doch zu überbrücken gewesen.

Ein Redesign des GK106-Chips gleich auf 1152 Shader-Einheiten würde dagegen nicht nur zu bewussten Chip-Fläche von ~240mm² passen, sondern vielmehr auch produktpolitisch viel Nutzen für nVidia haben: Erstens einmal könnte man nunmehr eine GK106-basierte Grafikkarte auflegen, welche unter Aktivierung des sechsten Shader-Clusters sich dann auch mit der Radeon HD 7870 anlegen kann. Und zweitens hätte man mit diesem deutlichen Hardware-Schub von 768 auf 1152 Shader-Einheiten gleich schon das 2013er Refresh des GK106-Chips erledigt bzw. sich die Arbeit an eben diesem Refresh-Chip gespart. Aber wie gesagt: Trotz aller durchaus haltbaren Überlegungen ist das ganze derzeit nur eine bessere Vermutung, welche auf Bestätigung durch andere Quellen oder letztendlich durch nVidia selber wartet.

Nachtrag vom 4. September 2012

Zur Frage, mit wievielen Shader-Clustern der GK106-Chip tatsächlich daherkommt, gibt es neue Ansätze: So wird erst einmal mittels eines GPU-Z-Screenshots von einer Die-Fläche von 221mm² gesprochen, was etwas unterhalb der bisher geschätzt ~240mm² liegt. Dies scheint zudem ein nVidia-offizieller Wert aus einer neuen Version von GPU-Z sein – was erst einmal positiv ist wegen der offiziellen Aussage, andererseits nVidia durchaus Raum für kleinere Zahlenspielereien zugunsten einer besseren Eigendarstellung gibt. Allerdings kommt die neueste Hochrechnung auf Basis einer GK106-Chipfläche von 221mm² dann auch wieder zum Ergebnis, daß sechs Shader-Cluster (SMX) aka 1152 Shader-Einheiten die wahrscheinlichste Auflösung für den GK106-Chip darstellt. An dieser Stelle gilt es dann schlicht abzuwarten, ob sich die neue Angabe zur Chipfläche bestätigt und inwiefern nVidia zum Launch der GK106-basierten GeForce GTX 660 am 12. September vielleicht genaueres zu den Innereien des GK106-Chips bekanntgibt.