19

Weitere Details und eine verbesserte Performance-Prognose zu nVidias GK110-Chip

Mittels des nVidia Kepler GK110 Architecture White Papers (PDF) läßt sich nunmehr sicher bestätigen, daß der GK110-Chip – wie andere Kepler-Chips auch – über 16 Textureneinheiten pro Shader-Cluster (SMX) und damit über insgesamt satte 240 Textureneinheiten verfügt. Interessanterweise behauptet nVidia zudem, daß pro Shader-Cluster neben den "normalen" 192 Shader-Einheiten für SinglePrecision-Bedürfnisse auch noch 64 Shader-Einheiten für DoublePrecision-Bedürfnisse existieren, auf dem Block-Diagramm zu den Shader-Clustern werden diese 64 DP-Einheiten sogar extra eingezeichnet (gelb markiert).

nVidia Kepler GK110 Block-Diagramm
nVidia Kepler GK110 Block-Diagramm
nVidia Kepler GK110 SMX-Diagramm
nVidia Kepler GK110 SMX-Diagramm

Trotz daß nVidia diese Auslegung in einem Interview sogar noch einmal bestätigte, wird sie allgemein bezweifelt – erstens einmal würde das den Silizium-Bedarf und damit die Chip-Fläche noch weiter in die Höhe katapultieren, desweiteren wären regelrecht extra Einheiten heftig unökonomisch und letztlich würde nVidia sicherlich maßlos darauf herumreiten, wenn der GK110 seine 192 SP-Einheiten und 64 DP-Einheiten pro Shader-Cluster gleichzeitig nutzen könnte, wenn diese unabhängig voneinander existieren würden. Viel wahrscheinlicher ist dagegen, daß diese DP-Einheiten zwar logisch existieren, jedoch viele Transistoren zwischen SP- und DP-Einheiten geshart sind, womit nur entweder die 192 SP-Einheiten oder die 64 DP-Einheiten pro Shader-Cluster nutzbar sind.

Daneben wurde in dem sehr interessanten Interview des Heise Newstickers auch eine Performance-Aussage zum GK110-Chip getroffen: Auf die Frage, ob man aus der Hardware-Ansetzung auf einen durchschnittlichen Geschwindigkeitsvorteil zwischen 50 und 70 Prozent gegenüber dem GK104-Chip schließen könne, antwortete nVidia, daß man dies oder etwas mehr "für gewöhnliche Programme erhoffen" kann. Diese Aussage gilt natürlich eher nur für den professionellen Bereich, aber man kann aus dieser Aussage durchaus ableiten, was der Chip an reiner Rechenleistung mehr bringen wird. 70 Prozent mehr nomineller Rechenleistung gegenüber dem GK104-Chip würden im übrigen einen Chiptakt von immerhin 912 MHz bei den vollen 2880 Shader-Einheiten des GK110-Chips ergeben – und dann schon 977 MHz Chiptakt bei nur 14 aktiven Shader-Clustern aka 2688 Shader-Einheiten.

Dies sind hohe Ziele – aber zumindest läßt sich daran ablesen, daß nVidia den GK110 nicht mit deutlich niedrigeren Taktraten plant, sondern anscheinend nur einen maßvollen Taktraten-Schnitt gegenüber dem GK104-Chip ansetzen will. Ob alles hiervon in der Praxis erreicht wird, bliebe die reale Produktion des GK110-Chips abzuwarten, aber selbst auf nur 850 MHz Chiptakt für einen vollen GK110-Chip würde man immer noch 58 Prozent mehr nominelle Rechenleistung gegenüber dem GK104-Chip auf die Waage bringen. Zusammen mit dem 384 Bit DDR breiten Speicherinterface und den augenscheinlich 6 Raster Engines (GPC), welche die Auslastung der Shader-Einheiten hochhalten, kann damit unsere bisherige Performance-Prognose für den Gamer-Bereich durchaus auf 35 bis 45 Prozent Mehrperformance gegenüber der GeForce GTX 680 erhöht werden.