19

Die offiziellen Spezifikationen und eine aktualisierte Performance-Prognose zur GeForce GTX 1070

Mit dem Launch der GeForce GTX 1080 hat nVidia auf seinen Webseiten nun auch offizielle Angaben und Spezifikationen zur GeForce GTX 1070 veröffentlicht, womit die bisherigen Spezifikations-Angaben ergänzt und die darauf basierende Performance-Prognose aktualisiert werden kann. Wichtigster Punkt ist die Bekanntgabe der groben Hardware-Daten, welche auf 1920 Shader-Einheiten an einem 256 Bit GDDR5-Speicherinterface lauten. Der Shader-Count ist damit nochmals etwas niedriger als zuletzt gedacht, dies sind gerade einmal drei Viertel der Shader-Einheiten der GeForce GTX 1080 – eine ungewöhnlich hohe Abspeckung. Dafür konnte nVidia die Taktraten ziemlich weit oben lassen, jene lauten offiziell auf 1506/1683/4000 MHz – woraus sich wieder die vorher schon so genannte offizielle (theoretische) Rechenleistung von ~6,5 TFlops ergibt. Wie die realen Taktraten der Karte unter Last ausfallen, müssen dann die Hardwaretests zum offiziellen Launch am 10. Juni 2016 nachprüfen.

GeForce GTX 970 GeForce GTX 980 GeForce GTX 980 Ti GeForce GTX 1070
Chipbasis nVidia GM204, 5,2 Mrd. Transist. in 28nm auf 398mm² Chipfläche nVidia GM200, 8 Mrd. Transist. in 28nm auf 601mm² Chipfläche nVidia GP104, 7,2 Mrd. Transist. in 16nm auf 314mm² Chipfläche
Architektur Maxwell 2, DirectX 12 Feature-Level 12_1 Pascal, DirectX 12 Feature-Level 12_1
Technik 4 Raster-Engines, 1664 Shader-Einheiten, 104 TMUs, 56 ROPs, 224 Bit GDDR5-Interface 4 Raster-Engines, 2048 Shader-Einheiten, 128 TMUs, 64 ROPs, 256 Bit GDDR5-Interface 6 Raster-Engines, 2816 Shader-Einheiten, 176 TMUs, 96 ROPs, 384 Bit GDDR5-Interface 1920 Shader-Einheiten, 120 TMUs, 256 Bit GDDR5-Interface
Taktraten 1050/1178/3500 MHz
(Ø-Chiptakt: 1178 MHz)
1126/1216/3500 MHz
(Ø-Chiptakt: 1144 MHz)
1000/1075/3500 MHz
(Ø-Chiptakt: 1114 MHz)
1506/1683/4000 MHz
Rechenleistung 3,92 TFlops 4,69 TFlops 6,27 TFlops ~6,5 TFlops
Bandbreite 196 GB/sec 224 GB/sec 336 GB/sec 256 GB/sec
Speicherausbau 4 GB GDDR5
(nur 3,5 GB performant nutzbar)
4 GB GDDR5 6 GB GDDR5 8 GB GDDR5
Ref./Herst./OC // // // //?
Stromstecker 2x 6pol. 2x 6pol. 1x 6pol. + 1x 8pol. 1x 8pol.
TDP 145W  (GCP) 165W  (GCP) 250W  (GCP) 150W  (GCP)
Ausgänge DualLink DVI-I, HDMI 2.0 (kein HDCP 2.2), 3x DisplayPort 1.2 DualLink DVI-I, HDMI 2.0 (kein HDCP 2.2), 3x DisplayPort 1.2 DualLink DVI-I, HDMI 2.0 (kein HDCP 2.2), 3x DisplayPort 1.2 DualLink DVI-D, HDMI 2.0b, 3x DisplayPort 1.4
FullHD Perf.Index 520% 600% 730% geschätzt ~720-760%
4K Perf.Index 64% 77% 100% geschätzt ~100-105%
Listenpreis 329$ 499$ 649$ 449$
(Herstellerdesigns ab 379$)
Release 19. September 2014 31. Mai 2015 10. Juni 2016

Da das Speicherinterface im Gegensatz zur GeForce GTX 970 augenscheinlich nicht abgespeckt wurde und mit gleich 4000 MHz DDR Speichertakt läuft, kommt sogar eine Speicherbandbreite leicht oberhalb des Niveaus der GeForce GTX 980 heraus. Aufgrund des vollen Speicherinterfaces ist auch eine Abspeckung bei der (bislang ungenannten) Anzahl der Raster Operation Units (ROPs) eher unwahrscheinlich – da jene üblicherweise derart fest an das Speicherinterface gebunden sind, das eine niedriger Anzahl an ROPs automatisch auch ein kleineres Speicherinterface oder aber wenigstens ein kleineres nutzbares Speicherinterface nach sich zieht. Rein praktisch braucht die GeForce GTX 1070 aufgrund der klar niedrigeren Rechenleistung nicht die vollen 64 ROPs des GP104-Chips, aber wegen dieser Seitenwirkung auf das Speicherinterface ist es eher unwahrscheinlich, das nVidia hier herumspielt (es sei denn, man hätte einen Weg gefunden, dies richtiggehend zu entkoppelt).

Eine eher mögliche Abspeckung könnte dann bei den Raster-Engines liegen: nVidia verbaut beim GP104-Chip vier Stück hiervon, der GeForce GTX 1070 fehlen jedoch glatt ein Viertel der Shader-Einheiten der GeForce GTX 1080 – an dieser Stelle könnte man natürlich auch eine Raster-Engine deaktivieren. Gebraucht würde jene für die GeForce GTX 1070 nicht wirklich, nach Deaktivierung ergibt sich das exakt gleiche Verhältnis von Shader- zu Raster-Power wie bei der GeForce GTX 1080. Echte Performance-Auswirkungen sind hiervon nicht zu erwarten – oder anders formuliert: Mit allen vier Raster-Engines wäre die GeForce GTX 1070 wohl auch nicht schneller. Insofern erscheint dies als logische Abspeckung, auch wenn es derzeit dafür natürlich noch keinerlei Belege hierfür gibt. In nachfolgender Übersicht der Rohleistungen (basierend erst einmal auf dem offiziellen Boosttakt von 1683 MHz) wurde diese Annahme bereits eingearbeitet:

Sehr gut bereits an diesen Rohleistungen zu sehen ist die grundsätzliche Ausrichtung der GeForce GTX 1070 – zwar als Nachfolger der GeForce GTX 970, aber mit wesentlich mehr Performance. Jene sollte klar das Performance-Niveau der GeForce GTX 980 übersteigen und eher in Richtung der GeForce GTX 980 Ti gehen. Die primären Differenzen zur GeForce GTX 1080 sind hiermit ebenfalls gut erkennbar: Die größere GP104-Variante bringt 34,2% mehr Rechenleistung zu 25,0% mehr Speicherbandbreite mit sich. Dies ist ein vergleichsweise hoher Unterschied, bei GeForce GTX 970 zu 980 lagen diese Werte bei +19,5% bzw. +14,3%, was dann zu einer Performance-Differenz von ca. 15% unter FullHD und ca. 20% unter UltraHD führte – letzteres sicherlich auch beeinflußt durch den nur 3,5 GB bei der GeForce GTX 970 performant nutzbaren Speicher. Einen solchen Effekt dürfte es beim Vergleich von GeForce GTX 1070 zu 1080 nicht geben, insofern sollte die Performance-Differenz beider Karten eher leicht unterhalb der Differenz bei der Rohleistung liegen.

Ein anderer Hinweis zur Performance der GeForce GTX 1070 ist direkt der nVidia-Webseite zu entnehmen: Dort soll auf Basis zweier Benchmark-Titel die GeForce GTX 1070 um 71% vor einer GeForce GTX 970 liegen. Normalerweise sind Hersteller-eigene Angaben und auf Basis so weniger Testtitel keine ernsthafte Betrachtung wert – aber im Fall der GeForce GTX 1080 hat sich im nachhinein gezeigt, das die nVidia-eigenen Performanceangaben ziemlich treffsicher waren. Mit dem gleichen Benchmark-Set hatte nVidia der GeForce GTX 1080 einen Performance-Vorteil gegenüber der GeForce GTX 980 von 72% prophezeit, in der Realität der Launchtests waren es dann gemittelt +70% unter UltraHD. Beide Ansätze zur Performance-Prognose ergeben dann einen 4K Performance-Index von zwischen 100 bis 110%, wobei wir für die GeForce GTX 1070 lieber etwas defensiv schätzen wollen und jene damit derzeit auf ~100-105% einordnen. Hieraus folgt ein FullHD Performance-Index, der irgendwo zwischen ~720-760% liegen dürfte.

Dies ergibt ein Performanceniveau wie von GeForce GTX 980 Ti und Titan X her bekannt – die GeForce GTX 1070 ist zwar der Nachfolger der GeForce GTX 970, löst aber von der Performance her diese beiden Enthusiasten-Lösungen ab. Und hierbei wird es endlich auch interessante Preisvorteile geben, denn die GeForce GTX 1070 ist mit einem Listenpreis für die Founders Edition von 449 Dollar klar besser angesetzt als GeForce GTX 980 Ti (649$, Straßenpreis derzeit bei 600-640€) und natürlich GeForce GTX Titan X (999$, Straßenpreis derzeit bei 1000-1100€). Sollten die Grafikkarten-Hersteller dann auch noch den angekündigten Preis von 379 Dollar für die Herstellerdesigns umsetzen können, kommt die GeForce GTX 1070 fast schon als Preisbrecher daher. Bei dieser zweiten GP104-Karte wird sich dann jener Effekt finden lassen, welcher üblicherweise Grafikkarten auf neuer Fertigungstechnologie auszeichnet – das es mit diesen klar mehr Performance zum selben Preispunkt gibt. Kommt alles ungefähr so heraus, wie wir vorstehend prognostiziert haben, dürfte die GeForce GTX 1070 somit das weit interessantere Produkt basierend auf dem GP104-Chip von nVidias Pascal-Generation werden.

Nachtrag vom 20. Mai 2016

Die PC Games Hardware hat sich von nVidia bestätigen lassen, das das Speicher-Subsystem der GeForce GTX 1070 in keiner Form beschnitten ist – bis auf die Nutzung von GDDR5-Speicher anstatt von GDDR5X-Speicher natürlich. Hierzu hat man sich die explizite Bestätigung eingeholt, das es auch in den Details – Anzahl der Raster Operation Units, Menge des Level2-Caches, Level der Farbkomprimierung – keine Unterschiede zur GeForce GTX 1080 geben wird. Dies war schon vermutet worden (und zwar auch allein deswegen, weil nVidia nicht noch einmal so ein Ärgernis wie bei der GeForce GTX 970 erleben will) – aber eine offizielle Bestätigung ist natürlich viel besser als wohlfeile Annahmen. nVidia braucht bei der GeForce GTX 1070 auch keine derartigen Abspeckungen, weil allein der Wechsel von GDDR5X auf GDDR5 (trotz deutlich höheren Speichertakts) die Speicherbandbreite in diesem konkreten Fall um 20% reduziert. Zusammen mit dem 25%igen Verlust an Shader-Einheiten von GeForce GTX 1080 zu 1070 wird sich immer ein vergleichsweise hoher Performance-Abstand zwischen beiden Karten ergeben, da braucht es keine zusätzlichen Abspeckungen an Nebenpunkten.