10

Die bisherigen Spezifikationen und eine grobe Performance-Prognose zur GeForce GTX 1070

In all dem medialen Wirbel um die GeForce GTX 1080 droht die zweite GP104-basierte Grafikkarte derzeit fast unterzugehen – dabei dürfte die GeForce GTX 1070 aufgrund ihres deutlich niedrigeren Preispunkts die viel interessantere Karte werden, mittels welcher nVidia den Markterfolg der GeForce GTX 970 zu replizieren versuchen wird. Denn während die GeForce GTX 1080 mit ziemlich hohen Preispunkten von 699$ bzw. 599$ (Referenzdesigns bzw. Herstellerdesigns) in den Markt kommen wird, sollen es bei der GeForce GTX 1070 "nur" 449$ bzw. 379$ werden. Dies ist immer noch hoch und glasklares HighEnd-Segment, gerade im Vergleich mit dem Preispunkt der GeForce GTX 970 von 329 Dollar – aber dennoch ist dies ein Preisnachlaß von gut 35% gegenüber der GeForce GTX 1080, ungewöhnlich viel für zwei direkt nebeneinanderstehende Grafikkarten basierend auf demselben Grafikchip.

Dabei weist die GeForce GTX 1070 zwei primäre Differenzen auf: Als Speicher wird (an demselben 256 Bit breiten Speicherinterface) nur gewöhnlicher GDDR5-Speicher verwendet, womit nicht die hohen Speicherbandbreite der GDDR5X-bestückten GeForce GTX 1080 erreicht werden können. Allerdings hat nVidia der GeForce GTX 1080 auch nur einen eher zaghaften Speichertakt von 2500 MHz QDR mitgegeben – damit ist keine Verdopplung der Speicherbandbreite machbar. Vielmehr sind es somit gegenüber GDDR5-Speicher auf einer Taktung von 3500 MHz DDR nur 43% mehr Speicherbandbreite (bzw. 30% weniger), auf einer Taktung von 4000 MHz DDR (theoretisch schon lieferbar) sind es gar nur 25% mehr (bzw. 20% weniger). Der ganz große Nachteil ergibt sich hier also nicht, dafür sind die effektiven Speichertaktungen zu nahe aneinanderliegend (selbst wenn der genaue Speichertakt der GeForce GTX 1070 derzeit noch nicht bekannt ist).

Zudem passt diese Differenz bei der Speicherbandbreite zur Differenz bei der (theoretischen) Rechenleistung, welche sich auf +36,5% zugunsten der GeForce GTX 1080 (bzw. 26,7 weniger bei der GeForce GTX 1070) beläuft. Für die genauen Abstände sind allerdings Erhebungen zu den real anliegenden Chiptaktraten abzuwarten – daran (und am konkreten Speichertakt) kann sich noch einiges verschieben. Somit läßt sich derzeit leider erst nur eine eher ungenaue Performance-Prognose abgeben. Aufgrund des beiderseitig starken Unterschieds bei theoretischer Rechenleistung und Speicherbandbreite ist letztlich aber auch von einem ebenso kräftigen Performance-Unterschied zwischen beiden GP104-basierten Karten ausgehen, welcher (je nach konkreten Taktraten) bei etwa +30-35% zugunsten der GeForce GTX 1080 liegen sollte. Dies würde dann umgerechnet einen FullHD Performance-Index der GeForce GTX 1070 von geschätzt ~670-730% ergeben, zuzüglich eines 4K Performance-Index von geschätzt ~90-95%.

GeForce GTX 970 GeForce GTX 980 GeForce GTX 980 Ti GeForce GTX 1070
Chipbasis nVidia GM204, 5,2 Mrd. Transist. in 28nm auf 398mm² Chipfläche nVidia GM200, 8 Mrd. Transist. in 28nm auf 601mm² Chipfläche nVidia GP104, 7,2 Mrd. Transist. in 16nm auf ~300mm² Chipfläche
Architektur Maxwell 2, DirectX 12 Feature-Level 12_1 Pascal, DirectX 12 Feature-Level 12_1
Technik 4 Raster-Engines, 1664 Shader-Einheiten, 104 TMUs, 56 ROPs, 224 Bit GDDR5-Interface 4 Raster-Engines, 2048 Shader-Einheiten, 128 TMUs, 64 ROPs, 256 Bit GDDR5-Interface 6 Raster-Engines, 2816 Shader-Einheiten, 176 TMUs, 96 ROPs, 384 Bit GDDR5-Interface geschätzt: 2048-2304 Shader-Einheiten, sicher: 256 Bit GDDR5-Interface
Rechenleistung 3,92 TFlops
(Ø-Chiptakt: 1178 MHz)
4,69 TFlops
(Ø-Chiptakt: 1144 MHz)
6,27 TFlops
(Ø-Chiptakt: 1114 MHz)
6,5 TFlops
Speicherausbau 4 GB GDDR5
(nur 3,5 GB performant nutzbar)
4 GB GDDR5 6 GB GDDR5 8 GB GDDR5
Ref./Herst./OC // // // //?
Ausgänge DualLink DVI-I, HDMI 2.0 (kein HDCP 2.2), 3x DisplayPort 1.2 DualLink DVI-I, HDMI 2.0 (kein HDCP 2.2), 3x DisplayPort 1.2 DualLink DVI-I, HDMI 2.0 (kein HDCP 2.2), 3x DisplayPort 1.2 DualLink DVI-D, HDMI 2.0b, 3x DisplayPort 1.4
FullHD Perf.Index 520% 600% 730% geschätzt ~670-730%
4K Perf.Index 64% 77% 100% geschätzt ~90-95%
Listenpreis 329$ 499$ 649$ 449$  (Herstellerdesigns angeblich ab 379$, erhältlich zwei Wochen nach Launch)
Release 19. September 2014 31. Mai 2015 10. Juni 2016

Treffen diese Performance-Prognosen zu, würde dies die GeForce GTX 1070 knapp unterhalb die Performance einer GeForce GTX 980 Ti führen (und deutlich oberhalb einer GeForce GTX 980) – womit diese Karte in der Tat mehr Aufmerksamkeit verdient, denn genau so etwas stellt sich der Käufer einer 70er Karte des nVidia-Nummernschemas unter einer sinnvollen Aufrüstung vor. Der Preispunkt von 449 Dollar für die Referendesigns ist zwar ein wenig zu hoch für eine typische 70er Karte, aber eventuell können dies die Herstellerdesigns wieder herausreißen, welche nVidia für ab 379 Dollar angesetzt hat. Schafft nVidia bei der GeForce GTX 1070 einen Straßenpreis von beachtbar unter 400 Dollar zu etablieren, dürfte die Karte ebenfalls zum Markterfolg werden. In Euroland dürfte dies schwieriger werden, denn selbst US-Preise von 379 Dollar ergeben hierzulande (zum aktuellen Dollar-Kurs und mit Mehrwehrsteuer) knapp 400 Euro, landen also an einer verkaufspsychologischen Barriere. Damit ist leider auch dieser Karte nVidias aktuelle Strategie der Grafikkarten-Preiserhöhungen anzusehen, wenn auch nicht so drastisch wie bei der GeForce GTX 1080.

Die von nVidia genannten 6,5 TFlops theoretische SinglePrecision-Rechenleistung sind im übrigen über verschiedene Wege zu erreichen: Niedrigere Taktraten oder/und Abspeckungen bei der Anzahl der aktiven Shader-Einheiten – wobei natürlich ein Mix aus beiden Methoden am wahrscheinlichsten ist. Denkbar wäre beispielsweise eine Auflösung mit 2304 Shader-Einheiten und dann einem Boosttakt von ~1410 MHz, was recht zaghaft gemessen an den Taktraten der GeForce GTX 1080 wäre. Auf nur 2048 Shader-Einheiten wäre dieselbe Rechenleistung mit einem Boosttakt von ~1586 MHz zu erreichen, was deutlich griffiger klingt. Andere Auflösungen sind aber genauso denkbar und letztlich ist es auch ziemlich egal, in welcher Kombination diese Rechenleistung erzielt wird. Probleme in diese Richtung hin, das besonders niedrigere Taktraten nachfolgend Overclocker herausfordern würden, braucht nVidia aufgrund des abriegelnden Power-Limits im eigentlichen nicht zu fürchten – durch jenes Mittel kann nVidia schließlich selber festlegen, welchen Overclocking-Spielraum es gibt.