Launch-Analyse nVidia GeForce GTX 1060

Mittwoch, 20. Juli 2016
 / von Leonidas
 

Mit der GeForce GTX 1060 stellt nVidia seine dritte Gamer-Grafikkarte auf Pascal-Basis vor – und die erste, für welche es seitens AMD ernsthafte Konkurrenz in Form der Radeon RX 480 gibt. Beide Grafikkarten gehen in dasselbe Performance- und Preissegment, mit meistens eher geringen Unterschieden, so das auf einen interessanten Zweikampf auf Augenhöhe zu hoffen ist. Mit Radeon RX 480 & GeForce GTX 1060 wird grob gesehen das alte Midrange-Segment um Radeon R9 380/380X & GeForce GTX 960 zur Performance von Radeon R9 390X & GeForce GTX 980 ersetzt. Unsere Launch-Analyse trägt wie immer alle Daten zur Fakten zur neuen Grafikkarte zusammen sowie wird abschließend deren Performance auf Basis der Auswertung möglichst vieler Testberichte bewerten.

Die GeForce GTX 1060 basiert auf dem neuen GP106-Chip und bringt den Vollausbau dieses Grafikchips mit. Der GP106-Chip ist ein klassischer Midrange-Grafikchip mit seiner Chipfläche von exakt 200mm², auf welchen 4,4 Milliarden Transistoren untergebracht wurden. Aus Effizienzsicht ist dies eine hohe Leistung seitens nVidia, denn AMD benötigt für grob dieselbe Performance immerhin 5,7 Mrd. Transistoren auf 232mm² Chipfläche beim Polaris-10-Chip, während in der vorhergehenden 28nm-Generation für grob dieselbe Performance der GM204-Chip mit 5,2 Mrd. Transistoren auf immerhin 398mm² Chipfläche benutzt wurde.

Vom Aufbau her ist der GP106 nahezu wie eine halbierte Version des GP104-Chips von GeForce GTX 1070 & GeForce GTX 1080 zu sehen: Halbierte Anzahl an Raster-Engines, Shader-Clustern, Shader-Einheiten und Textureneinheiten. Nur beim Speicherinterface setzte nVidia nicht auf eine glatte Halbierung, da dies die GP106-basierten Grafikkarten zu stark limitiert hätte – somit gibt es ein 192 Bit GDDR5-Speicherinterface. Jenes ermöglicht natürlich auch nur die "krummen" Speichermengen von 3 und 6 GB GDDR5-Speicher – wobei nVidia wie bekannt auch über eine GeForce GTX 1060 mit nur 3 GB Speicher sowie zusätzlichen Hardware-Abspeckungen nachdenkt. Alle nachfolgenden Ausführungen beziehen sich damit allein auf die 6-GB-Version der GeForce GTX 1060, auch wenn dies teilweise nicht explizit so notiert sein sollte.

nVidia GP106 Blockdiagramm
nVidia GP106 Blockdiagramm
nVidia GP104/GP106 Shader-Cluster
nVidia GP104/GP106 Shader-Cluster

Ein interessantes Detail besteht in den Raster Operation Units (ROPs), die mit an das Speicherinterface angegliedert sind und damit entsprechend dessen Breite aus 48 Stück beim GP106-Chip bestehen. Auf Basis der Anzahl der Shader-Cluster (10) und den Eigenheiten der aktuellen nVidia-Architekturen können regulär aber nur 40 ROPs mit Daten gefüttert werden. Die restlichen 8 ROPs kommen nur zum Einsatz, wenn Multisampling Anti-Aliasing zu berechnen wäre. Eine wirkliche Limitation stellt dies natürlich nicht dar – es existiert beim GP106-Chip immer genügend ROP-Power, um mit den von den Shader-Einheiten kommenden Daten fertigzuwerden.

Ansonsten entspricht der GP106-Chip technologisch voll und ganz der Pascal-Generation, mit allen deren bereits zum Launch der GeForce GTX 1080 notierten Verbesserungen und Neuerungen. Jene sind nicht besonders großartig, primär nutzt nVidia mit der Pascal-Generation einfach nur die Flächenvorteile der 16nm-Fertigung von TSMC aus, um besonders kleine Grafikchips zu bauen. Zudem kommt ein erheblicher Taktratengewinn durch diese Fertigung hinzu, auch wieder bei der GeForce GTX 1060 mit real anliegenden Taktraten im Bereich von über 1800 MHz zu sehen. Als kleine Differenz zu den anderen Pascal-basierten Beschleunigern unterstützt die GeForce GTX 1060 allerdings kein SLI – weder im Referenzdesign, noch will nVidia diese Funktionalität bei den Herstellerdesigns sehen. Hiermit will nVidia wohl verhindern, das jemand die teure GeForce GTX 1080 durch zwei GeForce GTX 1060 Karten unter SLI ersetzt – was zwar aus preislicher Sicht naheliegt, aber aufgrund der üblichen Nachteile von SLI & CrossFire sowieso nicht wirklich zu empfehlen wäre.

Stichwort Referenz- und Herstellerdesigns: Von der GeForce GTX 1060 hat nVidia wiederum eine "Founders Edition" aufgelegt, welche auch die Basis der allermeisten Launchreviews darstellte. Allerdings wird dieses Referenzdesign nicht in den freien Handel gehen, wie es noch bei GeForce GTX 1070 & 1080 der Fall war. Vielmehr wird nVidia die GeForce GTX 1060 "Founders Edition" allein über seinen eigenen Online-Shop vertreiben, während die Grafikkarten-Hersteller im Fall der GeForce GTX 1060 ausschließlich ihre eigenen Herstellerdesigns verkaufen werden. Jene können natürlich auf das Platinenlayout des Referenzdesigns setzen und nur einen anderen Kühlkörper mitbringen – aber es sind hier ähnlich der vorhergehenden GeForce GTX 960 auch völlig abweichende Kartendesigns zu erwarten, genauso wie starke Werksübertaktungen und andere Sondervarianten.

Radeon RX 480 GeForce GTX 960 GeForce GTX 980 GeForce GTX 1060
Chipbasis AMD Polaris 10 nVidia GM206 nVidia GM204 nVidia GP106
Fertigung 5,7 Mrd. Transistoren in 14nm auf 232mm² Chipfläche bei GlobalFoundries 2,94 Mrd. Transistoren in 28nm auf 227mm² Chipfläche bei TSMC 5,2 Mrd. Transistoren in 28nm auf 398mm² Chipfläche bei TSMC 4,4 Mrd. Transistoren in 16nm auf 200mm² Chipfläche bei TSMC
Architektur GCN4, DirectX 12 Feature-Level 12_0 Maxwell 2, DirectX 12 Feature-Level 12_1 Pascal, DirectX 12 Feature-Level 12_1
Features Vulkan, Mantle, Asynchonous Compute, VSR, CrossFire, TrueAudio Next, FreeSync Vulkan, DSR, SLI, PhysX, G-Sync Vulkan, Asynchonous Compute, DSR, PhysX, G-Sync
Technik 4 Raster-Engines, 2304 Shader-Einheiten, 144 TMUs, 32 ROPs, 256 Bit GDDR5-Interface, 2 MB Level2-Cache (Vollausbau) 2 Raster-Engines, 1024 Shader-Einheiten, 64 TMUs, 32 ROPs, 128 Bit GDDR5-Interface, 1 MB Level2-Cache (Vollausbau) 4 Raster-Engines, 2048 Shader-Einheiten, 128 TMUs, 64 ROPs, 256 Bit GDDR5-Interface, 2 MB Level2-Cache (Vollausbau) 2 Raster-Engines, 1280 Shader-Einheiten, 80 TMUs, 48 ROPs, 192 Bit GDDR5-Interface, 1,5 MB Level2-Cache (Vollausbau)
Taktraten 4GB: 1120/1266/3500 MHz
(Ø-Chiptakt: ~1220 MHz)
8GB: 1120/1266/4000 MHz
(Ø-Chiptakt: 1209 MHz)
1127/1178/3500 MHz
(Ø-Chiptakt: 1316 MHz)
1126/1216/3500 MHz
(Ø-Chiptakt: 1153 MHz)
1506/1708/4000 MHz
(Ø-Chiptakt: 1841 MHz)
Speicherausbau 4/8 GB GDDR5 2/4 GB GDDR5 4 GB GDDR5 6 GB GDDR5
Layout DualSlot DualSlot DualSlot DualSlot
Kartenlänge 24,3cm 21,5-27cm
(Herstellerdesigns)
27,0cm 24,9cm
Ref./Herst./OC / / / / / / / /
Stromstecker 1x 6pol.
(Herstellerdesigns 1x 8pol.)
1x 6pol. oder 1x 8pol.
(je nach Karte)
2x 6pol. 1x 6pol.
off. Verbrauch 150W (TBP) 120W (GCP) 165W (GCP) 120W (GCP)
Idle-Verbrauch 8GB: 16W 10W 12W 7W
Spiele-Verbrauch 8GB: 163W 109W 174W 119W
Ausgänge HDMI 2.0b (mit HDCP 2.2), 3x DisplayPort 1.3 (DP1.4-ready) DualLink DVI-I, HDMI 2.0 (mit HDCP 2.2), 3x DisplayPort 1.2 DualLink DVI-I, HDMI 2.0 (kein HDCP 2.2), 3x DisplayPort 1.2 DualLink DVI-I, HDMI 2.0b (mit HDCP 2.2), 3x DisplayPort 1.2 (DP1.4-ready)
FullHD Perf.Index 4GB: 520%
8GB: 550%
340% 600% 590%
Listenpreis 4GB: 199$
8GB: 239$
2GB: 199$ 499$ 249$/299$
(Herst./Ref.)
Straßenpreis 4GB: 220-250€
8GB: 270-300€
2GB: 170-190€
4GB: 185-210€
360-420€ 280-320€
Release 29. Juni 2016 22. Januar 2015 19. September 2014 19. Juli 2016

Eine gewisse Problematik liegt damit natürlich darin, das Tests eines Kartendesigns, welches dann gar nicht im Handel auftaucht, eigentlich keine besondere Aussagekraft entwickeln können. Viele Herstellerdesigns werden deutlich vom Referenzdesign abweichen – was aber nicht bedeutet, das die Grafikkartenhersteller keine einfachen Standarddesigns auflegen, jene bekommen nur meist keine besonders Aufmerksamkeit. Man kann die Launchtests zur GeForce GTX 1060 in der "Founders Edition" also auf die Standarddesigns der Grafikkartenhersteller beziehen – und deren Werksübertaktungen sind sowieso extra zu betrachten, dies war bei früheren Grafikkarten schließlich genauso.

Dabei können letztlich sogar Grafikkarten mit völlig voneinander abweichenden nominellen Taktraten dieselbe Performance erreichen – wenn denn das Power-Limit dieser Karten identisch ist. Heutige Grafikkarten von AMD und nVidia arbeiten inzwischen durchgehend mit Mechanismen, welche den Stromverbrauch an einem festen Punkt begrenzen und somit ganz automatisch dynamische Taktraten erzeugen. Damit sind allerdings auch die nominellen Taktraten einer Grafikkarte inzwischen weit weniger wichtig – theoretisch kann sogar die Situation auftreten, das eine Karte mit nominell viel höheren Taktraten langsamer läuft als eine Grafikkarte mit nominell niedrigeren Taktraten, einfach weil durch das gesetzte Power-Limit limitiert.

Radeon RX 480 8GB (Ref.) GeForce GTX 980 (Ref.) GeForce GTX 1060 6GB (Ref.)
Temperatur-Limit 90°C 80°C (+14°C möglich) 83°C (+7°C möglich)
Power-Limit 170W (+50% möglich) 180W (+25% möglich) 120W (+16% möglich)
nominelle Taktraten 1120/1266/4000 MHz 1126/1216/3500 MHz 1506/1708/4000 MHz
maximaler Boost-Takt 1266 MHz 1290 MHz 1911 MHz
durchschn. realer Takt 1197 MHz, 1221 MHz
ø = 1209 MHz
1130 MHz, 1144 MHz, 1186 MHz
ø = 1153 MHz
1842 MHz 1821 MHz, 1860 MHz
ø = 1841 MHz
reale Rechenleistung 5,57 TFlops 4,72 TFlops 4,71 TFlops

Die GeForce GTX 1060 im Referenzdesign trägt ein Power-Limit von augenscheinlich 120 Watt – wobei die meisten Testberichte an dieser Stelle leider nur die offiziellen Karten-TDP von ebenfalls 120 Watt zitieren, obwohl beide Werte durchaus voneinander abweichen können (wie sogar bei den meisten Grafikkarten). Mit diesem von HT4U nachgewiesenem Power-Limit überbietet die Karte allerdings ihre offiziellen Taktraten von 1506/1708/4000 MHz schon spielend, im Schnitt der Messungen lag ein durchschnittlicher Chiptakt von gleich 1841 MHz an – durchaus nahe des maximalen Chiptakts von 1911 MHz. Werksübertaktungen werden sicherlich mit noch höheren Power-Limits antreten, was neben der höheren Performance dann natürlich auch eine abweichende Stromverbrauchs-Charakteristik nach sich ziehen wird.