Launch-Analyse AMD Radeon R9 Fury X

Donnerstag, 25. Juni 2015
 / von Leonidas
 

Mit der Radeon R9 Fury X auf Basis des Fiji-Chips wagt AMD seit langem mal wieder einen echten Angriff auf die absolute Leistungsspitze im SingleChip-Bereich. Zuletzt versuchte man dies (allerdings mit großartigem Fehlschlag) mit der Radeon HD 2900 XT auf Basis des R600-Chips – einer der allerersten DirectX-10-Lösungen im Jahre 2007. In der Zwischenzeit hatte AMD immer nur eher kurzfristig die Leistungsspitze inne, wenn man mal innerhalb einer Technologie-Generation zeitlich früher als nVidia dran war (Radeon HD 5870 & Radeon HD 7970). Ansonsten beschränkte sich AMD bekannterweise eher darauf, Grafikkarten bis zu einer noch bezahlbare Preisgrenze anzubieten, nicht aber mit aller Macht die Performancekrone anzustreben. AMDs Grafikchip-Größen seit dem R600-Chip sprechen hierfür eine deutliche Sprache: Kein Chip war größer als 438mm² (Hawaii) – während nVidia beim größten Chip des Portfolios fast durchgehend im Bereich von 500-600mm² operierte, mit dem aktuellen GM200-Chip sogar diese Grenze leicht (601mm²) überbot.

Mit dem Fiji-Chip der Fury-Serie ändert sich dies nun grundlegend: Jener wurde ausschließlich dafür gebaut, nVidia auch bei der Spitzenposition anzugreifen – weswegen AMD die bisher übliche Chipgrößen-Limitierung ablegte und in die Vollen ging: Auf einer Chipfläche von 596mm² bringt man 8,9 Milliarden Transistoren unter (GM200: 8 Mrd. auf 601mm²), welche satte 4096 Shader-Einheiten beherbergen – ein Plus von 45% an Shader-Einheiten gegenüber dem vorhergehenden Hawaii-Chip der Radeon R9 290 & 390 Serien, bei nur 36% größerer Chipfläche. Da keine neue Fertigungstechnologie außer TSMCs bekannter 28nm-Fertigung zur Verfügung stand, war einfach nicht mehr möglich – und auch dies nur unter Anstrengungen. nVidia hat bei seinem Spitzenchip GM200 die vorher üblichen (und eigentlich für Tesla-Bedürfnisse benötigten) DoublePrecision-Einheiten glatt gestrichen (DP/SP-Verhältnis 1:32), AMD ging beim Fiji-Chip nun einen ähnlichen Weg (DP/SP-Verhältnis 1:16). Trotzdem stand AMD beim Fiji-Chip vor dem Problem, daß zwar 4096 Shader-Einheiten der GCN-Architektur verbaubar waren, jene allerdings auch die Verlustleistung enorm nach oben treiben würden – ausgehend von den ~270 Watt Stromverbrauch beim Hawaii-Chip wäre dies beim 45% fetteren Fiji-Chip schnell in Richtung 400 Watt Verlustleistung gegangen.

Da solche Extreme heutzutage (bei einer SingleChip-Grafikkarte) einfach nicht mehr gangbar sind oder aber zumindest schwer abgestraft würden, entschloß sich AMD, mehrere Fliegen mit einer Klappe zu schlagen: Durch den Verbau eines HBM-Speicherinterfaces samt entsprechendem HBM-Speicher erhielt man nicht nur deutlich mehr Speicherbandbreite als mit GDDR5-Speicher derzeit möglich wäre (512 GB/sec bei HBM gegenüber derzeit maximal 384 GB/sec bei GDDR5) und sparte sich etwas Chipfläche zugunsten von mehr Platz für andere Hardware-Einheiten ein, sondern erzielte vor allem einen erheblichen Vorteil bei der anfallenden Verlustleistung: Zwischen 50-80 Watt spart ein HBM-Interface gegenüber einem GDDR5-Interface ein (die Speicherchips selber verbrauchen dagegen kaum Strom) – was den Fiji-Chip überhaupt erst in der aktuell vorliegenden Form möglich macht. Zusammen mit der per default bei der Radeon R9 Fury X verbauten Wasserkühlung (bessere Kühlung = niedrigere Chiptemperaturen = geringerer Stromverbrauch) war es daher möglich, den Verbrauchswert der neuen Grafikkarte weiterhin unter 300 Watt zu halten – und damit nicht aus dem derzeit üblichen Rahmen fallen zu lassen.

Allerdings handelte man sich mit dem HBM1-Speicher auch einen gravierenden Nachteil ein: So ist der verbaute HBM1-Speicher weiteraus unflexibler als der im Jahr 2016 kommende HBM2-Speicher, was die Speicherbestückung angeht. An das von AMD beim Fiji-Chip verbaute 4096 Bit DDR HBM-Interface sind unter HBM1-Bedingungen eben nur 4 GB HBM1-Speicher andockbar – mehr Speicher würde unter HBM1-Bedingungen ein verdoppeltes Interface bedingen, was dann aber Overkill wäre (und zudem wiederum weniger Strom sparen würde). 4 GB Grafikkartenspeicher sind im Jahr 2015 eine eigentlich ehrbare Sache – aber speziell für den Anspruch einer schnellsten Grafikkarte, die dann eben auch unter 4K schnell sein muß, trotzdem zumindest riskant. Ob AMD dies zu den Zeiten, wo das Design des Fiji-Chips festgelegt wurde, schon erkennen konnte, sei dahingestellt – ändern konnte man es aus technischen Gründen sowieso nicht. Erst der im nächsten Jahr kommende HBM2-Speicher wird diesbezüglich mehr Flexibilität aufweisen – und da das Fiji-Speicherinterface angeblich auch mit HBM2-Speicher zurechtkommt, wären dann auch 8-GB-Ausführungen der Fury-Grafikkarten möglich. Wie weit die Radeon R9 Fury X mit ihren "nur" 4 GB Speicher kommt, wird man sehen müssen – genügend Vergleichsgegenstände stehen in Form von GeForce GTX 980 mit 4 GB, GeForce GTX 980 Ti mit 6 GB und GeForce GTX Titan X mit 12 GB Grafikkartenspeicher zur Verfügung.

Radeon R9 390X Radeon R9 Fury X GeForce GTX 980 GeForce GTX 980 Ti GeForce GTX Titan X
Chipbasis AMD Hawaii, 6,2 Mrd. Transistoren in 28nm auf 438mm² Chipfläche AMD Fiji, 8,9 Mrd. Transistoren in 28nm auf 596mm² Chipfläche nVidia GM204, 5,2 Mrd. Transistoren in 28nm auf 398mm² Chipfläche nVidia GM200, 8 Mrd. Transistoren in 28nm auf 601mm² Chipfläche
Architektur GCN 1.1, DirectX 12.0 GCN 1.2, DirectX 12.0 Maxwell 2, DirectX 12.1
Features Mantle, CrossFire, VSR, FreeSync, TrueAudio PhysX, SLI, DSR, G-Sync
Technik 4 Raster-Engines, 2816 Shader-Einheiten, 176 TMUs, 64 ROPs, 512 Bit DDR Interface, 1 MB Level2-Cache 4 Raster-Engines, 4096 Shader-Einheiten, 256 TMUs, 64 ROPs, 4096 Bit DDR HBM-Interface, 2 MB Level2-Cache 4 Raster-Engines (mit verdoppelter Raster-Power), 2048 Shader-Einheiten, 128 TMUs, 64 ROPs, 256 Bit DDR Interface, 2 MB Level2-Cache 6 Raster-Engines (mit verdoppelter Raster-Power), 2816 Shader-Einheiten, 176 TMUs, 96 ROPs, 384 Bit DDR Interface, 3 MB Level2-Cache 6 Raster-Engines (mit verdoppelter Raster-Power), 3072 Shader-Einheiten, 192 TMUs, 96 ROPs, 384 Bit DDR Interface, 3 MB Level2-Cache
Taktraten ≤1050/3000 MHz ≤1050/500 MHz
(Ø-Chiptakt: 1050 MHz)
1126/1216/3500 MHz
(Ø-Chiptakt: 1144 MHz)
1000/1075/3500 MHz
(Ø-Chiptakt: 1114 MHz)
1000/1075/3500 MHz
(Ø-Chiptakt: 1067 MHz)
Speicherausbau 8 GB GDDR5 4 GB HBM1 4 GB GDDR5 6 GB GDDR5 12 GB GDDR5
Layout DualSlot DualSlot, AiO-Wakü DualSlot DualSlot DualSlot
Kartenlänge 27-31cm
(Herstellerdesigns)
19,0cm 27,0cm 27,0cm 27,0cm
Stromstecker 1x 6pol. + 1x 8pol. 2x 8pol. 2x 6pol. 1x 6pol. + 1x 8pol. 1x 6pol. + 1x 8pol.
TDP 275W 275W 165W 250W 250W
Idle-Verbrauch ~19W 21W 12W 13W 13W
Spiele-Verbrauch ~290W 284W 174W 237W 240W
Ausgänge 2x DualLink DVD-D, HDMI 1.4a (kein HDCP 2.2), DisplayPort 1.2 HDMI 1.4a (kein HDCP 2.2), 3x DisplayPort 1.2 DualLink DVI-I, HDMI 2.0 (kein HDCP 2.2), 3x DisplayPort 1.2 DualLink DVI-I, HDMI 2.0 (kein HDCP 2.2), 3x DisplayPort 1.2 DualLink DVI-I, HDMI 2.0 (kein HDCP 2.2), 3x DisplayPort 1.2
Perf.Index 570% 660% 600% 730% 760%
4K Perf.Index 75% 95% 75% 95% 100%
Ref./Eigen./OC / / / / / / / / / /
Listenpreis 429$ 649$ 499$ 649$ 999$
Straßenpreis 430-470€ erwartet für 700€ 480-520€ 680-730€ 1000-1100€
Release 18. Juni 2015 24. Juni 2015 19. September 2014 31. Mai 2015 17. März 2015

Von den erzielten Rohleistungen her ist die Radeon R9 Fury X ein "Biest" an allen wichtigen Fronten – gerade auch, weil die von AMD vorgegebenen "bis zu 1050 MHz" im Gaming-Einsatz problemlos und durchgehend gehalten werden (nachgemessen von der ComputerBase und Tom's Hardware). In den Hauptdisziplinen Rechenleistung, Texturierleistungen und Speicherbandbreite liegt man deutlich vor GeForce GTX 980 Ti & Titan X, während der Nachteil in den Nebendisziplinen Rasterizer-Power und ROP-Leistung angesichts der hohen erzielten absoluten Werte verschmerzbar erscheint. Zudem ist AMD mit diesen Vorteilen wieder dort, wo man eigentlich mit der GCN-Architektur hin muß, um mit nVidia auf Augenhöhe konkurrieren zu können – dafür hat AMD in der Vergangenheit regelmäßig mehr Rohleistung als nVidia benötigt, nVidias Grafikchip-Architekturen sind (gerade seit Maxwell) eher auf die möglichst effiziente Ausnutzung der Rohleistung hin ausgelegt.