Launch-Analyse AMD Radeon RX 480

Donnerstag, 30. Juni 2016
 / von Leonidas
 

Mit der Radeon RX 480 stellt AMD seine erste Grafikkarte der 14/16nm-Generation vor, welche deutlich mehr Performance (bezogen auf den Preispunkt) und eine (durch die neue Fertigung logischerweise) deutlich bessere Energieeffizienz mitbringen soll. Wie der umfangreichen Vorberichterstattung schon zu entnehmen, geht die Radeon RX 480 auf Basis des Polaris-10-Chip dabei nicht in den Zweikampf mit nVidias GeForce GTX 1070 & 1080 auf Basis des GP104-Chips, sondern ist eine glatte Performance-Stufe darunter angesiedelt. Mit der neuen Karte bringt AMD vielmehr eine klassische Midrange-Lösung zu Preispunkten von 214 Euro (4 GB) bzw. 256 Euro (8 GB) daher – welche nicht insgesamt, sondern in ihrem Preisbereich die beste Performance bieten soll.

Dabei setzt AMD vollkommen zu Recht auf dieses Preissegment, gemäß unserer aktuellen Umfrage liegt im Preissegment von 200-300 Euro ein absoluter "Sweetspot", wo also große Mengen an Käufern zu finden sind. Die bisher in diesem Preissegment zu findenden Angebote der 28nm-Generation in Form von Radeon R9 380 & 380X sowie GeForce GTX 960 sind inzwischen angegraut, bei den Speichermengen teilweise hinter der Zeit (2-GB-Varianten) und haben selbst innerhalb nur der 28nm-Generation betrachtet zu wenig "Bumms", um wirklich etwas reißen zu können. Die von der Performance her interessanteren 28nm-Lösungen Radeon R9 390 & 390X sowie GeForce GTX 970 & 980 waren hingegen lange Zeit nur auf Preislagen von 350-500 Euro zu finden – klar zu teuer für ein Midrange-Angebot. Genau dieses will die Radeon RX 480 nunmehr bieten: Eine Performance von Radeon R9 390 und GeForce GTX 970 zu Preislagen von Radeon R9 380X und GeForce GTX 960.

AMD nVidia
Enthusiast Fiji   ->   Vega 11
R9 Nano, Fury & Fury X   ->   ?
GM200   ->   GP102
GTX 980 Ti & Titan X   ->   ?
HighEnd Hawaii   ->   Vega 10
R9 390 & 390X   ->   ?
GM204   ->   GP104
GTX 970 & 980   ->   GTX 1070 & 1080
Performance Tonga   ->   Polaris 10
R9 380 & 380X   ->   RX 470 & 480
GM206   ->   GP106
GTX 950 & 960   ->   GTX 1060
Mainstream Bonaire & Pitcairn   ->   Polaris 11
R7 360 & 370   ->   RX 460
GM107   ->   GP107
GTX 750 & 750 Ti   ->   ?

Für dieses Ziel nutzt AMD bei der Radeon RX 480 den Polaris-10-Grafikchip aus der Polaris/Vega-Generation, welcher die vierte GCN-Ausführung (inoffiziell: GCN 2.0) und die 14nm-Fertigung von Auftragsfertiger GlobalFoundries in sich vereint. Auf einer Chipfläche von 232mm² konnte man dabei 5,7 Milliarden Transistoren unterbringen, was grob dem Hawaii-Chip (6,2 Mrd. Transistoren auf 438mm² Chipfläche) von Radeon R9 390 & 390X entspricht – welche die Radeon RX 480 schließlich bei der Performance anpeilt. Auch in anderen Fragen sieht Polaris 10 manchmal wie ein auf die 14nm-Fertigung geschrumpfter Hawaii-Chip aus: Die Anzahl der Shader-Einheiten ist halbwegs im selben Feld (2304 zu 2816) – gerade wenn man die Neigung von Polaris 10 zu höheren Taktraten mit einrechnet, welches die fehlenden Shader-Einheiten gut kompensieren kann. Für die Textureneinheiten gilt dasselbe, die Raster-Engines liegen zudem mit jeweils 4 Stück gleichauf (zuzüglich des Taktraten-Vorteils von Polaris 10).

Deutliche Abweichungen gibt es hingegen beim Speicher-Subsystem: Kam der Hawaii-Chip von Radeon R9 390 & 390X noch mit einem 512 Bit GDDR5-Interface samt 64 Rastereinheiten (ROPs) daher, sind es beim Polaris-10-Chip der Radeon RX 480 glatt nur die Hälfte davon: Ein 256 Bit GDDR5-Interface samt 32 ROPs. Höhere Speichertaktraten gleichen einen Teil des Rückstands aus, auch gibt es eine neue Farbkompression – aber dennoch liegt Polaris 10 in dieser Frage nominell klar gegenüber dem vorhergehenden Hawaii-Chip zurück. Rein Hardware-technisch stellt Polaris 10 also den Versuch dar, eine Rechen- und Texturierleistung ähnlich wie beim Hawaii-Chip mit einer deutlich niedrigeren Speicherbandbreite sowie ROP-Power zu verbinden – und dann trotzdem noch die Hawaii-Performance (auf einem viel niedrigeren Stromverbrauch) zu erreichen.

AMD Radeon RX 480 Blockschaltbild
AMD Radeon RX 480 Blockschaltbild
AMD Polaris Shader-Cluster
AMD Polaris Shader-Cluster

Um dies zu erreichen, setzt AMD primär auf diverse (zumeist kleinere) Verbesserungen der vierten GCN-Ausführung. Der (geringeren) Speicherbandbreite soll zudem eine weiter verbesserte Farbkompression sowie der verdoppelte Level2-Cache weiterhelfen. Polaris 10 ist also grob betrachtet nicht nur ein auf die 14nm-Fertigung geschrumpfter Hawaii-Chip, sondern vor allem auch ein deutlich modernes Design als der seinerzeit ziemlich große und natürlich auch für andere Aufgaben gedachte Hawaii-Chip. Dies zeigt sich auch in den anderen von AMD für Polaris 10 angesetzten Innovationen:

  • vierte GCN-Ausführung
    Mit der vierten GCN-Ausführung hat sich AMD vornehmlich dem Thema der besseren Einheitenauslastung gewidmet – und dazu diverse kleinere Stellschrauben im Grafikchip neu justiziert sowie die Performance der Geometrie-Einheiten grundsätzlich verbessert. Dabei fällt auch eine deutliche Verbesserung der Tesselations-Performance ab, welche laut HT4U bei ungefähr +78% zur Radeon R9 390 und damit dann ziemlich exakt auf dem Niveau der GeForce GTX 970 liegt.
     
  • verbesserte Farbkompression
    Die AMD-Farbkompression verfügt nun über einen 4:1- sowie einen 8:1-Modus und soll zudem (per Treiber) häufiger wirksam werden. Gegenüber dem Fiji-Chip gibt AMD dazu einen Gewinn an effektiver Speicherbandbreite von ca. +16% an, gegenüber dem Hawaii-Chip (ohne jede Farbkompression) von ca. +35%.
     
  • verdoppelter Level2-Cache
    Gegenüber dem Hawaii-Chip bringt Polaris 10 einen auf 2 MB verdoppelten Level2-Cache mit, was erneut der effektiven Speicherbandbreite weiterhilft.
     
  • neues Boost-Verfahren
    Mit dem Polaris-10-Chip geht AMD weg vom bisherigem Boost-Verfahren, dessen Aufgabe eher nur darin lag, absolute Lastspitzen abzufangen, die Grafikkarte aber ansonsten an ihren Maximal-Takt zu bringen. Das neue Boost-Verfahren bei Polaris 10 geht vielmehr denselben Weg, welchen nVidia bei seinem Boost-Verfahren bereits ansetzt: Die Karte hat wieder einen Basetakt, hinzu kommt ein Maximal-Takt, welcher aber nur bestenfalls erreicht wird. Der reale Boost-Takt befindet sich dazwischen und wird durch Temperatur- und Power-Limits dynamisch geregelt.
     
  • Wattman
    AMD legt mit der Radeon RX 480 ein neues Overclocking-Panel im Rahmen des AMD-Treibers auf, den "Wattman". Hierbei hat man alle Steuerungs- und Overclocking-Funktionen auf einen Blick und kann nachfolgend an allen möglichen Stellschrauben drehen: Takt & Spannung in allen P-States, Lüfterregelung, Temperatur- und Power-Limit. Das ganze ist deutlich komfortabler wie umfangreicher als im Overdrive-Panel früherer AMD-Treiber, ist also sicherlich eine gutklassige Verbesserung.
     
  • Adaptive Clocking, AVFS, BTC & MBFF
    Die vier Chip-internen Technologien Adaptive Clocking, Adaptive Voltage & Frequency Scaling (AVFS), Boot Time Calibration (BTC) und Multi-Bit-Flip-Flops (MBFF) sind allein dazu da, Taktraten und Spannungen möglichst effektiv einzusetzen und arbeiten damit der allgemeinen Energieeffizienz zu. Hardwareluxx bringen hierzu nähere Details.
     
  • Variable Rate Shading
    Mit dieser Technologie ist es möglich, einzelne Bildbereiche gezielt mit einer geringeren Auflösung zu berechnen und damit Rohleistung einzusparen. Relevant ist dies insbesondere für VR-Gaming, da dort die Bildränder üblicherweise stark verzerrt wiedergegeben werden und damit nicht dieselbe hohe Renderqualität wie in der Mitte benötigen. nVidia unterstützt dieses Feature bereits seit der Maxwell-Generation. Bislang gibt es allerdings noch keine praktischen Anwendungen dieses Features, da jenes vom Spieleentwickler explizit unterstützt werden muß.
     
  • TrueAudio Next
    Diese Erweiterung des bisherig TrueAudio-Standards von AMD geht in dieselbe Richtung wie VRWorks Audio von nVidias Pascal-Generation: Raytracing-ähnliche Berechnung von mehreren Audioquellen, was besonders unter VR-Gaming interessant sein soll. Wie bei nVidia handelt es sich um ein exklusives Feature, welches die Spieleentwickler auch explizit unterstützen müssen. Beim bisherigen TrueAudio hat dies nicht so wirklich funktioniert, insofern bleibt der Erfolg von TrueAudio Next (wie auch der von VRWorks Audio) streng abzuwarten.
     
  • verbesserter Decode- und Encode-Support
    Die UVD-Einheit wurde wieder einmal aktualisiert, wobei die genauen Änderungen eher fließend gegenüber den früheren AMD-Grafikchips sind und als echte Neuerung nur der Support der Standards MJPEG und VP9 hinzugekommen ist – wobei letzterer derzeit noch nicht benutzt werden kann, da diese Funktionalität noch nicht im aktuellen Treiber freigeschaltet wurde. Grob betrachtet ist AMD mit dem Decode- und Encode-Support auf der Höhe der Zeit bzw. auf dem Niveau von nVidias Pascal-Generation.
    Radeon HD 7970 Radeon R9 290X Radeon R9 285 Radeon R9 Fury X Radeon RX 480
    Technik Tahiti, GCN 1.0 Hawaii, GCN 1.1 Tonga, GCN 1.2 Fiji, GCN 1.2 Polaris 10, GCN 2.0
    Decode H.264 bis 1080P60
    VC1 bis 1080p60
    MP4-P2 bis 1080p60
    H.264 bis 1080P60
    VC1 bis 1080p60
    MP4-P2 bis 1080p60
    H.264 bis 4K120
    VC1 bis 1080p60
    MP4-P2 bis 1080p60
    H.264 bis 4K120
    VC1 bis 1080p60
    MP4-P2 bis 1080p60
    Main HEVC bis 4K60
    H.264 bis 4K120
    VC1 bis 1080p60
    MP4-P2 bis 1080p60
    Main-10 HEVC bis 4K60
    VP9 bis 4K
    MJPEG bis 4K30
    Encode H.264 bis 1080p75 H.264 bis 1080p75 H.264 bis 4K60 H.264 bis 4K30 H.264 bis 4K30
    HEVC bis 4K60
  • HDMI 2.0b & DisplayPort 1.4
    Mit dem Polaris-10-Chip unterstützt AMD nunmehr ebenfalls die aktuellen Display-Normen HDMI 2.0b (inklusive Kopierschutz HDCP 2.2) und DisplayPort 1.4. In letzterem Fall ist derzeit allerdings erst einmal nur der offizielle Support für DisplayPort 1.3 real vorhanden, da die nachfolgende Norm 1.4 noch nicht final verabschiedet ist. AMD ist sich allerdings sicher, zukünftig die offizielle Zertifizierung für DisplayPort 1.4 mit dem Polaris-10-Chip zu bestehen und gibt daher bereits offiziell "DisplayPort 1.4" an.

In der Summe der verschiedenen Hardware-Verbesserungen spricht AMD dann von einer Leistungssteigerung gegenüber der zweiten GCN-Ausführung von bis zu 15% pro Shader-Cluster. Die Zahl selber klingt gut, basiert aber leider auf einer unseriösen Berechnung seitens AMD: Verglichen wurden hierbei Radeon RX 480 (36 Shader-Cluster) und Radeon R9 290 (40 Shader-Cluster) – allerdings nicht taktratennormiert und damit im eigentlichen falsch. Eine korrekte, taktnormierte Berechnung ergäbe sogar ein Minus, da die Radeon R9 290 mit ≤947 MHz deutlich niedriger taktet als die Radeon RX 480 und damit ihre Performance ausgehend von einer klar niedrigeren Rechenleistung (zu allerdings einer klar höheren Speicherbandbreite) erbringt. Somit sagen eigentlich schon AMDs eigene Performancewerte aus, das die vierte GCN-Generation nicht für eine höhere Takt- und Cluster-normierte Performance steht – obwohl das Marketing etwas völlig anderes verlauten läßt.