Launch-Analyse AMD Radeon RX 6600 XT

Mittwoch, 25. August 2021
 / von Leonidas
 

Mit der Radeon RX 6600 XT auf Basis des Navi-23-Chips schickt AMD seine fünfte RDNA2-basierte Grafikkarte sowie den dritten RDNA2-Grafikchip in den Markt – und rundet somit (vorerst) sein Angebot nach unten hin ab. Augenscheinlicher Zielpunkt ist das Performance- und Preissegment der GeForce RTX 3060 auf GA106-Basis als bislang kleinster Ampere-basierter Grafikkarte. Für diesen Zweck optimierte AMD den Navi-23-Chip gezielt auf eine starke FullHD-Performance – unter jedoch Inkaufnahme von ungewöhnlich starken Performance-Abschläge bei höheren Auflösungen. Wie stark die Radeon RX 6600 XT unter ihrer Ziel-Auflösung "FullHD" im Schnitt der Launchreviews herausgekommen ist, wie heftig jene Abschläge unter WQHD & 4K ausfallen und wo sich AMDs neue Karte damit insgesamt einordnen muß, soll mit dieser Launch-Analyse herausgearbeitet werden.

Der für die Radeon RX 6600 XT angesetzte Navi-23-Chip ist ein vergleichsweise ungewöhnliches Konstrukt, gerade im Vergleich zum nächsthöheren Navi-22-Chip für die Radeon RX 6700 XT: Wo AMD ansonsten immer auf eher große Differenzen zwischen den Grafikchip setzt, gibt es hier nur den Unterschied von 32 zu 40 Shader-Clustern – gerade einmal +25% mehr beim größeren Navi-22-Chip (bzw. –20% weniger beim kleineren Navi-23-Chip). FP32-Einheiten, TMUs & RA-Einheiten verlieren zwischen beiden Grafikchips im gleichen (geringen) Maßstab – und bei Nebenpunkten wie Raster-Engines (2) sowie ROPs (64) herrscht sogar totaler Gleichstand. Die erste größere Differenz findet sich beim Speicherinterface, wo Navi 23 nur mit 128 Bit an den Start geht. Gegenüber den 192 Bit von Navi 22 ist dies eine Abspeckung von immerhin –33%, äquivalent dazu wurde der Level2-Cache von 3 auf 2 MB verringert.

Die zweite größere Differenz besteht beim Infinity Cache, wo Navi 23 mit 32 MB nur ein Drittel (–67%) der 96 MB von Navi 22 bekommen hat. Jene geringe Größe macht den Infinity Cache gemäß dessen bekannter Hitraten eigentlich nur noch unter FullHD wirkmächtig – dort agiert das eigentlich nur 128 Bit breite Speicherinterface von Navi 23 dann sinngemäß wie ein 284 Bit breites Interface (und somit sogar etwas stärker als bei Navi 10). Die Effekte unter WQHD und 4K sind dann allerdings stark zurückgehend, die sinngemäße Interface-Breite beträgt unter WQHD nur noch 206 Bit, unter 4K gar nur noch 175 Bit. An dieser Stelle steckt die genannte Optimierung von Navi 23 auf die FullHD-Auflösung, denn natürlich sind diese (sinngemäßen) Interface-Breiten für WQHD wenigstens grenzwertig und für 4K dann zu wenig. Vor allem aber ergibt sich über die (deutlich) unterschiedliche effektive Bandbreite per Auflösung eine klare Performance-Abstufung bei Navi 23 – zugunsten von kleineren Auflösungen, wo der Infinity Cache besser wirken kann.

Navi 23 Navi 22 Navi 21
Codename "Dimgrey Cavefish" "Navy Flounder" "Sienna Cichlid"  ("Big Navi")
Chipbasis 11,1 Mrd. Transistoren auf 236mm² Chipfläche in der 7nm-Fertigung von TSMC 17,2 Mrd. Transistoren auf 335mm² Chipfläche in der 7nm-Fertigung von TSMC 26,8 Mrd. Transistoren auf 519mm² Chipfläche in der 7nm-Fertigung von TSMC
Technik 2 Raster-Engines, 32 Shader-Cluster, 2048 FP32-Einheiten, 128 TMUs, 32 RA-Einheiten, 64 ROPs, 2 MB Level2-Cache, 32 MB Infinity Cache, 128 Bit GDDR6-Interface 2 Raster-Engines, 40 Shader-Cluster, 2560 FP32-Einheiten, 160 TMUs, 40 RA-Einheiten, 64 ROPs, 3 MB Level2-Cache, 96 MB "Infinity Cache", 192 Bit GDDR6-Interface 4 Raster-Engines, 80 Shader-Cluster, 5120 FP32-Einheiten, 320 TMUs, 80 RA-Einheiten, 128 ROPs, 4 MB Level2-Cache, 128 MB "Infinity Cache", 256 Bit GDDR6-Interface
PCI Express 8 Lanes PCI Express 4.0 16 Lanes PCI Express 4.0 16 Lanes PCI Express 4.0
verbaut bei Radeon RX 6600 XT (Vollausbau) Radeon RX 6700 XT (Vollausbau) Radeon RX 6800 & 6800 XT (beide Salvage), Radeon RX 6900 XT (Vollausbau)
RDNA1-Vorgänger Navi 12: ? Mrd. Transistoren auf ~209mm² in der 7nm-Fertigung von TSMC, 4 Raster-Engines, 40 Shader-Cluster, 2560 FP32-Einheiten, 160 TMUs, 64 ROPs, ? MB Level2-Cache, 2048 Bit HBM2-Interface Navi 10: 10,3 Mrd. Transistoren auf 251mm² in der 7nm-Fertigung von TSMC, 4 Raster-Engines, 40 Shader-Cluster, 2560 FP32-Einheiten, 160 TMUs, 64 ROPs, 4 MB Level2-Cache, 256 Bit GDDR6-Interface -
Block-Diagramm AMD Navi 23 Block-Diagramm (by Locuza)
AMD Navi 23 Block-Diagramm
AMD Navi 22 Block-Diagramm (by Locuza)
AMD Navi 22 Block-Diagramm
AMD Navi 21 Block-Diagramm (by Locuza)
AMD Navi 21 Block-Diagramm
Hinweis: Chipflächen entsprechen den Angaben von Locuza @ Twitter, nicht AMDs offiziellen Angaben

Ein fast nebensächlicher Unterschied betrifft dann noch das PCI-Express-Interface, welches Chip-seitig bei Navi 23 tatsächlich nur mit 8 Lanes von PCI Express 4.0 ausgeführt wurde. Performance-technisch ergibt dies nur einen marginalen Effekt, wenn selbst die sinngemäße Limitierung auf nur noch 4 Lanes von PCI Express 4.0 (erzeugt über 8 Lanes von PCI Express 3.0) in einem kürzlichen Test kaum zu beachtbaren Performance-Differenzen führt. Diese Abspeckung mag zudem wohl auch dem Punkt geschuldet sein, dass Navi 23 in vielen Hardware-Punkten recht nahe an Navi 22 herankommt – und AMD somit auch hier und da mal den Rotstift ansetzen musste, um angesichts der vergleichsweise geringen Hardware-Unterschiede überhaupt auf eine beachtbar geringere Chipfläche zu kommen. Letzteres ist einwandfrei gelungen, denn Navi 23 ist trotz nur –20% weniger Shader-Clustern um ~100mm² (–30%) kleiner als Navi 22 ausgefallen.

Wie schon bei der Radeon RX 6700 XT auf Navi-22-Basis, kommt mit der Radeon RX 6600 XT auf Navi-23-Basis ein Vollausbau des zugrundeliegenden Grafikchips daher. Im Gegensatz zu den meisten anderen Karten-Modellen der RDNA2- und Ampere-Generationen geht es dabei deutlich unterhalb von 200 Watt Stromverbrauch: AMD gibt die Radeon RX 6600 XT mit 160 Watt TBP an, bei einem referenzmäßigen ASIC-Powerlimit von 130 Watt. Die einzige hierzu ähnliche Karte neueren Baudatums ist die GeForce RTX 3060, welche auf 170 Watt GCP und Powerlimit läuft. Momentan stellen beide genannten Karten die alleinigen (modernen) Optionen dar, wenn man seinem PC-System keine Grafikkarte mit 200 Watt Stromverbrauch (oder mehr) zumuten will.

GeForce RTX 3060 GeForce RTX 3060 Ti Radeon RX 6600 XT Radeon RX 6700 XT
Chipbasis nVidia GA106-300 nVidia GA104-200 AMD Navi 23 AMD Navi 22 XT
Fertigung 12,0 Mrd. Transistoren auf 276mm² in der 8nm-Fertigung von Samsung 17,4 Mrd. Transistoren auf 392mm² in der 8nm-Fertigung von Samsung 11,1 Mrd. Transistoren auf 236mm² in der 7nm-Fertigung von TSMC 17,2 Mrd. Transistoren auf 335mm² in der 7nm-Fertigung von TSMC
Architektur nVidia Ampere, DirectX 12 Feature-Level 12_2 AMD RDNA2, DirectX 12 Feature-Level 12_2
Features DirectX 12, OpenGL, Vulkan, Asynchonous Compute, RayTracing, DSR, DLSS, PhysX, G-Sync, FreeSync, rBAR DirectX 12, OpenGL, Vulkan, Asynchronous Compute, RayTracing, VSR, FSR, FreeSync, TrueAudio Next, XConnect, SAM
Technik 3 Raster-Engines, 28 Shader-Cluster, 3584 FP32-Einheiten, 112 TMUs, 28 RT-Cores v2, 112 Tensor-Cores v3, 48 ROPs, 2,25 MB Level2-Cache, 192 Bit GDDR6-Interface (Salvage) 5 Raster-Engines, 38 Shader-Cluster, 4864 FP32-Einheiten, 152 TMUs, 38 RT-Cores v2, 152 Tensor-Cores v3, 80 ROPs, 4 MB Level2-Cache, 256 Bit GDDR6-Interface (Salvage) 2 Raster-Engines, 32 Shader-Cluster, 2048 FP32-Einheiten, 128 TMUs, 32 RA-Einheiten, 64 ROPs, 2 MB Level2-Cache, 32 MB "Infinity Cache", 128 Bit GDDR6-Interface (Vollausbau) 2 Raster-Engines, 40 Shader-Cluster, 2560 FP32-Einheiten, 160 TMUs, 40 RA-Einheiten, 64 ROPs, 3 MB Level2-Cache, 96 MB "Infinity Cache", 192 Bit GDDR6-Interface (Vollausbau)
Taktraten 1320/1777 MHz & 15 Gbps 1410/1665 MHz & 14 Gbps 1968/2359/2589 MHz & 16 Gbps 2321/2424/2581 MHz & 16 Gbps
Rohleistungen 12,7 TFlops & 360 GB/sec 16,2 TFlops & 448 GB/sec 9,7 TFlops & 256 GB/sec 12,4 TFlops & 384 GB/sec
Speicherausbau 12 GB GDDR6 8 GB GDDR6 8 GB GDDR6 12 GB GDDR6
Anbindung PCIe 4.0 x16 PCIe 4.0 x16 PCIe 4.0 x8 PCIe 4.0 x16
Ref./Herst./OC / / / / / / / /
Layout Dual/TripleSlot Dual/TripleSlot Dual/TripleSlot Dual/TripleSlot
Kartenlänge Herst: 17,0-32,3cm Herst: 17,2-32,3cm
FE: 24,5cm
Herst: 17,9-30,5cm Herst: 22,8-32,3cm
Ref: 27,0cm
Stromstecker 1x 8pol. 1x 12pol. 1x 8pol. 1x 6pol. & 1x 8pol.
off. Verbrauch 170W (GCP) 200W (GCP) 160W (TBP) 230W (TBP)
realer Verbr. 171W 201W 156W 220W
Ausgänge HDMI 2.1, 3x DisplayPort 1.4 HDMI 2.1, 3x DisplayPort 1.4 HDMI 2.1, 3x DisplayPort 1.4 HDMI 2.1, 3x DisplayPort 1.4
FullHD Perf.Index 1130% 1460% 1260% 1540%
4K Perf.Index 165% 217% 159% 221%
Listenpreis $329  (UVP: 329€) $399  (UVP: 419€) $379  (UVP: 380€) $479  (UVP: 479€)
Straßenpreis 550-700 Euro 650-800 Euro 430-600 Euro 760-900 Euro
Release 25. Februar 2021 2. Dezember 2020 11. August 2021 18. März 2021

Die bei der Radeon RX 6600 XT gebotene Speichermenge wird durch das verbaute Speicherinterface bestimmt und liegt somit bei 8 GB (die anderen Wahlmöglichkeiten für AMD wären alleinig 4 oder 16 GB gewesen). Gegenüber der GeForce RTX 3060 mit deren 12 GB sind "nur" 8 GB Grafikkartenspeicher auf der Radeon RX 6600 XT ein gewisser optischer Nachteil – andererseits gilt die nVidia-Karte in dieser Disziplin auch ein wenig "overpowered", die nächstgrößeren nVidia-Karten tragen ihrerseits dann schließlich auch wieder nur 8 GB. Aufgrund der Speicher-Ansetzung sowie klaren FullHD-Ausrichtung verwundert dennoch der vergleichsweise hohe Listenpreis der Radeon RX 6600 XT von gleich 379 Dollar – dies sind immerhin 50 Dollar mehr als bei der GeForce RTX 3060 sowie gerade einmal 20 Dollar vor der GeForce RTX 3060 Ti. Sicherlich spielt hierbei mit hinein, dass AMD & nVidia zuletzt generell dazu übergegangen sind, ihre Listenpreise näher an das aktuelle Straßenpreis-Niveau zu setzen, dies mit früheren Listenpreisen somit schwerer vergleichbar ist.

Trotz gegenüber der Radeon RX 6700 XT nominell geringerer bis maximal gleicher Taktraten kommt die Radeon RX 6600 XT in der Praxis von Realtakt-Ermittlungen auf dem höchsten bislang ermittelten Stand heraus – immerhin 2562 MHz durchschnittlicher Realtakt bei einer auf Referenz-Werten simulierten Karte bei der ComputerBase (die leicht werksübertaktete MSI Gaming X lief sogar auf durchschnittlich 2616 MHz). Die übliche Tendenz, dass kleinere Grafikchips höher takten können, zeigt sich somit auch in diesem Fall – genauso wie die erhebliche Taktraten-Differenz zwischen AMDs RDNA2-Grafikkarten und nVidias Ampere-Grafikkarten gewahrt bleibt. Auf Realtakt gerechnet, nähert sich die Radeon RX 6600 XT der GeForce RTX 3060 bei der FP32-Rechenleistung damit sogar weiter (leicht) an: Nominell sind es 9,7 zu 12,7 TFLops (76%), auf Realtakt eher 10,5 zu 13,4 TFlops (78%).

Basis Durchschnitt Maximum gemessener Realtakt
AMD-Bezeichnung: "Base Clock" "Game Clock" "Boost Clock"
Radeon RX 6900 XT 1825 MHz 2015 MHz 2250 MHz 2800 MHz CB: 2265 MHz – TPU: 2233 MHz
Radeon RX 6800 XT 1825 MHz 2015 MHz 2250 MHz 2577 MHz CB: 2216 MHz – TPU: 2257 MHz
Radeon RX 6800 1700 MHz 1815 MHz 2105 MHz ? CB: 2177 MHz – TPU: 2205 MHz
Radeon RX 6700 XT 2321 MHz 2424 MHz 2581 MHz 2699 MHz CB: 2531 MHz – TPU: 2491 MHz
Radeon RX 6600 XT 1968 MHz 2359 MHz 2589 MHz ? CB: 2562 MHz
nVidia-Bezeichnung: "Base Clock" "Boost Clock"
GeForce RTX 3090 1400 MHz 1700 MHz ? TPU: 1754 MHz
GeForce RTX 3080 Ti 1365 MHz 1665 MHz ? CB: 1784 MHz – TPU: 1780 MHz
GeForce RTX 3080 1450 MHz 1710 MHz 1995 MHz CB: 1827 MHz – TPU: 1931 MHz
GeForce RTX 3070 Ti 1575 MHz 1770 MHz 1950 MHz CB: 1878 MHz – TPU: 1861 MHz
GeForce RTX 3070 1500 MHz 1725 MHz 2040 MHz CB: 1920 MHz – TPU: 1882 MHz
GeForce RTX 3060 Ti 1410 MHz 1665 MHz 2010 MHz CB: 1900 MHz – TPU: 1877 MHz
GeForce RTX 3060 1320 MHz 1777 MHz ? grob bei 1850-1900 MHz
Realtakt-Angaben gemäß den Ausarbeitungen der ComputerBase (Ø 17 Spiele) und von TechPowerUp (Ø 22-23 Spiele)

Wie bei der GeForce RTX 3060 kommt auch die Radeon RX 6600 XT ohne Referenzdesign in den Markt – womit beide Grafikchip-Entwickler auch den Punkt umgehen können, jene Karten zum Listenpreis in ihren eigenen Onlineshops anbieten zu "müssen". Für eine exakte Performance-Ermittlung bedeutet dies eine zusätzliche Schwierigkeit, denn sinnvollerweise sollte ein Performance-Index die Performance auf Referenz-Taktung abbilden. Selbst wer rein auf werksübertaktete Modelle schwört, benötigt zum Vergleich letztlich doch immer eine möglichst allgemeingültige Basis. Dabei bewegen sich die meisten der anfänglich erhältlichen werksübertakteten Modelle zur Radeon RX 6600 XT laut den Ermittlungen von ComputerBase & TechPowerUp (jeweils im Vergleich mit einer simulierten Referenz-Karte) in einem engen Rahmen bezüglich deren Mehrperformance. Allerdings ist das Performance-Bild nicht ganz eindeutig, wie anhand der unterschiedlichen Messungen zur MSI Gaming X oder zur XFX Speedster Merc 308 zu sehen.

FullHD #1 FullHD #2 FullHD #3 WQHD/1440p 4K/2160p
Benchmark-Quelle:   CB: 5 Tests CB: 17 Tests TPU: 22 Tests TPU: 22 Tests TPU: 22 Tests
ASRock Phantom Gaming D @ TPU 2064/2428/2607 MHz, TGP 145W - - +3% +4% +3%
Asus Strix OC @ TPU 2000/2428/2607 MHz, TGP 145W - - +2% +3% +3%
MSI Gaming X @ CB & TPU 2064/2428/2607 MHz, TGP 135W +3,0% +1,8% +2% +3% +3%
PowerColor Red Devil @ CB 2064/2428/2607 MHz, TGP 145W +3,8% - - - -
Sapphire Pulse @ CB & TPU 2000/2382/2593 MHz, TGP 135W +2,9% - +1% +2% +2%
XFX Speedster Merc 308 @ CB & TPU 2188/2428/2607 MHz, TGP 145W +3,6% - +1% +2% +2%
Hinweise: Performance-Werte werden bei TechPowerUp nur gerundet auf volle Zahlen angegeben — default-Taktung: 1968/2359/2589 MHz, TGP 130W

Ein klein wenig muß man somit doch mit Annahmen arbeiten, wenn es um den Performance-Unterschied zur Referenztaktung geht. Augenscheinlich kommen die einfachsten Werksübertaktungen mit 135 Watt TGP grob auf eine FullHD-Mehrperformance von +2%, während hingegen jene Modelle mit 145 Watt TGP etwas mehr zulegen können und somit auf +3% FullHD-Mehrperformance zu schätzen sind. Die jeweils offiziell angesetzten Taktraten spielen hierfür augenscheinlich nur eine untergeordnete, in jedem Fall keine eindeutige Rolle – weil die Karten sich natürlich sowieso automatisch so hoch takten, wie es jeweils möglich ist. Für WQHD, 4K und RayTracing wurde zudem aufgrund der diesbezüglichen Tendenz der vorliegenden Benchmarks eine jeweils um ein halbes Prozent höher liegende Performance-Differenz angenommen. Dabei liegen glücklicherweise wenigstens vier Testberichte vor, welche eine simulierte Referenzkarte oder ein Herstellerdesign auf Referenztakt (samt passender TGP) verwendet haben.

Hardware FHD Perf.-Effekt Testberichte
simulierte Referenz-Karte 1968/2359/2589 MHz, TGP 130W Referenz ComputerBase, PC Games Hardware & TechPowerUp
PowerColor Fighter 1968/2359/2589 MHz, TGP vmlt. 130W wie Referenz Golem
MSI Gaming X 2064/2428/2607 MHz, TGP 135W geschätzt +2% GameStar & Igor's Lab
Gigabyte Gaming OC Pro ?/2428/2607 MHz, TGP vmlt. 145W geschätzt +3% Le Comptoir du Hardware
ASRock Gaming Phantom D 2064/2428/2607 MHz, TGP 145W geschätzt +3% Tweakers
Für den Performance-Effekt unter WQHD, 4K und RayTracing wird mit einem Zuschlag von jeweils +0,5% gerechnet.