Launch-Analyse AMD Radeon RX 6600 XT

Mittwoch, 25. August 2021

/ von Leonidas

Mit der Radeon RX 6600 XT auf Basis des Navi-23-Chips schickt AMD seine fünfte RDNA2-basierte Grafikkarte sowie den dritten RDNA2-Grafikchip in den Markt – und rundet somit (vorerst) sein Angebot nach unten hin ab. Augenscheinlicher Zielpunkt ist das Performance- und Preissegment der GeForce RTX 3060 auf GA106-Basis als bislang kleinster Ampere-basierter Grafikkarte. Für diesen Zweck optimierte AMD den Navi-23-Chip gezielt auf eine starke FullHD-Performance – unter jedoch Inkaufnahme von ungewöhnlich starken Performance-Abschläge bei höheren Auflösungen. Wie stark die Radeon RX 6600 XT unter ihrer Ziel-Auflösung "FullHD" im Schnitt der Launchreviews herausgekommen ist, wie heftig jene Abschläge unter WQHD & 4K ausfallen und wo sich AMDs neue Karte damit insgesamt einordnen muß, soll mit dieser Launch-Analyse herausgearbeitet werden.

Der für die Radeon RX 6600 XT angesetzte Navi-23-Chip ist ein vergleichsweise ungewöhnliches Konstrukt, gerade im Vergleich zum nächsthöheren Navi-22-Chip für die Radeon RX 6700 XT: Wo AMD ansonsten immer auf eher große Differenzen zwischen den Grafikchip setzt, gibt es hier nur den Unterschied von 32 zu 40 Shader-Clustern – gerade einmal +25% mehr beim größeren Navi-22-Chip (bzw. –20% weniger beim kleineren Navi-23-Chip). FP32-Einheiten, TMUs & RA-Einheiten verlieren zwischen beiden Grafikchips im gleichen (geringen) Maßstab – und bei Nebenpunkten wie Raster-Engines (2) sowie ROPs (64) herrscht sogar totaler Gleichstand. Die erste größere Differenz findet sich beim Speicherinterface, wo Navi 23 nur mit 128 Bit an den Start geht. Gegenüber den 192 Bit von Navi 22 ist dies eine Abspeckung von immerhin –33%, äquivalent dazu wurde der Level2-Cache von 3 auf 2 MB verringert.

Die zweite größere Differenz besteht beim Infinity Cache, wo Navi 23 mit 32 MB nur ein Drittel (–67%) der 96 MB von Navi 22 bekommen hat. Jene geringe Größe macht den Infinity Cache gemäß dessen bekannter Hitraten eigentlich nur noch unter FullHD wirkmächtig – dort agiert das eigentlich nur 128 Bit breite Speicherinterface von Navi 23 dann sinngemäß wie ein 284 Bit breites Interface (und somit sogar etwas stärker als bei Navi 10). Die Effekte unter WQHD und 4K sind dann allerdings stark zurückgehend, die sinngemäße Interface-Breite beträgt unter WQHD nur noch 206 Bit, unter 4K gar nur noch 175 Bit. An dieser Stelle steckt die genannte Optimierung von Navi 23 auf die FullHD-Auflösung, denn natürlich sind diese (sinngemäßen) Interface-Breiten für WQHD wenigstens grenzwertig und für 4K dann zu wenig. Vor allem aber ergibt sich über die (deutlich) unterschiedliche effektive Bandbreite per Auflösung eine klare Performance-Abstufung bei Navi 23 – zugunsten von kleineren Auflösungen, wo der Infinity Cache besser wirken kann.

	Navi 23	Navi 22	Navi 21
Codename	"Dimgrey Cavefish"	"Navy Flounder"	"Sienna Cichlid" ("Big Navi")
Chipbasis	11,1 Mrd. Transistoren auf 236mm² Chipfläche in der 7nm-Fertigung von TSMC	17,2 Mrd. Transistoren auf 335mm² Chipfläche in der 7nm-Fertigung von TSMC	26,8 Mrd. Transistoren auf 519mm² Chipfläche in der 7nm-Fertigung von TSMC
Technik	2 Raster-Engines, 32 Shader-Cluster, 2048 FP32-Einheiten, 128 TMUs, 32 RA-Einheiten, 64 ROPs, 2 MB Level2-Cache, 32 MB Infinity Cache, 128 Bit GDDR6-Interface	2 Raster-Engines, 40 Shader-Cluster, 2560 FP32-Einheiten, 160 TMUs, 40 RA-Einheiten, 64 ROPs, 3 MB Level2-Cache, 96 MB "Infinity Cache", 192 Bit GDDR6-Interface	4 Raster-Engines, 80 Shader-Cluster, 5120 FP32-Einheiten, 320 TMUs, 80 RA-Einheiten, 128 ROPs, 4 MB Level2-Cache, 128 MB "Infinity Cache", 256 Bit GDDR6-Interface
PCI Express	8 Lanes PCI Express 4.0	16 Lanes PCI Express 4.0	16 Lanes PCI Express 4.0
verbaut bei	Radeon RX 6600 XT (Vollausbau)	Radeon RX 6700 XT (Vollausbau)	Radeon RX 6800 & 6800 XT (beide Salvage), Radeon RX 6900 XT (Vollausbau)
RDNA1-Vorgänger	Navi 12: ? Mrd. Transistoren auf ~209mm² in der 7nm-Fertigung von TSMC, 4 Raster-Engines, 40 Shader-Cluster, 2560 FP32-Einheiten, 160 TMUs, 64 ROPs, ? MB Level2-Cache, 2048 Bit HBM2-Interface	Navi 10: 10,3 Mrd. Transistoren auf 251mm² in der 7nm-Fertigung von TSMC, 4 Raster-Engines, 40 Shader-Cluster, 2560 FP32-Einheiten, 160 TMUs, 64 ROPs, 4 MB Level2-Cache, 256 Bit GDDR6-Interface	-
Block-Diagramm	AMD Navi 23 Block-Diagramm	AMD Navi 22 Block-Diagramm	AMD Navi 21 Block-Diagramm
Hinweis: Chipflächen entsprechen den Angaben von Locuza @ Twitter, nicht AMDs offiziellen Angaben

Ein fast nebensächlicher Unterschied betrifft dann noch das PCI-Express-Interface, welches Chip-seitig bei Navi 23 tatsächlich nur mit 8 Lanes von PCI Express 4.0 ausgeführt wurde. Performance-technisch ergibt dies nur einen marginalen Effekt, wenn selbst die sinngemäße Limitierung auf nur noch 4 Lanes von PCI Express 4.0 (erzeugt über 8 Lanes von PCI Express 3.0) in einem kürzlichen Test kaum zu beachtbaren Performance-Differenzen führt. Diese Abspeckung mag zudem wohl auch dem Punkt geschuldet sein, dass Navi 23 in vielen Hardware-Punkten recht nahe an Navi 22 herankommt – und AMD somit auch hier und da mal den Rotstift ansetzen musste, um angesichts der vergleichsweise geringen Hardware-Unterschiede überhaupt auf eine beachtbar geringere Chipfläche zu kommen. Letzteres ist einwandfrei gelungen, denn Navi 23 ist trotz nur –20% weniger Shader-Clustern um ~100mm² (–30%) kleiner als Navi 22 ausgefallen.

Wie schon bei der Radeon RX 6700 XT auf Navi-22-Basis, kommt mit der Radeon RX 6600 XT auf Navi-23-Basis ein Vollausbau des zugrundeliegenden Grafikchips daher. Im Gegensatz zu den meisten anderen Karten-Modellen der RDNA2- und Ampere-Generationen geht es dabei deutlich unterhalb von 200 Watt Stromverbrauch: AMD gibt die Radeon RX 6600 XT mit 160 Watt TBP an, bei einem referenzmäßigen ASIC-Powerlimit von 130 Watt. Die einzige hierzu ähnliche Karte neueren Baudatums ist die GeForce RTX 3060, welche auf 170 Watt GCP und Powerlimit läuft. Momentan stellen beide genannten Karten die alleinigen (modernen) Optionen dar, wenn man seinem PC-System keine Grafikkarte mit 200 Watt Stromverbrauch (oder mehr) zumuten will.

	GeForce RTX 3060	GeForce RTX 3060 Ti	Radeon RX 6600 XT	Radeon RX 6700 XT
Chipbasis	nVidia GA106-300	nVidia GA104-200	AMD Navi 23	AMD Navi 22 XT
Fertigung	12,0 Mrd. Transistoren auf 276mm² in der 8nm-Fertigung von Samsung	17,4 Mrd. Transistoren auf 392mm² in der 8nm-Fertigung von Samsung	11,1 Mrd. Transistoren auf 236mm² in der 7nm-Fertigung von TSMC	17,2 Mrd. Transistoren auf 335mm² in der 7nm-Fertigung von TSMC
Architektur	nVidia Ampere, DirectX 12 Feature-Level 12_2		AMD RDNA2, DirectX 12 Feature-Level 12_2
Features	DirectX 12, OpenGL, Vulkan, Asynchonous Compute, RayTracing, DSR, DLSS, PhysX, G-Sync, FreeSync, rBAR		DirectX 12, OpenGL, Vulkan, Asynchronous Compute, RayTracing, VSR, FSR, FreeSync, TrueAudio Next, XConnect, SAM
Technik	3 Raster-Engines, 28 Shader-Cluster, 3584 FP32-Einheiten, 112 TMUs, 28 RT-Cores v2, 112 Tensor-Cores v3, 48 ROPs, 2,25 MB Level2-Cache, 192 Bit GDDR6-Interface (Salvage)	5 Raster-Engines, 38 Shader-Cluster, 4864 FP32-Einheiten, 152 TMUs, 38 RT-Cores v2, 152 Tensor-Cores v3, 80 ROPs, 4 MB Level2-Cache, 256 Bit GDDR6-Interface (Salvage)	2 Raster-Engines, 32 Shader-Cluster, 2048 FP32-Einheiten, 128 TMUs, 32 RA-Einheiten, 64 ROPs, 2 MB Level2-Cache, 32 MB "Infinity Cache", 128 Bit GDDR6-Interface (Vollausbau)	2 Raster-Engines, 40 Shader-Cluster, 2560 FP32-Einheiten, 160 TMUs, 40 RA-Einheiten, 64 ROPs, 3 MB Level2-Cache, 96 MB "Infinity Cache", 192 Bit GDDR6-Interface (Vollausbau)
Taktraten	1320/1777 MHz & 15 Gbps	1410/1665 MHz & 14 Gbps	1968/2359/2589 MHz & 16 Gbps	2321/2424/2581 MHz & 16 Gbps
Rohleistungen	12,7 TFlops & 360 GB/sec	16,2 TFlops & 448 GB/sec	9,7 TFlops & 256 GB/sec	12,4 TFlops & 384 GB/sec
Speicherausbau	12 GB GDDR6	8 GB GDDR6	8 GB GDDR6	12 GB GDDR6
Anbindung	PCIe 4.0 x16	PCIe 4.0 x16	PCIe 4.0 x8	PCIe 4.0 x16
Ref./Herst./OC	✗ / ✓ / ✓	✓ / ✓ / ✓	✗ / ✓ / ✓	✓ / ✓ / ✓
Layout	Dual/TripleSlot	Dual/TripleSlot	Dual/TripleSlot	Dual/TripleSlot
Kartenlänge	Herst: 17,0-32,3cm	Herst: 17,2-32,3cm FE: 24,5cm	Herst: 17,9-30,5cm	Herst: 22,8-32,3cm Ref: 27,0cm
Stromstecker	1x 8pol.	1x 12pol.	1x 8pol.	1x 6pol. & 1x 8pol.
off. Verbrauch	170W (GCP)	200W (GCP)	160W (TBP)	230W (TBP)
realer Verbr.	171W	201W	156W	220W
Ausgänge	HDMI 2.1, 3x DisplayPort 1.4	HDMI 2.1, 3x DisplayPort 1.4	HDMI 2.1, 3x DisplayPort 1.4	HDMI 2.1, 3x DisplayPort 1.4
FullHD Perf.Index	1130%	1460%	1260%	1540%
4K Perf.Index	165%	217%	159%	221%
Listenpreis	$329 (UVP: 329€)	$399 (UVP: 419€)	$379 (UVP: 380€)	$479 (UVP: 479€)
Straßenpreis	550-700 Euro	650-800 Euro	430-600 Euro	760-900 Euro
Release	25. Februar 2021	2. Dezember 2020	11. August 2021	18. März 2021

Die bei der Radeon RX 6600 XT gebotene Speichermenge wird durch das verbaute Speicherinterface bestimmt und liegt somit bei 8 GB (die anderen Wahlmöglichkeiten für AMD wären alleinig 4 oder 16 GB gewesen). Gegenüber der GeForce RTX 3060 mit deren 12 GB sind "nur" 8 GB Grafikkartenspeicher auf der Radeon RX 6600 XT ein gewisser optischer Nachteil – andererseits gilt die nVidia-Karte in dieser Disziplin auch ein wenig "overpowered", die nächstgrößeren nVidia-Karten tragen ihrerseits dann schließlich auch wieder nur 8 GB. Aufgrund der Speicher-Ansetzung sowie klaren FullHD-Ausrichtung verwundert dennoch der vergleichsweise hohe Listenpreis der Radeon RX 6600 XT von gleich 379 Dollar – dies sind immerhin 50 Dollar mehr als bei der GeForce RTX 3060 sowie gerade einmal 20 Dollar vor der GeForce RTX 3060 Ti. Sicherlich spielt hierbei mit hinein, dass AMD & nVidia zuletzt generell dazu übergegangen sind, ihre Listenpreise näher an das aktuelle Straßenpreis-Niveau zu setzen, dies mit früheren Listenpreisen somit schwerer vergleichbar ist.

Trotz gegenüber der Radeon RX 6700 XT nominell geringerer bis maximal gleicher Taktraten kommt die Radeon RX 6600 XT in der Praxis von Realtakt-Ermittlungen auf dem höchsten bislang ermittelten Stand heraus – immerhin 2562 MHz durchschnittlicher Realtakt bei einer auf Referenz-Werten simulierten Karte bei der ComputerBase (die leicht werksübertaktete MSI Gaming X lief sogar auf durchschnittlich 2616 MHz). Die übliche Tendenz, dass kleinere Grafikchips höher takten können, zeigt sich somit auch in diesem Fall – genauso wie die erhebliche Taktraten-Differenz zwischen AMDs RDNA2-Grafikkarten und nVidias Ampere-Grafikkarten gewahrt bleibt. Auf Realtakt gerechnet, nähert sich die Radeon RX 6600 XT der GeForce RTX 3060 bei der FP32-Rechenleistung damit sogar weiter (leicht) an: Nominell sind es 9,7 zu 12,7 TFLops (76%), auf Realtakt eher 10,5 zu 13,4 TFlops (78%).

	Basis	Durchschnitt		Maximum	gemessener Realtakt
AMD-Bezeichnung:	"Base Clock"	"Game Clock"	"Boost Clock"
Radeon RX 6900 XT	1825 MHz	2015 MHz	2250 MHz	2800 MHz	CB: 2265 MHz – TPU: 2233 MHz
Radeon RX 6800 XT	1825 MHz	2015 MHz	2250 MHz	2577 MHz	CB: 2216 MHz – TPU: 2257 MHz
Radeon RX 6800	1700 MHz	1815 MHz	2105 MHz	?	CB: 2177 MHz – TPU: 2205 MHz
Radeon RX 6700 XT	2321 MHz	2424 MHz	2581 MHz	2699 MHz	CB: 2531 MHz – TPU: 2491 MHz
Radeon RX 6600 XT	1968 MHz	2359 MHz	2589 MHz	?	CB: 2562 MHz
nVidia-Bezeichnung:	"Base Clock"	"Boost Clock"
GeForce RTX 3090	1400 MHz	1700 MHz		?	TPU: 1754 MHz
GeForce RTX 3080 Ti	1365 MHz	1665 MHz		?	CB: 1784 MHz – TPU: 1780 MHz
GeForce RTX 3080	1450 MHz	1710 MHz		1995 MHz	CB: 1827 MHz – TPU: 1931 MHz
GeForce RTX 3070 Ti	1575 MHz	1770 MHz		1950 MHz	CB: 1878 MHz – TPU: 1861 MHz
GeForce RTX 3070	1500 MHz	1725 MHz		2040 MHz	CB: 1920 MHz – TPU: 1882 MHz
GeForce RTX 3060 Ti	1410 MHz	1665 MHz		2010 MHz	CB: 1900 MHz – TPU: 1877 MHz
GeForce RTX 3060	1320 MHz	1777 MHz		?	grob bei 1850-1900 MHz
Realtakt-Angaben gemäß den Ausarbeitungen der ComputerBase (Ø 17 Spiele) und von TechPowerUp (Ø 22-23 Spiele)

Wie bei der GeForce RTX 3060 kommt auch die Radeon RX 6600 XT ohne Referenzdesign in den Markt – womit beide Grafikchip-Entwickler auch den Punkt umgehen können, jene Karten zum Listenpreis in ihren eigenen Onlineshops anbieten zu "müssen". Für eine exakte Performance-Ermittlung bedeutet dies eine zusätzliche Schwierigkeit, denn sinnvollerweise sollte ein Performance-Index die Performance auf Referenz-Taktung abbilden. Selbst wer rein auf werksübertaktete Modelle schwört, benötigt zum Vergleich letztlich doch immer eine möglichst allgemeingültige Basis. Dabei bewegen sich die meisten der anfänglich erhältlichen werksübertakteten Modelle zur Radeon RX 6600 XT laut den Ermittlungen von ComputerBase & TechPowerUp (jeweils im Vergleich mit einer simulierten Referenz-Karte) in einem engen Rahmen bezüglich deren Mehrperformance. Allerdings ist das Performance-Bild nicht ganz eindeutig, wie anhand der unterschiedlichen Messungen zur MSI Gaming X oder zur XFX Speedster Merc 308 zu sehen.

		FullHD #1	FullHD #2	FullHD #3	WQHD/1440p	4K/2160p
	Benchmark-Quelle:	CB: 5 Tests	CB: 17 Tests	TPU: 22 Tests	TPU: 22 Tests	TPU: 22 Tests
ASRock Phantom Gaming D @ TPU	2064/2428/2607 MHz, TGP 145W	-	-	+3%	+4%	+3%
Asus Strix OC @ TPU	2000/2428/2607 MHz, TGP 145W	-	-	+2%	+3%	+3%
MSI Gaming X @ CB & TPU	2064/2428/2607 MHz, TGP 135W	+3,0%	+1,8%	+2%	+3%	+3%
PowerColor Red Devil @ CB	2064/2428/2607 MHz, TGP 145W	+3,8%	-	-	-	-
Sapphire Pulse @ CB & TPU	2000/2382/2593 MHz, TGP 135W	+2,9%	-	+1%	+2%	+2%
XFX Speedster Merc 308 @ CB & TPU	2188/2428/2607 MHz, TGP 145W	+3,6%	-	+1%	+2%	+2%
Hinweise: Performance-Werte werden bei TechPowerUp nur gerundet auf volle Zahlen angegeben — default-Taktung: 1968/2359/2589 MHz, TGP 130W

Ein klein wenig muß man somit doch mit Annahmen arbeiten, wenn es um den Performance-Unterschied zur Referenztaktung geht. Augenscheinlich kommen die einfachsten Werksübertaktungen mit 135 Watt TGP grob auf eine FullHD-Mehrperformance von +2%, während hingegen jene Modelle mit 145 Watt TGP etwas mehr zulegen können und somit auf +3% FullHD-Mehrperformance zu schätzen sind. Die jeweils offiziell angesetzten Taktraten spielen hierfür augenscheinlich nur eine untergeordnete, in jedem Fall keine eindeutige Rolle – weil die Karten sich natürlich sowieso automatisch so hoch takten, wie es jeweils möglich ist. Für WQHD, 4K und RayTracing wurde zudem aufgrund der diesbezüglichen Tendenz der vorliegenden Benchmarks eine jeweils um ein halbes Prozent höher liegende Performance-Differenz angenommen. Dabei liegen glücklicherweise wenigstens vier Testberichte vor, welche eine simulierte Referenzkarte oder ein Herstellerdesign auf Referenztakt (samt passender TGP) verwendet haben.

	Hardware	FHD Perf.-Effekt	Testberichte
simulierte Referenz-Karte	1968/2359/2589 MHz, TGP 130W	Referenz	ComputerBase, PC Games Hardware & TechPowerUp
PowerColor Fighter	1968/2359/2589 MHz, TGP vmlt. 130W	wie Referenz	Golem
MSI Gaming X	2064/2428/2607 MHz, TGP 135W	geschätzt +2%	GameStar & Igor's Lab
Gigabyte Gaming OC Pro	?/2428/2607 MHz, TGP vmlt. 145W	geschätzt +3%	Le Comptoir du Hardware
ASRock Gaming Phantom D	2064/2428/2607 MHz, TGP 145W	geschätzt +3%	Tweakers
Für den Performance-Effekt unter WQHD, 4K und RayTracing wird mit einem Zuschlag von jeweils +0,5% gerechnet.