Mit der Radeon RX 6600 XT auf Basis des Navi-23-Chips schickt AMD seine fünfte RDNA2-basierte Grafikkarte sowie den dritten RDNA2-Grafikchip in den Markt – und rundet somit (vorerst) sein Angebot nach unten hin ab. Augenscheinlicher Zielpunkt ist das Performance- und Preissegment der GeForce RTX 3060 auf GA106-Basis als bislang kleinster Ampere-basierter Grafikkarte. Für diesen Zweck optimierte AMD den Navi-23-Chip gezielt auf eine starke FullHD-Performance – unter jedoch Inkaufnahme von ungewöhnlich starken Performance-Abschläge bei höheren Auflösungen. Wie stark die Radeon RX 6600 XT unter ihrer Ziel-Auflösung "FullHD" im Schnitt der Launchreviews herausgekommen ist, wie heftig jene Abschläge unter WQHD & 4K ausfallen und wo sich AMDs neue Karte damit insgesamt einordnen muß, soll mit dieser Launch-Analyse herausgearbeitet werden.
Der für die Radeon RX 6600 XT angesetzte Navi-23-Chip ist ein vergleichsweise ungewöhnliches Konstrukt, gerade im Vergleich zum nächsthöheren Navi-22-Chip für die Radeon RX 6700 XT: Wo AMD ansonsten immer auf eher große Differenzen zwischen den Grafikchip setzt, gibt es hier nur den Unterschied von 32 zu 40 Shader-Clustern – gerade einmal +25% mehr beim größeren Navi-22-Chip (bzw. –20% weniger beim kleineren Navi-23-Chip). FP32-Einheiten, TMUs & RA-Einheiten verlieren zwischen beiden Grafikchips im gleichen (geringen) Maßstab – und bei Nebenpunkten wie Raster-Engines (2) sowie ROPs (64) herrscht sogar totaler Gleichstand. Die erste größere Differenz findet sich beim Speicherinterface, wo Navi 23 nur mit 128 Bit an den Start geht. Gegenüber den 192 Bit von Navi 22 ist dies eine Abspeckung von immerhin –33%, äquivalent dazu wurde der Level2-Cache von 3 auf 2 MB verringert.
Die zweite größere Differenz besteht beim Infinity Cache, wo Navi 23 mit 32 MB nur ein Drittel (–67%) der 96 MB von Navi 22 bekommen hat. Jene geringe Größe macht den Infinity Cache gemäß dessen bekannter Hitraten eigentlich nur noch unter FullHD wirkmächtig – dort agiert das eigentlich nur 128 Bit breite Speicherinterface von Navi 23 dann sinngemäß wie ein 284 Bit breites Interface (und somit sogar etwas stärker als bei Navi 10). Die Effekte unter WQHD und 4K sind dann allerdings stark zurückgehend, die sinngemäße Interface-Breite beträgt unter WQHD nur noch 206 Bit, unter 4K gar nur noch 175 Bit. An dieser Stelle steckt die genannte Optimierung von Navi 23 auf die FullHD-Auflösung, denn natürlich sind diese (sinngemäßen) Interface-Breiten für WQHD wenigstens grenzwertig und für 4K dann zu wenig. Vor allem aber ergibt sich über die (deutlich) unterschiedliche effektive Bandbreite per Auflösung eine klare Performance-Abstufung bei Navi 23 – zugunsten von kleineren Auflösungen, wo der Infinity Cache besser wirken kann.
Navi 23 | Navi 22 | Navi 21 | |
---|---|---|---|
Codename | "Dimgrey Cavefish" | "Navy Flounder" | "Sienna Cichlid" ("Big Navi") |
Chipbasis | 11,1 Mrd. Transistoren auf 236mm² Chipfläche in der 7nm-Fertigung von TSMC | 17,2 Mrd. Transistoren auf 335mm² Chipfläche in der 7nm-Fertigung von TSMC | 26,8 Mrd. Transistoren auf 519mm² Chipfläche in der 7nm-Fertigung von TSMC |
Technik | 2 Raster-Engines, 32 Shader-Cluster, 2048 FP32-Einheiten, 128 TMUs, 32 RA-Einheiten, 64 ROPs, 2 MB Level2-Cache, 32 MB Infinity Cache, 128 Bit GDDR6-Interface | 2 Raster-Engines, 40 Shader-Cluster, 2560 FP32-Einheiten, 160 TMUs, 40 RA-Einheiten, 64 ROPs, 3 MB Level2-Cache, 96 MB "Infinity Cache", 192 Bit GDDR6-Interface | 4 Raster-Engines, 80 Shader-Cluster, 5120 FP32-Einheiten, 320 TMUs, 80 RA-Einheiten, 128 ROPs, 4 MB Level2-Cache, 128 MB "Infinity Cache", 256 Bit GDDR6-Interface |
PCI Express | 8 Lanes PCI Express 4.0 | 16 Lanes PCI Express 4.0 | 16 Lanes PCI Express 4.0 |
verbaut bei | Radeon RX 6600 XT (Vollausbau) | Radeon RX 6700 XT (Vollausbau) | Radeon RX 6800 & 6800 XT (beide Salvage), Radeon RX 6900 XT (Vollausbau) |
RDNA1-Vorgänger | Navi 12: ? Mrd. Transistoren auf ~209mm² in der 7nm-Fertigung von TSMC, 4 Raster-Engines, 40 Shader-Cluster, 2560 FP32-Einheiten, 160 TMUs, 64 ROPs, ? MB Level2-Cache, 2048 Bit HBM2-Interface | Navi 10: 10,3 Mrd. Transistoren auf 251mm² in der 7nm-Fertigung von TSMC, 4 Raster-Engines, 40 Shader-Cluster, 2560 FP32-Einheiten, 160 TMUs, 64 ROPs, 4 MB Level2-Cache, 256 Bit GDDR6-Interface | - |
Block-Diagramm | |||
Hinweis: Chipflächen entsprechen den Angaben von Locuza @ Twitter, nicht AMDs offiziellen Angaben |
Ein fast nebensächlicher Unterschied betrifft dann noch das PCI-Express-Interface, welches Chip-seitig bei Navi 23 tatsächlich nur mit 8 Lanes von PCI Express 4.0 ausgeführt wurde. Performance-technisch ergibt dies nur einen marginalen Effekt, wenn selbst die sinngemäße Limitierung auf nur noch 4 Lanes von PCI Express 4.0 (erzeugt über 8 Lanes von PCI Express 3.0) in einem kürzlichen Test kaum zu beachtbaren Performance-Differenzen führt. Diese Abspeckung mag zudem wohl auch dem Punkt geschuldet sein, dass Navi 23 in vielen Hardware-Punkten recht nahe an Navi 22 herankommt – und AMD somit auch hier und da mal den Rotstift ansetzen musste, um angesichts der vergleichsweise geringen Hardware-Unterschiede überhaupt auf eine beachtbar geringere Chipfläche zu kommen. Letzteres ist einwandfrei gelungen, denn Navi 23 ist trotz nur –20% weniger Shader-Clustern um ~100mm² (–30%) kleiner als Navi 22 ausgefallen.
Wie schon bei der Radeon RX 6700 XT auf Navi-22-Basis, kommt mit der Radeon RX 6600 XT auf Navi-23-Basis ein Vollausbau des zugrundeliegenden Grafikchips daher. Im Gegensatz zu den meisten anderen Karten-Modellen der RDNA2- und Ampere-Generationen geht es dabei deutlich unterhalb von 200 Watt Stromverbrauch: AMD gibt die Radeon RX 6600 XT mit 160 Watt TBP an, bei einem referenzmäßigen ASIC-Powerlimit von 130 Watt. Die einzige hierzu ähnliche Karte neueren Baudatums ist die GeForce RTX 3060, welche auf 170 Watt GCP und Powerlimit läuft. Momentan stellen beide genannten Karten die alleinigen (modernen) Optionen dar, wenn man seinem PC-System keine Grafikkarte mit 200 Watt Stromverbrauch (oder mehr) zumuten will.
GeForce RTX 3060 | GeForce RTX 3060 Ti | Radeon RX 6600 XT | Radeon RX 6700 XT | |
---|---|---|---|---|
Chipbasis | nVidia GA106-300 | nVidia GA104-200 | AMD Navi 23 | AMD Navi 22 XT |
Fertigung | 12,0 Mrd. Transistoren auf 276mm² in der 8nm-Fertigung von Samsung | 17,4 Mrd. Transistoren auf 392mm² in der 8nm-Fertigung von Samsung | 11,1 Mrd. Transistoren auf 236mm² in der 7nm-Fertigung von TSMC | 17,2 Mrd. Transistoren auf 335mm² in der 7nm-Fertigung von TSMC |
Architektur | nVidia Ampere, DirectX 12 Feature-Level 12_2 | AMD RDNA2, DirectX 12 Feature-Level 12_2 | ||
Features | DirectX 12, OpenGL, Vulkan, Asynchonous Compute, RayTracing, DSR, DLSS, PhysX, G-Sync, FreeSync, rBAR | DirectX 12, OpenGL, Vulkan, Asynchronous Compute, RayTracing, VSR, FSR, FreeSync, TrueAudio Next, XConnect, SAM | ||
Technik | 3 Raster-Engines, 28 Shader-Cluster, 3584 FP32-Einheiten, 112 TMUs, 28 RT-Cores v2, 112 Tensor-Cores v3, 48 ROPs, 2,25 MB Level2-Cache, 192 Bit GDDR6-Interface (Salvage) | 5 Raster-Engines, 38 Shader-Cluster, 4864 FP32-Einheiten, 152 TMUs, 38 RT-Cores v2, 152 Tensor-Cores v3, 80 ROPs, 4 MB Level2-Cache, 256 Bit GDDR6-Interface (Salvage) | 2 Raster-Engines, 32 Shader-Cluster, 2048 FP32-Einheiten, 128 TMUs, 32 RA-Einheiten, 64 ROPs, 2 MB Level2-Cache, 32 MB "Infinity Cache", 128 Bit GDDR6-Interface (Vollausbau) | 2 Raster-Engines, 40 Shader-Cluster, 2560 FP32-Einheiten, 160 TMUs, 40 RA-Einheiten, 64 ROPs, 3 MB Level2-Cache, 96 MB "Infinity Cache", 192 Bit GDDR6-Interface (Vollausbau) |
Taktraten | 1320/1777 MHz & 15 Gbps | 1410/1665 MHz & 14 Gbps | 1968/2359/2589 MHz & 16 Gbps | 2321/2424/2581 MHz & 16 Gbps |
Rohleistungen | 12,7 TFlops & 360 GB/sec | 16,2 TFlops & 448 GB/sec | 9,7 TFlops & 256 GB/sec | 12,4 TFlops & 384 GB/sec |
Speicherausbau | 12 GB GDDR6 | 8 GB GDDR6 | 8 GB GDDR6 | 12 GB GDDR6 |
Anbindung | PCIe 4.0 x16 | PCIe 4.0 x16 | PCIe 4.0 x8 | PCIe 4.0 x16 |
Ref./Herst./OC | ✗ / ✓ / ✓ | ✓ / ✓ / ✓ | ✗ / ✓ / ✓ | ✓ / ✓ / ✓ |
Layout | Dual/TripleSlot | Dual/TripleSlot | Dual/TripleSlot | Dual/TripleSlot |
Kartenlänge | Herst: 17,0-32,3cm | Herst: 17,2-32,3cm FE: 24,5cm |
Herst: 17,9-30,5cm | Herst: 22,8-32,3cm Ref: 27,0cm |
Stromstecker | 1x 8pol. | 1x 12pol. | 1x 8pol. | 1x 6pol. & 1x 8pol. |
off. Verbrauch | 170W (GCP) | 200W (GCP) | 160W (TBP) | 230W (TBP) |
realer Verbr. | 171W | 201W | 156W | 220W |
Ausgänge | HDMI 2.1, 3x DisplayPort 1.4 | HDMI 2.1, 3x DisplayPort 1.4 | HDMI 2.1, 3x DisplayPort 1.4 | HDMI 2.1, 3x DisplayPort 1.4 |
FullHD Perf.Index | 1130% | 1460% | 1260% | 1540% |
4K Perf.Index | 165% | 217% | 159% | 221% |
Listenpreis | $329 (UVP: 329€) | $399 (UVP: 419€) | $379 (UVP: 380€) | $479 (UVP: 479€) |
Straßenpreis | 550-700 Euro | 650-800 Euro | 430-600 Euro | 760-900 Euro |
Release | 25. Februar 2021 | 2. Dezember 2020 | 11. August 2021 | 18. März 2021 |
Die bei der Radeon RX 6600 XT gebotene Speichermenge wird durch das verbaute Speicherinterface bestimmt und liegt somit bei 8 GB (die anderen Wahlmöglichkeiten für AMD wären alleinig 4 oder 16 GB gewesen). Gegenüber der GeForce RTX 3060 mit deren 12 GB sind "nur" 8 GB Grafikkartenspeicher auf der Radeon RX 6600 XT ein gewisser optischer Nachteil – andererseits gilt die nVidia-Karte in dieser Disziplin auch ein wenig "overpowered", die nächstgrößeren nVidia-Karten tragen ihrerseits dann schließlich auch wieder nur 8 GB. Aufgrund der Speicher-Ansetzung sowie klaren FullHD-Ausrichtung verwundert dennoch der vergleichsweise hohe Listenpreis der Radeon RX 6600 XT von gleich 379 Dollar – dies sind immerhin 50 Dollar mehr als bei der GeForce RTX 3060 sowie gerade einmal 20 Dollar vor der GeForce RTX 3060 Ti. Sicherlich spielt hierbei mit hinein, dass AMD & nVidia zuletzt generell dazu übergegangen sind, ihre Listenpreise näher an das aktuelle Straßenpreis-Niveau zu setzen, dies mit früheren Listenpreisen somit schwerer vergleichbar ist.
Trotz gegenüber der Radeon RX 6700 XT nominell geringerer bis maximal gleicher Taktraten kommt die Radeon RX 6600 XT in der Praxis von Realtakt-Ermittlungen auf dem höchsten bislang ermittelten Stand heraus – immerhin 2562 MHz durchschnittlicher Realtakt bei einer auf Referenz-Werten simulierten Karte bei der ComputerBase (die leicht werksübertaktete MSI Gaming X lief sogar auf durchschnittlich 2616 MHz). Die übliche Tendenz, dass kleinere Grafikchips höher takten können, zeigt sich somit auch in diesem Fall – genauso wie die erhebliche Taktraten-Differenz zwischen AMDs RDNA2-Grafikkarten und nVidias Ampere-Grafikkarten gewahrt bleibt. Auf Realtakt gerechnet, nähert sich die Radeon RX 6600 XT der GeForce RTX 3060 bei der FP32-Rechenleistung damit sogar weiter (leicht) an: Nominell sind es 9,7 zu 12,7 TFLops (76%), auf Realtakt eher 10,5 zu 13,4 TFlops (78%).
Basis | Durchschnitt | Maximum | gemessener Realtakt | ||
---|---|---|---|---|---|
AMD-Bezeichnung: | "Base Clock" | "Game Clock" | "Boost Clock" | ||
Radeon RX 6900 XT | 1825 MHz | 2015 MHz | 2250 MHz | 2800 MHz | CB: 2265 MHz – TPU: 2233 MHz |
Radeon RX 6800 XT | 1825 MHz | 2015 MHz | 2250 MHz | 2577 MHz | CB: 2216 MHz – TPU: 2257 MHz |
Radeon RX 6800 | 1700 MHz | 1815 MHz | 2105 MHz | ? | CB: 2177 MHz – TPU: 2205 MHz |
Radeon RX 6700 XT | 2321 MHz | 2424 MHz | 2581 MHz | 2699 MHz | CB: 2531 MHz – TPU: 2491 MHz |
Radeon RX 6600 XT | 1968 MHz | 2359 MHz | 2589 MHz | ? | CB: 2562 MHz |
nVidia-Bezeichnung: | "Base Clock" | "Boost Clock" | |||
GeForce RTX 3090 | 1400 MHz | 1700 MHz | ? | TPU: 1754 MHz | |
GeForce RTX 3080 Ti | 1365 MHz | 1665 MHz | ? | CB: 1784 MHz – TPU: 1780 MHz | |
GeForce RTX 3080 | 1450 MHz | 1710 MHz | 1995 MHz | CB: 1827 MHz – TPU: 1931 MHz | |
GeForce RTX 3070 Ti | 1575 MHz | 1770 MHz | 1950 MHz | CB: 1878 MHz – TPU: 1861 MHz | |
GeForce RTX 3070 | 1500 MHz | 1725 MHz | 2040 MHz | CB: 1920 MHz – TPU: 1882 MHz | |
GeForce RTX 3060 Ti | 1410 MHz | 1665 MHz | 2010 MHz | CB: 1900 MHz – TPU: 1877 MHz | |
GeForce RTX 3060 | 1320 MHz | 1777 MHz | ? | grob bei 1850-1900 MHz | |
Realtakt-Angaben gemäß den Ausarbeitungen der ComputerBase (Ø 17 Spiele) und von TechPowerUp (Ø 22-23 Spiele) |
Wie bei der GeForce RTX 3060 kommt auch die Radeon RX 6600 XT ohne Referenzdesign in den Markt – womit beide Grafikchip-Entwickler auch den Punkt umgehen können, jene Karten zum Listenpreis in ihren eigenen Onlineshops anbieten zu "müssen". Für eine exakte Performance-Ermittlung bedeutet dies eine zusätzliche Schwierigkeit, denn sinnvollerweise sollte ein Performance-Index die Performance auf Referenz-Taktung abbilden. Selbst wer rein auf werksübertaktete Modelle schwört, benötigt zum Vergleich letztlich doch immer eine möglichst allgemeingültige Basis. Dabei bewegen sich die meisten der anfänglich erhältlichen werksübertakteten Modelle zur Radeon RX 6600 XT laut den Ermittlungen von ComputerBase & TechPowerUp (jeweils im Vergleich mit einer simulierten Referenz-Karte) in einem engen Rahmen bezüglich deren Mehrperformance. Allerdings ist das Performance-Bild nicht ganz eindeutig, wie anhand der unterschiedlichen Messungen zur MSI Gaming X oder zur XFX Speedster Merc 308 zu sehen.
FullHD #1 | FullHD #2 | FullHD #3 | WQHD/1440p | 4K/2160p | ||
---|---|---|---|---|---|---|
Benchmark-Quelle: | CB: 5 Tests | CB: 17 Tests | TPU: 22 Tests | TPU: 22 Tests | TPU: 22 Tests | |
ASRock Phantom Gaming D @ TPU | 2064/2428/2607 MHz, TGP 145W | - | - | +3% | +4% | +3% |
Asus Strix OC @ TPU | 2000/2428/2607 MHz, TGP 145W | - | - | +2% | +3% | +3% |
MSI Gaming X @ CB & TPU | 2064/2428/2607 MHz, TGP 135W | +3,0% | +1,8% | +2% | +3% | +3% |
PowerColor Red Devil @ CB | 2064/2428/2607 MHz, TGP 145W | +3,8% | - | - | - | - |
Sapphire Pulse @ CB & TPU | 2000/2382/2593 MHz, TGP 135W | +2,9% | - | +1% | +2% | +2% |
XFX Speedster Merc 308 @ CB & TPU | 2188/2428/2607 MHz, TGP 145W | +3,6% | - | +1% | +2% | +2% |
Hinweise: Performance-Werte werden bei TechPowerUp nur gerundet auf volle Zahlen angegeben — default-Taktung: 1968/2359/2589 MHz, TGP 130W |
Ein klein wenig muß man somit doch mit Annahmen arbeiten, wenn es um den Performance-Unterschied zur Referenztaktung geht. Augenscheinlich kommen die einfachsten Werksübertaktungen mit 135 Watt TGP grob auf eine FullHD-Mehrperformance von +2%, während hingegen jene Modelle mit 145 Watt TGP etwas mehr zulegen können und somit auf +3% FullHD-Mehrperformance zu schätzen sind. Die jeweils offiziell angesetzten Taktraten spielen hierfür augenscheinlich nur eine untergeordnete, in jedem Fall keine eindeutige Rolle – weil die Karten sich natürlich sowieso automatisch so hoch takten, wie es jeweils möglich ist. Für WQHD, 4K und RayTracing wurde zudem aufgrund der diesbezüglichen Tendenz der vorliegenden Benchmarks eine jeweils um ein halbes Prozent höher liegende Performance-Differenz angenommen. Dabei liegen glücklicherweise wenigstens vier Testberichte vor, welche eine simulierte Referenzkarte oder ein Herstellerdesign auf Referenztakt (samt passender TGP) verwendet haben.
Hardware | FHD Perf.-Effekt | Testberichte | ||
---|---|---|---|---|
simulierte Referenz-Karte | 1968/2359/2589 MHz, TGP 130W | Referenz | ComputerBase, PC Games Hardware & TechPowerUp | |
PowerColor Fighter | 1968/2359/2589 MHz, TGP vmlt. 130W | wie Referenz | Golem | |
MSI Gaming X | 2064/2428/2607 MHz, TGP 135W | geschätzt +2% | GameStar & Igor's Lab | |
Gigabyte Gaming OC Pro | ?/2428/2607 MHz, TGP vmlt. 145W | geschätzt +3% | Le Comptoir du Hardware | |
ASRock Gaming Phantom D | 2064/2428/2607 MHz, TGP 145W | geschätzt +3% | Tweakers | |
Für den Performance-Effekt unter WQHD, 4K und RayTracing wird mit einem Zuschlag von jeweils +0,5% gerechnet. |