Launch-Analyse nVidia GeForce RTX 3080 Ti

Sonntag, 6. Juni 2021
 / von Leonidas
 

Mit der GeForce RTX 3080 Ti bringt nVidia nun endlich die lange erwartete Zwischenlösung für den übergroßen Preisabstand zwischen GeForce RTX 3080 & 3090 an den Start. Als reine Programmergänzung hat die Karte ein schweres Brot in Zeiten der durchweg überkandidelten Grafikkarten-Straßenpreise – denn das primäre Argument der Karte in Form eines besseren Preis/Leistungs-Verhältnisses gegenüber der GeForce RTX 3090 würde sich nur zu "normalen" Grafikkartenpreisen (nahe Listenpreis) wirklich zeigen können, geht derzeit in der allgemeinen Preisübertreibung jedoch glatt unter. Daher soll diese Launch-Analyse auch dazu genutzt werden, ein neues Performance-Bild im Enthusiasten-Segment aufzubauen – auf Basis aktualisierter Testparcours mit neuen Spielen, neuen Treibern und unter durchgehender Aktivierung von rBAR & SAM. Somit wird es nachfolgend für die komplette Riege an RDNA2- und Ampere-Karte neue Index-Werte unter dem 4K-Index geben – zuzüglich natürlich der Ersteinordnung der GeForce RTX 3080 Ti.

Zu jener GeForce RTX 3080 Ti hat nVidia über den Jahreswechsel hinweg mit allen möglichen Hardware-Spezifikationen gespielt – am Ende wurde es eine Karte, welche von den freigeschalteten Hardware-Einheiten her der GeForce RTX 3090 sehr nahe kommt, als primäres Unterscheidungsmerkmal dann nur mit der Hälfte von deren Grafikkartenspeicher antritt. Dies sind zwar immerhin noch 12 GB, allerdings für eine Karte dieses Preis- und Performance-Bereichs dann zumindest psychologisch eher knapp bemessen. Die sicherlich einmal im Gespräch befindlichen Lösungen mit gleich 20 GB Speicher wären aus dieser Sicht wohl besser gewesen, aufgrund der allgemeinen Grafikkarten-Dürre mußte sich nVidia an diesem Punkt aber einfach nicht verausgaben, sondern bringt nur knapp mehr als das nötigste. Dies läßt sich auch am gewählten Kartendesign der "Founders Edition" zur GeForce RTX 3080 Ti ermessen – welches dem FE-Design zur kleineren GeForce RTX 3080 entspricht, trotz wesentlich mehr freigeschalteter Hardware-Einheiten und höherer TDP.

Denn mit 80 Shader-Clustern an einem 384-Bit-Interface und 350W TDP ist die GeForce RTX 3080 Ti wesentlich näher am Stand der GeForce RTX 3090 (nur 2 Shader-Cluster mehr, ansonsten keine Unterschiede) als an der deutlich kleineren GeForce RTX 3080 (nur 68 Shader-Cluster, nur 320-Bit-Interface, nur 320W TDP). So gesehen wäre eher die Übernahme des FE-Designs zur größeren GeForce RTX 3090 zweckmäßig gewesen – was sich nVidia gespart hat und speziell die Founders Edition zur GeForce RTX 3080 Ti doch hier und da leicht behindert. Denn im Gegensatz zu anderen FE-Karten erreicht die GeForce RTX 3080 Ti "Founders Edition" recht hohe Temperaturen und könnte damit möglicherweise auch einmal in die Temperatur-Limitierung rutschen. Andererseits stellt dies dann eine Gelegenheit für die Herstellerdesigns dar, dies besser zu machen und sich in diesem Fall beachtbarer vom Referenz-Design abzusetzen.

Radeon RX 6900 XT GeForce RTX 3080 GeForce RTX 3080 Ti GeForce RTX 3090
Chipbasis AMD Navi 21 XTX nVidia GA102-200/202 nVidia GA102-225 nVidia GA102-300
Fertigung 26,8 Mrd. Transistoren auf 519mm² in der 7nm-Fertigung von TSMC 28,3 Mrd. Transistoren auf 628mm² in der 8nm-Fertigung von Samsung
Architektur AMD RDNA2, DirectX 12 Feature-Level 12_2 nVidia Ampere, DirectX 12 Feature-Level 12_2
Features DirectX 12, OpenGL, Vulkan, Asynchonous Compute, RayTracing, VSR, SAM, FreeSync, TrueAudio Next, XConnect DirectX 12, OpenGL, Vulkan, Asynchonous Compute, RayTracing, DSR, DLSS, PhysX, rBAR, G-Sync, FreeSync
Technik 4 Raster-Engines, 80 Shader-Cluster, 5120 FP32-Einheiten, 320 TMUs, 80 RA-Einheiten, 128 ROPs, 4 MB Level2-Cache, 128 MB "Infinity Cache", 256 Bit GDDR6-Interface (Vollausbau) 6 Raster-Engines, 68 Shader-Cluster, 8704 FP32-Einheiten, 272 TMUs, 68 RT-Cores v2, 272 Tensor-Cores v3, 96 ROPs, 5 MB Level2-Cache, 320 Bit GDDR6X-Interface (Salvage) 7 Raster-Engines, 80 Shader-Cluster, 10240 FP32-Einheiten, 320 TMUs, 80 RT-Cores v2, 320 Tensor-Cores v3, 112 ROPs, 6 MB Level2-Cache, 384 Bit GDDR6X-Interface (Salvage) 7 Raster-Engines, 82 Shader-Cluster, 10496 FP32-Einheiten, 328 TMUs, 82 RT-Cores v2, 328 Tensor-Cores v3, 112 ROPs, 6 MB Level2-Cache, 384 Bit GDDR6X-Interface (Salvage)
Taktraten 1825/2015/2250 MHz & 16 Gbps 1450/1710 MHz & 19 Gbps 1365/1665 MHz & 19 Gbps 1400/1700 MHz & 19,5 Gbps
Rohleistungen 20,6 TFlops & 512 GB/sec 29,8 TFlops & 760 GB/sec 34,1 TFlops & 912 GB/sec 35,7 TFlops & 936 GB/sec
Speicherausbau 16 GB GDDR6 10 GB GDDR6X 12 GB GDDR6X 24 GB GDDR6X
Anbindung PCI Express 4.0 PCI Express 4.0 PCI Express 4.0 PCI Express 4.0
Ref/Herst./OC / / / / / / / /
Layout Dual- & TripleSlot Single-, Dual- & TripleSlot Dual- & TripleSlot Single-, Dual- & TripleSlot
Kartenlänge Herst: 26,6-34,0cm
Ref: 26,7cm
Herst: 21,6-33,7cm
FE: 28,5cm
Herst: 22,5-33,6cm
FE: 28,5cm
Herst: 21,6-33,9cm
FE: 31,3cm
Stromstecker Ref: 2x 8pol. FE: 1x 12pol. FE: 1x 12pol. FE: 1x 12pol.
off. Verbrauch 300W (TBP) 320W (GCP) 350W (GCP) 350W (GCP)
Real-Verbrauch Ref: 306W FE: 325W FE: 350W FE: 359W
Ausgänge Ref: HDMI 2.1, 2x DisplayPort 1.4, USB Type-C FE: HDMI 2.1, 3x DisplayPort 1.4 FE: HDMI 2.1, 3x DisplayPort 1.4 FE: HDMI 2.1, 3x DisplayPort 1.4
4K Perf.Index 344% 328% 364% 374%
Listenpreis $999 / 999€ $699 / 719€ $1199 / 1199€ $1499 / 1549€
Straßenpreis ~1700-2200 Euro ~1800-2200 Euro ~2500-3200 Euro ~2800-3200 Euro
Release 8. Dezember 2020 17. September 2020 3. Juni 2021 24. September 2020

Wie üblich bei den neueren AMD- und nVidia-Karten sind die nominellen Taktraten-Angaben "Schall & Rauch", sollen teilweise sogar Produkt-Differenzen suggerieren, wo keine da sind. Im Fall der GeForce RTX 3080 Ti gibt es nominell etwas niedrigere Taktraten als bei der GeForce RTX 3090, die Praxis sagt dann klar etwas anderes aus: Die Real-Taktraten der GeForce RTX 3080 Ti liegen ziemlich sicher mindestens auf dem Niveau der GeForce RTX 3090, eventuell sogar leicht darüber. Der geringe Hardware-Nachteil bei der Anzahl der Shader-Cluster (–2,4%) läßt sich damit weitgehend egalisieren, von der real erreichten Rechenleistung dürften beide Karten ziemlich gleich herauskommen. Dies ist angesichts der identischen TDP (von 350 Watt) aber auch kein Wunder, da selbige TDP in Zeiten sich an Power- und Temperatur-Limits abregelnder dynamischer Taktraten viel wichtiger ist als die nominell angesetzten Taktraten.

Basis Durchschnitt Maximum gemessener Realtakt
AMD-Bezeichnung: "Base Clock" "Game Clock" "Boost Clock"
Radeon RX 6900 XT 1825 MHz 2015 MHz 2250 MHz 2800 MHz CB: 2265 MHz – TPU: 2233 MHz
Radeon RX 6800 XT 1825 MHz 2015 MHz 2250 MHz 2577 MHz CB: 2216 MHz – TPU: 2257 MHz
Radeon RX 6800 1700 MHz 1815 MHz 2105 MHz ? CB: 2177 MHz – TPU: 2205 MHz
Radeon RX 6700 XT 2321 MHz 2424 MHz 2581 MHz 2699 MHz CB: 2531 MHz – TPU: 2491 MHz
nVidia-Bezeichnung: "Base Clock" "Boost Clock"
GeForce RTX 3090 1400 MHz 1700 MHz ? TPU: 1754 MHz
GeForce RTX 3080 Ti 1365 MHz 1665 MHz ? CB: 1784 MHz – TPU: 1780 MHz
GeForce RTX 3080 1450 MHz 1710 MHz 1995 MHz CB: 1827 MHz – TPU: 1931 MHz
GeForce RTX 3070 1500 MHz 1725 MHz 2040 MHz CB: 1892 MHz – TPU: 1882 MHz
GeForce RTX 3060 Ti 1410 MHz 1665 MHz 2010 MHz CB: 1900 MHz – TPU: 1877 MHz
GeForce RTX 3060 1320 MHz 1777 MHz ? grob bei 1850-1900 MHz
Realtakt-Angaben gemäß den Ausarbeitungen der ComputerBase (Ø 17 Spiele) und von TechPowerUp (Ø 22-23 Spiele)

Neben einer Performance-Einordnung soll diese Launch-Analyse wie gesagt auch dem Aufbau eines aktualisierten Performance-Bildes für alle RDNA2- und Ampere-Karten dienen. Hierbei soll zum einen der Performance-Abstand zur schnellsten Turing-Grafikkarte (in Form der GeForce RTX 2080 Ti) neu ermittelt werden, zum anderen unter neuen Spielen, neuen Treibern und einschließlich des Effekts von rBAR & SAM die Performance der neuen Grafikkarten untereinander neu austariert werden. Dienlich für diesen Zweck sind Testberichte mit aktualisiertem Testparcour und vor allem der vollständigen Einbindung von rBAR & SAM. Speziell mit dem Aufkommen der GeForce RTX 3080 Ti kann es diesbezüglich keine Halbheiten mehr geben, denn diese neue nVidia-Karte tritt ab Werk mit aktiviertem rBAR-Feature an. An dieser Stelle verbietet es sich logischerweise, irgendwelche früheren Benchmarks ohne rBAR weiterzuverwenden – denn natürlich kann man die GeForce RTX 3080 Ti nicht ausreichend zielsicher zwischen GeForce RTX 3080 & 3090 einordnen, wenn eine Karte mit rBAR antritt, die anderen hingegen ohne.

Insofern wurde für diese Launch-Analyse besonderer Wert auf exakte Angaben zu diesem Themenfeld gelegt. Leider sind damit einige bekannte und ansonsten gern genutzte Quellen herausgefallen. Bei einigen war die Umstellung des Testparcour einfach noch nicht so weit, andere hingegen schwiegen sich zu diesem Thema komplett aus – was heuer nicht mehr gut genug ist, ohne exakte Angaben zu den Testbedingungen verbietet sich die Weiterverwendung solcherart Benchmark-Werte. Am Ende blieben aus über 40 Launchreviews zur GeForce RTX 3080 Ti gerade einmal 8 übrig (Update: 7), welche die Anforderungen erfüllten und zudem wenigstens eine gewisse Anzahl an Testspielen sowie getesteten Grafikkarten an den Start brachten. Es bleibt zu hoffen, dass die anderen Hardwaretester diesbezüglich schnellstmöglich nachlegen – jener Übergang muß schließlich sowieso erfolgen bzw. sollten gerade dieserart Spitzen-Grafikkarten generell nur auf modernen Plattformen mit allen aktivierten Features getestet werden.

CPU rBAR SAM AMD-Treiber nVidia-Treiber
ComputerBase Ryzen 9 5950X 21.4.1 (pre-RDNA2: 21.1.1) 466.54 & 466.11 (pre-Ampere: 461.40)
Golem Ryzen 9 5950X 21.5.2 466.54
Igor's Lab Ryzen 9 5900X unbekannt unbekannt
Le Comptoir du Hardware Ryzen 9 5950X 21.5.2 466.54
PC Games Hardware Ryzen 9 5950X 21.5.2 466.54 & 466.55
PCWorld Ryzen 9 5900X unbekannt unbekannt
TechPowerUp Ryzen 7 5800X 21.4.1 (pre-RDNA2: 21.2.3) 466.54 & 466.27 (pre-Ampere: 461.72)
WCCF Tech Ryzen 9 5900X 21.5.2 466.47
Nachtrag vom 9. Juni 2021: Die Aussagen von PCWorld zum Stand von rBAR/SAM wurden unsererseits leider mißverstanden. Nach Klarstellung muß der Status von rBAR/SAM bei PCWorld auf "nicht aktiv" geändert werden, obwohl die passende Hardware hierfür benutzt wurde. An den nachfolgenden Resultaten und Auswertungen ist leider nichts mehr zu ändern, der Effekt dieses Fehlers auf die insgesamten Zahlen sollte jedoch eher marginal sein.