Launch-Analyse nVidia GeForce RTX 3070 Ti

Mittwoch, 16. Juni 2021
 / von Leonidas
 

Mittels der GeForce RTX 3070 Ti schickt nVidia die Ampere-Karte #7 in den Markt (oder wenigstens zu den Hardwaretestern), welche zwischen GeForce RTX 3070 und 3080 liegend primär die dort bisher einsam operierende Radeon RX 6800 angreifen soll. Hierzu setzt nVidia auf den GA104-Chip im Vollausbau, erstmals auch mit GDDR6X-Speicher arbeitend sowie mit kräftig hochgezogenem Power-Limit. Diese Launch-Analyse wird herausarbeiten, ob die GeForce RTX 3070 Ti ihre Performance-Zielsetzung im Querschnitt der vorliegenden Launch-Reviews erfüllen konnte. Gleichzeitig soll das mit dem vorhergehenden Launch der GeForce RTX 3080 Ti angefangene neue Performance-Bild aller RDNA2- und Ampere-Karten hiermit vervollständigt werden, worauf für alle diese Grafikkarten neue Index-Werte im 3DCenter Performance-Index aufzustellen sind.

In einem regulären Grafikkarten-Markt mit Straßenpreisen auf Höhe der Listenpreise (oder teilweise leicht darunter) hätte nVidia die im Oktober 2020 vorgestellte Radeon RX 6800 möglicherweise schon früher gekontert – da jene AMD-Karte perfekt zwischen GeForce RTX 3070 & 3080 steht und bislang keinen wirklichen nVidia-Gegenspieler hatte. Überlegungen zu einer entsprechenden Zwischen-Variante gab es bei nVidia laut der Gerüchteküche schon seit dem Jahresende 2020, wobei dabei teilweise sogar andere Grafikchips als Unterbau gehandelt wurden: Der große GA102-Chip (84 SM @ 384 Bit) ist dafür allerdings wohl zu teuer in der Fertigung – und der eigentlich passende GA103-Chip (60 SM @ 320 Bit) wurde bislang nicht realisiert, dessen Fertigung ist womöglich zugunsten der bisher vorhandenen Ampere-Chips ausgesetzt.

Somit blieb nVidia nicht viel anderes übrig, als für die GeForce RTX 3070 Ti die letzten Reserven aus dem GA104-Chip herauszuholen. Die reguläre GeForce RTX 3070 nutzt bereits 46 der physikalisch vorhandenen 48 Shader-Cluster des GA104-Chips, sowie das volle 256-Bit-Speicherinterface. Nicht genutzt wurde bislang beim GA104-Chip dessen Fähigkeit, mit GDDR6X-Speicher umzugehen – was nVidia somit zugunsten der GeForce RTX 3070 Ti aktivierte. Nichtsdestotrotz sind zwei Shader-Cluster mehr und GDDR6X-Speicher anstatt GDDR6 nicht gerade umwerfend viel mehr an Hardware. Auf ein wirkliches Ausrufezeichen in Form eines verdoppelten Speicherausbaus (auf 16 GB) hat nVidia hingegen verzichtet. Dies dient sicherlich dem Haus-internen Schutz von GeForce RTX 3080 & 3080 Ti (10 GB bzw. 12 GB), gewinnt jedoch keinerlei Beliebtheitspreise und stellt vor allem einen gewichtigen Nachteil gegenüber der gleich mit 16 GB ausgelieferten Radeon RX 6800 dar.

Radeon RX 6800 GeForce RTX 3070 GeForce RTX 3070 Ti GeForce RTX 3080
Chipbasis AMD Navi 21 XL nVidia GA104-300/302 nVidia GA104-400 nVidia GA102-200/202
Fertigung 26,8 Mrd. Transistoren auf 519mm² Chipfläche in der 7nm-Fertigung von TSMC 17,4 Mrd. Transistoren auf 392mm² Chipfläche in der 8nm-Fertigung von Samsung 28,3 Mrd. Transistoren auf 628mm² Chipfläche in der 8nm-Fertigung von Samsung
Architektur AMD RDNA2, DirectX 12 Feature-Level 12_2 nVidia Ampere, DirectX 12 Feature-Level 12_2
Features DirectX 12, OpenGL, Vulkan, Asynchonous Compute, RayTracing, VSR, SAM, FreeSync, TrueAudio Next, XConnect DirectX 12, OpenGL, Vulkan, Asynchonous Compute, RayTracing, DSR, DLSS, PhysX, rBAR, G-Sync, FreeSync
Technik 3 Raster-Engines, 60 Shader-Cluster, 3840 FP32-Einheiten, 240 TMUs, 60 RA-Einheiten, 96 ROPs, 4 MB Level2-Cache, 128 MB "Infinity Cache", 256 Bit GDDR6-Interface (Salvage) 6 Raster-Engines, 46 Shader-Cluster, 5888 FP32-Einheiten, 184 TMUs, 46 RT-Cores v2, 184 Tensor-Cores v3, 96 ROPs, 4 MB Level2-Cache, 256 Bit GDDR6-Interface (Salvage) 6 Raster-Engines, 48 Shader-Cluster, 6144 FP32-Einheiten, 192 TMUs, 48 RT-Cores v2, 192 Tensor-Cores v3, 96 ROPs, 4 MB Level2-Cache, 256 Bit GDDR6X-Interface (Vollausbau) 6 Raster-Engines, 68 Shader-Cluster, 8704 FP32-Einheiten, 272 TMUs, 68 RT-Cores v2, 272 Tensor-Cores v3, 96 ROPs, 5 MB Level2-Cache, 320 Bit GDDR6X-Interface (Salvage)
Taktraten 1700/1815/2105 MHz & 16 Gbps 1500/1725 MHz & 14 Gbps 1575/1770 MHz & 19 Gbps 1450/1710 MHz & 19 Gbps
Rohleistungen 13,9 TFlops & 512 GB/sec 20,3 TFlops & 448 GB/sec 21,7 TFlops & 608 GB/sec 29,8 TFlops & 760 GB/sec
Speicherausbau 16 GB GDDR6 8 GB GDDR6 8 GB GDDR6X 10 GB GDDR6X
Anbindung PCI Express 4.0 PCI Express 4.0 PCI Express 4.0 PCI Express 4.0
Ref/Herst./OC / / / / / / / /
Layout Dual- & TripleSlot Single-, Dual- & TripleSlot Dual- & TripleSlot Single-, Dual- & TripleSlot
Kartenlänge Herst: 28,6-32,4cm
Ref: 27,0cm
Herst: 21,6-33,7cm
FE: 24,5cm
Herst: 23,8-33,5cm
FE: 27,0cm
Herst: 21,6-33,7cm
FE: 28,5cm
Stromstecker Ref: 2x 8pol. FE: 1x 12pol. FE: 1x 12pol. FE: 1x 12pol.
off. Verbrauch 250W (TBP) 220W (GCP) 290W (GCP) 320W (GCP)
Real-Verbrauch Ref: 234W FE: 221W FE: 294W FE: 325W
Ausgänge Ref: HDMI 2.1, 2x DisplayPort 1.4, USB Type-C FE: HDMI 2.1, 3x DisplayPort 1.4 FE: HDMI 2.1, 3x DisplayPort 1.4 FE: HDMI 2.1, 3x DisplayPort 1.4
FHD Perf.Index 1780% 1640% 1720% 1940%
4K Perf.Index 278% 250% 271% 330%
Listenpreis $579 / 579€ $499 / 519€ $599 / 619€ $699 / 719€
Straßenpreis 1250-1400 Euro 1000-1150 Euro 1000-1400 Euro 1650-1900 Euro
Release 18. November 2020 29. Oktober 2020 10. Juni 2021 17. September 2020

Um so wichtiger wäre es nunmehr für die GeForce RTX 3070 Ti, dass jene bei der reinen Performance vor der Radeon RX 6800 herauskommt. Hierzu sollten normalerweise die höheren Taktraten der Karte samt der deutlich hochgeschraubten TDP dienen: Die reguläre GeForce RTX 3070 taktet mit 1500/1725 MHz und kommt auf 220 Watt TDP daher, die GeForce RTX 3070 Ti bietet hingegen gleich 1575/1770 MHz und 290 Watt TDP auf. In der Praxis sollte die (viel) höhere TDP dann sogar für noch höhere Real-Taktraten sorgen – doch Pustekuchen, denn die Ermittlungen zur durchschnittlichen Taktraten bei ComputerBase und TechPowerUp zeigen beiderseits auf einen leicht niedrigeren Real-Takt der GeForce RTX 3070 Ti gegenüber der regulären GeForce RTX 3070 hin. Dies ist zwar erstaunlich, erklärt aber letztlich manche der nachfolgend aufgeführten Performance-Ergebnisse.

Basis Durchschnitt Maximum gemessener Realtakt
AMD-Bezeichnung: "Base Clock" "Game Clock" "Boost Clock"
Radeon RX 6900 XT 1825 MHz 2015 MHz 2250 MHz 2800 MHz CB: 2265 MHz – TPU: 2233 MHz
Radeon RX 6800 XT 1825 MHz 2015 MHz 2250 MHz 2577 MHz CB: 2216 MHz – TPU: 2257 MHz
Radeon RX 6800 1700 MHz 1815 MHz 2105 MHz ? CB: 2177 MHz – TPU: 2205 MHz
Radeon RX 6700 XT 2321 MHz 2424 MHz 2581 MHz 2699 MHz CB: 2531 MHz – TPU: 2491 MHz
nVidia-Bezeichnung: "Base Clock" "Boost Clock"
GeForce RTX 3090 1400 MHz 1700 MHz ? TPU: 1754 MHz
GeForce RTX 3080 Ti 1365 MHz 1665 MHz ? CB: 1784 MHz – TPU: 1780 MHz
GeForce RTX 3080 1450 MHz 1710 MHz 1995 MHz CB: 1827 MHz – TPU: 1931 MHz
GeForce RTX 3070 Ti 1575 MHz 1770 MHz 1950 MHz CB: 1878 MHz – TPU: 1861 MHz
GeForce RTX 3070 1500 MHz 1725 MHz 2040 MHz CB: 1920 MHz – TPU: 1882 MHz
GeForce RTX 3060 Ti 1410 MHz 1665 MHz 2010 MHz CB: 1900 MHz – TPU: 1877 MHz
GeForce RTX 3060 1320 MHz 1777 MHz ? grob bei 1850-1900 MHz
Realtakt-Angaben gemäß den Ausarbeitungen der ComputerBase (Ø 17 Spiele) und von TechPowerUp (Ø 22-23 Spiele)

Wie schon beim Launch der GeForce RTX 3080 Ti geht es bei dieser Launch-Analyse auch um eine generelle Performance-Neueinordung aller neuen AMD- und nVidia-Grafikkarten. Insbesondere der Effekt von rBAR und SAM soll hierbei korrekt abgebildet werden, womit auch nur Testberichte mit vollständiger Nutzung dieses Features hierfür ausgewertet wurden (bedingt passende Systeme, neue Treiber und BIOS-Updates bei den älteren Ampere-Karten). Dies beschränkt die Anzahl an nutzbaren Quellen, allerdings konnten trotz des Herausfalls der Benchmark-Werte von PCWorld (rBAR/SAM-fähiges Testsystem, aber rBAR/SAM noch deaktiviert) nunmehr wenigstens 10 hierfür qualifizierte Testberichte angesetzt werden. Dabei fanden sich als kleiner Farbtupfer mit dem Testbericht von "The Verge" sogar Benchmarks auf einem Intel-System mit aktiviertem rBAR/SAM ein.

Prozessor rBAR SAM AMD-Treiber nVidia-Treiber
ComputerBase Ryzen 9 5950X (Stock) 21.4.1 (pre-RNDA2: 21.1.1) 466.61/54/11 (pre-Ampere: 461.40)
GameStar Ryzen 9 5950X 21.4.1 466.61
Golem Ryzen 9 5950X (Stock) 21.5.2 466.61/54
Igor's Lab Ryzen 9 5900X @ 4.7 GHz "current certified drivers"
Le Comptoir du Hardware Ryzen 9 5950X (SMT off) 21.5.2 466.61
PC Games Hardware Ryzen 9 5950X (PBO on, SMT off) 21.5.2 466.6x/5x
TechPowerUp Ryzen 7 5800X @ 4.8 GHz 21.4.1 (pre-RDNA: 21.2.3) 466.27/54/61 (pre-Ampere: 461.72)
The Verge Core i9-11900K Treiber-Versionen nicht genannt
Tweakers Ryzen 9 5950X @ 4.65 GHz 21.5.2 466.54/61
WCCF Tech Ryzen 9 5900X (Stock) 21.5.2 466.47/54
Hinweise: Die 6900XT-Werte von Golem entstammen deren Launchreview zur 3080Ti. Die 3080Ti/3090-Werte von The Verge entstammen deren Launchreview zur 3080Ti (beiderseits Werte-konsistent). Die 3070Ti-Werte von Tweakers sind mit einer werksübertakteten Gigabyte Gaming OC aufgenommen und wurden für die nachfolgenden Performance-Aufstellungen auf Referenz-Niveau normalisiert.

Bei der Anforderung von reinen rBAR/SAM-Testsystemen handelt es sich im übrigen keineswegs um einen Selbstzweck oder aber das sklavische Adaptieren der immer allerneuesten Features. Vielmehr geht es hierbei um Benchmark-Genauigkeit, welche im konkreten Fall aus zwei Gründen gewahrt bleiben muß: Erstens einmal liegen die rBAR/SAM-Performancegewinne mit AMD-Grafikkarten anders (beachtbar besser) als mit nVidia-Grafikkarten – ein Effekt, welcher bei Deaktivierung jenes Features komplett verlorengehen würde. Und zweitens treten GeForce RTX 3070 Ti & 3080 Ti nunmehr ab Werk gleich mit aktiviertem rBAR an – womit man diese Karten nicht mehr seriös mit GeForce RTX 3070 & 3080 ohne rBAR vergleichen kann. Schließlich geht es hierbei dediziert um geringe Differenzen zwischen diesen nVidia-Karte, da kann man schlechterdings die ältere Hardware benachteilen bei einem Feature, welches jener seit dem Frühjahr ganz offiziell genauso zusteht.