Launch-Analyse nVidia GeForce RTX 4070

Sonntag, 16. April 2023
 / von Leonidas
 

Mit der vierten Grafikkarte der RTX40-Serie bringt nVidia erstmals eine Midrange-Lösung innerhalb der Ada/RDNA3-Generation heraus. Die GeForce RTX 4070 basiert auf einer starken Abspeckung des AD104-Chips der GeForce RTX 4070 Ti, behält aber – durchaus in die Zeit passend – die Speichermenge von 12 GB VRAM bei. Laut nVidia soll mit der GeForce RTX 4070 non-Ti die Performance-Klasse der früheren GeForce RTX 3080 10GB geboten werden, zuzüglich dann natürlich Mehrspeicher und den neueren Features der Ada-Lovelace-Architektur. Ob diese Performance-Prognose passt und welches Performance/Preis-Verhältnis damit erreicht werden kann, soll mit dieser Launch-Analyse unter Verwendung der Benchmark-Werte von 17 Launch-Reviews herausgearbeitet werden.

Während die GeForce RTX 4070 Ti den AD104-Chip im (für nVidia inzwischen seltenen) Vollausbau verwendet, kommt bei der GeForce RTX 4070 non-Ti die kleinere Chip-Version "AD104-250" mit erheblichen Hardware-Abspeckungen zum Einsatz. Mehr oder weniger alles wird um 20-30% reduziert, augenscheinlich ging es nVidia hierbei darum, einen substantiellen Hardware- und damit Performance-Unterschied herzustellen. Allein das Speicherinterface, die Speicher-Menge und der Speicher-Takt bleiben identisch, daraus resultiert dann auch die identische Speicherbandbreite. Dies verwundert etwas angesichts der klaren Unterschiede in allen anderen Hardware-Disziplinen. Die GeForce RTX 4070 non-Ti hat somit wohl vergleichsweise zu viel Speicherbandbreite – oder die GeForce RTX 4070 Ti zu wenig. Im Gesamtbild dürfte dies allerdings kaum etwas ausmachen angesichts der vielen anderen Hardware-Differenzen.

GeForce RTX 4070 GeForce RTX 4070 Ti Differenz
Raster-Engines (GPC) 4 5 +25% bzw. –20%
Shader-Cluster (SM) 46 60 +30% bzw. –23%
FP32-Einheiten 5888 7680 +30% bzw. –23%
ROPs 64 80 +25% bzw. –20%
Level2-Cache 36 MB 48 MB +33% bzw. –25%
Speicherinterface 192 Bit GDDR6X 192 Bit GDDR6X ±0
FP32-Rohleistung 29,1 TFlops 40,1 TFlops +38% bzw. –27%
Speicherbandbreite 504 GB/sec 504 GB/sec ±0
TDP 200W 285W +43% bzw. –30%
Listenpreis $599 $799 +33% bzw. –25%

Besonders relavant ist hierbei die TDP bzw. das Power-Limit von nur 200 Watt, was mit –30% die größte Differenz zur GeForce RTX 4070 Ti ergibt. Gerade an dieser Stelle dürfte nVidia die Performance der GeForce RTX 4070 non-Ti zielgerichtet gesteuert haben. Zugleich legt man damit auch endlich einmal wieder eine potente Grafikkarte für eine TDP nicht höher als 200 Watt auf – etwas, worauf so einige Anwender seit längerem warten. Hier zeigt sich genauso der Vorteil der neuen 5nm-Fertigung von TSMC (der von nVidia benutzte Spezial-Prozeß "4N" gehört laut nVidia zu TSMCs 5nm-Klasse) gegenüber der 8nm-Fertigung der vorherigen Ampere-Generation bei Samsung. Bei selbiger war die Performance-Klasse der GeForce RTX 4070 non-Ti erst mit einer TDP von 320 Watt (bei der GeForce RTX 3080 10GB) möglich.

Als erste Ada/RDNA3-Grafikkarte des Midrange-Segments läßt sich die GeForce RTX 4070 non-Ti momentan nur gegenüber Ampere/RDNA2-Beschleunigern des (früheren) HighEnd-Segments vergleichen, AMD-Counterparts wird es wohl erst im Sommer geben. Die derzeitigen Gegner der GeForce RTX 4070 non-Ti (ab 639€) lauten somit auf Radeon RX 6800 XT (ab 569€) und GeForce RTX 3080 10GB (ab 750€), wobei aufgrund guter Händlerpreise der Vergleich zur Radeon RX 6950 XT (ab 649€) durchaus mit zu beachten wäre (die dazwischenliegende Radeon RX 6900 XT hat hingegen Auslauf-Status und spielt daher keine Rolle mehr). Trotz Namensverwandschaft ist die GeForce RTX 3070 non-Ti (ab 499€) kein Gegner der GeForce RTX 4070 non-Ti, da sich zwischen beiden Karten ein deutlicher Preisunterschied ergibt – sowohl beim Listen- als auch Straßenpreis. Leider ist die GeForce RTX 4070 non-Ti preislich am oberen Ende des Midrange-Segments angesetzt, trägt somit (wie schon die bisherigen Ada-Lovelace-Karten) erneut zur Hochtreibung der Grafikkarten-Preise bei.

Radeon RX 6800 XT GeForce RTX 3080 10GB GeForce RTX 4070 GeForce RTX 4070 Ti
Chipbasis AMD Navi 21 XT nVidia GA102-200 nVidia AD104-250 nVidia AD104-400
Fertigung 26,8 Mrd. Transistoren auf 519mm² Chipfäche in der 7nm-Fertigung von TSMC 28,3 Mrd. Transistoren auf 628mm² Chipfläche in der 8nm-Fertigung von Samsung 35,8 Mrd. Transistoren auf 295mm² Chipfäche in der 5nm-Fertigung von TSMC
Architektur AMD RDNA2, DirectX 12 Feature-Level 12_2 nVidia Ampere, DirectX 12 Feature-Level 12_2 nVidia Ada Lovelace, DirectX 12 Feature-Level 12_2
Features DirectX 12, OpenGL, Vulkan, RayTracing, VSR, RSR, FSR 1/2, FreeSync, TrueAudio Next, XConnect, SAM DirectX 12, OpenGL, Vulkan, RayTracing, DSR, DLDSR, DLSS 2, PhysX, G-Sync, FreeSync, rBAR DirectX 12, OpenGL, Vulkan, RayTracing, DSR, DLDSR, DLSS 2/3, PhysX, G-Sync, FreeSync, rBAR
Technik 4 Raster-Engines, 72 Shader-Cluster, 4608 FP32-Einheiten, 288 TMUs, 72 RA-Einheiten, 128 ROPs, 4 MB Level2-Cache, 128 MB "Infinity Cache", 256 Bit GDDR6-Interface (Salvage) 6 Raster-Engines, 68 Shader-Cluster, 8704 FP32-Einheiten, 272 TMUs, 68 RT-Cores v2, 272 Tensor-Cores v3, 96 ROPs, 5 MB Level2-Cache, 320 Bit GDDR6X-Interface (Salvage) 4 Raster-Engines, 46 Shader-Cluster, 5888 FP32-Einheiten, 184 TMUs, 46 RT-Cores v3, 184 Tensor-Cores v4, 64 ROPs, 36 MB Level2-Cache, 192 Bit GDDR6X-Interface (Salvage) 5 Raster-Engines, 60 Shader-Cluster, 7680 FP32-Einheiten, 240 TMUs, 60 RT-Cores v3, 240 Tensor-Cores v4, 80 ROPs, 48 MB Level2-Cache, 192 Bit GDDR6X-Interface (Vollausbau)
Taktraten 1825/2015/2250 MHz & 16 Gbps 1450/1710 MHz & 19 Gbps 1920/2475 MHz & 21 Gbps 2310/2610 MHz & 21 Gbps
Rohleistungen 18,6 TFlops & 512 GB/sec 29,8 TFlops & 760 GB/sec 29,1 TFlops & 504 GB/sec 40,1 TFlops & 504 GB/sec
Speicherausbau 16 GB GDDR6 10 GB GDDR6 12 GB GDDR6X 12 GB GDDR6X
Anbindung PCI Express 4.0 x16 PCI Express 4.0 x16 PCI Express 4.0 x16 PCI Express 4.0 x16
Ref/AIBs/OC / / / / / / / /
Layout Dual- & TripleSlot Single-, Dual- & TripleSlot Dual- & TripleSlot Dual-, Triple- & QuadSlot
Kartenlänge Ref.: 27,0cm
AIBs: 26,6-34,5cm
FE: 28,5cm
AIBs: 21,6-33,7cm
FE: 24,0cm
AIBs: 22,6-34,9cm
AIBs: 25,4-35,6cm
Stromstecker 2x 8pol. FE: 1x 12pol.
AIBs: 2x 8pol.
FE: 1x 16pol.
AIBs: 1x 8pol.
1x 16pol.
off. Verbrauch 300W (ASIC: 255W) 320W 200W 285W
Real-Verbrauch 298W 325W 193W 267W
Ausgänge HDMI 2.1, 2x DisplayPort 1.4a, USB Type-C HDMI 2.1, 3x DisplayPort 1.4a HDMI 2.1a, 3x DisplayPort 1.4a HDMI 2.1a, 3x DisplayPort 1.4a
FHD Perf.Index 2030% 1990% 2030% 2370%
4K Perf.Index 322% 332% 314% 392%
Listenpreis $649 / 649€ $699 / 759€ $599 / 659€ $799 / 899€
Straßenpreis 569-680 Euro 750-850 Euro 639-680 Euro 874-930 Euro
Release 18. November 2020 17. September 2020 13. April 2023 5. Januar 2023

Nominell taktet die GeForce RTX 4070 non-Ti beachtbar niedriger als die größere Ti-Schwester, in der Praxis verwischt der Unterschied so ziemlich. Die entsprechenden Messungen zum Realtakt sehen bei der ComputerBase keine 50 MHz Differenz, bei der PC Games Hardware sogar einen kleinen Vorteil der non-Ti-Ausführung. Nochmals geringer fallen die Unterschiede bei der absoluten Höhe des Realtakts der GeForce RTX 4070 non-Ti aus: Die drei Wertequellen liegen (maximal) gerade einmal um 11 MHz auseinander. So oder so gibt es hier keine Überraschungen: Wie üblich bestimmt eher die TDP bzw. das Taktraten-Maximum, wo der Realtakt einer Grafikkarten landet. Die nominellen Taktraten sind vergleichsweise "Schall & Rauch", dort angesetzte große Unterschiede sind in der Praxis zumeist nur in stark abgeschwächter Form wiederzufinden.

Basis Durchschnitt Max gemessener Realtakt
AMD-Bezeichnung: "Base Clock" "Game Clock" "Boost Clock" "Max Clock" CB TPU PCGH
Radeon RX 7900 XTX 1900 MHz 2300 MHz 2500 MHz ? 2556 MHz 2612 MHz 2.60 GHz
Radeon RX 7900 XT 1500 MHz 2000 MHz 2400 MHz ? 2566 MHz 2687 MHz 2.40 GHz
Radeon RX 6950 XT 1890 MHz 2100 MHz 2310 MHz ? 2392 MHz 2405 MHz 2.42 GHz
Radeon RX 6900 XT 1825 MHz 2015 MHz 2250 MHz ? 2265 MHz 2233 MHz 2.30 GHz
Radeon RX 6800 XT 1825 MHz 2015 MHz 2250 MHz ? 2216 MHz 2257 MHz 2.34 GHz
Radeon RX 6800 1700 MHz 1815 MHz 2105 MHz ? 2177 MHz 2205 MHz 2.20 GHz
Radeon RX 6750 XT 2150 MHz 2495 MHz 2600 MHz ? 2683 MHz - 2.63 GHz
Radeon RX 6700 XT 2321 MHz 2424 MHz 2581 MHz ? 2531 MHz 2491 MHz 2.54 GHz
Radeon RX 6650 XT 2055 MHz 2410 MHz 2635 MHz ? 2601 MHz - 2.68 GHz
Radeon RX 6600 XT 1968 MHz 2359 MHz 2589 MHz ? 2562 MHz - 2.58 GHz
Radeon RX 6600 1626 MHz 2044 MHz 2491 MHz ? 2509 MHz 2444 MHz 2.51 GHz
Radeon RX 6500 XT 2310 MHz 2610 MHz 2815 MHz ? 2753 MHz - 2.82 GHz
nVidia-Bezeichnung: "Base Clock" "Boost Clock" "Max Clock" CB TPU PCGH
GeForce RTX 4090 2235 MHz 2520 MHz ? 2744 MHz 2701 MHz 2.74 GHz
GeForce RTX 4080 2205 MHz 2505 MHz ? 2725 MHz 2737 MHz 2.78 GHz
GeForce RTX 4070 Ti 2310 MHz 2610 MHz ? 2802 MHz - 2737 MHz
GeForce RTX 4070 1920 MHz 2475 MHz ? 2758 MHz 2762 MHz 2769 MHz
GeForce RTX 3090 Ti 1560 MHz 1860 MHz ? 1936 MHz 1979 MHz 2.00 GHz
GeForce RTX 3090 1400 MHz 1700 MHz ? 1754 MHz - 1.88 GHz
GeForce RTX 3080 Ti 1365 MHz 1665 MHz ? 1784 MHz 1780 MHz 1.80 GHz
GeForce RTX 3080 12GB 1260 MHz 1710 MHz ? - - 1.80 GHz
GeForce RTX 3080 10GB 1450 MHz 1710 MHz ? 1827 MHz 1931 MHz 1.90 GHz
GeForce RTX 3070 Ti 1575 MHz 1770 MHz ? 1878 MHz 1861 MHz 1.88 GHz
GeForce RTX 3070 1500 MHz 1725 MHz ? 1920 MHz 1882 MHz 1.86 GHz
GeForce RTX 3060 Ti 1410 MHz 1665 MHz ? 1900 MHz 1877 MHz 1.83 GHz
GeForce RTX 3060 1320 MHz 1777 MHz ? - - 1.87 GHz
GeForce RTX 3050 1552 MHz 1777 MHz ? 1891 MHz 1906 MHz 1.89 GHz
Intel-Bezeichnung: - "Graphics Clock" "Max Clock" CB TPU PCGH
Arc A770 "LE" - 2100 MHz 2400 MHz - 2386 MHz 2.33 GHz
Arc A750 - 2050 MHz 2400 MHz - 2394 MHz 2.39 GHz
Realtakt-Angaben gemäß den Ausarbeitungen der ComputerBase (Ø 11-20 Spiele) und von TechPowerUp (Ø 22-25 Spiele) sowie den Praxis-Angaben der PC Games Hardware (neuere, MHz-genaue Werte: Ø 20 Spiele) von jeweils Referenz-Varianten (oder auf Referenz-Taktung/TDP laufend)