Mit dem über drei Wochen verteilten Launch der neuen Grafikkarten-Modelle des GeForce RTX 40 "SUPER" Refreshs versucht nVidia, neuen Schwung ins Grafikkarten-Geschäft der oberen Preisregionen zu bringen. Gleichzeitig ergibt sich hiermit die Gelegenheit, den einen oder anderen Fehler des originalen GeForce RTX 40 Portfolios auszubessern, ohne zum verpönten Mittel der direkten Preissenkung schreiten zu müssen. Mittels der drei neuen Grafikkarten ergaben sich neue Benchmarks in Hülle & Fülle, durch die Zerstückelung des Launches allerdings auch etwas von zunehmender Langeweile der Grafikkarten-Käufer und Hardware-Enthusiasten begleitet. Deswegen gibt es diese Launch-Analyse für alle Modelle des "SUPER"-Refreshs zusammen, um dieses Thema nur einmal und dafür in vollständiger Form abhandeln zu können. Wo sich die neuen Karten einordnen lassen, ob die alten Modelle noch eine Chance haben und wie dies alles im Vergleich zu AMDs Angeboten aussieht, soll dieser Artikel ermitteln.
Mittels des GeForce RTX 40 "SUPER"-Refresh bringt nVidia jeweils einen "SUPER"-Nachfolger zu GeForce RTX 4070, 4070 Ti und 4080. Ohne neue Grafikchips für seine Refresh-Serie (regelrechte Refresh-Chips hat es bei nVidia kaum jemals gegeben) konnte nVidia logischerweise nur mit dem arbeiten, was man bereits an Ada-Lovelace-basierten Grafikchips im Programm hat. Teilweise konnte nVidia noch vorhandene Reserven anzapfen, teilweise ging es sogar einen Grafikchip nach oben. Angesichts der preislichen Ansetzung war dabei die Zielsetzung klar: Drei neue "SUPER"-Lösungen kommen in den Markt, wobei eine der vorherigen Grafikkarten preisgesenkt weiterhin im Programm bleibt und die anderen beiden hingegen den Auslauf-Status erreichen.
Den größten Hardware-Sprung gibt es dabei bei der kleinsten "SUPER"-Lösungen, der "GeForce RTX 4070 Super". Jene benutzt zwar wie die GeForce RTX 4070 den AD104-Chip, allerdings in einer wesentlich stärkeren Ausführung nahe des Vollausbaus – welchen es wie bekannt mit der GeForce RTX 4070 Ti gibt. Eben wegen der technischen Nähe zur GeForce RTX 4070 Ti (56 zu 60 Shader-Cluster) erhoffte man sich von der GeForce RTX 4070 Super oftmals das Performance-Level der GeForce RTX 4070 Ti, was allerdings wegen der stark abweichenden TDP (220W zu 285W) nicht wirklich realistisch ist. Gegenüber der GeForce RTX 4070 dürfte es jedoch einen guten Performance-Sprung geben, wobei jene ältere Karte weiterhin im Markt bleibt und mittels eines um 50 Dollar abgesenkten Listenpreises besser gegenüber der Radeon RX 7800 XT konkurrieren soll.
GeForce RTX 4070 | GeForce RTX 4070 Super | |
---|---|---|
AD104-250, 46 Shader-Cluster @ 192 Bit Speicherinterface, 36 MB L2, 12 GB GDDR6X, 1920/2475 MHz & 21 Gbps, 200W TDP, $549 Listenpreis | ➔ | AD104-350, 56 Shader-Cluster @ 192 Bit Speicherinterface, 48 MB L2, 12 GB GDDR6X, 1980/2475 MHz & 21 Gbps, 220W TDP, $599 Listenpreis |
+22% Shader-Cluster, +33% Level2-Cache, +3% Base-Takt, +10% TDP, +9% Listenpreis |
Nominell erhält die "GeForce RTX 4070 Ti Super" einen ähnlich ansprechenden Hardware-Sprung: Immerhin gibt es hier den Wechsel vom AD104- zum AD103-Chip, ein um ein Drittel größeres Speicherinterface samt ebenso vergrößerer Speichermenge. Allerdings sind die auf die Rechenleistung abzielenden Änderungen mit nur +10% mehr Shader-Cluster zu zudem unveränderter TDP keine großartigen Voraussetzungen für ein ähnliches Leistungsplus wie bei der GeForce RTX 4070 Super. Die GeForce RTX 4070 Ti Super geht zum selben Listenpreis wie die GeForce RTX 4070 Ti in den Markt, welche ihrerseits nunmehr im Auslauf-Status ist. In der Praxis hat sich inzwischen eine bedeutsam niedrigere Preislage bei der GeForce RTX 4070 Ti ergeben, zu welcher jene durchaus noch eine gewisse Berechtigung zwischen GeForce RTX 4070 Super und 4070 Ti Super hat.
GeForce RTX 4070 Ti | GeForce RTX 4070 Ti Super | |
---|---|---|
AD104-400, 60 Shader-Cluster @ 192 Bit Speicherinterface, 48 MB L2, 12 GB GDDR6X, 2310/2610 MHz & 21 Gbps, 285W TDP, $799 Listenpreis | ➔ | AD103-275, 66 Shader-Cluster @ 256 Bit Speicherinterface, 48 MB L2, 16 GB GDDR6X, 2340/2610 MHz & 21 Gbps, 285W TDP, $799 Listenpreis |
+10% Shader-Cluster, +33% Speicherinterface, +33% VRAM, +1% Base-Takt |
Den klar kleinsten Sprung legt dann die "GeForce RTX 4080 Super" hin, bei welcher nVidia einfach nur noch die letzten Reserven des AD103-Chips bemüht. Da es wiederum keine höhere TDP gibt, ist das Performance-Potential dieser größten "SUPER"-Lösung arg begrenzt. Der springende Punkt der Karte ist jedoch das damit einhergehende faktische Eingeständnis nVidias, dass die vorherige GeForce RTX 4080 mit 1199 Dollar Listenpreis gravierend falsch ausgepreist war – ein Fehler, welchen die GeForce RTX 4080 Super mit ihrem um 200 Dollar niedrigeren Preispunkt nunmehr ausbügelt. Die vorherige GeForce RTX 4080 erreicht damit natürlich auch den Auslaufstatus und wird derzeit auch nirgendwo günstiger als ihre "SUPER"-Nachfolgerin angeboten. Aufgrund offenbar nicht gerade geringer Lagerbestände im Einzelhandel wäre eigentlich noch mit Abverkaufsaktionen zugunsten der GeForce RTX 4080 zu rechnen, auch wenn hiervon derzeit noch nichts zu sehen ist.
GeForce RTX 4080 | GeForce RTX 4080 Super | |
---|---|---|
AD103-300, 76 Shader-Cluster @ 256 Bit Speicherinterface, 64 MB L2, 16 GB GDDR6X, 2205/2505 MHz & 22,4 Gbps, 320W TDP, $1199 Listenpreis | ➔ | AD103-400, 80 Shader-Cluster @ 256 Bit Speicherinterface, 64 MB L2, 16 GB GDDR6X, 2295/2550 MHz & 23 Gbps, 320W TDP, $999 Listenpreis |
+5% Shader-Cluster, +4% Base-Takt, +2% Boost-Takt, +3% Speicher-Takt, –17% Listenpreis |
Keinen "SUPER"-Nachfolger erhält die GeForce RTX 4090, wobei dies aufgrund der klaren Performance-Führerschaft dieser Karte auch nicht wirklich notwendig ist. Zudem legt die GeForce RTX 4080 Super viel zu wenig oben drauf, um irgendwie den Performance-Abstand zur GeForce RTX 4090 zu gefährden. Zu diesem Enthusiasten-Modell schwirren zwar gern Thesen über eine "GeForce RTX 4090 Super" oder auch "GeForce RTX 4090 Ti" durch die Gegend, derzeit dürfte für nVidia aber eher schon der Punkt zählen, die Ada-Lovelace-Generation nicht "zu gut" werden zu lassen. Alles was ein weiteres Spitzen-Modell oben drauf legen würde, reduziert schließlich den Generations-Gewinns gegenüber der 2025 zu erwartenden "Blackwell"-Generation (GeForce RTX 50 Serie). Inwiefern der "SUPER"-Refresh später hingegen noch zur GeForce RTX 4060 /Ti Serie getragen wird, ist denkbar, bleibt jedoch abzuwarten.
GeForce RTX 4070 | GeForce RTX 4070 Super | GeForce RTX 4070 Ti Super | GeForce RTX 4080 Super | |
---|---|---|---|---|
Chipbasis | nVidia AD104-250 | nVidia AD104-350 | nVidia AD103-275 | nVidia AD103-400 |
Fertigung | 35,8 Mrd. Transistoren auf 295mm² Chipfäche in der 5nm-Fertigung von TSMC | 45,9 Mrd. Transistoren auf 379mm² Chipfäche in der 5nm-Fertigung von TSMC | ||
Architektur | nVidia Ada Lovelace, DirectX 12 Feature-Level 12_2 | |||
Features | DirectX 12, OpenGL, Vulkan, RayTracing, DSR, DLDSR, DLSS 2/3, PhysX, G-Sync, FreeSync, rBAR | |||
Technik | 4 Raster-Engines, 46 Shader-Cluster, 5888 FP32-Einheiten, 184 TMUs, 46 RT-Cores v3, 184 Tensor-Cores v4, 64 ROPs, 36 MB Level2-Cache, 192 Bit GDDR6X-Interface (Salvage) | 5 Raster-Engines, 56 Shader-Cluster, 7168 FP32-Einheiten, 224 TMUs, 56 RT-Cores v3, 224 Tensor-Cores v4, 80 ROPs, 48 MB Level2-Cache, 192 Bit GDDR6X-Interface (Salvage) | 6 Raster-Engines, 66 Shader-Cluster, 8448 FP32-Einheiten, 264 TMUs, 66 RT-Cores v3, 264 Tensor-Cores v4, 96 ROPs, 48 MB Level2-Cache, 256 Bit GDDR6X-Interface (Salvage) | 7 Raster-Engines, 80 Shader-Cluster, 10'240 FP32-Einheiten, 320 TMUs, 80 RT-Cores v3, 320 Tensor-Cores v4, 112 ROPs, 64 MB Level2-Cache, 256 Bit GDDR6X-Interface (Vollausbau) |
Taktraten | 1920/2475 MHz & 21 Gbps | 1980/2475 MHz & 21 Gbps | 2340/2610 MHz & 21 Gbps | 2295/2550 MHz & 23 Gbps |
Rohleistungen | 29,1 TFlops & 504 GB/sec | 35,5 TFlops & 504 GB/sec | 44,1 TFlops & 672 GB/sec | 52,2 TFlops & 736 GB/sec |
Speicherausbau | 12 GB GDDR6X | 12 GB GDDR6X | 16 GB GDDR6X | 16 GB GDDR6X |
Anbindung | PCI Express 4.0 x16 | PCI Express 4.0 x16 | PCI Express 4.0 x16 | PCI Express 4.0 x16 |
Ref/AIBs/OC | ✓ / ✓ / ✓ | ✓ / ✓ / ✓ | ✗ / ✓ / ✓ | ✓ / ✓ / ✓ |
Layout | Dual- & TripleSlot | Dual- & TripleSlot | Dual- & TripleSlot | Dual-, Triple- & QuadSlot |
Kartenlänge | FE: 24,0cm AIBs: 22,6-34,9cm |
FE: 24,0cm AIBs: 22,7-34,2cm |
AIBs: 24,0-35,6cm | FE: 31,0cm AIBs: 25,4-35,8cm |
Stromstecker | FE: 1x 16pol. AIBs: 1x 8pol. |
1x 16pol. | 1x 16pol. | 1x 16pol. |
off. Verbrauch | 200W | 220W | 285W | 320W |
Ausgänge | HDMI 2.1a, 3x DisplayPort 1.4a | HDMI 2.1a, 3x DisplayPort 1.4a | HDMI 2.1a, 3x DisplayPort 1.4a | HDMI 2.1a, 3x DisplayPort 1.4a |
Listenpreis | $549 / 609€ (zum Launch: $599/659€) |
$599 / 659€ | $799 / 889€ | $999 / 1109€ |
Release | 13. April 2023 | 17. Januar 2024 | 24. Januar 2024 | 31. Januar 2024 |
Bei den erreichten realen Taktraten bewegt sich zwischen dem "SUPER"-Refresh und den jeweiligen Vorgänger-Modellen mehr oder weniger gar nichts, auch das allgemeine Taktraten-Niveau der drei neuen Karten liegt vergleichsweise ähnlich bei um die 2.7 GHz. Es gibt allenfalls eine kleine Tendenz zu minimal niedrigeren Taktraten gegenüber den jeweiligen Vorgänger-Modellen – was denkbarerweise daran liegt, dass die "SUPER"-Modelle durchgehend mehr freigeschaltete Shader-Cluster zu zweimal derselben TDP und nur einmal einer maßvoll höheren TDP bieten. Dass da die realen Taktraten geringfügig niedriger ausfallen, wäre nicht verwunderlich: Immerhin kann nVidia auf Basis derselben Grafikchips nicht zaubern, und von beachtbaren Verbesserungen der Fertigungsqualität ist auch nichts bekannt.
Basis | Durchschnitt | Max | gemessener Realtakt | |||||
---|---|---|---|---|---|---|---|---|
AMD-Bezeichnung: | "Base Clock" | "Game Clock" | "Boost Clock" | "Max Clock" | CB | TPU | PCGH | Tom's |
Radeon RX 7900 XTX | 1900 MHz | 2300 MHz | 2500 MHz | ? | 2556 MHz | 2612 MHz | 2.60 GHz | 2507 MHz |
Radeon RX 7900 XT | 1500 MHz | 2000 MHz | 2400 MHz | ? | 2566 MHz | 2687 MHz | 2.40 GHz | 2515 MHz |
Radeon RX 7800 XT | 1295 MHz | 2124 MHz | 2430 MHz | ? | 2386 MHz | 2425 MHz | 2.35 GHz | 2334 MHz |
Radeon RX 7700 XT | 1700 MHz | 2171 MHz | 2544 MHz | ? | 2507 MHz | 2560 MHz | 2.56 GHz | 2535 MHz |
Radeon RX 7600 XT | 1980 MHz | 2470 MHz | 2755 MHz | ? | 2716 MHz | 2790 MHz | 2.79 GHz | 2707 MHz |
Radeon RX 7600 | 1720 MHz | 2250 MHz | 2625 MHz | ? | 2645 MHz | 2613 MHz | 2.61 GHz | 2631 MHz |
nVidia-Bezeichnung: | "Base Clock" | "Boost Clock" | "Max Clock" | CB | TPU | PCGH | Tom's | |
GeForce RTX 4090 | 2235 MHz | 2520 MHz | ? | 2744 MHz | 2701 MHz | 2.74 GHz | 2752 MHz | |
GeForce RTX 4080 Super | 2295 MHz | 2550 MHz | ? | 2729 MHz | 2715 MHz | 2.73 GHz | 2787 MHz | |
GeForce RTX 4080 | 2205 MHz | 2505 MHz | ? | 2725 MHz | 2737 MHz | 2.78 GHz | 2783 MHz | |
GeForce RTX 4070 Ti Super | 2340 MHz | 2610 MHz | ? | 2785 MHz | 2708 MHz | 2.67 GHz | 2745 MHz | |
GeForce RTX 4070 Ti | 2310 MHz | 2610 MHz | ? | 2802 MHz | - | 2737 MHz | 2839 MHz | |
GeForce RTX 4070 Super | 1980 MHz | 2475 MHz | ? | 2735 MHz | 2715 MHz | 2.72 GHz | 2718 MHz | |
GeForce RTX 4070 | 1920 MHz | 2475 MHz | ? | 2758 MHz | 2762 MHz | 2769 MHz | 2722 MHz | |
GeForce RTX 4060 Ti | 2310 MHz | 2535 MHz | ? | 2714 MHz | 2767 MHz | 2.74 GHz | 2783 MHz | |
GeForce RTX 4060 | 1830 MHz | 2460 MHz | ? | 2738 MHz | 2640 MHz | 2.69 GHz | 2726 MHz | |
Intel-Bezeichnung: | - | "Graphics Clock" | "Max Clock" | CB | TPU | PCGH | Tom's | |
Arc A770 16GB | - | 2100 MHz | 2400 MHz | - | 2386 MHz | 2.33 GHz | 2311 MHz | |
Arc A750 | - | 2050 MHz | 2400 MHz | - | 2394 MHz | 2.39 GHz | 2379 MHz | |
Arc A580 (AIBs) | - | 2000 MHz | 2400 MHz | 2396 MHz | 2354 MHz | 2.33 GHz | 2325 MHz | |
Realtakt-Angaben gemäß den Ausarbeitungen der ComputerBase (Ø 11-23 Spiele), TechPowerUp (Ø 22-25 Spiele), PC Games Hardware (üblicherweise Praxis-Angaben, zuzüglich teilweise MHz-genaue Werte aus Ø 20 Spiele) und Tom's Hardware (Ø 15 Spiele, WQHD) von jeweils Referenz-Varianten (oder auf Referenz-Taktung/TDP laufend); letzte Tabelle mit allen Radeon RX 6000 & GeForce RTX 30 Modellen siehe hier |
Grafikkarten-Reviews zu den drei neuen "SUPER"-Modellen gab es in den letzten Januar-Wochen bis zum Abwinken, wobei die Hardwaretester viel dieser Arbeit doppelt & dreifach machen mussten, um bei jedem Launch zeitgenau dabei zu sein. Die Hauptaufgabe – die Information des Lesers – blieb dabei etwas auf der Strecke, denn den Launch-Reviews zur GeForce RTX 4070 Super fehlten ein wenig die Benchmarks der GeForce RTX 4070 Ti Super (zum Abschluß nach oben hin), genauso wie den Launch-Reviews zur GeForce RTX 4070 Ti Super aus selbem Grund die Benchmarks zur GeForce RTX 4080 Super fehlten. Zudem ergab sich beim Launch der GeForce RTX 4070 Ti Super eine Performance-Unstimmigkeit mit den MSI-Modellen, das rettende BIOS-Update wurde erst nach dem Launchtag geliefert. Erst mit dem Launch der letzten und größten "SUPER"-Karte ergibt sich ein vollständiges Bild – welches nachfolgend auch die Grundlage aller weiteren Betrachtungen bilden wird.
Denkbarerweise wegen der enormen Arbeitsbelastung durch diesen dreifachen Launch haben uns allerdings nur die wenigstens Hardwaretester den Gefallen getan und die jüngsten Treiberversionen von AMD & nVidia für alle Vergleichs-Modelle angesetzt. Mit dieser (kleinen) Ungenauigkeit muß man derzeit leben, um überhaupt auf eine gewisse Anzahl an wertbaren Benchmark-Daten zu kommen. Denn leider mussten aus der Unmenge an verfügbaren Benchmarks auch viele Testberichte disqualifiziert werden, weil uralte Treiber für die Vergleichs-Modelle benutzt wurden oder aber generell in Frage stand, welche Karten hierbei genau vermessen wurden (Referenz-Varianten oder aber Werksübertaktungen). Die Frage der (weitgehenden) Treiber-Gleichheit ist speziell kritisch bei Performance-Vergleichen von derart eng aneinanderliegenden Modellen, da können alte Treiber das ganze Performance-Bild verzerren. Demzufolge konnten auch nur die Werte von 14 Launch-Reviews für diesen Artikel herangezogen werden, obwohl die Verwendung von weit mehr Testberichten und Werten geplant war.
Tests | CPU | Treiber (neben SUPER-SKUs) | Werks-OC | |
---|---|---|---|---|
ComputerBase | 22 / 8 | Ryzen 9 7950X3D | 23.11.1 & 546.17 | — |
Cowcotland | 11 / 5 | Core i7-12700KF | 23.10.2 & 545.92 | 4070Ti, 4070TiS |
Digital Foundry | 8 / 6 | Core i9-13900K | ? | ? |
Hardware & Co | 20 / 18 | Core i9-14900K (HT off) | 23.12.1 & 546.52 | 7800XT |
Hardware Unboxed | 12 / 10 | Ryzen 7 7800X3D | 24.1.1 & 551.23 | ? |
KitGuru | 12 / 8 | Core i9-13900KS | 23.12.1 & 546.33 | — |
Linus Tech Tips | 8 / – | Ryzen 7 7800X3D | ? | ? |
Paul's Hardware | 9 / 4 | Ryzen 7 7800X3D | 23.12.1 & 551.15/22 | 4070Ti |
PC Games Hardware | 20 / 10 | Core i9-13900KS @ 5.7 GHz (E-Kerne off) | aktuelle Treiber | — |
PurePC | 10 / 7 | Core i9-14900K | ? | 4070Ti, 4070TiS |
Quasarzone | 15 / – | Ryzen 9 7950X3D | 23.12.1 & 546.52 | ? |
TechPowerUp | 25 / 10 | Core i9-14900K | 23.11.1 & 546.17 | ? |
Tom's Hardware | 9 / 6 | Core i9-13900K | ? | ? |
Tweakers | 10 / 3 | Core i9-13900K @ 5.5 GHz (E-Kerne off) | 23.12.1 & 546.52 | 4070Ti |
"Tests" = Anzahl der jeweils benutzten Benchmark-Spiele unter gewöhnlichem Raster-Rendering bzw. unter RayTracing |
Bezüglich werksübertakteter Modelle gab es bei diesem Launch bzw. den Benchmarks hierzu nur wenig zu beachten. Logischerweise basieren alle Benchmarks zu GeForce RTX 4070 Ti und 4070 Ti Super Karten auf Hersteller-Modellen, da nVidia zu diesen beiden Karten keine Founders Edition aufgelegt hat. Allerdings waren auch viele Hersteller-Modelle ohne Werksübertaktung im Einsatz, einige Hardwaretester simulieren auch schlicht die Referenz-Performance durch eine entsprechende Umtaktung. Dort, wo ein werksübertaktetes Modell identifiziert werden konnte, wurde in den nachfolgenden Performance-Tabellen der originale Performance-Wert (inkl. Werksübertaktung) notiert, dies jedoch für die Performance-Auswertung ("gemittelte Performance") jeweils auf den Referenz-Takt normalisiert. Die hierbei benutzten Performance-Offsets waren mit 1-2 Prozentpunkte erneut klein, da sich keine herausragenden Werksübertaktungen im Test befanden. Bei der exakten Dokumentation der jeweils benutzten Grafikkarten haben einige Hardwaretests allerdings noch "Optimierungs-Potential".