Launch-Analyse GeForce RTX 5070 vs Radeon RX 9070 (XT)

Sonntag, 9. März 2025
 

Mittels GeForce RTX 5070 und Radeon RX 9070 (XT) haben AMD und nVidia in dieser Woche drei neue Grafikkarten für das Midrange-Segment herausgebracht. Wie bekannt, haben diese Marktstarts mitnichten zu einer echten Verfügbarkeit geführt, leider einhergehend mit auch für diese neuen Grafikkarten überzogenen Straßenpreisen. Gleichzeitig hat AMD damit aber natürlich auch den Konkurrenzkampf von "nVidia Blackwell gegen AMD RDNA4" eröffnet. Eben wegen des Midrange-Ansatzes geht es dabei nicht auf zu neuen Performance-Ufern, dafür will AMD bei den Disziplinen RayTracing und Upscaler endlich einmal zu nVidia aufschließen. Mittels der nachfolgenden Launch-Analyse soll unter Auswertung von 14 Launch-Reviews mit ca. 8490 Einzel-Benchmarks herausgefunden werden, wie weit AMD damit gekommen ist und wo sich GeForce RTX 5070, Radeon RX 9070 und Radeon RX 9070 XT im großen Performance-Bild einordnen müssen.

Die am 5. März in den Markt entlassene GeForce RTX 5070 baut auf dem GB205-Chip auf, dem dritten Grafikchip des Consumer-Portfolios von nVidias "Blackwell". Jener tritt gegenüber dem GB203-Chip von GeForce RTX 5070 Ti & 5080 dann schon ordentlich abgespeckt an: 5 anstatt 7 Raster-Engines, maximal 50 anstatt 84 Shader-Cluster, maximal 192 anstatt 256 Bit Speicherinterface auf natürlich deutlich kleinerer Chipfläche (263mm² anstatt 378mm²) und Transistoren-Anzahl (31,1 anstatt 45,6 Mrd.). Bemerkenswert ist, dass der GB205-Chip damit nominell weniger Hardware führt als der bei "Ada Lovelace" an dieser Stelle im Portfolio stehende AD104-Chip: Jener trat immerhin mit 60 Shader-Clustern an, wenngleich am selben, nur 192 Bit breiten Speicherinterface.

    nVidia GB205

  • nVidia "Blackwell" Architektur (in einer Consumer-Version, nur indirekt verwandt mit "HPC/AI-Blackwell")
  • 31,1 Mrd. Transistoren auf 263mm² Chipfäche in der 4nm-Fertigung von TSMC
  • 5 Raster-Engines, 80 ROPs, 48 MB Level2-Cache
  • 50 Shader-Cluster mit insgesamt 6400 FP32-Einheiten, 200 TMUs, 50 RT-Cores v4 und 200 Tensor-Cores v5
  • die (wie vorher) 128 Recheneinheiten eines Shader-Clusters sind nunmehr fähig zu komplett Dual-Use FP32/INT32
  • 192 Bit GDDR7-Speicherinterface
  • PCI Express 5.0 x16 Anbindung
  • zusätzlich zu den bekannten nVidia-Features: DLSS4 mit neuem "Transformer" Berechnungsmodell, Multi Frame Generation (MFG), Reflex 2 & Smooth Motion
  • Display-Ausgänge nunmehr nach den Standards DisplayPort 2.1b und HDMI 2.1b
  • resultierende Grafikkarte: GeForce RTX 5070 (nahe Vollausbau)

In diesem liegt sicherlich eine Schwachstelle des GB205-Chips bzw. der hieraus resultierenden GeForce RTX 5070: Ohne 24-GBit-Speicherchips (welche nVidia derzeit exklusiv für die "GeForce RTX 5090 Laptop" sowie für Profi-Beschleuniger verwendet) zwingt jenes Speicherinterface zu einer Speichermenge von 12 GB VRAM – was in heutiger Zeit einfach knapp ist für einen Beschleuniger mit klarer Ausrichtung auf WQHD-Bedürfnisse. Momentan reicht diese Speichermenge nVidia-Beschleunigern unter dieser Auflösung sicherlich noch aus (bei AMD & Intel ist dies hingegen nicht immer der Fall), aber es existiert damit auch keine Reserve für die Zukunft – was man von neu gekauften Beschleunigern mit nicht geringfügigem Preispunkt eigentlich sehr wohl erwarten können sollte.

    nVidia GeForce RTX 5070

  • nVidia "GB205-300" Chip der "Blackwell"-Architektur
  • 5 Raster-Engines, 80 ROPs, 48 MB Level2-Cache
  • 48 Shader-Cluster mit insgesamt 6144 FP32-Einheiten, 192 TMUs, 48 RT-Cores v4 und 192 Tensor-Cores v5
  • 192 Bit GDDR7-Speicherinterface für 12 GB GDDR7-Speicher
  • Taktraten: 2325/2512 MHz & 28 Gbps
  • Founders Edition: DualSlot, 24,5cm
  • Hersteller-Varianten: Dual- & TripleSlot, 23,1-33,8cm
  • TDP bzw. Powerlimit: 250 Watt
  • Listenpreis/UVP: $549 / 649€
  • Marktstart: 5. März 2025

AMD hat die Radeon RX 9070 & 9070 XT Grafikkarten hingegen einen Tag später am 6. März in den Markt entlassen, beide neuen Karten bauen auf dem "Navi 48" Grafikchip als dem Erstlingswerk der "RDNA4"-Architektur auf. Hiermit gibt es wie bekannt keine neuen HighEnd-Beschleuniger, sondern reine Midrange-Ware – und auch im Gegensatz zu "RDNA3" dann wiederum im monolithischen Aufbau. Dennoch sind sich der "alte" Midrange-Chip "Navi 32" und der neue Midrange-Chip "Navi 48" von der Hardware-Ansetzung her recht ähnlich: 60 Shader-Cluster stehen hierbei 64 gegenüber, jeweils an einem 256-Bit-Speicherinterface. AMD muß somit dennoch unter der Haube mächtig etwas getan haben, denn gegenüber den "nur" 28,1 Mrd. Transistoren des Navi-32-Chips trägt Navi 48 auf nahezu gleicher Chipfläche immerhin 53,9 Mrd. Transistoren.

    AMD Navi 48

  • AMD "RDNA4" Architektur
  • 53,9 Mrd. Transistoren auf 356mm² Chipfäche in der 4nm-Fertigung von TSMC
  • 4 Raster-Engines, 128 ROPs, 8 MB Level2-Cache, 64 MB Infinity Cache
  • 64 Shader-Cluster mit insgesamt 4096 (Dual-Issue) FP32-Einheiten, 256 TMUs, 64 RT-Kerne v3 und 128 AI-Kerne v2
  • 256 Bit GDDR6-Speicherinterface
  • PCI Express 5.0 x16 Anbindung
  • zusätzlich zu den bekannten AMD-Features: FSR4, deutlich verbesserte RayTracing-Eignung
  • Display-Ausgänge nunmehr nach den Standards DisplayPort 2.1b (max. UHBR13.5) und HDMI 2.1b
  • resultierende Grafikkarte: Radeon RX 9070 (Salvage) und Radeon RX 9070 XT (Vollausbau)

Die beiden aus Navi 48 geschnitzten Grafikkarten lassen sich dabei grob folgendermaßen beschreiben: Die größere Radeon RX 9070 XT kommt mit dem Vollausbau des Grafikchips samt ziemlich weit ausgefahreren TDP daher. Die kleinere Radeon RX 9070 setzt eine maßvolle Hardware-Abspeckung an, bei welcher es nur 56 anstatt 64 Shader-Cluster gibt, viele andere Details (Raster-Engines, ROPs, Caches und Speicherinterface) jedoch identisch bleiben. Als weiteren Unterschied hat die kleinere Karte jedoch mit 220 Watt eine deutlich kleinere TDP als die größere Karte mit 304 Watt, dürfte dies maßgeblich zur Performance-Differenz unter diesen beiden Navi-48-Karten beitragen. Jeglichen VRAM-Fragen geht AMD dabei komplett aus dem Weg mit einer beiderseitigen Speicherbestückung von 16 GB.

 
    AMD Radeon RX 9070

  • AMD "Navi 48 XT" Chip der "RDNA4"-Architektur
  • 4 Raster-Engines, 128 ROPs, 8 MB Level2-Cache, 64 MB Infinity Cache
  • 56 Shader-Cluster mit insgesamt 3584 (Dual-Issue) FP32-Einheiten, 224 TMUs, 56 RT-Kerne v3 und 112 AI-Kerne v2
  • 256 Bit GDDR6-Speicherinterface für 16 GB GDDR6-Speicher
  • Taktraten: 1330/2070/2520 MHz & 20,1 Gbps
  • kein Referenz-Design seitens AMD
  • Hersteller-Varianten: Dual- & TripleSlot, 28,0-35,0cm
  • TDP bzw. Powerlimit: 220 Watt
  • Listenpreis/UVP: $549 / 629€
  • Marktstart: 6. März 2025
    AMD Radeon RX 9070 XT

  • AMD "Navi 48 XTX" Chip der "RDNA4"-Architektur
  • 4 Raster-Engines, 128 ROPs, 8 MB Level2-Cache, 64 MB Infinity Cache
  • 64 Shader-Cluster mit insgesamt 4096 (Dual-Issue) FP32-Einheiten, 256 TMUs, 64 RT-Kerne v3 und 128 AI-Kerne v2
  • 256 Bit GDDR6-Speicherinterface für 16 GB GDDR6-Speicher
  • Taktraten: 1660/2400/2970 MHz & 20,1 Gbps
  • kein Referenz-Design seitens AMD
  • Hersteller-Varianten: Dual- & TripleSlot, 28,8-36,0cm
  • TDP bzw. Powerlimit: 304 Watt
  • Listenpreis/UVP: $599 / 689€
  • Marktstart: 6. März 2025
 

Im Gegensatz zur GeForce RTX 5070, welcher nVidia wieder eine "Founders Edition" spendiert hat, kommen die beiden neuen AMD-Grafikkarten ohne jegliches Referenz-Design seitens AMD daher, jenes gab es noch nicht einmal für Reviewer-Zwecke. Der Launch von Radeon RX 9070 & 9070 XT wurde somit durchgehend mit Hersteller-Designs bestritten, welche allerdings die neuen AMD-Grafikkarten oftmals weit deutlicher ausgereizt haben, als dies mit nVidia-Modellen ansonsten üblich ist. So kommen viele werksübertaktete Ausführungen zu Radeon RX 9070 & 9070 XT nicht nur mit beachtbar höheren Taktraten daher, sondern auch mit hochgesetzten TDP- bzw. Powerlimit-Werten, welche durchaus im Rahmen von 20-30 Watt mehr liegen können – und damit natürlich das Performance-Bild dieser Karten klar beeinflussen können.

Radeon RX 9070 Radeon RX 9070 XT GeForce RTX 5070 GeForce RTX 5070 Ti
Chipbasis AMD Navi 48 XT AMD Navi 48 XTX nVidia GB205-300 nVidia GB203-300
Fertigung 53,9 Mrd. Transistoren auf 356mm² Chipfäche in der 4nm-Fertigung von TSMC 31,1 Mrd. Transistoren auf 263mm² Chipfäche in der 4nm-Fertigung von TSMC 45,6 Mrd. Transistoren auf 378mm² Chipfäche in der 4nm-Fertigung von TSMC
Architektur AMD RDNA4, DirectX 12 Feature-Level 12_2 nVidia Blackwell, DirectX 12 Feature-Level 12_2
Features DirectX 12, OpenGL, Vulkan, RayTracing, VSR, FSR 1/2/3/4, FreeSync, TrueAudio Next, XConnect, rBAR DirectX 12, OpenGL, Vulkan, RayTracing, DSR, DLDSR, DLSS 2/3/4, MFG, PhysX (nur 64-Bit), G-Sync, FreeSync, rBAR
Technik 4 Raster-Engines, 56 Shader-Cluster, 3484 (Dual-Issue) FP32-Einheiten, 224 TMUs, 56 RT-Kerne v3, 112 AI-Kerne v2, 128 ROPs, 8 MB Level2-Cache, 64 MB Infinity Cache, 256 Bit GDDR6-Interface (Salvage) 4 Raster-Engines, 64 Shader-Cluster, 4096 (Dual-Issue) FP32-Einheiten, 256 TMUs, 64 RT-Kerne v3, 128 AI-Kerne v2, 128 ROPs, 8 MB Level2-Cache, 64 MB Infinity Cache, 256 Bit GDDR6-Interface (Vollausbau) 5 Raster-Engines, 48 Shader-Cluster, 6144 FP32-Einheiten, 192 TMUs, 48 RT-Cores v4, 192 Tensor-Cores v5, 80 ROPs, 48 MB Level2-Cache, 192 Bit GDDR7-Interface (Salvage) 6 Raster-Engines, 70 Shader-Cluster, 8960 FP32-Einheiten, 280 TMUs, 70 RT-Cores v4, 280 Tensor-Cores v5, 96 ROPs, 48 MB Level2-Cache, 256 Bit GDDR7-Interface (Salvage)
Taktraten 1330/2070/2520 MHz & 20,1 Gbps 1660/2400/2970 MHz & 20,1 Gbps 2325/2512 MHz & 28 Gbps 2300/2452 MHz & 28 Gbps
Rohleistungen 29,7 TFlops & 645 GB/sec 39,3 TFlops & 645 GB/sec 30,9 TFlops & 672 GB/sec 43,9 TFlops & 896 GB/sec
Speicherausbau 16 GB GDDR6 16 GB GDDR6 12 GB GDDR7 16 GB GDDR7
Anbindung PCI Express 5.0 x16 PCI Express 5.0 x16 PCI Express 5.0 x16 PCI Express 5.0 x16
Ref/AIBs/OC / / / / / / / /
Layout Dual- & TripleSlot Dual- & TripleSlot Dual- & TripleSlot Dual-, Triple- & QuadSlot
Kartenlänge AIBs: 28,0-35,0cm AIBs: 28,8-36,0cm FE: 24,5cm
AIBs: 23,1-33,8cm
AIBs: 28,8-36,0cm
Stromstecker 2x 8pol. 2x 8pol. 1x 16pol. 1x 16pol.
TDP 220W 304W 250W 300W
Ausgänge HDMI 2.1b, 3x DisplayPort 2.1b HDMI 2.1b, 3x DisplayPort 2.1b HDMI 2.1b, 3x DisplayPort 2.1b HDMI 2.1b, 3x DisplayPort 2.1b
Listenpreis $549 / 629€ $599 / 689€ $549 / 649€ $749 / 879€
Straßenpreis (derzeit) 749-830€ (derzeit) 898-980€ (derzeit) 796-850€ (derzeit) 1079-1160€
Release 6. März 2025 6. März 2025 5. März 2025 20. Februar 2025

Zur Ermittlung der realen Taktraten wurden natürlich nur Karten zugelassen, welche tatsächlich auf Referenz-Niveau laufen. Hierbei ergab sich, dass die GeForce RTX 5070 mit durchschnittlich 2.78 GHz Realtakt die derzeit wohl am höchsten taktende Blackwell-basierte Grafikkarte darstellt, wenngleich nicht mit großem Abstand zur GeForce RTX 5070 Ti sowie auch nicht zu den im gleichen Technik-Feld stehenden Ada-Lovelace-basierenden Beschleunigern (GeForce RTX 4070 bei durchschnittlich 2.73 GHz). Wie üblich bei nVidia-Grafikkarten, wird dabei nVidias offizieller Boost-Takt (2512 MHz bei der GeForce RTX 5070) klar überboten. Bei AMD läuft dies wie bekannt etwas anders, dort wird in aller Regel der offizielle "Game Clock" klar überboten und das Niveau des offiziellen "Boost Clock" meist nur knapp erreicht.

Bei der größeren Radeon RX 9070 XT klappt dies nicht ganz, auch wenn durchschnittlich 2.94 GHz Realtakt ein Spitzen-Ergebnis sind – und AMD damit nun endlich jene Taktraten aufbietet, für welche RDNA3 eigentlich einmal gedacht war. Die kleinere Radeon RX 9070 kommt mit einem Realtakt von durchschnittlich 2.65 GHz hingegen klar oberhalb ohres nominellen Boost-Takts heraus, welcher bei nur 2520 MHz steht. Anders formuliert: Liegt die Rechenleistungs-Differenz beider neuen AMD-Grafikkarten auf dem nominellen "Game Clock" bei +33% zugunsten des größeren XT-Modells sowie bei +35% auf dem nominellen "Boost Clock", sind es auf Basis des gemessenen Realtaks dann "nur" noch +27% zugunsten der XT-Ausführung (bei wohlgemerkt identischer Speicherbandbreite).

Basis Durchschnitt Max gemessener Realtakt
AMD-Bezeichnung: "Base Clock" "Game Clock" "Boost Clock" "Max Clock" CB PCGH TPU Tom's
Radeon RX 9070 XT 1660 MHz 2400 MHz 2970 MHz ? 2893 MHz 3.00 GHz - 2932 MHz
Radeon RX 9070 1330 MHz 2070 MHz 2520 MHz ? 2637 MHz 2.69 GHz - 2616 MHz
Radeon RX 7900 XTX 1900 MHz 2300 MHz 2500 MHz ? 2556 MHz 2.60 GHz 2612 MHz 2507 MHz
Radeon RX 7900 XT 1500 MHz 2000 MHz 2400 MHz ? 2566 MHz 2.40 GHz 2687 MHz 2515 MHz
Radeon RX 7900 GRE 1287 MHz 1880 MHz 2245 MHz ? 2151 MHz 2.23 GHz - -
Radeon RX 7800 XT 1295 MHz 2124 MHz 2430 MHz ? 2386 MHz 2.35 GHz 2425 MHz 2334 MHz
Radeon RX 7700 XT 1700 MHz 2171 MHz 2544 MHz ? 2507 MHz 2.56 GHz 2560 MHz 2535 MHz
Radeon RX 7600 XT 1980 MHz 2470 MHz 2755 MHz ? 2716 MHz 2.79 GHz 2790 MHz 2707 MHz
Radeon RX 7600 1720 MHz 2250 MHz 2625 MHz ? 2645 MHz 2.61 GHz 2613 MHz 2631 MHz
nVidia-Bezeichnung: "Base Clock" "Boost Clock" "Max Clock" CB PCGH TPU Tom's
GeForce RTX 5090 2017 MHz 2407 MHz ? 2645 MHz 2722 MHz 2684 MHz 2654 MHz
GeForce RTX 5080 2295 MHz 2617 MHz ? 2713 MHz 2731 MHz 2640 MHz 2677 MHz
GeForce RTX 5070 Ti 2300 MHz 2452 MHz ? 2753 MHz 2.71 GHz 2746 MHz 2786 MHz
GeForce RTX 5070 2325 MHz 2512 MHz ? 2781 MHz 2.79 GHz 2738 MHz 2816 MHz
GeForce RTX 4090 2235 MHz 2520 MHz ? 2744 MHz 2.74 GHz 2701 MHz 2752 MHz
GeForce RTX 4080 Super 2295 MHz 2550 MHz ? 2729 MHz 2.73 GHz 2715 MHz 2787 MHz
GeForce RTX 4080 2205 MHz 2505 MHz ? 2725 MHz 2.78 GHz 2737 MHz 2783 MHz
GeForce RTX 4070 Ti Super 2340 MHz 2610 MHz ? 2785 MHz 2.67 GHz 2708 MHz 2745 MHz
GeForce RTX 4070 Ti 2310 MHz 2610 MHz ? 2802 MHz 2737 MHz - -
GeForce RTX 4070 Super 1980 MHz 2475 MHz ? 2735 MHz 2.72 GHz 2715 MHz 2718 MHz
GeForce RTX 4070 1920 MHz 2475 MHz ? 2758 MHz 2769 MHz 2762 MHz 2722 MHz
GeForce RTX 4060 Ti 2310 MHz 2535 MHz ? 2714 MHz 2.74 GHz 2767 MHz 2783 MHz
GeForce RTX 4060 1830 MHz 2460 MHz ? 2738 MHz 2.69 GHz 2640 MHz 2726 MHz
Intel-Bezeichnung: - "Graphics Clock" "Max Clock" CB PCGH TPU Tom's
Arc B580 - 2670 MHz 2850 MHz 2850 MHz 2.85 GHz 2801 MHz 2848 MHz
Arc B570 (AIBs) - ≥2600 MHz 2750 MHz - 2.75 GHz 2684 MHz 2747 MHz
Arc A770 16GB - 2100 MHz 2400 MHz - 2.33 GHz 2386 MHz 2311 MHz
Arc A750 - 2050 MHz 2400 MHz - 2.39 GHz 2394 MHz 2379 MHz
Arc A580 (AIBs) - 2000 MHz 2400 MHz 2396 MHz 2.33 GHz 2354 MHz 2325 MHz
Realtakt-Angaben gemäß den Ausarbeitungen der ComputerBase (Ø 11-23 Spiele), PC Games Hardware (üblicherweise Praxis-Angaben, zuzüglich teilweise MHz-genaue Werte aus Ø 20 Spiele), TechPowerUp (Ø 22-25 Spiele) und Tom's Hardware (Ø 15-19 Spiele) von jeweils Referenz-Varianten (oder auf Referenz-Takt/TDP laufend); letzte Tabelle mit allen Radeon RX 6000 & GeForce RTX 30 Modellen siehe hier