Launch-Analyse nVidia GeForce RTX 5060 Ti

Sonntag, 27. April 2025
 / von Leonidas
 

Mit der GeForce RTX 5060 Ti dehnt nVidia seine "Blackwell"-basierte RTX50-Serie nunmehr auf das Mainstream-Segment aus. Zugleich handelt es sich hiermit auch um die erste Grafikkarte der 2025er Neuvorstellungen, welche in zwei Speicherversionen und damit auch mit einer 8-GB-Ausführung angeboten wird. Wie bekannt, hat nVidia es verstanden, selbige weitgehend an den Hardwaretestern vorbeizuschummeln, die Launch-Reviews zur GeForce RTX 5060 Ti konzentrierten sich fast ausschließlich auf die 16-GB-Ausführung. Zumindest selbige läßt sich nach der Auswertung von 16 Launch-Reviews mit ~6420 Benchmarks doch ziemlich gut einordnen, zur 8-GB-Ausführung läßt sich aber zumindest eine passable Performance-Schätzung anbringen. Wo beide neuen RTX50-Grafikkarten im Gesamtbild bei Performance, Stromverbrauch, Energieeffizienz und Performance/Preis-Verhältnis herauskommen, soll mit nachfolgender Launch-Analyse ermittelt werden.

Für die GeForce RTX 5060 Ti benutzt nVidia erstmals den GB206-Chips als dem immerhin schon vierten Grafikchip der Blackwell-Serie für Consumer/Gamer-Bedürfnisse. Selbiger tritt mit 3 Raster-Engines, 36 Shader-Cluster und 32 MB Level2-Cache von diesen Grunddaten her unverändert zum vorhergehenden AD106-Chip der "Ada Lovelace" Generation an. Auch die Abspeckung auf eine PCIe-Anbindung mit nur 8 Lanes wurde vom Vorgänger-Chip übernommen, allerdings führt der GB206-Chip dies dann bereits unter PCI Express 5.0 aus (AD106: nur PCIe 4.0). Wegen der fast gleichen Anzahl an Hardware-Einheiten beschränken sich die Fortschritte zwischen AD106 und GB206 primär auf dieserart Feature-Sprünge: GDDR7 anstatt GDDR6X-Speicher, leichte Verbesserungen innerhalb der Shader-Cluster sowie DLSS4 samt MFG anstatt DLSS3 und (einfachem) Frame Generation.

    nVidia GB206

  • nVidia "Blackwell" Architektur (in einer Consumer-Version, nur indirekt verwandt mit "HPC/AI-Blackwell")
  • 21,9 Mrd. Transistoren auf 181mm² Chipfäche in der 4nm-Fertigung von TSMC
  • 3 Raster-Engines, 48 ROPs, 32 MB Level2-Cache
  • 36 Shader-Cluster mit insgesamt 4608 FP32-Einheiten, 144 TMUs, 36 RT-Cores v4 und 144 Tensor-Cores v5
  • die (wie vorher) 128 Recheneinheiten eines Shader-Clusters sind nunmehr fähig zu komplett Dual-Use FP32/INT32
  • 128 Bit GDDR7-Speicherinterface
  • PCI Express 5.0 x8 Anbindung
  • zusätzlich zu den bekannten nVidia-Features: DLSS4 mit neuem "Transformer" Berechnungsmodell, Multi Frame Generation (MFG), Reflex 2 & Smooth Motion
  • Display-Ausgänge nunmehr nach den Standards DisplayPort 2.1b und HDMI 2.1b
  • resultierende Grafikkarten: GeForce RTX 5060 Ti (Vollausbau) und GeForce RTX 5060 (Salvage, folgt im Mai)

Interessant ist, dass nVidia diese weitgehend gleiche Hardware samt der neuen Features in sogar etwas weniger Transistoren unterbringt: 21,9 Mrd. beim GB206 zu 22,9 Mrd. bei AD106 lauten hierbei die Zahlen. Da bei den Einheiten-Zahlen wirklich alles identisch ist und wie gesagt auch ein paar neue Features mit an Bord sind, lassen sich hieraus zwei Schlüsse ziehen: Zum einen können die neuen Features kaum wirklich an Transistoren gekostet haben. Und zum anderen könnte ein Teil dieser Einsparung von immerhin einer Milliarde Transistoren denkbarerweise dem Schritt vom GDDR6X- zum GDDR7-Speicherinterface zu verdanken sein. Zwar ist das GDDR7-Interface moderner und leistungsfähiger, allerdings nutzt GDDR6X das komplizierte PAM4-Signalverfahren, was möglicherweise einen höheren Transistorenbedarf ergibt. Sicher ist diese Auslegung natürlich nicht, aber bemerkenswert ist diese Abspeckung von einer Milliarde Transistoren zwischen den ansonsten Einheiten-gleichen Chips AD106 und GB206 sicherlich.

Die GeForce RTX 5060 Ti benutzt dann den Vollausbau des GB206-Chips, sprich hier kommen die vollen 36 Shader-Cluster zum Einsatz. Damit ergibt sich Karten-seitig dann doch eine kleine Hardware-Differenz zur vorhergehenden GeForce RTX 4060 Ti, welche mit nur 34 aktiven Shader-Clustern antrat (obwohl der zugrundliegende AD106-Chip genauso 36 Shader-Cluster trägt). Damit kommt – trotz bei der Anzahl der Hardware-Einheiten vergleichbarem Chip-Unterbau – die GeForce RTX 5060 Ti dann doch noch mit etwas mehr nomineller Rechenleistung daher: Unterstützt von einem minimalen Mehrtakt hat die Karte gegenüber der GeForce RTX 4060 Ti eine um +7,4% höhere nominelle FP32-Rechenleistung. Hinzu kommt natürlich immer noch der überaus kräftige Sprung bei der Speicherbandbreite durch GDDR7-Speicher von stolzen +75% zugunsten der GeForce RTX 5060 Ti. An dieser Stelle zahlt sich doppelt aus, dass die GeForce RTX 4060 Ti nur mit GDDR6-Speicher (und nicht GDDR6X wie die meisten anderen RTX40-Beschleuniger) antrat.

    nVidia GeForce RTX 5060 Ti

  • nVidia "GB206-300" Chip der "Blackwell"-Architektur
  • 3 Raster-Engines, 48 ROPs, 32 MB Level2-Cache
  • 36 Shader-Cluster mit insgesamt 4608 FP32-Einheiten, 144 TMUs, 36 RT-Cores v4 und 144 Tensor-Cores v5
  • 128 Bit GDDR7-Speicherinterface für 8 oder 16 GB GDDR7-Speicher
  • Taktraten: 2407/2572 MHz & 28 Gbps
  • keine Founders Edition
  • Hersteller-Varianten: Dual- & TripleSlot, 20,4-33,7cm
  • TDP bzw. Powerlimit: 180 Watt
  • Listenpreis/UVP der 8-GB-Ausführung: $379 / 399€
  • Listenpreis/UVP der 16-GB-Ausführung: $429 / 449€
  • Marktstart: 16. April 2025

Die Benutzung eines Vollausbaus bei einer Mainstream-Lösung ist für nVidia eher ungewöhnlich ist, selbst wenn dies bei GeForce RTX 5080 und GB203 auch schon derart der Fall war. Für eine etwaige Refresh-Serie müsste nVidia sich somit höheren Chips bedienen, zumindest wenn man die Rechenleistung beachtbar steigern wollte. Andererseits gab es zur vorhergehenden GeForce RTX 4060 Serie auch keinen Refresh, ergo ist das ganze derzeit rein hypothetisch. Im Gegensatz zur GeForce RTX 4060 Ti gibt es bei der GeForce RTX 5060 Ti keine Founders Edition. Allerdings hat nVidia den Grafikkarten-Herstellern – wohl aus der Erfahrung der vorhergehenden RTX50-Launches – vorgeschrieben, wenigstens eine Grafikkarte zum Listenpreis bzw. zur UVP aufzulegen, um eben dieses UVP-Niveau auch tatsächlich im Markt bieten zu können (was in der Praxis auch gut funktioniert hat).

Ein klarer Unterschied zur vorhergehenden GeForce RTX 4060 Ti besteht dann im Handling der beiden Speicherausführungen von 8 und 16 GB. Bei der GeForce RTX 4060 Ti war die 8-GB-Ausführung das primäre Modell, wurde zuerst und mit einem (halbwegs) sinnigen Listenpreis ($399) herausgebracht. Die 16-GB-Ausführung der GeForce RTX 4060 Ti kam dagegen etwas später, ohne Launch-Reviews und mit einem um glatt 100 Dollar höheren Listenspreis ($499), welches diese Karte anfänglich auch recht unattraktiv machte. nVidia renkte dies später wieder ein über interne Preissenkungen zur 16-GB-Ausführungen, welche den Preisabstand zur 8-GB-Ausführung auf rund 50 Dollar bzw. 60 Euro reduzierten – womit sich in der Folge die 16-GB-Ausführung (trotz wie gesagt ungünstigerer Startbedingungen) beachtbar besser verkaufte als die 8-GB-Ausführung.

Bei der GeForce RTX 5060 Ti ist hingegen die 16-GB-Ausführung klar in der Pole Position: nVidia stellte den Hardwaretestern nur diese Karte zum Test zur Verfügung und verdonnerte die Grafikkarten-Hersteller, den Hardwaretestern (wenigstens anfänglich) keine 8-GB-Ausführung eigenverantwortlich herauszugeben. Zugleich besteht auch ein sinniger Preisunterschied gleich vom Launchtag weg: Anstatt 100 Dollar bzw. 110 Euro mehr wie bei der GeForce RTX 4060 Ti, sind es bei der GeForce RTX 5060 Ti nunmehr nur 50 Dollar/Euro mehr für die größere Speicherbestückung. Da nVidia zudem die Listenspreise gegenüber dem Vorgänger-Modell leicht reduziert hat, bietet sich somit der direkte Vergleich von GeForce RTX 4060 Ti 8GB ($399) gegen GeForce RTX 5060 Ti 16GB ($429) an – was nVidia sicherlich derart kalkuliert haben dürfte, da man somit den Speichervorteil auch mit in den Generationssprung einfliessen lassen kann.

GeForce RTX 4060 Ti GeForce RTX 4070 GeForce RTX 5060 Ti GeForce RTX 5070
Chipbasis nVidia AD106-350/351 nVidia AD104-250 nVidia GB206-300 nVidia GB205-300
Fertigung 22,9 Mrd. Transistoren auf 188mm² Chipfäche in der 5nm-Fertigung von TSMC 35,8 Mrd. Transistoren auf 295mm² Chipfäche in der 5nm-Fertigung von TSMC 21,9 Mrd. Transistoren auf 181mm² Chipfäche in der 4nm-Fertigung von TSMC 31,1 Mrd. Transistoren auf 263mm² Chipfäche in der 4nm-Fertigung von TSMC
Architektur nVidia Ada Lovelace, DirectX 12 Feature-Level 12_2 nVidia Blackwell, DirectX 12 Feature-Level 12_2
Features DirectX 12, OpenGL, Vulkan, RayTracing, DSR, DLDSR, DLSS 2/3, FG, PhysX, G-Sync, FreeSync, rBAR DirectX 12, OpenGL, Vulkan, RayTracing, DSR, DLDSR, DLSS 2/3/4, MFG, PhysX (nur 64-Bit), G-Sync, FreeSync, rBAR
Technik 3 Raster-Engines, 34 Shader-Cluster, 4352 FP32-Einheiten, 136 TMUs, 34 RT-Cores v3, 136 Tensor-Cores v4, 48 ROPs, 32 MB Level2-Cache, 128 Bit GDDR6-Interface (Salvage) 4 Raster-Engines, 46 Shader-Cluster, 5888 FP32-Einheiten, 184 TMUs, 46 RT-Cores v3, 184 Tensor-Cores v4, 64 ROPs, 36 MB Level2-Cache, 192 Bit GDDR6X-Interface (Salvage) 3 Raster-Engines, 36 Shader-Cluster, 4608 FP32-Einheiten, 144 TMUs, 36 RT-Cores v4, 144 Tensor-Cores v5, 48 ROPs, 32 MB Level2-Cache, 128 Bit GDDR7-Interface (Vollausbau) 5 Raster-Engines, 48 Shader-Cluster, 6144 FP32-Einheiten, 192 TMUs, 48 RT-Cores v4, 192 Tensor-Cores v5, 80 ROPs, 48 MB Level2-Cache, 192 Bit GDDR7-Interface (Salvage)
Taktraten 2310/2535 MHz & 18 Gbps 1920/2475 MHz & 21 Gbps 2407/2572 MHz & 28 Gbps 2325/2512 MHz & 28 Gbps
Rohleistungen 22,1 TFlops & 288 GB/sec 29,1 TFlops & 504 GB/sec 23,7 TFlops & 504 GB/sec 30,9 TFlops & 672 GB/sec
Speicherausbau 8/16 GB GDDR6 12 GB GDDR6X 8/16 GB GDDR7 12 GB GDDR7
Anbindung PCI Express 4.0 x8 PCI Express 4.0 x16 PCI Express 5.0 x8 PCI Express 5.0 x16
Ref./Herst./OC / / / / / / / /
Layout Dual/TripleSlot Dual/TripleSlot Dual/TripleSlot Dual/TripleSlot
Kartenlänge FE: 24,5cm
AIBs: 17,0-33,8cm
FE: 24,0cm
AIBs: 22,6-34,9cm
AIBs: 20,4-33,7cm FE: 24,5cm
AIBs: 23,1-33,8cm
Stromstecker FE: 1x 16pol.
AIBs: 1x 8pol.
FE: 1x 16pol.
AIBs: 1x 8pol.
1x 8pol. 1x 16pol.
off. Verbrauch 160/165W 200W 180W 250W
Ausgänge HDMI 2.1a, 3x DisplayPort 1.4a HDMI 2.1a, 3x DisplayPort 1.4a HDMI 2.1b, 3x DisplayPort 2.1b HDMI 2.1b, 3x DisplayPort 2.1b
Listenpreis 8GB: $399 / 439€
16GB: $499 / 549€
$549 / 609€ 8GB: $379 / 399€
16GB: $429 / 449€
$549 / 649€
Release 8GB: 24. Mai 2023
16GB: 18. Juli 2023
13. April 2023 16. April 2025 5. März 2025

Obwohl die GeForce RTX 5060 Ti nominell den leicht höheren Chiptakt gegenüber der GeForce RTX 4060 Ti mitbringt, gehen die Messungen des Realtakts in die andere Richtung – mit einem leichten Vorteil zugunsten der älteren Karte. Dies überrascht etwas angesichts der auf 180 Watt hochgezogenen TDP der GeForce RTX 5060 Ti, ausgehend von dieser hätte man sich eventuell einen klar höheren Realtakt bei der GeForce RTX 5060 Ti vorstellen können. Zugleich liegt die neue Mainstream-Karte somit auch etwas, aber beachtbar unterhalb des Taktraten-Niveaus von GeForce RTX 5070 & 5070 Ti, eher nur auf dem Taktraten-Niveau der Spitzen-Lösungen GeForce RTX 5080 & 5090. Für eine Mainstream-Lösung ist dies vergleichsweise ungewöhnlich, jene haben üblicherweise eher das Potential zu klar höheren Taktraten (gegenüber den Spitzen-Lösungen auf Basis viel größerer Grafikchips).

Basis Durchschnitt Max gemessener Realtakt
AMD-Bezeichnung: "Base Clock" "Game Clock" "Boost Clock" "Max Clock" CB PCGH TPU Tom's
Radeon RX 9070 XT 1660 MHz 2400 MHz 2970 MHz ? 2893 MHz 3.00 GHz - 2932 MHz
Radeon RX 9070 1330 MHz 2070 MHz 2520 MHz ? 2637 MHz 2.69 GHz - 2616 MHz
Radeon RX 7900 XTX 1900 MHz 2300 MHz 2500 MHz ? 2556 MHz 2.60 GHz 2612 MHz 2507 MHz
Radeon RX 7900 XT 1500 MHz 2000 MHz 2400 MHz ? 2566 MHz 2.40 GHz 2687 MHz 2515 MHz
Radeon RX 7900 GRE 1287 MHz 1880 MHz 2245 MHz ? 2151 MHz 2.23 GHz - -
Radeon RX 7800 XT 1295 MHz 2124 MHz 2430 MHz ? 2386 MHz 2.35 GHz 2425 MHz 2334 MHz
Radeon RX 7700 XT 1700 MHz 2171 MHz 2544 MHz ? 2507 MHz 2.56 GHz 2560 MHz 2535 MHz
Radeon RX 7600 XT 1980 MHz 2470 MHz 2755 MHz ? 2716 MHz 2.79 GHz 2790 MHz 2707 MHz
Radeon RX 7600 1720 MHz 2250 MHz 2625 MHz ? 2645 MHz 2.61 GHz 2613 MHz 2631 MHz
nVidia-Bezeichnung: "Base Clock" "Boost Clock" "Max Clock" CB PCGH TPU Tom's
GeForce RTX 5090 2017 MHz 2407 MHz ? 2645 MHz 2722 MHz 2684 MHz 2654 MHz
GeForce RTX 5080 2295 MHz 2617 MHz ? 2713 MHz 2731 MHz 2640 MHz 2677 MHz
GeForce RTX 5070 Ti 2300 MHz 2452 MHz ? 2753 MHz 2.71 GHz 2746 MHz 2786 MHz
GeForce RTX 5070 2325 MHz 2512 MHz ? 2781 MHz 2.79 GHz 2738 MHz 2816 MHz
GeForce RTX 5060 Ti 2407 MHz 2572 MHz ? 2684 MHz 2.72 GHz 2649 MHz -
GeForce RTX 4090 2235 MHz 2520 MHz ? 2744 MHz 2.74 GHz 2701 MHz 2752 MHz
GeForce RTX 4080 Super 2295 MHz 2550 MHz ? 2729 MHz 2.73 GHz 2715 MHz 2787 MHz
GeForce RTX 4080 2205 MHz 2505 MHz ? 2725 MHz 2.78 GHz 2737 MHz 2783 MHz
GeForce RTX 4070 Ti Super 2340 MHz 2610 MHz ? 2785 MHz 2.67 GHz 2708 MHz 2745 MHz
GeForce RTX 4070 Ti 2310 MHz 2610 MHz ? 2802 MHz 2737 MHz - -
GeForce RTX 4070 Super 1980 MHz 2475 MHz ? 2735 MHz 2.72 GHz 2715 MHz 2718 MHz
GeForce RTX 4070 1920 MHz 2475 MHz ? 2758 MHz 2769 MHz 2762 MHz 2722 MHz
GeForce RTX 4060 Ti 2310 MHz 2535 MHz ? 2714 MHz 2.74 GHz 2767 MHz 2783 MHz
GeForce RTX 4060 1830 MHz 2460 MHz ? 2738 MHz 2.69 GHz 2640 MHz 2726 MHz
Intel-Bezeichnung: - "Graphics Clock" "Max Clock" CB PCGH TPU Tom's
Arc B580 - 2670 MHz 2850 MHz 2850 MHz 2.85 GHz 2801 MHz 2848 MHz
Arc B570 (AIBs) - ≥2600 MHz 2750 MHz - 2.75 GHz 2684 MHz 2747 MHz
Arc A770 16GB - 2100 MHz 2400 MHz - 2.33 GHz 2386 MHz 2311 MHz
Arc A750 - 2050 MHz 2400 MHz - 2.39 GHz 2394 MHz 2379 MHz
Arc A580 (AIBs) - 2000 MHz 2400 MHz 2396 MHz 2.33 GHz 2354 MHz 2325 MHz
Realtakt-Angaben gemäß den Ausarbeitungen der ComputerBase (Ø 11-23 Spiele), PC Games Hardware (üblicherweise Praxis-Angaben, zuzüglich teilweise MHz-genaue Werte aus Ø 20 Spiele), TechPowerUp (Ø 22-25 Spiele) und Tom's Hardware (Ø 15-19 Spiele) von jeweils Referenz-Varianten (oder auf Referenz-Takt/TDP laufend); letzte Tabelle mit allen Radeon RX 6000 & GeForce RTX 30 Modellen siehe hier