Launch-Analyse nVidia GeForce RTX 4060

Sonntag, 2. Juli 2023
 / von Leonidas
 

Mit der GeForce RTX 4060 bringt nVidia seine eigentliche Mainstream-Lösung innerhalb der Ada-Lovelace-Generation an den Start. Jene Grafikkarte verwendet erstmals im Desktop-Segment den AD107-Chip, den kleinsten Grafikchip jener Hardware-Generation – was allerdings nicht gerade große Performance-Sprünge verheißt. Mit zudem wiederum nur 8 GB Grafikkartenspeicher ausgestattet, geht die GeForce RTX 4060 zudem in dieselbe VRAM-Problematik wie zuvor schon GeForce RTX 4060 Ti & Radeon RX 7600. Nichtsdestotrotz müssen natürlich die Launchreviews ausgewertet werden, um auf Basis von deren kumulierten Ergebnissen eine solide begründbare Performance-Einordnung der GeForce RTX 4060 im großen Performance-Bild vornehmen zu können.

Der von der GeForce RTX 4060 eingesetzte AD107-Chip ist nochmals etwas kleiner als der AD106-Chip der GeForce RTX 4060 Ti, teilweise gleichen sich diese beiden Grafikchips allerdings sogar: So sind Raster-Engines, ROPs, (physikalisch vorhandener) Level2-Cache sowie Speicherinterface-Breite identisch. Herunterskaliert zwischen beiden Grafikchips wird wirklich nur die Anzahl der Shader-Cluster – in dieser Frage ist AD106 um +50% größer bzw. AD107 um –33% kleiner. Während bei den anderen Ada-Chips in der Regel alle Hardware-Teile skalieren, gibt nVidia dem AD107-Chip somit relativ mehr Raster-Power sowie Speicherbandbreite mit auf den Weg. Somit dürften sich AD106 und AD107 in den Benchmarks wesentlich näher kommen, als es der nominelle Unterschied von +50% mehr Shader-Cluster zuerst vermuten lassen würde.

AD107 AD106 AD104 AD103 AD102
Fertigung 18,9 Mrd. Transistoren auf 159mm² in der 5nm-Fertigung von TSMC 22,9 Mrd. Transistoren auf 188mm² in der 5nm-Fertigung von TSMC 35,8 Mrd. Transistoren auf 295mm² in der 5nm-Fertigung von TSMC 45,9 Mrd. Transistoren auf 379mm² in der 5nm-Fertigung von TSMC 76,3 Mrd. Transistoren auf 609mm² in der 5nm-Fertigung von TSMC
Hardware 3 GPC, 24 SM, 3072 FP32, 32 MB Level2 Cache, 128 Bit Interface 3 GPC, 36 SM, 4608 FP32, 32 MB Level2 Cache, 128 Bit Interface 5 GPC, 60 SM, 7680 FP32, 48 MB Level2 Cache, 192 Bit Interface 7 GPC, 80 SM, 10'240 FP32, 64 MB Level2 Cache, 256 Bit Interface 12 GPC, 144 SM, 18'432 FP32, 96 MB Level2 Cache, 384 Bit Interface
SKUs GeForce RTX 4060 GeForce RTX 4060 Ti GeForce RTX 4070 & 4070 Ti GeForce RTX 4080 GeForce RTX 4090

Die GeForce RTX 4060 benutzt nahezu den Vollausbau des AD107-Chips, die einzige Abspeckung liegt beim Level2-Cache: Hier hat die GeForce RTX 4060 nur 24 der physikalisch augenscheinlich vorhandenen 32 MB zu bieten. Denkbarerweise hat nVidia diese Abspeckung aus Salvage-Gründen angesetzt, schließlich benutzt auch die "GeForce RTX 4060 Laptop" die volle Hardware des AD107-Chips, in diesem Fall inklusive auch des vollen Level2-Caches. "Echte" Salvage-Varianten mit somit weniger (aktiven) Shader-Clustern gibt es zum AD107-Chip derzeit noch nicht, die Gerüchteküche spekuliert hierzu über eine nachfolgende "GeForce RTX 4050" in Speichervarianten von 8 und 6 GB VRAM. Noch ist dies allerdings nicht spruchreif, die einzige sicher nachfolgende Ada-Lovelace-Karte wird die "GeForce RTX 4060 Ti 16GB" in der zweiten Juli-Hälfte sein.

Im Gegensatz zur vorhergehenden GeForce RTX 4060 Ti gibt es von der "GeForce RTX 4060" keine Founders Edition und auch kein Referenz-Design, die Grafikkarten-Hersteller können somit vollkommen frei agieren. Bislang wird diese Möglichkeit seitens der Grafikkarten-Hersteller allerdings eher dahingehend genutzt, übergroße Designs dieser Karte herauszubringen – welche bei nur 115 Watt TDP vielmehr in die andere Richtung gehen könnte. Zu beachten ist wie bei GeForce RTX 4060 Ti und Radeon RX 7600, dass die GeForce RTX 4060 (Chip-seitig vorgegeben) nur noch über 8 PCI Express Lanes verfügt, somit in einem System mit PCI Express 4.0 grundsätzlich besser aufgehoben ist. Der Performance-Verlust unter PCIe 3.0 ist mit grob –5% zwar nicht weltbewegend, bei knappen Vergleichen kann dies aber natürlich dennoch etwas ausmachen.

Radeon RX 7600 GeForce RTX 3060 12GB GeForce RTX 4060 GeForce RTX 4060 Ti 8GB
Chipbasis AMD Navi 33 XL nVidia GA106-300 nVidia AD107-400 nVidia AD106-350
Fertigung 13,3 Mrd. Transistoren auf 204mm² in der 6nm-Fertigung von TSMC 12,0 Mrd. Transistoren auf 276mm² in der 8nm-Fertigung von Samsung 18,9 Mrd. Transistoren auf 159mm² in der 5nm-Fertigung von TSMC 22,9 Mrd. Transistoren auf 188mm² in der 5nm-Fertigung von TSMC
Architektur AMD RDNA3, DirectX 12 Feature-Level 12_2 nVidia Ampere, DirectX 12 Feature-Level 12_2 nVidia Ada Lovelace, DirectX 12 Feature-Level 12_2
Features DirectX 12, OpenGL, Vulkan, RayTracing, VSR, FSR 1/2/3, FreeSync, TrueAudio Next, XConnect, rBAR DirectX 12, OpenGL, Vulkan, RayTracing, DSR, DLDSR, DLSS 2, PhysX, G-Sync, FreeSync, rBAR DirectX 12, OpenGL, Vulkan, RayTracing, DSR, DLDSR, DLSS 2/3, PhysX, G-Sync, FreeSync, rBAR
Technik 2 Raster-Engines, 32 Shader-Cluster, 4096 FP32-Einheiten, 128 TMUs, 32 RA-Einheiten v2, 64 KI-Kerne, 64 ROPs, 2 MB Level2-Cache, 32 MB "Infinity Cache", 128 Bit GDDR6-Interface (Vollausbau) 3 Raster-Engines, 28 Shader-Cluster, 3584 FP32-Einheiten, 112 TMUs, 28 RT-Cores v2, 112 Tensor-Cores v3, 48 ROPs, 2,25 MB Level2-Cache, 192 Bit GDDR6-Interface (Salvage) 3 Raster-Engines, 24 Shader-Cluster, 3072 FP32-Einheiten, 96 TMUs, 24 RT-Cores v3, 96 Tensor-Cores v4, 48 ROPs, 24 MB Level2-Cache, 128 Bit GDDR6-Interface (Salvage) 3 Raster-Engines, 34 Shader-Cluster, 4352 FP32-Einheiten, 136 TMUs, 34 RT-Cores v3, 136 Tensor-Cores v4, 48 ROPs, 32 MB Level2-Cache, 128 Bit GDDR6-Interface (Salvage)
Taktraten 1720/2250/2625 MHz & 18 Gbps 1320/1777 MHz & 15 Gbps 1830/2460 MHz & 17 Gbps 2310/2535 MHz & 18 Gbps
Rohleistungen 21,5 TFlops & 288 GB/sec 12,7 TFlops & 360 GB/sec 15,1 TFlops & 272 GB/sec 22,1 TFlops & 288 GB/sec
Speicherausbau 8 GB GDDR6 12 GB GDDR6 8 GB GDDR6 8 GB GDDR6
Anbindung PCI Express 4.0 x8 PCI Express 4.0 x16 PCI Express 4.0 x8 PCI Express 4.0 x8
Ref./Herst./OC / / / / / / / /
Layout Dual/TripleSlot Dual/TripleSlot Dual/TripleSlot Dual/TripleSlot
Kartenlänge AIBs: 20,0-30,5cm AIBs: 17,0-32,3cm AIBs: 17,0-29,9cm FE: 24,5cm
AIBs: 17,0-33,8cm
Stromstecker AIBs: 1x 8pol. AIBs: 1x 8pol. AIBs: 1x 8pol. FE: 1x 16pol.
AIBs: 1x 8pol.
off. Verbrauch 165W 170W 115W 160W
Ausgänge HDMI 2.1a, 3x DisplayPort 2.1 HDMI 2.1, 3x DisplayPort 1.4a HDMI 2.1a, 3x DisplayPort 1.4a HDMI 2.1a, 3x DisplayPort 1.4a
Listenpreis $269 / 299€ $329 / 329€ $299 / 329€ $399 / 439€
Release 25. Mai 2023 25. Februar 2021 29. Juni 2023 24. Mai 2023

Die Ermittlung der Real-Taktraten ergibt den seltenen Fall von stark voneinander abweichenden Ergebnissen: Im Maximum sind es 100 MHz Differenz zwischen allen drei Quellen, selbst wenn sich daraus mit ~2.7 GHz natürlich dennoch ein gewisser Mittelwert bilden läßt. Interessantweise weicht selbst die Taktraten-Tendenz gegenüber der GeForce RTX 4060 Ti bei allen drei Quellen stark voneinander ab: Bei der ComputerBase taktet die 4060 leicht schneller als die 4060Ti, bei TechPowerUp liegt die 4060 kräftig zurück, bei der PC Games Hardware hingegen mittelmäßig zurück. Denkbarerweise ist dies eine Auswirkung des Fehlens von Founders-Edition-Modellen, denn bei den Hersteller-Designs sind solcherart Taktraten-Differenzen durchaus "normal" – selbst wenn dabei am Ende oftmals nur eine minimal unterschiedliche Performance herauskommt.

Basis Durchschnitt Max gemessener Realtakt
AMD-Bezeichnung: "Base Clock" "Game Clock" "Boost Clock" "Max Clock" CB TPU PCGH
Radeon RX 7900 XTX 1900 MHz 2300 MHz 2500 MHz ? 2556 MHz 2612 MHz 2.60 GHz
Radeon RX 7900 XT 1500 MHz 2000 MHz 2400 MHz ? 2566 MHz 2687 MHz 2.40 GHz
Radeon RX 7600 1720 MHz 2250 MHz 2625 MHz ? 2645 MHz 2613 MHz 2.61 GHz
Radeon RX 6950 XT 1890 MHz 2100 MHz 2310 MHz ? 2392 MHz 2405 MHz 2.42 GHz
Radeon RX 6900 XT 1825 MHz 2015 MHz 2250 MHz ? 2265 MHz 2233 MHz 2.30 GHz
Radeon RX 6800 XT 1825 MHz 2015 MHz 2250 MHz ? 2216 MHz 2257 MHz 2.34 GHz
Radeon RX 6800 1700 MHz 1815 MHz 2105 MHz ? 2177 MHz 2205 MHz 2.20 GHz
Radeon RX 6750 XT 2150 MHz 2495 MHz 2600 MHz ? 2683 MHz - 2.63 GHz
Radeon RX 6700 XT 2321 MHz 2424 MHz 2581 MHz ? 2531 MHz 2491 MHz 2.54 GHz
Radeon RX 6650 XT 2055 MHz 2410 MHz 2635 MHz ? 2601 MHz - 2.68 GHz
Radeon RX 6600 XT 1968 MHz 2359 MHz 2589 MHz ? 2562 MHz - 2.58 GHz
Radeon RX 6600 1626 MHz 2044 MHz 2491 MHz ? 2509 MHz 2444 MHz 2.51 GHz
Radeon RX 6500 XT 2310 MHz 2610 MHz 2815 MHz ? 2753 MHz - 2.82 GHz
nVidia-Bezeichnung: "Base Clock" "Boost Clock" "Max Clock" CB TPU PCGH
GeForce RTX 4090 2235 MHz 2520 MHz ? 2744 MHz 2701 MHz 2.74 GHz
GeForce RTX 4080 2205 MHz 2505 MHz ? 2725 MHz 2737 MHz 2.78 GHz
GeForce RTX 4070 Ti 2310 MHz 2610 MHz ? 2802 MHz - 2737 MHz
GeForce RTX 4070 1920 MHz 2475 MHz ? 2758 MHz 2762 MHz 2769 MHz
GeForce RTX 4060 Ti 2310 MHz 2535 MHz ? 2714 MHz 2767 MHz 2.74 GHz
GeForce RTX 4060 1830 MHz 2460 MHz ? 2738 MHz 2640 MHz 2.69 GHz
GeForce RTX 3090 Ti 1560 MHz 1860 MHz ? 1936 MHz 1979 MHz 2.00 GHz
GeForce RTX 3090 1400 MHz 1700 MHz ? 1754 MHz - 1.88 GHz
GeForce RTX 3080 Ti 1365 MHz 1665 MHz ? 1784 MHz 1780 MHz 1.80 GHz
GeForce RTX 3080 12GB 1260 MHz 1710 MHz ? - - 1.80 GHz
GeForce RTX 3080 10GB 1450 MHz 1710 MHz ? 1827 MHz 1931 MHz 1.90 GHz
GeForce RTX 3070 Ti 1575 MHz 1770 MHz ? 1878 MHz 1861 MHz 1.88 GHz
GeForce RTX 3070 1500 MHz 1725 MHz ? 1920 MHz 1882 MHz 1.86 GHz
GeForce RTX 3060 Ti 1410 MHz 1665 MHz ? 1900 MHz 1877 MHz 1.83 GHz
GeForce RTX 3060 1320 MHz 1777 MHz ? - - 1.87 GHz
GeForce RTX 3050 1552 MHz 1777 MHz ? 1891 MHz 1906 MHz 1.89 GHz
Intel-Bezeichnung: - "Graphics Clock" "Max Clock" CB TPU PCGH
Arc A770 "LE" - 2100 MHz 2400 MHz - 2386 MHz 2.33 GHz
Arc A750 - 2050 MHz 2400 MHz - 2394 MHz 2.39 GHz
Realtakt-Angaben gemäß den Ausarbeitungen der ComputerBase (Ø 11-20 Spiele) und von TechPowerUp (Ø 22-25 Spiele) sowie den Praxis-Angaben der PC Games Hardware (neuere, MHz-genaue Werte: Ø 20 Spiele) von jeweils Referenz-Varianten (oder auf Referenz-Taktung/TDP laufend)