Mit der GeForce RTX 3060 hat nVidia am 25. Februar 2021 die nunmehr fünfte Gaming-Grafikkarte auf Basis der Ampere-Architektur ins Rennen geschickt. Jene soll nominell das Preisfeld von 329 Dollar/Euro beackern, geht also (genauso nominell) ins untere Midrange-Segment. Wie bekannt, wurde auch diese neue Grafikkarte umgehend nach Launch ausverkauft bzw. wird derzeit nur zu weit überzogenen Preisen angeboten. Eine echte Einordnung ins Preis/Leistungs-Gefüge ist (mangels dessen Existenz) damit derzeit leider nicht möglich, es bleibt allein der Trockentest der reinen Performance-Einordnung. Jener soll nachfolgend anhand der vorliegenden Benchmarks der Launchreviews unter FullHD, WQHD, 4K und RayTracing angegangen werden.
Für die GeForce RTX 3060 setzt nVidia den neuen GA106-Chip an, welcher bisher im Desktop-Segment noch keine Verwendung fand (sondern nur im Mobile-Segment bei der zum Jahresanfang vorgestellten GeForce RTX 3060 Laptop). Mit dem GA106-Chip reduziert nVidia gegenüber dem innerhalb der Ampere-Generation darüberliegenden GA104-Chip (von GeForce RTX 3060 Ti & 3070), die Anzahl der Shader-Cluster von 48 auf 30, das Speicherinterface geht zudem von 256 Bit auf 192 Bit zurück. Beachtbar und selten thematisiert ist hierbei auch der Rückgang an Raster- und ROP-Power, welcher zwischen GA106- und GA104-Chip mit 3 anstatt 6 Raster-Engines sowie 48 anstatt 96 ROPs doch ziemlich harsch ausfällt. Dafür geht es dann aber auch bei der Chipfläche stark nach unten: Für den GA106 stehen nur 276mm² Chipfläche zu Buche, im Gegensatz zu den immerhin 392mm² des GA104-Chips (beiderseits unter der 8nm-Fertigung von Samsung).
nVidia "Ampere" GA106 | nVidia "Ampere" GA104 | nVidia "Ampere" GA102 | |
---|---|---|---|
Chip | 12,0 Mrd. Transistoren auf 276mm² Chipfläche in der 8nm-Fertigung von Samsung | 17,4 Mrd. Transistoren auf 392mm² Chipfläche in der 8nm-Fertigung von Samsung | 28,3 Mrd. Transistoren auf 628mm² Chipfläche in der 8nm-Fertigung von Samsung |
Hardware | 3 Raster-Engines, 30 Shader-Cluster, 3840 FP32-Einheiten, 120 TMUs, 30 RT-Cores v2, 120 Tensor-Cores v3, 48 ROPs, 2,25 MB Level2-Cache, 192 Bit GDDR6-Interface | 6 Raster-Engines, 48 Shader-Cluster, 6144 FP32-Einheiten, 192 TMUs, 48 RT-Cores v2, 192 Tensor-Cores v3, 96 ROPs, 4 MB Level2-Cache, 256 Bit GDDR6-Interface | 7 Raster-Engines, 84 Shader-Cluster, 10752 FP32-Einheiten, 336 TMUs, 84 RT-Cores v2, 336 Tensor-Cores v3, 112 ROPs, 6 MB Level2-Cache, 384 Bit GDDR6X-Interface |
NVLink & SLI | nicht verfügbar | nicht verfügbar | NVLink nur bei der GeForce RTX 3090, kein Support für "implicit SLI" mehr |
verbaut bei | GeForce RTX 3060 (Salvage), GeForce RTX 3060 Laptop (Vollausbau) | GeForce RTX 3060 Ti, 3070 & 3070 Laptop (alle Salvage), GeForce RTX 3080 Laptop (Vollausbau) | GeForce RTX 3080 & 3090 (beide Salvage) |
Blockdiagramm | |||
Turing-Vorgänger | TU106, 10,6 Mrd. Transistoren auf 445mm² Chipfläche in der 12nm-Fertigung von TSMC, 3 Raster-Engines, 36 Shader-Cluster, 2304 FP32-Einheiten, 144 TMUs, 36 RT-Cores v1, 288 Tensor-Cores v2, 64 ROPs, 4 MB Level2-Cache, 256 Bit GDDR6-Interface, verbaut bei GeForce RTX 2060, 2060 Super & 2070 TU116, 6,6 Mrd. Transistoren auf 284mm² Chipfläche in der 12nm-Fertigung von TSMC, 3 Raster-Engines, 24 Shader-Cluster, 1536 FP32-Einheiten, 96 TMUs, 48 ROPs, 1,5 MB Level2-Cache, 192 Bit GDDR6-Interface, verbaut bei GeForce GTX 1650 Super, 1660, 1660 Super & 1660 Ti |
TU104, 13,6 Mrd. Transistoren auf 545mm² Chipfläche in der 12nm-Fertigung von TSMC, 6 Raster-Engines, 48 Shader-Cluster, 3072 FP32-Einheiten, 192 TMUs, 48 RT-Cores v1, 384 Tensor-Cores v2, 64 ROPs, 4 MB Level2-Cache, 256 Bit GDDR6-Interface, verbaut bei GeForce RTX 2070 Super, 2080 & 2080 Super | TU102, 18,6 Mrd. Transistoren auf 754mm² Chipfläche in der 12nm-Fertigung von TSMC, 6 Raster-Engines, 72 Shader-Cluster, 4608 FP32-Einheiten, 288 TMUs, 72 RT-Cores v1, 576 Tensor-Cores v2, 96 ROPs, 6 MB Level2-Cache, 384 Bit GDDR6-Interface, verbaut bei GeForce RTX 2080 Ti & Titan RTX |
Pascal-Vorgänger | GP106, 4,4 Mrd. Transistoren auf 200mm² Chipfläche in der 16nm-Fertigung von TSMC, 2 Raster-Engines, 10 Shader-Cluster, 1280 FP32-Einheiten, 80 TMUs, 48 ROPs, 1.5 MB Level2-Cache, 192 Bit GDDR5-Interface, verbaut bei GeForce GTX 1060 | GP104, 7,2 Mrd. Transistoren auf 314mm² Chipfläche in der 16nm-Fertigung von TSMC, 4 Raster-Engines, 20 Shader-Cluster, 2560 FP32-Einheiten, 160 TMUs, 64 ROPs, 2 MB Level2-Cache, 256 Bit GDDR5X-Interface, verbaut bei GeForce GTX 1070, 1070 Ti & 1080 | GP102, 12 Mrd. Transistoren auf 471mm² Chipfläche in der 16nm-Fertigung von TSMC, 6 Raster-Engines, 30 Shader-Cluster, 3840 FP32-Einheiten, 256 TMUs, 96 ROPs, 3 MB Level2-Cache, 384 Bit GDDR5X-Interface, verbaut bei GeForce GTX 1080 Ti, Titan X & Titan Xp |
Der GA106-Chip geht damit bei nVidia eher wieder in Richtung früherer Midrange-Chips – wie dem GP106 aus der Pascal-Generation (oder auch dem GM206 der Maxwell-Generation), welche vergleichsweise stark abgespeckt waren und beiderseits nur ein 192-Bit-Speicherinterface mitbrachten. Innerhalb der Turing-Generation gab es zwar den TU106-Chip, jener bringt jedoch nominell mehr Shader-Cluster und ein breiteres Speicherinterface (als der GA106) auf die Waage, womit der passendere Vergleich innerhalb der Turing-Generation eher der TU116-Chip darstellt – auch wiederum nur mit 192-Bit-Speicherinterface ausgerüstet. Selbiges verhindert dann den Einsatz von 4/8/16 GB Grafikkartenspeicher, sondern kommt nur mit 3/6/12/24 GB zurecht. Diese Frage hatte nVidia in den beiden Vorgänger-Generationen jeweils mit "6 GB" beantwortet, bei der Ampere-Generation erfolgt nun erstmals der Schritt zu mehr Speicher – und somit erhielt die GeForce RTX 3060 gleich 12 GB Grafikkartenspeicher.
Dies führt natürlich zur leicht irritierenden Situation, dass die GeForce RTX 3060 nVidia-intern mehr Grafikkartenspeicher mitbringt als die drei nächstteuren Ampere-Lösungen – GeForce RTX 3060 Ti & 3070 mit jeweils 8 GB und GeForce RTX 3080 mit 10 GB müssen hierbei hintenanstehen. Wahrscheinlich war diese Speicherbestückung auch ursprünglich nicht derart geplant (ansonsten hätte man den anderen Ampere-Karten gleich mehr mitgegeben oder aber sich um 1,5-Gigabyte-Speicherchips bemüht), sondern stellt eine Vorab-Reaktion auf AMDs kommende Midrange-Lösungen auf Basis des Navi-22-Chips dar – welche auf Basis von dessen 192-Bit-Speicherinterface ebenfalls mit 12 GB Grafikkartenspeicher antreten werden. Diese Speicherbestückung mag angesichts des Performance-Profils der GeForce RTX 3060 vielleicht etwas übertrieben erscheinen, stellt aber dennoch die (weitaus) bessere Wahl gegenüber der einzigen (direkt gangbaren) Alternative von nur 6 GB Grafikkartenspeicher dar.
Die aus dem GA106-Chip geschnitzte GeForce RTX 3060 benutzt dann nicht den Vollausbau des zugrundeliegenden Grafikchips, sondern kommt mit zwei Shader-Clustern weniger daher – wie bisher alle (nahe am Vollausbau liegenden) Desktop-Lösungen innerhalb der Ampere-Generation. Ansonsten gibt es keine weiteren Abspeckungen gegenüber dem Vollausbau des GA106-Chips, welchen es derzeit nur bei der GeForce RTX 3060 Laptop in Aktion zu sehen gibt. Der GA106-Chip dürfte von nVidia nachfolgend sicherlich noch zu einer weiteren GA106-basierten Grafikkarte mit vermutlich größeren Hardware-Abspeckungen (vielleicht 22-24 Shader-Cluster) und dann tatsächlich nur 6 GB Grafikkartenspeicher benutzt werden. Inwiefern sich die hieraus resultierende Grafikkarte dann "GeForce RTX 3050 Ti" oder "GeForce RTX 3060 6GB" nennen wird, ist jedoch immer noch nicht heraus.
Radeon RX 5700 XT | GeForce RTX 3060 | GeForce RTX 3060 Ti | GeForce RTX 3070 | |
---|---|---|---|---|
Chipbasis | AMD Navi 10 XT | nVidia GA106-300 | nVidia GA104-200 | nVidia GA104-300 |
Fertigung | 10,3 Mrd. Transistoren auf 251mm² in der 7nm-Fertigung von TSMC | 12,0 Mrd. Transistoren auf 276mm² in der 8nm-Fertigung von Samsung | 17,4 Mrd. Transistoren auf 392mm² in der 8nm-Fertigung von Samsung | |
Architektur | AMD RDNA1, DirectX 12 Feature-Level 12_1 | nVidia Ampere, DirectX 12 Feature-Level 12_2 | ||
Features | DirectX 12, OpenGL, Vulkan, Asynchonous Compute, VSR, FreeSync, TrueAudio Next, XConnect | DirectX 12, OpenGL, Vulkan, Asynchonous Compute, RayTracing, DSR, DLSS, PhysX, G-Sync, FreeSync | ||
Technik | 4 Raster-Engines, 40 Shader-Cluster, 2560 FP32-Einheiten, 160 TMUs, 64 ROPs, 4 MB Level2-Cache, 256 Bit GDDR6-Interface (Vollausbau) | 3 Raster-Engines, 28 Shader-Cluster, 3584 FP32-Einheiten, 112 TMUs, 28 RT-Cores v2, 112 Tensor-Cores v3, 48 ROPs, 2,25 MB Level2-Cache, 192 Bit GDDR6-Interface (Salvage) | 5 Raster-Engines, 38 Shader-Cluster, 4864 FP32-Einheiten, 152 TMUs, 38 RT-Cores v2, 152 Tensor-Cores v3, 80 ROPs, 4 MB Level2-Cache, 256 Bit GDDR6-Interface (Salvage) | 6 Raster-Engines, 46 Shader-Cluster, 5888 FP32-Einheiten, 184 TMUs, 46 RT-Cores v2, 184 Tensor-Cores v3, 96 ROPs, 4 MB Level2-Cache, 256 Bit GDDR6-Interface (Salvage) |
Taktraten | 1605/1755 MHz & 14 Gbps | 1320/1777 MHz & 15 Gbps | 1410/1665 MHz & 14 Gbps | 1500/1725 MHz & 14 Gbps |
Rohleistungen | 9,0 TFlops & 448 GB/sec | 12,7 TFlops & 360 GB/sec | 16,2 TFlops & 448 GB/sec | 20,3 TFlops & 448 GB/sec |
Speicherausbau | 8 GB GDDR6 | 12 GB GDDR6 | 8 GB GDDR6 | 8 GB GDDR6 |
Anbindung | PCI Express 4.0 | PCI Express 4.0 | PCI Express 4.0 | PCI Express 4.0 |
Ref./Herst./OC | ✓ / ✓ / ✓ | ✗ / ✓ / ✓ | ✓ / ✓ / ✓ | ✓ / ✓ / ✓ |
Layout | Dual/TripleSlot | Dual/TripleSlot | Dual/TripleSlot | Dual/TripleSlot |
Kartenlänge | Herst: 23,0-32,6cm Ref: 27,5cm |
Herst: 17,0-32,3cm | Herst: 17,2-32,3cm FE: 24,5cm |
Herst: 21,6-33,7cm FE: 24,5cm |
Stromstecker | 1x 6pol. & 1x 8pol. | 1x 8pol. | 1x 12pol. | 1x 12pol. |
off. Verbrauch | 225W (TBP) | 170W (GCP) | 200W (GCP) | 220W (GCP) |
realer Verbr. | 176W | 172W | 202W | 220W |
Ausgänge | HDMI 2.0b, 3x DisplayPort 1.4 | HDMI 2.1, 3x DisplayPort 1.4 | HDMI 2.1, 3x DisplayPort 1.4 | HDMI 2.1, 3x DisplayPort 1.4 |
FullHD Perf.Index | 1160% | 1110% | 1420% | 1590% |
4K Perf.Index | 163% | 161% | 212% | 245% |
Listenpreis | $399 (UVP: 399€) | $329 (UVP: 329€) | $399 (UVP: 419€) | $499 (UVP: 519€) |
Release | 7. Juli 2019 | 25. Februar 2021 | 2. Dezember 2020 | 29. Oktober 2020 |
Gegenüber den bisherigen Ampere-Grafikkarten legt nVidia für die GeForce RTX 3060 keine eigene Founders Edition auf, die Karte wird somit allein nur von den Grafikkarte-Herstellern angeboten werden. Jene setzen für die GeForce RTX 3060 derzeit gern ihre Layouts für die GeForce RTX 3060 Ti ein – dies geht wohl, weil Speicher-seitig generell 2-Gigabyte-Chips verwendet werden und somit nur 6 der 8 möglichen Speicherplätz eines Platinenlayouts der GeForce RTX 3060 Ti zu besetzen sind. Prinzipiell wären aber auch günstigere Platinen-Layouts denkbar, welche speziell an die GeForce RTX 3060 angepasst sind. Jene könnten später nachfolgen, beispielsweise mit der vorgenannten kleineren GA106-Ausführung, welche für kleinere Preisbereiche gedacht ist und demzufolge einen höheren Kostendruck hat.
Taktraten-mäßig gibt es bei der GeForce RTX 3060 keine wirklichen Überraschungen: Die Karte hat zwar einen vergleichsweise hohen Referenz-Takt, aber die real erzielten Taktraten sind dann doch Ampere-üblich. Die ComputerBase ermittelte durchschnittlich 1938 MHz, TechPowerUp hingegen durchschnittlich 1905 MHz – beiderseits auf einer MSI Gaming X Trio, welche von Haus aus einen um +75 MHz höheren Boosttakt mit sich bringt. Zieht man dies von jenen Messungen ab, bleiben ca. 1850 MHz realer Boosttakt für eine auf Referenz-Niveau laufende GeForce RTX 3060 übrig. Dies ist grob dasselbe Niveau, welches man bereits von den anderen Ampere-Grafikkarten kennt – vielleicht sogar etwas niedriger als jenes, aber dafür sind diese Messungen mit werksübertakteten Herstellerkarten nicht gut genug vergleichbar.
Basis | Durchschnitt | Maximum | durchschnittlicher Realtakt | ||
---|---|---|---|---|---|
AMD-Bezeichnung | "Base Frequency" | "Game Frequency" | "Boost Frequency" | - | - |
Radeon RX 6900 XT | 1825 MHz | 2015 MHz | 2250 MHz | 2800 MHz | CB: 2265 MHz – TPU: 2233 MHz |
Radeon RX 6800 XT | 1825 MHz | 2015 MHz | 2250 MHz | 2577 MHz | CB: 2216 MHz – TPU: 2257 MHz |
Radeon RX 6800 | 1700 MHz | 1815 MHz | 2105 MHz | ? | CB: 2177 MHz – TPU: 2205 MHz |
nVidia-Bezeichnung | "Base Clock" | "Boost Clock" | - | - | |
GeForce RTX 3090 | 1400 MHz | 1700 MHz | ? | TPU: 1754 MHz | |
GeForce RTX 3080 | 1450 MHz | 1710 MHz | 1995 MHz | CB: 1827 MHz – TPU: 1931 MHz | |
GeForce RTX 3070 | 1500 MHz | 1725 MHz | 2040 MHz | CB: 1892 MHz – TPU: 1882 MHz | |
GeForce RTX 3060 Ti | 1410 MHz | 1665 MHz | 2010 MHz | CB: 1900 MHz – TPU: 1877 MHz | |
GeForce RTX 3060 | 1320 MHz | 1777 MHz | ? | keine Messung zum Referenz-Takt verfügbar | |
Realtakt-Angaben gemäß den Ausarbeitungen der ComputerBase (Ø 17 Spiele) und von TechPowerUp (Ø 23 Spiele) |
Stichwort Werksübertaktungen: Ohne Founders Edition wurde der Launch der GeForce RTX 3060 natürlich ausschließlich mit Herstellerkarten bestritten – und jene haben üblicherweise ihr bestes Grafikkarten-Design zu den Hardwaretestern gesandt. Nur wenige Hardwaretester haben es daraufhin auf sich genommen, die Referenz-Performance der GeForce RTX 3060 zu ermitteln – sei es durch Simulation der Referenz-Taktraten oder durch den Test einer Herstellerkarte auf (exaktem) Referenztakt. Dabei ist es (selbstverständlich) jedem Hardwaretester selbst überlassen, wie man diesen Punkt angeht – aber für den Zweck einer Index-Erstellung wird an dieser Stelle natürlich die Performance auf Referenztakt benötigt. Zur Einordnung der Performance-Differenz zwischen Referenztakt und Werksübertakung helfen glücklicherweise die Testberichte von ComputerBase & TechPowerUp weiter, welche Messungen unter beiden Bedingungen vorgenommen haben:
Mehrperformance Herstellerdesigns | Hardware | FullHD/1080p | WQHD/1440p | 4K/2160p |
---|---|---|---|---|
Asus Strix OC @ ComputerBase | Boost 1882 MHz, TDP 170W | +2,7% | - | - |
MSI Gaming X Trio @ ComputerBase | Boost 1852 MHz, TDP 170W | +2,1% | - | - |
EVGA XC Black @ TechPowerUp | Boost 1852 MHz, TDP 170W | +2% | +1% | +2% |
MSI Gaming X Trio @ TechPowerUp | Boost 1852 MHz, TDP 170W | +2% | +2% | +2% |
Palit Dual OC @ TechPowerUp | Boost 1867 MHz, TDP 170W | +2% | +2% | +2% |
Zotac AMP White @ TechPowerUp | Boost 1867 MHz, TDP 170W | +2% | +3% | +2% |
Hinweise: Performance-Werte werden bei TechPowerUp nur gerundet auf volle Zahlen angegeben |
Gut zu erkennen ist, dass die Werksübertaktungen kaum wirklich an Boden gutmachen gegenüber dem Referenztakt – für +4% nominell mehr Boosttakt gibt es üblicherweise nur +2% Mehrperformance. Dies mag vielleicht auch an der limitierten Speicherbandbreite sowie dem einheitlichen TDP-Limit hängen, denn bislang bieten alle Werksübertaktungen durchgehend nur die Standard-TDP von 170 Watt auf – Differenzen gibt es allein beim (zusätzlichen) TDP-Spielraum zum Übertakten. In jedem Fall läßt sich somit für die werksübertakteten GeForce RTX 3060 Modelle die Faustregel aufstellen, dass auf Referenz-TDP und ohne anderen Speichertakt grob die Hälfte eines höheren Boosttakts in Mehrperformance umgesetzt wird. Damit lassen sich auch Benchmarks zu Werksübertaktungen einordnen respektive normalisieren, zu welchen keine exakten Performance-Vergleiche auf Referenztakt vorliegen.