Mit der GeForce RTX 3070 hat nVidia bereits seine dritte Ampere-Grafikkarte und die erste auf Basis eines anderen Grafikchips als dem bisher benutzten "GA102" vorgestellt. Ausgehend vom kleineren GA104-Chip geht die GeForce RTX 3070 zu einem Listenpreis von 499 Dollar in einen klar niedrigeren und damit breitere Käuferschichten ansprechenden Preisbereich, soll aber dennoch die Performance der GeForce RTX 2080 Ti erreichen bzw. laut nVidia sogar (leicht) schlagen. Aber auch wenn nur das erstere Ziel wirklich in Reichweite ist, ergibt dies gegenüber der Turing-Generation doch einen enormen Preis/Leistungs-Schub, denn jenes frühere Spitzenmodell stand mal für 1199 Dollar in nVidias Preisliste. Wie nahe die GeForce RTX 3070 der GeForce RTX 2080 Ti wirklich kommt, soll nachfolgend anhand der durch die Launch-Reviews aufgestellten Performance-Werte genauer bestimmt werden. Zugleich dient dieser Artikel auch einer generellen Performance-Neueinordnung der HighEnd- und Enthusiasten-Grafikkarten von RDNA1, Turing & Ampere.
Der für die GeForce RTX 3070 herangezogene GA104-Chip ist mit 17,4 Mrd. Transistoren kaum weniger dick als der TU102-Chip der GeForce RTX 2080 Ti mit 18,6 Mrd. Transistoren – wobei der Vergleich der Chipflächen von 392mm² zu 754mm² anzeigt, dass Samsungs 8nm-Fertigung wenigstens in der Frage der Packdichte sehr wohl erhebliche Vorteile bieten kann. Von jenem GA104-Chip benutzt nVidia für die GeForce RTX 3070 mit 46 von maximal möglich 48 Shader-Clustern eine minimale Abspeckung, ansonsten sind alle physikalisch vorhandenen Hardware-Einheiten bei der GeForce RTX 3070 mit an Bord bzw. aktiv. Als deutliche Differenz zum GA102-Chip gibt es keinen GDDR6X-Speicher, womit die Speicherbandbreite der GeForce RTX 3070 deutlich niedriger ausfällt als bei den GA102-basierten Grafikkarten GeForce RTX 3080 & 3090.
nVidia "Ampere" GA104 | nVidia "Ampere" GA102 | |
---|---|---|
Chip | 17,4 Mrd. Transistoren auf 392mm² Chipfläche in der 8nm-Fertigung von Samsung | 28,3 Mrd. Transistoren auf 628mm² Chipfläche in der 8nm-Fertigung von Samsung |
Hardware | 6 Raster-Engines, 48 Shader-Cluster, 6144 FP32-Einheiten, 192 TMUs, 48 RT-Cores v2, 192 Tensor-Cores v3, 96 ROPs, 4 MB Level2-Cache, 256 Bit GDDR6-Interface | 7 Raster-Engines, 84 Shader-Cluster, 10752 FP32-Einheiten, 336 TMUs, 84 RT-Cores v2, 336 Tensor-Cores v3, 112 ROPs, 6 MB Level2-Cache, 384 Bit GDDR6X-Interface |
NVLink & SLI | - | NVLink nur bei der GeForce RTX 3090, kein Support für "implicit SLI" mehr |
verbaut bei | GeForce RTX 3060 Ti & 3070 (beide Salvage) | GeForce RTX 3080 & 3090 (beide Salvage) |
Turing-Vorgänger | TU104, 13,6 Mrd. Transistoren auf 545mm² Chipfläche in der 12nm-Fertigung von TSMC, 6 Raster-Engines, 48 Shader-Cluster, 3072 FP32-Einheiten, 192 TMUs, 48 RT-Cores v1, 384 Tensor-Cores v2, 64 ROPs, 4 MB Level2-Cache, 256 Bit GDDR6-Interface, verbaut bei GeForce RTX 2070 Super, 2080 & 2080 Super | TU102, 18,6 Mrd. Transistoren auf 754mm² Chipfläche in der 12nm-Fertigung von TSMC, 6 Raster-Engines, 72 Shader-Cluster, 4608 FP32-Einheiten, 288 TMUs, 72 RT-Cores v1, 576 Tensor-Cores v2, 96 ROPs, 6 MB Level2-Cache, 384 Bit GDDR6-Interface, verbaut bei GeForce RTX 2080 Ti & Titan RTX |
Pascal-Vorgänger | GP104, 7,2 Mrd. Transistoren auf 314mm² Chipfläche in der 16nm-Fertigung von TSMC, 4 Raster-Engines, 20 Shader-Cluster, 2560 FP32-Einheiten, 160 TMUs, 64 ROPs, 2 MB Level2-Cache, 256 Bit GDDR5X-Interface, verbaut bei GeForce GTX 1070, 1070 Ti & 1080 | GP102, 12 Mrd. Transistoren auf 471mm² Chipfläche in der 16nm-Fertigung von TSMC, 6 Raster-Engines, 30 Shader-Cluster, 3840 FP32-Einheiten, 256 TMUs, 96 ROPs, 3 MB Level2-Cache, 384 Bit GDDR5X-Interface, verbaut bei GeForce GTX 1080 Ti, Titan X & Titan Xp |
Interessant ist die Ansetzung von gleich 6 Raster-Engines und damit 96 ROPs beim GA104-Chip (die Anzahl der ROPs korreliert unter der Ampere-Architektur direkt mit der Anzahl der Raster-Engines, im Gegensatz zu früheren nVidia-Architekturen). Dies sind nur unwesentlich weniger als die 7 Raster-Engines und 112 ROPs des GA102-Chips – und sogar komplett gleich zur GeForce RTX 3080, welche auf dieselben 6 Raster-Engines und 96 ROPs wie die GeForce RTX 3070 abgespeckt ist. Damit kann die GeForce RTX 3070 sicherlich einiges vom enormen Unterschied bei der FP32-Rechenleistung kaschieren, welcher bei +47% zugunsten der GeForce RTX 3080 bzw. −32% zuungunsten der GeForce RTX 3070 steht.
Im Gegensatz zu den leicht überkandidelten GA102-Grafikkarten kommt die GeForce RTX 3070 mit normalen Abmesssungen daher: Die Founders Edition mißt 24,5cm, ist ein gewöhnliches 2-Slot-Design und verbraucht offiziell 220 Watt. Die Herstellermodelle zur GeForce RTX 3070 gibt es dann natürlich auch mit allen möglichen anderen Abmessungen, sowohl (etwas) kleinere als auch größere. Als Problempunkt schickt nVidia die GeForce RTX 3070 allerdings mit nur 8 GB Grafikkartenspeicher ins Rennen. Jene Speichermenge resultiert formell natürlich aus der Verwendung eines 256bittigen Speicherinterfaces, welches mit derzeitig verfügbaren Speicherchips eben nur Bestückungen von 8 oder 16 GB zuläßt. Im Sinne eines Nachfolgers der 2070er Serie mag dies gerade noch so angehen, im Sinne eines Ersatz' der GeForce RTX 2080 Ti erscheint dies jedoch als zu knapp gedacht.
GeForce RTX 2080 Ti | GeForce RTX 3070 | GeForce RTX 3080 | GeForce RTX 3090 | |
---|---|---|---|---|
Chipbasis | nVidia TU102-300 | nVidia GA104-300 | nVidia GA102-200 | nVidia GA102-300 |
Fertigung | 18,6 Mrd. Transistoren auf 754mm² in der 12nm-Fertigung von TSMC | 17,4 Mrd. Transistoren auf 392mm² in der 8nm-Fertigung von Samsung | 28,3 Mrd. Transistoren auf 628mm² in der 8nm-Fertigung von Samsung | |
Architektur | nVidia Turing, DirectX 12 Feature-Level 12_2 | alle drei Ampere-Beschleuniger: nVidia Ampere, DirectX 12 Feature-Level 12_2 | ||
Features | für alle gelisteten Modelle: DirectX 12, OpenGL, Vulkan, Asynchonous Compute, RayTracing, DSR, DLSS, PhysX, G-Sync, FreeSync | |||
Technik | 6 Raster-Engines, 68 Shader-Cluster, 4352 FP32-Einheiten, 272 TMUs, 68 RT-Cores v1, 544 Tensor-Cores v2, 88 ROPs, 5.5 MB Level2-Cache, 352 Bit GDDR6-Interface (Salvage) | 6 Raster-Engines, 46 Shader-Cluster, 5888 FP32-Einheiten, 184 TMUs, 46 RT-Cores v2, 184 Tensor-Cores v3, 96 ROPs, 4 MB Level2-Cache, 256 Bit GDDR6-Interface (Salvage) | 6 Raster-Engines, 68 Shader-Cluster, 8704 FP32-Einheiten, 272 TMUs, 68 RT-Cores v2, 272 Tensor-Cores v3, 96 ROPs, 5 MB Level2-Cache, 320 Bit GDDR6X-Interface (Salvage) | 7 Raster-Engines, 82 Shader-Cluster, 10496 FP32-Einheiten, 328 TMUs, 82 RT-Cores v2, 328 Tensor-Cores v3, 112 ROPs, 6 MB Level2-Cache, 384 Bit GDDR6X-Interface (Salvage) |
Taktraten | Ref: 1350/1545 MHz & 14 Gbps FE: 1350/1635 MHz & 14 Gbps |
1500/1725 MHz & 14 Gbps | 1450/1710 MHz & 19 Gbps | 1400/1700 MHz & 19,5 Gbps |
Rohleistungen | Ref: 13,4 TFlops & 616 GB/sec FE: 14,2 TFlops & 616 GB/sec |
20,3 TFlops & 448 GB/sec | 29,8 TFlops & 760 GB/sec | 35,7 TFlops & 936 GB/sec |
Speicherausbau | 11 GB GDDR6 | 8 GB GDDR6 | 10 GB GDDR6X | 24 GB GDDR6X |
Anbindung | PCI Express 3.0 | PCI Express 4.0 | PCI Express 4.0 | PCI Express 4.0 |
FE/Herst./OC | ✓ / ✓ / ✓ | ✓ / ✓ / ✓ | ✓ / ✓ / ✓ | ✓ / ✓ / ✓ |
Layout | Dual/TripleSlot | Dual/TripleSlot | Dual/TripleSlot | Dual/TripleSlot |
Kartenlänge | Herst: 26,5-33,0cm FE: 27,0cm |
Herst: 23,2-32,3cm FE: 24,5cm |
Herst: 27,4-32,3cm FE: 28,5cm |
Herst: 28,5-33,5cm FE: 31,3cm |
Stromstecker | 2x 8pol. | 1x 12pol. | 1x 12pol. | 1x 12pol. |
off. Verbrauch | Ref: 250W — FE: 260W | 220W | 320W | 350W |
realer Verbr. | FE: 272W | FE: 219W | FE: 325W | FE: 356W |
Ausgänge | HDMI 2.0b, 3x DisplayPort 1.4, VirtualLink per USB Type C | alle drei Ampere-Beschleuniger: HDMI 2.1, 3x DisplayPort 1.4 | ||
FullHD Perf.Index | Ref: 1540% — FE: 1580% | 1590% | 1900% | 2030% |
4K Perf.Index | Ref: 239% — FE: 247% | 245% | 328% | 367% |
Listenpreis | Ref: $999 — FE: $1199 | $499 | $699 | $1499 |
Straßenpreis | 1100-1420€ (Auslauf) | Herst: 650-850€ — FE: 499€ | Herst: 880-1080€ — FE: 699€ | Herst: 1700-2200€ — FE: 1499€ |
Release | 19. September 2018 | 29. Oktober 2020 | 17. September 2020 | 24. September 2020 |
Wie bei GeForce RTX 3080 & 3090 war auch die GeForce RTX 3070 umgehend nach Marktstart vom 29. Oktober 2020 vergriffen (und ist es noch), in der Folge dessen ist eine Betrachtung zum aktuellen Straßenpreis kaum sinnvoll: Jener ist derzeit komplett übertrieben, wird sich aber nach Besserung der Verfügbarkeit voraussichtlich wieder in Richtung des Listenpreises bewegen. Zugleich sind die oberen Teile des früheren Turing-Portfolios inzwischen längst auf Auslaufstatus und derzeit nur noch als Restposten erhältlich, womit auch zu diesen Karten ein aktueller Straßenpreis nicht mehr zu ermitteln ist. Alle nachfolgenden Preis/Leistungs-Betrachtungen beziehen sich damit auf den US-Listenpreis als zumeist solide Orientierungs-Größe, welche zu normalen Zeiten auch ziemlich gut (nach Währungs-Umrechnung und Mehrwersteuer-Aufschlag) in den deutschen Straßenpreisen wiederzufinden ist.
Nachdem sich die vorherigen Launch-Analysen zu GeForce RTX 3080 & 3090 primär auf die 4K-Performance konzentriert haben bzw. nur eine Kurzfassung zur FullHD- und WQHD-Performance der neuen Grafikkarten boten, wird mittels dieser Launch-Analyse nunmehr eine komplette Aufstellung zur FullHD- und WQHD-Performance nachgeholt. Dies ist zum einen speziell für die GeForce RTX 3070 wichtig, da jene wegen der Speichermengen-Problematik kaum gut geeignet für die UltraHD-Auflösung erscheint. Genauso wichtig ist dies aber auch für die mit dieser Launch-Analyse zu leistenden Performance-Neubewertung der früheren HighEnd- und Enthusiasten-Grafikkarten. Zu jenen hatten sich schon im Zuge der Launch-Analyse zur GeForce RTX 3080 klar verbesserte Performance-Werte gezeigt, speziell im Vergleich zur Vor-Vor-Generation "Pascal" in Form der GeForce GTX 1080 Ti. Demzufolge wurden für die nachfolgenden Performance-Auswertungen inbesondere Launch-Reviews mit vollständigen Resultaten unter allen drei Auflösungen sowie der Beteilung von möglichst vielen Grafikkarten herangezogen.
FullHD-Performance | 5700 | 5700XT | R7 | 1080Ti | 2060S | 2070S | 2080S | 2080Ti | 3070 | 3080 | 3090 |
---|---|---|---|---|---|---|---|---|---|---|---|
Generation & Speicher | RDNA1, 8GB | RDNA1, 8GB | Vega, 16GB | Pascal, 11GB | Turing, 8GB | Turing, 8GB | Turing, 8GB | Turing, 11GB | Ampere, 8GB | Ampere, 10GB | Ampere, 24GB |
ComputerBase (17 Tests) | - | 70,4% | 69,8% | 72,9% | - | 75,9% | 85,0% | 98,0% | 100% | 119,0% | 125,0% |
Golem (10 Tests) | - | 74,3% | - | 68,7% | - | - | - | 97,7% | 100% | 115,5% | - |
Igor's Lab (10 Tests) | 68,5% | 75,8% | 74,2% | - | 69,3% | 77,5% | 84,1% | 92,9% | 100% | 110,6% | - |
KitGuru (11 Tests) | 64,4% | 72,3% | 73,6% | 76,2% | - | 77,9% | 88,0% | 101,6% | 100% | 119,0% | - |
Overclockers Club (13 Tests) | - | 74,0% | - | - | 68,3% | 78,0% | 85,7% | 99,1% | 100% | 112,1% | - |
PC Games Hardware (20 Tests) | 62,7% | 72,1% | 72,1% | 75,0% | 64,0% | 76,9% | 86,5% | 99,8% | 100% | 123,4% | 132,6% |
PurePC (8 Tests) | - | 71,4% | 72,8% | 71,7% | - | 76,7% | 86,9% | 99,8% | 100% | 126,0% | 139,4% |
SweClockers (12 Tests) | 64,6% | 73,1% | 73,8% | 73,1% | 64,6% | 76,9% | 87,7% | 100,8% | 100% | 124,6% | 134,6% |
TechPowerUp (23 Tests) | 68% | 75% | 76% | 77% | 69% | 80% | 89% | 101% | 100% | 116% | 121% |
Tom's Hardware (9 Tests) | 69,0% | 76,2% | - | - | - | 80,4% | 89,3% | 101,4% | 100% | 119,4% | 126,9% |
Tweakers (10 Tests) | - | 78,5% | - | - | 71,2% | 81,3% | 89,1% | 99,0% | 100% | 113,0% | - |
gemittelte FullHD-Performance | 65,3% | 73,2% | 73,6% | 74,4% | 66,5% | 77,5% | 86,9% | 99,6% | 100% | 119,4% | 127,6% |
Listenpreis | $349 | $399 | $699 | $699 | $399 | $499 | $699 | $1199 | $499 | $699 | $1499 |
TDP (TBP/GCP) | 175W | 225W | 300W | 250W | 175W | 215W | 250W | 260W | 220W | 320W | 350W |
Performance-Durchschnitt gemäß geometrischem Mittel, gewichtet zugunsten jener Hardwaretests mit höherer Benchmark-Anzahl und mehr Vergleichs-Hardware; ausschließlich FE/Referenz-Modelle; gesamte ausgewertete Benchmark-Anzahl: ca. 1310 |
Im Vergleich zwischen GeForce RTX 2080 Ti und GeForce RTX 3070 legt die neue Ampere-Karte unter der FullHD-Auflösung eine Punktlandung mit einer gemittelt +0,4% besseren Performance hin. Dies kann je nach Testbericht etwas abweichen, allerdings liegt die üblichen Abweichungen nur bei 1-2% Prozentpunkten – allein Igor's Lab fallen mit einer gleich 7%igen Differenz zugunsten der GeForce RTX 3070 etwas aus dem Rahmen. Gegenüber der (nominell) gleichpreisigen GeForce RTX 2070 Super wird eine Mehrperformance von +29% erzielt, währenddessen die GeForce RTX 3080 ihrerseits +19% sowie die GeForce RTX 3090 dann +28% auf die GeForce RTX 3070 oben drauf legt. Insbesondere an der absoluten Leistungsspitze fallen die Ergebnis-Differenzen unter der FullHD-Auflösung bedingt durch CPU-Limitierungen somit spürbar geringer aus – womit es sich kaum lohnt, echte Spitzen-Grafikkarten als FullHD-Beschleuniger zu benutzen.