Launch-Analyse nVidia GeForce RTX 3070

Dienstag, 3. November 2020
 / von Leonidas
 

Mit der GeForce RTX 3070 hat nVidia bereits seine dritte Ampere-Grafikkarte und die erste auf Basis eines anderen Grafikchips als dem bisher benutzten "GA102" vorgestellt. Ausgehend vom kleineren GA104-Chip geht die GeForce RTX 3070 zu einem Listenpreis von 499 Dollar in einen klar niedrigeren und damit breitere Käuferschichten ansprechenden Preisbereich, soll aber dennoch die Performance der GeForce RTX 2080 Ti erreichen bzw. laut nVidia sogar (leicht) schlagen. Aber auch wenn nur das erstere Ziel wirklich in Reichweite ist, ergibt dies gegenüber der Turing-Generation doch einen enormen Preis/Leistungs-Schub, denn jenes frühere Spitzenmodell stand mal für 1199 Dollar in nVidias Preisliste. Wie nahe die GeForce RTX 3070 der GeForce RTX 2080 Ti wirklich kommt, soll nachfolgend anhand der durch die Launch-Reviews aufgestellten Performance-Werte genauer bestimmt werden. Zugleich dient dieser Artikel auch einer generellen Performance-Neueinordnung der HighEnd- und Enthusiasten-Grafikkarten von RDNA1, Turing & Ampere.

Der für die GeForce RTX 3070 herangezogene GA104-Chip ist mit 17,4 Mrd. Transistoren kaum weniger dick als der TU102-Chip der GeForce RTX 2080 Ti mit 18,6 Mrd. Transistoren – wobei der Vergleich der Chipflächen von 392mm² zu 754mm² anzeigt, dass Samsungs 8nm-Fertigung wenigstens in der Frage der Packdichte sehr wohl erhebliche Vorteile bieten kann. Von jenem GA104-Chip benutzt nVidia für die GeForce RTX 3070 mit 46 von maximal möglich 48 Shader-Clustern eine minimale Abspeckung, ansonsten sind alle physikalisch vorhandenen Hardware-Einheiten bei der GeForce RTX 3070 mit an Bord bzw. aktiv. Als deutliche Differenz zum GA102-Chip gibt es keinen GDDR6X-Speicher, womit die Speicherbandbreite der GeForce RTX 3070 deutlich niedriger ausfällt als bei den GA102-basierten Grafikkarten GeForce RTX 3080 & 3090.

nVidia "Ampere" GA104 nVidia "Ampere" GA102
Chip 17,4 Mrd. Transistoren auf 392mm² Chipfläche in der 8nm-Fertigung von Samsung 28,3 Mrd. Transistoren auf 628mm² Chipfläche in der 8nm-Fertigung von Samsung
Hardware 6 Raster-Engines, 48 Shader-Cluster, 6144 FP32-Einheiten, 192 TMUs, 48 RT-Cores v2, 192 Tensor-Cores v3, 96 ROPs, 4 MB Level2-Cache, 256 Bit GDDR6-Interface 7 Raster-Engines, 84 Shader-Cluster, 10752 FP32-Einheiten, 336 TMUs, 84 RT-Cores v2, 336 Tensor-Cores v3, 112 ROPs, 6 MB Level2-Cache, 384 Bit GDDR6X-Interface
NVLink & SLI - NVLink nur bei der GeForce RTX 3090, kein Support für "implicit SLI" mehr
verbaut bei GeForce RTX 3060 Ti & 3070 (beide Salvage) GeForce RTX 3080 & 3090 (beide Salvage)
Turing-Vorgänger TU104, 13,6 Mrd. Transistoren auf 545mm² Chipfläche in der 12nm-Fertigung von TSMC, 6 Raster-Engines, 48 Shader-Cluster, 3072 FP32-Einheiten, 192 TMUs, 48 RT-Cores v1, 384 Tensor-Cores v2, 64 ROPs, 4 MB Level2-Cache, 256 Bit GDDR6-Interface, verbaut bei GeForce RTX 2070 Super, 2080 & 2080 Super TU102, 18,6 Mrd. Transistoren auf 754mm² Chipfläche in der 12nm-Fertigung von TSMC, 6 Raster-Engines, 72 Shader-Cluster, 4608 FP32-Einheiten, 288 TMUs, 72 RT-Cores v1, 576 Tensor-Cores v2, 96 ROPs, 6 MB Level2-Cache, 384 Bit GDDR6-Interface, verbaut bei GeForce RTX 2080 Ti & Titan RTX
Pascal-Vorgänger GP104, 7,2 Mrd. Transistoren auf 314mm² Chipfläche in der 16nm-Fertigung von TSMC, 4 Raster-Engines, 20 Shader-Cluster, 2560 FP32-Einheiten, 160 TMUs, 64 ROPs, 2 MB Level2-Cache, 256 Bit GDDR5X-Interface, verbaut bei GeForce GTX 1070, 1070 Ti & 1080 GP102, 12 Mrd. Transistoren auf 471mm² Chipfläche in der 16nm-Fertigung von TSMC, 6 Raster-Engines, 30 Shader-Cluster, 3840 FP32-Einheiten, 256 TMUs, 96 ROPs, 3 MB Level2-Cache, 384 Bit GDDR5X-Interface, verbaut bei GeForce GTX 1080 Ti, Titan X & Titan Xp

Interessant ist die Ansetzung von gleich 6 Raster-Engines und damit 96 ROPs beim GA104-Chip (die Anzahl der ROPs korreliert unter der Ampere-Architektur direkt mit der Anzahl der Raster-Engines, im Gegensatz zu früheren nVidia-Architekturen). Dies sind nur unwesentlich weniger als die 7 Raster-Engines und 112 ROPs des GA102-Chips – und sogar komplett gleich zur GeForce RTX 3080, welche auf dieselben 6 Raster-Engines und 96 ROPs wie die GeForce RTX 3070 abgespeckt ist. Damit kann die GeForce RTX 3070 sicherlich einiges vom enormen Unterschied bei der FP32-Rechenleistung kaschieren, welcher bei +47% zugunsten der GeForce RTX 3080 bzw. −32% zuungunsten der GeForce RTX 3070 steht.

Im Gegensatz zu den leicht überkandidelten GA102-Grafikkarten kommt die GeForce RTX 3070 mit normalen Abmesssungen daher: Die Founders Edition mißt 24,5cm, ist ein gewöhnliches 2-Slot-Design und verbraucht offiziell 220 Watt. Die Herstellermodelle zur GeForce RTX 3070 gibt es dann natürlich auch mit allen möglichen anderen Abmessungen, sowohl (etwas) kleinere als auch größere. Als Problempunkt schickt nVidia die GeForce RTX 3070 allerdings mit nur 8 GB Grafikkartenspeicher ins Rennen. Jene Speichermenge resultiert formell natürlich aus der Verwendung eines 256bittigen Speicherinterfaces, welches mit derzeitig verfügbaren Speicherchips eben nur Bestückungen von 8 oder 16 GB zuläßt. Im Sinne eines Nachfolgers der 2070er Serie mag dies gerade noch so angehen, im Sinne eines Ersatz' der GeForce RTX 2080 Ti erscheint dies jedoch als zu knapp gedacht.

GeForce RTX 2080 Ti GeForce RTX 3070 GeForce RTX 3080 GeForce RTX 3090
Chipbasis nVidia TU102-300 nVidia GA104-300 nVidia GA102-200 nVidia GA102-300
Fertigung 18,6 Mrd. Transistoren auf 754mm² in der 12nm-Fertigung von TSMC 17,4 Mrd. Transistoren auf 392mm² in der 8nm-Fertigung von Samsung 28,3 Mrd. Transistoren auf 628mm² in der 8nm-Fertigung von Samsung
Architektur nVidia Turing, DirectX 12 Feature-Level 12_2 alle drei Ampere-Beschleuniger: nVidia Ampere, DirectX 12 Feature-Level 12_2
Features für alle gelisteten Modelle: DirectX 12, OpenGL, Vulkan, Asynchonous Compute, RayTracing, DSR, DLSS, PhysX, G-Sync, FreeSync
Technik 6 Raster-Engines, 68 Shader-Cluster, 4352 FP32-Einheiten, 272 TMUs, 68 RT-Cores v1, 544 Tensor-Cores v2, 88 ROPs, 5.5 MB Level2-Cache, 352 Bit GDDR6-Interface (Salvage) 6 Raster-Engines, 46 Shader-Cluster, 5888 FP32-Einheiten, 184 TMUs, 46 RT-Cores v2, 184 Tensor-Cores v3, 96 ROPs, 4 MB Level2-Cache, 256 Bit GDDR6-Interface (Salvage) 6 Raster-Engines, 68 Shader-Cluster, 8704 FP32-Einheiten, 272 TMUs, 68 RT-Cores v2, 272 Tensor-Cores v3, 96 ROPs, 5 MB Level2-Cache, 320 Bit GDDR6X-Interface (Salvage) 7 Raster-Engines, 82 Shader-Cluster, 10496 FP32-Einheiten, 328 TMUs, 82 RT-Cores v2, 328 Tensor-Cores v3, 112 ROPs, 6 MB Level2-Cache, 384 Bit GDDR6X-Interface (Salvage)
Taktraten Ref: 1350/1545 MHz & 14 Gbps
FE: 1350/1635 MHz & 14 Gbps
1500/1725 MHz & 14 Gbps 1450/1710 MHz & 19 Gbps 1400/1700 MHz & 19,5 Gbps
Rohleistungen Ref: 13,4 TFlops & 616 GB/sec
FE: 14,2 TFlops & 616 GB/sec
20,3 TFlops & 448 GB/sec 29,8 TFlops & 760 GB/sec 35,7 TFlops & 936 GB/sec
Speicherausbau 11 GB GDDR6 8 GB GDDR6 10 GB GDDR6X 24 GB GDDR6X
Anbindung PCI Express 3.0 PCI Express 4.0 PCI Express 4.0 PCI Express 4.0
FE/Herst./OC / / / / / / / /
Layout Dual/TripleSlot Dual/TripleSlot Dual/TripleSlot Dual/TripleSlot
Kartenlänge Herst: 26,5-33,0cm
FE: 27,0cm
Herst: 23,2-32,3cm
FE: 24,5cm
Herst: 27,4-32,3cm
FE: 28,5cm
Herst: 28,5-33,5cm
FE: 31,3cm
Stromstecker 2x 8pol. 1x 12pol. 1x 12pol. 1x 12pol.
off. Verbrauch Ref: 250W — FE: 260W 220W 320W 350W
realer Verbr. FE: 272W FE: 219W FE: 325W FE: 356W
Ausgänge HDMI 2.0b, 3x DisplayPort 1.4, VirtualLink per USB Type C alle drei Ampere-Beschleuniger: HDMI 2.1, 3x DisplayPort 1.4
FullHD Perf.Index Ref: 1540%FE: 1580% 1590% 1900% 2030%
4K Perf.Index Ref: 239%FE: 247% 245% 328% 367%
Listenpreis Ref: $999 — FE: $1199 $499 $699 $1499
Straßenpreis 1100-1420€ (Auslauf) Herst: 650-850€FE: 499€ Herst: 880-1080€FE: 699€ Herst: 1700-2200€FE: 1499€
Release 19. September 2018 29. Oktober 2020 17. September 2020 24. September 2020

Wie bei GeForce RTX 3080 & 3090 war auch die GeForce RTX 3070 umgehend nach Marktstart vom 29. Oktober 2020 vergriffen (und ist es noch), in der Folge dessen ist eine Betrachtung zum aktuellen Straßenpreis kaum sinnvoll: Jener ist derzeit komplett übertrieben, wird sich aber nach Besserung der Verfügbarkeit voraussichtlich wieder in Richtung des Listenpreises bewegen. Zugleich sind die oberen Teile des früheren Turing-Portfolios inzwischen längst auf Auslaufstatus und derzeit nur noch als Restposten erhältlich, womit auch zu diesen Karten ein aktueller Straßenpreis nicht mehr zu ermitteln ist. Alle nachfolgenden Preis/Leistungs-Betrachtungen beziehen sich damit auf den US-Listenpreis als zumeist solide Orientierungs-Größe, welche zu normalen Zeiten auch ziemlich gut (nach Währungs-Umrechnung und Mehrwersteuer-Aufschlag) in den deutschen Straßenpreisen wiederzufinden ist.

Nachdem sich die vorherigen Launch-Analysen zu GeForce RTX 3080 & 3090 primär auf die 4K-Performance konzentriert haben bzw. nur eine Kurzfassung zur FullHD- und WQHD-Performance der neuen Grafikkarten boten, wird mittels dieser Launch-Analyse nunmehr eine komplette Aufstellung zur FullHD- und WQHD-Performance nachgeholt. Dies ist zum einen speziell für die GeForce RTX 3070 wichtig, da jene wegen der Speichermengen-Problematik kaum gut geeignet für die UltraHD-Auflösung erscheint. Genauso wichtig ist dies aber auch für die mit dieser Launch-Analyse zu leistenden Performance-Neubewertung der früheren HighEnd- und Enthusiasten-Grafikkarten. Zu jenen hatten sich schon im Zuge der Launch-Analyse zur GeForce RTX 3080 klar verbesserte Performance-Werte gezeigt, speziell im Vergleich zur Vor-Vor-Generation "Pascal" in Form der GeForce GTX 1080 Ti. Demzufolge wurden für die nachfolgenden Performance-Auswertungen inbesondere Launch-Reviews mit vollständigen Resultaten unter allen drei Auflösungen sowie der Beteilung von möglichst vielen Grafikkarten herangezogen.

FullHD-Performance 5700 5700XT R7 1080Ti 2060S 2070S 2080S 2080Ti 3070 3080 3090
Generation & Speicher RDNA1, 8GB RDNA1, 8GB Vega, 16GB Pascal, 11GB Turing, 8GB Turing, 8GB Turing, 8GB Turing, 11GB Ampere, 8GB Ampere, 10GB Ampere, 24GB
ComputerBase  (17 Tests) - 70,4% 69,8% 72,9% - 75,9% 85,0% 98,0% 100% 119,0% 125,0%
Golem  (10 Tests) - 74,3% - 68,7% - - - 97,7% 100% 115,5% -
Igor's Lab  (10 Tests) 68,5% 75,8% 74,2% - 69,3% 77,5% 84,1% 92,9% 100% 110,6% -
KitGuru  (11 Tests) 64,4% 72,3% 73,6% 76,2% - 77,9% 88,0% 101,6% 100% 119,0% -
Overclockers Club  (13 Tests) - 74,0% - - 68,3% 78,0% 85,7% 99,1% 100% 112,1% -
PC Games Hardware  (20 Tests) 62,7% 72,1% 72,1% 75,0% 64,0% 76,9% 86,5% 99,8% 100% 123,4% 132,6%
PurePC  (8 Tests) - 71,4% 72,8% 71,7% - 76,7% 86,9% 99,8% 100% 126,0% 139,4%
SweClockers  (12 Tests) 64,6% 73,1% 73,8% 73,1% 64,6% 76,9% 87,7% 100,8% 100% 124,6% 134,6%
TechPowerUp  (23 Tests) 68% 75% 76% 77% 69% 80% 89% 101% 100% 116% 121%
Tom's Hardware  (9 Tests) 69,0% 76,2% - - - 80,4% 89,3% 101,4% 100% 119,4% 126,9%
Tweakers  (10 Tests) - 78,5% - - 71,2% 81,3% 89,1% 99,0% 100% 113,0% -
gemittelte FullHD-Performance 65,3% 73,2% 73,6% 74,4% 66,5% 77,5% 86,9% 99,6% 100% 119,4% 127,6%
Listenpreis $349 $399 $699 $699 $399 $499 $699 $1199 $499 $699 $1499
TDP (TBP/GCP) 175W 225W 300W 250W 175W 215W 250W 260W 220W 320W 350W
Performance-Durchschnitt gemäß geometrischem Mittel, gewichtet zugunsten jener Hardwaretests mit höherer Benchmark-Anzahl und mehr Vergleichs-Hardware; ausschließlich FE/Referenz-Modelle; gesamte ausgewertete Benchmark-Anzahl: ca. 1310

Im Vergleich zwischen GeForce RTX 2080 Ti und GeForce RTX 3070 legt die neue Ampere-Karte unter der FullHD-Auflösung eine Punktlandung mit einer gemittelt +0,4% besseren Performance hin. Dies kann je nach Testbericht etwas abweichen, allerdings liegt die üblichen Abweichungen nur bei 1-2% Prozentpunkten – allein Igor's Lab fallen mit einer gleich 7%igen Differenz zugunsten der GeForce RTX 3070 etwas aus dem Rahmen. Gegenüber der (nominell) gleichpreisigen GeForce RTX 2070 Super wird eine Mehrperformance von +29% erzielt, währenddessen die GeForce RTX 3080 ihrerseits +19% sowie die GeForce RTX 3090 dann +28% auf die GeForce RTX 3070 oben drauf legt. Insbesondere an der absoluten Leistungsspitze fallen die Ergebnis-Differenzen unter der FullHD-Auflösung bedingt durch CPU-Limitierungen somit spürbar geringer aus – womit es sich kaum lohnt, echte Spitzen-Grafikkarten als FullHD-Beschleuniger zu benutzen.