Launch-Analyse nVidia GeForce RTX 3060 Ti

Montag, 7. Dezember 2020
 / von Leonidas
 

Mit der GeForce RTX 3060 Ti bringt nVidia inzwischen schon die vierte Ampere-basierte Gamer-Grafikkarte daher, die zweite mit GA104-Unterbau. Vor allem aber geht die Ampere-Generation damit in einen Preisbereich, welcher bislang von den neuen Grafikkarten noch weitgehend unberührt war: Auf 399 Dollar Listenpreis (UVP: 399 Euro) werden nunmehr die stärksten Midrange-Modelle der 2019er Grafikkarten-Generation direkt attackiert – Radeon RX 5700 XT und GeForce RTX 2060 Super. Auf einer Performance leicht oberhalb der GeForce RTX 2080 Super gemäß nVidias eigener Vorhersage sollte es kein Problem für die GeForce RTX 3060 Ti darstellen, das frühere Midrange-Portfolio genauso obsolet zu machen, wie es die neuen HighEnd- und Enthusiasten-Grafikkarten bereits in deren Preisfeld getan haben. Wo genau sich die GeForce RTX 3060 Ti gegenüber dem bisherigen Turing-Angebot sowie den neuen Grafikkarten von AMD & nVidia einordnet, soll die nachfolgende Launch-Analyse unter Auswertung der mittels der Launchreviews erzeugten Performance- und Stromverbrauchs-Daten aufzeigen.

Die GeForce RTX 3060 Ti basiert auf dem schon bei der GeForce RTX 3070 verwendeten GA104-Chip, beschneidet jenen im Gegensatz zu ihrer größeren Schwester jedoch viel deutlicher: Von 48 physikalisch vorhandenen Shader-Clustern sind auf der GeForce RTX 3060 Ti nur 36 aktiv, was entsprechend weniger FP32-Einheiten, Textureneinheiten, RayTracing-Einheiten und Tensor Cores bedeutet. Zur Realisierung dessen hat nVidia u.a. eine ganze Raster-Engine des GA104-Chips deaktiviert, im Gegensatz zur GeForce RTX 3070 sind bei der GeForce RTX 3060 Ti also nur 5 der physikalisch vorhandenen 6 Raster-Engines aktiv. Damit einher geht auch eine geringere Anzahl an ROPs, da selbige in der Ampere-Architektur den Raster-Engines zugeordnet sind.

Nicht beschnitten ist hingegen das Speicherinterface, welches wie bei der GeForce RTX 3070 seine 256 Bit breit ist, genauso mit auf 14 Gbps Datenrate (3500 MHz QDR) laufendem GDDR6-Speicher bestückt wird und ebenfalls auch die 4 MB Level2-Cache der GeForce RTX 3070 bereithält. Der Hintergrund dieser Nicht-Abspeckung ist natürlich die hieraus direkt resultierende Speichermenge: Mit einem kleineren Speicherinterface sind (mangels praktischer Nichtexistenz von 1,5-GByte-Speicherchips) eben keine 8 GB Speicher mehr machbar, sondern nur 7 GB bei einem 224-Bit-Interface oder gar nur 6 GB bei einem 192-Bit-Interface. Da sich kleinere Speichermengen als 8 GB in diesem Preisbereich jedoch kaum noch verkaufen lassen, hatte nVidia in dieser Frage keine Wahl und konnte das Speicherinterface der GeForce RTX 3060 Ti nur unangetastet lassen.

Radeon RX 5700 XT GeForce RTX 2060 Super GeForce RTX 3060 Ti GeForce RTX 3070
Chipbasis AMD Navi 10 XT nVidia TU106-410 nVidia GA104-200 nVidia GA104-300
Fertigung 10,3 Mrd. Transistoren auf 251mm² in der 7nm-Fertigung von TSMC 10,6 Mrd. Transistoren auf 445mm² in der 12nm-Fertigung von TSMC 17,4 Mrd. Transistoren auf 392mm² in der 8nm-Fertigung von Samsung
Architektur AMD RDNA1, DirectX 12 Feature-Level 12_1 nVidia Turing, DirectX 12 Feature-Level 12_2 nVidia Ampere, DirectX 12 Feature-Level 12_2
Features DirectX 12, OpenGL, Vulkan, Asynchonous Compute, VSR, FreeSync, TrueAudio Next, XConnect DirectX 12, OpenGL, Vulkan, Asynchonous Compute, RayTracing, DSR, DLSS, PhysX, G-Sync, FreeSync DirectX 12, OpenGL, Vulkan, Asynchonous Compute, RayTracing, DSR, DLSS, PhysX, G-Sync, FreeSync
Technik 4 Raster-Engines, 40 Shader-Cluster, 2560 FP32-Einheiten, 160 TMUs, 64 ROPs, 4 MB Level2-Cache, 256 Bit GDDR6-Interface (Vollausbau) 3 Raster-Engines, 34 Shader-Cluster, 2176 FP32-Einheiten, 136 TMUs, 34 RT-Cores, 272 Tensor-Cores, 64 ROPs, 4 MB Level2-Cache, 256 Bit GDDR6-Interface (Salvage) 5 Raster-Engines, 38 Shader-Cluster, 4864 FP32-Einheiten, 152 TMUs, 38 RT-Cores v2, 152 Tensor-Cores v3, 80 ROPs, 4 MB Level2-Cache, 256 Bit GDDR6-Interface (Salvage) 6 Raster-Engines, 46 Shader-Cluster, 5888 FP32-Einheiten, 184 TMUs, 46 RT-Cores v2, 184 Tensor-Cores v3, 96 ROPs, 4 MB Level2-Cache, 256 Bit GDDR6-Interface (Salvage)
Taktraten 1605/1755 MHz & 14 Gbps 1470/1650 MHz & 14 Gbps 1410/1665 MHz & 14 Gbps 1500/1725 MHz & 14 Gbps
Rohleistungen 9,0 TFlops & 448 GB/sec 9,0 TFlops & 448 GB/sec 16,2 TFlops & 448 GB/sec 20,3 TFlops & 448 GB/sec
Speicherausbau 8 GB GDDR6 8 GB GDDR6 8 GB GDDR6 8 GB GDDR6
Anbindung PCI Express 4.0 PCI Express 3.0 PCI Express 4.0 PCI Express 4.0
FE/Herst./OC / / / / / / / /
Layout Dual/TripleSlot Dual/TripleSlot Dual/TripleSlot Dual/TripleSlot
Kartenlänge Herst: 23,0-32,6cm
Ref: 27,5cm
Herst: 17,5-31,6cm
FE: 23,0cm
Herst: 20,2-32,3cm
FE: 24,5cm
Herst: 23,0-33,3cm
FE: 24,5cm
Stromstecker 1x 6pol. & 1x 8pol. 1x 8pol. 1x 12pol. 1x 12pol.
off. Verbrauch 225W (TBP) 175W (GCP) 200W (GCP) 220W (GCP)
realer Verbr. 176W 221W 202W 220W
Ausgänge HDMI 2.0b, 3x DisplayPort 1.4 DualLink DVI-D, HDMI 2.0b, 2x DisplayPort 1.4, VirtualLink per USB Type C HDMI 2.1, 3x DisplayPort 1.4 HDMI 2.1, 3x DisplayPort 1.4
FullHD Perf.Index 1160% 1050% 1420% 1590%
4K Perf.Index 163% 148% 212% 245%
Listenpreis $399 $399 $399 $499
Straßenpreis 390-560€ (Auslauf) 390-540€ (Auslauf) Herst: 520-700€FE: 399€ Herst: 610-900€FE: 499€
Release 7. Juli 2019 9. Juli 2019 2. Dezember 2020 29. Oktober 2020

Größere Speichermengen wären zwar auch gern genommen wurden, allerdings wiegt dieses Manko der GeForce RTX 3070 bei der GeForce RTX 3060 Ti aufgrund des niedrigeren Preispunktes doch deutlich weniger stark. Die GeForce RTX 3060 Ti ist mit weniger als der Hälfte der Shader-Cluster einer GeForce RTX 3090 sicherlich keine Karte für die UltraHD/4K-Auflösung mehr, sondern eher eine Karte für FullHD und WQHD. Auch dort wird natürlich Grafikkartenspeicher benötigt und haben heutige Spiele die Tendenz, kaum noch eine große Differenz der benötigten Speichermengen per Auflösung zu machen, aber angesichts des Preispunktes sind gewisse Kompromisse bei zukünftigen Titeln durchaus ertragbar – heutzutage dürften die 8 GB hingegen noch komplett ausreichend sein. Dennoch kann man natürlich auf AMDs Gegenangebote innerhalb der RDNA2-Generation warten, welche allem Anschein nach mit klar mehr Grafikkartenspeicher antreten werden.

Neben dem Hardware-Unterschied gibt es auch noch einen nominellen Taktraten-Unterschied zwischen den beiden GA104-basierten Grafikkarten – welcher allerdings eher nur auf dem (Marketing-)Papier existiert. Denn wie die Realtakt-Ermittlungen bei ComputerBase und TechPowerUp nahelegen, gehen GeForce RTX 3070 wie GeForce RTX 3060 Ti im Spiele-Alltag beiderseits bei durchschnittlich knapp 1900 MHz ans Werk. In dieser Frage wird die GeForce RTX 3060 Ti auch über ihr relativ gesehen hohes Power-Limit von 200 Watt unterstützt: Dies sind bei immerhin −17% weniger Shader-Cluster nur −9% weniger Power-Limit. Da die realen Taktraten somit als Unterscheidungsmerkmal ausfallen, sollte die Performance-Differenz zwischen GeForce RTX 3070 und GeForce RTX 3060 Ti letztlich zwischen diesen beiden Polen liegen: Von −17% Shader-Cluster zu −9% Power-Limit (von +21% bis +10%, normiert auf die GeForce RTX 3060 Ti).

Basis Durchschnitt Maximum durchschnittlicher Realtakt
AMD-Bezeichnung "Base Frequency" "Game Frequency" "Boost Frequency" - -
Radeon RX 6900 XT ? 2015 MHz 2250 MHz 2800 MHz ?
Radeon RX 6800 XT 1825 MHz 2015 MHz 2250 MHz 2577 MHz CB: 2216 MHz – TPU: 2257 MHz
Radeon RX 6800 1700 MHz 1815 MHz 2105 MHz ? CB: 2177 MHz – TPU: 2205 MHz
nVidia-Bezeichnung "Base Clock" "Boost Clock" - -
GeForce RTX 3090 1400 MHz 1700 MHz ? TPU: 1754 MHz
GeForce RTX 3080 1450 MHz 1710 MHz 1995 MHz CB: 1827 MHz – TPU: 1931 MHz
GeForce RTX 3070 1500 MHz 1725 MHz 2040 MHz CB: 1892 MHz – TPU: 1882 MHz
GeForce RTX 3060 Ti 1410 MHz 1665 MHz 2010 MHz CB: 1900 MHz – TPU: 1877 MHz
Realtakt-Angaben gemäß den Ausarbeitungen der ComputerBase (Ø 17 Spiele) und von TechPowerUp (Ø 23 Spiele)

Zur Performance-Ermittlung wurden wiederum verschiedene Launchreviews herangezogen, wobei für eine höchstmögliche Korrekheit ausschließlich Tests mit Referenz- bzw. FE-Modellen zugelassen sind. Bevorzugt wurden zudem Launchreviews mit eigenen Performance-Indizes (heftige Arbeitserleichterung) sowie mit Benchmarks unter möglichst allen drei Auflösungen. Da es hierbei aber im Endeffekt auch "nur" um die Performance-Differenz der GeForce RTX 3060 Ti gegenüber der Chip-gleichen GeForce RTX 3070 geht, wurde diesesmal nur ein mittelstarkes Aufgebot an Launchreviews einer Performance-Auswertung unterzogen. Zu erwähnen wäre noch, dass bei PC Games Hardware und PCWorld die Benchmarks einiger Grafikkarten aus deren jeweiligen Launchreviews zu Radeon RX 6800 & 6800 XT stammen, was aufgrund einer Werte-Kontinuität in diesem Einzelfall möglich war.

FullHD-Performance 5700XT 6800 6800XT 2060S 2080S 2080Ti 3060Ti 3070 3080 3090
Generation & Speicher Navi, 8GB RDNA2, 16GB RDNA2, 16GB Turing, 8GB Turing, 8GB Turing, 11GB Ampere, 8GB Ampere, 8GB Ampere, 10GB Ampere, 24GB
ComputerBase  (17 Tests) 79,7% 111,5% 127,3% - 96,3% 111,0% 100% 113,2% 134,7% 141,5%
Eurogamer  (11 Tests) 83,5% 115,3% 125,4% - 97,8% 110,7% 100% 109,7% 127,6% 135,4%
Golem  (10 Tests) 82,3% 112,0% 122,7% - - 108,1% 100% 110,7% 127,8% -
Hardwareluxx  (9 Tests) 83,0% 115,8% 127,4% 74,0% 98,6% 109,2% 100% 111,5% 130,2% -
Hardware Upgrade  (13 Tests) 92,1% 119,8% 130,5% 78,2% 99,4% 111,5% 100% 109,2% 129,0% 136,7%
KitGuru  (14 Tests) 80,8% 120,0% 133,9% 74,8% 98,0% 113,9% 100% 112,2% 135,3% -
Le Comptoir d.H.  (14 Tests) 81,7% 120,0% - 73,7% 96,2% - 100% 111,7% - -
PC Games Hardware  (20 Tests) 82,2% 110,6% 125,7% 72,9% 98,6% 113,7% 100% 113,9% 140,6% 151,0%
PCWorld  (11 Tests) 82,7% 115,7% 125,0% - 96,2% 108,5% 100% 105,8% 118,3% -
SweClockers  (12 Tests) 82,6% 121,7% 136,5% 73,0% 99,1% 113,9% 100% 113,0% 140,9% 152,2%
TechPowerUp  (23 Tests) 83% 112% 121% 76% 98% 110% 100% 110% 128% 132%
gemittelte FullHD-Performance 82,5% 114,6% 127,3% 74,1% 97,7% 111,3% 100% 111,6% 132,6% 140,3%
Listenpreis $399 $579 $649 $399 $699 $1199 $399 $499 $699 $1499
TDP (TBP/GCP) 225W 250W 300W 175W 250W 260W 200W 220W 320W 350W
Performance-Durchschnitt gemäß geometrischem Mittel, gewichtet zugunsten jener Hardwaretests mit höherer Benchmark-Anzahl; ausschließlich FE/Referenz-Modelle; Benchmarks durchgehend ohne AMDs SAM-Feature; gesamte ausgewertete Benchmark-Anzahl: ca. 1380