Launch-Analyse nVidia GeForce RTX 3060 (Seite 2)

Dienstag, 2. März 2021
 / von Leonidas
 

Die nachfolgende Tabelle schlüsselt auf, welche konkreten Kartenmodelle die ausgewerteten Testberichte benutzt haben, welchen Boosttakt jene jeweils hatten und welche Mehrperformance von jenen gegenüber dem Referenztakt (schätzungsweise) zu erwarten ist. Mit den nachfolgenden Performanceauswertungen wurde dann die Mehrperformance dieser werksübertakteten GeForce RTX 3060 Karten (in blauer Schrift markiert) entsprechend normalisiert, sprich es wurden bei den entsprechenden Hardwaretests jeweils –2% von der Performance der GeForce RTX 3060 abgezogen (beim Test von PurePC entsprechend –1%). Jener Werteabzug erfolgte allerdings nur für den insgesamten Performance-Durchschnitt, nicht bereits bei der Werte-Dokumentation des einzelnen Hardwaretests (logisch, es handelt sich um eine Dokumentation, welche möglichst original wiedergegeben werden muß).

Hardware Perf.-Effekt Testberichte
simulierte Referenz-Karte Boost 1777 MHz, TDP 170W Referenz ComputerBase, TechPowerUp
Gigabyte Eagle Boost 1777 MHz, TDP 170W wie Referenz Le Comptoir du Hardware, PC Games Hardware
Zotac Twin Edge Boost 1777 MHz, TDP 170W wie Referenz Eurogamer
KFA2 EX Boost 1807 MHz, TDP 170W geschätzt +1% PurePC
Gigabyte Gaming OC Boost 1837 MHz, TDP 170W geschätzt +2% SweClockers, Tweakers
EVGA XC Black Boost 1852 MHz, TDP 170W geschätzt +2% Tom's Hardware
MSI Gaming X Trio Boost 1852 MHz, TDP 170W geschätzt +2% Guru3D, Hardwareluxx, Hardware Upgrade, Igor's Lab, SweClockers
Zotac AMP White Boost 1867 MHz, TDP 170W geschätzt +2% Golem

Der Einfluß dieser Normalisierung auf den gesamten Performance-Durchschnitt ist allerdings nicht besonders hoch: Angenommen, die Performance-Differenz zwischen Referenztakt und Werksübertaktung wäre real gerade einmal halb so hoch wie angesetzt, würde die GeForce RTX 3060 im gesamten Performance-Schnitt gegenüber den anderen Karten gerade einmal einen halben Prozentpunkt hinzugewinnen (respektive jene anderen Karten einen halben Prozentpunkt verlieren). Dies ist aber fast schon der maximal denkbare Fehler, die reale Fehlerquote dürfte deutlich niedriger liegen (und sofern die Fehler mal in die eine und mal in die andere Richtung gehen, könnten sich jene in der Summe sogar ausgleichen). Perfekt kann es leider nicht werden, dafür liegen einfach zu viele Benchmarks rein von werksübertakteten Grafikkarten vor, selbst wenn im Performance-Durchschnitt zugunsten der Messungen auf Referenztakt gewichtet wurde.

Ein weiterer Punkt, welcher die Benchmarks aktuell beeinflußt, ist der differierende Status von SAM/rBAR, je nach Grafikkarte und je nach Hardwaretest. Denn da jenes Feature nunmehr für alle modernen Grafikkarten und PC-Systeme kommt, rüsten die Tester scheibchenweise zugunsten von SAM/rBAR um – was bedeutet, dass zum jetzigen Zeitpunkt manche Hardware bereits mit SAM/rBAR getestet wird, und andere eben noch nicht. Die GeForce RTX 3060 läuft von Haus aus bereits mit rBAR – mit allerdings negierbarem Performance-Effekt. Die anderen im Test befindlichen Karten erhalten SAM/rBAR teilweise nicht mehr (ältere Grafikkarten) bzw. werden es im Laufe des März bekommen (andere Ampere-Karten). Ehe das ganze jedoch durchgehend von den Testern adaptiert ist, könnte nochmals einige Zeit mehr vergehen. Vermutlich dürfte erst irgendwann im Sommer echte Waffengleichheit erreicht sein und müssen die jetzt angestellten Tests mit dem (kleinen) Fehler leben, dass SAM/rBAR nicht bei allen potentiell damit erreichbaren Testobjekten bereits aktiv war.

FullHD-Performance 5700 5700XT 1080Ti 2060S 2070S 3060 3060Ti 3070
Generation & Speicher RDNA1, 8GB RDNA1, 8GB Pascal, 11GB Turing, 8GB Turing, 8GB Ampere, 12GB Ampere, 8GB Ampere, 8GB
ComputerBase  (17 Tests) Ref. 96,9% 107,3% - 94,8% 111,6% 100% 129,7% 147,1%
Golem  (10 Tests) Zotac - 99,8% 92,2% - - 100% 121,3% 134,2%
Eurogamer  (11 Tests) Ref. - 106,8% 103,2% - 108,0% 100% 127,9% 140,2%
Guru3D  (15 Tests) MSI 96,7% 104,7% 101,6% 92,6% 105,5% 100% 122,6% 134,2%
Hardwareluxx  (11 Tests) MSI 92,1% 104,2% 105,3% 93,1% - 100% 125,1% 142,5%
Hardware Upgrade  (12 Tests) MSI 96,8% 110,2% 103,4% 94,0% 109,0% 100% 127,8% 139,7%
Igor's Lab  (10 Tests) MSI - 103,0% - 91,3% 108,2% 100% 128,0% 141,0%
Le Comptoir du Hardware  (14 T.) Ref. 89,3% 100,1% 103,2% 94,8% 111,0% 100% 127,5% 142,1%
PC Games Hardware  (20 Tests) Ref. - 107,7% 108,8% - 113,4% 100% 129,7% 148,6%
PurePC  (9 Tests) KFA2 - 103,5% 103,1% 93,1% 111,6% 100% 127,8% 145,3%
SweClockers  (12 Tests) MSI/GB 90,7% 94,0% 103,8% 90,7% 109,3% 100% 125,7% 142,1%
TechPowerUp  (23 Tests) Ref. 92,9% 103,1% 106,1% 94,9% 109,2% 100% 125,5% 137,8%
Tom's Hardware  (13 Tests) EVGA - - - 93,6% 110,3% 100% 125,7% 136,6%
Tweakers  (10 Tests) GB 92,2% 104,7% 100,6% 92,8% - 100% 121,8% 137,6%
gemittelte FullHD-Performance 94,1% 104,7% 105,3% 94,2% 110,6% 100% 127,9% 142,9%
Listenpreis $349 $399 $699 $399 $499 $329 $399 $499
TDP (TBP/GCP) 180W 225W 250W 175W 215W 170W 200W 220W
Performance-Durchschnitt gemäß geometrischem Mittel, gewichtet zugunsten jener Hardwaretests mit Benutzung von Karten auf Referenz-Takt; werksübertaktete Karten sind in blauer Schrift markiert (für den Performance-Durchschnitt wurde deren Effekt normalisiert); gesamte ausgewertete Benchmark-Anzahl: ca. 1300

Die Benchmarks unter der FullHD-Auflösung zeigen auf einen vergleichsweise großen Performance-Abstand zur GeForce RTX 3060 Ti hin und ordnen die GeForce RTX 3060 grob zwischen GeForce RTX 2060 Super sowie 2070 Super ein – mit Tendenz eher zur kleineren Lösung. Die Performance der GeForce GTX 1080 Ti wird nicht ganz erreicht, selbst die Radeon RX 5700 XT kommt leicht oberhalb der GeForce RTX 3060 heraus. Die AMD-Karte läuft dabei tendentiell nochmals leicht stärker als bei früheren Benchmarks, die GeForce GTX 1080 Ti hingegen leicht schwächer – was aber auch kein großes Wunder ist, denn letztgenannte Karte basiert noch auf der Pascal-Architektur, auf welche heutzutage nicht mehr vordringlich optimiert wird. Gemäß der hier gezeigten Performance kann man die GeForce RTX 3060 nach Normalisierung auf das Performance-Niveau des Referenztakts somit im 3DCenter FullHD Performance-Index auf einen Wert von 1110% einordnen.

WQHD-Performance 5700 5700XT 1080Ti 2060S 2070S 3060 3060Ti 3070
Generation & Speicher RDNA1, 8GB RDNA1, 8GB Pascal, 11GB Turing, 8GB Turing, 8GB Ampere, 12GB Ampere, 8GB Ampere, 8GB
ComputerBase  (17 Tests) Ref. 95,7% 106,7% - 94,8% 112,0% 100% 131,5% 150,4%
Golem  (10 Tests) Zotac - 97,9% 92,8% - - 100% 124,1% 139,4%
Eurogamer  (11 Tests) Ref. - 104,1% 104,4% - 108,5% 100% 131,1% 147,9%
Guru3D  (15 Tests) MSI 96,7% 104,2% 104,2% 93,5% 108,6% 100% 129,3% 144,3%
Hardwareluxx  (11 Tests) MSI 89,2% 101,6% 103,1% 90,4% - 100% 127,9% 148,0%
Hardware Upgrade  (12 Tests) MSI 95,1% 108,6% 103,6% 91,3% 108,1% 100% 129,9% 143,3%
Igor's Lab  (10 Tests) MSI - 105,2% - 91,3% 109,6% 100% 128,8% 147,9%
Le Comptoir du Hardware  (14 T.) Ref. 88,4% 99,5% 102,4% 94,2% 111,0% 100% 129,5% 146,9%
PC Games Hardware  (20 Tests) Ref. - 106,7% 109,1% - 113,3% 100% 130,0% 149,9%
PurePC  (9 Tests) KFA2 - 101,6% 102,9% 92,4% 111,0% 100% 128,9% 146,9%
SweClockers  (12 Tests) MSI/GB 89,6% 100,5% 101,6% 89,6% 109,3% 100% 126,8% 147,5%
TechPowerUp  (23 Tests) Ref. 91,8% 103,1% 107,1% 94,9% 111,2% 100% 130,6% 146,9%
Tom's Hardware  (13 Tests) EVGA - - - 92,9% 110,4% 100% 128,8% 142,6%
Tweakers  (10 Tests) GB 91,1% 103,6% 102,3% 93,0% - 100% 125,1% 142,3%
gemittelte WQHD-Performance 92,6% 104,5% 105,6% 93,5% 111,2% 100% 130,4% 148,2%
Listenpreis $349 $399 $699 $399 $499 $329 $399 $499
TDP (TBP/GCP) 180W 225W 250W 175W 215W 170W 200W 220W
Performance-Durchschnitt gemäß geometrischem Mittel, gewichtet zugunsten jener Hardwaretests mit Benutzung von Karten auf Referenz-Takt; werksübertaktete Karten sind in blauer Schrift markiert (für den Performance-Durchschnitt wurde deren Effekt normalisiert); gesamte ausgewertete Benchmark-Anzahl: ca. 1300

Die Benchmarks unter der WQHD-Auflösung sehen generell nur eine etwas höhere Skalierung des ganzen – kleinere Karten verlieren (leicht) stärker, größere Karten gewinnen (leicht) stärker. Die Benchmarks unter der 4K-Auflösung setzen dies weiter fort, wobei sich im Vergleich der drei Auflösungen keinerlei besonders abweichendes Performance-Profil der GeForce RTX 3060 zeigt. Jene ist also mitnichten besonders stark/schwach unter einzelnen Auflösungen, sondern liegt mitten drin im üblichen Performance-Profil von Ampere-Karten. Auch GeForce GTX 1080 Ti und Radeon RX 5700 XT zeigen wiederum ihre kleinen Abweichungen von deren bislang bekannter Performance, was nach weiterer Bestätigung dieser Werte für die AMD-Karte zukünftig eine (minimale) Index-Aufwertung ergeben könnte. Gemäß der hier gezeigten Performance kann man die GeForce RTX 3060 nach Normalisierung auf das Performance-Niveau des Referenztakts somit im 3DCenter UltraHD/4K Performance-Index auf einen Wert von 161% einordnen.

4K-Performance 5700 5700XT 1080Ti 2060S 2070S 3060 3060Ti 3070
Generation & Speicher RDNA1, 8GB RDNA1, 8GB Pascal, 11GB Turing, 8GB Turing, 8GB Ampere, 12GB Ampere, 8GB Ampere, 8GB
Golem  (10 Tests) Zotac - 94,0% 93,8% - - 100% 122,3% 142,7%
Eurogamer  (11 Tests) Ref. - 103,7% 104,0% - 112,0% 100% 134,5% 154,5%
Guru3D  (15 Tests) MSI 92,6% 102,2% 105,5% 93,4% 109,9% 100% 132,2% 150,2%
Hardwareluxx  (11 Tests) MSI 88,0% 98,7% 101,2% 87,8% - 100% 126,0% 146,3%
Hardware Upgrade  (12 Tests) MSI 91,5% 104,2% 102,7% 89,3% 105,1% 100% 130,6% 147,3%
PC Games Hardware  (20 Tests) Ref. - 103,5% 107,8% - 110,6% 100% 128,2% 148,6%
PurePC  (9 Tests) KFA2 - 99,6% 101,6% 92,0% 111,4% 100% 132,0% 151,4%
SweClockers  (12 Tests) MSI/GB 87,4% 98,4% 102,7% 88,5% 109,3% 100% 127,9% 148,6%
TechPowerUp  (23 Tests) Ref. 90,8% 102,0% 107,1% 92,9% 111,2% 100% 134,7% 154,1%
Tom's Hardware  (13 Tests) EVGA - - - 90,5% 109,0% 100% 129,8% 145,9%
Tweakers  (10 Tests) GB 89,3% 101,1% 104,7% 91,8% - 100% 127,7% 148,6%
gemittelte 4K-Performance 90,4% 102,0% 105,7% 91,9% 110,5% 100% 131,4% 151,3%
Listenpreis $349 $399 $699 $399 $499 $329 $399 $499
TDP (TBP/GCP) 180W 225W 250W 175W 215W 170W 200W 220W
Performance-Durchschnitt gemäß geometrischem Mittel, gewichtet zugunsten jener Hardwaretests mit Benutzung von Karten auf Referenz-Takt; werksübertaktete Karten sind in blauer Schrift markiert (für den Performance-Durchschnitt wurde deren Effekt normalisiert); gesamte ausgewertete Benchmark-Anzahl: ca. 1010

Damit kommt die GeForce RTX 3060 jedoch eher am unteren Ende der Erwartungen heraus, welche gemäß der technischen Ansetzung auf ~150-180% im 4K-Index lagen. Gerade im Vergleich zum bisherigen Ampere-Portfolio mit üblicherweise geringer Performance-Skalierung anhand der technischen Ansetzung ist die GeForce RTX 3060 dann doch eher ein gewisser "Performance-Ausreißer" – nicht vom generellen Performance-Profil her, aber bezüglich der Hardware-Skalierung. Denn bislang haben die jeweils kleineren Ampere-Lösungen immer deutlich weniger Performance verloren als jene weniger Shader-Cluster mitbrachten. Doch bei der GeForce RTX 3060 liegt der Performance-Verlust zur GeForce RTX 3060 Ti mit –24% fast auf der Höhe der Differenz bei der Anzahl der Shader-Cluster (von –26%). An unterschiedlichen Taktraten kann dies kaum liegen, da sich jene wie vorstehend ausgeführt weitgehend im selben Feld befinden.

Vielmehr sieht man hierbei aller Vermutung nach den Effekt von (neben den Shader-Clustern) inzwischen eher selten diskutierten Hardware-Teilen in Form von Raster-Engines (Dreiecks-Zerlegung vor dem Rendern) und ROP-Einheiten (finales Schreiben der Pixel in den Speicher). An dieser Stelle hat das GA106-Design wie schon vorstehend ausgeführt den größten Einschnitt gegenüber dem größeren GA104-Chip, was zwischen GeForce RTX 3060 Ti und 3060 zu glatt –40% weniger Raster-Engines und ROPs führt. Und obwohl der Performance-Effekt jener Hardware-Einheiten üblicherweise nicht besonders groß ist (insbesondere bei ausgewogenen Designs), zieht es in diesem Fall die GeForce RTX 3060 doch etwas nach unten – der Grafikchip bzw. die GeForce RTX 3060 verliert mehr an Performance (gegenüber größeren Lösung derselben Architektur), als es auf Basis der reinen Rechenleistung notwendig wäre.

RTX3090 Diff. RTX3080 Diff. RTX3070 Diff. RTX3060Ti Diff. RTX3060
UltraHD/4K Perf.-Index 368% –11% 328% –25% 245% –13% 212% –24% 161%
Shader-Cluster 82 –17% 68 –32% 46 –17% 38 –26% 28
Raster-Engines & ROPs 7 & 112 -14% 6 & 96 ±0 6 & 96 –17% 5 & 80 –40% 3 & 48

Anders formuliert ist an dieser Stelle das GA106-Design nicht ganz ausgewogen und hätte nVidia besser mehr Raster-Engines und mehr ROPs beim Chip-Design angesetzt. Denkbar wäre ein Modell mit 4 Raster-Engines, 64 ROPs und 32 Shader-Clustern, damit hätte man selbst bei der identischen Limitierung auf 28 freigeschaltete Shader-Cluster eine klar bessere Performance-Skalierung gegenüber den größeren Ampere-Lösungen erzielt. Aber vermutlich hätte dies dann auch den GA106-Chip zu nahe an die Marke von 300mm² Chipfläche herangebracht – womit bei nVidia dann womöglich wirtschaftliche Überlegungen den Vorrang gegenüber produktpolitischen Gedankenspielen erhalten haben. Schließlich ist der GA106-Chip auch jetzt schon mit 276mm² Chipfläche recht groß für ein typisches xx60er Produkt bzw. den drittgrößten Chip im Gaming-Portfolio.