Launch-Analyse nVidia GeForce RTX 3090 Ti

Montag, 4. April 2022
 / von Leonidas
 

Zu einem vergleichsweise späten Zeitpunkt innerhalb der "Ampere"-Generation bringt nVidia mit der GeForce RTX 3090 Ti nochmals ein neues Spitzen-Modell – welches auch erstmals den Vollausbau des GA102-Chips ins Gamer-Segment bringt. Die neue Karte ist weniger eine Antwort auf AMDs im Frühjahr zu erwartenden "50er Refresh", da nVidia von diesem eigentlich keine Gefahr zu erwarten hat. Eher handelt es sich um einen gewissen Vorgriff auf die nachfolgende GeForce RTX 40 Serie – mit höheren Stromverbrauchswerten, demzufolge klar aufwendigeren Platinen, denkbarerweise nochmals höheren Listenpreisen. In diese Schiene geht die GeForce RTX 3090 Ti mit einer TDP von 450 Watt sowie Listenpreisen von 1999 Dollar bzw. 2249 Euro bereits jetzt hinein – was dann sicherlich nur noch einem Bruchteil der Grafikkarten-Käufer mundet. Was selbige im Gegenzug an Mehrperformance gemäß der hierzu ausgewerteten Launchreviews zur GeForce RTX 3090 Ti erhalten, soll mit dieser Launch-Analyse dargelegt werden.

Die GeForce RTX 3090 Ti bringt wie gesagt den Vollausbau des GA102-Chips daher, was allerdings gegenüber der regulären GeForce RTX 3090 auch nur 2 Shader-Cluster (+2,4%) mehr ergibt – und somit das Kraut nicht fettmacht. Auch der verbaute GDDR6X-Speicher mit einer Datenrate von 21 Gbps (+7,7%) wäre für sich allein zu wenig wirkungsvoll, auf dass eine solche Grafikkarte Sinn ergeben würde – respektive eine gewisse Mehrperformance erbringt. Demzufolge hat nVidia der GeForce RTX 3090 Ti satt mehr Taktrate spendiert: Auf 1560 MHz Basetakt (+160 MHz, +11,4%) sowie 1860 MHz Boosttakt (+160 MHz, +9,4%) geht es hinauf, dies ist beim Boosttakt sogar mit Abstand die höchste nominelle Taktrate innerhalb der Ampere-Generation. Die nominell am zweitschnellsten taktenden Ampere-Karten sind GeForce RTX 3050 & 3060 (auf Basis des viel kleineren GA106-Chips), deren gleichlautender Boosttakt von 1777 MHz rangiert jedoch deutlich unterhalb des Boosttakts der GeForce RTX 3090 Ti.

Lösbar war dieser beachtliche Taktratensprung – gerade für den größten Chip des Gaming-Portfolios – nur mit einem massiven Anstieg des Energieverbrauchs. Anstatt den sowieso schon hohen 350W der regulären GeForce RTX 3090 lautet die TDP-Angabe der Ti-Ausführung auf gleich 450 Watt. Die GeForce RTX 3090 Ti ist damit schon auf den ersten Blick arg Energie-ineffizient unterwegs, für (nominell) +12% mehr Rohleistung werden +29% mehr Energie benötigt. Offenbar ist dieser hohe Stromverbrauchs-Anstieg aber auch (wenigstens teilweise) notwendig, um die höheren Taktraten in der Praxis zu halten. Dabei dürfte es nVidia sicherlich auch darum gegangen sein, letztmalig innerhalb der Ampere/RDNA2-Generation noch einmal die eigene Stärke mit einem klar überlegenen Produkt zu demonstrieren. Gleichfalls gibt es beachtbare Hinweise auf eine hiermit erfolgende Vorbereitung der nachfolgenden "Ada"-Generation, zu welcher noch höhere Stromverbrauchs-Werte (und demzufolge Ansprüche an die Kühlung) kolportiert werden.

Radeon RX 6900 XT GeForce RTX 3080 Ti GeForce RTX 3090 GeForce RTX 3090 Ti
Chipbasis AMD Navi 21 XTX nVidia GA102-225 nVidia GA102-300 nVidia GA102-350
Fertigung 26,8 Mrd. Transistoren auf 519mm² Chipfäche in der 7nm-Fertigung von TSMC 28,3 Mrd. Transistoren auf 628mm² Chipfäche in der 8nm-Fertigung von Samsung
Architektur AMD RDNA2, DirectX 12 Feature-Level 12_2 nVidia Ampere, DirectX 12 Feature-Level 12_2
Features DirectX 12, OpenGL, Vulkan, Asynchronous Compute, RayTracing, VSR, FSR 1/2, RSR, FreeSync, TrueAudio Next, XConnect, SAM DirectX 12, OpenGL, Vulkan, Asynchonous Compute, RayTracing, DSR, DLDSR, DLSS, PhysX, G-Sync, FreeSync, rBAR
Technik 4 Raster-Engines, 80 Shader-Cluster, 5120 FP32-Einheiten, 320 TMUs, 80 RA-Einheiten, 128 ROPs, 4 MB Level2-Cache, 128 MB "Infinity Cache", 256 Bit GDDR6-Interface (Vollausbau) 7 Raster-Engines, 80 Shader-Cluster, 10'240 FP32-Einheiten, 320 TMUs, 80 RT-Cores v2, 320 Tensor-Cores v3, 112 ROPs, 6 MB Level2-Cache, 384 Bit GDDR6X-Interface (Salvage) 7 Raster-Engines, 82 Shader-Cluster, 10'496 FP32-Einheiten, 328 TMUs, 82 RT-Cores v2, 328 Tensor-Cores v3, 112 ROPs, 6 MB Level2-Cache, 384 Bit GDDR6X-Interface (Salvage) 7 Raster-Engines, 84 Shader-Cluster, 10'752 FP32-Einheiten, 336 TMUs, 84 RT-Cores v2, 336 Tensor-Cores v3, 112 ROPs, 6 MB Level2-Cache, 384 Bit GDDR6X-Interface (Vollausbau)
Taktraten 1825/2015/2250 MHz & 16 Gbps 1365/1665 MHz & 19 Gbps 1400/1700 MHz & 19,5 Gbps 1560/1860 MHz & 21 Gbps
Rohleistungen 20,6 TFlops & 512 GB/sec 34,1 TFlops & 912 GB/sec 35,7 TFlops & 936 GB/sec 40,0 TFlops & 1008 GB/sec
Speicherausbau 16 GB GDDR6 12 GB GDDR6X 24 GB GDDR6X 24 GB GDDR6X
Anbindung PCI Express 4.0 PCI Express 4.0 PCI Express 4.0 PCI Express 4.0
Ref/Herst./OC / / / / / / / /
Layout Dual- & TripleSlot Single-, Dual- & TripleSlot Single-, Dual- & TripleSlot Dual-, Triple- & QuadSlot
Kartenlänge Herst: 26,6-34,0cm
Ref: 26,7cm
Herst: 22,5-33,6cm
FE: 28,5cm
Herst: 21,6-33,9cm
FE: 31,3cm
Herst: 22,0-35,6cm
FE: 31,3cm
Stromstecker 2x 8pol. 1x 12pol. 1x 12pol. 1x 16pol.
off. Verbrauch 300W  (ASIC: 255W) 350W 350W 450W
Real-Verbrauch 303W 350W 359W 462W
Ausgänge HDMI 2.1, 2x DisplayPort 1.4, USB Type-C HDMI 2.1, 3x DisplayPort 1.4 HDMI 2.1, 3x DisplayPort 1.4 HDMI 2.1, 3x DisplayPort 1.4
FHD Perf.Index 2140% 2060% 2100% ~2180%
4K Perf.Index 348% 366% 376% 408%
Listenpreis $999 / 999€ $1199 / 1269€ $1499 / 1649€ $1999 / 2249€
Straßenpreis 1250-1400 Euro 1330-1500 Euro 1880-2100 Euro 2350-2500 Euro
Release 8. Dezember 2020 3. Juni 2021 24. September 2020 29. März 2022

Zur GeForce RTX 3090 Ti gibt es wieder ein Referenz-Design bzw. eine "Founders Edition", welche nVidia allerdings nur in geringer Menge in den Markt und überhaupt nicht zu den Hardware-Testern geschickt hat. Jene mussten somit ausschließlich mit Hersteller-Designs arbeiten, wobei die Grafikkarten-Hersteller (wie nicht unüblich) allein werksübertaktete Karten zur Verfügung stellten. Dies macht die exakte Betrachtung der GeForce RTX 3090 Ti nicht ganz so einfach, da nahezu jeder einzelne Hardwaretest nicht auf Referenz-Taktraten und oftmals mit Karten mit einem nochmals höheren Power-Limit stattfand (zu erwähnen die breit getestete MSI Suprim X mit 480 Watt TDP). Dabei wird es die GeForce RTX 3090 Ti auch auf Referenz-Takt geben, wie die Ankündigungen und Produkt-Webseiten der Grafikkarten-Hersteller belegen. Die einzigen Hardwaretester, welche sich dann die Arbeit des Umtaktens samt Anpassung des Power-Limits gemacht haben, um eine Referenz-Performance zu ermitteln, waren (wieder einmal) PC Games Hardware und ComputerBase

Letztgenannte Quelle liefert somit auch jene Taktraten, welche man auf Referenz-Takt bei der GeForce RTX 3090 Ti erwarten kann: 1936 MHz im Schnitt von 20 Spielen. Die sind immerhin +182 MHz mehr, als TechPowerUp seinerzeit auf einer regulären GeForce RTX 3090 gemessen hatte. Auf das genaue Megahertz kann man sich wegen der unterschiedlichen Quellen nicht versteifen, aber dies sieht doch stark danach aus, als könnte nVidia den Vorteil bei der nominellen Taktrate von +160 MHz auch in der Praxis halten bzw. vielleicht sogar leicht überbieten. Auf Realtakt gerechnet, steigt somit auch der Rohleistungs-Vorteil der Ti-Ausführung leicht von +12,1% (nominell) auf +13,1% (real). Die bei der ComputerBase im Test befindliche Asus TUF Gaming OC kam im übrigen in Folge ihrer Werksübertaktung gleich mit 1988 MHz Real-Taktrate durchs Ziel, dies sind dann nochmals +2,7% mehr Rohleistung – was allerdings nur zu +1,2% Mehrperformance unter der 4K-Auflösung führte.

Basis Durchschnitt Maximum gemessener Realtakt
AMD-Bezeichnung: "Base Clock" "Game Clock" "Boost Clock"
Radeon RX 6900 XT 1825 MHz 2015 MHz 2250 MHz 2800 MHz CB: 2265 MHz – TPU: 2233 MHz
Radeon RX 6800 XT 1825 MHz 2015 MHz 2250 MHz 2577 MHz CB: 2216 MHz – TPU: 2257 MHz
Radeon RX 6800 1700 MHz 1815 MHz 2105 MHz ? CB: 2177 MHz – TPU: 2205 MHz
Radeon RX 6700 XT 2321 MHz 2424 MHz 2581 MHz 2699 MHz CB: 2531 MHz – TPU: 2491 MHz
Radeon RX 6600 XT 1968 MHz 2359 MHz 2589 MHz ? CB: 2562 MHz
Radeon RX 6600 1626 MHz 2044 MHz 2491 MHz 2704 MHz CB: 2509 MHz – TPU: 2444 MHz
Radeon RX 6500 XT 2310 MHz 2610 MHz 2815 MHz ? TPU: 2753 MHz
nVidia-Bezeichnung: "Base Clock" "Boost Clock"
GeForce RTX 3090 Ti 1560 MHz 1860 MHz 1995 MHz CB: 1936 MHz
GeForce RTX 3090 1400 MHz 1700 MHz ? TPU: 1754 MHz
GeForce RTX 3080 Ti 1365 MHz 1665 MHz ? CB: 1784 MHz – TPU: 1780 MHz
GeForce RTX 3080 12GB 1260 MHz 1710 MHz ? unbekannt
GeForce RTX 3080 10GB 1450 MHz 1710 MHz 1995 MHz CB: 1827 MHz – TPU: 1931 MHz
GeForce RTX 3070 Ti 1575 MHz 1770 MHz 1950 MHz CB: 1878 MHz – TPU: 1861 MHz
GeForce RTX 3070 1500 MHz 1725 MHz 2040 MHz CB: 1920 MHz – TPU: 1882 MHz
GeForce RTX 3060 Ti 1410 MHz 1665 MHz 2010 MHz CB: 1900 MHz – TPU: 1877 MHz
GeForce RTX 3060 1320 MHz 1777 MHz ? grob bei 1850-1900 MHz
GeForce RTX 3050 1552 MHz 1777 MHz 1927 MHz CB: 1891 MHz – TPU: 1906 MHz
Realtakt-Angaben gemäß den Ausarbeitungen der ComputerBase (Ø 17-20 Spiele) und von TechPowerUp (Ø 22-25 Spiele)

Dies war dann – mangels weiterer solcherart Vergleiche – auch der einzige Hinweis auf die Performance-Differenz zwischen Referenz-Taktung und werksübertakteten Karten. An dieser Stelle mussten leider einige (durchaus fehlbare) Abschätzungen vorgenommen werden, damit der Performance-Effekt der GeForce RTX 3090 Ti durch die häufige Verwendung von werksübertakten Karten nicht überschätzt wird. Eine andere Schwierigkeit für diese Benchmark-Auswertung bestand darin, dass sich so einige Testberichte als methodisch zu ungenau ausgeführt für die mit der GeForce RTX 3090 Ti zu erwartenden kleinen Performance-Differenzen offenbarten. Dazu gehören zum einen Tests, wo sich primär werksübertaktete Karten tummeln – und dies manchmal sogar ohne Kennzeichnung, um welche Ausführungen es sich genau handelt. Selbstverständlich ist der damit einhergehende Fehlerquotient gering (bestenfalls 1-3 Prozentpunkte), aber je kleiner die zu ermittelnden Differenzen werden, um so wirkmächtiger werden dann natürlich auch solche (scheinbar) kleinen Fehlerraten.

In eine ähnliche Kerbe schlägt die Verwendung uralter Testwerte bei früher veröffentlichten Grafikkarten. Einzelne Testberichte haben es tatsächlich fertigbekommen, die reguläre GeForce RTX 3090 mit ihren Testresultaten vom Launchtag anno September 2020 durch den (neuen) Test zu schicken. Dies schmeichelt der GeForce RTX 3090 Ti, welche dann auf brandneuen Treibern gegen die reguläre GeForce RTX 3090 auf faktisch Launch-Treiber getestet wird – ist aber natürlich für einen solchen Vergleich der geringen Differenzen einfach nicht gangbar. Dabei hätten es die betreffenden Hardwaretester selber erkennen können, dass etwas faul ist im Staate Dänemark, wenn der Performance-Abstand zwischen GeForce RTX 3090 und 3090 Ti beachtbar größer als zwischen GeForce RTX 3080 und 3090 herauskommt – oder wenn eine GeForce RTX 3080 12GB mit nur 70 Shader-Clustern die GeForce RTX 3080 Ti mit 80 Shader-Clustern schlagen können soll. An dieser Stelle gab es einige "Ausfälle" bzw. Hardwaretests, deren Ergebnisse selbst bei aller Liebe nicht mit gutem Gewissen verwendet werden konnten.

Alle Probleme zusammengenommen reduzierten die Auswahl der "qualifizierten" Hardwaretests dann auf eine unüblich geringe Größe von nur 8 Reviews. Davon haben einige keine Benchmarks unter FullHD & WQHD angetreten – was eine bei der GeForce RTX 3090 Ti sicherlich verzeihbare Einsparung darstellt, letztlich aber nicht genug Benchmarks für eine echte Performance-Einordnung unter diesen beiden Auflösungen zuläßt. Deren viel schwächere Performance-Skalierung kommt natürlich auch einer absoluten Enthusiasten-Karte wie der GeForce RTX 3090 Ti wenig entgegen, unter der FullHD-Auflösung läßt sich nVidias neues Top-Modell gerade einmal auf ca. 4% Mehrperformance gegenüber der regulären GeForce RTX 3090 einschätzen. Allerdings reicht dies trotzdem dafür aus, damit die GeForce RTX 3090 Ti der Radeon RX 6900 XT unter der FullHD-Auflösung deren dortige Leistungskrone wieder abnimmt – der einzigen Performance-Disziplin, wo AMD zuletzt vorn lag.

FullHD/1080p-Performance 6800XT 6900XT 3080-10G 3080-12G 3080Ti 3090 3090Ti
ComputerBase  (19 Tests) 105,4% 115,2% 100% 102,9% 108,2% 114,4% 118,0%
KitGuru  (12 Tests) 108,3% 115,8% 100% - 107,5% 109,2% 117,3%
PC Games Hardware  (20 Tests) 104,3% - 100% - - 110,5% 114,9%
TechPowerUp  (25 Tests) 102,2% 106,7% 100% - 106,7% 107,9% 112,4%
TechSpot  (12 Tests) 103,2% 108,4% 100% 103,7% 105,3% 107,4% 109,5%
Tweakers  (10 Tests) 111,0% 118,3% 100% - 110,0% 112,5% 117,4%
werksübertaktete Karten sind in blauer Schrift markiert (angegeben ist jeweils die werksübertaktete Performance); gesamte ausgewertete Benchmark-Anzahl: ~570
WQHD/1440p-Performance 6800XT 6900XT 3080-10G 3080-12G 3080Ti 3090 3090Ti
ComputerBase  (19 Tests) 103,6% 114,0% 100% 103,0% 109,5% 115,2% 120,3%
KitGuru  (12 Tests) 105,6% 114,1% 100% - 108,7% 110,7% 121,4%
PC Games Hardware  (20 Tests) 102,9% - 100% - - 112,7% 118,9%
TechPowerUp  (25 Tests) 103,6% 108,3% 100% - 109,5% 110,7% 119,0%
TechSpot  (12 Tests) 100,7% 109,6% 100% 104,8% 108,2% 111,6% 116,4%
Tweakers  (10 Tests) 106,2% 114,0% 100% - 109,2% 112,2% 118,6%
werksübertaktete Karten sind in blauer Schrift markiert (angegeben ist jeweils die werksübertaktete Performance); gesamte ausgewertete Benchmark-Anzahl: ~570