Launch-Analyse nVidia GeForce RTX 40 "SUPER" Refresh

Sonntag, 11. Februar 2024
 / von Leonidas
 

Mit dem über drei Wochen verteilten Launch der neuen Grafikkarten-Modelle des GeForce RTX 40 "SUPER" Refreshs versucht nVidia, neuen Schwung ins Grafikkarten-Geschäft der oberen Preisregionen zu bringen. Gleichzeitig ergibt sich hiermit die Gelegenheit, den einen oder anderen Fehler des originalen GeForce RTX 40 Portfolios auszubessern, ohne zum verpönten Mittel der direkten Preissenkung schreiten zu müssen. Mittels der drei neuen Grafikkarten ergaben sich neue Benchmarks in Hülle & Fülle, durch die Zerstückelung des Launches allerdings auch etwas von zunehmender Langeweile der Grafikkarten-Käufer und Hardware-Enthusiasten begleitet. Deswegen gibt es diese Launch-Analyse für alle Modelle des "SUPER"-Refreshs zusammen, um dieses Thema nur einmal und dafür in vollständiger Form abhandeln zu können. Wo sich die neuen Karten einordnen lassen, ob die alten Modelle noch eine Chance haben und wie dies alles im Vergleich zu AMDs Angeboten aussieht, soll dieser Artikel ermitteln.

Mittels des GeForce RTX 40 "SUPER"-Refresh bringt nVidia jeweils einen "SUPER"-Nachfolger zu GeForce RTX 4070, 4070 Ti und 4080. Ohne neue Grafikchips für seine Refresh-Serie (regelrechte Refresh-Chips hat es bei nVidia kaum jemals gegeben) konnte nVidia logischerweise nur mit dem arbeiten, was man bereits an Ada-Lovelace-basierten Grafikchips im Programm hat. Teilweise konnte nVidia noch vorhandene Reserven anzapfen, teilweise ging es sogar einen Grafikchip nach oben. Angesichts der preislichen Ansetzung war dabei die Zielsetzung klar: Drei neue "SUPER"-Lösungen kommen in den Markt, wobei eine der vorherigen Grafikkarten preisgesenkt weiterhin im Programm bleibt und die anderen beiden hingegen den Auslauf-Status erreichen.

Den größten Hardware-Sprung gibt es dabei bei der kleinsten "SUPER"-Lösungen, der "GeForce RTX 4070 Super". Jene benutzt zwar wie die GeForce RTX 4070 den AD104-Chip, allerdings in einer wesentlich stärkeren Ausführung nahe des Vollausbaus – welchen es wie bekannt mit der GeForce RTX 4070 Ti gibt. Eben wegen der technischen Nähe zur GeForce RTX 4070 Ti (56 zu 60 Shader-Cluster) erhoffte man sich von der GeForce RTX 4070 Super oftmals das Performance-Level der GeForce RTX 4070 Ti, was allerdings wegen der stark abweichenden TDP (220W zu 285W) nicht wirklich realistisch ist. Gegenüber der GeForce RTX 4070 dürfte es jedoch einen guten Performance-Sprung geben, wobei jene ältere Karte weiterhin im Markt bleibt und mittels eines um 50 Dollar abgesenkten Listenpreises besser gegenüber der Radeon RX 7800 XT konkurrieren soll.

GeForce RTX 4070 GeForce RTX 4070 Super
AD104-250, 46 Shader-Cluster @ 192 Bit Speicherinterface, 36 MB L2, 12 GB GDDR6X, 1920/2475 MHz & 21 Gbps, 200W TDP, $549 Listenpreis AD104-350, 56 Shader-Cluster @ 192 Bit Speicherinterface, 48 MB L2, 12 GB GDDR6X, 1980/2475 MHz & 21 Gbps, 220W TDP, $599 Listenpreis
+22% Shader-Cluster, +33% Level2-Cache, +3% Base-Takt, +10% TDP, +9% Listenpreis

Nominell erhält die "GeForce RTX 4070 Ti Super" einen ähnlich ansprechenden Hardware-Sprung: Immerhin gibt es hier den Wechsel vom AD104- zum AD103-Chip, ein um ein Drittel größeres Speicherinterface samt ebenso vergrößerer Speichermenge. Allerdings sind die auf die Rechenleistung abzielenden Änderungen mit nur +10% mehr Shader-Cluster zu zudem unveränderter TDP keine großartigen Voraussetzungen für ein ähnliches Leistungsplus wie bei der GeForce RTX 4070 Super. Die GeForce RTX 4070 Ti Super geht zum selben Listenpreis wie die GeForce RTX 4070 Ti in den Markt, welche ihrerseits nunmehr im Auslauf-Status ist. In der Praxis hat sich inzwischen eine bedeutsam niedrigere Preislage bei der GeForce RTX 4070 Ti ergeben, zu welcher jene durchaus noch eine gewisse Berechtigung zwischen GeForce RTX 4070 Super und 4070 Ti Super hat.

GeForce RTX 4070 Ti GeForce RTX 4070 Ti Super
AD104-400, 60 Shader-Cluster @ 192 Bit Speicherinterface, 48 MB L2, 12 GB GDDR6X, 2310/2610 MHz & 21 Gbps, 285W TDP, $799 Listenpreis AD103-275, 66 Shader-Cluster @ 256 Bit Speicherinterface, 48 MB L2, 16 GB GDDR6X, 2340/2610 MHz & 21 Gbps, 285W TDP, $799 Listenpreis
+10% Shader-Cluster, +33% Speicherinterface, +33% VRAM, +1% Base-Takt

Den klar kleinsten Sprung legt dann die "GeForce RTX 4080 Super" hin, bei welcher nVidia einfach nur noch die letzten Reserven des AD103-Chips bemüht. Da es wiederum keine höhere TDP gibt, ist das Performance-Potential dieser größten "SUPER"-Lösung arg begrenzt. Der springende Punkt der Karte ist jedoch das damit einhergehende faktische Eingeständnis nVidias, dass die vorherige GeForce RTX 4080 mit 1199 Dollar Listenpreis gravierend falsch ausgepreist war – ein Fehler, welchen die GeForce RTX 4080 Super mit ihrem um 200 Dollar niedrigeren Preispunkt nunmehr ausbügelt. Die vorherige GeForce RTX 4080 erreicht damit natürlich auch den Auslaufstatus und wird derzeit auch nirgendwo günstiger als ihre "SUPER"-Nachfolgerin angeboten. Aufgrund offenbar nicht gerade geringer Lagerbestände im Einzelhandel wäre eigentlich noch mit Abverkaufsaktionen zugunsten der GeForce RTX 4080 zu rechnen, auch wenn hiervon derzeit noch nichts zu sehen ist.

GeForce RTX 4080 GeForce RTX 4080 Super
AD103-300, 76 Shader-Cluster @ 256 Bit Speicherinterface, 64 MB L2, 16 GB GDDR6X, 2205/2505 MHz & 22,4 Gbps, 320W TDP, $1199 Listenpreis AD103-400, 80 Shader-Cluster @ 256 Bit Speicherinterface, 64 MB L2, 16 GB GDDR6X, 2295/2550 MHz & 23 Gbps, 320W TDP, $999 Listenpreis
+5% Shader-Cluster, +4% Base-Takt, +2% Boost-Takt, +3% Speicher-Takt, –17% Listenpreis

Keinen "SUPER"-Nachfolger erhält die GeForce RTX 4090, wobei dies aufgrund der klaren Performance-Führerschaft dieser Karte auch nicht wirklich notwendig ist. Zudem legt die GeForce RTX 4080 Super viel zu wenig oben drauf, um irgendwie den Performance-Abstand zur GeForce RTX 4090 zu gefährden. Zu diesem Enthusiasten-Modell schwirren zwar gern Thesen über eine "GeForce RTX 4090 Super" oder auch "GeForce RTX 4090 Ti" durch die Gegend, derzeit dürfte für nVidia aber eher schon der Punkt zählen, die Ada-Lovelace-Generation nicht "zu gut" werden zu lassen. Alles was ein weiteres Spitzen-Modell oben drauf legen würde, reduziert schließlich den Generations-Gewinns gegenüber der 2025 zu erwartenden "Blackwell"-Generation (GeForce RTX 50 Serie). Inwiefern der "SUPER"-Refresh später hingegen noch zur GeForce RTX 4060 /Ti Serie getragen wird, ist denkbar, bleibt jedoch abzuwarten.

GeForce RTX 4070 GeForce RTX 4070 Super GeForce RTX 4070 Ti Super GeForce RTX 4080 Super
Chipbasis nVidia AD104-250 nVidia AD104-350 nVidia AD103-275 nVidia AD103-400
Fertigung 35,8 Mrd. Transistoren auf 295mm² Chipfäche in der 5nm-Fertigung von TSMC 45,9 Mrd. Transistoren auf 379mm² Chipfäche in der 5nm-Fertigung von TSMC
Architektur nVidia Ada Lovelace, DirectX 12 Feature-Level 12_2
Features DirectX 12, OpenGL, Vulkan, RayTracing, DSR, DLDSR, DLSS 2/3, PhysX, G-Sync, FreeSync, rBAR
Technik 4 Raster-Engines, 46 Shader-Cluster, 5888 FP32-Einheiten, 184 TMUs, 46 RT-Cores v3, 184 Tensor-Cores v4, 64 ROPs, 36 MB Level2-Cache, 192 Bit GDDR6X-Interface (Salvage) 5 Raster-Engines, 56 Shader-Cluster, 7168 FP32-Einheiten, 224 TMUs, 56 RT-Cores v3, 224 Tensor-Cores v4, 80 ROPs, 48 MB Level2-Cache, 192 Bit GDDR6X-Interface (Salvage) 6 Raster-Engines, 66 Shader-Cluster, 8448 FP32-Einheiten, 264 TMUs, 66 RT-Cores v3, 264 Tensor-Cores v4, 96 ROPs, 48 MB Level2-Cache, 256 Bit GDDR6X-Interface (Salvage) 7 Raster-Engines, 80 Shader-Cluster, 10'240 FP32-Einheiten, 320 TMUs, 80 RT-Cores v3, 320 Tensor-Cores v4, 112 ROPs, 64 MB Level2-Cache, 256 Bit GDDR6X-Interface (Vollausbau)
Taktraten 1920/2475 MHz & 21 Gbps 1980/2475 MHz & 21 Gbps 2340/2610 MHz & 21 Gbps 2295/2550 MHz & 23 Gbps
Rohleistungen 29,1 TFlops & 504 GB/sec 35,5 TFlops & 504 GB/sec 44,1 TFlops & 672 GB/sec 52,2 TFlops & 736 GB/sec
Speicherausbau 12 GB GDDR6X 12 GB GDDR6X 16 GB GDDR6X 16 GB GDDR6X
Anbindung PCI Express 4.0 x16 PCI Express 4.0 x16 PCI Express 4.0 x16 PCI Express 4.0 x16
Ref/AIBs/OC / / / / / / / /
Layout Dual- & TripleSlot Dual- & TripleSlot Dual- & TripleSlot Dual-, Triple- & QuadSlot
Kartenlänge FE: 24,0cm
AIBs: 22,6-34,9cm
FE: 24,0cm
AIBs: 22,7-34,2cm
AIBs: 24,0-35,6cm FE: 31,0cm
AIBs: 25,4-35,8cm
Stromstecker FE: 1x 16pol.
AIBs: 1x 8pol.
1x 16pol. 1x 16pol. 1x 16pol.
off. Verbrauch 200W 220W 285W 320W
Ausgänge HDMI 2.1a, 3x DisplayPort 1.4a HDMI 2.1a, 3x DisplayPort 1.4a HDMI 2.1a, 3x DisplayPort 1.4a HDMI 2.1a, 3x DisplayPort 1.4a
Listenpreis $549 / 609€
(zum Launch: $599/659€)
$599 / 659€ $799 / 889€ $999 / 1109€
Release 13. April 2023 17. Januar 2024 24. Januar 2024 31. Januar 2024

Bei den erreichten realen Taktraten bewegt sich zwischen dem "SUPER"-Refresh und den jeweiligen Vorgänger-Modellen mehr oder weniger gar nichts, auch das allgemeine Taktraten-Niveau der drei neuen Karten liegt vergleichsweise ähnlich bei um die 2.7 GHz. Es gibt allenfalls eine kleine Tendenz zu minimal niedrigeren Taktraten gegenüber den jeweiligen Vorgänger-Modellen – was denkbarerweise daran liegt, dass die "SUPER"-Modelle durchgehend mehr freigeschaltete Shader-Cluster zu zweimal derselben TDP und nur einmal einer maßvoll höheren TDP bieten. Dass da die realen Taktraten geringfügig niedriger ausfallen, wäre nicht verwunderlich: Immerhin kann nVidia auf Basis derselben Grafikchips nicht zaubern, und von beachtbaren Verbesserungen der Fertigungsqualität ist auch nichts bekannt.

Basis Durchschnitt Max gemessener Realtakt
AMD-Bezeichnung: "Base Clock" "Game Clock" "Boost Clock" "Max Clock" CB TPU PCGH Tom's
Radeon RX 7900 XTX 1900 MHz 2300 MHz 2500 MHz ? 2556 MHz 2612 MHz 2.60 GHz 2507 MHz
Radeon RX 7900 XT 1500 MHz 2000 MHz 2400 MHz ? 2566 MHz 2687 MHz 2.40 GHz 2515 MHz
Radeon RX 7800 XT 1295 MHz 2124 MHz 2430 MHz ? 2386 MHz 2425 MHz 2.35 GHz 2334 MHz
Radeon RX 7700 XT 1700 MHz 2171 MHz 2544 MHz ? 2507 MHz 2560 MHz 2.56 GHz 2535 MHz
Radeon RX 7600 XT 1980 MHz 2470 MHz 2755 MHz ? 2716 MHz 2790 MHz 2.79 GHz 2707 MHz
Radeon RX 7600 1720 MHz 2250 MHz 2625 MHz ? 2645 MHz 2613 MHz 2.61 GHz 2631 MHz
nVidia-Bezeichnung: "Base Clock" "Boost Clock" "Max Clock" CB TPU PCGH Tom's
GeForce RTX 4090 2235 MHz 2520 MHz ? 2744 MHz 2701 MHz 2.74 GHz 2752 MHz
GeForce RTX 4080 Super 2295 MHz 2550 MHz ? 2729 MHz 2715 MHz 2.73 GHz 2787 MHz
GeForce RTX 4080 2205 MHz 2505 MHz ? 2725 MHz 2737 MHz 2.78 GHz 2783 MHz
GeForce RTX 4070 Ti Super 2340 MHz 2610 MHz ? 2785 MHz 2708 MHz 2.67 GHz 2745 MHz
GeForce RTX 4070 Ti 2310 MHz 2610 MHz ? 2802 MHz - 2737 MHz 2839 MHz
GeForce RTX 4070 Super 1980 MHz 2475 MHz ? 2735 MHz 2715 MHz 2.72 GHz 2718 MHz
GeForce RTX 4070 1920 MHz 2475 MHz ? 2758 MHz 2762 MHz 2769 MHz 2722 MHz
GeForce RTX 4060 Ti 2310 MHz 2535 MHz ? 2714 MHz 2767 MHz 2.74 GHz 2783 MHz
GeForce RTX 4060 1830 MHz 2460 MHz ? 2738 MHz 2640 MHz 2.69 GHz 2726 MHz
Intel-Bezeichnung: - "Graphics Clock" "Max Clock" CB TPU PCGH Tom's
Arc A770 16GB - 2100 MHz 2400 MHz - 2386 MHz 2.33 GHz 2311 MHz
Arc A750 - 2050 MHz 2400 MHz - 2394 MHz 2.39 GHz 2379 MHz
Arc A580 (AIBs) - 2000 MHz 2400 MHz 2396 MHz 2354 MHz 2.33 GHz 2325 MHz
Realtakt-Angaben gemäß den Ausarbeitungen der ComputerBase (Ø 11-23 Spiele), TechPowerUp (Ø 22-25 Spiele), PC Games Hardware (üblicherweise Praxis-Angaben, zuzüglich teilweise MHz-genaue Werte aus Ø 20 Spiele) und Tom's Hardware (Ø 15 Spiele, WQHD) von jeweils Referenz-Varianten (oder auf Referenz-Taktung/TDP laufend); letzte Tabelle mit allen Radeon RX 6000 & GeForce RTX 30 Modellen siehe hier

Grafikkarten-Reviews zu den drei neuen "SUPER"-Modellen gab es in den letzten Januar-Wochen bis zum Abwinken, wobei die Hardwaretester viel dieser Arbeit doppelt & dreifach machen mussten, um bei jedem Launch zeitgenau dabei zu sein. Die Hauptaufgabe – die Information des Lesers – blieb dabei etwas auf der Strecke, denn den Launch-Reviews zur GeForce RTX 4070 Super fehlten ein wenig die Benchmarks der GeForce RTX 4070 Ti Super (zum Abschluß nach oben hin), genauso wie den Launch-Reviews zur GeForce RTX 4070 Ti Super aus selbem Grund die Benchmarks zur GeForce RTX 4080 Super fehlten. Zudem ergab sich beim Launch der GeForce RTX 4070 Ti Super eine Performance-Unstimmigkeit mit den MSI-Modellen, das rettende BIOS-Update wurde erst nach dem Launchtag geliefert. Erst mit dem Launch der letzten und größten "SUPER"-Karte ergibt sich ein vollständiges Bild – welches nachfolgend auch die Grundlage aller weiteren Betrachtungen bilden wird.

Denkbarerweise wegen der enormen Arbeitsbelastung durch diesen dreifachen Launch haben uns allerdings nur die wenigstens Hardwaretester den Gefallen getan und die jüngsten Treiberversionen von AMD & nVidia für alle Vergleichs-Modelle angesetzt. Mit dieser (kleinen) Ungenauigkeit muß man derzeit leben, um überhaupt auf eine gewisse Anzahl an wertbaren Benchmark-Daten zu kommen. Denn leider mussten aus der Unmenge an verfügbaren Benchmarks auch viele Testberichte disqualifiziert werden, weil uralte Treiber für die Vergleichs-Modelle benutzt wurden oder aber generell in Frage stand, welche Karten hierbei genau vermessen wurden (Referenz-Varianten oder aber Werksübertaktungen). Die Frage der (weitgehenden) Treiber-Gleichheit ist speziell kritisch bei Performance-Vergleichen von derart eng aneinanderliegenden Modellen, da können alte Treiber das ganze Performance-Bild verzerren. Demzufolge konnten auch nur die Werte von 14 Launch-Reviews für diesen Artikel herangezogen werden, obwohl die Verwendung von weit mehr Testberichten und Werten geplant war.

Tests CPU Treiber (neben SUPER-SKUs) Werks-OC
ComputerBase 22 / 8 Ryzen 9 7950X3D 23.11.1 & 546.17
Cowcotland 11 / 5 Core i7-12700KF 23.10.2 & 545.92 4070Ti, 4070TiS
Digital Foundry 8 / 6 Core i9-13900K ? ?
Hardware & Co 20 / 18 Core i9-14900K (HT off) 23.12.1 & 546.52 7800XT
Hardware Unboxed 12 / 10 Ryzen 7 7800X3D 24.1.1 & 551.23 ?
KitGuru 12 / 8 Core i9-13900KS 23.12.1 & 546.33
Linus Tech Tips 8 / – Ryzen 7 7800X3D ? ?
Paul's Hardware 9 / 4 Ryzen 7 7800X3D 23.12.1 & 551.15/22 4070Ti
PC Games Hardware 20 / 10 Core i9-13900KS @ 5.7 GHz (E-Kerne off) aktuelle Treiber
PurePC 10 / 7 Core i9-14900K ? 4070Ti, 4070TiS
Quasarzone 15 / – Ryzen 9 7950X3D 23.12.1 & 546.52 ?
TechPowerUp 25 / 10 Core i9-14900K 23.11.1 & 546.17 ?
Tom's Hardware 9 / 6 Core i9-13900K ? ?
Tweakers 10 / 3 Core i9-13900K @ 5.5 GHz (E-Kerne off) 23.12.1 & 546.52 4070Ti
"Tests" = Anzahl der jeweils benutzten Benchmark-Spiele unter gewöhnlichem Raster-Rendering bzw. unter RayTracing

Bezüglich werksübertakteter Modelle gab es bei diesem Launch bzw. den Benchmarks hierzu nur wenig zu beachten. Logischerweise basieren alle Benchmarks zu GeForce RTX 4070 Ti und 4070 Ti Super Karten auf Hersteller-Modellen, da nVidia zu diesen beiden Karten keine Founders Edition aufgelegt hat. Allerdings waren auch viele Hersteller-Modelle ohne Werksübertaktung im Einsatz, einige Hardwaretester simulieren auch schlicht die Referenz-Performance durch eine entsprechende Umtaktung. Dort, wo ein werksübertaktetes Modell identifiziert werden konnte, wurde in den nachfolgenden Performance-Tabellen der originale Performance-Wert (inkl. Werksübertaktung) notiert, dies jedoch für die Performance-Auswertung ("gemittelte Performance") jeweils auf den Referenz-Takt normalisiert. Die hierbei benutzten Performance-Offsets waren mit 1-2 Prozentpunkte erneut klein, da sich keine herausragenden Werksübertaktungen im Test befanden. Bei der exakten Dokumentation der jeweils benutzten Grafikkarten haben einige Hardwaretests allerdings noch "Optimierungs-Potential".