Launch-Analyse nVidia GeForce RTX 40 "SUPER" Refresh

Sonntag, 11. Februar 2024

/ von Leonidas

Mit dem über drei Wochen verteilten Launch der neuen Grafikkarten-Modelle des GeForce RTX 40 "SUPER" Refreshs versucht nVidia, neuen Schwung ins Grafikkarten-Geschäft der oberen Preisregionen zu bringen. Gleichzeitig ergibt sich hiermit die Gelegenheit, den einen oder anderen Fehler des originalen GeForce RTX 40 Portfolios auszubessern, ohne zum verpönten Mittel der direkten Preissenkung schreiten zu müssen. Mittels der drei neuen Grafikkarten ergaben sich neue Benchmarks in Hülle & Fülle, durch die Zerstückelung des Launches allerdings auch etwas von zunehmender Langeweile der Grafikkarten-Käufer und Hardware-Enthusiasten begleitet. Deswegen gibt es diese Launch-Analyse für alle Modelle des "SUPER"-Refreshs zusammen, um dieses Thema nur einmal und dafür in vollständiger Form abhandeln zu können. Wo sich die neuen Karten einordnen lassen, ob die alten Modelle noch eine Chance haben und wie dies alles im Vergleich zu AMDs Angeboten aussieht, soll dieser Artikel ermitteln.

Mittels des GeForce RTX 40 "SUPER"-Refresh bringt nVidia jeweils einen "SUPER"-Nachfolger zu GeForce RTX 4070, 4070 Ti und 4080. Ohne neue Grafikchips für seine Refresh-Serie (regelrechte Refresh-Chips hat es bei nVidia kaum jemals gegeben) konnte nVidia logischerweise nur mit dem arbeiten, was man bereits an Ada-Lovelace-basierten Grafikchips im Programm hat. Teilweise konnte nVidia noch vorhandene Reserven anzapfen, teilweise ging es sogar einen Grafikchip nach oben. Angesichts der preislichen Ansetzung war dabei die Zielsetzung klar: Drei neue "SUPER"-Lösungen kommen in den Markt, wobei eine der vorherigen Grafikkarten preisgesenkt weiterhin im Programm bleibt und die anderen beiden hingegen den Auslauf-Status erreichen.

Den größten Hardware-Sprung gibt es dabei bei der kleinsten "SUPER"-Lösungen, der "GeForce RTX 4070 Super". Jene benutzt zwar wie die GeForce RTX 4070 den AD104-Chip, allerdings in einer wesentlich stärkeren Ausführung nahe des Vollausbaus – welchen es wie bekannt mit der GeForce RTX 4070 Ti gibt. Eben wegen der technischen Nähe zur GeForce RTX 4070 Ti (56 zu 60 Shader-Cluster) erhoffte man sich von der GeForce RTX 4070 Super oftmals das Performance-Level der GeForce RTX 4070 Ti, was allerdings wegen der stark abweichenden TDP (220W zu 285W) nicht wirklich realistisch ist. Gegenüber der GeForce RTX 4070 dürfte es jedoch einen guten Performance-Sprung geben, wobei jene ältere Karte weiterhin im Markt bleibt und mittels eines um 50 Dollar abgesenkten Listenpreises besser gegenüber der Radeon RX 7800 XT konkurrieren soll.

GeForce RTX 4070		GeForce RTX 4070 Super
AD104-250, 46 Shader-Cluster @ 192 Bit Speicherinterface, 36 MB L2, 12 GB GDDR6X, 1920/2475 MHz & 21 Gbps, 200W TDP, $549 Listenpreis	➔	AD104-350, 56 Shader-Cluster @ 192 Bit Speicherinterface, 48 MB L2, 12 GB GDDR6X, 1980/2475 MHz & 21 Gbps, 220W TDP, $599 Listenpreis
+22% Shader-Cluster, +33% Level2-Cache, +3% Base-Takt, +10% TDP, +9% Listenpreis

Nominell erhält die "GeForce RTX 4070 Ti Super" einen ähnlich ansprechenden Hardware-Sprung: Immerhin gibt es hier den Wechsel vom AD104- zum AD103-Chip, ein um ein Drittel größeres Speicherinterface samt ebenso vergrößerer Speichermenge. Allerdings sind die auf die Rechenleistung abzielenden Änderungen mit nur +10% mehr Shader-Cluster zu zudem unveränderter TDP keine großartigen Voraussetzungen für ein ähnliches Leistungsplus wie bei der GeForce RTX 4070 Super. Die GeForce RTX 4070 Ti Super geht zum selben Listenpreis wie die GeForce RTX 4070 Ti in den Markt, welche ihrerseits nunmehr im Auslauf-Status ist. In der Praxis hat sich inzwischen eine bedeutsam niedrigere Preislage bei der GeForce RTX 4070 Ti ergeben, zu welcher jene durchaus noch eine gewisse Berechtigung zwischen GeForce RTX 4070 Super und 4070 Ti Super hat.

GeForce RTX 4070 Ti		GeForce RTX 4070 Ti Super
AD104-400, 60 Shader-Cluster @ 192 Bit Speicherinterface, 48 MB L2, 12 GB GDDR6X, 2310/2610 MHz & 21 Gbps, 285W TDP, $799 Listenpreis	➔	AD103-275, 66 Shader-Cluster @ 256 Bit Speicherinterface, 48 MB L2, 16 GB GDDR6X, 2340/2610 MHz & 21 Gbps, 285W TDP, $799 Listenpreis
+10% Shader-Cluster, +33% Speicherinterface, +33% VRAM, +1% Base-Takt

Den klar kleinsten Sprung legt dann die "GeForce RTX 4080 Super" hin, bei welcher nVidia einfach nur noch die letzten Reserven des AD103-Chips bemüht. Da es wiederum keine höhere TDP gibt, ist das Performance-Potential dieser größten "SUPER"-Lösung arg begrenzt. Der springende Punkt der Karte ist jedoch das damit einhergehende faktische Eingeständnis nVidias, dass die vorherige GeForce RTX 4080 mit 1199 Dollar Listenpreis gravierend falsch ausgepreist war – ein Fehler, welchen die GeForce RTX 4080 Super mit ihrem um 200 Dollar niedrigeren Preispunkt nunmehr ausbügelt. Die vorherige GeForce RTX 4080 erreicht damit natürlich auch den Auslaufstatus und wird derzeit auch nirgendwo günstiger als ihre "SUPER"-Nachfolgerin angeboten. Aufgrund offenbar nicht gerade geringer Lagerbestände im Einzelhandel wäre eigentlich noch mit Abverkaufsaktionen zugunsten der GeForce RTX 4080 zu rechnen, auch wenn hiervon derzeit noch nichts zu sehen ist.

GeForce RTX 4080		GeForce RTX 4080 Super
AD103-300, 76 Shader-Cluster @ 256 Bit Speicherinterface, 64 MB L2, 16 GB GDDR6X, 2205/2505 MHz & 22,4 Gbps, 320W TDP, $1199 Listenpreis	➔	AD103-400, 80 Shader-Cluster @ 256 Bit Speicherinterface, 64 MB L2, 16 GB GDDR6X, 2295/2550 MHz & 23 Gbps, 320W TDP, $999 Listenpreis
+5% Shader-Cluster, +4% Base-Takt, +2% Boost-Takt, +3% Speicher-Takt, –17% Listenpreis

Keinen "SUPER"-Nachfolger erhält die GeForce RTX 4090, wobei dies aufgrund der klaren Performance-Führerschaft dieser Karte auch nicht wirklich notwendig ist. Zudem legt die GeForce RTX 4080 Super viel zu wenig oben drauf, um irgendwie den Performance-Abstand zur GeForce RTX 4090 zu gefährden. Zu diesem Enthusiasten-Modell schwirren zwar gern Thesen über eine "GeForce RTX 4090 Super" oder auch "GeForce RTX 4090 Ti" durch die Gegend, derzeit dürfte für nVidia aber eher schon der Punkt zählen, die Ada-Lovelace-Generation nicht "zu gut" werden zu lassen. Alles was ein weiteres Spitzen-Modell oben drauf legen würde, reduziert schließlich den Generations-Gewinns gegenüber der 2025 zu erwartenden "Blackwell"-Generation (GeForce RTX 50 Serie). Inwiefern der "SUPER"-Refresh später hingegen noch zur GeForce RTX 4060 /Ti Serie getragen wird, ist denkbar, bleibt jedoch abzuwarten.

	GeForce RTX 4070	GeForce RTX 4070 Super	GeForce RTX 4070 Ti Super	GeForce RTX 4080 Super
Chipbasis	nVidia AD104-250	nVidia AD104-350	nVidia AD103-275	nVidia AD103-400
Fertigung	35,8 Mrd. Transistoren auf 295mm² Chipfäche in der 5nm-Fertigung von TSMC		45,9 Mrd. Transistoren auf 379mm² Chipfäche in der 5nm-Fertigung von TSMC
Architektur	nVidia Ada Lovelace, DirectX 12 Feature-Level 12_2
Features	DirectX 12, OpenGL, Vulkan, RayTracing, DSR, DLDSR, DLSS 2/3, PhysX, G-Sync, FreeSync, rBAR
Technik	4 Raster-Engines, 46 Shader-Cluster, 5888 FP32-Einheiten, 184 TMUs, 46 RT-Cores v3, 184 Tensor-Cores v4, 64 ROPs, 36 MB Level2-Cache, 192 Bit GDDR6X-Interface (Salvage)	5 Raster-Engines, 56 Shader-Cluster, 7168 FP32-Einheiten, 224 TMUs, 56 RT-Cores v3, 224 Tensor-Cores v4, 80 ROPs, 48 MB Level2-Cache, 192 Bit GDDR6X-Interface (Salvage)	6 Raster-Engines, 66 Shader-Cluster, 8448 FP32-Einheiten, 264 TMUs, 66 RT-Cores v3, 264 Tensor-Cores v4, 96 ROPs, 48 MB Level2-Cache, 256 Bit GDDR6X-Interface (Salvage)	7 Raster-Engines, 80 Shader-Cluster, 10'240 FP32-Einheiten, 320 TMUs, 80 RT-Cores v3, 320 Tensor-Cores v4, 112 ROPs, 64 MB Level2-Cache, 256 Bit GDDR6X-Interface (Vollausbau)
Taktraten	1920/2475 MHz & 21 Gbps	1980/2475 MHz & 21 Gbps	2340/2610 MHz & 21 Gbps	2295/2550 MHz & 23 Gbps
Rohleistungen	29,1 TFlops & 504 GB/sec	35,5 TFlops & 504 GB/sec	44,1 TFlops & 672 GB/sec	52,2 TFlops & 736 GB/sec
Speicherausbau	12 GB GDDR6X	12 GB GDDR6X	16 GB GDDR6X	16 GB GDDR6X
Anbindung	PCI Express 4.0 x16	PCI Express 4.0 x16	PCI Express 4.0 x16	PCI Express 4.0 x16
Ref/AIBs/OC	✓ / ✓ / ✓	✓ / ✓ / ✓	✗ / ✓ / ✓	✓ / ✓ / ✓
Layout	Dual- & TripleSlot	Dual- & TripleSlot	Dual- & TripleSlot	Dual-, Triple- & QuadSlot
Kartenlänge	FE: 24,0cm AIBs: 22,6-34,9cm	FE: 24,0cm AIBs: 22,7-34,2cm	AIBs: 24,0-35,6cm	FE: 31,0cm AIBs: 25,4-35,8cm
Stromstecker	FE: 1x 16pol. AIBs: 1x 8pol.	1x 16pol.	1x 16pol.	1x 16pol.
off. Verbrauch	200W	220W	285W	320W
Ausgänge	HDMI 2.1a, 3x DisplayPort 1.4a	HDMI 2.1a, 3x DisplayPort 1.4a	HDMI 2.1a, 3x DisplayPort 1.4a	HDMI 2.1a, 3x DisplayPort 1.4a
Listenpreis	$549 / 609€ (zum Launch: $599/659€)	$599 / 659€	$799 / 889€	$999 / 1109€
Release	13. April 2023	17. Januar 2024	24. Januar 2024	31. Januar 2024

Bei den erreichten realen Taktraten bewegt sich zwischen dem "SUPER"-Refresh und den jeweiligen Vorgänger-Modellen mehr oder weniger gar nichts, auch das allgemeine Taktraten-Niveau der drei neuen Karten liegt vergleichsweise ähnlich bei um die 2.7 GHz. Es gibt allenfalls eine kleine Tendenz zu minimal niedrigeren Taktraten gegenüber den jeweiligen Vorgänger-Modellen – was denkbarerweise daran liegt, dass die "SUPER"-Modelle durchgehend mehr freigeschaltete Shader-Cluster zu zweimal derselben TDP und nur einmal einer maßvoll höheren TDP bieten. Dass da die realen Taktraten geringfügig niedriger ausfallen, wäre nicht verwunderlich: Immerhin kann nVidia auf Basis derselben Grafikchips nicht zaubern, und von beachtbaren Verbesserungen der Fertigungsqualität ist auch nichts bekannt.

	Basis	Durchschnitt		Max	gemessener Realtakt
AMD-Bezeichnung:	"Base Clock"	"Game Clock"	"Boost Clock"	"Max Clock"	CB	TPU	PCGH	Tom's
Radeon RX 7900 XTX	1900 MHz	2300 MHz	2500 MHz	?	2556 MHz	2612 MHz	2.60 GHz	2507 MHz
Radeon RX 7900 XT	1500 MHz	2000 MHz	2400 MHz	?	2566 MHz	2687 MHz	2.40 GHz	2515 MHz
Radeon RX 7800 XT	1295 MHz	2124 MHz	2430 MHz	?	2386 MHz	2425 MHz	2.35 GHz	2334 MHz
Radeon RX 7700 XT	1700 MHz	2171 MHz	2544 MHz	?	2507 MHz	2560 MHz	2.56 GHz	2535 MHz
Radeon RX 7600 XT	1980 MHz	2470 MHz	2755 MHz	?	2716 MHz	2790 MHz	2.79 GHz	2707 MHz
Radeon RX 7600	1720 MHz	2250 MHz	2625 MHz	?	2645 MHz	2613 MHz	2.61 GHz	2631 MHz
nVidia-Bezeichnung:	"Base Clock"	"Boost Clock"		"Max Clock"	CB	TPU	PCGH	Tom's
GeForce RTX 4090	2235 MHz	2520 MHz		?	2744 MHz	2701 MHz	2.74 GHz	2752 MHz
GeForce RTX 4080 Super	2295 MHz	2550 MHz		?	2729 MHz	2715 MHz	2.73 GHz	2787 MHz
GeForce RTX 4080	2205 MHz	2505 MHz		?	2725 MHz	2737 MHz	2.78 GHz	2783 MHz
GeForce RTX 4070 Ti Super	2340 MHz	2610 MHz		?	2785 MHz	2708 MHz	2.67 GHz	2745 MHz
GeForce RTX 4070 Ti	2310 MHz	2610 MHz		?	2802 MHz	-	2737 MHz	2839 MHz
GeForce RTX 4070 Super	1980 MHz	2475 MHz		?	2735 MHz	2715 MHz	2.72 GHz	2718 MHz
GeForce RTX 4070	1920 MHz	2475 MHz		?	2758 MHz	2762 MHz	2769 MHz	2722 MHz
GeForce RTX 4060 Ti	2310 MHz	2535 MHz		?	2714 MHz	2767 MHz	2.74 GHz	2783 MHz
GeForce RTX 4060	1830 MHz	2460 MHz		?	2738 MHz	2640 MHz	2.69 GHz	2726 MHz
Intel-Bezeichnung:	-	"Graphics Clock"		"Max Clock"	CB	TPU	PCGH	Tom's
Arc A770 16GB	-	2100 MHz		2400 MHz	-	2386 MHz	2.33 GHz	2311 MHz
Arc A750	-	2050 MHz		2400 MHz	-	2394 MHz	2.39 GHz	2379 MHz
Arc A580 (AIBs)	-	2000 MHz		2400 MHz	2396 MHz	2354 MHz	2.33 GHz	2325 MHz
Realtakt-Angaben gemäß den Ausarbeitungen der ComputerBase (Ø 11-23 Spiele), TechPowerUp (Ø 22-25 Spiele), PC Games Hardware (üblicherweise Praxis-Angaben, zuzüglich teilweise MHz-genaue Werte aus Ø 20 Spiele) und Tom's Hardware (Ø 15 Spiele, WQHD) von jeweils Referenz-Varianten (oder auf Referenz-Taktung/TDP laufend); letzte Tabelle mit allen Radeon RX 6000 & GeForce RTX 30 Modellen siehe hier

Grafikkarten-Reviews zu den drei neuen "SUPER"-Modellen gab es in den letzten Januar-Wochen bis zum Abwinken, wobei die Hardwaretester viel dieser Arbeit doppelt & dreifach machen mussten, um bei jedem Launch zeitgenau dabei zu sein. Die Hauptaufgabe – die Information des Lesers – blieb dabei etwas auf der Strecke, denn den Launch-Reviews zur GeForce RTX 4070 Super fehlten ein wenig die Benchmarks der GeForce RTX 4070 Ti Super (zum Abschluß nach oben hin), genauso wie den Launch-Reviews zur GeForce RTX 4070 Ti Super aus selbem Grund die Benchmarks zur GeForce RTX 4080 Super fehlten. Zudem ergab sich beim Launch der GeForce RTX 4070 Ti Super eine Performance-Unstimmigkeit mit den MSI-Modellen, das rettende BIOS-Update wurde erst nach dem Launchtag geliefert. Erst mit dem Launch der letzten und größten "SUPER"-Karte ergibt sich ein vollständiges Bild – welches nachfolgend auch die Grundlage aller weiteren Betrachtungen bilden wird.

Denkbarerweise wegen der enormen Arbeitsbelastung durch diesen dreifachen Launch haben uns allerdings nur die wenigstens Hardwaretester den Gefallen getan und die jüngsten Treiberversionen von AMD & nVidia für alle Vergleichs-Modelle angesetzt. Mit dieser (kleinen) Ungenauigkeit muß man derzeit leben, um überhaupt auf eine gewisse Anzahl an wertbaren Benchmark-Daten zu kommen. Denn leider mussten aus der Unmenge an verfügbaren Benchmarks auch viele Testberichte disqualifiziert werden, weil uralte Treiber für die Vergleichs-Modelle benutzt wurden oder aber generell in Frage stand, welche Karten hierbei genau vermessen wurden (Referenz-Varianten oder aber Werksübertaktungen). Die Frage der (weitgehenden) Treiber-Gleichheit ist speziell kritisch bei Performance-Vergleichen von derart eng aneinanderliegenden Modellen, da können alte Treiber das ganze Performance-Bild verzerren. Demzufolge konnten auch nur die Werte von 14 Launch-Reviews für diesen Artikel herangezogen werden, obwohl die Verwendung von weit mehr Testberichten und Werten geplant war.

	Tests	CPU	Treiber (neben SUPER-SKUs)	Werks-OC
ComputerBase	22 / 8	Ryzen 9 7950X3D	23.11.1 & 546.17	—
Cowcotland	11 / 5	Core i7-12700KF	23.10.2 & 545.92	4070Ti, 4070TiS
Digital Foundry	8 / 6	Core i9-13900K	?	?
Hardware & Co	20 / 18	Core i9-14900K (HT off)	23.12.1 & 546.52	7800XT
Hardware Unboxed	12 / 10	Ryzen 7 7800X3D	24.1.1 & 551.23	?
KitGuru	12 / 8	Core i9-13900KS	23.12.1 & 546.33	—
Linus Tech Tips	8 / –	Ryzen 7 7800X3D	?	?
Paul's Hardware	9 / 4	Ryzen 7 7800X3D	23.12.1 & 551.15/22	4070Ti
PC Games Hardware	20 / 10	Core i9-13900KS @ 5.7 GHz (E-Kerne off)	aktuelle Treiber	—
PurePC	10 / 7	Core i9-14900K	?	4070Ti, 4070TiS
Quasarzone	15 / –	Ryzen 9 7950X3D	23.12.1 & 546.52	?
TechPowerUp	25 / 10	Core i9-14900K	23.11.1 & 546.17	?
Tom's Hardware	9 / 6	Core i9-13900K	?	?
Tweakers	10 / 3	Core i9-13900K @ 5.5 GHz (E-Kerne off)	23.12.1 & 546.52	4070Ti
"Tests" = Anzahl der jeweils benutzten Benchmark-Spiele unter gewöhnlichem Raster-Rendering bzw. unter RayTracing

Bezüglich werksübertakteter Modelle gab es bei diesem Launch bzw. den Benchmarks hierzu nur wenig zu beachten. Logischerweise basieren alle Benchmarks zu GeForce RTX 4070 Ti und 4070 Ti Super Karten auf Hersteller-Modellen, da nVidia zu diesen beiden Karten keine Founders Edition aufgelegt hat. Allerdings waren auch viele Hersteller-Modelle ohne Werksübertaktung im Einsatz, einige Hardwaretester simulieren auch schlicht die Referenz-Performance durch eine entsprechende Umtaktung. Dort, wo ein werksübertaktetes Modell identifiziert werden konnte, wurde in den nachfolgenden Performance-Tabellen der originale Performance-Wert (inkl. Werksübertaktung) notiert, dies jedoch für die Performance-Auswertung ("gemittelte Performance") jeweils auf den Referenz-Takt normalisiert. Die hierbei benutzten Performance-Offsets waren mit 1-2 Prozentpunkte erneut klein, da sich keine herausragenden Werksübertaktungen im Test befanden. Bei der exakten Dokumentation der jeweils benutzten Grafikkarten haben einige Hardwaretests allerdings noch "Optimierungs-Potential".

Bookmark/Search this post with:

Launch-Analyse nVidia GeForce RTX 40 "SUPER" Refresh

Hauptlinks

Suchen

Navigation

Launch-Analyse nVidia GeForce RTX 40 "SUPER" Refresh

Die weiteren Seiten des Artikels

Translate

3DCenter unterstützen

Neueste Blogeinträge

Neue Forenbeiträge

Neue Beiträge im Forum Technologie

Uns folgen

Partner

Umfrage