Launch-Analyse nVidia GeForce RTX 4070 Ti

Montag, 9. Januar 2023

/ von Leonidas

Mit der GeForce RTX 4070 Ti bringt nVidia die dritte RTX40-Grafiklösung, basierend auf dem dritten Ada-Lovelace-Grafikchip und erstmals bei nVidias neuer Grafikkarten-Generation in den dreistelligen Preisbereich herabreichend. Prinzipiell handelt es sich hierbei um eine umbenannten "GeForce RTX 4080 12GB" zum leicht abgesenkten Preis. Letzteres war wohl auch notwendig, um wenigstens einen gewissen Performance/Preis-Vorteil gegenüber der von den Grafikkarten-Käufern weitgehend verschmähten GeForce RTX 4080 (16GB) zu erreichen. Ob dies ausreichend ist bzw. wo sich die GeForce RTX 4070 Ti im Performance-Gesamtbild einordnen kann, soll nachfolgend auf Basis der Performance-Werte der Launch-Reviews ermittelt werden.

Wie bekannt, hatte nVidia bei der initialen Vorstellung der Ada-Lovelace-Generation bereits eine "GeForce RTX 4080 12GB" für November 2022 sowie Listenpreise von 899 Dollar bzw. 1099 Euro bekanntgegeben. Schon seinerzeit wurden Preispunkt und Namensgebung in Frage gestellt, worauf nVidia tatsächlich ein Einsehen hatte und noch Mitte Oktober diese Karte wieder aus dem Aufgebot strich. Schnell wurde allerdings klar, dass damit die einstmals angedachte Hardware keineswegs aus dem Spiel war, sondern schlicht nur unter neuem Namen herauskommen sollte. Nach einer gewissen Zeitspanne kristallisierte sich dann die neue Namensgebung "GeForce RTX 4070 Ti" heraus. Preislich gab es lange Zeit keine Bewegung, ehe nVidia kurz vor Launch den Listenpreis doch noch um 100 Dollar bzw. 200 Euro kürzte (letzteres auch ermöglicht durch den inzwischen besseren Wechselkurs).

Die neue Namensgebung passt in jedem Fall besser zu dem Punkt, dass für die GeForce RTX 4070 Ti der AD104-Chip Verwendung findet, im Gegensatz zum AD103-Chip bei der GeForce RTX 4080. Der neue, nunmehr dritte Ada-Lovelace-Grafikchip kommt in einer für nVidia typischen Midrange-Größe von 294,5mm² Chipfläche daher, das 192-Bit-Speicherinterface (für 6 Stück Speicherchips à 2 GByte) samt der (aus heutiger Sicht) mittleren TDP sollte die Kostenlage eigentlich überschaubar halten. Trotzdem ist die Preislage der GeForce RTX 4070 Ti mit Listenpreisen von 799 Dollar bzw. 899 Euro weiterhin hoch für ein Modell der 70er Klasse, die vorherige GeForce RTX 3070 Ti startete mal für 599 Dollar – was zudem gegenüber den 499 Dollar der regulären GeForce RTX 3070 ebenfalls schon als zu hoch angesehen wurde.

nVidia AD104

"Ada Lovelace" Architektur
35,8 Mrd. Transistoren auf 294,5mm² Chipfläche unter der "4N"-Fertigung von TSMC
5 Raster-Engines (GPC) mit jeweils 6 Texture Processing Cluster (TPC) und 12 "Streaming Multiprocessors" (SM) aka Shader-Clustern
ein Shader-Cluster enthält jeweils 64 FP32-Einheiten, 64 FP32/INT32-Einheiten, 4 Textureneinheiten (TMUs), einen RT-Core v3, vier Tensor-Cores v4, 128 kByte Level1-Cache
ergibt für den gesamten Grafikchip 5 Raster-Engines, 30 TPC, 60 Shader-Cluster, 3840 FP32-Einheiten, 3840 FP32/INT32-Einheiten (somit 7680 FP32-Einheiten, wenn man nur FP32-Berechnungen laufen hat), 240 Textureneinheiten (TMUs), 60 RT-Core v3, 240 Tensor-Cores v4
16 ROPs pro Raster-Engine = 80 ROPs insgesamt
48 MB Level2-Cache
192 Bit GDDR6X-Speicherinterface
PCI Express 4.0 x16 Interface
rBAR, DLSS3, HDMI 2.1a, DisplayPort 1.4a
resultierende Grafikkarte: GeForce RTX 4070 Ti (im Vollausbau des Grafikchips)

Chip-technisch ist der AD104-Chip unspektakulär, da einfach 1:1 von den vorherigen Ada-Lovelace-Chips herunterskaliert. Dies betrifft dann auch das Speicherinterface, wo es den einzigen Rückschritt gegenüber der vorherigen Ampere-Generation gibt: Während der GA104-Chip von GeForce RTX 3060 Ti, 3070 & 3070 Ti mit einem 256-Bit-Interface antrat, kommt der AD104-Chip eben nur mit einem 192-Bit-Interface daher. Bandbreiten-seitig wird dies ausgeglichen durch die Verwendung von GDDR6X und durch den großen Level2-Cache der Ada-Lovelace-Generation. Als großen Vorteil kann nVidia dafür andere Speichermengen als nur 8 oder 16 GB bieten – so dass die GeForce RTX 4070 Ti eben mit 12 GB Grafikkartenspeicher antritt. Gegenüber den bisherigen 70er Modellen von nVidia ist dies ein deutlicher Fortschritt, welcher zudem angesichts der erreichten Leistungsklasse auch dringend benötigt war.

Natürlich hätte nVidia der GeForce RTX 4070 Ti gut und gerne auch noch etwas mehr Speicher mitgeben können, die ganz große Zukunftssicherheit ist mit dieser Speicherbestückung nicht gegeben. Aber dieser Blick in die Glaskugel wird zunehmend schwerer, die Spiele-Entwickler ziehen die Anforderungen derzeit nicht mehr ganz so rasant an wie früher. Insofern dürfte die GeForce RTX 4070 Ti mit ihrer Speicherbestückung wohl zumindest für ein paar Jahre keine Probleme haben. Im Vergleich mit der GeForce RTX 4080 ergeben sich dann durchgehend beachtbar große Hardware-Unterschiede, welche in jedem Fall den tatsächlich eigenständigen Namen der GeForce RTX 4070 Ti rechtfertigen. Die Hardware-Differenzen sind zwar nicht so hoch wie zwischen GeForce RTX 4080 & 4090, allerdings erleiden diese größeren Karten auch höhere Skalierungs-Verluste durch den Einfluß der CPU-Performance, benötigen ihren größeren Hardware-Unterschied somit regelrecht.

	GeForce RTX 4070 Ti	GeForce RTX 4080	Differenz
Raster-Engines (GPC)	5	7	+40% bzw. –29%
Shader-Cluster (SM)	60	76	+27% bzw. –21%
FP32-Einheiten	7680	9728	+27% bzw. –21%
ROPs	80	112	+40% bzw. –29%
Level2-Cache	48 MB	64 MB	+33% bzw. –25%
Speicherinterface	192 Bit GDDR6X	256 Bit GDDR6X	+33% bzw. –25%

nVidias dritte RTX40-Karte kommt erstaunlicherweise nicht in einem Referenz-Design aka einer "Founders Edition" daher, es sind allein die Hersteller-Designs verfügbar. Jene gibt es in allen Formen und Farben, darunter Karten auf Referenz-Takt sowie mit allen möglichen Werksübertaktungen. Trotz Eigendesigns ist nVidias neuer 16poliger 12VHPWR-Stromstecker üblicherweise auch für die Hersteller-Modelle Pflicht, zuletzt gab es allerdings auch keinerlei Störungs-Meldungen mehr zu diesem neuen Adapter. Regulär soll die GeForce RTX 4070 Ti in einem DualSlot-Design antreten, bei den Grafikkarten-Herstellern hat man die freie Auswahl zwischen DualSlot-, TripleSlot- und QuadSlot-Designs mit (derzeit) Kartenlängen von 25,4 bis 34,9cm.

	Radeon RX 7900 XT	GeForce RTX 4070 Ti	GeForce RTX 4080	GeForce RTX 4090
Chipbasis	AMD Navi 31	nVidia AD104-400	nVidia AD103-300	nVidia AD102-300
Fertigung	? Mrd. Transistoren auf 485mm² Chipfäche in der 5/6nm-Fertigung von TSMC	35,8 Mrd. Transistoren auf 295mm² Chipfäche in der 4nm-Fertigung von TSMC	45,9 Mrd. Transistoren auf 379mm² Chipfäche in der 4nm-Fertigung von TSMC	76,3 Mrd. Transistoren auf 609mm² Chipfäche in der 4nm-Fertigung von TSMC
Architektur	AMD RDNA3, DirectX 12 Feature-Level 12_2	nVidia Ada Lovelace, DirectX 12 Feature-Level 12_2
Features	DirectX 12, OpenGL, Vulkan, RayTracing, VSR, FSR 1/2/3, FreeSync, TrueAudio Next, XConnect, rBAR	DirectX 12, OpenGL, Vulkan, RayTracing, DSR, DLDSR, DLSS 2/3, PhysX, G-Sync, FreeSync, rBAR
Technik	6 Raster-Engines, 84 Shader-Cluster, 10'752 FP32-Einheiten, 336 TMUs, 84 RA-Einheiten v2, 168 KI-Kerne, 192 ROPs, 6 MB Level2-Cache, 80 MB Infinity Cache v2, 320 Bit GDDR6-Interface (Salvage)	5 Raster-Engines, 60 Shader-Cluster, 7680 FP32-Einheiten, 240 TMUs, 60 RT-Cores v3, 240 Tensor-Cores v4, 80 ROPs, 48 MB Level2-Cache, 192 Bit GDDR6X-Interface (Vollausbau)	7 Raster-Engines, 76 Shader-Cluster, 9728 FP32-Einheiten, 304 TMUs, 76 RT-Cores v3, 304 Tensor-Cores v4, 112 ROPs, 64 MB Level2-Cache, 256 Bit GDDR6X-Interface (Salvage)	11 Raster-Engines, 128 Shader-Cluster, 16'384 FP32-Einheiten, 512 TMUs, 128 RT-Cores v3, 512 Tensor-Cores v4, 176 ROPs, 72 MB Level2-Cache, 384 Bit GDDR6X-Interface (Salvage)
Taktraten	1500/2000/2400 MHz & 20 Gbps	2310/2610 MHz & 21 Gbps	2205/2505 MHz & 22,4 Gbps	2235/2520 MHz & 21 Gbps
Rohleistungen	51,6 TFlops & 800 GB/sec	40,1 TFlops & 504 GB/sec	48,7 TFlops & 717 GB/sec	82,6 TFlops & 1008 GB/sec
Speicherausbau	20 GB GDDR6	12 GB GDDR6X	16 GB GDDR6X	24 GB GDDR6X
Anbindung	PCI Express 4.0 x16	PCI Express 4.0 x16	PCI Express 4.0 x16	PCI Express 4.0 x16
Ref/AIBs/OC	✓ / ✓ / ✓	✗ / ✓ / ✓	✓ / ✓ / ✓	✓ / ✓ / ✓
Layout	Triple- & QuadSlot	Dual-, Triple- & QuadSlot	Dual-, Triple- & QuadSlot	Dual-, Triple- & QuadSlot
Kartenlänge	Ref: 27,6cm AIBs: 31,3-35,3cm	AIBs: 25,4-34,9cm	FE: 30,5cm AIBs: 20,0-36,7cm	FE: 30,5cm AIBs: 20,0-36,7cm
Stromstecker	2x 8pol.	1x 16pol.	1x 16pol.	1x 16pol.
off. Verbrauch	315W	285W	320W	450W
Real-Verbrauch	309W	267W	297W	418W
Ausgänge	HDMI 2.1a, USB Type-C, 2x DisplayPort 2.1	HDMI 2.1a, 3x DisplayPort 1.4a	HDMI 2.1a, 3x DisplayPort 1.4a	HDMI 2.1a, 3x DisplayPort 1.4a
FHD Perf.Index	2530%	2370%	2690%	3000%
4K Perf.Index	434%	392%	496%	655%
Listenpreis	$899 / 1049€	$799 / 899€	$1199 / 1469€	$1599 / 1949€
Straßenpreis	980-1100 Euro	900-1000 Euro	1320-1450 Euro	1920-2200 Euro
Release	13. Dezember 2022	5. Januar 2023	16. November 2022	12. Oktober 2022

Mit 2610 MHz Boost-Takt handelt es sich bei der GeForce RTX 4070 Ti um die (nominell) bislang am höchsten taktende nVidia-Karte – folgend der bekannten Tendenz, dass die kleineren Grafikchips einer Serie immer etwas höher takten können als die jeweiligen Spitzen-Chips. Dieser Eindruck wird auch teilweise über die Messungen zur real anliegenden Taktrate bestätigt, welche zumindest in einem Fall ein Ergebnis von sogar 2802 MHz erbrachte. Die Meßwerte sind nicht ganz einheitlich wie vollständig, aber generell kann man die GeForce RTX 4070 Ti bei Taktraten von 2.7-2.8 GHz für eine auf Referenz-Einstellungen laufende Karte einbuchen. Die Werksübertaktungen schaffen etwas mehr – wobei deren Realtakt-Unterschiede deutlich geringer ausfallen als die Unterschiede beim offiziellen Boost-Takt (laut TechPowerUp 2828-2880 MHz Realtakt bei 2640-2760 MHz Boost-Takt).

	Basis	Durchschnitt		Max	gemessener Realtakt
AMD-Bezeichnung:	"Base Clock"	"Game Clock"	"Boost Clock"	"Max Clock"	CB	TPU	PCGH
Radeon RX 7900 XTX	1900 MHz	2300 MHz	2500 MHz	?	2556 MHz	2612 MHz	2.60 GHz
Radeon RX 7900 XT	1500 MHz	2000 MHz	2400 MHz	?	2566 MHz	2687 MHz	2.40 GHz
Radeon RX 6950 XT	1890 MHz	2100 MHz	2310 MHz	?	2392 MHz	2405 MHz	2.42 GHz
Radeon RX 6900 XT	1825 MHz	2015 MHz	2250 MHz	?	2265 MHz	2233 MHz	2.30 GHz
Radeon RX 6800 XT	1825 MHz	2015 MHz	2250 MHz	?	2216 MHz	2257 MHz	2.34 GHz
Radeon RX 6800	1700 MHz	1815 MHz	2105 MHz	?	2177 MHz	2205 MHz	2.20 GHz
Radeon RX 6750 XT	2150 MHz	2495 MHz	2600 MHz	?	2683 MHz	-	2.63 GHz
Radeon RX 6700 XT	2321 MHz	2424 MHz	2581 MHz	?	2531 MHz	2491 MHz	2.54 GHz
Radeon RX 6650 XT	2055 MHz	2410 MHz	2635 MHz	?	2601 MHz	-	2.68 GHz
Radeon RX 6600 XT	1968 MHz	2359 MHz	2589 MHz	?	2562 MHz	-	2.58 GHz
Radeon RX 6600	1626 MHz	2044 MHz	2491 MHz	?	2509 MHz	2444 MHz	2.51 GHz
Radeon RX 6500 XT	2310 MHz	2610 MHz	2815 MHz	?	2753 MHz	-	2.82 GHz
nVidia-Bezeichnung:	"Base Clock"	"Boost Clock"		"Max Clock"	CB	TPU	PCGH
GeForce RTX 4090	2235 MHz	2520 MHz		?	2744 MHz	2701 MHz	2.74 GHz
GeForce RTX 4080	2205 MHz	2505 MHz		?	2725 MHz	2737 MHz	2.78 GHz
GeForce RTX 4070 Ti	2310 MHz	2610 MHz		?	2802 MHz	-	2.74 GHz
GeForce RTX 3090 Ti	1560 MHz	1860 MHz		?	1936 MHz	1979 MHz	2.00 GHz
GeForce RTX 3090	1400 MHz	1700 MHz		?	1754 MHz	-	1.88 GHz
GeForce RTX 3080 Ti	1365 MHz	1665 MHz		?	1784 MHz	1780 MHz	1.80 GHz
GeForce RTX 3080 12GB	1260 MHz	1710 MHz		?	-	-	1.80 GHz
GeForce RTX 3080 10GB	1450 MHz	1710 MHz		?	1827 MHz	1931 MHz	1.90 GHz
GeForce RTX 3070 Ti	1575 MHz	1770 MHz		?	1878 MHz	1861 MHz	1.88 GHz
GeForce RTX 3070	1500 MHz	1725 MHz		?	1920 MHz	1882 MHz	1.86 GHz
GeForce RTX 3060 Ti	1410 MHz	1665 MHz		?	1900 MHz	1877 MHz	1.83 GHz
GeForce RTX 3060	1320 MHz	1777 MHz		?	-	-	1.87 GHz
GeForce RTX 3050	1552 MHz	1777 MHz		?	1891 MHz	1906 MHz	1.89 GHz
Intel-Bezeichnung:	-	"Graphics Clock"		"Max Clock"	CB	TPU	PCGH
Arc A770 "LE"	-	2100 MHz		2400 MHz	-	2386 MHz	2.33 GHz
Arc A750	-	2050 MHz		2400 MHz	-	2394 MHz	2.39 GHz
Realtakt-Angaben gemäß den Ausarbeitungen der ComputerBase (Ø 17-20 Spiele) und von TechPowerUp (Ø 22-25 Spiele) sowie den Praxis-Angaben der PC Games Hardware von jeweils Referenz-Varianten (oder auf Referenz-Taktung/TDP laufend)

Bookmark/Search this post with:

Launch-Analyse nVidia GeForce RTX 4070 Ti

Hauptlinks

Suche

Navigation

Launch-Analyse nVidia GeForce RTX 4070 Ti

Die weiteren Seiten des Artikels

Translate

3DCenter unterstützen

Neueste Blogeinträge

Neue Forenbeiträge

Neue Beiträge im Forum Technologie

Uns folgen

Partner

Umfrage