Launch-Analyse AMD Radeon RX 7900 XT & XTX

Dienstag, 20. Dezember 2022

/ von Leonidas

Mit dem Navi-31-Chip und den darauf basierenden Radeon RX 7900 XT & XTX Grafikkarten startet nun auch AMD seine neue Grafikkarten-Generation, im Wettstreit mit nVidias GeForce RTX 40 Serie auf Basis der Ada-Lovelace-Chips. Die von AMD hierfür angesetzte Preislage von 899 bzw. 999 Dollar deutet dabei schon an, dass man sich mitnichten mit nVidias größten RTX40-Beschleunigern messen kann, sondern etwas kleinere Brötchen backt. Trotzdem ist natürlich zu ermitteln, wie die beiden neuen AMD-Grafikkarten sowohl gegenüber GeForce RTX 4080 & 4090 als auch der vorherigen Grafikkarten-Generation von AMD & nVidia bestehen können. Die nachfolgende Launch-Analyse wird somit auf Basis der von den Launch-Reviews aufgestellten Benchmarks und Meßwerte eine Einschätzung zur gemittelten Performance, Stromverbrauch, Energieeffizienz, Generations-Gewinn und Preis/Leistungs-Verhältnis abgeben.

AMD Radeon RX 7900 XT & Radeon RX 7900 XTX im Referenz-Design

Mittels Navi 31 bzw. der RDNA3-Architektur läutet AMD eine neue Architektur-Stufe ein, welche zwei primäre Neuerungen mit sich bringt: Erstens die Aufteilung des Grafikchips in Einzelchips, wenngleich dies nur auf einen vergleichsweise niedrigen Level. Denn es gibt weiterhin nur ein Compute-Die (GCD), die anderen Chiplets (MCD) enthalten allein Infinity Cache und Speicherinterface. Der Hintergrund des ganzen liegt derzeit noch weniger in der Skalierbarkeit, sondern in der Wirtschaftlichkeit der Fertigung: Für die MCDs kann man die günstigere 6nm-Fertigung bemühen, die Aufteilung in einzelne MCDs sichert eine gewisse Skalierbarkeit und vor allem eine hohe Ausbeute dieser Kleinchips. Auch das eigentliche Compute-Die wird durch die Herauslösung von Infinity Cache und Speicherinterface vergleichsweise viel kleiner (300mm²) und erreicht somit automatisch eine höhere Ausbeute in der Chipfertigung.

Die zweite Änderung besteht in der Verbreiterung der Shader-Einheiten, welche unter der RDNA3-Architektur nunmehr den doppelten FP32-Durchsatz gegenüber RDNA2 erreichen. AMD spricht hierzu allerdings nicht von einer größeren Anzahl an "Stream-Prozessoren", davon gibt es auch unter RDNA3 weiterhin nur 64 pro Shader-Cluster (CU). Allerdings liegt deren FP32-Durchsatz nunmehr bei 128 FP32 pro Shader-Cluster und Takt, sinngemäß kann man also von 128 FP32-Einheiten pro Shader-Cluster ausgehen. Dies entspricht grundsätzlich der Änderung an den nVidia-Architekturen zwischen "Turing" und "Ampere" – und stellt somit die gleiche Frage nach der vollständigen Auslastung der vielen FP32-Einheiten in den Raum. Im Gegensatz zu nVidia hat AMD dies allerdings durchaus bedacht und auch diverse Verwaltungs-Teile der Shader-Cluster entsprechend größer gestaltet. Die Schlagkräftigkeit des Ganzen kann sich dann sowieso nur in der Praxis ergeben.

AMD Navi 31 (RDNA3)

RDNA3-Architektur
Chiplet-Verfahren mit einem GCD unter TSMC N5 (300mm²) und bis zu 6 MCDs unter TSMC N6 (á 37mm²)
GCD trägt den eigentlichen Grafikchip, MCD trägt Speicherinterface & Infinity Cache (64-Bit-Interface + 16 MB IF$ pro MCD)
58 Mrd. Transistoren auf 522mm² Chipfläche im Vollausbau
"Dual-Issue Stream Processor" = 128 FP32-Einheiten pro Shader-Cluster
6 Raster-Engines, 96 Shader-Cluster (CU), 6144 Stream-Prozessoren, sinngemäß 12'288 FP32-Einheiten, 96 RA-Einheiten v2, 192 KI-Kerne, 384 TMUs, 192 ROPs
unterschiedliche Taktraten für Front-End (nominell 2.5 GHz) und Shader-Cluster (nominell 2.3 GHz)
6 MB Level2-Cache, 96 MB Infinity Cache v2, 384 Bit GDDR6-Speicherinterface
PCI Express 4.0 x16 Interface
Support für rBAR, DisplayPort 2.1, HDMI 2.1a, FSR3 und Hyper-RX (beide letztgenannten Features erst im Jahr 2023)
resultierende Grafikkarten: Radeon RX 7900 XT (84 CU, Salvage) & Radeon RX 7900 XTX (96 CU, Vollausbau)

Daneben gab es kleinere zu erwähnende Änderungen an RDNA3: So führen die Shader-Cluster nunmehr jeweils zwei KI-Kerne, welche für die Berechnung von INT8 und BFLOAT16 ausgelegt sind, derzeit aber noch keine praktische Verwendung finden. Womöglich nutzt das für 2023 angekündigte FSR3 diese Einheiten aus, welche sinngemäß durchaus mit den Tensor-Cores von nVidia zu vergleichen sind. Die RayTracing-Einheiten (RA-Einheiten) können nunmehr 50% mehr Strahlen pro Takt berechnen, was sich natürlich nicht gleichförmig in mehr RayTracing-Performance ummünzen sollte, sondern in der Praxis einen beachtbar geringeren Effekt haben wird. Das Front-End mit der Raster-Engine erhält bei RDNA3 eine eigene Takt-Domäne, welche nominell etwas höher taktet als jene der Shader-Cluster. Genauer hat AMD dies allerdings nicht ausgeführt, womit unbekannt ist, ob das Front-End genauso dynamisch (hoch)taktet wie die Shader-Cluster.

Selbiges Front-End ist im übrigen mit nunmehr 6 Raster-Engines endlich einmal deutlich dicker gegenüber früheren AMD-Grafikchips (max. 4 Raster-Engines) geworden. Auch beim Speicherinterface geht Navi 31 denselben Weg und setzt gleich eine Interface-Breite von 384 Bit an. Nachdem man mit RDNA2 noch den "Infinity Cache" zur Reduzierung der Bedeutung des Speicherinterfaces einführte, war bei Navi 31 angesichts von 96 Shader-Clustern und 12'288 FP32-Einheiten wohl nichts mehr anderes möglich, als hier wirklich mehr "echte" Speicherbandbreite zu bieten. Und letztlich hat AMD etwas beim Infinity Cache gespart, nach 128 MB bei Navi 21 bringt Navi 31 "nur" noch 96 MB daher. Dafür steigt die Anbindung des Infinity Caches auf das Doppelte gegenüber Navi 21 (2,5 anstatt 1,2 TB/sec), was eigentlich ein guter Ausgleich sein sollte.

Aus dem grundsätzlichen Design des Navi-31-Chips mit 96 Shader-Clustern an einem 384-Bit-Speicherinterface zieht AMD dann zwei Grafikkarten: Die Radeon RX 7900 XTX im Vollausbau des Grafikchips sowie die Radeon RX 7900 XT mit einer gewissen Abspeckung auf 84 Shader-Cluster an einem 320-Bit-Speicherinterface. Diese Abspeckung ist durchaus AMD-typisch, zwischen Radeon RX 6800 XT und 6900 XT standen +11% mehr Shader-Cluster, bei Radeon RX 7900 XT und 7900 XTX sind es nunmehr +14%. Andere Punkte deuten wiederum auf einen etwas größeren Hardware-Unterschied hin, wie die beachtbaren Differenzen bei Infinity Cache, der IF$-Bandbreite sowie beim Speicherinterface, welches es bei der Vorgänger-Generation mehrheitlich nicht gab. Unverändert zwischen beiden Grafikkarten-Varianten sind allein die Anzahl von Raster-Engines, ROPs und Level2-Cache.

	Radeon RX 7900 XT	Radeon RX 7900 XTX	Differenz
Raster-Engines (GPC)	6	6	±0
Shader-Cluster (CU)	84	96	+14% bzw. –12,5%
FP32-Einheiten	10'752	12'288	+14% bzw. –12,5%
(nominelle) FP32-Leistung	51,6 TFlops	61,4 TFlops	+19% bzw. –16%
ROPs	192	192	±0
Level2-Cache	6 MB	6 MB	±0
Infinity Cache	80 MB	96 MB	+20% bzw. –17%
IF$-Bandbreite	2,0 TB/sec	2,5 TB/sec	+25% bzw. –20%
Speicherinterface	320 Bit GDDR6	384 Bit GDDR6	+20% bzw. –17%
Speichermenge	20 GB GDDR6	24 GB GDDR6	+20% bzw. –17%

Beachtenswerterweise hat AMD seine Referenz-Designs nicht so aufgebläht wie nVidia die seinigen: Die Radeon RX 7900 XT kommt mit einer Kartenlänge von 27,6cm aus, bei der Radeon RX 7900 XTX sind es 28,7cm, beiderseits mit einem Platzbedarf von 2½ Slots. Leider sieht es so aus, als würden die Hersteller-Modelle dieser Vorgabe überhaupt nicht folgen, jene gehen derzeit fast ausnahmslos in die Größenklasse der Herstellerdesigns zu GeForce RTX 4080 & 4090. nVidias neuer 12VHPWR-Stromadapter wird allerdings generell von keiner der neuen AMD-Grafikkarten verwendet, man bleibt bei den bekannten 8poligen Stromsteckern (2x für das Referenz-Design, 3x für viele Herstellerdesigns). Zu erwähnen zudem noch eine kleine Änderung der offiziellen Spezifikationen zur Radeon RX 7900 XT gegenüber AMDs ursprünglicher Ankündigung: Die kleinere Navi-31-Lösung tritt nunmehr mit einer TDP von 315 Watt an, nicht mehr mit "nur" 300 Watt.

	GeForce RTX 4080	GeForce RTX 4090	Radeon RX 7900 XT	Radeon RX 7900 XTX
Chipbasis	nVidia AD103-300	nVidia AD102-300	AMD Navi 31	AMD Navi 31
Fertigung	45,9 Mrd. Transistoren auf 379mm² Chipfäche in der 4nm-Fertigung von TSMC	76,3 Mrd. Transistoren auf 609mm² Chipfäche in der 4nm-Fertigung von TSMC	? Mrd. Transistoren auf 485mm² Chipfäche in der 5/6nm-Fertigung von TSMC	58 Mrd. Transistoren auf 522mm² Chipfäche in der 5/6nm-Fertigung von TSMC
Architektur	nVidia Ada Lovelace, DirectX 12 Feature-Level 12_2		AMD RDNA3, DirectX 12 Feature-Level 12_2
Features	DirectX 12, OpenGL, Vulkan, RayTracing, DSR, DLDSR, DLSS 2/3, PhysX, G-Sync, FreeSync, rBAR		DirectX 12, OpenGL, Vulkan, RayTracing, VSR, FSR 1/2/3, FreeSync, TrueAudio Next, XConnect, rBAR
Technik	7 Raster-Engines, 76 Shader-Cluster, 9728 FP32-Einheiten, 304 TMUs, 76 RT-Cores v3, 304 Tensor-Cores v4, 112 ROPs, 64 MB Level2-Cache, 256 Bit GDDR6X-Interface (Salvage)	11 Raster-Engines, 128 Shader-Cluster, 16'384 FP32-Einheiten, 512 TMUs, 128 RT-Cores v3, 512 Tensor-Cores v4, 176 ROPs, 72 MB Level2-Cache, 384 Bit GDDR6X-Interface (Salvage)	6 Raster-Engines, 84 Shader-Cluster, 10'752 FP32-Einheiten, 336 TMUs, 84 RA-Einheiten v2, 168 KI-Kerne, 192 ROPs, 6 MB Level2-Cache, 80 MB Infinity Cache v2, 320 Bit GDDR6-Interface (Salvage)	6 Raster-Engines, 96 Shader-Cluster, 12'288 FP32-Einheiten, 384 TMUs, 96 RA-Einheiten v2, 192 KI-Kerne, 192 ROPs, 6 MB Level2-Cache, 96 MB Infinity Cache v2, 384 Bit GDDR6-Interface (Vollausbau)
Taktraten	2205/2505 MHz & 22,4 Gbps	2235/2520 MHz & 21 Gbps	1500/2000/2400 MHz & 20 Gbps	1900/2300/2500 MHz & 20 Gbps
Rohleistungen	48,7 TFlops & 717 GB/sec	82,6 TFlops & 1008 GB/sec	51,6 TFlops & 800 GB/sec	61,4 TFlops & 960 GB/sec
Speicherausbau	16 GB GDDR6X	24 GB GDDR6X	20 GB GDDR6	24 GB GDDR6
Anbindung	PCI Express 4.0 x16	PCI Express 4.0 x16	PCI Express 4.0 x16	PCI Express 4.0 x16
Ref/AIBs/OC	✓ / ✓ / ✓	✓ / ✓ / ✓	✓ / ✓ / ✓	✓ / ✓ / ✓
Layout	Dual-, Triple- & QuadSlot	Dual-, Triple- & QuadSlot	Triple- & QuadSlot	Dual-, Triple- & QuadSlot
Kartenlänge	FE: 30,5cm AIBs: 23,5-36,7cm	FE: 30,5cm AIBs: 20,0-36,7cm	Ref: 27,6cm AIBs: 31,3-35,3cm	Ref: 28,7cm AIBs: 27,5-35,3cm
Stromstecker	1x 16pol.	1x 16pol.	2x 8pol.	2x 8pol.
off. Verbrauch	320W	450W	315W (ASIC: 257W)	355W (ASIC: 291W)
Real-Verbrauch	297W	418W	309W	351W
Ausgänge	HDMI 2.1a, 3x DisplayPort 1.4a	HDMI 2.1a, 3x DisplayPort 1.4a	HDMI 2.1a, USB Type-C, 2x DisplayPort 2.1	HDMI 2.1a, USB Type-C, 2x DisplayPort 2.1
FHD Perf.Index	2690%	3000%	2530%	2740%
4K Perf.Index	496%	655%	434%	512%
Listenpreis	$1199 / 1469€	$1599 / 1949€	$899 / 1049€	$999 / 1149€
Straßenpreis	1350-1500 Euro	1960-2200 Euro	1050-1130 Euro	1400-1800 Euro
Release	16. November 2022	12. Oktober 2022	13. Dezember 2022	13. Dezember 2022

Taktraten-technisch hatte man zweifellos (viel) mehr von Navi 31 erwartet als die derzeit gebotenen 2.3 GHz Game-Clock sowie 2.5 GHz Boost-Clock der Radeon RX 7900 XTX. Allerdings wird dies teilweise durch die real gemessenen Taktraten wieder ausgeglichen, welche eher denn bei 2.6 GHz liegen. Wie nicht unüblich bei heutigen Grafikkarten, liegt der Realtakt somit beachtbar oberhalb selbst der höchsten offiziellen Taktraten-Angabe des Herstellers. Die üblicherweise dynamisch schwankenden Taktraten können dabei durchaus auch 3.0 GHz erreichen, gehen allerdings teilweise auch auf nur 2.0 GHz zurück. Ein wirklicher Taktraten-Boost gegenüber der Vorgänger-Generation ergibt sich damit natürlich nicht, denn jene durchschnittlich 2.6 GHz sind nur gegenüber Navi-21-basierten Grafikkarten ein Gewinn, die kleineren Grafikkarten der Radeon RX 6000 Serie erreichten allerdings schon ähnliche und teilweise sogar höhere reale Taktraten.

	Basis	Durchschnitt		Max	gemessener Realtakt
AMD-Bezeichnung:	"Base Clock"	"Game Clock"	"Boost Clock"	"Max Clock"	CB	TPU	PCGH
Radeon RX 7900 XTX	1900 MHz	2300 MHz	2500 MHz	?	2556 MHz	2612 MHz	2.60 GHz
Radeon RX 7900 XT	1500 MHz	2000 MHz	2400 MHz	?	2566 MHz	2687 MHz	2.40 GHz
Radeon RX 6950 XT	1890 MHz	2100 MHz	2310 MHz	?	2392 MHz	2405 MHz	2.42 GHz
Radeon RX 6900 XT	1825 MHz	2015 MHz	2250 MHz	?	2265 MHz	2233 MHz	2.30 GHz
Radeon RX 6800 XT	1825 MHz	2015 MHz	2250 MHz	?	2216 MHz	2257 MHz	2.34 GHz
Radeon RX 6800	1700 MHz	1815 MHz	2105 MHz	?	2177 MHz	2205 MHz	2.20 GHz
Radeon RX 6750 XT	2150 MHz	2495 MHz	2600 MHz	?	2683 MHz	-	2.63 GHz
Radeon RX 6700 XT	2321 MHz	2424 MHz	2581 MHz	?	2531 MHz	2491 MHz	2.54 GHz
Radeon RX 6650 XT	2055 MHz	2410 MHz	2635 MHz	?	2601 MHz	-	2.68 GHz
Radeon RX 6600 XT	1968 MHz	2359 MHz	2589 MHz	?	2562 MHz	-	2.58 GHz
Radeon RX 6600	1626 MHz	2044 MHz	2491 MHz	?	2509 MHz	2444 MHz	2.51 GHz
Radeon RX 6500 XT	2310 MHz	2610 MHz	2815 MHz	?	2753 MHz	-	2.82 GHz
nVidia-Bezeichnung:	"Base Clock"	"Boost Clock"		"Max Clock"	CB	TPU	PCGH
GeForce RTX 4090	2235 MHz	2520 MHz		?	2744 MHz	2701 MHz	2.74 GHz
GeForce RTX 4080	2205 MHz	2505 MHz		?	2725 MHz	2737 MHz	2.78 GHz
GeForce RTX 3090 Ti	1560 MHz	1860 MHz		?	1936 MHz	1979 MHz	2.00 GHz
GeForce RTX 3090	1400 MHz	1700 MHz		?	1754 MHz	-	1.88 GHz
GeForce RTX 3080 Ti	1365 MHz	1665 MHz		?	1784 MHz	1780 MHz	1.80 GHz
GeForce RTX 3080 12GB	1260 MHz	1710 MHz		?	-	-	1.80 GHz
GeForce RTX 3080 10GB	1450 MHz	1710 MHz		?	1827 MHz	1931 MHz	1.90 GHz
GeForce RTX 3070 Ti	1575 MHz	1770 MHz		?	1878 MHz	1861 MHz	1.88 GHz
GeForce RTX 3070	1500 MHz	1725 MHz		?	1920 MHz	1882 MHz	1.86 GHz
GeForce RTX 3060 Ti	1410 MHz	1665 MHz		?	1900 MHz	1877 MHz	1.83 GHz
GeForce RTX 3060	1320 MHz	1777 MHz		?	-	-	1.87 GHz
GeForce RTX 3050	1552 MHz	1777 MHz		?	1891 MHz	1906 MHz	1.89 GHz
Intel-Bezeichnung:	-	"Graphics Clock"		"Max Clock"	CB	TPU	PCGH
Arc A770 "LE"	-	2100 MHz		2400 MHz	-	2386 MHz	2.33 GHz
Arc A750	-	2050 MHz		2400 MHz	-	2394 MHz	2.39 GHz
Realtakt-Angaben gemäß den Ausarbeitungen der ComputerBase (Ø 17-20 Spiele) und von TechPowerUp (Ø 22-25 Spiele) sowie den Praxis-Angaben der PC Games Hardware von jeweils Referenz-Varianten (oder auf Referenz-Taktung/TDP laufend)

Beachtenswert daneben, dass die Radeon RX 7900 XT in der Praxis bei 2 der 3 Wertequellen keinen Taktraten-Unterschied zur Radeon RX 7900 XTX offenbart bzw. teilweise sogar leicht höher als die größere Karte taktet. Hier zeigt sich einmal mehr, dass heutige Grafikkarten nur noch sehr wenig von ihren nominellen Taktraten abhängen, sondern in der Praxis schlicht so weit takten, wie es die Limits für Stromzufuhr und Temperaturen zulassen. Augenscheinlich sind jene Limits bei der Radeon RX 7900 XT ausreichend hoch angesetzt, so dass die kleinere Karte den Navi-31-Chip Taktraten-technisch genauso stark ausreizen kann wie die größere Radeon RX 7900 XTX. Der reale Unterschied zwischen beiden Karten reduziert sich somit auf den echten Hardware-Unterschied, die nominelle Taktraten-Differenz existiert in der Praxis (weitgehend) nicht.

Bookmark/Search this post with:

Launch-Analyse AMD Radeon RX 7900 XT & XTX

Hauptlinks

Suchen

Navigation

Launch-Analyse AMD Radeon RX 7900 XT & XTX

Die weiteren Seiten des Artikels

Translate

3DCenter unterstützen

Neueste Blogeinträge

Neue Forenbeiträge

Neue Beiträge im Forum Technologie

Uns folgen

Partner

Umfrage