Launch-Analyse AMD Radeon RX 7900 XT & XTX

Dienstag, 20. Dezember 2022
 / von Leonidas
 

Mit dem Navi-31-Chip und den darauf basierenden Radeon RX 7900 XT & XTX Grafikkarten startet nun auch AMD seine neue Grafikkarten-Generation, im Wettstreit mit nVidias GeForce RTX 40 Serie auf Basis der Ada-Lovelace-Chips. Die von AMD hierfür angesetzte Preislage von 899 bzw. 999 Dollar deutet dabei schon an, dass man sich mitnichten mit nVidias größten RTX40-Beschleunigern messen kann, sondern etwas kleinere Brötchen backt. Trotzdem ist natürlich zu ermitteln, wie die beiden neuen AMD-Grafikkarten sowohl gegenüber GeForce RTX 4080 & 4090 als auch der vorherigen Grafikkarten-Generation von AMD & nVidia bestehen können. Die nachfolgende Launch-Analyse wird somit auf Basis der von den Launch-Reviews aufgestellten Benchmarks und Meßwerte eine Einschätzung zur gemittelten Performance, Stromverbrauch, Energieeffizienz, Generations-Gewinn und Preis/Leistungs-Verhältnis abgeben.

Mittels Navi 31 bzw. der RDNA3-Architektur läutet AMD eine neue Architektur-Stufe ein, welche zwei primäre Neuerungen mit sich bringt: Erstens die Aufteilung des Grafikchips in Einzelchips, wenngleich dies nur auf einen vergleichsweise niedrigen Level. Denn es gibt weiterhin nur ein Compute-Die (GCD), die anderen Chiplets (MCD) enthalten allein Infinity Cache und Speicherinterface. Der Hintergrund des ganzen liegt derzeit noch weniger in der Skalierbarkeit, sondern in der Wirtschaftlichkeit der Fertigung: Für die MCDs kann man die günstigere 6nm-Fertigung bemühen, die Aufteilung in einzelne MCDs sichert eine gewisse Skalierbarkeit und vor allem eine hohe Ausbeute dieser Kleinchips. Auch das eigentliche Compute-Die wird durch die Herauslösung von Infinity Cache und Speicherinterface vergleichsweise viel kleiner (300mm²) und erreicht somit automatisch eine höhere Ausbeute in der Chipfertigung.

Die zweite Änderung besteht in der Verbreiterung der Shader-Einheiten, welche unter der RDNA3-Architektur nunmehr den doppelten FP32-Durchsatz gegenüber RDNA2 erreichen. AMD spricht hierzu allerdings nicht von einer größeren Anzahl an "Stream-Prozessoren", davon gibt es auch unter RDNA3 weiterhin nur 64 pro Shader-Cluster (CU). Allerdings liegt deren FP32-Durchsatz nunmehr bei 128 FP32 pro Shader-Cluster und Takt, sinngemäß kann man also von 128 FP32-Einheiten pro Shader-Cluster ausgehen. Dies entspricht grundsätzlich der Änderung an den nVidia-Architekturen zwischen "Turing" und "Ampere" – und stellt somit die gleiche Frage nach der vollständigen Auslastung der vielen FP32-Einheiten in den Raum. Im Gegensatz zu nVidia hat AMD dies allerdings durchaus bedacht und auch diverse Verwaltungs-Teile der Shader-Cluster entsprechend größer gestaltet. Die Schlagkräftigkeit des Ganzen kann sich dann sowieso nur in der Praxis ergeben.

    AMD Navi 31 (RDNA3)

  • RDNA3-Architektur
  • Chiplet-Verfahren mit einem GCD unter TSMC N5 (300mm²) und bis zu 6 MCDs unter TSMC N6 (á 37mm²)
  • GCD trägt den eigentlichen Grafikchip, MCD trägt Speicherinterface & Infinity Cache (64-Bit-Interface + 16 MB IF$ pro MCD)
  • 58 Mrd. Transistoren auf 522mm² Chipfläche im Vollausbau
  • "Dual-Issue Stream Processor" = 128 FP32-Einheiten pro Shader-Cluster
  • 6 Raster-Engines, 96 Shader-Cluster (CU), 6144 Stream-Prozessoren, sinngemäß 12'288 FP32-Einheiten, 96 RA-Einheiten v2, 192 KI-Kerne, 384 TMUs, 192 ROPs
  • unterschiedliche Taktraten für Front-End (nominell 2.5 GHz) und Shader-Cluster (nominell 2.3 GHz)
  • 6 MB Level2-Cache, 96 MB Infinity Cache v2, 384 Bit GDDR6-Speicherinterface
  • PCI Express 4.0 x16 Interface
  • Support für rBAR, DisplayPort 2.1, HDMI 2.1a, FSR3 und Hyper-RX (beide letztgenannten Features erst im Jahr 2023)
  • resultierende Grafikkarten: Radeon RX 7900 XT (84 CU, Salvage) & Radeon RX 7900 XTX (96 CU, Vollausbau)

Daneben gab es kleinere zu erwähnende Änderungen an RDNA3: So führen die Shader-Cluster nunmehr jeweils zwei KI-Kerne, welche für die Berechnung von INT8 und BFLOAT16 ausgelegt sind, derzeit aber noch keine praktische Verwendung finden. Womöglich nutzt das für 2023 angekündigte FSR3 diese Einheiten aus, welche sinngemäß durchaus mit den Tensor-Cores von nVidia zu vergleichen sind. Die RayTracing-Einheiten (RA-Einheiten) können nunmehr 50% mehr Strahlen pro Takt berechnen, was sich natürlich nicht gleichförmig in mehr RayTracing-Performance ummünzen sollte, sondern in der Praxis einen beachtbar geringeren Effekt haben wird. Das Front-End mit der Raster-Engine erhält bei RDNA3 eine eigene Takt-Domäne, welche nominell etwas höher taktet als jene der Shader-Cluster. Genauer hat AMD dies allerdings nicht ausgeführt, womit unbekannt ist, ob das Front-End genauso dynamisch (hoch)taktet wie die Shader-Cluster.

Selbiges Front-End ist im übrigen mit nunmehr 6 Raster-Engines endlich einmal deutlich dicker gegenüber früheren AMD-Grafikchips (max. 4 Raster-Engines) geworden. Auch beim Speicherinterface geht Navi 31 denselben Weg und setzt gleich eine Interface-Breite von 384 Bit an. Nachdem man mit RDNA2 noch den "Infinity Cache" zur Reduzierung der Bedeutung des Speicherinterfaces einführte, war bei Navi 31 angesichts von 96 Shader-Clustern und 12'288 FP32-Einheiten wohl nichts mehr anderes möglich, als hier wirklich mehr "echte" Speicherbandbreite zu bieten. Und letztlich hat AMD etwas beim Infinity Cache gespart, nach 128 MB bei Navi 21 bringt Navi 31 "nur" noch 96 MB daher. Dafür steigt die Anbindung des Infinity Caches auf das Doppelte gegenüber Navi 21 (2,5 anstatt 1,2 TB/sec), was eigentlich ein guter Ausgleich sein sollte.

Aus dem grundsätzlichen Design des Navi-31-Chips mit 96 Shader-Clustern an einem 384-Bit-Speicherinterface zieht AMD dann zwei Grafikkarten: Die Radeon RX 7900 XTX im Vollausbau des Grafikchips sowie die Radeon RX 7900 XT mit einer gewissen Abspeckung auf 84 Shader-Cluster an einem 320-Bit-Speicherinterface. Diese Abspeckung ist durchaus AMD-typisch, zwischen Radeon RX 6800 XT und 6900 XT standen +11% mehr Shader-Cluster, bei Radeon RX 7900 XT und 7900 XTX sind es nunmehr +14%. Andere Punkte deuten wiederum auf einen etwas größeren Hardware-Unterschied hin, wie die beachtbaren Differenzen bei Infinity Cache, der IF$-Bandbreite sowie beim Speicherinterface, welches es bei der Vorgänger-Generation mehrheitlich nicht gab. Unverändert zwischen beiden Grafikkarten-Varianten sind allein die Anzahl von Raster-Engines, ROPs und Level2-Cache.

Radeon RX 7900 XT Radeon RX 7900 XTX Differenz
Raster-Engines (GPC) 6 6 ±0
Shader-Cluster (CU) 84 96 +14% bzw. –12,5%
FP32-Einheiten 10'752 12'288 +14% bzw. –12,5%
(nominelle) FP32-Leistung 51,6 TFlops 61,4 TFlops +19% bzw. –16%
ROPs 192 192 ±0
Level2-Cache 6 MB 6 MB ±0
Infinity Cache 80 MB 96 MB +20% bzw. –17%
IF$-Bandbreite 2,0 TB/sec 2,5 TB/sec +25% bzw. –20%
Speicherinterface 320 Bit GDDR6 384 Bit GDDR6 +20% bzw. –17%
Speichermenge 20 GB GDDR6 24 GB GDDR6 +20% bzw. –17%

Beachtenswerterweise hat AMD seine Referenz-Designs nicht so aufgebläht wie nVidia die seinigen: Die Radeon RX 7900 XT kommt mit einer Kartenlänge von 27,6cm aus, bei der Radeon RX 7900 XTX sind es 28,7cm, beiderseits mit einem Platzbedarf von 2½ Slots. Leider sieht es so aus, als würden die Hersteller-Modelle dieser Vorgabe überhaupt nicht folgen, jene gehen derzeit fast ausnahmslos in die Größenklasse der Herstellerdesigns zu GeForce RTX 4080 & 4090. nVidias neuer 12VHPWR-Stromadapter wird allerdings generell von keiner der neuen AMD-Grafikkarten verwendet, man bleibt bei den bekannten 8poligen Stromsteckern (2x für das Referenz-Design, 3x für viele Herstellerdesigns). Zu erwähnen zudem noch eine kleine Änderung der offiziellen Spezifikationen zur Radeon RX 7900 XT gegenüber AMDs ursprünglicher Ankündigung: Die kleinere Navi-31-Lösung tritt nunmehr mit einer TDP von 315 Watt an, nicht mehr mit "nur" 300 Watt.

GeForce RTX 4080 GeForce RTX 4090 Radeon RX 7900 XT Radeon RX 7900 XTX
Chipbasis nVidia AD103-300 nVidia AD102-300 AMD Navi 31 AMD Navi 31
Fertigung 45,9 Mrd. Transistoren auf 379mm² Chipfäche in der 4nm-Fertigung von TSMC 76,3 Mrd. Transistoren auf 609mm² Chipfäche in der 4nm-Fertigung von TSMC ? Mrd. Transistoren auf 485mm² Chipfäche in der 5/6nm-Fertigung von TSMC 58 Mrd. Transistoren auf 522mm² Chipfäche in der 5/6nm-Fertigung von TSMC
Architektur nVidia Ada Lovelace, DirectX 12 Feature-Level 12_2 AMD RDNA3, DirectX 12 Feature-Level 12_2
Features DirectX 12, OpenGL, Vulkan, RayTracing, DSR, DLDSR, DLSS 2/3, PhysX, G-Sync, FreeSync, rBAR DirectX 12, OpenGL, Vulkan, RayTracing, VSR, FSR 1/2/3, FreeSync, TrueAudio Next, XConnect, rBAR
Technik 7 Raster-Engines, 76 Shader-Cluster, 9728 FP32-Einheiten, 304 TMUs, 76 RT-Cores v3, 304 Tensor-Cores v4, 112 ROPs, 64 MB Level2-Cache, 256 Bit GDDR6X-Interface (Salvage) 11 Raster-Engines, 128 Shader-Cluster, 16'384 FP32-Einheiten, 512 TMUs, 128 RT-Cores v3, 512 Tensor-Cores v4, 176 ROPs, 72 MB Level2-Cache, 384 Bit GDDR6X-Interface (Salvage) 6 Raster-Engines, 84 Shader-Cluster, 10'752 FP32-Einheiten, 336 TMUs, 84 RA-Einheiten v2, 168 KI-Kerne, 192 ROPs, 6 MB Level2-Cache, 80 MB Infinity Cache v2, 320 Bit GDDR6-Interface (Salvage) 6 Raster-Engines, 96 Shader-Cluster, 12'288 FP32-Einheiten, 384 TMUs, 96 RA-Einheiten v2, 192 KI-Kerne, 192 ROPs, 6 MB Level2-Cache, 96 MB Infinity Cache v2, 384 Bit GDDR6-Interface (Vollausbau)
Taktraten 2205/2505 MHz & 22,4 Gbps 2235/2520 MHz & 21 Gbps 1500/2000/2400 MHz & 20 Gbps 1900/2300/2500 MHz & 20 Gbps
Rohleistungen 48,7 TFlops & 717 GB/sec 82,6 TFlops & 1008 GB/sec 51,6 TFlops & 800 GB/sec 61,4 TFlops & 960 GB/sec
Speicherausbau 16 GB GDDR6X 24 GB GDDR6X 20 GB GDDR6 24 GB GDDR6
Anbindung PCI Express 4.0 x16 PCI Express 4.0 x16 PCI Express 4.0 x16 PCI Express 4.0 x16
Ref/AIBs/OC / / / / / / / /
Layout Dual-, Triple- & QuadSlot Dual-, Triple- & QuadSlot Triple- & QuadSlot Dual-, Triple- & QuadSlot
Kartenlänge FE: 30,5cm
AIBs: 23,5-36,7cm
FE: 30,5cm
AIBs: 20,0-36,7cm
Ref: 27,6cm
AIBs: 31,3-35,3cm
Ref: 28,7cm
AIBs: 27,5-35,3cm
Stromstecker 1x 16pol. 1x 16pol. 2x 8pol. 2x 8pol.
off. Verbrauch 320W 450W 315W  (ASIC: 257W) 355W  (ASIC: 291W)
Real-Verbrauch 297W 418W 309W 351W
Ausgänge HDMI 2.1a, 3x DisplayPort 1.4a HDMI 2.1a, 3x DisplayPort 1.4a HDMI 2.1a, USB Type-C, 2x DisplayPort 2.1 HDMI 2.1a, USB Type-C, 2x DisplayPort 2.1
FHD Perf.Index 2690% 3000% 2530% 2740%
4K Perf.Index 496% 655% 434% 512%
Listenpreis $1199 / 1469€ $1599 / 1949€ $899 / 1049€ $999 / 1149€
Straßenpreis 1350-1500 Euro 1960-2200 Euro 1050-1130 Euro 1400-1800 Euro
Release 16. November 2022 12. Oktober 2022 13. Dezember 2022 13. Dezember 2022

Taktraten-technisch hatte man zweifellos (viel) mehr von Navi 31 erwartet als die derzeit gebotenen 2.3 GHz Game-Clock sowie 2.5 GHz Boost-Clock der Radeon RX 7900 XTX. Allerdings wird dies teilweise durch die real gemessenen Taktraten wieder ausgeglichen, welche eher denn bei 2.6 GHz liegen. Wie nicht unüblich bei heutigen Grafikkarten, liegt der Realtakt somit beachtbar oberhalb selbst der höchsten offiziellen Taktraten-Angabe des Herstellers. Die üblicherweise dynamisch schwankenden Taktraten können dabei durchaus auch 3.0 GHz erreichen, gehen allerdings teilweise auch auf nur 2.0 GHz zurück. Ein wirklicher Taktraten-Boost gegenüber der Vorgänger-Generation ergibt sich damit natürlich nicht, denn jene durchschnittlich 2.6 GHz sind nur gegenüber Navi-21-basierten Grafikkarten ein Gewinn, die kleineren Grafikkarten der Radeon RX 6000 Serie erreichten allerdings schon ähnliche und teilweise sogar höhere reale Taktraten.

Basis Durchschnitt Max gemessener Realtakt
AMD-Bezeichnung: "Base Clock" "Game Clock" "Boost Clock" "Max Clock" CB TPU PCGH
Radeon RX 7900 XTX 1900 MHz 2300 MHz 2500 MHz ? 2556 MHz 2612 MHz 2.60 GHz
Radeon RX 7900 XT 1500 MHz 2000 MHz 2400 MHz ? 2566 MHz 2687 MHz 2.40 GHz
Radeon RX 6950 XT 1890 MHz 2100 MHz 2310 MHz ? 2392 MHz 2405 MHz 2.42 GHz
Radeon RX 6900 XT 1825 MHz 2015 MHz 2250 MHz ? 2265 MHz 2233 MHz 2.30 GHz
Radeon RX 6800 XT 1825 MHz 2015 MHz 2250 MHz ? 2216 MHz 2257 MHz 2.34 GHz
Radeon RX 6800 1700 MHz 1815 MHz 2105 MHz ? 2177 MHz 2205 MHz 2.20 GHz
Radeon RX 6750 XT 2150 MHz 2495 MHz 2600 MHz ? 2683 MHz - 2.63 GHz
Radeon RX 6700 XT 2321 MHz 2424 MHz 2581 MHz ? 2531 MHz 2491 MHz 2.54 GHz
Radeon RX 6650 XT 2055 MHz 2410 MHz 2635 MHz ? 2601 MHz - 2.68 GHz
Radeon RX 6600 XT 1968 MHz 2359 MHz 2589 MHz ? 2562 MHz - 2.58 GHz
Radeon RX 6600 1626 MHz 2044 MHz 2491 MHz ? 2509 MHz 2444 MHz 2.51 GHz
Radeon RX 6500 XT 2310 MHz 2610 MHz 2815 MHz ? 2753 MHz - 2.82 GHz
nVidia-Bezeichnung: "Base Clock" "Boost Clock" "Max Clock" CB TPU PCGH
GeForce RTX 4090 2235 MHz 2520 MHz ? 2744 MHz 2701 MHz 2.74 GHz
GeForce RTX 4080 2205 MHz 2505 MHz ? 2725 MHz 2737 MHz 2.78 GHz
GeForce RTX 3090 Ti 1560 MHz 1860 MHz ? 1936 MHz 1979 MHz 2.00 GHz
GeForce RTX 3090 1400 MHz 1700 MHz ? 1754 MHz - 1.88 GHz
GeForce RTX 3080 Ti 1365 MHz 1665 MHz ? 1784 MHz 1780 MHz 1.80 GHz
GeForce RTX 3080 12GB 1260 MHz 1710 MHz ? - - 1.80 GHz
GeForce RTX 3080 10GB 1450 MHz 1710 MHz ? 1827 MHz 1931 MHz 1.90 GHz
GeForce RTX 3070 Ti 1575 MHz 1770 MHz ? 1878 MHz 1861 MHz 1.88 GHz
GeForce RTX 3070 1500 MHz 1725 MHz ? 1920 MHz 1882 MHz 1.86 GHz
GeForce RTX 3060 Ti 1410 MHz 1665 MHz ? 1900 MHz 1877 MHz 1.83 GHz
GeForce RTX 3060 1320 MHz 1777 MHz ? - - 1.87 GHz
GeForce RTX 3050 1552 MHz 1777 MHz ? 1891 MHz 1906 MHz 1.89 GHz
Intel-Bezeichnung: - "Graphics Clock" "Max Clock" CB TPU PCGH
Arc A770 "LE" - 2100 MHz 2400 MHz - 2386 MHz 2.33 GHz
Arc A750 - 2050 MHz 2400 MHz - 2394 MHz 2.39 GHz
Realtakt-Angaben gemäß den Ausarbeitungen der ComputerBase (Ø 17-20 Spiele) und von TechPowerUp (Ø 22-25 Spiele) sowie den Praxis-Angaben der PC Games Hardware von jeweils Referenz-Varianten (oder auf Referenz-Taktung/TDP laufend)

Beachtenswert daneben, dass die Radeon RX 7900 XT in der Praxis bei 2 der 3 Wertequellen keinen Taktraten-Unterschied zur Radeon RX 7900 XTX offenbart bzw. teilweise sogar leicht höher als die größere Karte taktet. Hier zeigt sich einmal mehr, dass heutige Grafikkarten nur noch sehr wenig von ihren nominellen Taktraten abhängen, sondern in der Praxis schlicht so weit takten, wie es die Limits für Stromzufuhr und Temperaturen zulassen. Augenscheinlich sind jene Limits bei der Radeon RX 7900 XT ausreichend hoch angesetzt, so dass die kleinere Karte den Navi-31-Chip Taktraten-technisch genauso stark ausreizen kann wie die größere Radeon RX 7900 XTX. Der reale Unterschied zwischen beiden Karten reduziert sich somit auf den echten Hardware-Unterschied, die nominelle Taktraten-Differenz existiert in der Praxis (weitgehend) nicht.