Launch-Analyse AMD Radeon RX 7700 XT & 7800 XT

Dienstag, 12. September 2023
 / von Leonidas
 

Mit dem Navi-32-Chip bringt AMD nun endlich seine lange vermissten Midrange-Beschleuniger innerhalb der RDNA3-Generation an den Start, welche in den Grafikkarten "Radeon RX 7700 XT" und "Radeon RX 7800 XT" resultieren. Jene müssen sich mit den letzten Resten der früheren Ampere/RDNA2-Generation sowie natürlich in erster Linie mit nVidias neuen Ada-Lovelace-Beschleunigern dieses Preisbereichs vergleichen lassen. nVidia hat es AMD dabei vergleichsweise leicht gemacht, indem die GeForce RTX 4070 nominell klar teurer als die Radeon RX 7800 XT angesetzt wurde und die GeForce RTX 4060 Ti (bei weitem) nicht als potent genug erscheint, um es mit der Radeon RX 7700 XT aufnehmen zu können. Ob diese nominell gut klingende Ansetzung in der Praxis hält was sie verspricht, soll mittels dieser Launch-Analyse auf Basis der Benchmark-Auswertung von 16 Launch-Reviews herausgearbeitet werden.

Wie beim Navi-31-Chip kommt der neue Navi-32-Chip im Chiplet-Verfahren daher, teilt sich somit in fünf Einzelchips auf: Ein GCD mit dem eigentlichen Grafikchip sowie bis zu vier MCDs mit jeweils einem Teil des Speicherinterfaces sowie des Infinity Caches. Hiervon hat sich AMD wohl eine kostengünstigere Fertigung versprochen, immerhin kommen somit 42% des kompletten Navi-32-Grafikchips noch aus der 6nm-Fertigung bzw. kann die Salvage-Lösung "Radeon RX 7700 XT" auch mit tatsächlich kleinerem Silizium-Aufwand erstellt werden (nur 3 anstatt 4 MCDs notwendig). In der Praxis hat sich das erstmals mittels "Navi 31" im Bereich von Gaming-Grafikchips benutzte Chiplet-Verfahren noch nicht als großer Durchbruch gezeigt und AMD konnte bei beiden 5nm-Chips (Navi 31 & 32) jeweils nicht die benötigten Taktraten im Gaming-Einsatz erreichen, welche zur Verwirklichung der gesetzten Performance-Ziele notwendig gewesen wären.

    AMD Navi 32

  • RDNA3-Architektur
  • Chiplet-Verfahren mit einem GCD unter TSMC N5 (200mm²) und bis zu 4 MCDs unter TSMC N6 (á 37mm²)
  • GCD trägt den eigentlichen Grafikchip, MCD trägt Speicherinterface & Infinity Cache (jeweils 64-Bit-Interface + 16 MB IF$ pro MCD)
  • 28,1 Mrd. Transistoren auf 348mm² Chipfläche im Vollausbau
  • "Dual-Issue Stream Processor" = sinngemäß 128 FP32-Einheiten pro Shader-Cluster
  • 3 Raster-Engines, 60 Shader-Cluster (CU), 3840 Stream-Prozessoren (sinngemäß 7680 FP32-Einheiten), 60 RA-Einheiten v2, 120 KI-Kerne, 240 TMUs, 96 ROPs
  • unterschiedliche Taktraten für Front-End und Shader-Cluster
  • 4 MB Level2-Cache, 64 MB Infinity Cache v2, 256 Bit GDDR6-Speicherinterface
  • PCI Express 4.0 x16 Interface
  • Support für rBAR, DisplayPort 2.1, HDMI 2.1a, FSR3 und Hyper-RX
  • resultierende Grafikkarten: Radeon RX 7700 XT (54 CU & 192-bit, Salvage) & Radeon RX 7800 XT (60 CU & 256-bit, Vollausbau)

Erschwerend kommt für Navi 32 hinzu, dass der Grafikchip bei den meisten Hardare-Einheiten zwar fast zwei Drittel so groß ist wie Navi 31, bei den gar nicht so unrelevanten Raster-Engines allerdings nur halb so groß (3 vs 6). Dies ergibt eine nominelle Unterversorgung mit Raster-Power bei Navi 32, was zudem durch die Hardware-Daten von Navi 33 bestätigt wird: Danach hat Navi 32 zwischen 87-100% mehr Hardware-Einheiten in fast allen Fällen, doch bei der Raster-Power geht es nur von 2 auf 3 Raster-Engines nach oben (+50%). Besser passend für Navi 32 wären gemäß der Hardware-Daten von Navi 31 & 33 somit 4 (anstatt 3) Raster-Engines gewesen. Gleiches gilt für die Anzahl der ROPs, welche im RDNA3-Design durchgehend an der Anzahl der Raster-Engines hängt. Diese Problematik mag keinen ganz großen Ausschlag ergeben, kostet Navi 32 allerdings auch wieder etwas an Potential – zusätzlich zu den schon vorhandenen Problemfeldern.

Navi 33 Navi 32 Navi 31
Raster-Engines 2 3 6
Shader-Cluster 32
(4096 FP32, 32 RT, 64 KI, 128 TMU)
60
(7680 FP32, 60 RT, 120 KI, 240 TMU)
96
(12288 FP32, 96 RT, 192 KI, 384 TMU)
ROPs 64 96 192
Level2-Cache 2 MB 4 MB 6 MB
Infinity Cache 32 MB 64 MB 96 MB
Speicherinterface 128 Bit GDDR6 256 Bit GDDR6 384 Bit GDDR6
PCI Express PCIe 4.0 x8 PCIe 4.0 x16 PCIe 4.0 x16
Bauform monolithisch Chiplets Chiplets
Chipfläche 204mm²
(komplett 6nm)
348mm²
(200mm² 5nm + 148mm² 6nm)
522mm²
(300mm² 5nm + 222mm² 6nm)

Aus dem Navi-32-Chip schnitzt AMD dann zwei Grafikkarten: "Radeon RX 7800 XT" im Vollausbau des Grafikchips sowie "Radeon RX 7700 XT" als Salvage-Lösung. Letztere trägt mit 54 von 60 Shader-Clustern nur vergleichsweise wenige Unterschiede bei den eigentlichen Recheneinheiten, die größere Differenz liegt im Speicher-Subsystem: AMD spart sich hier einen MCD, womit der Infinity Cache von 64 auf 48 MB sinkt, sowie die Breite des Speicherinterfaces von 256 auf 192 Bit zurückgeht. In Folge dessen gibt es auch weniger Grafikkartenspeicher, die Radeon RX 7800 XT tritt mit 16 GB GDDR6-Speicher an, die Radeon RX 7700 XT hingegen mit nur 12 GB GDDR6. Für jene Salvage-Lösung spart AMD also an zwei Stellen tatsächlich Hardware-Kosten ein, insofern sieht die Preisansetzung der Radeon RX 7700 XT mit nur 50 Dollar unterhalb der Radeon RX 7800 XT liegend ein wenig unpassend aus.

GeForce RTX 4060 Ti 16GB GeForce RTX 4070 Radeon RX 7700 XT Radeon RX 7800 XT
Chipbasis nVidia AD106-351 nVidia AD104-250 AMD Navi 32 XL AMD Navi 32 XT
Fertigung 22,9 Mrd. Transistoren auf 188mm² Chipfäche in der 5nm-Fertigung von TSMC 35,8 Mrd. Transistoren auf 295mm² Chipfäche in der 5nm-Fertigung von TSMC ? Mrd. Transistoren auf 311mm² Chipfäche in der 5/6nm-Fertigung von TSMC 28,1 Mrd. Transistoren auf 348mm² Chipfäche in der 5/6nm-Fertigung von TSMC
Architektur nVidia Ada Lovelace, DirectX 12 Feature-Level 12_2 AMD RDNA3, DirectX 12 Feature-Level 12_2
Features DirectX 12, OpenGL, Vulkan, RayTracing, DSR, DLDSR, DLSS 2/3, PhysX, G-Sync, FreeSync, rBAR DirectX 12, OpenGL, Vulkan, RayTracing, VSR, FSR 1/2/3, FreeSync, TrueAudio Next, XConnect, rBAR
Technik 3 Raster-Engines, 34 Shader-Cluster, 4352 FP32-Einheiten, 136 TMUs, 34 RT-Cores v3, 136 Tensor-Cores v4, 48 ROPs, 32 MB Level2-Cache, 128 Bit GDDR6-Interface (Salvage) 4 Raster-Engines, 46 Shader-Cluster, 5888 FP32-Einheiten, 184 TMUs, 46 RT-Cores v3, 184 Tensor-Cores v4, 64 ROPs, 36 MB Level2-Cache, 192 Bit GDDR6X-Interface (Salvage) 3 Raster-Engines, 54 Shader-Cluster, 6912 FP32-Einheiten, 216 TMUs, 54 RA-Einheiten v2, 108 KI-Kerne, 96 ROPs, 4 MB Level2-Cache, 48 MB "Infinity Cache", 192 Bit GDDR6-Interface (Salvage) 3 Raster-Engines, 60 Shader-Cluster, 7680 FP32-Einheiten, 240 TMUs, 60 RA-Einheiten v2, 120 KI-Kerne, 96 ROPs, 4 MB Level2-Cache, 64 MB "Infinity Cache", 256 Bit GDDR6-Interface (Vollausbau)
Taktraten 2310/2535 MHz & 18 Gbps 1920/2475 MHz & 21 Gbps 1700/2171/2544 MHz & 18 Gbps 1295/2124/2430 MHz & 19,5 Gbps
Rohleistungen 22,1 TFlops & 288 GB/sec 29,1 TFlops & 504 GB/sec 35,2 TFlops & 432 GB/sec 37,3 TFlops & 624 GB/sec
Speicherausbau 16 GB GDDR6 12 GB GDDR6X 12 GB GDDR6 16 GB GDDR6
Anbindung PCI Express 4.0 x8 PCI Express 4.0 x16 PCI Express 4.0 x16 PCI Express 4.0 x16
Ref./Herst./OC / / / / / / / /
Layout Dual- & TripleSlot Dual- & TripleSlot Dual- & TripleSlot Dual- & TripleSlot
Kartenlänge AIBs: 19,9-32,5cm FE: 24,0cm
AIBs: 22,6-34,9cm
AIBs: 26,6-33,5cm Ref: 26,5cm
AIBs: 28,0-33,5cm
Stromstecker AIBs: 1x 8pol. FE: 1x 16pol.
AIBs: 1x 8pol.
AIBs: 2x 8pol. Ref: 2x 8pol.
AIBs: 2x 8pol.
off. Verbrauch 165W 200W 245W 263W
Ausgänge HDMI 2.1a, 3x DisplayPort 1.4a HDMI 2.1a, 3x DisplayPort 1.4a HDMI 2.1a, 3x DisplayPort 2.1 HDMI 2.1a, 3x DisplayPort 2.1
Listenpreis $499 / 549€ $599 / 659€ $449 / 489€ $499 / 549€
Release 18. Juli 2023 13. April 2023 6. September 2023 6. September 2023

Interessanterweise schiebt AMD den Hardware-Unterschied zwischen beiden Navi-32-Karten auf Seiten der Rechenleistung durch höhere Taktraten bei der kleineren Karte noch weiter zusammen. Von den Hardware-Daten her liegt die Radeon RX 7700 XT schon auf 90% des Rechenleistungs-Niveaus der Radeon RX 7800 XT, gemäß der offiziellen Taktraten sind es sogar 94%. In der Praxis erreicht die Radeon RX 7800 XT ihren (sowieso nicht garantierten) Boost-Takt aber nicht gänzlich, während die Radeon RX 7700 XT selbigen in 2 der 3 Messungen leicht überbietet. Die Rohleistungs-Kalkulation auf Basis der real gemessenen Taktraten sieht die Radeon RX 7700 XT somit dann sogar schon auf 96% des Rechenleistungs-Niveaus der Radeon RX 7800 XT. Jeder größere Performance-Unterschied zwischen beiden Karten muß somit primär aus der Differenz im Speicher-Subsystem kommen.

Basis Durchschnitt Max gemessener Realtakt
AMD-Bezeichnung: "Base Clock" "Game Clock" "Boost Clock" "Max Clock" CB TPU PCGH
Radeon RX 7900 XTX 1900 MHz 2300 MHz 2500 MHz ? 2556 MHz 2612 MHz 2.60 GHz
Radeon RX 7900 XT 1500 MHz 2000 MHz 2400 MHz ? 2566 MHz 2687 MHz 2.40 GHz
Radeon RX 7800 XT 1295 MHz 2124 MHz 2430 MHz ? 2386 MHz 2425 MHz 2.35 GHz
Radeon RX 7700 XT 1700 MHz 2171 MHz 2544 MHz ? 2507 MHz 2560 MHz 2.56 GHz
Radeon RX 7600 1720 MHz 2250 MHz 2625 MHz ? 2645 MHz 2613 MHz 2.61 GHz
Radeon RX 6950 XT 1890 MHz 2100 MHz 2310 MHz ? 2392 MHz 2405 MHz 2.42 GHz
Radeon RX 6900 XT 1825 MHz 2015 MHz 2250 MHz ? 2265 MHz 2233 MHz 2.30 GHz
Radeon RX 6800 XT 1825 MHz 2015 MHz 2250 MHz ? 2216 MHz 2257 MHz 2.34 GHz
Radeon RX 6800 1700 MHz 1815 MHz 2105 MHz ? 2177 MHz 2205 MHz 2.20 GHz
Radeon RX 6750 XT 2150 MHz 2495 MHz 2600 MHz ? 2683 MHz - 2.63 GHz
Radeon RX 6700 XT 2321 MHz 2424 MHz 2581 MHz ? 2531 MHz 2491 MHz 2.54 GHz
Radeon RX 6650 XT 2055 MHz 2410 MHz 2635 MHz ? 2601 MHz - 2.68 GHz
Radeon RX 6600 XT 1968 MHz 2359 MHz 2589 MHz ? 2562 MHz - 2.58 GHz
Radeon RX 6600 1626 MHz 2044 MHz 2491 MHz ? 2509 MHz 2444 MHz 2.51 GHz
Radeon RX 6500 XT 2310 MHz 2610 MHz 2815 MHz ? 2753 MHz - 2.82 GHz
nVidia-Bezeichnung: "Base Clock" "Boost Clock" "Max Clock" CB TPU PCGH
GeForce RTX 4090 2235 MHz 2520 MHz ? 2744 MHz 2701 MHz 2.74 GHz
GeForce RTX 4080 2205 MHz 2505 MHz ? 2725 MHz 2737 MHz 2.78 GHz
GeForce RTX 4070 Ti 2310 MHz 2610 MHz ? 2802 MHz - 2737 MHz
GeForce RTX 4070 1920 MHz 2475 MHz ? 2758 MHz 2762 MHz 2769 MHz
GeForce RTX 4060 Ti 2310 MHz 2535 MHz ? 2714 MHz 2767 MHz 2.74 GHz
GeForce RTX 4060 1830 MHz 2460 MHz ? 2738 MHz 2640 MHz 2.69 GHz
GeForce RTX 3090 Ti 1560 MHz 1860 MHz ? 1936 MHz 1979 MHz 2.00 GHz
GeForce RTX 3090 1400 MHz 1700 MHz ? 1754 MHz - 1.88 GHz
GeForce RTX 3080 Ti 1365 MHz 1665 MHz ? 1784 MHz 1780 MHz 1.80 GHz
GeForce RTX 3080 12GB 1260 MHz 1710 MHz ? - - 1.80 GHz
GeForce RTX 3080 10GB 1450 MHz 1710 MHz ? 1827 MHz 1931 MHz 1.90 GHz
GeForce RTX 3070 Ti 1575 MHz 1770 MHz ? 1878 MHz 1861 MHz 1.88 GHz
GeForce RTX 3070 1500 MHz 1725 MHz ? 1920 MHz 1882 MHz 1.86 GHz
GeForce RTX 3060 Ti 1410 MHz 1665 MHz ? 1900 MHz 1877 MHz 1.83 GHz
GeForce RTX 3060 1320 MHz 1777 MHz ? - - 1.87 GHz
GeForce RTX 3050 1552 MHz 1777 MHz ? 1891 MHz 1906 MHz 1.89 GHz
Intel-Bezeichnung: - "Graphics Clock" "Max Clock" CB TPU PCGH
Arc A770 "LE" - 2100 MHz 2400 MHz - 2386 MHz 2.33 GHz
Arc A750 - 2050 MHz 2400 MHz - 2394 MHz 2.39 GHz
Realtakt-Angaben gemäß den Ausarbeitungen der ComputerBase (Ø 11-20 Spiele) und von TechPowerUp (Ø 22-25 Spiele) sowie den Praxis-Angaben der PC Games Hardware (neuere, MHz-genaue Werte: Ø 20 Spiele) von jeweils Referenz-Varianten (oder auf Referenz-Taktung/TDP laufend)