Launch-Analyse AMD Radeon RX 6800 & 6800 XT

Donnerstag, 26. November 2020
 / von Leonidas
 

Mit dem Launch von "Radeon RX 6800" und "Radeon RX 6800 XT" hat AMD am 18. November 2020 nun endlich die RDNA2-Generation eingeläutet. Beide neuen Grafikkarten basieren auf dem "Navi 21" Grafikchip – im Vorfeld oftmals auch schlicht als "Big Navi" bezeichnet – und stellen somit die Fortführung der Navi-Architektur dar, welche AMD letztes Jahr mit den Radeon RX 5000 Grafikkarten gestartet hatte. Während AMDs erste Navi-Generation noch im Mainstream- und Midrange-Segment verblieb, kommt mittels "Big Navi" nunmehr der Angriff aufs HighEnd- und teilweise auch das Enthusiasten-Segment. AMD peilt somit Leistungshöhen an, welche man zuletzt im Jahr 2015 mit den Fiji-basierten Fury-Grafikkarten besetzt hatte, fordert nVidia endlich auch wieder an der Leistungsspitze heraus. Wie gut dies gelingt, soll nachfolgend anhand der Auswertung der aufgelaufenen Benchmarks und Daten der Launch-Reviews zu Radeon RX 6800 & 6800 XT herausgearbeitet werden.

Der von AMD für die beiden neuen Grafikkarten angesetzte Navi-21-Chip ist jener Aufgabe sehr wohl würdig, denn mit 26,8 Milliarden Transistoren bewegt man sich in der Größenordnung des GA102-Chips von GeForce RTX 3080 & 3090 (28,3 Mrd. Transistoren). Allein die belegte Chipfläche ist mit 520mm² deutlich kleiner als beim GA102-Chip (628mm²), was aber natürlich an der abweichenden Chipfertigung hängt (AMD: 7nm TSMC, nVidia: 8nm Samsung). Nominell liegen in beiden Grafikchips sogar eine ähnliche Anzahl an Shader-Clustern vor: Bei AMD 80 hiervon, bei nVidia sogar 84. Jeder der beiden Grafikchips hat dann allerdings seine großen Besonderheiten: Bei nVidia sind dies wie bekannt die verdoppelten FP32-Einheiten – und bei AMD dann hingegen der "Infinity Cache", welcher faktisch als eine Art von Level3-Cache agiert. Hiermit will AMD die Menge der tatsächlich notwendigen Speicherzugriffe limitieren – und kommt somit auch mit einem 256 Bit GDDR6-Speicherinterface aus, wo nVidia deutlich größere Speicherinterfaces ins Feld führt.

    AMD "Navi 21"

  • alternativer Codename "Sienna Cichlid", umgangssprachlich auch "Big Navi" genannt
  • RDNA2 Architektur (GFX1030)
  • DirectX 12 Feature Level 12_2, OpenGL, Vulkan, Asynchonous Compute, RayTracing, VSR, FreeSync, TrueAudio Next, XConnect
  • 26,8 Mrd. Transistoren auf 520mm² Chipfläche in der 7nm-Fertigung von TSMC
  • 4 "Shader Engines" mit jeweils 2 Raster-Engines, 20 Shader-Clustern und 32 ROPs
  • ein Shader-Cluster enthält 64 Shader-Einheiten, 4 Textureneinheiten und einen "Ray Accelerator"
  • somit insgesamt 8 Raster-Engines, 80 Shader-Cluster, 5120 Shader-Einheiten, 320 Textureneinheiten, 80 Ray Accelerators und 128 ROPs
  • 4 MB Level2-Cache sowie 128 MB "Infinity Cache" @ 1024 Bit Interface
  • 256 Bit GDDR6-Speicherinterface
  • PCI Express 4.0
  • HDMI 2.1, DisplayPort 1.4
  • resultierende Grafikkarten: Radeon RX 6800, Radeon RX 6800 XT & Radeon RX 6900 XT
  • Release: 18. November 2020

Interessanterweise ist AMD intern tatsächlich dieselben Gedankengänge durchgegangen, welche vorab beim Aufkommen der ersten Informationsfetzen zu "Big Navi" auch in den Foren diskutiert wurden: Die 80 Shader-Cluster würden eigentlich ein 512-Bit-Interface benötigen, 384 Bit wären dafür wohl etwas zu wenig. AMD hat zwar Erfahrungen mit solcherart großen Speicherinterfaces, die darauf basierenden Grafikchips (AMD "Hawaii") waren allerdings echte Stromfresser. Denn an dieser Stelle liegt der Hauptgrund für den Infinity Cache bei "Big Navi": Ohne selbigen müsste der Grafikchip ein ziemlich dickes Speicherinterface tragen, was im Sinne des Stromverbrauchs schlecht wäre – und eingedenk gewisser Verbrauchs-Limits dann sogar die Rechenkraft des Grafikchips limitieren könnte (wenn man zu viel vom Power-Budget ans Speicherinterface übertragen muß). Ein Großteil des (später noch einmal betrachteten) Energieeffizienz-Vorteils zwischen RDNA1 und RDNA2 dürfte letztlich am Infinity Cache und dem damit ausgelösten vergleichsweise kleinen Speicherinterface hängen.

Ansonsten ist AMDs RDNA2-Architektur gar nicht derart abweichend von der bekannten RDNA1-Architektur. Inbesondere der Navi-21-Chip ist vom Aufbau her faktisch wie ein verdoppelter Navi-10-Chip – nur halt mit Infinity Cache anstelle eines verdoppelten Speicherinterfaces. Eine bedeutsame andere Änderung liegt in der Hinzunahme einer einzelnen RayTracing-Einheit namens "Ray Accelerator" pro Shader-Cluster. Jene ist allerdings weit weniger mächtig als nVidias RayTracing-Ansatz, insofern darf hierbei nicht die gleiche RayTracing-Performance wie bei nVidia erwartet werden. Unter dem Namen "FidelityFX Super Resolution" arbeitet AMD zudem an einem DLSS-Äquivalent, was natürlich gerade in Bezug auf RayTracing bzw. dessen Performance-Anforderungen wichtig ist. Allerdings wird jenes Feature zu einem noch unbekannten Zeitpunkt erst nächstes Jahr (per Treiber) nachgereicht werden, zudem darf hierbei sicherlich nicht umgehend die Qualität und Performance des nVidia-Originals erwartet werden.

Aus dem Navi-21-Grafikchip wird AMD nach derzeitigem Stand drei Gamer-Grafikkarten generieren, wovon das Spitzenmodell "Radeon RX 6900 XT" im Vollausbau des Grafikchips erst am 8. Dezember 2020 in den Ring steigt. Die hiermit zu betrachtenden Grafikkarten "Radeon RX 6800" sowie "Radeon RX 6800 XT" stellen somit "nur" Abspeckungen des Navi-21-Chips dar – wie es inzwischen üblich ist, Grafikkarten im Vollausbau eines Grafikchips sind eher die Ausnahme als denn die Regel (bei nVidia ist derzeit keine der bekannten Ampere-Grafikkarten ein Vollausbau). Die Radeon RX 6800 XT ist dem Vollaubau noch am nächsten, hier fehlen schlicht 8 der 80 Shader-Cluster, sprich 2 Shader-Cluster pro "Shader-Engine" sind deaktiviert. Bei der Radeon RX 6800 ist dies radikaler gelöst: Für jene Grafikkarte wurde gleich eine der vier Shader-Engines komplett deaktiviert, womit dann die restlichen drei Shader-Engines vollumfänglich laufen müssen, um auf die spezifikationsgemäßen 60 Shader-Cluster zu kommen. Dies ist auch der Grund für die geringere Anzahl an ROPs bei der Radeon RX 6800: Jene ROPs liegen nunmehr innerhalb der Shader-Engines – und sobald eine davon deaktiviert wird, reduziert sich auch die Anzahl der (aktiven) ROPs.

GeForce RTX 3070 Radeon RX 6800 Radeon RX 6800 XT GeForce RTX 3080
Chipbasis nVidia GA104-300 AMD Navi 21 XL AMD Navi 21 XT nVidia GA102-200
Fertigung 17,4 Mrd. Transistoren auf 392mm² in der 8nm-Fertigung von Samsung 26,8 Mrd. Transistoren auf 520mm² in der 7nm-Fertigung von TSMC 28,3 Mrd. Transistoren auf 628mm² in der 8nm-Fertigung von Samsung
Architektur nVidia Ampere, DirectX 12 Feature-Level 12_2 AMD RDNA2, DirectX 12 Feature-Level 12_2 nVidia Ampere, DirectX 12 Feature-Level 12_2
Features DirectX 12, OpenGL, Vulkan, Asynchonous Compute, RayTracing, DSR, DLSS, PhysX, G-Sync, FreeSync DirectX 12, OpenGL, Vulkan, Asynchonous Compute, RayTracing, VSR, FreeSync, TrueAudio Next, XConnect DirectX 12, OpenGL, Vulkan, Asynchonous Compute, RayTracing, DSR, DLSS, PhysX, G-Sync, FreeSync
Technik 6 Raster-Engines, 46 Shader-Cluster, 5888 FP32-Einheiten, 184 TMUs, 46 RT-Cores v2, 184 Tensor-Cores v3, 96 ROPs, 4 MB Level2-Cache, 256 Bit GDDR6-Interface (Salvage) 6 Raster-Engines, 60 Shader-Cluster, 3840 FP32-Einheiten, 240 TMUs, 60 RA-Einheiten, 96 ROPs, 4 MB Level2-Cache, 128 MB "Infinity Cache", 256 Bit GDDR6-Interface (Salvage) 8 Raster-Engines, 72 Shader-Cluster, 4608 FP32-Einheiten, 288 TMUs, 72 RA-Einheiten, 128 ROPs, 4 MB Level2-Cache, 128 MB "Infinity Cache", 256 Bit GDDR6-Interface (Salvage) 6 Raster-Engines, 68 Shader-Cluster, 8704 FP32-Einheiten, 272 TMUs, 68 RT-Cores v2, 272 Tensor-Cores v3, 96 ROPs, 5 MB Level2-Cache, 320 Bit GDDR6X-Interface (Salvage)
Taktraten 1500/1725 MHz & 14 Gbps 1700/1815 MHz & 16 Gbps 1825/2015 MHz & 16 Gbps 1450/1710 MHz & 19 Gbps
Rohleistungen 20,3 TFlops & 448 GB/sec 13,9 TFlops & 512 GB/sec 18,6 TFlops & 512 GB/sec 29,8 TFlops & 760 GB/sec
Speicherausbau 8 GB GDDR6 16 GB GDDR6 16 GB GDDR6 10 GB GDDR6X
Anbindung PCI Express 4.0 PCI Express 4.0 PCI Express 4.0 PCI Express 4.0
FE/Herst./OC / / / / / / / /
Layout Dual/TripleSlot Dual/TripleSlot TripleSlot Dual/TripleSlot
Kartenlänge Herst: 23,2-32,3cm
FE: 24,5cm
Herst: 26,7-34,0cm
Ref: 27,0cm
Herst: 26,7-34,0cm
Ref: 27,0cm
Herst: 27,4-32,3cm
FE: 28,5cm
Stromstecker 1x 12pol. 2x 8pol. 2x 8pol. 1x 12pol.
off. Verbrauch 220W (GCP) 250W (TBP) 300W (TBP) 320W (GCP)
realer Verbr. FE: 220W 231W 296W FE: 328W
Ausgänge HDMI 2.1, 3x DisplayPort 1.4 HDMI 2.1, 2x DisplayPort 1.4, USB Type-C HDMI 2.1, 3x DisplayPort 1.4
FullHD Perf.Index 1590% 1650% 1840% 1900%
4K Perf.Index 245% 266% 306% 328%
Listenpreis $499 $579 $649 $699
Straßenpreis Herst: 610-850€FE: 499€ Ref: 579€ Ref: 649€ Herst: 860-1100€FE: 699€
Release 29. Oktober 2020 18. November 2020 18. November 2020 17. September 2020

Für den nicht gänzlich unerheblichen Hardware-Unterschied von 60 zu 72 Shader-Clustern (+20%) zwischen Radeon RX 6800 und Radeon RX 6800 XT setzt AMD mit 579 zu 649 Dollar (+12%) nur einen vergleichsweise kleinen Preis-Unterschied an. Jene Preislagen sind aber natürlich verkaufstaktisch gewählt: Die größere Radeon RX 6800 XT soll mit ihren 649 Dollar die GeForce RTX 3080 preislich angreifen, während sich AMD bei der kleineren Radeon RX 6800 augenscheinlich seiner Sache sicher ist und daher ein Preispunkt beachtbar oberhalb der GeForce GTX 3070 angesetzt wurde. In beiden Fällen wäre bei der Preisgestaltung auch die dafür gebotene Menge an Grafikkartenspeicher zu beachten: Mit jeweils 16 GB geht AMD in dieser Frage keinerlei Kompromisse ein und setzt nVidias Angebote deutlich unter Druck – bei der GeForce RTX 3080 vielleicht etwas weniger, aber bei der GeForce RTX 3070 dann deutlich. Sobald es in anderen Punkten auf knappe Differenzen hinausläuft, dürfte dieser erhebliche Speichermengen-Vorteil sicherlich in vielen Fällen das "Zünglein an der Waage" ergeben.

AMD hat mit der RDNA2-Generation die Taktraten seiner Grafikkarten nochmals weiter ausgebaut, was sich sowohl an den offiziellen als auch den real erreichten Taktraten (deutlich) bemerkbar macht. Inzwischen takten die neuen AMD-Grafikkarten somit bemerkbar höher als die aktuellen nVidia-Grafikkarten – womit AMD auch einen Teil von deren nominellen Rechenleistungs-Vorteil durch die verdoppelten FP32-Einheiten wieder aufholen kann. Interessanterweise ergibt sich bei den Navi-21-basierten Grafikkkarten der Effekt, dass jene sogar oftmals oberhalb der eigentlich als Taktraten-Maximum spezifizierten "Boost Frequency" operieren. In der Praxis fungiert letztere Angaben bei Navi 21 nicht mehr als wirkliche Taktraten-Begrenzung, sondern vielmehr takten sich die Navi-21-Grafikkarten bei passenden Bedingungen gemäß Power- und Temperatur-Limit (ähnlich wie AMDs Zen-3-Prozessoren) munter weiter nach oben.

Basis Durchschnitt Maximum durchschnittlicher Realtakt
AMD-Bezeichnung "Base Frequency" "Game Frequency" "Boost Frequency" -
Radeon RX 6900 XT ? 2015 MHz 2250 MHz ?
Radeon RX 6800 XT 1825 MHz 2015 MHz 2250 MHz CB: 2216 MHz – TPU: 2257 MHz
Radeon RX 6800 1700 MHz 1815 MHz 2105 MHz CB: 2177 MHz – TPU: 2205 MHz
nVidia-Bezeichnung "Base Clock" "Boost Clock" - -
GeForce RTX 3090 1400 MHz 1700 MHz ? TPU: 1754 MHz
GeForce RTX 3080 1450 MHz 1710 MHz 1995 MHz CB: 1827 MHz – TPU: 1931 MHz
GeForce RTX 3070 1500 MHz 1725 MHz 2040 MHz CB: 1892 MHz – TPU: 1882 MHz
Realtakt-Angaben gemäß den Ausarbeitungen der ComputerBase (Ø 17 Spiele) und von TechPowerUp (Ø 23 Spiele)