Launch-Analyse AMD Radeon RX 6800 & 6800 XT

Donnerstag, 26. November 2020

/ von Leonidas

Mit dem Launch von "Radeon RX 6800" und "Radeon RX 6800 XT" hat AMD am 18. November 2020 nun endlich die RDNA2-Generation eingeläutet. Beide neuen Grafikkarten basieren auf dem "Navi 21" Grafikchip – im Vorfeld oftmals auch schlicht als "Big Navi" bezeichnet – und stellen somit die Fortführung der Navi-Architektur dar, welche AMD letztes Jahr mit den Radeon RX 5000 Grafikkarten gestartet hatte. Während AMDs erste Navi-Generation noch im Mainstream- und Midrange-Segment verblieb, kommt mittels "Big Navi" nunmehr der Angriff aufs HighEnd- und teilweise auch das Enthusiasten-Segment. AMD peilt somit Leistungshöhen an, welche man zuletzt im Jahr 2015 mit den Fiji-basierten Fury-Grafikkarten besetzt hatte, fordert nVidia endlich auch wieder an der Leistungsspitze heraus. Wie gut dies gelingt, soll nachfolgend anhand der Auswertung der aufgelaufenen Benchmarks und Daten der Launch-Reviews zu Radeon RX 6800 & 6800 XT herausgearbeitet werden.

AMD Radeon RX 6800 & Radeon RX 6800 XT im Referenz-Design

Der von AMD für die beiden neuen Grafikkarten angesetzte Navi-21-Chip ist jener Aufgabe sehr wohl würdig, denn mit 26,8 Milliarden Transistoren bewegt man sich in der Größenordnung des GA102-Chips von GeForce RTX 3080 & 3090 (28,3 Mrd. Transistoren). Allein die belegte Chipfläche ist mit 520mm² deutlich kleiner als beim GA102-Chip (628mm²), was aber natürlich an der abweichenden Chipfertigung hängt (AMD: 7nm TSMC, nVidia: 8nm Samsung). Nominell liegen in beiden Grafikchips sogar eine ähnliche Anzahl an Shader-Clustern vor: Bei AMD 80 hiervon, bei nVidia sogar 84. Jeder der beiden Grafikchips hat dann allerdings seine großen Besonderheiten: Bei nVidia sind dies wie bekannt die verdoppelten FP32-Einheiten – und bei AMD dann hingegen der "Infinity Cache", welcher faktisch als eine Art von Level3-Cache agiert. Hiermit will AMD die Menge der tatsächlich notwendigen Speicherzugriffe limitieren – und kommt somit auch mit einem 256 Bit GDDR6-Speicherinterface aus, wo nVidia deutlich größere Speicherinterfaces ins Feld führt.

AMD "Navi 21"

alternativer Codename "Sienna Cichlid", umgangssprachlich auch "Big Navi" genannt
RDNA2 Architektur (GFX1030)
DirectX 12 Feature Level 12_2, OpenGL, Vulkan, Asynchonous Compute, RayTracing, VSR, FreeSync, TrueAudio Next, XConnect
26,8 Mrd. Transistoren auf 520mm² Chipfläche in der 7nm-Fertigung von TSMC
4 "Shader Engines" mit jeweils einer Raster-Engine samt Primitive-Unit, 20 Shader-Clustern und 32 ROPs
ein Shader-Cluster enthält 64 Shader-Einheiten, 4 Textureneinheiten und einen "Ray Accelerator"
somit insgesamt 4 Raster-Engines, 80 Shader-Cluster, 5120 Shader-Einheiten, 320 Textureneinheiten, 80 Ray Accelerators und 128 ROPs
4 MB Level2-Cache sowie 128 MB "Infinity Cache" @ 1024 Bit Interface
256 Bit GDDR6-Speicherinterface
PCI Express 4.0
HDMI 2.1, DisplayPort 1.4
resultierende Grafikkarten: Radeon RX 6800, Radeon RX 6800 XT & Radeon RX 6900 XT
Release: 18. November 2020

Interessanterweise ist AMD intern tatsächlich dieselben Gedankengänge durchgegangen, welche vorab beim Aufkommen der ersten Informationsfetzen zu "Big Navi" auch in den Foren diskutiert wurden: Die 80 Shader-Cluster würden eigentlich ein 512-Bit-Interface benötigen, 384 Bit wären dafür wohl etwas zu wenig. AMD hat zwar Erfahrungen mit solcherart großen Speicherinterfaces, die darauf basierenden Grafikchips (AMD "Hawaii") waren allerdings echte Stromfresser. Denn an dieser Stelle liegt der Hauptgrund für den Infinity Cache bei "Big Navi": Ohne selbigen müsste der Grafikchip ein ziemlich dickes Speicherinterface tragen, was im Sinne des Stromverbrauchs schlecht wäre – und eingedenk gewisser Verbrauchs-Limits dann sogar die Rechenkraft des Grafikchips limitieren könnte (wenn man zu viel vom Power-Budget ans Speicherinterface übertragen muß). Ein Großteil des (später noch einmal betrachteten) Energieeffizienz-Vorteils zwischen RDNA1 und RDNA2 dürfte letztlich am Infinity Cache und dem damit ausgelösten vergleichsweise kleinen Speicherinterface hängen.

AMD RDNA2 / Navi 21 Architektur

AMD Infinity Cache

Ansonsten ist AMDs RDNA2-Architektur gar nicht derart abweichend von der bekannten RDNA1-Architektur. Inbesondere der Navi-21-Chip ist vom Aufbau her faktisch wie ein verdoppelter Navi-10-Chip – nur halt mit Infinity Cache anstelle eines verdoppelten Speicherinterfaces. Eine bedeutsame andere Änderung liegt in der Hinzunahme einer einzelnen RayTracing-Einheit namens "Ray Accelerator" pro Shader-Cluster. Jene ist allerdings weit weniger mächtig als nVidias RayTracing-Ansatz, insofern darf hierbei nicht die gleiche RayTracing-Performance wie bei nVidia erwartet werden. Unter dem Namen "FidelityFX Super Resolution" arbeitet AMD zudem an einem DLSS-Äquivalent, was natürlich gerade in Bezug auf RayTracing bzw. dessen Performance-Anforderungen wichtig ist. Allerdings wird jenes Feature zu einem noch unbekannten Zeitpunkt erst nächstes Jahr (per Treiber) nachgereicht werden, zudem darf hierbei sicherlich nicht umgehend die Qualität und Performance des nVidia-Originals erwartet werden.

Aus dem Navi-21-Grafikchip wird AMD nach derzeitigem Stand drei Gamer-Grafikkarten generieren, wovon das Spitzenmodell "Radeon RX 6900 XT" im Vollausbau des Grafikchips erst am 8. Dezember 2020 in den Ring steigt. Die hiermit zu betrachtenden Grafikkarten "Radeon RX 6800" sowie "Radeon RX 6800 XT" stellen somit "nur" Abspeckungen des Navi-21-Chips dar – wie es inzwischen üblich ist, Grafikkarten im Vollausbau eines Grafikchips sind eher die Ausnahme als denn die Regel (bei nVidia ist derzeit keine der bekannten Ampere-Grafikkarten ein Vollausbau). Die Radeon RX 6800 XT ist dem Vollaubau noch am nächsten, hier fehlen schlicht 8 der 80 Shader-Cluster, sprich 2 Shader-Cluster pro "Shader-Engine" sind deaktiviert. Bei der Radeon RX 6800 ist dies radikaler gelöst: Für jene Grafikkarte wurde gleich eine der vier Shader-Engines komplett deaktiviert, womit dann die restlichen drei Shader-Engines vollumfänglich laufen müssen, um auf die spezifikationsgemäßen 60 Shader-Cluster zu kommen. Dies ist auch der Grund für die geringere Anzahl an ROPs bei der Radeon RX 6800: Jene ROPs liegen nunmehr innerhalb der Shader-Engines – und sobald eine davon deaktiviert wird, reduziert sich auch die Anzahl der (aktiven) ROPs.

	GeForce RTX 3070	Radeon RX 6800	Radeon RX 6800 XT	GeForce RTX 3080
Chipbasis	nVidia GA104-300	AMD Navi 21 XL	AMD Navi 21 XT	nVidia GA102-200
Fertigung	17,4 Mrd. Transistoren auf 392mm² in der 8nm-Fertigung von Samsung	26,8 Mrd. Transistoren auf 520mm² in der 7nm-Fertigung von TSMC		28,3 Mrd. Transistoren auf 628mm² in der 8nm-Fertigung von Samsung
Architektur	nVidia Ampere, DirectX 12 Feature-Level 12_2	AMD RDNA2, DirectX 12 Feature-Level 12_2		nVidia Ampere, DirectX 12 Feature-Level 12_2
Features	DirectX 12, OpenGL, Vulkan, Asynchonous Compute, RayTracing, DSR, DLSS, PhysX, G-Sync, FreeSync	DirectX 12, OpenGL, Vulkan, Asynchonous Compute, RayTracing, VSR, FreeSync, TrueAudio Next, XConnect		DirectX 12, OpenGL, Vulkan, Asynchonous Compute, RayTracing, DSR, DLSS, PhysX, G-Sync, FreeSync
Technik	6 Raster-Engines, 46 Shader-Cluster, 5888 FP32-Einheiten, 184 TMUs, 46 RT-Cores v2, 184 Tensor-Cores v3, 96 ROPs, 4 MB Level2-Cache, 256 Bit GDDR6-Interface (Salvage)	3 Raster-Engines, 60 Shader-Cluster, 3840 FP32-Einheiten, 240 TMUs, 60 RA-Einheiten, 96 ROPs, 4 MB Level2-Cache, 128 MB "Infinity Cache", 256 Bit GDDR6-Interface (Salvage)	4 Raster-Engines, 72 Shader-Cluster, 4608 FP32-Einheiten, 288 TMUs, 72 RA-Einheiten, 128 ROPs, 4 MB Level2-Cache, 128 MB "Infinity Cache", 256 Bit GDDR6-Interface (Salvage)	6 Raster-Engines, 68 Shader-Cluster, 8704 FP32-Einheiten, 272 TMUs, 68 RT-Cores v2, 272 Tensor-Cores v3, 96 ROPs, 5 MB Level2-Cache, 320 Bit GDDR6X-Interface (Salvage)
Taktraten	1500/1725 MHz & 14 Gbps	1700/1815 MHz & 16 Gbps	1825/2015 MHz & 16 Gbps	1450/1710 MHz & 19 Gbps
Rohleistungen	20,3 TFlops & 448 GB/sec	13,9 TFlops & 512 GB/sec	18,6 TFlops & 512 GB/sec	29,8 TFlops & 760 GB/sec
Speicherausbau	8 GB GDDR6	16 GB GDDR6	16 GB GDDR6	10 GB GDDR6X
Anbindung	PCI Express 4.0	PCI Express 4.0	PCI Express 4.0	PCI Express 4.0
FE/Herst./OC	✓ / ✓ / ✓	✓ / ✓ / ✓	✓ / ✓ / ✓	✓ / ✓ / ✓
Layout	Dual/TripleSlot	Dual/TripleSlot	TripleSlot	Dual/TripleSlot
Kartenlänge	Herst: 23,2-32,3cm FE: 24,5cm	Herst: 26,7-34,0cm Ref: 27,0cm	Herst: 26,7-34,0cm Ref: 27,0cm	Herst: 27,4-32,3cm FE: 28,5cm
Stromstecker	1x 12pol.	2x 8pol.	2x 8pol.	1x 12pol.
off. Verbrauch	220W (GCP)	250W (TBP)	300W (TBP)	320W (GCP)
realer Verbr.	FE: 220W	231W	296W	FE: 328W
Ausgänge	HDMI 2.1, 3x DisplayPort 1.4	HDMI 2.1, 2x DisplayPort 1.4, USB Type-C		HDMI 2.1, 3x DisplayPort 1.4
FullHD Perf.Index	1590%	1650%	1840%	1900%
4K Perf.Index	245%	266%	306%	328%
Listenpreis	$499	$579	$649	$699
Straßenpreis	Herst: 610-850€ — FE: 499€	Ref: 579€	Ref: 649€	Herst: 860-1100€ — FE: 699€
Release	29. Oktober 2020	18. November 2020	18. November 2020	17. September 2020

Für den nicht gänzlich unerheblichen Hardware-Unterschied von 60 zu 72 Shader-Clustern (+20%) zwischen Radeon RX 6800 und Radeon RX 6800 XT setzt AMD mit 579 zu 649 Dollar (+12%) nur einen vergleichsweise kleinen Preis-Unterschied an. Jene Preislagen sind aber natürlich verkaufstaktisch gewählt: Die größere Radeon RX 6800 XT soll mit ihren 649 Dollar die GeForce RTX 3080 preislich angreifen, während sich AMD bei der kleineren Radeon RX 6800 augenscheinlich seiner Sache sicher ist und daher ein Preispunkt beachtbar oberhalb der GeForce GTX 3070 angesetzt wurde. In beiden Fällen wäre bei der Preisgestaltung auch die dafür gebotene Menge an Grafikkartenspeicher zu beachten: Mit jeweils 16 GB geht AMD in dieser Frage keinerlei Kompromisse ein und setzt nVidias Angebote deutlich unter Druck – bei der GeForce RTX 3080 vielleicht etwas weniger, aber bei der GeForce RTX 3070 dann deutlich. Sobald es in anderen Punkten auf knappe Differenzen hinausläuft, dürfte dieser erhebliche Speichermengen-Vorteil sicherlich in vielen Fällen das "Zünglein an der Waage" ergeben.

AMD hat mit der RDNA2-Generation die Taktraten seiner Grafikkarten nochmals weiter ausgebaut, was sich sowohl an den offiziellen als auch den real erreichten Taktraten (deutlich) bemerkbar macht. Inzwischen takten die neuen AMD-Grafikkarten somit bemerkbar höher als die aktuellen nVidia-Grafikkarten – womit AMD auch einen Teil von deren nominellen Rechenleistungs-Vorteil durch die verdoppelten FP32-Einheiten wieder aufholen kann. Interessanterweise ergibt sich bei den Navi-21-basierten Grafikkkarten der Effekt, dass jene sogar oftmals oberhalb der eigentlich als Taktraten-Maximum spezifizierten "Boost Frequency" operieren. In der Praxis fungiert letztere Angaben bei Navi 21 nicht mehr als wirkliche Taktraten-Begrenzung, sondern vielmehr takten sich die Navi-21-Grafikkarten bei passenden Bedingungen gemäß Power- und Temperatur-Limit (ähnlich wie AMDs Zen-3-Prozessoren) munter weiter nach oben.

	Basis	Durchschnitt	Maximum	durchschnittlicher Realtakt
AMD-Bezeichnung	"Base Frequency"	"Game Frequency"	"Boost Frequency"	-
Radeon RX 6900 XT	?	2015 MHz	2250 MHz	?
Radeon RX 6800 XT	1825 MHz	2015 MHz	2250 MHz	CB: 2216 MHz – TPU: 2257 MHz
Radeon RX 6800	1700 MHz	1815 MHz	2105 MHz	CB: 2177 MHz – TPU: 2205 MHz
nVidia-Bezeichnung	"Base Clock"	"Boost Clock"	-	-
GeForce RTX 3090	1400 MHz	1700 MHz	?	TPU: 1754 MHz
GeForce RTX 3080	1450 MHz	1710 MHz	1995 MHz	CB: 1827 MHz – TPU: 1931 MHz
GeForce RTX 3070	1500 MHz	1725 MHz	2040 MHz	CB: 1892 MHz – TPU: 1882 MHz
Realtakt-Angaben gemäß den Ausarbeitungen der ComputerBase (Ø 17 Spiele) und von TechPowerUp (Ø 23 Spiele)