29

Hardware-Daten, Taktraten und Power-Limits zu AMDs RDNA2-Grafikchips offengelegt

Über das Wochenende hat sich an der Front der kommenden RDNA2-Grafikchips ein hochinteressanter, weil ziemlich ergiebiger Leak zu den Chipdaten von Navi 21, Navi 22 und Navi 23 für die kommenden Grafikkarten der "Radeon RX 6000" Serie ergeben. Dabei hat Dataminer 'stblr' AMD-Treiber für MacOS 11 ausgewertet und seine Erkenntnisse auf Reddit veröffentlicht. Die gleiche Quellenbasis wurde früher schon benutzt zur Feststellung der Hardware-Daten diverser AMD-APUs wie auch von Navi 21 selber und ist bekanntermaßen solide – zumindest die reinen Hardware-Daten sind bislang nie vom späteren Auslieferungszustand abgewichen. Erneut genannt wurden dabei die grundsätzlichen Hardware-Daten zu Navi 21 ("Sienna Cichlid") und Navi 22 ("Navy Flounder"), neu hingekommen sind hingegen die Hardware-Daten zu Navi 23 ("Dimgrey Cavefish") und vor allem auch erste Informationen zu Taktraten und Power-Limits (rein des Grafikchips). Insbesondere die Taktraten-Informationen machen die RDNA2-Chips viel besser einschätzbar – denn mit den genannten 2.05 bis 2.5 GHz liegt AMD deutlich vor nVidias aktuellen Grafikchips und holt somit einen Teil von deren verdoppelter FP32-Power mittels der Shader-Cluster der Ampere-Architektur allein über höhere Taktraten wieder auf.

Navi 23 Navi 22 Navi 21
Chip-Technik 4 Raster-Engines, 32 Shader-Cluster (2048 FP32-Einheiten), 32 ROPs 4 Raster-Engines, 40 Shader-Cluster (2560 FP32-Einheiten), 32 ROPs 8 Raster-Engines, 80 Shader-Cluster (5120 FP32-Einheiten), 64 ROPs
Speicherinterface 128 Bit GDDR6 192 Bit GDDR6 256 Bit GDDR6
mögliche Speichermengen 4/8/16 GB 6/12/24 GB 8/16/32 GB
Taktraten ? max. 2.5 GHz & 16 Gbps max. 2.05-2.2 GHz & 16 Gbps
Rohleistungen ? ≤12,8 TFlops & 384 GB/sec ≤22,5 TFlops & 512 GB/sec
Power-Limit (ASIC) ? 170W 200-238W
Quelle: stblr @ Reddit (mögliche Speichermengen & sich ergebende Rohleistungen selber hinzugefügt)

Allerdings ist trotz erstklassiger Datenlage nicht gleich alles in Stein gemeißelt: Sicher sind zum einen die Daten zur Chip-Technik. Die Daten zu den Speicherinterfaces stellen dagegen eine Ableitung gemäß der Anzahl der im Treiber genannten "Texture Channel Caches" dar. Die Auslegung dieser Information ist normalerweise ebenfalls recht sicher, allerdings werden ähnlich leistungsstarke HBM-Interfaces genauso kodiert – beispielsweise könnte das 256bittige GDDR6-Interface von Navi 21 demnach auch 2048 Bit breit für HBM2-Speicher sein. Zudem gibt es wohl nach wie vor andere Anzeichen im Treiber, dass der Navi-21-Chip sowohl GDDR6 als auch HBM2 unterstützt – obwohl sich bislang noch niemand darauf einen Reim machen kann. Gegen die Nutzung von HBM2-Speicher spricht allerdings ein wenig der genannte Speichertakt, welcher mit "1000" kodiert wurde und für GDDR6 mit x16 sowie für HBM2 mit x2 zu multiplizieren wäre. Im Fall von GDDR6 ergäbe dies eine Speichertaktung von 16 Gbps (4000 MHz QDR), im Fall von HBM2 allerdings nur 2 Gbps (1000 MHz DDR) – was arg unwahrscheinlich ist, weil dies zum einen klar unterhalb der heutigen Möglichkeiten von HBM2-Speicher liegt und zum anderen nur genau dieselbe Speicherbandbreite wie unter GDDR6 ergeben würde.

Auch die genannten Chip-Taktraten sind leider nicht gänzlich sicher, denn die im gleichen Treiber hinterlegten Taktraten für Navi 10 & Navi 14 gehen einigermaßen an der Realität vorbei – für Navi 10 (sehr) deutlich zu niedrig, für Navi 14 leicht zu hoch. Dies schmälert etwas den Wert dieser Taktraten-Angaben bzw. darf man jene somit noch nicht auf die Goldwaage legen. Die große Tendenz, dass die RDNA2-Chips mit beachtbar höheren Taktraten als die bisherigen Navi-Chips der RDNA1-Generation sowie auch die bekannten nVidia-Chips laufen sollen, dürfte allerdings auch mit den realen Daten erhalten bleiben – ansonsten würde man kaum Taktraten der RDNA2-Chips à 2.05, 2.2 und 2.5 GHz in diesen Treibern notieren. Gänzlich überraschend kommt dies natürlich nicht, der hohe Chiptakt der PlayStation 5 deutet bereits ähnliches an. Wie gesagt kann AMD somit sehr viel vom "Ampere-Effekt" wieder aufholen: Zwar bleibt die reine FP32-Rohpower von Ampere unerreicht, aber normiert auf die gleiche Anzahl an Shader-Clustern legt Ampere trotz doppelter FP32-Power trotzdem nur ca. +32% auf Turing (im Bestcase der GeForce RTX 3080) oben drauf. Navi 21 würde allein mit seinem Taktraten-Plus von +15% schon die Hälfte dessen egalisieren können, zuzüglich etwaiger Architektur-Verbesserungen eventuell sogar recht nahe an die Performance der Shader-Cluster von Ampere herankommen.

Sofern die Speicherbandbreite dem RDNA2-Ansatz keinen Strich durch die Rechnung macht, könnten die Shader-Cluster von Navi 21 (auf diesen Taktraten) somit durchaus 90% des Performance-Niveaus der Shader-Cluster von Ampere erreichen. Im Fall von Navi 22 mit seinem nochmals höherem Chiptakt von (bis zu) 2.5 GHz läuft es hingegen sogar auf einen Gleichstand hinaus – sprich, die Shader-Cluster von Navi 22 könnten tatsächlich das gleiche oder gar ein leicht besseres Performance-Niveau wie die Shader-Cluster von Ampere aufbieten. Damit dürfte Navi 21 kein Problem haben, sich mit der GeForce RTX 3080 anzulegen: Immerhin stehen hierbei 80 Shader-Cluster von RDNA2 gegen 68 von Ampere, dem geringen Nachteil bei der Shader-Cluster-normierten Performance kann AMD ergo durch eine um knapp ein Sechstel höhere Anzahl an Shader-Clustern begegnen. Der GeForce RTX 3070 dürfte AMD dann mittels Navi-21-Abspeckungen entgegentreten – eine solche kann man genau darauf timen, auf dass die Performance jener nVidia-Karte geschlagen wird. Alles darunter dürfte dann das Thema von Navi 22 sein, dessen 40 Shader-Cluster mit vermutlich Shader-Cluster-normiert derselben Performance wie bei Ampere ausreichend sind, um sich problemlos mit der GeForce RTX 3060 Ti (GA104, 38 Shader-Cluster) anzulegen.

AMD RDNA2 nVidia Ampere
GeForce RTX 3090 GA102, 82 SM @ 384 Bit, 24 GB GDDR6X
80 CU @ 256 Bit, 16 GB GDDR6 Navi 21 GeForce RTX 3080 GA102, 68 SM @ 320 Bit, 10 GB GDDR6X
~60 CU @ 256 Bit, 16 GB GDDR6 Navi 21 Salvage GeForce RTX 3070 GA104, 46 SM @ 256 Bit, 8 GB GDDR6
40 CU @ 192 Bit, 12 GB GDDR6 Navi 22 GeForce RTX 3060 Ti GA104, 38 SM @ 256 Bit, 8 GB GDDR6

Natürlich beinhaltet diese grobe Vorhersage trotzdem einige kritische Punkte: Ob jenes Taktraten-Plus in dieser Höhe erreicht wird, ist unklar. Zudem läßt sich aus der Maximal-Taktung schwer entnehmen, wie hoch die Grafikchips im Mittel wirklich takten. Der durch die RDNA2-Architektur mitgebrachte Vorteil ist zudem unbekannt, könnte auch nur marginal sein und nichts wesentliches beitragen. Und letztlich ist nicht klar, wieviel das kleinere Speicherinterface aller RDNA2-Chips kostet bzw. ob AMD dies selbst unter dem Einsatz einer "Secret Sauce" wirklich ganz ohne Performance-Verlust hinbekommt. Als Vorteil kann man hingegen anführen, dass diese Aufrechnung durchaus noch Spielraum hat, und AMD bis hin zur GeForce RTX 3080 überall die Möglichkeit hat, mit der klar höheren Anzahl an Shader-Clustern anzutreten. Und letztlich ermöglicht diese Portfolio-Gestaltung AMD vor allem, überall bei der gebotenen Speichermenge aufzutrumpfen: Während nVidia von unten nach oben Speichermengen von 8, 8 & 10 GB aufbietet, werden es bei AMD an derselben Portfolio-Stelle dann wahrscheinlich 12, 16 & 16 GB sein. Selbst bei Performance- und Preis-Gleichstand gegenüber nVidia wäre dies ein deutliches Argument pro der RDNA2-basierten Grafikkarten.

Ein gewisses Mysterium stellen hingegen die Hardware-Daten des Navi-23-Chips dar: Mit 32 Shader-Clustern bewegt man sich auf einem Niveau, welches locker und leicht auch mittels einer Salvage-Version des Navi-22-Chips zu erreichen wäre, trotz des natürlich nochmals kleineren Speicherinterfaces. Aber eventuell steckt hinter dem Navi-23-Chip wieder eine spezielle Idee, beispielsweise ein direkt für Mobile-Bedürfnisse (bereits auf Chip- und Transistoren-Ebene) optimierter Chip mit vielleicht grundsätzlich niedrigeren Taktraten und dafür eben sehr geringem Stromverbrauch. Die ASIC-Power des Navi-22-Chips von 170 Watt (hierzu kommen dann noch der Verbrauch der Speicherchips sowie des Grafikboards, ergo ca. 40-60 Watt) ist dafür sicherlich zu hoch, auch in Form von Salvage-Lösungen. Es könnte natürlich auch noch eine andere Idee hinter Navi 23 stecken, dies ist jetzt einfach noch nicht ersichtlich und wird sich später aufklären. Der bislang nur einmalig genannte Navi-24-Chip fehlt hingegen in dieser Aufstellung – was nochmals darauf hindeutet, dass jener erst deutlich später antritt, nach derzeitiger Prognose erst im zweiten Halbjahr 2021.

Nachtrag vom 29. September 2020

Zu den kürzlich genannten Daten der RDNA2-Grafikchips kommt seitens Videocardz noch der Hinweis auf kurzeitig bei US-Händler "Newegg" in einem Blogeintrag geführte (angebliche) Daten zur Radeon RX 6000 Serie. Jener (sehr große) Händler könnte natürlich interne Informationen über zukünftige AMD-Hardware besitzen – andererseits kommt es durchaus vor, dass sich Händler mit Vorab-Listungen und Vorab-Berichten auf Basis von Phantasie-Werten in die Öffentlichkeit zu stellen versuchen. Zudem sind die gezeigten Daten an sich leicht zu bezweifeln, jene passen in Details nicht zu den nunmehr bekannten Chip-Daten. Dies betrifft speziell die TDP-Werte, welche für die beiden kleineren Karten-Modelle als zu niedrig erscheinen – gerade wenn der Navi-22-Chip bereits eine reine ASIC-Power von 170 Watt aufweisen soll. Doch davon abgesehen könnte der Rest der Angaben sogar stimmen – oder läuft es halt automatisch auf einen solchen Portfolio-Aufbau hinaus, wenn AMD die bekannten Ampere-Grafikkarten kontern will.

Chip-Basis Technik Speicher grobes Performance-Level
Radeon RX 6900 XT augensch. Navi 21 80 Shader-Cluster @ 256 Bit Interface 16 GB GDDR6 Richtung GeForce RTX 3080
Radeon RX 6800 XT augensch. Navi 21 (Salvage) 60 Shader-Cluster @ 192 Bit Interface 12 GB GDDR6 Richtung GeForce RTX 3070
Radeon RX 6700 XT augensch. Navi 22 40 Shader-Cluster @ 192 Bit Interface 6 GB GDDR6 Richtung GeForce RTX 3060 Ti
gemäß den Ausführungen von Newegg Insider, gesichert durch Videocardz (Performance-Prognose durch 3DCenter)