30

Gerüchteküche: Kommen AMDs Navi 33, 32, 31 Grafikchips tatsächlich mit 80, 120, 160 Shader-Clustern?

Mitten in der Zeit der Launches von GeForce RTX 3080 Ti & 3070 Ti gab es eine Reihe von kleineren Leaks samt Gedankenspielen zum grundsätzlichen Aufbau der Navi-3X-Chipreihe. Zuletzt gab es hierzu eine Meldung vom 9. Juni, welche Navi 33 als nicht-monolithischen Chip klassifiziert und nachfolgend eine denkbare Auslegung zum Aufbau der Navi-3X-Chipserie anbietet. Nachfolgend kam von Twitterer Vegeta sogar noch eine grundsätzliche Performance-Aussage zu Navi 3X, mittels welcher dieses Thema nunmehr – wenn auch verzögert um zwei Wochen – erneut aufgegriffen werden soll. Denn gerade in Verbindung mit der vorherigen Aussage von Kepler & Twitter läßt sich hieraus eine vernünftige These zur Hardware-Gestaltung der einzelnen Navi-3X-Chips formulieren, welche dann sogar schon auf Basis zweier unterschiedlicher Quellen steht.

2.8x n21
2.2x n21
1.5x n21

 
It's a pure guess. Don't take it seriously.

Quelle:  Vegeta @ Twitter am 11. Juni 2021 (inkl. nachfolgendem Tweet – inzwischen sind beide Tweets allerdings gelöscht)

Dabei wäre zuerst anzumerken, dass jene Performance-Angaben zu den Navi-3X-Chips (augenscheinlich zu lesen von oben nach unten als Navi 31, 32 & 33 im Vergleich zur Performance von Navi 21) gemäß eines nachfolgenden Tweets (natürlich) nicht auf Basis von Messungen getroffen wurden, sondern reine Schätzungen darstellen – wahrscheinlich basierend auf der Kenntnis rein der Hardware-Daten und somit dann bewußt abzüglich eines gewissen, gegen eine perfekte Skalierung laufenden Effekts erstellt. Deswegen wird Navi 31 auch nicht doppelt so schnell wie Navi 33 eingeschätzt, sondern eben nur +87% schneller (2,8/1,5). Unter Einrechnung dieses Umstands könnte man sich faktisch schon festlegen, dass Navi 31 somit die doppelte Hardware gegenüber Navi 33 aufbieten wird, welcher seinerseits ziemlich sicher mit 80 Shader-Clustern antreten dürfte. Jene Performance-Aussage zeigt also erst einmal auf Navi 31 mit 160 Shader-Clustern hin – was jetzt keine ganz große Überraschung darstellt, aber dennoch bisher nur eine von mehreren möglichen Annahmen war.

Vor allem aber zum dazwischenliegenden Navi 32 wird die Sache interessant: Immerhin +47% mehr Performance soll es gegenüber Navi 33 geben, zudem soll Navi 31 dann nochmals +27% entfernt sein. Dies weist doch ziemlich deutlich darauf hin, dass Navi 32 mit 120 Shader-Clustern antritt – dies ist die einzige runde Zahl, zu welcher diese Performance-Differenzen passen. Und dies würde bedeuten, dass AMD zwei verschiedene GCDs innerhalb der Navi-3X-Chipserie auflegt: Eines mit 80 Shader-Clustern, eines mit 60 Shader-Clustern. Die zuletzt geäußerte reine These, wonach dies eine mögliche Auflösung zur Navi-3X-Chipserie wäre, scheint sich hiermit zu bestätigen. Zumindest ist es ausgehend von angenommen 80 Shader-Clustern bei Navi 33 schwierig, wirklich andere Auflösungen zu jenen Performance-Werten seitens Vegeta sowie der Chip-Konstellation seitens Kepler zu finden. Danach kann man sich die Navi-3X-Chipserie somit derzeit folgendermaßen vorstellen:

Aufbau Hardware-Einheiten Performance
Navi 31 2x großer GCD + 1x MCD 160 Shader-Cluster ~190%
Navi 32 2x kleiner GCD + 1x MCD 120 Shader-Cluster ~150%
Navi 33 1x großer GCD + 1x MCD 80 Shader-Cluster 100%
Navi 34 1x kleiner GCD + 1x MCD 60 Shader-Cluster ~80%
Hinweis: hypothetische Auslegung, Navi 34 zudem als reine Annahme (bisher nirgendwo genannt)

Die vorstehenden notierten Performance-Werte basieren auf den Vegeta-Angaben, sind allerdings nicht mehr auf den Navi-21-Chip bezogen – weil sich erst einmal bestätigen muß, dass Navi 33 mit gleicher Anzahl an Shader-Clustern tatsächlich gleich +50% mehr Performance auf Navi 21 oben drauf legt. An dieser Stelle sollte man zu diesem frühen Zeitpunkt eher vorsichtig sein, jene Angabe ist vermutlich eine grobe Zielvorgabe oder beschreibt vielleicht auch nur einen Teilbereich (beispielsweise die Energieeffizienz), was sich dann aber nicht 100%ig auf die reale Mehrperformance umlegen läßt. Natürlich könnte AMD so viel Mehrperformance bieten, immerhin sollte die RDNA3-Architektur gegenüber RDNA1 & RDNA2 dann wieder beachtbare Änderungen mitbringen und steht zudem mit der 5nm-Fertigung zumindest potentiell die Möglichkeit zu wiederum höheren Taktraten zur Verfügung. Dennoch erscheint es derzeit als besser, auf klarere Angaben zur Performance-Differenz zwischen RDNA2 und RDNA3 zu warten – und in der Zwischenzeit die Performance der RDNA3-Chips nur relativ zueinander zu nennen.

Daneben bleiben noch reichlich Fragen zu diesem mutmaßlichen Chip-Portfolio offen: Wieso AMD (augenscheinlich) einen extra GCD mit 60 Shader-Clustern auflegt, wenn man dafür doch den größeren GCD in einer Salvage-Variante nehmen könnte? Wo Speicherinterface und I/O-Einheiten liegen – jeweils pro GCD vorhanden oder im MCD vereint? Ob der MCD als jeweils ein Chip gefertigt wird oder als Zusammenschluß mehrerer Cache-Bausteine (anzunehmen, damit könnte man eine dynamische Cache-Größe erreichen)? In jedem Fall liegt in der Frage, was der MCD umfaßt und wie jener Chip mit den GCDs verbunden ist, derzeit noch der größte Spielraum. Hierzu haben diverse Hinweise seitens bekannter Twitterer gegenüber der letzten Gerüchteküche-Meldung zum Thema nunmehr zu verbesserten grafischen Darstellungen geführt – eine seitens Cyberfries @ 3DCenter-Forum (alle Navi-3X-Chips betreffend) und eine seitens CapeFrameX @ Twitter (schematisches Grundprinzip).

All dies betrifft natürlich noch ungelegte Eier, womit die wenigen zur Verfügung stehenden Informationen durchaus auch in die Irre führen können. Schon allein, wenn die Grundannahme von "Navi 33 = 80 Shader-Cluster" nicht zutreffen sollte, bricht die gesamte vorstehend ausgebreitete These in sich zusammen. Insofern sollte man dies alles als Gedankenspiel ansehen, welches möglicherweise sogar zutreffend ist – aber selbst dann keineswegs eine abschließende Information zur Navi-3X-Performance ergibt. Derzeit dürften die RDNA3-Grafikchips gerade einmal in Sichtweite ihres Tape-Ins kommen, sprich ist noch nicht einmal das Designende erreicht und dürfte es auch AMD-intern bestenfalls Performance-Simulationen zu RDNA3 geben. Wieviel reale Performance letztlich herauskommt, bestimmen aber nicht nur die Hardware-Daten, sondern ergibt sich auch an den Taktraten – was wiederum eine Frage des Power-Limits und den Möglichkeiten der gewählten Chipfertigung ist. Hierzu muß AMD erst einmal ein reales Stück Silizium vorliegen haben und entsprechend austesten – was voraussichtlich erst im nächsten Jahr der Fall sein wird, da die RDNA3-Generation erst im vierten Quartal 2022 antreten soll.

Nachtrag vom 19. Juli 2021

Greymon55 @ Twitter hat mal wieder ein paar Info-Bröckchen zu den nachfolgenden 5nm-Grafikchips und dort erst einmal speziell zu AMDs RDNA3-Generation abgegeben. Nicht ganz unüblich gibt es das ganze in Rätselform, wobei selbiges nun wirklich einfach aufzulösen ist – noch dazu, wo die 8 Shader-Engines beim RDNA3-Spitzenchip "Navi 31" sich schon fast automatisch mittels der Verwendung von zwei GCDs á 80 Shader-Clustern mit je 4 Shader-Engines ergeben. Der Twitterer deutet hiermit also dezent an, dass die aktuelle Vermutung von 8 Shader-Engines und 160 Shader-Clustern bei Navi 31 auch seinen Informationen entspricht – welche hoffentlich (bzw. teilweise augenscheinlich) auch reale Hintergründe haben.

Fiji: 4 shader engine
Polaris: 4 shader engine
Vega: 4 shader engine
RDNA: 2 shader engine
RDNA2: 4 shader engine

Quelle:  Greymon55 @ Twitter am 19. Juli 2021
 
RDNA3: 8 shader engine ... (?)
Quelle:  3DCenter @ Twitter am 19. Juli 2021