2

Gerüchteküche: AMDs Navi 31 auf 3 GHz Chiptakt und nVidias AD102 nahe 3 GHz Chiptakt

Mit dem Erreichen von Tape-Out und Test-Phase bei allen wichtigen Grafikchips der kommenden Ada/RDNA3-Generation wird in den folgenden Wochen die Anzahl der Gerüchtemeldungen hierzu zunehmen – da nun schlicht mehr an Informationen zur Verfügung steht bzw. an Personen außerhalb der beiden Grafikchip-Entwickler gelangen. Den Anfang hierzu macht Twitterer 'Greymon55', welcher über das Wochenende neue, nochmals hochgesetzte Taktraten-Angaben zu den kommenden Top-Chips verlauten lassen hat. So soll Navi 31 in der Spitze – einer möglicherweise "Radeon RX 7900 XT" genannten Grafikkarte – mit mehr als 3 GHz takten. Glatt auf jene 3 GHz gerechnet, wären dies im Vollausbau des Navi-31-Chips dann schon 74 TFlops nominelle FP32-Power (die vom Twitterer urspünglich genannten 92 TFlops beziehen sich hingegen auf die inzwischen unaktuelle Hardware-Konfiguration von Navi 31).

Navi3 is way crazier than I thought.
Quelle:  Greymon55 @ Twitter am 30. April 2022  (Tweet inzwischen gelöscht)
 
Perf and frequency
Quelle:  Greymon55 @ Twitter am 30. April 2022
 
3GHz+ 7900xt
Quelle:  Greymon55 @ Twitter am 30. April 2022

Dies ist immerhin gleich das 3,2fache an FP32-Power, als was die Radeon RX 6900 XT derzeit auf die Waage bringt – und somit ein überaus massiver Sprung, gerade zwischen nur zwei Grafikchip-Generationen. Die reale Rechenleistung könnte dann sowohl leicht mehr als auch leicht weniger herauskommen: Mehr, wenn die Taktraten oberhalb von 3 GHz gehen (wie ja schon vom Twitterer angedeutet) – und weniger, wenn AMD nicht den Vollausbau des Navi-31-Chips in den Markt entläßt. AMD hat zwar eine Tradition, mit dem jeweiligen Vollausbau zu arbeiten, aber angesichts jener massiven MCM-Konstruktion mit bis zu 7 Einzelchips könnte man die Vermutung aussprechen, dass dies für den Navi-31-Chip nicht durchzuhalten ist. Gleichfalls gilt natürlich, dass selbst wenn anfänglich ein Vollausbau fehlt, jener sicherlich irgendwann nachfolgt – und wenn nur als reines "Halo"-Produkt in Form einer Sonderausführung.

Nachfolgend gab es dann ähnliches von gleicher Quelle zum kommenden nVidia-Spitzenchip "AD102": Jener soll – trotz dass nVidia zuletzt nicht für herausragende Taktraten bekannt war – "sehr nahe" an der Taktrate von Navi 31 herankommen. Die Formulierung läßt nur einen kleinen Spielraum, es dürfte kaum wesentlich unterhalb von 2.8 GHz werden. Damit sind vom AD102-Chip letztlich sogar 100 TFlops (und eventuell leicht mehr) zu erwarten, selbige runde Marke wären im Vollausbau "schon" ab 2713 MHz erreicht. Konservativ nur auf 2.7 GHz gerechnet, würde der AD102-Chip damit das 2,8fache an nomineller FP32-Rechenleistung gegenüber der originalen GeForce RTX 3090 erreichen, gegenüber der neueren GeForce RTX 3090 Ti wären es hingegen das 2,5fache.

100t for ada
Quelle:  Greymon55 @ Twitter am 30. April 2022
 
Ada's frequency is very close to navi3's.
Quelle:  Greymon55 @ Twitter am 30. April 2022

Allerdings könnte die derzeit seitens nVidia wahrscheinlich in Vorbereitung befindliche "GeForce RTX 4090" die 100-TFlops-Marke auch noch verfehlen, je nach der seitens nVidia hierfür angesetzten Hardware-Abspeckungen. Ganz im Vollausbau wird diese Grafikkarte sicherlich nicht erscheinen, dies behält sich nVidia inzwischen traditionell für spätere Refresh-Lösungen vor. Bei einer kleinen Abspeckung samt hohen Taktraten tatsächlich sehr nahe 3 GHz könnte allerdings auch die GeForce RTX 4090 schon die 100-TFlops-Marke erreichen – nur bei größeren Hardware-Abspeckungen wäre dies nicht mehr machbar. Letztere haben durchaus ihre Wahrscheinlichkeit aufgrund der schieren Größe des AD102-Chips mit gleich 144 Shader-Clustern. Irgendwo in die Richtung von grob 100 TFlops geht es mit diesen Taktraten natürlich sowieso.

AMD Navi 31 nVidia AD102
Hardware 48 WGP, 96 CU, 12'288 FP32, 256 Bit GDDR6 Speicherinterface 144 SM, 18'432 FP32, 384 Bit GDDR6X Speicherinterface
angeblicher Chiptakt 3 GHz und leicht mehr sehr nahe Navi 31 = rund um 2.8 GHz
FP32-Rechenleistung im Vollausbau ca. 74-77 TFlops ca. 100-107 TFlops
Rechenleistungs-Differenz zum Vorgänger @ 3.0 GHz = 3,2fache von Radeon RX 6900 XT @ 2.7 GHz = 2,8fache von GeForce RTX 3090 sowie 2,5fache von GeForce RTX 3090 Ti
Anmerkung: Angaben zu noch nicht vorgestellter Hardware basieren auf Gerüchten & Annahmen

Interessanterweise hatte Twitterer Kopite7kimi einen Tag vor diesen ganzen Greymon55-Tweets bereits eine Andeutung in genau diese Richtung gemacht – sprich, dass sowohl AMD als auch nVidia letztlich mit ihren Spitzen-Produkten auf Basis der kommenden NextGen-Grafikchips bei um die 100 TFlops herum landen könnten. Bezüglich AMD bezieht sich diese Marke noch auf die inzwischen unaktuelle Hardware-Konfiguation des Navi-31-Chips mit 15'360 FP32-Einheiten, welche inwzischen durch eine aktualisierte Hardware-Konfiguration mit 12'288 FP32-Einheiten abgelöst wurde. Der springende Punkt ist jedoch, dass hier augenscheinlich Branchen-intern neue, gleichlautende Taktraten-Informationen kursieren – womit man fast von einer Absicherung aus zweiter Quelle sprechen könnte (wofür Informationen aus der Gerüchteküche allerdings generell zu volatil sind).

Maybe Lisa and Jensen's competition will give us a 100TFLOPS gaming war in a few months.
Quelle:  Kopite7kimi @ Twitter am 29. April 2022

Mit diesen vergleichsweise hohen Taktraten vergrößert sich der Generations-Sprung, welchen AMD & nVidia zwischen Ampere/RDNA2 und Ada/RDNA3 hinlegen werden. Jener Generations-Sprung war bisher schon ungewöhnlich hoch angesetzt, geht nunmehr allerdings sogar in die Richtung, grob bei der dreifachen nominellen Rechenleistung sowie geschätzt einer zweieinhalbfachen Realperformance herauszukommen. Dies ist ein tatsächlich ungewöhnlich hoher Performance-Sprung – bislang war man ja damit zufrieden, wenn das Doppelte angepeilt wurde und letztlich +70% reale Mehrperformance herauskommen. Grafikchip-Generationen, welche nahe am Doppelten der realen Gaming-Performance gegenüber ihrer Vorgänger-Generation erreichten, liegen dagegen lange zurück – und an noch größere Sprünge kann man sich kaum erinnern, fehlen für diese Ur-Zeiten zudem genauere Daten.

Die sich hier anschließenden Fragen sind natürlich jene nach dem "Wie" und dem "Weshalb": Wie kann dies erreicht werden und weshalb gehen die Grafikchip-Entwickler überhaupt so hoch hinein. Das "Wie" erklärt sich wohl über den großen Sprung in der Technik: Bei AMD hat man MCM – was man normalerweise einsetzt, um Chipflächen deutlich größer als 800mm² zu realisieren, welche mit normaler Fertigungstechnik ansonsten nicht erreichbar sind. Und bei nVidia hat man einen heftigen Sprung bei der Fertigungstechnologie: Von Samsungs 8nm (ein 10nm-Derivat) auf TSMCs 4nm (ein 5nm-Derivat, bei nVidia unter "4N" laufend). Ohne diese beiden Dinge wären Technik-Sprünge von über dem Doppelten sicherlich nicht denkbar – wie aus der Vergangenheit bekannt, wo man die Fortschritte neuer Grafikchip-Generationen vorher schon anhand des anstehenden Sprungs beim Fertigungsverfahren abschätzen konnte.

Das "Weshalb" ist dagegen eine eher philosophische Frage: Prinzipiell gilt, weil die Hersteller es können. Und im konkreten Einzelfall kommt hinzu, weil die Hersteller es denken tun zu müssen, um im Wettbewerb mitzuhalten. AMD will bekanntermaßen mit aller Macht die Leistungsspitze von nVidia übernehmen, hat dafür mit seinem MCM-Konstrukt auch den passenden Ansatz, um sich gegenüber jedem "gewöhnlichen" Konkurrenzprodukt deutlich abzusetzen. nVidia hat hingegen spätestens mit der RDNA2-Generation und deren sehr nahe an "Ampere" heranreichender Performance erfahren müssen, dass es AMD sowohl Ernst meint als auch tatsächlich seine Zielsetzungen erreichen kann. Aus dieser Ansetzung heraus fallen beiderseits alle Hemmungen und wird mit der kommenden Ada/RDNA3-Generation schlicht das an Technik geboten, was tatsächlich maximal machbar ist – unabhängig etwaiger Nebeneffekte wie des hochgehenden Stromverbrauchs samt eventuell hoher Preislagen für Spitzen-Grafikkarten.