15

Gerüchteküche: AMDs "Big Navi" mit angeblich 72 Shader-Clustern samt +40-50% Performancegewinn zur 2080Ti

Von Moore's Law Is Dead kommt ein vieldiskutiertes YouTube-Video mit einem (angeblichen) Leak zu AMDs "Big Navi". Die dabei kredenzten Daten sollen angeblich aus dem Umfeld von nVidia stammen – welche durchaus im groben wissen dürften, was AMD vor hat. Allerdings wäre es etwas ungewöhnlich, wenn von dort aus ein Leak kommt, gerade wenn selbiger von einem Performance-Sprung von +40-50% auf die GeForce RTX 2080 Ti oben drauf spricht. Dies würde schließlich auch für die kommenden GA102-basierten Grafikkarten relevant werden, jene sind derzeit (außerhalb von RayTracing) auch nicht besser bzw. potentiell sogar mit etwas kleinerem Performance-Sprung einzuschätzen. Erreicht werden soll jene Performance dann über 72 Shader-Cluster an einem 384bittigem Speicherinterface mit Chip-Taktraten leicht oberhalb von 2 GHz, zuzüglich einem IPC-Gewinn in unbekannter Höhe.

AMD "Big Navi"
427mm² Chipfläche
72 Shader-Cluster (= 4608 Shader-Einheiten – unbekannt, ob dies schon der volle Chip ist)
Chip-Taktraten: "Game Clock" 2050 MHz, "Boost Clock" (= maximaler Boost) 2150 MHz
IPC-Zugewinn in unbekannter Höhe
384 Bit Speicherinterface für GDDR6-Speicher
Stromverbrauch zwischen 285 bis 310 Watt
Performance anscheinend +40-50% oberhalb der GeForce RTX 2080 Ti

Quelle:  Moore's Law Is Dead @ YouTube am 13. Juli 2020

Dies erscheint als maßvoll und nicht unbedingt so abgehoben wie manches andere Gerücht. Dennoch wird es nicht ganz einfach sein, damit das Performance-Niveau der GeForce RTX 2080 Ti um gleich +40-50% zu überbieten: Jene Grafikkarte hat schließlich selber schon 68 Shader-Cluster im Einsatz, die FE-Ausführung kommt dann auf mittleren Boost-Takt von (nominell) 1635 MHz und taktet real irgendwo bei 1700-1750 MHz. Aus den genannten Hardware-Daten heraus ergeben sich somit nur ca. +30% mehr nominelle Rechenleistung für den AMD-Chip – der Rest muß dann über die höhere IPC kommen, was einen (erneuten) IPC-Sprung von +10-15% bedeutet. Eher problematisch für AMD ist, dass damit dann schon die 300-Watt-Marke beim Stromverbrauch genommen werden soll – was für diese Spitzen-Lösung selber nicht schlimm wäre, allerdings weitere Grafikchips mit noch mehr Hardware-Power zuverlässig verhindern dürfte. Noch größere AMD-Grafikchips würden somit zwingend eine bessere Chipfertigung benötigen – nicht wegen der Chipfläche, sondern wegen des Stromverbrauchs.

Vor allem aber ergibt sich ein kritischer Punkt an diesen angeblichen Hardware-Daten zu "Big Navi": Nimmt man jene ernst, würde AMD somit den Versuch unternehmen, die Ampere-Spitzenmodelle mit einer sogar kleineren Anzahl an Shader-Clustern zu schlagen – sprich, AMD würde die beachtbar höhere IPC aufbieten müssen, um dies zu erreichen. Dies erscheint nicht gerade als besonders wahrscheinlich, noch dazu wo AMDs Augenmerk bei der Navi-2X-Generation erklärtermaßen eher in Richtung der Energieeffizienz geht. Auflösbar wäre dies natürlich darüber, wenn nVidias Ampere-Generation entgegen der bisherigen Erwartungen dann doch deutlich mehr Performance mitbringt, sich somit (auf Basis von mehr Shader-Clustern) dann doch wieder vor "Big Navi" setzt. Da dies noch weitgehend unbestimmt ist, behält dieser Leak/Gerücht weiterhin seine Chance – selbst wenn frühere Gerüchte von einer etwas höheren Anzahl an Shader-Clustern (80 oder 84) bei "Big Navi" ausgegangen sind.

Für das Gesamtbild ist es allerdings auch nicht ganz so wichtig, wie dick "Big Navi" wirklich wird und ob man sich damit letztlich mit einer GeForce RTX 3080 Ti oder "nur" einer GeForce RTX 3080 anlegen kann. Relevant ist eher denn die getroffene Performance-Prognose: Sollte sich selbige tatsächlich halten lassen, würde AMD einen riesigen Performance-Sprung in Richtung von (durch AMD) zuletzt unerforschten Gewässern hinlegen. Dass sich damit ergebende Performance-Level liegt sogar leicht über dem Doppelten einer Radeon RX 5700 XT – womit AMD endlich wieder einmal effektiv im HighEnd- und Enthusiasten-Segment mitspielen könnte. Den großen Platz nach unten hin dürfte man dann mit Salvage-Lösungen und eventuell einem weiteren Navi-2X-Chip auffüllen. Dies würde dem Wettbewerb im Grafikkarten-Markt sicherlich gut tun, da nVidia bislang speziell bei HighEnd- und Enthusiasten-Beschleuniger mangels jeglicher AMD-Konkurrenz (in diesem Segment) nach Gusto schalten und walten konnte.

Radeon RX 5000 GeForce RTX 20 Radeon RX 6000
"Big Navi"  —  ~330-350%
 
GeForce RTX 2080 Ti-FE  —  236%
GeForce RTX 2080 Super  —  198%
GeForce RTX 2070 Super  —  172%
Radeon RX 5700 XT  —  156% GeForce RTX 2070-FE  —  151%
basierend auf dem 3DCenter UltraHD Performance-Index sowie der von Moore's Law Is Dead genannten Performance-Projektion zu "Big Navi"

Nachtrag vom 15. Juli 2020

Der eigentliche Ausgangspunkt der kürzlich genannten (neuen) Spezifikationen zu AMDs "Big Navi" liegt augenscheinlich in einem Tweet seitens Hassan Mujtaba von WCCF Tech, wo fast 1:1 die Daten des YouTube-Videos von Moore's Law Is Dead genannt werden und vor allem die beiderseitigen Details komplett deckungsgleich sind. Als Ausgangslage für einen Leak ist dies allerdings nicht wirklich optimal, wenn selbst WCCF Tech (bisher) nichts aus diesen Daten gemacht haben – wahrscheinlich wegen unklarer Quellenlage auf Basis einer möglicherweise anonymen Einsendung. Zudem wird auf Twitter bezweifelt, ob eine Konstruktion mit zweimal 36 Shader-Clustern überhaupt sinnvoll aufteilbar wäre, da hätte man eher eine stärkere symetrische Zahl wie zweimal 40 Shader-Cluster erwartet. Hier liegt in der Tat ein Symetrie-Problem vor, denn 72 Shader-Cluster lassen sich nur sinnvoll auf 6 Raster-Engines verteilen – dies muß wegen der WGPs eine gerade Zahl ergeben (WGP = "Workgroup Processor" = Zusammenschluß von zwei Shader-Clustern innerhalb der RDNA-Architektur), womit 8 Raster-Engines als Option (vorerst) ausscheiden.

Jene 6 Raster-Engines beißen sich dann aber mit den im Tweet genannten 128 ROPs, jene lassen sich wiederum nur sinnvoll auf 4 oder 8 Raster-Engines verteilen. Interessanterweise fehlt genau diese ROP-Angabe im Video von 'Moore's Law Is Dead', selbige gibt es nur im genannten Tweet. Sinn ergibt das ganze somit nur, wenn 72 Shader-Cluster tatsächlich nicht der Vollausbau des Chips sind – erst mit 8 Raster-Engines zu 80 Shader-Clustern samt 128 ROPs würde es wieder symetrisch. Alternativ müsste eine der anderen Angaben falsch sein – sofern die 128 ROPs rausfallen bzw. durch 96 ROPs ersetzt werden, wäre es mit 6 Raster-Engines, 72 Shader-Clustern und 96 ROPs auch wieder plausibel. Dies senkt den Wert selbigen Gerüchts dennoch erheblich ab, denn eine der getroffenen Angaben ist in jedem Fall nicht gänzlich korrekt. Schade, dass 'Moore's Law Is Dead' zwar ihre Quelle verlinkt, aber nicht direkt im Video gezeigt haben – dann hätte diese Diskrepanz früher auffallen können. Woher man dann allerdings die Performance-Prognose hat, ist unklar – hoffentlich haben 'Moore's Law Is Dead' diesbezüglich noch anderen Quellen und spekulieren nicht einfach nur ins Blaue hinein.