22

Hardware- und Nachrichten-Links des 22. Juli 2021

Kopite7kimi @ Twitter hat Teile der Hardware-Daten des GH100-Chips explizit bestätigt – welche bereits im letzten Mai von gleicher Quelle derart gemeldet wurden, seinerzeit aber noch mit der Einschränkung "maybe" versehen waren. Nicht direkt bestätigt wurde die Anzahl der GPCs (Raster-Engines), allerdings kann man hierzu durchaus annehmen, dass nunmehr das ursprüngliche Gerücht seine Richtigkeit haben wird – wo deren 8 pro Die genannt werden. Das gesamte MCM-Konstrukt beläuft sich somit auf 288 Shader-Cluster (SM) – was 18432 FP32-Einheiten ergibt, insofern nVidia beim Ansatz des GA100-Chips bleibt und die FP32-Einheiten nicht (wie bei Gaming-Ampere) verdoppelt. Dieser Punkt mag noch leicht offen sein, aber da HPC-Ampere und Gaming-Ampere seinerzeit nahezu gleichzeitig entwickelt wurden und HPC-Ampere über die bessere Fertigung verfügt, könnte man durchaus die Aussage treffen, dann nVidia HPC-Ampere jene FP32-Verdopplung bewußt nicht mitgegeben hat.

I can confirm that
every GPC has three CPCs and
every CPC has three TPCs
in GH100.

Quelle:  Kopite7kimi @ Twitter am 22. Juli 2021

Das Designziel jener HPCs-Chips liegt augenscheinlich wo anders bzw. möglicherweise nutzt es nVidia nichts, massiv an Hardware-Einheiten hinzuzufügen, welche man im professionellen Einsatz wegen Stromverbrauchs-Limitierungen dann niemals (auch nur annähernd) auslasten kann. Bei Gaming mag so etwas in der erreichten fps-Zahl untergehen, aber im professionellen Segment schaut man dann schon, ob die nominelle FP32-Power sich auch in Benchmarks wiederfinden läßt. Mit 64 FP32-Einheiten pro Shader-Cluster kommt der GH100-Chip (als gesamtes MCM-Konstrukt, sprich beide Dies zusammen) wie gesagt auf 18432 FP32-Einheiten (wie der AD102-Chip für das Gaming-Segment), sind es dagegen 128 FP32-Einheiten pro Shader-Cluster, würde sich dies auf insgesamt 36864 FP32-Einheiten für den GH100-Chip erhöhen. Nachfolgendes (Nutzer-erstelltes) Block-Diagramm zum GH100-Chip würde für beide Varianten zutreffend sein, da maximal auf die Tiefe einzelner Shader-Clustern aufgelöst:

Erneut von Igor's Lab kommt eine neue These zur Frage, wieso es zu Abstürzen und aber auch regelrechten Grafikkarten-Ausfällen bei Amazons "New World" kommt. Dabei wäre einzurechnen, dass die Problematik nun doch nicht nur auf die GeForce RTX 3090 beschränkt ist, sondern laut JayzTwoCents @ Twitter durchaus auch andere Karten betrifft. Interessanterweise handelt es sich dabei allesamt um HighEnd-Modelle, was die neue These seitens Igor's Lab stützt, welche nur unter besonders schnellen Grafikkarten funktioniert. Denn danach sind die Renderzyklen im Spiel-Menü von "New World" zu kurz für die von AMD & nVidia gedachten Schutzschaltungen. Deren Grenze scheint bei grob 1ms zu liegen – wenn schnelle Lastwechsel oder hoher Stromhunger unterhalb dieser Schwelle anliegt, greift die Schutzschaltung nicht mehr. Damit kann prinzipiell jede Karte betroffen sein, welche wirklich leistungsfähig ist.

Dass die EVGA-Modelle besonders oft ausfallen (und damit an erster Stelle genannt wurden), kann durchaus weiterhin durch den extra Lüftercontroller-Chip dieser Karten erklärt werden – welcher dann einfach früher durchbrennt als bei anderen Karten eventuell andere Komponenten. Die EVGA-Modelle haben dann in gewissem Sinn sogar einen Vorteil, denn jene dürften sich über den simplen Austausch dieses Klein-Chips reparieren lassen – ob dies bei anderen defekten Karten so einfach ist, läßt sich derzeit noch nicht sagen. Davon abgesehen hilft auch diese Erklärung nur dahingehend weiter, wieso ein bestimmter Kartenkreis unter "New World" betroffen ist. Wieso das Amazon-Spiel allerdings etwas schafft, was hunderte andere Spiele trotz der gleichen Problematik (und damit genauso teilweise vierstelliger Frameraten in Spiel-Menüs) bisher nicht geschafft haben, verdient trotzdem noch einer echten Ursachen-Forschung seitens der Grafikchip-Entwickler AMD & nVidia.