12

Hardware- und Nachrichten-Links des 11./12. November 2019

Von Twitterer Kopite7Kimi kommen auch noch erste Aussagen zur Ampere-Nachfolgegeneration – welche im Gegensatz zu den Ampere-Gerüchten derzeit auch noch online zu sehen sind: Teil 1 & Teil 2. Danach wird der Ampere-Generation die Hopper-Generation nachfolgen, benannt nach Computer-Pionierin Grace Hopper – was dem Wikipedia-Eintrag nach zu urteilen eine überaus würdige Namenswahl darstellt. Der entscheidende Punkt zur Hopper-Generation soll dann die Verwendung des MultiChip-Verfahrens (Multi Chip Module, MCM) sein – wobei dies sicherlich für Diskussionsstoff sorgen wird, denn so einfach wie dies immer dargestellt wird ist diese Technologie speziell im Grafikchip-Umfeld überhaupt nicht. Das griffigste Argument dagegen ist schlicht der erhöhte Strombedarf, der dadurch entsteht, wenn um (gegenüber CPUs) den Faktor 10 größere Datenmengen zwischen den verschiedenen Grafik-Chiplets bewegt werden müssen. Ein anderes Gegenargument zieht auf die generelle Preiskalkulation von MCM ab: Wenn die Chips tatsächlich für eine monololitische Fertigung zu groß werden und der MultiChip-Ansatz besser käme – wer soll darauf basierende Gaming-Grafikkarten angesichts heutiger (und weiter steigender) Herstellungskosten noch bezahlen können?

After Ampere, the next codename of GeForce is Hopper, in memory of Grace Hopper.
GeForce of Hopper will use MCM module to build giant cores.

Quelle:  Twitter-User "Kopite7Kimi" mittels Tweets vom 10. Juni 2019 sowie vom 11. Juni 2019

Sinn macht das ganze wohl nur, wenn man es rein auf das HPC-Segment bezieht – wo Kosten keine entscheidende Rolle spielen, mehr Performance allerdings jederzeit wünschenswert ist. Vielleicht sind die zwei HPC-Chips der Ampere-Generation (GA100 & GA101) bereits der erste Ausdruck einer diesbezüglichen Denkweise bei nVidia, weil schließlich der GA101-Chip als exakte Halbierung des GA100-Chips gedacht ist. Zukünftig will man vielleicht nur noch einen mittelgroßen HPC-Chip "GH100" herstellen und in Kombination mehrerer hiervon dann eine skalierbare Performance generieren – welche mit einer entsprechenden Kühlung (und damit der Möglichkeit zu mehr Chiplets auf kleinem Raum) auch weit entfernte Performance-Gipfel erklimmen könnte. Vermutlich dürfte diese Entwicklung an den Gaming-Chips der Hopper-Generation (vorerst) aber noch vorbeigehen (trotz das die Quelle es anders notiert) – die dortigen Zielsetzungen erreicht man weiterhin besser im monolitischen Ansatz. Natürlich kann sich dies mittel- und langfristig (mit späteren Grafikkarten-Generationen) ändern, wenn nVidia erst einmal mittels der Hopper-Generation mehr Erfahrungen im MultiChip-Design angesammelt hat. Diskutiert wird über so etwas immerhin schon seit dem ausgehenden DirectX-9-Zeitalter, seitdem wurden immer mal wieder diverse (letztlich allesamt doch monolitisch erschienene) Chipprojekte spekulativ als MultiChip-Design gehandelt.

Die kürzliche Aufstellung zum Notebookcheck-Test des Comet-Lake-Sechskerners "Core i7-10710U" enthielt leider falsche Werte zum Cinebench R15 in der beigebrachten Tabelle: Notiert waren fälscherlicherweise die niedrigsten Werte anstatt der Durchschnittswerte. Dies ändert wenig an der grundsätzlichen Aussage, schrumpft allerdings das Delta zwischen Maximalwert und dem durchschnittlichen Wert: Jener liegt beim Core i7-8565U von Whiskey Lake nunmehr bei -10%, beim Core i7-1065G7 von Ice Lake bei -20% und beim Core i7-10710U von Comet Lake bei -17% – gerade hier also deutlich weniger als ursprünglich notiert (wir bitte um Entschuldigung für diesen Lapsus). Leider ist der (nunmehr korrekte) Durchschnittswert keine wirklich perfekte Angabe, da hierbei auch die hohen anfänglichen Werte einfließen – besser wäre es wohl, einen Durchschnitt der Benchmark-Durchläufe 6-25 zu ziehen, um rein das Ergebnis unter Dauerlast abzubilden (mangels exakter Detailwerte in diesem Fall nicht möglich). So oder so sind 17% Leistungsverlust unter Dauerlast weiterhin erheblich – sinngemäß entspricht dies einem Zustand, wo man anstatt 6 CPU-Kernen nur 5 bekommt. Wie gesagt ist dies im Ultrabook-Segment bei den Spitzenmodellen wohl gar nicht anders zu lösen und nur die ausgewachsenen Notebook-Prozessoren kommen um diesen Effekt herum – wie der mitgetestete Ryzen 7 3750H, dessen Performance-Differenz zwischen Spitze und Dauerlast bei gerade einmal 1% liegt.

Twitterer Momomo weist auf einen Geekbench-Vergleich von Ryzen 9 3950X vs. Core i9-10980XE hin – welcher im SingleCore-Wert ziemlich gleich ausgeht, beim MultiCore-Wert jedoch den AMD-Prozessor um gut +16% vorn sieht. Wirklich belastbar sind diese Ergebnisse allerdings nicht, denn der Core i9-10980XE hatte im September noch wesentlich bessere Ergebnisse anzubieten – und selbst diese waren gemessen an früheren Ergebnissen des Core i9-9980XE eher durchschnittlich. Für solcherart Vergleiche schwanken Geekbench-Messungen einfach viel zu stark, um zu wirklich sinnvollen Aussagen zu kommen – dies wäre nur im Rahmen eines ernsthaften Hardware-Tests auf möglichst der gleichen Plattform bzw. in jedem Fall gleichen Bedingungen möglich. Insofern ist hier fast nur das Resultat des Ryzen 9 3950X bewertbar, welches natürlich genauso wenig auf die Goldwaage gelegt werden kann. Aber zumindest läßt sich anhand der Ergebnis-Höhe erahnen, das es jener 16-Kerner des Consumer-Felds wohl problemlos mit Intels 18-Kernern des HEDT-Segments aufnehmen kann bzw. zumindest in deren grober Werte-Region unterwegs ist.

Technik GB4 Single GB4 Multi Quellen
Ryzen Threadripper 3970X Castle Peak (Zen 2), 32C/64T, 3.7/4.5 GHz 5519 68279 WCCF Tech
Ryzen Threadripper 2990WX Colfax (Zen+), 32C/64T, 3.0/4.2 GHz 4400-4800 25-36.000 Geekbench-DB
Ryzen 9 3950X Matisse (Zen 2), 16C/32T, 3.5/4.7 GHz 5570 52098 Geekbench
Core i9-10980XE Cascade Lake X, 18C/36T, 3.0/3.8/4.8 GHz 5381 51514 Geekbench
Core i9-9980XE Skylake X Refresh, 18C/36T, 3.0/3.8/4.5 GHz 5200-5500 51-62.000 Geekbench-DB
alle Benchmark-Werte unter dem Geekbench 4 (rein unter Windows)

Der Planet 3DNow! spricht die Ungereihmtheiten bezüglich der Abstammung des Athlon 3000G an – und seitens Twitterer Komachi kommt wahrscheinlich die Auflösung hierzu. Offiziell gehört der Athlon 3000G zur Picasso-Familie, soll aber trotzdem in 14nm gefertigt sein – was um so irritierender ist, als das die wirkliche Differenz zwischen "Raven Ridge" und "Picasso" nur in der Chipfertigung liegt, der komplette Aufbau inklusive sogar wohl der Belichtungsmaske ist jedoch dieselbe. Erklärbar wird dies dann durch die Information, dass das benutzte Die eigentlich "Raven 2" darstellt – ein dediziertes Zweikern-Die mit genauso viel kleinerer iGPU (physikalisch 3 Shader-Cluster), so dass hierbei keinerlei Verschnitt entsteht. Jenes "Raven 2" wurde früher mal in diversen Linuxx-Treibern erwähnt, geriet dann etwas in Vergessenheit und kommt nunmehr also doch noch zum Einsatz – und zwar in der 14nm-Fertigung, augenscheinlich um die Auslastung ältere Fertigungsanlagen bei GlobalFoundries zu garantieren. Wahrscheinlich auch nur deshalb ist der spartanische Preispunkt von 49 Dollar zu machen, das herauskommende Prozessoren-Die dürfte wirklich klein sein und die ältere Fertigung ist sowohl Yield-stark als auch inzwischen ausreichend kostenfreundlich.

Fertigung Technik Chipfläche
Raven Ridge 14nm GlobalFoundries 4 CPU-Kerne (Zen 1) samt 11 Shader-Cluster (Vega) 210mm²
Picasso 12nm GlobalFoundries 4 CPU-Kerne (Zen +) samt 11 Shader-Cluster (Vega) 210mm²
Raven 2 14nm GlobalFoundries 2 CPU-Kerne (Zen 1) samt 3 Shader-Cluster (Vega) geschätzt ~110-120mm²