14

Hardware- und Nachrichten-Links des 14. Februar 2020

Bei Notebookcheck thematisiert man Intel "Xe" DG1 Benchmarks unter SiSoft Sandra, welche auf den ersten Blick ziemlich schlecht ausgefallen sind. Allerdings wird die Betrachtungsweise seitens Notebookcheck als nicht gänzlich fair kritisiert, wenn hierbei mit einer Desktop-Grafikkarte verglichen wird – gegenüber der arg auf Mobile-Bedürfnisse optimierten DG1, welche zudem auch noch mit einer unterdurchschnittlichen Taktrate lief. Die angetretene Hochrechnung, eine DG2-256 könnte es dann noch nicht einmal mit einer GeForce GTX 980 (umgerechnet auf heutige Verhältnisse eine GeForce GTX 1650 Super) aufnehmen, passt somit an mehreren Ecken und Enden nicht. Solcherart Hochrechnungen sollte man sowieso nicht derart Genre-übergreifend zwischen Mobile & Desktop sowie zwischen DG1 & DG2 vornehmen: Denn zum einen ist die Performance-Differenz von Intel Xe zwischen Mobile und Desktop noch nicht bekannt (womit man nicht einfach die entsprechende Differenz von AMD oder nVidia ansetzen kann), zum anderen fehlt auch eine ernsthafte Kenntnis über den Architektur-Unterschied zwischen DG1 und DG2. An dieser Stelle könnten eben noch einige Überraschungen liegen: Unsere eigene Vermutung geht wie dargelegt in Richtung einer verdoppelten Shader-Anzahl pro EU bei DG2, bei WCCF Tech geht man hingegen davon aus, das eine "Tile" aus gleich 512 EU (á 8 Shader-Einheiten) besteht.

Intel Arctic Sound Technik-Ausführung 1 Tile 2 Tiles 4 Tiles
Annahme lt. 3DCenter eine EU mit 16 SE 128 EU (2048 SE) = ~6 TF 256 EU (4096 SE) = ~12 TF 512 EU (8196 SE) = ~22 TF
Gerücht lt. WCCF Tech eine Tile mit 512 EU 512 EU (4096 SE) = ~12 TF 1024 EU (8196 SE) = ~20 TF 2048 EU (16384 SE) = ~36 TF
TDP lt. Intel-Unterlagen - bis 150 Watt bis 300 Watt bis 500 Watt
Diese Tabelle enthält reine Annahmen & Spekulationen.

Angeblich haben WCCF Tech dies von einer Quelle bei Intel so erfahren – was der Sache einiges an Gewicht verleiht, auch wenn man hierfür natürlich noch eine Bestätigung benötigt. Die 512 EU pro Tile passen dann natürlich nicht mehr wirklich zu den früher notierten Codenamen "DG2-128", "DG2-256" und "DG2-512" (aus welchem man die Anzahl der EUs schlußfolgerte), aber dies muß nicht unbedingt wirklich viel sagen. So oder so kommt Intels "Arctic Sound" wahrscheinlich wesentlich kräftiger heraus, als die ursprünglichen Intel-Dokumente es zuerst vermuten lassen haben: Bei WCCF Tech kann die Spitzenversion mit 4 Tiles auf (selbst bei niedrigeren Taktraten) immerhin ca. 36 TFlops Rechenleistung kommen. Dies wäre gegenüber aktueller Grafik-Hardware extrem viel, die GeForce RTX 2080 Ti erreicht 14 TFlops, eine Tesla V100 knapp 16 TFlops. Selbst innerhalb der kommenden Ampere-Generation dürfte nVidia nicht auf derart hohe Rechenleistungen kommen – dürfte aber vermutlich auch nicht den von Intel angepeilten Stromverbrauch von gleich 500 Watt erreichen. Normiert man es auf einen eher gebräuchlichen Stromverbrauchswert von (maximal) 300 Watt, dann würde Intel lt. WCCF Tech immerhin noch 20 TFlops erreichen – ein durchaus realistischer Wert, nVidias GA100-Chip dürfte in der Spitze selbiges bzw. leicht besseres bieten. Insofern erscheint das neue Gerücht lt. WCCF Tech womöglich besser zur vermuteten Realität zu passen als unsere vorherige These.

Bei Tom's Hardware ist man der Frage nachgegangen, inwiefern die Verwendung von Windows 10 Enterprise etwas an der Performance des Ryzen Threadripper 3990X ändert – eine Frage, welche sich speziell nach den Benchmark-Ergebnissen von AnandTech zum Launch dieses 64-Kern-Boliden durchaus aufgetan hat. Allerdings gab es "seinerzeit" schon den Hinweis, das der bei AnandTech gemessene Performance-Unterschied eher am Alter der konkret benutzten Windows-Version lag, was die Benchmarks von Tom's Hardware nun eindrucksvoll bestätigen: Auf jeweils neuester Windows-Version gibt es zwischen Windows 10 Pro und Windows 10 Enterprise auch auf diesem Threadripper-Prozessor nur marginale Performance-Differenzen, welche üblicherweise nur um ±1% schwanken und in der Summe keine von beiden Windows-Ausführungen wirklich vorn sehen. Wichtig für einen solchen Test ist damit in erster Linie ein radikal aktuelles Windows samt auch der jeweils neuesten Versionen der benutzten Benchmarks – wenn man hier mit älteren Software-Versionen testet, dann kann der Ryzen Threadripper 3990X hier und da sein Performance-Potential nicht gänzlich ausspielen.

Nebenbei zeigt jener Nachtest auch auf eine Problematik zukünftiger Threadripper-Prozessoren mit noch mehr CPU-Threads hin: Windows 10 Pro unterstützt derzeit maximal 128 CPU-Threads, was exakt so viel sind, wie jener Ryzen Threadripper 3990X aufbietet. Doch wenn AMD eines Tages an dieser Stelle mal mehr bieten will, dann wird man vorher mit Microsoft darüber reden müssen, jenes Limit anzuheben. Noch steht dies allerdings nicht direkt auf der Agenda, denn Zen 3 wird allem Anschein nach dieselbe Kern-Anzahl (und keinerlei SMT4) mitbringen, ergo wird dies dann erst ein Thema für Zen-4-basierte Threadripper-Prozessoren sein. Mittels Zen 4 steht AMD in vermutlich der 5nm-Fertigung von TSMC dann auch erstmals wieder die fertigungstechnische Möglichkeit zu mehr CPU-Kernen auf gleich großer Chipfläche zur Verfügung, bei der 7nm+ Fertigung von Zen 3 ist der Flächenvorteil wahrscheinlich noch zu klein. Ob Zen 4 dann gleich eine Kern-Verdopplung aufbietet, wie von AMD in jüngerer Vergangenheit gern bemüht, ist aber noch nicht sicher – möglicherweise gibt es hier auch erst einmal einen Zwischenschritt mit "nur" 12 CPU-Kernen pro Chiplet. Trotz der grundsätzlichen Flexibilität des Chiplet-Ansatzes muß AMD hierbei immer zusehen, das die jeweils einfachste Bauform die Bedürfnisse des Consumer-Markts vernünftig abdeckt, ohne dabei zu viel an "Verschnitt" zu produzieren.