1

Hardware- und Nachrichten-Links des 1. August 2017

Von TechPowerUp kommt auf Basis einer entsprechenden AMD-Präsentation ein "Vega Microarchitecture Technical Overview" – welche namensgemäß einige weitere Details der Vega-Architektur beleuchtet. Einiges hiervon hatte AMD schon mit dem Vega Architecture Preview zum Jahresanfang genannt, anderes ist hingegen neu – gänzlich detailliert ist leider vergleichsweise wenig, was für eine nunmehr offiziell vorgestellte Grafikchip-Architektur ein wenig mager erscheint. Manchmal (oftmals) sind solcherart Präsentationen allerdings auch nur dazu da, damit die Fachpresse etwas zu berichten hat und keine dummen oder gar gefährlichen Fragen in Richtung des Herstellers stellt. Eine dieser gefährlichen Fragen wäre sicherlich, wo denn jetzt der große Gewinn von Vega 10 sein soll – immerhin hat AMD rund 40% mehr Transistoren als beim Fiji-Chip angesetzt und bekommt dafür voraussichtlich nur eine 30-40% bessere Performance heraus. Im Sinne eines nominellen Effizienzgewinns ist dies natürlich sogar eine gute Hausnummer – im Sinne dessen, das AMD mit der GCN5-Architektur die Recheneffizienz maßgeblich über das normale Maß hinaus steigern wollte, jedoch eher nicht.

nVidia hatte seinerzeit beim Wechsel von der Kepler- auf die Maxwell-Architektur (welches erstmals bei nVidia ein Tile-based Binning brachte) für 47% mehr Transistoren immerhin 67% mehr Performance (Vergleich der jeweils ersten Generationen von Kepler und Maxwell, sprich GeForce GTX 680 vs. 980) herausgeholt – da gab es einen echten Effizienzgewinn aus der neuen Grafikchip-Architektur selbst heraus, welcher klar über das hinaus ging, was man an mehr Transistoren hierfür ansetzen musste. Genau dies fehlt derzeit der Vega-Architektur – und deren Zuwachs an Transistoren wurde laut Ausführungen der PC Games Hardware primär für den Mehrtakt verwendet. Das AMD nun endlich ein echtes Hochtaktdesign hat, ist zwar löblich, aber der dafür notwendige Hardware-Einsatz ist augenscheinlich sehr hoch. Für die genannten 12,5 Mrd. Transistoren hätte AMD in der GCN4-Architektur locker und leicht ~6000 Shader-Einheiten zu Polaris-Taktraten verbauen können, womit man auf ~16 TFlops Rechenleistung gekommen wäre (die Radeon RX Vega 64 "Liquid Cooled" liegt bei bestenfalls 13,7 TFlops).

Natürlich waren die bisherigen Grafikchip-Designs von AMD auf ihren mittelprächtigen Taktraten eine gewisse Sackgasse, musste man irgendwenn den Weg zu Hochtakt-Designs gehen. Der Mehrtakt mag gerade teuer erkauft sein, aber zu viele Recheneinheiten zwingen regelrecht zu anderen Verbreitungen im Grafikchip-Design (Raster-Engines, Register, Caches, anderes), um jene vielen Recheneinheiten überhaupt effektiv auslasten zu können – worin schließlich gerade AMD immer so seine Schwierigkeiten hatte. Trotzdem bleibt es enttäuschend, das die eigentlichen Architektur-Verbesserungen derart kurz gekommen sind und sich Vega 10 derzeit einfach nur wie Fiji auf höheren Taktraten anfühlt – dafür war die Wartezeit zu lang und der von AMD höchstselbst angefachte Hype reichlich deplaziert. Aber wahrscheinlich sehen wir hier nur die Auswirkungen einer über die Jahre immer wieder zusammengekürzten R&D-Abteilung bei AMD – welche auf ihrem schmalen Budget einfach keine derartige Qualitätsarbeit (im ersten Versuch) abliefern kann wie nVidia in der vergleichbaren Situation. Bleibt nur zu hoffen, das AMDs nächste Versuche eine bessere Effizienz erbringen bzw. das AMD auf Basis des nun langsam anziehenden Geschäftserfolgs seine R&D-Ausgaben sowie auch die Treiber-Abteilung wieder aufstocken kann.

Zur Ankündigung des Ryzen Threadripper 1900X Prozessors gibt es noch einige relevante Nachträge zu vermelden: So soll der XFR-Modus bei allen Threadripper-Modellen nicht nur auf zwei CPU-Kernen laufen, sondern sogar auf vier CPU-Kernen (2 CPU-Kerne pro genutztem Die). Dies würde dem XFR-Modus, so lange jener Takt aus thermischer Sicht gehalten werden kann, natürlich erheblich mehr Schlagkraft verleihen – gerade im Spiele-Einsatz, wo oftmals nur 4 CPU-Kerne eine wirkliche Last bekommen. Zudem werden alle Threadripper-Prozessoren samt der entsprechenden X399-Mainboards den Support für ECC-Speicher mitbringen – womit Threadripper auch im Workstation-Segment als gut einsetzbar erscheint. Und letztlich gibt es noch eine Bestätigung dafür, das Threadripper von den vier zu sehenden Dies immer nur 2 nutzt – die zwei anderen Dies sind Dummys aus nicht belichtetem Silizium, welche (wie erwartet) aus Gründen des besseren Anpressdrucks verbaut werden. Mit dieser Methode muß AMD dann auch nur ein Package für Epyc und Threadripper auflegen – was wohl bedeutet, das die zusätzliche Erstellung eines extra Threadripper-Packages sowie dessen extra Fertigung am Ende teurer kommt, als das vorhandene Epyc-Package zu benutzen und darauf dann eben zwei funktionslose Silizium-Scheiben zu verbauen.