AMDs Zen-Präsentation

Freitag, 19. August 2016
 / von Leonidas
 

AMDs traditionelle Gegenveranstaltung zum IDF 2016 packte unerwartet früh bereits umfangreiche Details zur kommenden Zen-Prozessorenarchitektur sowie einen ersten Benchmark der darauf basierenden Consumer-Prozessoren "Summit Ridge" auf den Tisch. Eigentlich war selbiges erst für die kommende HotChips-Konferenz erwartet worden – wo AMD am kommenden Dienstag nochmals tiefer ins Detail gehen wird. Für den Augenblick hat AMD erst einmal beeindruckend vorgelegt – am Gesagten war keine Schwachstelle zu finden und gleichzeitig begeisterte die gezeigte Performance auf dem (taktnormiert) selben Leistungsniveau wie Broadwell-E regelrecht, würde AMDs Zen damit oberhalb aller früherer Erwartungen herauskommen können. Einen kurzen Zusammenschnitt der AMD-Präsentation kann man sich auf YouTube geben, die wichtigsten gezeigten Folien finden sich nachfolgend.

Dazu gehören zuerst die Präsentationsfolien zur Zen-Architektur selber, bezogen in diesem Fall auf die einzelnen Zen-Rechenkerne. Mit diesen versucht AMD primär herauszustreichen, das Zen als Prozessoren-Design gar nichts mehr mit dem früheren Bulldozer-Design zu tun hat. Während Bulldozer eher sparsam mit Ressourcen und damit Chipfläche umgehen sollte, geht es bei Zen in die umgekehrte Richtung: Der Rechenkern darf gern mächtig sein, Zugriff auf viele (exklusive) Ausführungseinheiten samt großen Caches haben. Ziel ist nicht die Einsparung von Chipfläche, denn dies ist mittels der 14nm-Fertigung nicht mehr notwendig (ein einzelner Zen-Rechenkern dürfte ohne Level2-Cache unterhalb von 10mm² Chipfläche herauskommen) – sondern vielmehr, jedes Rechenwerk auf maximale Performance zu trimmen. Dabei darf die Energieeffizienz aber nicht außer acht gelassen werden, weil jene am Ende die erreichbaren Taktraten begrenzt und somit Performance-schmälernd wirken könnte.

AMDs Zen-Präsentation (Slide 1)
AMDs Zen-Präsentation (Slide 1)
AMDs Zen-Präsentation (Slide 2)
AMDs Zen-Präsentation (Slide 2)

Jener neue Zen-Ansatz ist sowohl im großen als auch im kleinen zu sehen: Jeder CPU-Rechenkern verfügt über seine komplett eigenen Ausführungseinheiten – vier Integer-Einheiten, vier 128 Bit breite Fließkomma-Einheiten, zuzüglich Adress-Einheiten und SMT ähnlich Intels HyperThreading ergeben richtig viel Rechenkraft, der Zen-Ansatz ist somit bei den Ausführungseinheiten absolut vergleichbar mit Intels aktuellen Prozessoren. An den Details hat AMD hingegen genauso gearbeitet: Größerer Level1-Cache, verfünffachte Level1-Bandbreite, neuer MicroOps-Cache, geringere Latenzen an vielen Stellen, verbesserte Sprungvorhersage und vergrößerter Scheduler werden die Auslastung der Recheneinheiten (neben SMT) erhöhen helfen. Hinzu kommt ein nun endlich auch ein standardmäßiger Level3-Cache (8 MB für einen Vierkern-Cluster), welcher die Prozessoren weniger abhängig vom Speichersubsystem machen wird.

Dekoder ALU AGU FP SMT
Intel Sandy & Ivy Bridge 4 3 2 2x 256 Bit
Intel Haswell & Broadwell 4 4 2 2x 256 Bit
Intel Skylake 4 4 2 2x 256 Bit  (koppelbar auf 1x 512 Bit)
AMD Bulldozer für zwei Kerne: 4 2 2 für zwei Kerne: 2x 128 Bit  (koppelbar auf 1x 256 Bit)
AMD Zen 4 4 2 4x 128 Bit  (koppelbar auf 2x 256 Bit)

All dies ist natürlich nur möglich, weil AMD mit der 14nm-Fertigung die Zen-Prozessoren vergleichsweise klein bekommen kann – ein Achtkern-Die wurde schon einmal auf ~160mm² Chipfläche geschätzt, was sich im Vergleich zu Intel absolut sehen lassen kann. AMD nutzt natürlich an der Stelle den Umstand aus, das Intel eine immer größer werdende integrierte Grafiklösung mitschleppt, AMD auf selbige bei den regulären Desktop-Modellen der "Summit Ridge" Serie jedoch verzichtet (die später erscheinenden Zen-basierten APUs der "Raven Ridge" Serie werden natürlich eine integrierte Grafiklösung tragen).

AMDs Zen-Präsentation (Slide 3)
AMDs Zen-Präsentation (Slide 3)
AMDs Zen-Präsentation (Slide 4)
AMDs Zen-Präsentation (Slide 4)

Wichtig für AMD bei Zen war aber daneben auch eine gute Energieeffizienz, nachdem das originale Bulldozer-Design überhaupt nicht in diese Richtung gedacht war und dies nachfolgend für AMD nur zu Problemen geführt hatte: Zum einen konnte man nach Nichterreichen der Performanceziele mit Bulldozer nicht einfach dessen Taktrate hochsetzen, da dies den Stromverbrauch hätte explodieren lassen – und zum anderen war Bulldozer im originalen Design überhaupt nicht für Mobile-Prozessoren geeignet, welche mit der Zeit aber immer wichtiger wurden. Mit dem Zen-Design will man dagegen schon von Anfang an in normalen TDP-Bereichen bleiben und hat damit auch Raum, diese Prozessoren-Architektur nachfolgend auch in den Mobile-Bereich zu bringen (eben in Form der APU-Schiene).

AMDs Zen-Präsentation (Slide 5)
AMDs Zen-Präsentation (Slide 5)
AMDs Zen-Präsentation (Slide 6)
AMDs Zen-Präsentation (Slide 6)

Nochmals betont AMD den großen Unterschied zu Bulldozer sowie den riesigen IPC-Sprung gegenüber der letzten Bulldozer-Ausbaustufe "Excavator", welcher bei satten 40% liegen soll – bei gleichzeitig allerdings identischem Energieverbrauch. Insbesondere letzterer Punkt ist natürlich primär dem Vergleich 14nm- gegen 28nm-Fertigung zu verdanken, denn ein Zen-Prozessor auf der 28nm-Fertigung würde vielleicht ähnlich viel Performance bringen, aber kaum diese hohe Energieeffizienz erreichen können. Damit soll bei Zen aber natürlich nicht Schluß sein, man kündigte auch schon einmal die kommende Ausbaustufe "Zen+" an, welche weitere IPC-Steigerungen erreichen soll. Hierbei dürfte man sicherlich die ersten Praxiserfahrungen mit Zen nutzen können, um gewisse Flaschenhälse und andere keinere Design-Unebenheiten bereinigen zu können. Offen muß derzeit noch bleiben, ob Zen+ schon in einer anderen Fertigungstechnologie daherkommt, da es beim als alleinigen Auftragsfertiger bestätigten GlobalFoundries augenscheinlich keine 10nm-Fertigung geben wird.

AMDs Zen-Präsentation (Slide 7)
AMDs Zen-Präsentation (Slide 7)
AMDs Zen-Präsentation (Slide 8)
AMDs Zen-Präsentation (Slide 8)

Für den Augenblick liegt das Interesse natürlich zuerst einmal eher auf den ersten real erhältlichen Zen-Produkten, wobei hier die Consumer-Prozessoren der "Summit Ridge" Serie zum Jahresanfang 2017 den Start geben werden. Jene wurden erneut als mit 8 CPU-Rechenkernen samt SMT ausgerüstet beschrieben, das ganze kommt auf der AM4-Plattform unter Nutzung von DDR4-Speicher und PCI Express 3.0 daher. Die entsprechenden AM4-Mainboards werden bereits vor Jahresende 2016 mittels der Desktop-Varianten der "Bristol Ridge" APUs erscheinen und sind dann auch schon Zen-kompatibel, da AMD positiverweise die Anwender nicht mit unterschiedlichen Sockeln oder Plattformen verwirren will.

Der spannende Teil kam dann ganz zum Schluß: Ein erster Benchmark von Zen gegen Broadwell-E – ein hoher, in dieser Form nicht erwarteter Vergleich, nachdem AMD in der Vergangenheit immer eher das Haswell-Performanceniveau angepeilt hatte. Hierbei bemühte AMD einen Achtkerner von Zen gegen einen Core i7-6900K – beides also Achtkerner mit SMT. Beide Prozessoren wurden auf einheitlich 3.0 GHz Takt umgetaktet (der Core i7-6900K läuft regulär mit 3.2/3.7 GHz) und dann auch ohne Turbo-Modi betrieben – ergo ein Architekturvergleich auf identischer Taktrate samt identischer Anzahl an CPU-Rechenkernen. In diesem beendete der Zen-Prozessor seine Rechenaufgabe unter dem Blender-Benchmark um eine Nuance schneller als Broadwell-E – genaue Zahlen gab AMD nicht heraus, aber man kann durchaus von einer Gleichwertigkeit unter diesem Benchmark sprechen.

Dies kommt um so überraschender, als das Blender stark FPU-lastig ist und dies bisher die klare Schwäche aller Bulldozer-basierten Prozessoren darstellte. Wenn man sich Blender-Benchmarks zu Bulldozer-basierten Prozessoren ansieht (bei SweClockers) oder Tom's Hardware, dann haben jene dort bereits Mühe, Ivy-Bridge-basierte Vierkerner zu erreichen – so bald man dann Intels Sechs- und Achtkerner ins Feld führt, ist der Ofen für Bulldozer (naturgemäß) aus. Daß AMDs Zen-Prozessor ausgerechnet in diesem Benchmark nunmehr die gleiche (taktnormierte) Performance aufbieten können soll, ist aller Ehren wert und zeigt auf ein sogar zu den neuesten und besten Intel-Prozessoren vergleichbares Performancepotential hin.

Einschränkenderweise wäre allerdings zu erwähnen, das die vorgenommene Taktnormierung aller Vermutung nach eher Intel schadet als denn AMD. Denn von Zen werden keine besonders hohen Taktraten erwartet – auch wenn AMD angibt, das es über 3 GHz für die Serienmodelle sein sollen – während Intel da teilweise schon viel weiter ist und in jedem Fall noch einiger Taktraten-Spielraum bei Intel existiert. Zudem ist der gewählte Benchmark natürlich auch perfekt für Vielkern-Prozessoren – und zeigt überhaupt nicht an, was passiert, wenn nur wenige CPU-Rechenkerne gut ausgelastet werden können. Gerade dann spielt die anliegende Taktrate plötzlich wieder eine viel größere Rolle – und in dieser Frage dürften gerade Intels Consumer-Modelle mit Taktraten um die 4-GHz-Marke gewisse Vorteile ins Feld führen können.

Dies dürfte dem Sexappeal eines bezahlbaren Achtkerners aber wahrscheinlich keinen Abbruch tun, wenn Zen vielleicht in einigen anderen Benchmarks (rein technisch) gegenüber einem von Intels hoch getakteten Consumer-Prozessoren leicht zurückliegt. Sofern Zen bzw. Summit Ridge nur die richtige Grundperformance mitbringen, auf das man keinerlei spürbaren Performance-Nachteile hat, wird das ganze so oder so ein Verkaufsschlager unter Hardware-Enthusiasten – welche zum einen schon marktpolitisch gesehen gern mal wieder etwas anderes als Intel kaufen möchten, zum anderen natürlich wie gesagt scharf auf bezahlbare Achtkerner (mit ordentlicher Performance) sind. Ganz so billig wie zuletzt die Bulldozer-Prozessoren wird Summit Ridge laut AMD aber nicht anbieten – aber Intels Monsterpreise wird man sicherlich auch nicht aufrufen wollen, da wird sich also sicherlich ein alle Seiten zufriedenstellender Mittelweg finden lassen. Nach dieser Präsentation darf man in jedem Fall gespannt auf Zen sein.

Nachtrag vom 19. August 2016

Unserer Performance-"Beurteilung" zu AMDs Zen kann man natürlich skeptisch gegenüberstellen – und beispielsweise darauf verweisen, das ein Benchmark nun einmal kein Benchmark ist. Vielleicht ist das ganze wirklich etwas zu euphorisch geschrieben – bis auf daß sich außer Allgemeinplätzen wenig Ansatzpunkte dafür finden lassen, daß diese Performance des Zen-Testsamples nicht eben auch in der Praxis auftauchen sollte. Denn die hohe Performance unter Blender deutet darauf hin, das Zen unter allen eher FPU-lastigen Benchmarks gut wegkommt – und dies sind die heutzutage interessanten Benchmarks von Videobearbeitung bis hin zu Spielen. Somit könnte Zen am Ende sogar bei der Integer-Performance etwas zurückliegen (eher unwahrscheinlich, denn die Anzahl der Ausführungseinheiten ist wie bei Intel) – im Consumer-Bereich sind dies die uninteressanteren Benchmarks, da mehr Alltagsperformance eigentlich nirgendwo benötigt wird. Hier lag letztlich ein großer Fehler der Bulldozer-Architektur – man setzte auf eine gute Integer-Performance bei gleichzeitig eher schwacher Fließkomma-Performance. Dies wäre zu Zeiten eines Pentium 4 (und früher) gut gegangen, wo CPUs auch eher nur in diese Richtung getestet wurden.

Als Bulldozer herauskam, war Intel jedoch schon mit den Nachfolgern der rundherum schnellen Core-2-Architektur dabei, wurde vor allem die Alltagsperformance immer weniger wichtig (weil die grundsätzliche Arbeitsgeschwindigkeit von PCs bereits ausreichend gut war), sondern gingen die Performance-Anforderungen eher in Spezialbereiche wie eben Videobearbeitung und Spiele. Gerade in letzterem ist Bulldozer wirklich schlecht und wird regelmäßig von nominell viel kleineren Intel-Prozessoren vernascht – es fällt glücklicherweise nicht ganz so oft auf, da die allermeisten Spiele maßgeblich Grafikkarten-limitiert sind. Trotzdem sind exakt dies die Felder, wo eine heutige CPU glänzen können muß: Videobearbeitung, Profi-Rendering und Spiele. Erreicht man hierbei eine gute Performance, wäre es völlig egal, ob ein PCMark oder ein WinZip unter Zen eventuell langsamer laufen sollten – letzteres sind keine echten Maßgaben mehr, nach welchen man sich eine CPU heutzutage aussuchen sollte. Und die erstklassige Blender-Performance von Zen deutet eben darauf hin, das Zen genau unter diesen Feldern seine Stärken hat – ergo richtig gute Voraussetzungen dafür, das AMD endlich einmal sein Tal der Tränen im CPU-Geschäft verlassen kann.

Heiß diskutiert wird derweil, mit welchen Zen-Preislagen man rechnen kann/muß – bzw. wie Intels Konter aussehen könnte. Mit einer Chipfläche von grob ~160mm² dürfte ein Zen-Achtkerner nicht einmal teurer herzustellen sein wie ein Polaris-10-Chip (232mm² Chipfläche) – und jener wird in 200-Euro-Grafikkarten vertickt, wo dann ja auch noch die Platine und der Speicher als weitere Hardware-Kosten hinzukommen. Aber bei Prozessoren haben Endkundenpreise immer recht wenig mit den reinen Herstellungskosten zu tun – die üblicherweise große Differenz dazwischen muß den gewaltigen Forschungs- und Entwicklungsaufwand für die Prozessoren-Architektur sowie die Fertigungstechnologie wieder einspielen. Insofern dürften sich die Verkaufspreise der Zen-Prozessoren kaum an den reinen Herstellungskosten orientieren – sondern eher am Markt sowie AMDs Zielsetzung, wieder auf echte Marktanteile zu kommen. Daher sollte man schon Preislagen von 250-400 Dollar/Euro für die Zen-Achtkerner erwarten, die später nachfolgenden Zen-basierten APUs werden natürlich günstiger ausfallen.

Gut möglich zudem, das AMD ein besonders schnelles Modell dann auch für einen hochgezogenen Preis anbietet – hoffentlich achtet man dabei darauf, es nicht wie Intel derzeit maßlos mit den Preisen zu übertreiben. Die erste Zen-Generation darf bei AMD sicherlich Gewinn machen, ist aber wie gesagt eher auf Marktanteile hin ausgerichtet – erreicht man jene, kommt das mit den Gewinnen eigentlich fast von selbst. Intels mögliche Konter sind hingegen einigermaßen limitiert, da auch Intel nicht mehr einfach so neue Prozessoren-Generationen aus dem Ärmel schütteln kann bzw. die zähen Fortschritte in der Halbleiterfertigung Intel an schnellen Kontern maßgeblich hindern. Sicherlich wird sich Intel bei einem Zen-Erfolg bemüßigt fühlen, endlich einmal das alte Modell der ausschließlich Zwei- und Vierkerner im (regulären) Consumer-Bereich aufzubrechen – sollte dies passieren, dann hätte sich Zen umgehend für alle Prozessoren-Käufer gelohnt. Aber auch dies benötigt Zeit und Vorbereitung – selbst Intels erst kürzlich eingeschobene Coffee-Lake-Generation (mit erstmals Sechskernern im regulären Consumer-Bereich) kommt erst zur Jahresmitte 2018.

Kurzfristig könnte Intel demzufolge nur über Preisnachlässe auf Zen antworten – doch ob sich Intel diese Blöße gibt (und damit indirekt Zens Stärke zugibt), bliebe streng abzuwarten. Am Ende dauert es auch für AMD recht lange, gute Marktanteile und eine stabile Kundenbasis mit Zen aufzubauen, Intel ist da jetzt nicht unbedingt zum sofortigen Gegenzug gezwungen. Für Intel dürfte hier auch der Punkt mit hineinspielen, das man AMD als (letzten verbliebenen) CPU-Wettbewerber ziemlich gut gebrauchen kann und dafür ein gewisser Marktanteil zugunsten von AMD nicht nur nützlich, sondern sogar (für AMD) überlebensnotwendig ist. Eventuell setzt Intel daher seinen Zen-Konter bewußt zu einem späteren Zeitpunkt an, um AMD bewußt ein paar Marktanteile zu geben – nicht so viel, das es Intel weh tut, aber doch ausreichend für ein absehbares Überleben von AMD. Denn AMD benötigt diese CPU-Marktanteile sicherlich, eine Pleite kann man sich mit Zen absolut nicht erlauben bzw. würde das Überleben von AMD als Firma in ernsthafte Frage stellen.

Nachtrag vom 25. August 2016

Mit der HotChips-Konferenz hat AMD nun auch noch mehr Details zur Zen-Prozessorenarchitektur veröffentlicht – wobei vieles bereits mittels der kürzlichen Vorab-Präsentation bekannt war, AMD also "nur" noch diverse Informationslücken gefüllt hat. Entsprechende Artikel von Golem, Heise, AnandTech und PC Perspective haben sich mit diesen neuen Präsentationsfolien beschäftigt, deren die Zen-Architektur betreffenden Slides am Ende unseres kürzlichen Zen-Artikels gespiegelt wurden. Die vorgenannten Artikel sind sich derweil darüber einig, das Zen für den Augenblick wie ein gelungenes CPU-Design aussieht, welches vor allem keine auffälligen Schwächen in irgendwelchen Teilbereichen haben dürfte, sondern auf eine rundherum gute Performance unter allen Anwendungsarten ausgelegt ist. Dafür ist das Zen-Design dann auch ziemlich dem ähnlich, was Intel zuletzt so entwickelt hat – aber andererseits muß man das Rad schließlich auch nicht neu erfinden bzw. versuchen, auf Zwang einen abweichenden Weg zum Ziel zu finden. Wie dies schiefgegangen kann, konnte AMD schließlich mit der Bulldozer-Architektur bereits selber erleben.

Die PC Games Hardware beschäftigt sich dagegen mit der Kritik gegenüber AMDs Zen-Benchmark mit Blender. Der Hauptpunkt, das AMD an der Blender-Entwicklung beteiligt ist, spielt keine wirkliche Rolle, da dies nur den GPU-Ansatz von Blender betrifft, nicht jedoch den CPU-Ansatz. Auch der Einwand eines Intel-Mitarbeiters, daß Blender sowieso alle Prozessoren-Architektur mit angepasstem Code anfasst, spielt keine ganz große Rolle – weil dies primär bedeutet, daß Blender bereits bestmöglich auf Intel-CPUs optimiert sein dürfte. Insofern kann diese hauptsächliche Kritik wohl als ausgeräumt betrachtet werden – nichtsdestotrotz interessant ist der Nebenpunkt, daß AMD bei seinen Benchmarks das Intel-System nur im DualCore-Modus hat laufen lassen, obwohl der benutzte Broadwell-E natürlich über ein QuadChannel-Speicherinterface verfügt. Man kann sicherlich argumentieren, das im Sinne eines Architektur-Vergleiches auch das Speicherinterface gleich sein sollte – aber wenn am Markt diese Prozessoren dann letztlich eben doch mit diesem (kleinen) Unterschied verfügbar sein werden, dann gehört jener wohl doch mit in den Benchmark. Ein ganz perfekter Vergleich ist das ganze somit dann also doch nicht geworden, auch wenn der Punkt der Speicherbandbreite unter Blender keine Welten ausmachen soll.

AMDs "Zen" HotChips-Präsentation (Slide 6)
AMDs "Zen" HotChips-Präsentation (Slide 6)
AMDs "Zen" HotChips-Präsentation (Slide 7)
AMDs "Zen" HotChips-Präsentation (Slide 7)
AMDs "Zen" HotChips-Präsentation (Slide 8)
AMDs "Zen" HotChips-Präsentation (Slide 8)
AMDs "Zen" HotChips-Präsentation (Slide 9)
AMDs "Zen" HotChips-Präsentation (Slide 9)
AMDs "Zen" HotChips-Präsentation (Slide 10)
AMDs "Zen" HotChips-Präsentation (Slide 10)
AMDs "Zen" HotChips-Präsentation (Slide 11)
AMDs "Zen" HotChips-Präsentation (Slide 11)
AMDs "Zen" HotChips-Präsentation (Slide 12)
AMDs "Zen" HotChips-Präsentation (Slide 12)
AMDs "Zen" HotChips-Präsentation (Slide 13)
AMDs "Zen" HotChips-Präsentation (Slide 13)
AMDs "Zen" HotChips-Präsentation (Slide 14)
AMDs "Zen" HotChips-Präsentation (Slide 14)
AMDs "Zen" HotChips-Präsentation (Slide 15)
AMDs "Zen" HotChips-Präsentation (Slide 15)