Launch-Analyse: AMD Bulldozer/Vishera mit Piledriver-Rechenkernen

Mittwoch, 24. Oktober 2012
 / von Leonidas
 

Als AMD im Oktober 2011 die ursprüngliche Bulldozer-Prozessorenarchitektur an den Start brachte, waren die Hoffnungen groß, daß AMD mit dieser endlich wieder Anschluß an Intel finden würde – nachdem man in der Zeit davor die eigentlich sehr erfolgreiche K7/K8/K10-Architektur lange Zeit gemolken hatte, mit den letzten Ausbaustufen (K10- und K10.5-Modelle aka Phenom-Prozessoren) dann jedoch deutlich gegenüber Intels in Hintertreffen geraten war. Bulldozer konnte letztes Jahr die Erwartungen jedoch nicht erfüllen: Die Prozessoren hatten eine viel zu niedrige Pro-MHz-Leistung, was auch durch die gebotenen ansprechenden Taktraten nicht mehr ausgeglichen werden konnte. Hinzu war der Übertaktungs-Spielraum eher mäßig und die Leistungsaufnahme unter Volllast schon bei default-Taktraten viel zu hoch gegenüber Intel.

Entscheidend hinzu kam eine eher unglückliche Mischung bei den Bulldozer-Prozessoren: Ausgerechnet im Spieler-Bereich, wo die hohe Leistungsaufnahme noch am ehesten verziehen wird und wo das Hauptgeschäft bei hochpreisigen Prozessoren liegt, war Bulldozer besonders schwach – so schwach, daß Zweikern-Prozessoren von Intel an ausgewachsenen Achtkern-Modellen von AMD vorbeizogen. Für den Office-Bereich bot AMD zwar eine ansprechende Performance, war Bulldozer speziell unter Anwendungen immer schon gut – hier aber störte die hohe Verlustleistung besonders stark. So richtig interessant war Bulldozer daher auf dem Desktop nur dort, wo viele physikalische Rechenkerne benötigt wurden und auch ausgelastet werden konnten – hier war das einzige Feld, wo Bulldozer auf Augenhöhe mit Intel mitspielen konnte. Allerdings ist die Anwendergruppe mit solcherart Anforderungen recht klein, war der Mißerfolg von Bulldozer mit dieser Ausgangslage nahezu vorprogrammiert.

Nun ist die Bulldozer-Prozessorenarchitektur etwas, was mit der Zeit wachsen soll. AMD plante schon von Anfang an mit mindestens drei Ausbaustufen von Bulldozer anzutreten, zusätzlich zu etwaigen neuen Fertigungsverfahren, welche primär für mehr Taktspielraum sorgen würden. Mit dem Vishera-Prozessor mit den – von Trinity her schon bekannten – Piledriver-Rechenkernen liegt nunmehr die erste Bulldozer-Ausbaustufe ziemlich exakt ein Jahr nach dem Launch der Bulldozer-Prozessorenarchitektur vor. Aufgrund der Kürze der Zeit hat AMD bei dieser ersten Bulldozer-Ausbaustufe sicherlich noch recht wenig Zukunftsarbeit tun können, sondern sich wohl in erster Linie darauf konzentriert, die augenfälligsten Schwächen des originalen Bulldozer-Designs bestmöglich auszubügeln.

Trotzdem – oder vielleicht gerade deshalb – reicht es für Vishera/Piledriver zu einem mittleren Sprung in der Pro-MHz-Leistung von knapp 10 Prozent. AMD hat einige Detailverbesserungen vorgenommen, welche für sich genommen keine große Sache sind – gut zu sehen auch daran, daß die Transistorenmenge (1,2 Mrd.) sowie die Chipfläche (315mm²) absolut gleich zum originalen Bulldozer-Prozessor geblieben sind. Trotzdem gehen diese Detailverbesserungen in ihrer Summe doch deutlich darüber hinausgehen, was man üblicherweise als "Refresh" bezeichnen würde (wie zwischen Sandy Bridge & Ivy Bridge geschehen). Insbesondere für die kurze Entwicklungszeit von nur einem Jahr ist dies schon gutklassig.

Technik Fertigung
Bulldozer Sockel AM3+, 8 Bulldozer-Kerne in 4 Modulen, 2 MB Level2-Cache pro Modul, 8 MB Level3-Cache insgesamt, DualChannel-Speicherinterface bis DDR3/1866, kein PCI Express Interface, keine integrierte Grafik 1200 Millionen Transistoren auf 315mm² Chipfläche in 32nm bei GlobalFoundries
Vishera Sockel AM3+, 8 Piledriver-Kerne in 4 Modulen, 2 MB Level2-Cache pro Modul, 8 MB Level3-Cache insgesamt, DualChannel-Speicherinterface bis DDR3/1866, kein PCI Express Interface, keine integrierte Grafik 1200 Millionen Transistoren auf 315mm² Chipfläche in 32nm bei GlobalFoundries
Sandy Bridge (4C) Sockel 1155, 4 Sandy-Bridge-Kerne + HyperThreading, 256 kByte Level2-Cache pro Kern, 8 MB Level3-Cache insgesamt, DualChannel-Speicherinterface bis DDR3/1333, PCI Express 2.0 x16, integrierte HD3000-Grafik mit 12 Execution Units 1160 Millionen Transistoren auf 216mm² Chipfläche in 32nm bei Intel
Sandy Bridge E Sockel 1155, 6 Sandy-Bridge-Kerne + HyperThreading, 256 kByte Level2-Cache pro Kern, 20 MB Level3-Cache insgesamt, QuadChannel-Speicherinterface bis DDR3/1600, PCI Express 3.0 x40, keine integrierte Grafik 2270 Millionen Transistoren auf 435mm² Chipfläche in 32nm bei Intel
Ivy Bridge (4C+GT1) Sockel 1155, 4 Ivy-Bridge-Kerne + HyperThreading, 256 kByte Level2-Cache pro Kern, 6 MB Level3-Cache insgesamt, DualChannel-Speicherinterface bis DDR3/1600, PCI Express 3.0 x16, integrierte HD2500-Grafik mit 6 Execution Units ~1100 Millionen Transistoren auf 133mm² Chipfläche in 22nm bei Intel
Ivy Bridge (4C+GT2) Sockel 1155, 4 Ivy-Bridge-Kerne + HyperThreading, 256 kByte Level2-Cache pro Kern, 8 MB Level3-Cache insgesamt, DualChannel-Speicherinterface bis DDR3/1600, PCI Express 3.0 x16, integrierte HD4000-Grafik mit 16 Execution Units 1400 Millionen Transistoren auf 160mm² Chipfläche in 22nm bei Intel

Welche der einzelnen Verbesserungen primär für den Pro-MHz-Gewinn von Vishera/Piledriver sorgen, ist schwer zu sagen – vermutlich gewinnt AMD recht viel mit der verbesserten Sprungvorhersage, dies ist ein üblicher Performancebringer. Der Testbericht des Planet 3DNow! hat in dieser Frage versucht, die wenigen direkt messbaren Verbesserungen einzeln auszutesten – bemerkenswert ist hierbei die nunmehr aktive Integer-Divisions-Einheit, mittels welcher Vishera (in speziellen Tests) bis zum fünffachen gegenüber dem originalen Bulldozer zulegen kann. Wirklich genaueres zu den einzelnen Vishera/Piledriver-Verbesserungen läßt sich jedoch kaum berichten, da viele Verbesserungen nur allgemein auf die Pro-MHz-Leistung wirken und die AMD-Angaben zum Verbesserungsgrad eher unspezifisch sind.

Zu der etwas höheren Pro-MHz-Leistung kommt auch noch ein kleinerer Taktratensprung um nominell 400 MHz (+11,1%), beim maximalen TurboCore-Takt gibt es allerdings gar keinen Taktraten-Zuwachs zwischen den Spitzenmodellen von Vishera und Bulldozer. Die anderen Vishera-Modelle gewinnen zumeist in ähnlichem Maß an Takt hinzu – was wohl nicht weiter erwähneswert wäre, wenn Intel nicht gerade gar keinen Mehrtakt bei Ivy Bridge gegenüber Sandy Bridge bieten würde. AMD robbt sich also nicht nur mittels der höheren Pro-MHz-Leistung, sondern auch mittels des geringfügigen Mehrtakts an Intel heran.

Takt Technik TDP Listenpreis Release
FX-8350 4.0 GHz (TC 4.2 GHz) 8 Vishera-Kerne (4 Module), 8 MB Level2-Cache, 8 MB Level3-Cache, DDR3/1866 125W 195$
FX-8320 3.5 GHz (TC 4.0 GHz) 8 Vishera-Kerne (4 Module), 8 MB Level2-Cache, 8 MB Level3-Cache, DDR3/1866 125W 169$
FX-8300 3.3 GHz (TC 4.2 GHz) 8 Vishera-Kerne (4 Module), 8 MB Level2-Cache, 8 MB Level3-Cache, DDR3/1866 95W ? Q4/2012
FX-6350 3.9 GHz (TC 4.2 GHz) 6 Vishera-Kerne (3 Module), 6 MB Level2-Cache, 8 MB Level3-Cache, DDR3/1866 125W ? Q4/2012
FX-6300 3.5 GHz (TC 4.1 GHz) 6 Vishera-Kerne (3 Module), 6 MB Level2-Cache, 8 MB Level3-Cache, DDR3/1866 95W 132$
FX-4350 4.2 GHz (TC 4.3 GHz) 4 Vishera-Kerne (2 Module), 4 MB Level2-Cache, 8 MB Level3-Cache, DDR3/1866 125W ? Q4/2012
FX-4320 4.0 GHz (TC 4.2 GHz) 4 Vishera-Kerne (2 Module), 4 MB Level2-Cache, 4 MB Level3-Cache, DDR3/1866 95W ? Q4/2012
FX-4300 3.8 GHz (TC 4.0 GHz) 4 Vishera-Kerne (2 Module), 4 MB Level2-Cache, 4 MB Level3-Cache, DDR3/1866 95W 122$

Wie vorher schon bekannt, setzen die Vishera-Prozessoren weiterhin auf den Sockel AM3+ und die dafür schon im Markt befindlichen Mainboards – welche für Vishera maximal ein BIOS-Update benötigen. Ob dies auch noch für den Vishera-Nachfolger mit Steamroller-Rechenkernen gilt, ist ungewiß – und da diese Prozessoren aber wohl erst für den Jahresanfang 2014 geplant sind, ist durchaus ein (zukünftiger) Sockelwechsel denkbar. Für die jetzigen Besitzer eines Sockel AM3+ Systems ist Vishera also eine problemlose Aufrüstoption, für die Zukunft hingegen sind weitere Aufrüstmöglichkeiten (abgesehen von Taktraten-Updates innerhalb der Vishera-Linie) eher unwahrscheinlich.

Ein bei den originalen Bulldozer-Prozessoren besonders wunder Punkt war die enorme Stromaufnahme unter Last – welche AMD bei Vishera eigentlich reduzieren wollte. Dies ist jedoch nur relativ gelungen: Auf gleichem Takt verbraucht Vishera minimal weniger als der originale Bulldozer – je nach benutztem Benchmark kann das Pendel aber sogar auch einmal minimal in die andere Richtung ausschlagen. Und damit ist der Verbrauch auf Nominaltakt bei Vishera logischerweise sogar etwas höher als beim originalen Bulldozer, begründet durch den Vishera-Mehrtakt. In diesem Punkt hat AMD keinen echten Fortschritt erzielt, sondern dehnt das Maß sogar noch etwas weiter – was wohl viele Vishera-Interessenten enttäuschen dürfte.

Volllast (Syst.) CB PCGH Anand HWCan X-bit HW.fr
Phenom II X6 1100T
6C, 3.3/3.7 GHz
194W 190W - - - 167W
FX-8150
8C, 3.6/4.2 GHz
215W 194W 199,2W 185W 205W 186W
FX-8350
8C, 4.0/4.2 GHz
233W 199W 195,2W 179W 213W 189W
FX-8320
8C, 3.5/4.0 GHz
- - 185,4W - - -
FX-6300
6C, 3.5/4.1 GHz
- - 145,7W - - -
FX-4300
4C, 3.8/4.0 GHz
- - 135,8W - - -
Core i3-3220
2C+HT, 3.3 GHz
89W - 79,8W - - -
Core i3-3240
2C+HT, 3.4 GHz
- 59W - - - 65W
Core i5-3330
4C, 3.0/3.2 GHz
- - - - 103W 84W
Core i5-3450
4C, 3.1/3.5 GHz
117W - - - - -
Core i5-3470
4C, 3.2/3.6 GHz
- 71W - - 114W -
Core i5-3550
4C, 3.3/3.7 GHz
118W - - - - -
Core i5-3570K
4C, 3.4/3.8 GHz
123W 92W 101,3W 91W 126W 91W
Core i7-3770K
4C+HT, 3.5/3.9 GHz
133W 105W 119,8W 113W 132W 103W
Core i7-3960X
6C+HT, 3.3/3.9 GHz
228W - - 186W - -

Andererseits wird gerade an diesem Fall deutlich, daß wir endlich bessere Stromverbrauchs-Benchmarks im Prozessoren-Bereich benötigen. Die an dieser Stelle üblichen Volllast-Tests zeigen nun einmal nur Extremszenarien an, in welchen moderne CPUs aufgrund weitreichender Stromspar-Mechanismen nur noch höchst selten arbeiten müssen. Eine solide Aussage zum Alltags-Stromverbrauch stellen Volllast-Tests somit schon lange nicht mehr dar – und schlimmer noch, aufgrund unterschiedlich wirkender Stromsparmechanismen unter Teillast könnten sich die Ergebnisse bei einem Test des Alltags-Stromverbrauchs theoretisch sogar umkehren. Auch wenn dies aufgrund des hohen Vorteils von Intel beim Volllast-Verbrauch eher unwahrscheinlich ist, so könnte ein Test des Alltags-Stromverbrauchs doch zumindest ergeben, daß die Unterschiede in der Praxis weitaus geringer ausfallen als es die Extremzahlen von Volllast-Tests vermuten lassen.

Ebenfalls keinen echten Fortschritt hat AMD im Feld der Übertaktung erzielt: Weiterhin erreichen Vishera-Prozessoren in aller Regel um die 5 GHz Takt – dies ist nur minimal besser als beim originalen Bulldozer zu seinem seinerzeitigen Launch (knapp unter 5 GHz). Relativ gesehen ist der Übertaktungsgewinn von Vishera aufgrund des höheren nominellen Takts damit sogar etwas gesunken, selbst wenn absolut gesehen etwas höhere Taktraten erreicht werden. Unter Übertaktung geht der Volllast-Stromverbrauch zudem wieder durch die Decke, für 25 Prozent Mehrtakt kann man (auf das gesamte System bezogen) einen Mehrverbrauch von gleich 60 Prozent erwarten (wobei auch in diesem Punkt Messungen zum Alltags-Stromverbrauch aussagekräftiger wären).