Launch-Analyse: AMD Bulldozer (Seite 2)

Mittwoch, 12. Oktober 2011
 / von Leonidas
 

Ansonsten sind alle Vorteile bei Intel zu sehen: Die ausgewogenere Gesamtperformance (für den Normalanwender oder Spieler), die niedrigere Verlustleistung, die klar höhere Singlethread-Leistung, die höheren relativen Taktreserven (unter normaler Kühlung) sprechen für Sandy Bridge, für Bulldozer dagegen nur die Übertaktfähigkeiten der kleineren Modelle und die Aufrüstmöglichkeit zugunsten bestehender Systeme mit den Sockeln AM3 und AM3+. Dafür verlangt AMD derzeit einen Preis, welcher eher unpassend ist, vergleicht man gerade die Performance zwischen Bulldozer und Phenom II Prozessoren – ironischerweise wäre es zur aktuellen Preislage sinnvoller, einen Phenom II X6 zu ordern anstatt einen Bulldozer.

AMD Phenom II AMD Bulldozer Intel Sandy Bridge
    Core i7-2600K
4 Kerne + HT, 3.4 GHz (TM 3.8 GHz), 95W TDP
Listenpreis: 317 Dollar, Straßenpreis: ab 262 Euro
Performance-Index: 133%
    Core i7-2600
4 Kerne + HT, 3.4 GHz (TM 3.8 GHz), 95W TDP
Listenpreis: 294 Dollar, Straßenpreis: ab 247 Euro
Performance-Index: 133%
  FX-8150
8 Kerne, 3.6 GHz (TC 4.2 GHz), 125W TDP
Listenpreis: 245 Dollar, Straßenpreis: ab 229 Euro
Performance-Index: 100%
 
    Core i5-2500K
4 Kerne, 3.3 GHz (TM 3.7 GHz), 95W TDP
Listenpreis: 216 Dollar, Straßenpreis: ab 179 Euro
Performance-Index: 125%
Phenom II X6 1100T
6 Kerne, 3.3 GHz (TC 3.7 GHz), 125W TDP
Listenpreis: 205 Dollar, Straßenpreis: ab 161 Euro
Performance-Index: 94%
FX-8120
8 Kerne, 3.1 GHz (TC 4.0 GHz), 95/125W TDP
Listenpreis: 205 Dollar, Straßenpreis: ab 190 Euro
Performance-Index: ca. 90%
Core i5-2500
4 Kerne, 3.3 GHz (TM 3.7 GHz) 95W TDP
Listenpreis: 205 Dollar, Straßenpreis: ab 171 Euro
Performance-Index: 125%
Phenom II X6 1090T
6 Kerne, 3.2 GHz (TC 3.6 GHz), 125W TDP
Listenpreis: 185 Dollar, Straßenpreis: ab 144 Euro
Performance-Index: 92%
  Core i5-2400
4 Kerne, 3.1 GHz (TM 3.4 GHz), 95W TDP
Listenpreis: 184 Dollar, Straßenpreis: ab 154 Euro
Performance-Index: 118%
die zwei vorgenannten Phenom II X6 Modelle 1090T und 1100T sind mit freiem Multiplator ausgestattet, zudem ist eine Busübertaktung generell möglich; das Übertaktungspotential ist allerdings gering alle Bulldozer-Prozessoren sind mit freiem Multiplator ausgestattet, zudem ist eine Busübertaktung generell möglich; hohes Übertaktungspotential alle K-Modelle von Sandy Bridge sind mit freiem Multiplikator ausgestattet, eine Busübertaktung ist bei allen Modellen generell nicht möglich; hohes Übertaktungspotential
Sockel AM3 (und AM3+), Mainboards mit 8er und 9er Chipsätzen, Speichersupport bis offiziell DDR3/1333 Sockel AM3+ (und teilweise AM3), Mainboards mit 8er und 9er Chipsätzen, Speichersupport bis offiziell DDR3/1866 Sockel 1155, Mainboards mit 6er Chipsätzen, Speichersupport bis offiziell DDR3/1333

Auf dem Stand der Dinge – und selbst eingerechnet noch eine Anpassung der Bulldozer-Straßenpreise auf ein faires Niveau angesichts der Listenpreise – verzeichnet die Bulldozer-Architektur in der Summe aller Eigenschaften einen äußerst zähen Start. Hier und da wird es sicherlich Anwender aus dem semi-professionellen und professionellen Segment geben, deren Software unter Bulldozer besser läuft als unter gleichwertigen Intel-CPUs. Aber danach sieht es düster aus, gibt es kaum Ansatzpunkte für Bulldozer, wo Intel nicht schon besser ist. Intel muß gegenüber Bulldozer faktisch gar nichts antworten, vielmehr muß AMD umgehend die Bulldozer-Preise maßgeblich nach unten korrigieren, auf daß Bulldozer nicht gerade teurer als der Phenom II X6 daherkommt – dies sagt schon alles aus über die Gesamteinschätzung am heutigen Launchtag.

Primäres Problem von Bulldozer ist dabei der Punkt, daß ein auf hohe Taktraten ausgelegtes Prozessorendesign letztlich nicht auf Taktrate gebracht werden konnte. Sicherlich hat Bulldozer nett anzuschauende Taktraten zu bieten, aber gemäß der abgesenkten Pro/MHz-Leistung müsste Bulldozer mit deutlich mehr Taktrate kommen und war ursprünglich wohl auch auf ebensolcher geplant (angeblich 4.5 GHz ohne Turbo). Wenn AMD Bulldozer mit einer solchen Taktrate gestartet hätte, könnte das Design durchaus konkurrenzfähig sein – anstatt mit einem großem Vorteil bei der Pro/MHz-Power wie die Intel-Prozessoren dann eben mit einem großen Vorteil bei der Taktrate. Ironischerweise scheint das vorliegende Bulldozer-Design die benötigte Taktraten sogar liefern zu können – nur eben dann zu einer nicht mehr tragbaren Verlustleistung (Llano läßt grüßen).

Trotzdem muß die Frage aufgestellt werden, ob AMDs Ansatz des taktratenoptimierten Designs wirklich die beste Lösung war. Eine höhere Pro/MHz-Leistung von 30 Prozent zu erreichen, ist schweres Brot, aber mit viel Ingenieursarbeit doch irgendwie zu realisieren. Eine 30 Prozent höhere Taktrate ausgehend von ca. 3.5 GHz zu erzielen (Zieltaktrate demnach 4.5 GHz), hat das nicht vermeidbare Risiko, daß dies produktionstechnisch nicht herzustellen ist oder eben – wie aktuell bei Bulldozer – mit einer zu hohen Verlustleistung einhergeht. Vor allem aber benötigen weitere Performancesteigerungen dann immer utopischere Takraten – wenn AMD ausgehend von 4.5 GHz nochmals 30 Prozent oben drauf legen wollte, müsste man mit 6 GHz Takt rechnen, wofür heutige Schaltkreise sicherlich nicht ausgelegt sind. Intel hat nicht umsonst den Gedanken des Pentium 4 beerdigt, als man gesehen hat, daß die Taktraten immer schwindelerregende Höhen erreichen müssten, um noch deutlich mehr Performance herauskitzeln zu können.

Dummerweise ist Bulldozer der Start einer neuen Prozessoren-Architektur und AMD somit erst einmal in dieser Entwicklungsrichtung gefangen. Trotzdem sollten zukünftige Bulldozer-Updates sich in erster Linie um eine höhere Pro/MHz-Power kümmern, gerade da AMD für die nächsten Jahre an der 32nm-Fertigung bzw. der nur geringfügig besseren 28nm-Fertigung festhalten wird und die ganz großen Taktratensprünge daher eher unwahrscheinlich sind. Denkbar für die weitere Bulldozer-Entwicklung wäre zuerst eine Verbesserung der 32nm-Fertigung bei GlobalFoundries, wo dieselben Prozessoren zu einer niedrigeren Verlustleistung hergestellt werden können, womit AMD einige Top-Modelle mit höherem Takt herausbringen kann. Daneben sollte man einfache Anpassungen an der Architektur vornehmen, welche gewisse Flaschenhälse beseitigt – zumeist werden diesbezüglich die sehr klein bemessenen Level1-Caches und allgemein die gesamte Cache-Anbindung genannt.

Damit kann AMD innerhalb von zwei Entwicklungssprüngen (also bis zum Jahr 2013) sicherlich die jetzt fehlenden rund 30 Prozent Performance aus Bulldozer herausholen. Natürlich wird Intel zu diesem Zeitpunkt schon viel weiter sein, schon ab dem Frühling 2012 wird Intel die in 22nm gefertigten Ivy Bridge Prozessoren als Refresh-Architektur zu Sandy Bridge verkaufen und für den Anfang des Jahres 2014 steht mit Haswell dann sogar schon der nächste Architektur-Schritt bei Intel an. AMD ist im Performance- und HighEnd-Segment nun einmal rund zwei Jahre gegenüber Intel im Hintertreffen, die heute vorgestellte Bulldozer-Architektur ändert dies nicht, sondern zementiert diesen Zustand sogar noch.

Nachtrag vom 15. Oktober 2011

Beim Guru3D sowie bei Legion Hardware gibt es erste Artikel zur Performance der kleineren Bulldozer-Modelle – FX-8120, FX-6100, FX-4170 und FX-4100. Die Ergebnisse schwanken ein wenig zwischen diesen Tests und manches Resultat sieht auch unvereinbar mit anderen Benchmark-Ergebnissen aus, in der Relation sind die Ergebnisse aber dennoch klar: Die kleineren Bulldozer-Modelle mit weniger Rechenkernen verlieren ungewöhnlich viel Performance – viel deutlicher, als daß man dies bisher im Vergleich von Vierkern- zu Sechskern- und Achtkern-Prozessoren gewohnt war. Vom Performanceprofil her sieht der Vergleich zwischen Vierkern-Bulldozer und Achtkern-Bulldozer eher wie der Vergleich zwischen einem regulärem DualCore- und einem regulärem QuadCore-Prozessor aus, so viel Performanceabstand liegt bei Bulldozer dazwischen.

ComputerBase
Anwend./Spiele
HT4U
Anwend./Spiele
Guru3D
Anwendungen
Legion Hardware
Anwendungen
AMD A8-3850
4 Llano-Kerne, 2.9 GHz
63%/85% - 57% -
AMD FX-4100
4 Bulldozer-Kerne, 3.6 GHz + TC
- - 54% -
AMD FX-4170
4 Bulldozer-Kerne, 4.2 GHz + TC
- - - 67%
AMD FX-6100
6 Bulldozer-Kerne, 3.3 GHz + TC
- - 67% 87%
AMD FX-8120
8 Bulldozer-Kerne, 3.1 GHz + TC
- - 94% 95%
AMD FX-8150
8 Bulldozer-Kerne, 3.6 GHz + TC
100%/100% 100%/100% 100% 100%
AMD Phenom II X4 975
4 K10.5-Kerne, 3.6 GHz
73%/81% 98%/100% 70% -
AMD Phenom II X6 1100T
6 K10.5-Kerne, 3.3 GHz + TC
85%/90% 99%/102% 95% 78%
Intel Core i5-2300
4 Sandy-Bridge-Kerne, 2.8 GHz + TM
-/96% -/127% - -
Intel Core i5-2400
4 Sandy-Bridge-Kerne, 3.1 GHz + TM
98%/- 132%/- - -
Intel Core i5-2500K
4 Sandy-Bridge-Kerne, 3.3 GHz + TM
105%/111% 139%/144% 90% 99%
Intel Core i7-2600K
4 Sandy-Bridge-Kerne + HT, 3.4 GHz + TM
115%/124% 144%/148% 115% 113%

Oder anders formuliert: Im Anwendungsbereich benötigt Bulldozer auch wirklich seine acht Rechenkerne, um überhaupt auf Touren zu kommen, die Sechskern-Bulldozer und gerade die Vierkern-Bulldozer fallen deutlich ab. Besonders der Vierkern-Bulldozer FX-4100 (3.6 GHz) stellt dabei einige Negativrekorde in die falsche Richtung hin auf: Im Test von Guru3D war das beste Llano-Modell A8-3850 (2.9 GHz) sogar um 7 Prozent schneller – bei 700 MHz weniger Takt, fehlendem Level3-Cache und ohne TurboCore-Feature. So gesehen wäre AMD wohl wirklich besser damit gefahren, anstatt der Bulldozer-Kerne diejenigen von Llano zu nehmen, selbst jene in dieser Frage nicht berühmten Rechenkerne bringen es anscheinend auf ca. 30 Prozent (!) mehr Pro/MHz-Leistung gegenüber Bulldozer. Ein vakanter Punkt stellt allerdings noch die Spiele-Rohleistung der kleineren Bulldozer-Modelle dar, da es diesbezüglich derzeit noch keine Tests unter CPU-limitierten Settings gibt.

In der Theorie könnte hierbei ein FX-4170 (4.2 GHz) dank seines höheren Takts durchaus den FX-8150 (3.6 GHz) überholen – die höhere Kernanzahl bringt dem FX-8150 unter Spielen im Normalfall nichts und selbst CPU-limitierte Titel haben höchstselten gleich eine (nutzvolle) Achtkern-Optimierung zu bieten. Besser bedeutet in diesem Zusammenhang aber noch lange nicht "gut", denn auch der höhere Takt der Vierkern-Bulldozer wird den überdimensionalen Unterschied bei der Spiele-Rohleistung gegenüber Intel nur schwerlich aufholen können. Trotzdem wäre dies mal ein interessanter Test: Vierkern-Bulldozer – am besten eben den taktstarken FX-4170 (4.2 GHz) – gegen gleichpreisige Intel-Prozessoren, also den Core i3-2100 (3.1 GHz), welcher wegen seiner nur zwei Rechenkerne und ohne TurboMode-Feature eventuell doch durch den AMD-Prozessoren erreichbar ist.

Nachtrag vom 15. Dezember 2011

Noch nachzutragen wären zwei Testberichte seitens Hardwareluxx und von HT4U, welche sich mit der Performance der kleineren Bulldozer-Modelle FX-4100 und FX-6100 beschäftigt haben. Der FX-4100 verfügt über zwei Bulldozer-Module mit vier Rechenkernen auf 3.6 GHz Takt (unter TurboCore maximal 3.8 GHz), der FX-6100 über drei Bulldozer-Module mit sechs Rechenkernen auf 3.3 GHz Takt (unter TurboCore maximal 3.9 GHz). Dabei ist schon vor dem Test klar, daß diese Prozessoren aufgrund der generellen Bulldozer-Ausrichtung auf viele Rechenkerne unter Anwendungsprogrammen nicht gut mithalten werden können, denn dem FX-6100 fehlen immerhin ein Drittel und dem FX-4100 dann schon die Hälfte der Rechenkerne des Bulldozer-Spitzenmodells FX-8150 mit vier Bulldozer-Modulen und acht Rechenkernen auf 3.6 GHz Takt (unter TurboCore maximal 4.2 GHz).

Interessanter ist eher die Fragestellung, wie dies unter Spielen aussieht, welche höchst selten über gutklassige Unterstützung von drei oder vier Rechenkernen verfügen und fast niemals über gutklassige Unterstützung von mehr als vier Rechenkernen. In der Theorie sollte hier ein FX-4100 auf dem gleichem Takt wie ein FX-8150 nahezu dieselbe Performance erbringen – eben weil der FX-8150 seine Rechenkerne fünf bis acht kaum in Spielen zum Einsatz bringen kann. Und in der Tat funktioniert diese Theorie sogar teilweise: Der FX-8150 ist auf demselben Takt unter Spielen (LowQuality-Messungen seitens HT4U) nur 14 Prozent schneller als der FX-4100 mit der Hälfte der Rechenkerne – unter Applikationen liegt dieser Unterschied bei immerhin 37 Prozent. Zudem dürften dem FX-8150 in diesem Vergleich sein besserer TurboCore helfen: Zum einen ist der TurboCore-Takt höher, zum anderen kann der FX-8150 natürlich immerhin vier Rechenkerne auf den maximalen TurboCore-Takt hieven, der FX-4100 eben nur zwei.

Quelle: HT4U Applikationen Spiele (LowQuality)
AMD FX-8150
Bulldozer, 8C, 3.6 GHz (TurboCore max. 4.2 GHz)
137% 114%
AMD FX-6100
Bulldozer, 6C, 3.3 GHz (TurboCore max. 3.9 GHz)
112% 103%
AMD FX-4100
Bulldozer, 4C, 3.6 GHz (TurboCore max. 3.8 GHz)
100% 100%
AMD A8-3850
Llano, 4C, 2.9 GHz
92% 104%
AMD Phenom II X4 980
K10.5, 4C, 3.7 GHz
113% 120%
Intel Core i5-2300
Sandy Bridge, 4C, 2.8 GHz (TurboMode max. 3.1 GHz)
131% 145%
Intel Core i7-2700K
Sandy Bridge, 4C+HT, 3.4 GHz (TurboMode max. 3.8 GHz)
170% 169%

Während letzteres prinzipbedingt unänderbar ist, ist die Taktrate des TurboCore letztlich nur eine Festlegungssache – wenn AMD einen Vierkern-Bulldozer mit ansprechendem TurboCore-Takt herausbringt, kann dieser sicherlich bei unterhalb 10 Prozent Performancedifferenz zum FX-8150 unter Spielen liegen. Allerdings bleibt ein Problem weiterhin vorhanden: Im Gegensatz zu anderen Prozessoren sehen die Bulldozer-Benchmarks unter Spielen nach wie vor erschreckend schwach aus: Der FX-4100 schlägt trotz 3.6 GHz Takt noch nicht einmal einen Llano-basierten A8-3850 auf nur 2.9 GHz Takt, ein "alter" Phenom II X4 980 mit 3.7 GHz ist unter Spielen klar schneller als der FX-4100 und sogar minimal schneller als der FX-8150. Anstatt also den gegenüber den Intel-Prozessoren sowieso schon hohen Performanceabstand unter Spielen irgendwie zu reduzieren, legt AMDs Bulldozer-Architektur sogar noch einen größeren Performanceabstand hin

Wenn dies ausgerechnet in dem einzigen Feld passiert, wofür es im Heimanwender-Bereich noch breitere Leistungsanforderungen gibt (weil die Anwendungsperformance immer mehr zur theoretischen Größe wird, die wenigsten Anwender nutzen schließlich die heute gebotene Anwendungsperformance wirklich aus), macht den Fall um so tragischer. Daß die kleineren Bulldozer-Prozessoren dann sehr viel freundlicher beim Punkt der Stromaufnahme als die Achtkern-Bulldozer ausfallen, hilft letztlich auch nicht mehr wirklich weiter – ohne eine zeitgemäße Performance kann man schwerlich eine Empfehlung für diese Prozessoren aussprechen. AMD kann nur zusehen, so schnell wie möglich die nächste Bulldozer-Generation an den Start zu bringen (Trinity als Llano-Nachfolger im zweiten Quartal 2012, Vishera als Bulldozer-Nachfolger im dritten Quartal 2012), mit der originalen Bulldozer-Generation ist kein Blumentopf zu gewinnen.