Fast drei Jahre nach der offiziellen Ankündigung [2] bringt AMD heute mit Bulldozer eine regelrecht neue Prozessoren-Architektur für Performance- und HighEnd-Ansprüche in den Markt, welche die inzwischen altgediente K10.5-Architektur der Athlon-II- und Phenom-II-Prozessoren komplett ablösen und den Grundstein für die Mainstream-, Performance- und HighEnd-Prozessoren von AMD für die nächsten Jahre legen soll. Mittels Bulldozer bricht AMD deutlich mit dem Prinzip der K10.5-Prozessoren, deren Architektur sich über die nahe verwandeten K10-, K8- und K7-Modelle sogar bis ins Jahr 1999 zurückverfolgen läßt, und bringt erstmals seit über einer ganzen Dekade etwas grundsätzlich neues in diesem Marktsegment.
Die Marktsituation von AMD ist dabei ironischerweise gar nicht so viel anders wie beim seinerzeitigen Launch der K7-Architektur anno 1999: AMD war damals (mit den K6-Prozessoren) und ist heute (mit den Athlon-II- und Phenom-II-Prozessoren) deutlich zurückliegend gegenüber Intel, muß also mit der neuen Architektur einen deutlichen Schub bringen, um wieder mithalten zu können. Da so grundlegend neue Prozessoren-Architekturen nun auch nicht aller zwei Jahre vorgestellt werden, sondern – wie in diesem Fall zu sehen – durchaus auch einmal satte 12 Jahre benötigen, muß dieser Versuch zudem auch wenigstens grundsätzlich erfolgreich sein. Beim K7 (Athlon & Athlon XP) hatte AMD dies seinerzeit mit Bravour geschafft, bei Bulldozer wird man sehen müssen.
Das Grundprinzip der Bulldozer-Architektur stellen dabei die Rechenkerne in Modul-Bauweise [3] dar, welche deutlich von allem abweichen, was AMD und Intel bisher fabriziert haben. Dabei fasst AMD zwei Rechenkerne zu einem Bulldozer-Modul zusammen und bietet gewisse Ausführungseinheiten (Fließkomma-Einheit) und gewisse Pipeline-Schritte (Fetch-Einheit, Dekoder, Level1- und Level2-Caches) nur noch einfach an, shart diese Einheiten also zwischen den zwei Rechenkernen eines Bulldozer-Moduls.
Vom Betriebssystem werden dann natürlich zwei physikalische Rechenkerne pro Bulldozer-Modul erkannt, da die hierfür maßgeblich relevanten Integer-Recheneinheiten weiterhin doppelt vorliegen. Trotzdem ist das ganze ein gewisses Spardesign, da sich auf gleichem Takt (und gleicher Anzahl an Ausführungseinheiten) ein Bulldozer-Modul nicht mit einem regulär aufgebautem Zweikerner messen kann. AMD führt hiergegen als Argument ins Feld, daß der zweite Rechenkern im Bulldozer-Modul gerade einmal 12 Prozent mehr an Transistoren und 20 Prozent mehr an Chipfläche kostet, dafür aber gute 80 Prozent mehr Performance (unter auf Multithreading ausgelegten Anwendungen) einbringt.
Allerdings hat AMD auch innerhalb der Rechenkerne abgespeckt: Die durchaus mächtige Fließkomma-Einheit liegt wie gesagt nur einfach pro zwei Rechenkerne (pro einem Bulldozer-Modul) vor, die Integer-Einheit wurde gegenüber den bisherigen K7/K8/K10/K10.5-Designs um eine ALU-Einheit erleichtert, es werden damit maximal zwei Ops pro Takt und Kern erreicht. Damit liegt Bulldozer dann nicht nur gegenüber dem AMD-eigenem Vorgänger in Form der K10.5-basierten Prozessoren zurück, sondern auch gegenüber allen modernen Intel-Designs, wo es immer drei Integer-Einheiten pro Rechenkern gibt (maximal drei Ops pro Takt und Kern).
Jetzt ist natürlich fraglich, ob die dritte Integer-Einheit wirklich benötigt wird, wenn man davon ausgehen kann, daß heutige Prozessoren in der Praxis nur eine Auslastung von einer Ops pro Takt und Kern erreichen – effektiv ist die dritte Einheit angesichts dieser Ausgangslage augenscheinlich nicht. Aber: Wenn man eine hohe Pro/MHz-Performance anstrebt, dann sind auch solch eigentlich uneffektiven Einheiten wichtig, damit überall im Design noch das eine oder andere Prozent an mehr Rechenleistung pro Takt und Kern herausgeholt wird. Bulldozer bietet dagegen auch in dieser Frage ein ziemliches Spardesign: Sowohl die Anzahl der Ausführungseinheiten pro Rechenkern ist niedriger, der Level1-Cache kleiner und auch die Latenzen & Bandbreite der Level1- sowie Level2-Caches [5] weniger gut als bei früheren AMD-Designs und als bei Intel.
(alles pro Kern) | AMD K10.5 | AMD Bulldozer | Intel Sandy Bridge |
---|---|---|---|
Pipeline-Länge | 17 Stufen | deutlich mehr als 17 Stufen | weniger als 16 Stufen |
Dekoderkapazität | bis zu 3 Ops (drei komplexe) |
für zwei Kerne: bis zu 4 Ops (vier komplexe) |
bis zu 4 Ops (eine komplexe und drei einfache) |
Integer-Einheiten | 3x ALU, 2x L/S | 2x ALU, 2x L/S | 3x ALU, 2x L/S |
Fließkomma-Einheiten | 2+1 (ADD, MUL, MISC), max. 128 Bit Befehlsbreite | für zwei Kerne: 2xFMA, max. 256 Bit Befehlsbreite | 2+1 (ADD, MUL, MISC), max. 256 Bit Befehlsbreite |
Level1 Befehls-Cache | 64 kB, 2fach assoziativ, 256 Bit Bandbreite | für zwei Kerne: 64 kB, 2fach assoziativ | 32 kB, 8fach assoziativ |
Level1 Daten-Cache | 64 kB, 2fach assoziativ, 256 Bit Bandbreite | 16 kB, 4fach assoziativ | 32 kB, 8fach assoziativ |
Level2-Cache | 512 kB, 16fach assoziativ, 256 Bit Bandbreite | für zwei Kerne: 2 MB, 16fach assoziativ | 256 kB, 8fach assoziativ |
Level3-Cache | für vier/sechs Kerne: 6 MB, 48fach assoziativ | für acht Kerne: 8 MB, 64fach assoziativ | für vier Kerne: 6 MB, 12fach assoziativ |
Fertigung | Vierkerner: 0,758 Milliarden Transistoren auf 258mm² Die-Fläche in 45nm bei GlobalFoundries Sechskerner: 0,904 Milliarden Transistoren auf 346mm² Die-Fläche in 45nm bei GlobalFoundries |
Achtkerner: 1,2 Milliarden Transistoren auf 315mm² Die-Fläche in 32nm bei GlobalFoundries | Vierkerner: 1,16 Milliarden Transistoren auf 216mm² Die-Fläche in 32nm bei Intel |
Damit – und mit der auf deutlich über 17 Stufen verlängerten Pipeline (eine genaue Angabe bleibt AMD leider schuldig) – wird klar, in welche Richtung AMDs Bulldozer-Architektur ursächlich geht: Deutlich mehr Taktrate statt deutlich mehr Pro/MHz-Leistung. Dies ist etwas entgegen der vorherigen Erwartungen, welche aufgrund des hohen Rückstands der bisherigen AMD-Prozessoren in der Frage der Pro/MHz-Leistung deutliche Verbesserungen an genau dieser Stelle erwartet haben – aber nun gut, dies ist die Entscheidung von AMD.
Problematisch mt einem solchen Weg wird es aber immer, wenn man bei einem auf hohe Taktraten ausgelegtem Design dann nicht wirklich auf Taktrate kommt. Ausgehend von AMDs K10.5-Vierkerner und deren ca. 20 bis 30prozentigem Rückstand zu Intels Sandy Bridge bei der Pro/MHz-Leistung müsste AMD mit Bulldozer (bei angenommen gleicher Pro/MHz-Leistung wie beim K10.5, was angesichts der technischen Vorzeichen schwer erreichbar erscheint) dann mit ca. 30 Prozent mehr Takt gegenüber Sandy Bridge daherkommen, um diese Intel-Prozessoren zu erreichen. Dies wären immerhin ca. 4.5 GHz Takt (noch ohne jede Turbo-Modi), welchen Bulldozer derzeit allerdings nur im Übertaktungsbetrieb erreicht.
Takt | Technik | Preis | |
---|---|---|---|
FX-8150 | 3.6 GHz (TurboCore: 3.9/4.2 GHz) |
8 Kerne (4 Module), 8 MB Level2-Cache, 8 MB Level3-Cache, 2200 MHz Northbridge-Takt, DDR3/1866, 125 Watt TDP | 245$ ab 229 Euro [6] |
FX-8120 | 3.1 GHz (TurboCore: 3.4/4.0 GHz) |
8 Kerne (4 Module), 8 MB Level2-Cache, 8 MB Level3-Cache, 2200 MHz Northbridge-Takt, DDR3/1866, 95 und 125 Watt TDP | 205$ ab 190 Euro [7] |
FX-8100 | 2.8 GHz (TurboCore: 3.1/3.7 GHz) |
8 Kerne (4 Module), 8 MB Level2-Cache, 8 MB Level3-Cache, 2000 MHz Northbridge-Takt, DDR3/1866, 95 Watt TDP | ? (Release später) |
FX-6100 | 3.3 GHz (TurboCore: 3.6/3.9 GHz) |
6 Kerne (3 Module), 6 MB Level2-Cache, 8 MB Level3-Cache, 2000 MHz Northbridge-Takt, DDR3/1866, 95 Watt TDP | 165$ ab 162 Euro [8] |
FX-4170 | 4.2 GHz (TurboCore: 4.2/4.3 GHz) |
4 Kerne (2 Module), 4 MB Level2-Cache, 8 MB Level3-Cache, 2200 MHz Northbridge-Takt, DDR3/1866, 125 Watt TDP | ? (Release später) |
FX-B4150 | 3.8 GHz (TurboCore: 3.9/4.0 GHz) |
4 Kerne (2 Module), 4 MB Level2-Cache, 8 MB Level3-Cache, 2200 MHz Northbridge-Takt, DDR3/1866, 95 Watt TDP | ? (Release später) |
FX-4100 | 3.6 GHz (TurboCore: 3.7/3.8 GHz) |
4 Kerne (2 Module), 4 MB Level2-Cache, 8 MB Level3-Cache, 2000 MHz Northbridge-Takt, DDR3/1866, 95 Watt TDP | 115$ ab 114 Euro [9] |
Der erste TurboCore-Takt gibt den maximalen Takt unter Belastung aller Rechenkerne an, der zweite TurboCore-Takt den maximalen Takt unter Belastung der Hälfte der Rechenkerne. |
Bulldozer hat nun in der Realität der heutigen Benchmarks das Problem, daß nicht nur die benötigte Taktrate fehlt, sondern auch noch die Leistung pro Takt und Kern niedriger als beim Phenom II liegt – und zwar so viel niedriger, daß ein Achtkern-Bulldozer größtenteils seine doppelte Kernanzahl nur dafür benötigt, um überhaupt die Performance einer Vierkern-CPU der Phenom-II-Reihe zu erreichen. Würden wir heute Tests von Vierkern-Bulldozer-Prozessoren vorliegen haben, würde dieser Punkt noch augenscheinlicher werden – derzeit kann man dies nur aus den bisherigen Ergebnissen von Achtkern-Bulldozer-Prozessoren interpolieren.
CB: Applikationen | HT4U: Applikationen | CB: Spiele (LowQuality) | HT4U: Spiele (LowQuality) | |
---|---|---|---|---|
AMD FX-8150 8 Kerne, 3.6 GHz + TC |
100% | 100% | 100% | 100% |
AMD Phenom II X4 975 4 Kerne, 3.6 GHz |
73% | 81% | 98% | 101% |
AMD Phenom II X6 1100T 6 Kerne, 3.3 GHz + TC |
85% | 90% | 99% | 102% |
Intel Core i5-2300 4 Kerne, 2.8 GHz + TM |
96% | 127% | ||
Intel Core i5-2400 4 Kerne, 3.1 GHz + TM |
98% | 132% | ||
Intel Core i5-2500K 4 Kerne, 3.3 GHz + TM |
105% | 111% | 139% | 144% |
Intel Core i7-2600K 4 Kerne + HT, 3.4 GHz + TM |
115% | 124% | 144% | 148% |
Bulldozer hat gemäß dieser doch recht eindeutigen Benchmarks (welche sich durch viele andere der heutigen Testberichte bestätigen lassen) seinen klaren Stärken in der Anwendungs-Performance, wo ein FX-8150 gegenüber einem Core i5-2500K nur um 5 bis 10 Prozent zurückliegt. Je stärker sich dabei der Fokus auf Multimedia-Anwendungen verschiebt (welche üblicherweise über eine gute Multithreading-Unterstützung verfügen), um so besser kommt der FX-8150 weg – im Idealfall kann für ein reines Arbeitssystem mit starkem Einsatz von für Bulldozer passender Software der FX-8150 sogar die bessere Wahl gegenüber einem Core i7-2600K sein, welcher in der durchschnittlichen Anwendungsperformance ansonsten schon ganz gut mit 15 bis 25 Prozent vor dem FX-8150 rangiert.
Bei der Rohperformance unter Spielen (sprich unter LowQuality) sieht es dagegen desaströs aus für Bulldozer: Auf gleichem Takt ist ein vierkerniger Phenom II genauso schnell – genauso wie ein sechskerniger Phenom II mit etwas weniger Takt. Dabei hat der FX-8150 gerade im Vergleich mit dem Phenom II X4 975 auf 3.6 GHz Nominaltakt immerhin noch sein TurboCore-Feature. Nicht auszudenken, was hier herauskommt, wenn man einen Bulldozer-Vierkerner ohne TurboCore auf gleichem Nominaltakt gegen einen Phenom II X4 stellen würde – vermutlich würde Bulldozer in diesem Vergleich der reinen Rechenleistung pro Takt und Kern um 10 bis 20 Prozent hinter die alte K10.5-Architektur zurückfallen.
Sicherlich muß zu diesen LowQuality-Spielebenchmarks einschränkenderweise dazugesagt werden, daß unter Gamer-üblichen Settings mit hohen Auflösung und dem gleichzeitigem Einsatz von Anti-Aliasing die Benchmark-Resultate üblicherweise Grafikkarten-limitiert sind und dann zwischen Bulldozer und Sandy Bridge kein Unterschied mehr existiert. Die Rohperformance unter Spielen ist aber dennoch eine interessante Größe: Sie zeigt erstens an, was herauskommt, wenn kaum gut optimierbarer und oftmals auf nur wenige Rechenkerne ausgelegter Programmcode ausgeführt wird. Und zweitens haben diese Benchmark-Resultate natürlich auch eine praktische Bedeutung für CPU-limitierte Spiele und für Spiele mit einem gewissen Anteil an CPU-Limitierung.
In vielen Spielen ist es schließlich so, daß eine gewisse CPU-Leistungsklasse benötigt wurd, um gerade HighEnd-Grafikkarten bestmöglich ausfahren zu können – dafür eignet sich Bulldozer nun genauso wie die bisherigen AMD-Prozessoren überhaupt nicht. Mit einer Mainstream- oder Performance-Grafikkarte wird Bulldozer wohl keinen Unterschied ausmachen, aber wenn es um die perfekte CPU-Spieleunterstützung für eine HighEnd-Grafikkarte geht, kommen weiterhin nur Prozessoren von Intel in Frage.
Dies wirft Bulldozer für die Masse der Anwender – deren Leistungsbedarf nun einmal vorwiegend im Spielebereich zu suchen ist – maßgeblich zurück, viel mehr als Mainstream-Niveau ist für Bulldozer nicht drin. Damit wird auch die im HighEnd-Bereich eher verschmerzbar klar höhere Leistungsaufnahme von Bulldozer ein größeres Problem: Im Mainstream-Bereich benutzt man ungern CPUs, die ihre TDP von 125 Watt auch wirklich ausreizen (und anscheinend sogar noch ein Quentchen mehr [10] verbrauchen als spezifiziert) – vor allem dann, wenn die Konkurrenz ihre TDP von 95 Watt klar unterbietet und reale Vorteile von zwischen 75 und 85 Watt (!) bei der Leistungsaufnahme des kompletten Systems unter Volllast offeriert (75 bis 85 Watt zwischen Systemen mit Core i5-2500K und FX-8150, bei kleineren Modellen wird diese Differenz geringer sein).
Selbst mit Übertaktung kann AMD letztlich nichts ändern bzw. geht diese Rechnung eher ins Gegenteil auf: Zwar sind die Bulldozer-Modelle durchgehend ungelockt, während bei Intel hierfür im passenden Preisbereich nur der Core i5-2500K zur Verfügung steht. Dafür ist der relative Übertaktungsgewinn bei Intel sogar etwas besser als bei AMD, selbst wenn Bulldozer die nominell höheren Taktraten (nahe 5 GHz) erreicht. Ein gewisser Vorteil ergibt sich zugunsten von Bulldozer nur bei den kleineren Modellen, wo Bulldozer seine durchgehende Übertaktungsfähigkeit hat und Intel im selben Preisbereich keine K-Modelle offeriert. Dies ist aber die einzige Schiene, wo AMD mit Bulldozer heute einen klaren Vorteil bietet.
Ansonsten sind alle Vorteile bei Intel zu sehen: Die ausgewogenere Gesamtperformance (für den Normalanwender oder Spieler), die niedrigere Verlustleistung, die klar höhere Singlethread-Leistung, die höheren relativen Taktreserven (unter normaler Kühlung) sprechen für Sandy Bridge, für Bulldozer dagegen nur die Übertaktfähigkeiten der kleineren Modelle und die Aufrüstmöglichkeit zugunsten bestehender Systeme mit den Sockeln AM3 und AM3+. Dafür verlangt AMD derzeit einen Preis, welcher eher unpassend ist, vergleicht man gerade die Performance zwischen Bulldozer und Phenom II Prozessoren – ironischerweise wäre es zur aktuellen Preislage sinnvoller, einen Phenom II X6 zu ordern anstatt einen Bulldozer.
AMD Phenom II | AMD Bulldozer | Intel Sandy Bridge |
---|---|---|
Core i7-2600K 4 Kerne + HT, 3.4 GHz (TM 3.8 GHz), 95W TDP Listenpreis: 317 Dollar, Straßenpreis: ab 262 Euro [13] Performance-Index: 133% |
||
Core i7-2600 4 Kerne + HT, 3.4 GHz (TM 3.8 GHz), 95W TDP Listenpreis: 294 Dollar, Straßenpreis: ab 247 Euro [14] Performance-Index: 133% |
||
FX-8150 8 Kerne, 3.6 GHz (TC 4.2 GHz), 125W TDP Listenpreis: 245 Dollar, Straßenpreis: ab 229 Euro [6] Performance-Index: 100% |
||
Core i5-2500K 4 Kerne, 3.3 GHz (TM 3.7 GHz), 95W TDP Listenpreis: 216 Dollar, Straßenpreis: ab 179 Euro [15] Performance-Index: 125% |
||
Phenom II X6 1100T 6 Kerne, 3.3 GHz (TC 3.7 GHz), 125W TDP Listenpreis: 205 Dollar, Straßenpreis: ab 161 Euro [16] Performance-Index: 94% |
FX-8120 8 Kerne, 3.1 GHz (TC 4.0 GHz), 95/125W TDP Listenpreis: 205 Dollar, Straßenpreis: ab 190 Euro [7] Performance-Index: ca. 90% |
Core i5-2500 4 Kerne, 3.3 GHz (TM 3.7 GHz) 95W TDP Listenpreis: 205 Dollar, Straßenpreis: ab 171 Euro [17] Performance-Index: 125% |
Phenom II X6 1090T 6 Kerne, 3.2 GHz (TC 3.6 GHz), 125W TDP Listenpreis: 185 Dollar, Straßenpreis: ab 144 Euro [18] Performance-Index: 92% |
Core i5-2400 4 Kerne, 3.1 GHz (TM 3.4 GHz), 95W TDP Listenpreis: 184 Dollar, Straßenpreis: ab 154 Euro [19] Performance-Index: 118% |
|
die zwei vorgenannten Phenom II X6 Modelle 1090T und 1100T sind mit freiem Multiplator ausgestattet, zudem ist eine Busübertaktung generell möglich; das Übertaktungspotential ist allerdings gering | alle Bulldozer-Prozessoren sind mit freiem Multiplator ausgestattet, zudem ist eine Busübertaktung generell möglich; hohes Übertaktungspotential | alle K-Modelle von Sandy Bridge sind mit freiem Multiplikator ausgestattet, eine Busübertaktung ist bei allen Modellen generell nicht möglich; hohes Übertaktungspotential |
Sockel AM3 (und AM3+), Mainboards mit 8er und 9er Chipsätzen, Speichersupport bis offiziell DDR3/1333 | Sockel AM3+ (und teilweise AM3), Mainboards mit 8er und 9er Chipsätzen, Speichersupport bis offiziell DDR3/1866 | Sockel 1155, Mainboards mit 6er Chipsätzen, Speichersupport bis offiziell DDR3/1333 |
Auf dem Stand der Dinge – und selbst eingerechnet noch eine Anpassung der Bulldozer-Straßenpreise auf ein faires Niveau angesichts der Listenpreise – verzeichnet die Bulldozer-Architektur in der Summe aller Eigenschaften einen äußerst zähen Start. Hier und da wird es sicherlich Anwender aus dem semi-professionellen und professionellen Segment geben, deren Software unter Bulldozer besser läuft als unter gleichwertigen Intel-CPUs. Aber danach sieht es düster aus, gibt es kaum Ansatzpunkte für Bulldozer, wo Intel nicht schon besser ist. Intel muß gegenüber Bulldozer faktisch gar nichts antworten, vielmehr muß AMD umgehend die Bulldozer-Preise maßgeblich nach unten korrigieren, auf daß Bulldozer nicht gerade teurer als der Phenom II X6 daherkommt – dies sagt schon alles aus über die Gesamteinschätzung am heutigen Launchtag.
Primäres Problem von Bulldozer ist dabei der Punkt, daß ein auf hohe Taktraten ausgelegtes Prozessorendesign letztlich nicht auf Taktrate gebracht werden konnte. Sicherlich hat Bulldozer nett anzuschauende Taktraten zu bieten, aber gemäß der abgesenkten Pro/MHz-Leistung müsste Bulldozer mit deutlich mehr Taktrate kommen und war ursprünglich wohl auch auf ebensolcher geplant (angeblich 4.5 GHz ohne Turbo). Wenn AMD Bulldozer mit einer solchen Taktrate gestartet hätte, könnte das Design durchaus konkurrenzfähig sein – anstatt mit einem großem Vorteil bei der Pro/MHz-Power wie die Intel-Prozessoren dann eben mit einem großen Vorteil bei der Taktrate. Ironischerweise scheint das vorliegende Bulldozer-Design die benötigte Taktraten sogar liefern zu können – nur eben dann zu einer nicht mehr tragbaren Verlustleistung (Llano läßt grüßen).
Trotzdem muß die Frage aufgestellt werden, ob AMDs Ansatz des taktratenoptimierten Designs wirklich die beste Lösung war. Eine höhere Pro/MHz-Leistung von 30 Prozent zu erreichen, ist schweres Brot, aber mit viel Ingenieursarbeit doch irgendwie zu realisieren. Eine 30 Prozent höhere Taktrate ausgehend von ca. 3.5 GHz zu erzielen (Zieltaktrate demnach 4.5 GHz), hat das nicht vermeidbare Risiko, daß dies produktionstechnisch nicht herzustellen ist oder eben – wie aktuell bei Bulldozer – mit einer zu hohen Verlustleistung einhergeht. Vor allem aber benötigen weitere Performancesteigerungen dann immer utopischere Takraten – wenn AMD ausgehend von 4.5 GHz nochmals 30 Prozent oben drauf legen wollte, müsste man mit 6 GHz Takt rechnen, wofür heutige Schaltkreise sicherlich nicht ausgelegt sind. Intel hat nicht umsonst den Gedanken des Pentium 4 beerdigt, als man gesehen hat, daß die Taktraten immer schwindelerregende Höhen erreichen müssten, um noch deutlich mehr Performance herauskitzeln zu können.
Dummerweise ist Bulldozer der Start einer neuen Prozessoren-Architektur und AMD somit erst einmal in dieser Entwicklungsrichtung gefangen. Trotzdem sollten zukünftige Bulldozer-Updates sich in erster Linie um eine höhere Pro/MHz-Power kümmern, gerade da AMD für die nächsten Jahre an der 32nm-Fertigung bzw. der nur geringfügig besseren 28nm-Fertigung festhalten wird und die ganz großen Taktratensprünge daher eher unwahrscheinlich sind. Denkbar für die weitere Bulldozer-Entwicklung wäre zuerst eine Verbesserung der 32nm-Fertigung bei GlobalFoundries, wo dieselben Prozessoren zu einer niedrigeren Verlustleistung hergestellt werden können, womit AMD einige Top-Modelle mit höherem Takt herausbringen kann. Daneben sollte man einfache Anpassungen an der Architektur vornehmen, welche gewisse Flaschenhälse beseitigt – zumeist werden diesbezüglich die sehr klein bemessenen Level1-Caches und allgemein die gesamte Cache-Anbindung genannt.
Damit kann AMD innerhalb von zwei Entwicklungssprüngen (also bis zum Jahr 2013) sicherlich die jetzt fehlenden rund 30 Prozent Performance aus Bulldozer herausholen. Natürlich wird Intel zu diesem Zeitpunkt schon viel weiter sein, schon ab dem Frühling 2012 wird Intel die in 22nm gefertigten Ivy Bridge [20] Prozessoren als Refresh-Architektur zu Sandy Bridge verkaufen und für den Anfang des Jahres 2014 steht mit Haswell [21] dann sogar schon der nächste Architektur-Schritt bei Intel an. AMD ist im Performance- und HighEnd-Segment nun einmal rund zwei Jahre gegenüber Intel im Hintertreffen, die heute vorgestellte Bulldozer-Architektur ändert dies nicht, sondern zementiert diesen Zustand sogar noch.
Nachtrag vom 15. Oktober 2011
Beim Guru3D [35] sowie bei Legion Hardware [36] gibt es erste Artikel zur Performance der kleineren Bulldozer-Modelle – FX-8120, FX-6100, FX-4170 und FX-4100. Die Ergebnisse schwanken ein wenig zwischen diesen Tests und manches Resultat sieht auch unvereinbar mit anderen Benchmark-Ergebnissen aus, in der Relation sind die Ergebnisse aber dennoch klar: Die kleineren Bulldozer-Modelle mit weniger Rechenkernen verlieren ungewöhnlich viel Performance – viel deutlicher, als daß man dies bisher im Vergleich von Vierkern- zu Sechskern- und Achtkern-Prozessoren gewohnt war. Vom Performanceprofil her sieht der Vergleich zwischen Vierkern-Bulldozer und Achtkern-Bulldozer eher wie der Vergleich zwischen einem regulärem DualCore- und einem regulärem QuadCore-Prozessor aus, so viel Performanceabstand liegt bei Bulldozer dazwischen.
ComputerBase Anwend./Spiele |
HT4U Anwend./Spiele |
Guru3D Anwendungen |
Legion Hardware Anwendungen |
|
---|---|---|---|---|
AMD A8-3850 4 Llano-Kerne, 2.9 GHz |
63%/85% | - | 57% | - |
AMD FX-4100 4 Bulldozer-Kerne, 3.6 GHz + TC |
- | - | 54% | - |
AMD FX-4170 4 Bulldozer-Kerne, 4.2 GHz + TC |
- | - | - | 67% |
AMD FX-6100 6 Bulldozer-Kerne, 3.3 GHz + TC |
- | - | 67% | 87% |
AMD FX-8120 8 Bulldozer-Kerne, 3.1 GHz + TC |
- | - | 94% | 95% |
AMD FX-8150 8 Bulldozer-Kerne, 3.6 GHz + TC |
100%/100% | 100%/100% | 100% | 100% |
AMD Phenom II X4 975 4 K10.5-Kerne, 3.6 GHz |
73%/81% | 98%/100% | 70% | - |
AMD Phenom II X6 1100T 6 K10.5-Kerne, 3.3 GHz + TC |
85%/90% | 99%/102% | 95% | 78% |
Intel Core i5-2300 4 Sandy-Bridge-Kerne, 2.8 GHz + TM |
-/96% | -/127% | - | - |
Intel Core i5-2400 4 Sandy-Bridge-Kerne, 3.1 GHz + TM |
98%/- | 132%/- | - | - |
Intel Core i5-2500K 4 Sandy-Bridge-Kerne, 3.3 GHz + TM |
105%/111% | 139%/144% | 90% | 99% |
Intel Core i7-2600K 4 Sandy-Bridge-Kerne + HT, 3.4 GHz + TM |
115%/124% | 144%/148% | 115% | 113% |
Oder anders formuliert: Im Anwendungsbereich benötigt Bulldozer auch wirklich seine acht Rechenkerne, um überhaupt auf Touren zu kommen, die Sechskern-Bulldozer und gerade die Vierkern-Bulldozer fallen deutlich ab. Besonders der Vierkern-Bulldozer FX-4100 (3.6 GHz) stellt dabei einige Negativrekorde in die falsche Richtung hin auf: Im Test von Guru3D war das beste Llano-Modell A8-3850 (2.9 GHz) sogar um 7 Prozent schneller – bei 700 MHz weniger Takt, fehlendem Level3-Cache und ohne TurboCore-Feature. So gesehen wäre AMD wohl wirklich besser damit gefahren, anstatt der Bulldozer-Kerne diejenigen von Llano zu nehmen, selbst jene in dieser Frage nicht berühmten Rechenkerne bringen es anscheinend auf ca. 30 Prozent (!) mehr Pro/MHz-Leistung gegenüber Bulldozer. Ein vakanter Punkt stellt allerdings noch die Spiele-Rohleistung der kleineren Bulldozer-Modelle dar, da es diesbezüglich derzeit noch keine Tests unter CPU-limitierten Settings gibt.
In der Theorie könnte hierbei ein FX-4170 (4.2 GHz) dank seines höheren Takts durchaus den FX-8150 (3.6 GHz) überholen – die höhere Kernanzahl bringt dem FX-8150 unter Spielen im Normalfall nichts und selbst CPU-limitierte Titel haben höchstselten gleich eine (nutzvolle) Achtkern-Optimierung zu bieten. Besser bedeutet in diesem Zusammenhang aber noch lange nicht "gut", denn auch der höhere Takt der Vierkern-Bulldozer wird den überdimensionalen Unterschied bei der Spiele-Rohleistung gegenüber Intel nur schwerlich aufholen können. Trotzdem wäre dies mal ein interessanter Test: Vierkern-Bulldozer – am besten eben den taktstarken FX-4170 (4.2 GHz) – gegen gleichpreisige Intel-Prozessoren, also den Core i3-2100 (3.1 GHz), welcher wegen seiner nur zwei Rechenkerne und ohne TurboMode-Feature eventuell doch durch den AMD-Prozessoren erreichbar ist.
Nachtrag vom 15. Dezember 2011
Noch nachzutragen wären zwei Testberichte seitens Hardwareluxx [37] und von HT4U [38], welche sich mit der Performance der kleineren Bulldozer-Modelle FX-4100 und FX-6100 beschäftigt haben. Der FX-4100 verfügt über zwei Bulldozer-Module mit vier Rechenkernen auf 3.6 GHz Takt (unter TurboCore maximal 3.8 GHz), der FX-6100 über drei Bulldozer-Module mit sechs Rechenkernen auf 3.3 GHz Takt (unter TurboCore maximal 3.9 GHz). Dabei ist schon vor dem Test klar, daß diese Prozessoren aufgrund der generellen Bulldozer-Ausrichtung auf viele Rechenkerne unter Anwendungsprogrammen nicht gut mithalten werden können, denn dem FX-6100 fehlen immerhin ein Drittel und dem FX-4100 dann schon die Hälfte der Rechenkerne des Bulldozer-Spitzenmodells FX-8150 mit vier Bulldozer-Modulen und acht Rechenkernen auf 3.6 GHz Takt (unter TurboCore maximal 4.2 GHz).
Interessanter ist eher die Fragestellung, wie dies unter Spielen aussieht, welche höchst selten über gutklassige Unterstützung von drei oder vier Rechenkernen verfügen und fast niemals über gutklassige Unterstützung von mehr als vier Rechenkernen. In der Theorie sollte hier ein FX-4100 auf dem gleichem Takt wie ein FX-8150 nahezu dieselbe Performance erbringen – eben weil der FX-8150 seine Rechenkerne fünf bis acht kaum in Spielen zum Einsatz bringen kann. Und in der Tat funktioniert diese Theorie sogar teilweise: Der FX-8150 ist auf demselben Takt unter Spielen (LowQuality-Messungen seitens HT4U [39]) nur 14 Prozent schneller als der FX-4100 mit der Hälfte der Rechenkerne – unter Applikationen liegt dieser Unterschied bei immerhin 37 Prozent. Zudem dürften dem FX-8150 in diesem Vergleich sein besserer TurboCore helfen: Zum einen ist der TurboCore-Takt höher, zum anderen kann der FX-8150 natürlich immerhin vier Rechenkerne auf den maximalen TurboCore-Takt hieven, der FX-4100 eben nur zwei.
Quelle: HT4U [38] | Applikationen | Spiele (LowQuality) |
---|---|---|
AMD FX-8150 Bulldozer, 8C, 3.6 GHz (TurboCore max. 4.2 GHz) |
137% | 114% |
AMD FX-6100 Bulldozer, 6C, 3.3 GHz (TurboCore max. 3.9 GHz) |
112% | 103% |
AMD FX-4100 Bulldozer, 4C, 3.6 GHz (TurboCore max. 3.8 GHz) |
100% | 100% |
AMD A8-3850 Llano, 4C, 2.9 GHz |
92% | 104% |
AMD Phenom II X4 980 K10.5, 4C, 3.7 GHz |
113% | 120% |
Intel Core i5-2300 Sandy Bridge, 4C, 2.8 GHz (TurboMode max. 3.1 GHz) |
131% | 145% |
Intel Core i7-2700K Sandy Bridge, 4C+HT, 3.4 GHz (TurboMode max. 3.8 GHz) |
170% | 169% |
Während letzteres prinzipbedingt unänderbar ist, ist die Taktrate des TurboCore letztlich nur eine Festlegungssache – wenn AMD einen Vierkern-Bulldozer mit ansprechendem TurboCore-Takt herausbringt, kann dieser sicherlich bei unterhalb 10 Prozent Performancedifferenz zum FX-8150 unter Spielen liegen. Allerdings bleibt ein Problem weiterhin vorhanden: Im Gegensatz zu anderen Prozessoren sehen die Bulldozer-Benchmarks unter Spielen nach wie vor erschreckend schwach aus: Der FX-4100 schlägt trotz 3.6 GHz Takt noch nicht einmal einen Llano-basierten A8-3850 auf nur 2.9 GHz Takt, ein "alter" Phenom II X4 980 mit 3.7 GHz ist unter Spielen klar schneller als der FX-4100 und sogar minimal schneller als der FX-8150. Anstatt also den gegenüber den Intel-Prozessoren sowieso schon hohen Performanceabstand unter Spielen irgendwie zu reduzieren, legt AMDs Bulldozer-Architektur sogar noch einen größeren Performanceabstand hin
Wenn dies ausgerechnet in dem einzigen Feld passiert, wofür es im Heimanwender-Bereich noch breitere Leistungsanforderungen gibt (weil die Anwendungsperformance immer mehr zur theoretischen Größe wird, die wenigsten Anwender nutzen schließlich die heute gebotene Anwendungsperformance wirklich aus), macht den Fall um so tragischer. Daß die kleineren Bulldozer-Prozessoren dann sehr viel freundlicher beim Punkt der Stromaufnahme als die Achtkern-Bulldozer ausfallen, hilft letztlich auch nicht mehr wirklich weiter – ohne eine zeitgemäße Performance kann man schwerlich eine Empfehlung für diese Prozessoren aussprechen. AMD kann nur zusehen, so schnell wie möglich die nächste Bulldozer-Generation [40] an den Start zu bringen (Trinity als Llano-Nachfolger im zweiten Quartal 2012, Vishera als Bulldozer-Nachfolger im dritten Quartal 2012), mit der originalen Bulldozer-Generation ist kein Blumentopf zu gewinnen.
Verweise:
[1] http://www.3dcenter.org/users/leonidas
[2] http://www.3dcenter.org/news/2009-11-12
[3] http://www.3dcenter.org/artikel/amd-bulldozer-rechenkerne-modul-bauweise
[4] http://www.3dcenter.org/abbildung/amd-bulldozer-zweikern-modul
[5] http://ht4u.net/reviews/2011/amd_bulldozer_fx_prozessoren/index13.php
[6] http://www.preisroboter.de/search.php?search=FX-8150
[7] http://www.preisroboter.de/search.php?search=FX-8120
[8] http://www.preisroboter.de/search.php?search=FX-6100
[9] http://www.preisroboter.de/search.php?search=FX-4100
[10] http://ht4u.net/reviews/2011/amd_bulldozer_fx_prozessoren/index24.php
[11] http://www.forum-3dcenter.org/vbulletin/showthread.php?t=515528
[12] http://www.3dcenter.org/artikel/launch-analyse-amd-bulldozer
[13] http://www.preisroboter.de/search.php?search=Core+i7-2600K
[14] http://www.preisroboter.de/search.php?search=Core+i7-2600
[15] http://www.preisroboter.de/search.php?search=Core+i5-2500K
[16] http://www.preisroboter.de/search.php?search=Phenom+II+X6+1100T
[17] http://www.preisroboter.de/search.php?search=Core+i5-2500
[18] http://www.preisroboter.de/search.php?search=Phenom+II+X6+1090T
[19] http://www.preisroboter.de/search.php?search=Core+i5-2400
[20] http://www.3dcenter.org/news/intel-ivy-bridge
[21] http://www.3dcenter.org/news/intel-haswell
[22] http://www.computerbase.de/artikel/prozessoren/2011/test-amd-bulldozer/
[23] http://www.hardwareluxx.de/index.php/artikel/hardware/prozessoren/20127-bulldozer-amd-fx-8150.html
[24] http://hartware.net/review_1396.html
[25] http://ht4u.net/reviews/2011/amd_bulldozer_fx_prozessoren/
[26] http://www.pcgameshardware.de/aid,848744/Test-Bulldozer-FX-8150-Gelungenes-Comeback-fuer-AMD/CPU/Test/
[27] http://www.planet3dnow.de/vbulletin/showthread.php?t=399114
[28] http://www.planet3dnow.de/vbulletin/showthread.php?t=399118
[29] http://www.anandtech.com/show/4955/the-bulldozer-review-amd-fx8150-tested
[30] http://hothardware.com/Reviews/AMD-FX8150-8Core-Processor-Review-Bulldozer-Has-Landed/
[31] http://www.lostcircuits.com/mambo//index.php?option=com_content&task=view&id=102&Itemid=42
[32] http://techreport.com/articles.x/21813
[33] http://vr-zone.com/articles/amd-fx-8150-cpu-overclocking-review-a-bulldozer-for-gamers-/13694.html
[34] http://www.hardware.fr/articles/842-1/amd-fx-8150-fx-6100-bulldozer-debarque-am3.html
[35] http://www.guru3d.com/article/amd-fx-8150--8120-6100-and-4100-performance-review/
[36] http://www.legionhardware.com/articles_pages/amd_fx_8150fx_8120fx_6100_and_fx_4170,1.html
[37] http://www.hardwareluxx.de/index.php/artikel/hardware/prozessoren/20405-test-amd-fx-6100-und-fx-4100.html
[38] http://ht4u.net/reviews/2011/amd_fx_6100_4100_review/
[39] http://ht4u.net/reviews/2011/amd_fx_6100_4100_review/index31.php
[40] http://www.3dcenter.org/news/amd-bulldozer-2
[41] http://www.3dcenter.org/artikel/launch-analyse-amd-bulldozer/launch-analyse-amd-bulldozer-seite-2