Launch-Analyse: AMD Llano (Nachträge)

Mittwoch, 15. Juni 2011
 / von Leonidas
 

Nachtrag vom 18. Juni 2011

HT4U vermelden erste Preislistungen von Desktop-Llanos in den USA, welche die Vermutung einer eher günstigen Preissituation bei Llano deutlich untermauern. So wird das schnellste Desktop-Modell in Form des A8-3850 mit vier Rechenkernen auf 2.9 GHz und integrierter Radeon HD 6550D derzeit für 142 Dollar angeboten, in Euroland wären dies mit der (in den USA üblicherweise weggelassenen) Mehrwertsteuer ca. 119 Euro und damit etwas mehr als das Preisniveau des Core i3-2120 (ab 111 Euro). Der A6-3650 mit vier Rechenkernen auf 2.6 GHz und integrierter Radeon HD 6530D steht dagegen für 122 Dollar (ca. 102 Euro) zum Verkauf, etwas mehr als bei Intels Core i3-2100 (ab 91 Euro). Mit einer echten Marktverfügbarkeit ab Anfang Juli dürften die Preise der Llano-Prozessoren dann wohl noch ein wenig nachgeben, so daß danach von einem vermutlich ähnlichen Preisniveau gesprochen werden kann.

AMD Llano Intel Sandy Bridge
A8-3850
4 Kerne, 2.9 GHz, CPU-Performance = 100%
Radeon HD 6550D (400 SE) @ 600 MHz, GPU-Performance = 100%
100 Watt TDP
Vorlaunchpreis 119 Euro, DDR3/1866-Speicher, tendentiell etwas billigere Mainboards Core i3-2120
2 Kerne + HyperThreading, 3.3 GHz, CPU-Performance = 121%
HD Graphics 2000 (6 SE) @ 850 MHz (TurboMode @ 1100 MHz), GPU-Performance = 40%
65 Watt TDP
CPU ab 111 Euro, DDR3/1333-Speicher, tendentiell etwas teurere Mainboards
A8-3800
4 Kerne, 2.4 GHz (TurboCore max. 2.7 GHz), CPU-Performance = ca. 90%
Radeon HD 6550D (400 SE) @ 600 MHz, GPU-Performance = 100%
65 Watt TDP
CPU-Preis noch unbekannt, DDR3/1866-Speicher, tendentiell etwas billigere Mainboards
A6-3650
4 Kerne, 2.6 GHz, CPU-Performance = ca. 90%
Radeon HD 6530D (320 SE) @ 443 MHz, GPU-Performance = ca. 70%
100 Watt TDP
Vorlaunchpreis 102 Euro, DDR3/1866-Speicher, tendentiell etwas billigere Mainboards Core i3-2100
2 Kerne + HyperThreading, 3.1 GHz, CPU-Performance = 115%
HD Graphics 2000 (6 SE) @ 850 MHz (TurboMode @ 1100 MHz), GPU-Performance = 40%
65 Watt TDP
CPU ab 91 Euro, DDR3/1333-Speicher, tendentiell etwas teurere Mainboards
A6-3600
4 Kerne, 2.1 GHz (TurboCore max. 2.4 GHz), CPU-Performance = ca. 80%
Radeon HD 6530D (320 SE) @ 443 MHz, GPU-Performance = ca. 70%
65 Watt TDP
CPU-Preis noch unbekannt, DDR3/1866-Speicher, tendentiell etwas billigere Mainboards
Pentium G850
2 Kerne, 2.9 GHz, CPU-Performance = ca. 90%
HD Graphics 2000 (6 SE) @ 850 MHz (TurboMode @ 1100 MHz), GPU-Performance = 40%
65 Watt TDP
CPU ab 72 Euro, DDR3/1333-Speicher, tendentiell etwas teurere Mainboards
CPU- und GPU-Performanceangaben sind grobe Werte, als Index=100% wurde der A8-3850 sowohl bei der CPU- als auch der GPU-Performance festgesetzt

Damit relativiert sich auch die schwächere CPU-Leistung von AMDs Llano-Architektur, denn ein A8-3850 liegt diesbezüglich nur ca. 15 Prozent hinter einem Core i3-2100 zurück, was grob betrachtet kein relevanter Unterschied mehr ist und durch die deutlich bessere Grafikperformance wieder aufgehoben wird. Einen deutlichen Nachteil haben die beiden genannten AMD-CPUs allerdings bei der Verlustleistungs-Klasse: Intels Core i3-21xx Prozessoren laufen unter 65 Watt TDP und dürften in der Realität weit weniger als diese grobe Klasseneinteilung verbrauchen, während A8-3850 und A6-3650 gleich mit einer TDP von 100 Watt antreten (auch wenn der Real-Verbrauch doch weniger sein wird). Interessanter in AMDs Llano-Portfolio ist daher vielleicht der A8-3800 mit nur 65 Watt TDP, welcher die gleiche Grafikeinheit wie der A8-3850 und einen nur etwas niedrigeren CPU-Takt aufweist (nominell 2.4 GHz, im TurboCore maximal 2.7 GHz).

Nachtrag vom 30. Juni 2011

Mit dem Donnerstag hat AMD nun auch seine Desktop-Llanos offiziell vorgestellt – doch mittels des Launchs der Mobile-Llanos vor zwei Wochen und einiger Vorab-Tests war allerdings das meiste schon bekannt und bringen die neuen Benchmarks fast nur noch eine Bestätigung des schon erarbeiteten Performance-Bilds. So gab es keine Überraschungen bei der CPU- und GPU-Performance der Desktop-Modelle: Die CPU-Performance wird weiterhin als arg durchschnittlich auf dem Niveau gleich getakteter Athlon II & Phenom II Prozessoren angesehen – mit dem Problem allerdings, daß diese früheren AMD-Prozessoren teils klar höhere Taktraten erreichen und Llano somit in der Summe aus Pro/MHz-Leistung und Taktrate sogar noch hinter Athlon II und Phenom II zurückliegt. Am Ende kommt Llanos schnellstes Modell in Form des Vierkerners A8-3850 gerade einmal auf dieselbe CPU-Performance wie der Zweikerner Core i3-2100 aus der Sandy-Bridge-Generation von Intel – und dies ist ein Prozessor mit einem Preispunkt von unter 100 Euro.

  Technik integrierte Grafik TDP Preis
A8-3850 4 Rechenkerne, 4 MB Level2-Cache insgesamt, 2.9 GHz (kein TurboCore), bis DDR3/1866, Sockel FM1 Radeon HD 6550D mit 400 Shader-Einheiten, 20 TMUs und 8 ROPs @ 600 MHz 100W 135$
A8-3800 4 Rechenkerne, 4 MB Level2-Cache insgesamt, 2.4 GHz (TurboCore max. 2.7 GHz), bis DDR3/1866, Sockel FM1 Radeon HD 6550D mit 400 Shader-Einheiten, 20 TMUs und 8 ROPs @ 600 MHz 65W  
A6-3650 4 Rechenkerne, 4 MB Level2-Cache insgesamt, 2.6 GHz (kein TurboCore), bis DDR3/1866, Sockel FM1 Radeon HD 6530D mit 320 Shader-Einheiten, 16 TMUs und 8 ROPs @ 443 MHz 100W 115$
A6-3600 4 Rechenkerne, 4 MB Level2-Cache insgesamt, 2.1 GHz (TurboCore max. 2.4 GHz), bis DDR3/1866, Sockel FM1 Radeon HD 6530D mit 320 Shader-Einheiten, 16 TMUs und 8 ROPs @ 443 MHz 65W  
A6-3500 3 Rechenkerne, 3 MB Level2-Cache insgesamt, 2.1 GHz (TurboCore max. 2.4 GHz), bis DDR3/1866, Sockel FM1 Radeon HD 6530D mit 320 Shader-Einheiten, 16 TMUs und 8 ROPs @ 443 MHz 65W  
A4-3400 2 Rechenkerne, 1 MB Level2-Cache insgesamt, 2.7 GHz (kein TurboCore), bis DDR3/1600, Sockel FM1 Radeon HD 6410D mit 160 Shader-Einheiten, 8 TMUs und 4 ROPs @ 600 MHz 65W  
E2-3200 2 Rechenkerne, 1 MB Level2-Cache insgesamt, 2.4 GHz (kein TurboCore), bis DDR3/1600, Sockel FM1 Radeon HD 6370D mit 160 Shader-Einheiten, 8 TMUs und 4 ROPs @ 443 MHz 65W  
E2-450 2 Rechenkerne, 1 MB Level2-Cache insgesamt, 1.65 GHz (kein TurboCore), bis DDR3/1333, Sockel FT1 Radeon HD 6320 mit 80 Shader-Einheiten, 4 TMUs und 4 ROPs @ 508 MHz (TurboCore max. 600 MHz) 18W  
E2-350D 2 Rechenkerne, 1 MB Level2-Cache insgesamt, 1.6 GHz (kein TurboCore), bis DDR3/1066, Sockel FT1 Radeon HD 6310 mit 80 Shader-Einheiten, 4 TMUs und 4 ROPs @ 492 MHz 22W  
E2-300 2 Rechenkerne, 1 MB Level2-Cache insgesamt, 1.3 GHz (kein TurboCore), bis DDR3/1066, Sockel FT1 Radeon HD 6310 mit 80 Shader-Einheiten, 4 TMUs und 4 ROPs @ 488 MHz 18W  
E2-240 1 Rechenkern, 512 kByte Level2-Cache insgesamt, 1.5 GHz (kein TurboCore), bis DDR3/1066, Sockel FT1 Radeon HD 6310 mit 80 Shader-Einheiten, 4 TMUs und 4 ROPs @ 500 MHz 18W  

Mittels der Desktop-Modelle von Llano läßt sich nun auch zielsicher erkennen, woher diese auch schon bei den Mobile-Llanos spürbare geringe CPU-Performance kommt: AMD braucht trotz der 32nm-Fertigung von Llano viel zu viel CPU-Spannung, um Llano überhaupt in die Nähe von 3 GHz zu bekommen. In der Summme hat ein Llano auf 3 GHz somit die gleiche Leistungsaufnahme wie ein K10-Kern auf demselben Takt (gerechnet auf CPU-Vollast ohne Beteiligung der Llano-Grafiklösung) – wobei das K10-Modell aber in 45nm gefertigt wird (Llano in 32nm) und dies eigentlich für einen klaren Leistungsaufnahme-Vorteil stehe müsste. AMD bzw. GlobalFoundries haben hier schlicht noch Probleme mit der 32nm-Fertigung (wahrscheinlich ist dies auch der Grund für die Bulldozer-Verschiebung) und können daher gutklassige Leistungsaufnahmen nur bei arg niedrigen Taktraten erreichen bzw. geht schon bei mittlerer Taktrate schnell der Stromverbrauch massiv nach oben.

Allerdings ist auch klar, daß hier noch reichlich Potential für Llano liegt: Denn daß die 32nm-Fertigung von Llano derzeit keinerlei Stromverbrauchs-Vorteile bringt, wird keinesfalls ein Dauerzustand sein. Vielmehr könnten die Llano-Taktfrequenzen regelrecht explodieren, wenn GlobalFoundries seine Probleme mit der 32nm-Fertigung in den Griff bekommt – die bisherigen Llano-Modelle dürften dann viel weniger verbrauchen und AMD könnte dann auch höhere Llano-Modelle mit Taktraten nahe 4 GHz auflegen. Auch könnten dann im Mobile-Segment die Taktraten ähnlich steigen, ohne einen höheren Stromverbrauch auszulösen – und Llano damit auf der CPU-Seite deutlich attraktiver machen. Normalerweise sollte diese Entwicklung absolut machbar sein – es ist halt nur eine Frage der Zeit. Aber da der Llano-Nachfolger "Bulldozer Trinity" (zweite Bulldozer-Generation samt integrierter Grafik) kaum vor dem Jahresende 2012 antreten dürfte, hat AMD noch einiges an Zeit, um Llano bei der Taktrate deutlich nach vorn zu schieben.

AMD Llano (Radeon HD 6550D) Grafikperformance, Teil 1

Für den Augenblick muß AMD bei Llano zwangsläufig die integrierte Radeon-Grafik in den Vordergrund schieben, weil nur diese ein Feature bietet, welches Intel nicht hat – eine Grafik-Performance im Bereich unterer Mainstream und damit dramatisch besser als bei Intels aktuellen Sandy-Bridge-Grafiklösungen. Allerdings reicht es auch nur bei der besten Llano-Grafik in Form der Radeon HD 6550D zu dieser Einschätzung – jene kommt in etwa (je nach Test) auf ein Performance-Niveau rund um die Radeon HD 5550 DDR3 herum bzw. etwas schwächer als die GeForce GT 430. Interessant ist, daß die Llano-Grafiklösung dieses Performance-Niveau auch schon mit DDR3/1600-Speicher erreicht – DDR3/1866 ist dann nur noch zwei Prozent schneller, während DDR3/1333 deutlich Leistung verschenkt. Weniger interessant ist dagegen die Möglichkeit zum CrossFire-Betrieb mit einer extra Radeon-Grafikkarte: Laut übereinstimmenden Berichten ergibt sich dabei ein derart starker Mikroruckler-Effekt, daß das subjektive Spielgefühl schlechter ist als nur mit der integrierten Grafik allein.

AMD Llano (Radeon HD 6550D) Grafikperformance, Teil 2

Allerdings gilt diese für eine integrierte Grafik stolze Performance eben auch nur für die Radeon HD 6550D, die anderen Llano-Grafiklösungen sind allesamt klar bis überdeutlich schwächer: Bei der Radeon HD 6530D kann man einen Abschlag von ca. 25 Prozent ansetzen, bei der Radeon HD 6410D sind es gar ca. 40 Prozent und bei der Radeon HD 6370D dann ca. 50 Prozent (Schätzwerte auf Basis der bekannten Rohdaten). Die letzteren beiden verabschieden sich damit deutlich aus dem Mainstream-Feld und auch die Radeon HD 6530D wäre dem nur noch äußerst knapp hinzuzurechnen – eigentlich sollte in der Tat die Radeon HD 6550D die unterste Grenze hierfür darstellen. Damit sind eigentlich nur noch die A8-3800 und A8-3850 Prozessoren aus AMDs Llano-Portfolio interessant, da nur diese über die Radeon HD 6550D Grafiklösung verfügen.

AMD Llano (Radeon HD 6550D) Grafikperformance, Teil 3

Die große Frage zu Llano ist aber immer: Für welchen Anwender passt es? Auf den ersten Blick hat Llano zumindest im Desktop keinen großen Ansatz – viele Anwender wünschen sich generell mehr CPU-Performance und akzeptieren das von Llano gebotene Performance-Niveau nur bei einem niedrigen Stromverbrauch, was Llano aber derzeit gerade nicht hat. Und bezüglich der integrierten Grafik lockt Llano keinen ernsthaften Gamer hinter dem warmen Ofen hervor, die Performance-Anforderungen von Gamern werden sich auf absehbare Zeit nur mit extra Grafikkarten abdecken lassen. Interessant ist Llano auf dem Desktop dagegen für den klaren Gelegenheitsspieler, welcher bisher eine Intel-Grafik nutzt und mit dieser auch zurechtkam – für diesen ist Llano eine großartige Verbesserung und die vergleichsweise niedrige CPU-Power in den allermeisten Fällen kein Stolperstein.

Allerdings ist der typische Gelegenheitsspieler üblicherweise nun auch kein Hardware-Profi und firm mit allen CPU- und GPU-Entwicklungen. Daß die Presse also Llano als "ideal für Gelegenheitsspieler" feiert, nutzt AMD auf dem Desktop-Markt noch gar nichts – diese Information muß auch erst einmal zum potentiellen Kunden gebracht werden. Im Enthusiasten-Bereich organisieren sich die Marktteilnehmer weitestgehend selbst, aber im Massenmarkt muß AMD kräftig auf die Werbetrommel schlagen, damit Llano bei den potentiellen Käufern ausreichend bekannt wird. Hierbei muß man dann leider auch gegen das im Massenmarkt verbreitete (und natürlich unrichtige) Vorurteil aus dem CPU-Segment von "AMD = billig" ankämpfen, dies wird für AMD also keineswegs ein Selbstläufer trotz guter Ausgangslage und klar skizzierbarem Kundenkreis. Da AMD mittels seines Fusion-Konzepts allerdings langfristig denkt, dürfte man sich auch von solchen Anfangsschwierigkeiten nicht auf seinem Weg abbringen lassen.

Nachtrag vom 31. Mai 2012

Wie der (erneut in diesen Detailfragen sehr rührige und hartnäckige) Planet 3DNow! ausführt, hat AMD seine Transistoren-Zählmethode bei der Prozessoren-Entwicklung umgestellt und zählt nunmehr die Entkopplungskondensatoren (de-capacitor cells) nicht mehr zum offiziellen Transistoren-Count. Beim neu vorgestellten Trinity mit seinen 1303 Millionen Transistoren wurde dies schon so berücksichtigt, der Trinity-Vorgänger Llano wurde allerdings noch nach der alten Zählweise vermessen, welche auf 1450 Millionen Transistoren kam. Daraus ergab sich die (fälschliche) Feststellung, AMD hätte zwischen Llano und Trinity – womöglich aufgrund der Bulldozer-Abstammung von Trinity – ein paar Transistoren einsparen können, diese Differenz basiert aber eben nur auf den unterschiedlichen Transistoren-Zählmethoden. Gemäß der neuen Zählmethode hat Llano nur noch 1178 Millionen Transistoren und kommt somit etwas unterhalb die Transistoren-Anzahl von Trinity – was dann letztlich auch zur etwas gestiegenen Die-Fläche zwischen Llano und Trinity passt.

Technik Fertigung
Llano 4C Sockel FM1, 4 Husky-Kerne, 1 MB Level2-Cache pro Kern, kein Level3-Cache, DualChannel-Speicherinterface bis DDR3/1866, kein PCI Express Interface, integrierte HD6550D-Grafik mit 400 VLIW5 Shader-Einheiten 1178 Millionen Transistoren auf 228mm² Chip-Fläche in 32nm
Trinity 4C Sockel FM2, 4 Piledriver-Kerne in 2 Modulen, 2 MB Level2-Cache pro Modul, kein Level3-Cache, DualChannel-Speicherinterface bis DDR3/1866, kein PCI Express Interface, integrierte HD7660D-Grafik mit 384 VLIW4 Shader-Einheiten 1303 Millionen Transistoren auf 246mm² Chip-Fläche in 32nm
Bulldozer Sockel AM3+, 8 Bulldozer-Kerne in 4 Modulen, 2 MB Level2-Cache pro Modul, 8 MB Level3-Cache insgesamt, DualChannel-Speicherinterface bis DDR3/1866, kein PCI Express Interface, keine Grafik 1200 Millionen Transistoren auf 315mm² Chip-Fläche in 32nm
Sandy Bridge 2C+GT1 Sockel 1155, 2 Sandy-Bridge-Kerne + HyperThreading, 256 kByte Level2-Cache pro Kern, 3 MB Level3-Cache insgesamt, DualChannel-Speicherinterface bis DDR3/1333, PCI Express 2.0 x16, integrierte HD2000-Grafik mit 6 Execution Units 504 Millionen Transistoren auf 131mm² Chip-Fläche in 32nm
Sandy Bridge 2C+GT2 Sockel 1155, 2 Sandy-Bridge-Kerne + HyperThreading, 256 kByte Level2-Cache pro Kern, 3 MB Level3-Cache insgesamt, DualChannel-Speicherinterface bis DDR3/1333, PCI Express 2.0 x16, integrierte HD3000-Grafikmit 12 Execution Units 624 Millionen Transistoren auf 149mm² Chip-Fläche in 32nm
Sandy Bridge 4C Sockel 1155, 4 Sandy-Bridge-Kerne + HyperThreading, 256 kByte Level2-Cache pro Kern, 8 MB Level3-Cache insgesamt, DualChannel-Speicherinterface bis DDR3/1333, PCI Express 2.0 x16, integrierte HD3000-Grafik mit 12 Execution Units 1160 Millionen Transistoren auf 216mm² Chip-Fläche in 32nm
Sandy Bridge E Sockel 1356 & 2011, 8 Sandy-Bridge-Kerne + HyperThreading, 256 kByte Level2-Cache pro Kern, 20 MB Level3-Cache insgesamt, QuadChannel-Speicherinterface bis DDR3/1600, PCI Express 3.0 Interface x40, keine Grafik 2270 Millionen Transistoren auf 435mm² Chip-Fläche in 32nm
Ivy Bridge 4C Sockel 1155, 4 Ivy-Bridge-Kerne + HyperThreading, 256 kByte Level2-Cache pro Kern, 8 MB Level3-Cache insgesamt, DualChannel-Speicherinterface bis DDR3/1600, PCI Express 3.0 x16, integrierte HD4000-Grafik mit 16 Execution Units 1400 Millionen Transistoren auf 160mm² Chip-Fläche in 22nm

Nicht ganz klar ist, wie dies AMD beim Bulldozer-Prozessor gehandhabt hat, sprich ob dessen Transistoren-Anzahl nun noch nach alter oder schon nach neuer Zählmethode bestimmt wurde. Richtig unklar ist zudem, inwiefern diese neuen AMD-Angaben nun noch mit den Intel-Angaben vergleichbar sind – ob Intel also auch jene Entkopplungskondensatoren mitzählt oder dies nicht tut. Dabei gehören die Entkopplungskondensatoren sicherlich nicht zum eigentlichen Prozessoren-Design, sondern werden nur verbaut, um das Signalrauschen der eigentlichen Logik-Transistoren gering zu halten. Andererseits belegen auch die Entkopplungskondensatoren Die-Fläche und sind jene schließlich auch notwendig, um den Prozessor auf der gewünschten Taktrate stabil zu halten – ob man die Entkopplungskondensatoren einfach so nicht mitzählen darf, wäre dann also die nächste Frage.