Launch-Analyse: AMD Trinity (Mobile)

Mittwoch, 16. Mai 2012
 / von Leonidas
 

Wie angekündigt hat AMD am 15. Mai den ersten Teil seiner neuen Mainstream-Prozessoren auf Basis der Trinity-Architektur mit Bulldozer-Unterbau vorgestellt. Damit löst Trinity die bisherigen Llano-Prozessoren ab, welche AMDs ersten Versuch einer (hochwertigen) Kombination von ausreichender Prozessoren-Power mit (für integrierte Verhältnisse) gutklassiger Grafik-Power darstellen und diesbezüglich durchaus zu überzeugen wussten, auch wenn deren Stand am Markt aufgrund der Übermacht Intels niemals einfach war. Mittels Trinity versucht AMD dieses Konzept weiterzutreiben, indem einfach mehr CPU- und Grafik-Power geliefert wird und damit diese Alles-in-einem-CPUs noch attraktiver gemacht werden sollen.

Nachteiligerweise liefert AMD zum jetzigen Zeitpunkt allerdings nur die Mobile-Modelle aus, welche sich üblicherweise schwerer vergleichen lassen – einmal abgesehen davon, daß von diesen sowieso nur eher schwer ein Schluß auf die Performance der Desktop-Modelle gezogen werden kann. Diese werden für OEM-Bedürfnisse schon im Juni (wahrscheinlich ja nach Verfügbarkeit in der Produktion) ausgeliefert werden, der offizielle Retail-Launch der Desktop-Modelle von Trinity soll dagegen erst im August erfolgen. Zu diesem Zeitpunkt dürften sich diese Desktop-Modelle dann allerdings schon mit den Zweikerner von Intels Ivy Bridge duellieren müssen, muß die ganze Situation dann höchstwahrscheinlich komplett neu betrachtet werden. Daher werden wir uns an dieser Stelle primär darum kümmern, was AMDs Trinity derzeit für den Mobile-Bereich zu bieten hat.

Obwohl Trinity bezüglich des Markt-Segments der direkte Nachfolger von Llano ist, hat AMD Trinity von der Architektur her komplett umgekrempelt: Basierte Llano noch auf einer letzten Weiterentwicklung der K10-Rechenkerne samt einer Grafiklösung mit VLIW5 Shader-Einheiten, kommt Trinity mit dem Bulldozer-Prinzip der Modul-Bauweise daher, bietet allerdings schon die verbesserten Piledriver-Rechenkerne und ansonsten eine Grafiklösung mit eben schon VLIW4 Shader-Einheiten. Gleich zu Llano ist faktisch nur, daß beide Prozessoren keinen Level3-Cache bieten – welcher aber im gewöhnlichen nur bei Prozessoren für den Enthusiasten-Bereich interessant ist und bei Llano wie Trinity nur die Die-Fläche unnötig aufgebläht hätte.

Technik Fertigung
Llano 2C Sockel FM1, 2 Husky-Kerne, 1 MB Level2-Cache pro Kern, kein Level3-Cache, DualChannel-Speicherinterface bis DDR3/1866, kein PCI Express Interface, integrierte HD6410D-Grafik mit 160 VLIW5 Shader-Einheiten 758 Millionen Transistoren auf unbekannter Chip-Fläche in 32nm
Llano 4C Sockel FM1, 4 Husky-Kerne, 1 MB Level2-Cache pro Kern, kein Level3-Cache, DualChannel-Speicherinterface bis DDR3/1866, kein PCI Express Interface, integrierte HD6550D-Grafik mit 400 VLIW5 Shader-Einheiten 1450 Millionen Transistoren auf 228mm² Chip-Fläche in 32nm
Trinity 4C Sockel FM2, 4 Piledriver-Kerne in 2 Modulen, 2 MB Level2-Cache pro Modul, kein Level3-Cache, DualChannel-Speicherinterface bis DDR3/1866, kein PCI Express Interface, integrierte HD7660D-Grafik mit 384 VLIW4 Shader-Einheiten 1303 Millionen Transistoren auf 246mm² Chip-Fläche in 32nm
Bulldozer Sockel AM3+, 8 Bulldozer-Kerne in 4 Modulen, 2 MB Level2-Cache pro Modul, 8 MB Level3-Cache insgesamt, DualChannel-Speicherinterface bis DDR3/1866, kein PCI Express Interface, keine Grafik 1200 Millionen Transistoren auf 315mm² Chip-Fläche in 32nm
Sandy Bridge 2C+GT1 Sockel 1155, 2 Sandy-Bridge-Kerne + HyperThreading, 256 kByte Level2-Cache pro Kern, 3 MB Level3-Cache insgesamt, DualChannel-Speicherinterface bis DDR3/1333, PCI Express 2.0 x16, integrierte HD2000-Grafik mit 6 Execution Units 504 Millionen Transistoren auf 131mm² Chip-Fläche in 32nm
Sandy Bridge 2C+GT2 Sockel 1155, 2 Sandy-Bridge-Kerne + HyperThreading, 256 kByte Level2-Cache pro Kern, 3 MB Level3-Cache insgesamt, DualChannel-Speicherinterface bis DDR3/1333, PCI Express 2.0 x16, integrierte HD3000-Grafikmit 12 Execution Units 624 Millionen Transistoren auf 149mm² Chip-Fläche in 32nm
Sandy Bridge 4C Sockel 1155, 4 Sandy-Bridge-Kerne + HyperThreading, 256 kByte Level2-Cache pro Kern, 8 MB Level3-Cache insgesamt, DualChannel-Speicherinterface bis DDR3/1333, PCI Express 2.0 x16, integrierte HD3000-Grafik mit 12 Execution Units 1160 Millionen Transistoren auf 216mm² Chip-Fläche in 32nm
Ivy Bridge 4C Sockel 1155, 4 Ivy-Bridge-Kerne + HyperThreading, 256 kByte Level2-Cache pro Kern, 8 MB Level3-Cache insgesamt, DualChannel-Speicherinterface bis DDR3/1600, PCI Express 3.0 x16, integrierte HD4000-Grafik mit 16 Execution Units 1400 Millionen Transistoren auf 160mm² Chip-Fläche in 22nm

Denn so oder so ist Trinity (wie Llano) kein Leisetreter in der Frage der Die-Fläche: 246mm² sind für eine CPU, welche üblicherweise in den Preisbereich von 80 bis 120 Euro geht (Desktop-Maßstab), aus ökonomischer Sicht schon ziemlich grenzwertig – Intel beliefert diesen Preisbereich mit seinen Zweikern-Prozessoren, welche in der Sandy-Bridge-Ausführung auf Die-Flächen von gerade einmal 131 bzw. 149mm² kommen. Zwar wird es Trinity auch in einer nativen Zweikern-Ausführung mit demzufolge ebenfalls kleinerer Die-Fläche geben, allerdings benötigt AMD im vorgenannten Preisbereich durchaus die vollen vier Rechenkerne (sowohl bei Llano als auch Trinity), um mit Intel in der Frage der CPU-Power mithalten zu können.

Denn nach wie vor liegt AMD bei einem Äpfel-zu-Äpfel-Vergleich klar zurück, sprich: Bezogen auf die Performance des einzelnen Rechenkerns liegt Intel überdeutlich vorn. Mit Trinity hat AMD diesen Zustand nicht ändern können, dies ist allerdings auf Basis der bei AMD derzeit vorhandenen CPU-Architekturen sowie der allgemeinen AMD-Ausrichtung von eher mehr Rechenkernen mit dafür geringerer Performance pro Rechenkern auch nicht anders zu erwarten. Da AMD letztlich auch denselben Preis für vier Rechenkerner bietet wie Intel für zwei Rechenkerne, ist dieser Vergleich jedoch auf jeden Fall zulässig bzw. aufgrund der gleichen Preissituation auch der einzige für die Praxis relevante Vergleich.

Technik Grafik TDP Listenpreis Release
A10-4600M 4 Piledriver-Kerne, 2.3 GHz (TC 3.2 GHz), 4 MB L2, DDR3/1600 Radeon HD 7660G: 384 VLIW4 SE @ 497 MHz (TC 686 MHz) 35W ?
A10-4655M 4 Piledriver-Kerne, 2.0 GHz (TC 2.8 GHz), 4 MB L2, DDR3/1600 Radeon HD 7620G: 384 VLIW4 SE @ 360 MHz (TC 497 MHz) 25W ?
A8-4500M 4 Piledriver-Kerne, 1.9 GHz (TC 2.8 GHz), 4 MB L2, DDR3/1600 Radeon HD 7640G: 256 VLIW4 SE @ 497 MHz (TC 655 MHz) 35W ?
A6-4400M 2 Piledriver-Kerne, 2.7 GHz (TC 3.2 GHz), 1 MB L2, DDR3/1333 Radeon HD 7520G: 192 VLIW4 SE @ 497 MHz (TC 686 MHz) 35W ?
A6-4455M 2 Piledriver-Kerne, 2.1 GHz (TC 2.6 GHz), 2 MB L2, DDR3/1333 Radeon HD 7500G: 256 VLIW4 SE @ 327 MHz (TC 424 MHz) 17W ?

Das Thema vergleichbarer Benchmarks ist aber wie schon im Vorspann angemerkt bei Mobile-Prozessoren ein eher grausiges – leider bietet kaum jemand wirklich sinnvolle Benchmark-Setups. Geboten wurden dafür aber reihenweise zu kurze bzw. unvollständige Benchmark-Reihen, welche aufgrund der zu geringen Zahlenmenge eher den Zufall als die eigentliche Performance entscheiden lassen – und dann natürlich fast durchgehend aufgenommen mit nicht passenden Testkontrahenten (Intels Vierkern-Topmodelle) zu den Trinity-CPUs. Der eigentlich naheliegende Vergleich gegen zum einen ein vernünftiges Llano-Notebook und zum anderen gegenüber Notebooks mit Zweikern-Modellen von Intel (nicht aber ULV-Typen!) wurde viel zu selten angetreten, so daß selbst nach Studium aller vorliegenden Testberichte nur wenige sinnvolle Vergleichzahlen zusammenkamen:

ComputerBase AnandTech PC Perspective
A10-4600M
Trinity, 4C, 2.3 GHz (TC 3.2 GHz)
100% 100%
A8-4500M
Trinity, 4C, 1.9 GHz (TC 2.8 GHz)
100%
A8-3500M
Llano, 4C, 1.5 GHz (TC 2.4 GHz)
115,5% 82,3%
Core i5-2410M
Sandy Bridge, 2C+HT, 2.3 GHz (TM 2.9 GHz)
157,3% 120,7%
Core i5-2540M
Sandy Bridge, 2C+HT, 2.6 GHz (TM 3.3 GHz)
164,8%
Core i7-2630QM
Sandy Bridge, 4C+HT, 2.0 GHz (TM 2.9 GHz)
205,6%
Core i7-2820QM
Sandy Bridge, 4C+HT, 2.3 GHz (TM 3.4 GHz)
193,5%

Die benutzbare Zahlenmenge ist jedoch immer noch zu klein, um einfach einen mathematischen Schnitt der Ergebnisse für sich selber sprechen zu lassen – man kann nur anhand der vorliegenden Ergebnisse eine gewisse Interpretation versuchen, welche dann aber doch arg grob ausfallen muß. Denn leider widersprechen sich die wenigen Testberichte mit den sinnvollen Benchmarks schon bei der simplen Frage, ob die CPU-Power von Trinity nun höher ausfällt als jene von Llano: Laut AnandTech passt das, bei der ComputerBase geht es dagegen in die umgedrehte Richtung. Auch in der Frage, wie weit AMD von Intel entfernt liegt, ist man sich uneins: Bei der ComputerBase und PC Perspective sind dies über 50%, bei AnandTech dann wieder nur ertragbare 20% Performance-Differenz gegenüber einem Intel-Zweikerner.

Das einzige, was sich also zum jetzigen Zeitpunkt sagen läßt, ist daß der große Wurf in Sachen CPU-Performance bislang ausgeblieben ist. Anzumerken wäre jedoch, daß die Karten im Desktop-Segment gänzlich anders ausfallen können, da AMD die Mobile-Modelle von Trinity wirklich deutlich niedriger taktet als die kommenden Desktop-Modelle. Vor allem aber ist der Taktraten-Unterschied Mobile zu Desktop bei AMD gewöhnlich klar höher als bei Intel, was demzufolge Trinity im Desktop-Segment gänzlich anders aussehen lassen könnte. Für eine genauere Aussage zur CPU-Performance im Mobile-Segment wären hingegen noch eine ganze Reihe intensiver Benchmarks anzuraten, das derzeit hierzu vorliegende Zahlenmaterial ist ein regelrechter Witz bezogen auf diese Klarheit, welche sich bei anderen Hardware-Vergleichen herausarbeiten läßt.

Im Bereich der GPU-Performance ist die Beurteilung theoretisch einfacher – vor allem, weil hier die Fronten von Anfang an klarer sind, da AMD ja schon mit Llano recht deutlich vor Intels integrierten Grafiklösungen lag. Mittels Trinity verbessert AMD diese Performance nochmals, obwohl sogar etwas weniger Shader-Einheiten (aber dafür mehr Textureneinheiten) verbaut wurden – dafür gibt es dann unter dem TurboCore-Feature deutlich mehr an Taktrate, was wohl den Hauptteil des Performance-Gewinns von Trinity im GPU-Bereich erwirtschaften sollte.

Radeon HD 7660G Radeon HD 6620G HD Graphics 3000 HD Graphics 4000
AnandTech 100% 78,7% 50,7%
(2C, TM 1200 MHz)
78,9%
(4C, TM 1250 MHz)
Hot Hardware 100% 45,0%
(2C, TM 1300 MHz)
76,3%
(4C, TM 1250 MHz)
Notebookcheck 100% 68,6%
(4C, TM 1100 MHz)
PC Perspective 100% 80,5%
(4C, TM 1250 MHz)
VR-Zone 100% 75,8%
(2C, TM 1150 MHz)

Allerdings schwanken die Benchmarks der verschiedenen Webseiten auch hier wieder sehr deutlich – zudem wäre einzurechnen, daß die Intel HD Graphics 4000 fast durchgehend nur auf Vierkern-Prozessoren getestet wurde, was gerade unter den oftmals gewählten niedrigen Auflösungen (näher an CPU-Limitierungen) die Intel-Werte zusätzlich etwas verfälscht. Hinzu kommen je nach Prozessor auch noch abweichende TurboMode-Taktraten: Während im Desktop-Bereich die HD Graphics 4000 unter dem TurboMode nicht höher als auf 1150 MHz geht, sind im Mobile-Bereich TurboMode-Taktraten von 1100, 1150, 1200, 1250 und sogar 1300 MHz möglich – ja nach konkretem Prozessor. Die mit Trinity vergleichbaren Zweikern-Modelle liegen (im Ivy-Bridge-Bereich) allerdings nur bei TurboMode-Taktraten von 1200 oder 1250 MHz (bei Sandy Bridge dagegen auf 1100 bis 1300 MHz).

Daher ist die Performance-Einschätzung auch hier nicht ganz einfach und kann daher nur in grober Form erfolgen. Erkennen läßt sich dabei, daß die Mobile-Grafiklösungen von Trinity weit weniger Mehrperformance aufweisen als seitens AMD vorab prognostiziert wurde – auf gleichem Speichertyp vielleicht sogar nur im Rahmen von 10 bis 15 Prozent. Dadurch, daß AMD seine Mobile-Lösungen deutlich gegenüber den Desktop-Lösungen abspeckt, während bei Intel die Mobile-Taktraten sogar leicht höher liegen, kommt die HD Graphics 4000 den Trinity-Beschleunigern rein technisch vergleichsweise nahe, liegen im Schnitt der Messungen nur ca. 30 Prozent zwischen HD Graphics 4000 und Radeon HD 7660G.

Sandy Bridge (Mobile) Ivy Bridge (Mobile) Llano (Mobile) Trinity (Mobile)
Radeon HD 7660G
DirectX 11, 384 VLIW4 Shader-Einheiten, 497/686 MHz, DDR3/1600
Performance-Index: ca. 100%
Radeon HD 6620G
DirectX 11, 400 VLIW5 Shader-Einheiten, 444 MHz, DDR3/1600
Performance-Index: ca. 90%
Radeon HD 7660G
DirectX 11, 384 VLIW4 Shader-Einheiten, 497/686 MHz, DDR3/1333
Performance-Index: ca. 90%
Radeon HD 6620G
DirectX 11, 400 VLIW5 Shader-Einheiten, 444 MHz, DDR3/1333
Performance-Index: ca. 80%
HD Graphics 4000
DirectX 11, 16 Shader-Einheiten, 650/1200 MHz, DDR3/1600
Performance-Index: ~73%
Radeon HD 6520G
DirectX 11, 320 VLIW5 Shader-Einheiten, 400 MHz, DDR3/1333
Performance-Index: ca. 70%
Radeon HD 7640G
DirectX 11, 256 VLIW4 Shader-Einheiten, 497/655 MHz, DDR3/1600
Performance-Index: ca. 70%
HD Graphics 4000
DirectX 11, 16 Shader-Einheiten, 650/1200 MHz, DDR3/1333
Performance-Index: ~67%
Radeon HD 7640G
DirectX 11, 256 VLIW4 Shader-Einheiten, 497/655 MHz, DDR3/1333
Performance-Index: ca. 65%
HD Graphics 3000
DirectX 10.1, 12 Shader-Einheiten, 650/1200 MHz, DDR3/1333
Performance-Index: ~47%
Radeon HD 7520G
DirectX 11, 192 VLIW4 Shader-Einheiten, 497/686 MHz, DDR3/1333
Performance-Index: ca. 55%
Radeon HD 6480G
DirectX 11, 160 VLIW5 Shader-Einheiten, 444 MHz, DDR3/1333
Performance-Index: ca. 40%
In diesem Ausnahmefall gilt nicht der allgemeine 3DCenter Performance-Index, vielmehr wurde für die integrierten Grafiklösungen ein extra Performance-Index erstellt mit der Radeon HD 6550D samt DDR3/1333 auf 100% Performance.

Nicht eingerechnet in diesen Zahlen ist natürlich der Vorteil der viel höheren Problemlosigkeit der AMD-Grafiklösungen im realen Spieleinsatz durch den von den eigenen "ernsthaften" Grafikchips abstammenden Treiber – einen Vorteil, den Intel derzeit nicht kontern kann. Daher sind die integrierten AMD-Grafiklösungen faktisch immer vorzuziehen, selbst bei gleicher oder sogar etwas zurückhängender Performance. Allerdings muß dennoch anerkannt werden, daß Intel im Mobile-Segment mittels der HD Graphics 4000 von Ivy Bridge eine inzwischen bei der reinen Performance nicht mehr maßlos zurückhängende integrierte Grafiklösung anbietet. Sobald nicht direkt die Radeon HD 7660G, sondern eine kleinere Trinity-Grafiklösung verbaut ist, kann Intel demzufolge sogar auf Augenhöhe mitspielen.

Dies stößt ein ganz allgemeines Trinity-Problem an, welches auch schon bei Llano existiert: Sinn macht diese spezielle Prozessoren-Architektur nur, wenn man auch wirklich die integrierte Grafik ausnutzen will – wenn sowieso eine potentere extra Grafik verbaut wird, lohnt diese Silizium-Verschwendung wenig und dann wären die bezüglich der CPU-Power schnelleren Intel-Prozessoren natürlich die generell bessere Wahl. Wenn aber die integrierte AMD-Grafik der eigentliche Aufhänger ist, dann lohnen logischerweise nur diese Trinity-Modelle mit der schnellsten integrierten Grafik – und davon gibt es nur eines in Form des Topmodells A10-4600M. Schon das nachfolgende Modell A8-4500M hat eine sehr deutlich abgespeckte integrierte Grafik und nimmt sich damit – wie der Rest des derzeitigen Trinity-Portfolios – eigentlich aus dem Rennen.

Die Empfehlung für Trinity-interessierte kann somit allein nur A10-4600M lauten – und dann muß man darauf hoffen, daß AMD für sein Topmodell keinen überzogenen Preis ansetzt (wie das bei Topmodellen oftmals der Fall ist) und die Notebook-Hersteller auch eine gute Auswahl an entsprechend ausgerüsteten Notebooks zur Verfügung stellen. Im Fall des Falles wäre natürlich noch darauf zu achten, daß auch immer hübsch zwei Speicherriegel verbaut sind, damit das für die integrierte Grafik lebensnotwendige DualChannel-Feature ausgenutzt werden kann – bei Llano haben es tatsächlich viele Hersteller hinbekommen, Notebook mit nur einem Speicherriegel und damit nur SingleChannel-Betrieb anzubieten.

Wenn man in diese Richtung gehen will – Nutzung der integrierten Grafik ohne des Bedarfs an einer extra Grafiklösung – ist AMDs Trinity wieder die beste Wahl, wie bisher schon der Vorgänger Llano. Unter diesem Anwendungsfall kann man die nicht ganz dem Intel-Standard entsprechende CPU-Power verschmerzen, hat aber eine gutklassige Grafikpower ohne eben zusätzlichen Grafikchip und trotzdem mit dem Treibersupport basierend auf "echten" Grafikboliden. Und natürlich kann man unter dieser Ansetzung auch wirklich preisgünstige Notebooks erwarten, will AMD Intel doch beim Preis unterbieten und entfallen – sofern der Notebook-Hersteller mitdenkt – die Mehrkosten einer extra Grafiklösung.

Da AMD laut den verschiedenen Hardwaretests nunmehr auch das Problem der Batterie-Laufzeiten gegenüber Llano in den Griff bekommen hat, gibt es eigentlich wenig, was gegen Trinity spricht, wenn man ein einfaches Kombi-Notebook erwerben will. Sofern man entweder deutlich mehr CPU-Power oder/und deutlich mehr Grafik-Power wünscht, lohnt Trinity natürlich nicht, dann kommt man mit einem Intel-basierten Produkt und dedizierter Grafiklösung von AMD oder nVidia besser – aber für die einfachen Mobile-Bedürfnisse ist Trinity nahezu perfekt. Demzufolge sollte man AMD durchaus auch einmal im Mobile-Segment seine Chance geben – wie gesagt, wenn die Vorzeichen bezüglich des persönlichen Notebook-Anforderungen passend sind.

Leider kaum verwertbare Informationen lassen sich aus dieser Launch-Analyse allerdings bezüglich der Desktop-Modelle von Trinity ziehen, welche wie gesagt später antreten werden. Dafür ist gerade im CPU-Bereich der Taktabstand zwischen Mobile- und Desktop-Modellen zu groß, hinzu kommt die deutliche Unsicherheit der an dieser Stelle ausgewerteten Benchmarks. Sobald Trinity auch im Desktop-Segment ansteht und dort getestet werden kann, dürfte sich jedoch das Bild klarer gestalten lassen als es derzeit unter reinen Mobile-Bedingungen möglich war.