Launch-Analyse: AMD Trinity (Mobile) (Nachträge)

Mittwoch, 16. Mai 2012
 / von Leonidas
 

Nachtrag vom 16. Mai 2012

Zur vorstehenden Launch-Analyse der Trinity Mobile-Prozessoren wäre noch eine Betrachtung der Ultrabook-Modelle nachzuliefern: Hier dürfte AMD jedoch keinerlei Chancen haben, da das einzige 17-Watt-Modell (A6-4455M) bei Trinity nur mit zwei Prozessorenkernen sowie stark abgesenkten GPU-Taktraten daherkommt, während die 17-Watt-Modelle bei Intel üblicherweise nur einen eher maßvollen Abschlag bei CPU- und GPU-Taktfrequenzen aufbieten. Unter der 17-Watt-Klasse dürfte die Schere also richtig aufgehen und AMD wohl deutlich von Intel geschlagen werden. Besser sieht es dann unter der 25-Watt-Klasse aus, wo AMD mit dem A10-4655M einen Prozessor mit nur leicht gegenüber dem Topmodell abgesenkten CPU-Taktraten zu Verfügung hat – der GPU-Takt ist dafür aber wieder deutlich niedriger als beim A10-4600M.

Ganz generell gesprochen hat es Intel schlicht einfacher, die Prozessoren-Modelle mit besonders niedriger TDP zu erzeugen, da AMD beim Energieverbrauch der voll ausgefahrenen Prozessoren immer noch zurückhängt, trotz daß Trinity hierbei eine klare Verbesserung gegenüber Llano darstellt. Dadurch muß Intel generell im Mobile-Bereich und speziell bei den Modellen mit nochmals abgesenkter TDP die Taktraten auch weniger absenken als AMD, was die Performancedifferenz zwischen Intel und AMD mit sinkender TDP demzufolge ansteigen läßt. Gutklassig ist AMD nur dort, wo keine TDP-Sorgen herrschen: Zum einen bei der 35-Watt-Klasse im Mobile-Segment und demzufolge höchstwahrscheinlich auch bei den kommenden Desktop-Modellen auf Trinity-Basis.

Nachtrag vom 17. Mai 2012

Zu den Ultrabook-Modellen von Trinity wäre auf Basis eines (wertvollen) Hinweises aus unserem Forum noch anzumerken, daß diese zwar weiterhin erheblich langsamer als jene von Intel sind, dafür aber der bessere Preispunkt von AMD in diesem Feld auch zu bemerkbar niedrigeren Ultrabook-Preisen führen sollte. Hier kommt der spezielle Punkt hinzu, das bei Ultrabooks der Preis des Prozessors einen sehr hohen Anteil am insgesamten Gerätepreis hat, damit also die Auswirkungen differierender Prozessoren-Preise auf den Gerätepreis besonders ausgeprägt sind – im negativen (Intel) wie im positiven (AMD) Sinne. So gesehen haben die Ultrabook-Modelle von AMDs Trinity dann doch ihre Berechtigung, trotz der gegenüber Intel klar zurückhängenen Performance zumindestens in der 17-Watt-Klasse (in der 25-Watt-Klasse sieht es dann schon wieder besser aus, aber jene ist regulär nicht für Ultrabooks vorgesehen).

Nachtrag vom 24. Mai 2012

Mittels der Diskussion zum AMD Trinity Launch-Artikel sind noch einige weitere Tests der Trinity Mobile-Prozessoren hinzugekommen, deren Auswertung aufgrund der bislang (und auch weiterhin) arg unterdurchschnittlichen Datenmenge an sinnvollen Benchmarks zu diesen neuen Prozessoren bzw. vergleichbaren Mobile-Prozessoren von Intel durchaus interessant ist. Besonders erwähnenswert ist dabei der Artikel von Tom's Hardware, welcher mit recht vielen Benchmarks und vor allem der Benutzung eines zu Llano/Trinity gleichwertigen Intel-Prozessors aufwarten kann – oftmals wurde Trinity nämlich nicht artgerecht mit schnellen Vierkern-Modellen von Intel verglichen, preislich ordnen sich Llano und Trinity aber bei den eher maßvoll getakteten Zweikern-Modellen von Intel ein.

ComputerBase Nordic Hardware AnandTech PC Perspective The Tech Report Tom's Hardware
A10-4600M
Trinity, 4C, 2.3 GHz (TC 3.2 GHz)
100% 100% 100% 100%
A8-4500M
Trinity, 4C, 1.9 GHz (TC 2.8 GHz)
100% 100%
A8-3500M
Llano, 4C, 1.5 GHz (TC 2.4 GHz)
115,5% 82,3% 74,8% 80,6%
A6-3400M
Llano, 4C, 1.4 GHz (TC 2.3 GHz)
89,3%
Core i5-2410M
Sandy Bridge, 2C+HT, 2.3 GHz (TM 2.9 GHz)
157,3% 120,7%
Core i5-2450M
Sandy Bridge, 2C+HT, 2.5 GHz (TM 3.1 GHz)
164,4% 138,5%
Core i5-2540M
Sandy Bridge, 2C+HT, 2.6 GHz (TM 3.3 GHz)
164,8%
Core i7-2630QM
Sandy Bridge, 4C+HT, 2.0 GHz (TM 2.9 GHz)
205,6%
Core i7-2670QM
Sandy Bridge, 4C+HT, 2.2 GHz (TM 3.1 GHz)
182,8%
Core i7-2820QM
Sandy Bridge, 4C+HT, 2.3 GHz (TM 3.4 GHz)
193,5%

Mit den neuen Benchmarks verdoppelt sich das zur Trinity-Einschätzung verfügbare Zahlenmaterial, allerdings reicht es weiterhin nur zu einer eher groben Leistungseinstufung. Klar ist nunmehr, daß der ComputerBase-Test irgeneinen Fehler aufweisen muß (daß dort Trinity nur unter dem SingleChannel-Modus lief, darf in den Anwendungs-Benchmarks keine so große Rolle spielen) – der gleichartige Test von Nordic Hardware weist nunmehr nach, daß auch die kleinere Trinity-Lösung A8-4500M doch schneller als das schnellste Llano-Modell A8-3500M sein muß. Im groben läßt sich der Vorteil von Trinity gegenüber Llano im Mobile-Bereich inzwischen auf ca. +25% Anwendungs-Performance schätzen – dies ist sogar deutlich mehr, als was man vorab an Zugewinn auf der CPU-Seite von Trinity erwartet hatte.

Andererseits bestimmen im Mobile-Segment in erster Linie die jeweils angesetzten Taktabspeckungen gegenüber den voll ausgefahrenen Desktop-Modellen über die letztlich ankommende Performance – und hier hat Trinity aufgrund seines besseren Performance/Stromverbrauchs-Verhältnisses gewisse Vorteile gegenüber Llano. Hinzu kommt der Einfluß von TurboCore in Zusammenhang mit dem Stromhunger der jeweiligen CPU – beim weniger stromhungrigen Trinity dürfte das TurboCore-Feature und damit dessen höhere Taktfrequenzen viel häufiger aktiv als bei Llano sein. Über den Performance-Gewinn von Trinity im Desktop-Segment sagt dies aber noch nichts aus, dies wird maßgeblich bestimmt über die dort anzutreffenden Taktfrequenzen und dann natürlich auch die Skalierung mit diesen viel höheren Taktraten bei den doch sehr unterschiedlichen CPU-Architekturen von Llano und Trinity.

Gegenüber Intels Mobile-Prozessoren des gleichen Preisbereichs in Form der (maßvoll getakteten) Zweikern-Modelle hat Trinity aber weiterhin klar das Nachsehen, je nach Test und CPU-Modell liegt Intel hier immer noch um 20 bis 65 Prozent bei der Anwendungs-Performance vorn. AMDs Problem liegt dabei weiterhin in der für das Mobile-Segment notwendigen Taktraten-Abspeckung, um die gegebenen TDP-Normen (35W für ein normales Notebook) zu erfüllen: Dabei muß AMD das eigentlich für sehr hohe Taktraten ausgelegte Trinity-Design (im Desktop-Betrieb bis 4.2 GHz TurboCore-Takt) so deutlich heruntertakten, daß dabei nur Taktraten auf dem Niveau von Intels Sandy-Bridge-Niveau herauskommen. Im Mobile-Segment kann AMD somit seine Strategie der hohen Taktraten nicht durchziehen, während Intel seinen Vorteil der höheren Pro/MHz-Leistung komplett durchbringen kann. Mit Ivy Bridge könnte dies sogar noch ungünstiger für AMD ausfallen, da Intel bei Ivy Bridge noch mehr Taktrate unter die gleiche TDP pressen kann – dies bliebe allerdings das konkrete Zweikern-Mobile-Portfolio von Ivy Bridge abzuwarten.

Nachtrag vom 25. Mai 2012

Neben den weiteren CPU-Benchmarks gibt es mittels neuer Testberichte zu AMDs Trinity Mobile-Prozessoren auch noch weitere Grafikchip-Benchmarks. Die neuen Benchmarks (die letzten vier Spalten der nachfolgenden Tabelle) bestätigen dabei allerdings "nur" den bisherigen Eindruck: Die Radeon HD 7660G liegt ca. 30 bis 35 Prozent vor der HD Graphics 4000 von Intel, letztere liegt wiederum ungefähr auf dem Leistungsniveau der bei Llano verbauten Radeon HD 6620G. Die Benchmark-Werte schwanken allerdings heftig, was gerade bei Artikeln mit eher wenigen Einzelbenchmarks zu erheblichen Verzerrungen führen kann – auf der einen Seite sehen die Intel-Grafiklösungen bei eher CPU-nahen Settings umgehend glänzend aus, bei Titeln mit schwacher oder gar nicht vorhandener Optimierung im Intel-Treiber kann der Performance-Abstand AMD zu Intel aber auch schnell 100% annehmen.

Radeon HD 7660G Radeon HD 6620G Radeon HD 6520G HD Graphics 3000 HD Graphics 4000
AnandTech 100% 78,7% 50,7%
(2C, TM 1200 MHz)
78,9%
(4C, TM 1250 MHz)
Hot Hardware 100% 45,0%
(2C, TM 1300 MHz)
76,3%
(4C, TM 1250 MHz)
Notebookcheck 100% 68,6%
(4C, TM 1100 MHz)
PC Perspective 100% 80,5%
(4C, TM 1250 MHz)
VR-Zone 100% 75,8%
(2C, TM 1150 MHz)
Tom's Hardware 100% 78,2% 56,7%
(2C, TM 1300 MHz)
Legit Reviews 100% 71,6% 70,0%
(4C, TM 1250 MHz)
The Tech Report 100% 83,7% 44,5%
(4C, TM 1100 MHz)
88,1%
(4C, TM 1250 MHz)
Nordic Hardware 100% 70,6% 70,3%
(4C, TM 1100 MHz)

Nachtrag vom 31. Mai 2012

Wie der (erneut in diesen Detailfragen sehr rührige und hartnäckige) Planet 3DNow! ausführt, hat AMD seine Transistoren-Zählmethode bei der Prozessoren-Entwicklung umgestellt und zählt nunmehr die Entkopplungskondensatoren (de-capacitor cells) nicht mehr zum offiziellen Transistoren-Count. Beim neu vorgestellten Trinity mit seinen 1303 Millionen Transistoren wurde dies schon so berücksichtigt, der Trinity-Vorgänger Llano wurde allerdings noch nach der alten Zählweise vermessen, welche auf 1450 Millionen Transistoren kam. Daraus ergab sich die (fälschliche) Feststellung, AMD hätte zwischen Llano und Trinity – womöglich aufgrund der Bulldozer-Abstammung von Trinity – ein paar Transistoren einsparen können, diese Differenz basiert aber eben nur auf den unterschiedlichen Transistoren-Zählmethoden. Gemäß der neuen Zählmethode hat Llano nur noch 1178 Millionen Transistoren und kommt somit etwas unterhalb die Transistoren-Anzahl von Trinity – was dann letztlich auch zur etwas gestiegenen Die-Fläche zwischen Llano und Trinity passt.

Technik Fertigung
Llano 4C Sockel FM1, 4 Husky-Kerne, 1 MB Level2-Cache pro Kern, kein Level3-Cache, DualChannel-Speicherinterface bis DDR3/1866, kein PCI Express Interface, integrierte HD6550D-Grafik mit 400 VLIW5 Shader-Einheiten 1178 Millionen Transistoren auf 228mm² Chip-Fläche in 32nm
Trinity 4C Sockel FM2, 4 Piledriver-Kerne in 2 Modulen, 2 MB Level2-Cache pro Modul, kein Level3-Cache, DualChannel-Speicherinterface bis DDR3/1866, kein PCI Express Interface, integrierte HD7660D-Grafik mit 384 VLIW4 Shader-Einheiten 1303 Millionen Transistoren auf 246mm² Chip-Fläche in 32nm
Bulldozer Sockel AM3+, 8 Bulldozer-Kerne in 4 Modulen, 2 MB Level2-Cache pro Modul, 8 MB Level3-Cache insgesamt, DualChannel-Speicherinterface bis DDR3/1866, kein PCI Express Interface, keine Grafik 1200 Millionen Transistoren auf 315mm² Chip-Fläche in 32nm
Sandy Bridge 2C+GT1 Sockel 1155, 2 Sandy-Bridge-Kerne + HyperThreading, 256 kByte Level2-Cache pro Kern, 3 MB Level3-Cache insgesamt, DualChannel-Speicherinterface bis DDR3/1333, PCI Express 2.0 x16, integrierte HD2000-Grafik mit 6 Execution Units 504 Millionen Transistoren auf 131mm² Chip-Fläche in 32nm
Sandy Bridge 2C+GT2 Sockel 1155, 2 Sandy-Bridge-Kerne + HyperThreading, 256 kByte Level2-Cache pro Kern, 3 MB Level3-Cache insgesamt, DualChannel-Speicherinterface bis DDR3/1333, PCI Express 2.0 x16, integrierte HD3000-Grafikmit 12 Execution Units 624 Millionen Transistoren auf 149mm² Chip-Fläche in 32nm
Sandy Bridge 4C Sockel 1155, 4 Sandy-Bridge-Kerne + HyperThreading, 256 kByte Level2-Cache pro Kern, 8 MB Level3-Cache insgesamt, DualChannel-Speicherinterface bis DDR3/1333, PCI Express 2.0 x16, integrierte HD3000-Grafik mit 12 Execution Units 1160 Millionen Transistoren auf 216mm² Chip-Fläche in 32nm
Sandy Bridge E Sockel 1356 & 2011, 8 Sandy-Bridge-Kerne + HyperThreading, 256 kByte Level2-Cache pro Kern, 20 MB Level3-Cache insgesamt, QuadChannel-Speicherinterface bis DDR3/1600, PCI Express 3.0 Interface x40, keine Grafik 2270 Millionen Transistoren auf 435mm² Chip-Fläche in 32nm
Ivy Bridge 4C Sockel 1155, 4 Ivy-Bridge-Kerne + HyperThreading, 256 kByte Level2-Cache pro Kern, 8 MB Level3-Cache insgesamt, DualChannel-Speicherinterface bis DDR3/1600, PCI Express 3.0 x16, integrierte HD4000-Grafik mit 16 Execution Units 1400 Millionen Transistoren auf 160mm² Chip-Fläche in 22nm

Nicht ganz klar ist, wie dies AMD beim Bulldozer-Prozessor gehandhabt hat, sprich ob dessen Transistoren-Anzahl nun noch nach alter oder schon nach neuer Zählmethode bestimmt wurde. Richtig unklar ist zudem, inwiefern diese neuen AMD-Angaben nun noch mit den Intel-Angaben vergleichbar sind – ob Intel also auch jene Entkopplungskondensatoren mitzählt oder dies nicht tut. Dabei gehören die Entkopplungskondensatoren sicherlich nicht zum eigentlichen Prozessoren-Design, sondern werden nur verbaut, um das Signalrauschen der eigentlichen Logik-Transistoren gering zu halten. Andererseits belegen auch die Entkopplungskondensatoren Die-Fläche und sind jene schließlich auch notwendig, um den Prozessor auf der gewünschten Taktrate stabil zu halten – ob man die Entkopplungskondensatoren einfach so nicht mitzählen darf, wäre dann also die nächste Frage.

Nachtrag vom 10. Juni 2012

Laut der ComputerBase scheint sich die Desktop-Version von AMDs Trinity weiter zu verschieben: Aus August ist inzwischen "September/Oktober" geworden, was sich nicht gerade gut anhört. Zwar sind derzeit schon erste Desktop-Exemplare von Trinity bei den PC-Bauern, dies sind aber reine Evaluierungs-Exemplare, darauf ist nicht auf einen baldigen Start der Desktop-Modelle wenigstens im OEM-Geschäft zu schließen. Trotzdem sollte jenes OEM-Geschäft wohl früher als der Retail-Handel loslaufen, denn September/Oktober ist zu spät, um in der lukrativen Back-to-School-Saison in den USA mitspielen zu können, dafür brauchen die PC-Bauer lieferbare Kontingente spätstens im August. Gut möglich, daß der Desktop-Trinity also ab August in Fertig-PCs auftaucht, der Retail-Start dann aber wirklich erst September/Oktober über die Bühne geht.

LowCost Mainstream Enthusiast
Iststand Bobcat ("Brazos 2.0")
40nm Hondo/Ontario/Zacate-Prozessoren
1-2 Bobcat-Rechenkerne
VLIW5-Grafik mit 80 Shader-Einheiten
Sockel FT1, SingleChannel DDR3/1333
(TabletPC-Lösung "Hondo" erst im Q4)
Trinity
32nm Trinity-Prozessoren
2-4 Piledriver-Rechenkerne
VLIW4-Grafik mit max. 384 Shader-Einheiten
Sockel FM2, DualChannel DDR3/1866
(derzeit nur für Mobile erhältlich)
Bulldozer
32nm Zambezi-Prozessoren
4-8 Bulldozer-Rechenkerne
keine integrierte Grafik
Sockel AM3+, DualChannel DDR3/1866
August 2012 Desktop-Trinity für OEM
Sep/Okt 2012 Desktop-Trinity für Retail
Q3-Q4/2012 Bulldozer/Vishera
32nm Vishera-Prozessoren
4-8 Piledriver-Rechenkerne
keine integrierte Grafik
Sockel AM3+, DualChannel DDR3
H1/2013 Bobcat/Kabini
28nm Kabini-Prozessoren
2-4 Jaguar-Rechenkerne
integrierte GCN-basierte Grafiklösung
Sockel FT2, DDR3
Trinity/Kaveri
28nm Kaveri-Prozessoren
2-4 Steamroller-Rechenkerne
integrierte GCN-basierte Grafik
GCN-Grafik mit max. 512 Shader-Einheiten
Sockel FM2, DDR3/2133
H2/2013 neue Prozessoren auf Steamroller-Basis, bisher keine weiteren Daten bekannt
2015 neue Prozessoren auf Excavator-Basis, bisher keine weiteren Daten bekannt neue Prozessoren auf Excavator-Basis, bisher keine weiteren Daten bekannt