Citavia [1] hat ein paar neue Trinity-Benchmarks entdeckt, welche einen durchaus interessanten Performance-Gewinn durch die neuen Piledriver-Rechenkerner der Trinity-Prozessoren versprechen. Alle Meßwerte beziehen sich auf den BOINC-Benchmark, welcher sich in einen Integer-Benchmark (singlethreaded) sowie einen Fließkomma-Benchmark (angeblich multithreaded) unterteilt. Da die Messungen von unterschiedlichen Systemen (mit teils sogar leicht unterschiedlichen BOINC-Versionen) stammen, liegt die Meßungenauigkeit höher als regulär – so daß beispielsweise auch ein Trinity Engineering Sample auf 3.7/4.1 GHz den ebenfals Trinity-basierten A10-5800K mit 3.8/4.2 GHz [2] teilweise minimal überflügeln konnte. Trotzdem läßt sich schon eine gewisse Richtung aus diesen Benchmarks erkennen:
Integer (singlethreaded) |
Fließkomma (multithreaded) |
||
---|---|---|---|
A8-3870K | Llano, 4C, 3.0 GHz | 7540 | 2593 |
FX-8150 | Bulldozer, 8C, 3.6 GHz (TC 4.2 GHz) | 9022 | 2855 |
Trinity ES | Trinity, 4C, 3.7 GHz (TC 4.1 GHz) | 9807 | 2924 |
A10-5800K | Trinity, 4C, 3.8 GHz (TC 4.2 GHz) | 9775 | 2945 |
An der (angeblich rein singlethreaded ablaufend) Integer-Performance läßt sich gut ablesen, daß die Piledriver-Rechenkerne von Trinity – trotz des fehlenden Level3-Caches im Gegensatz zu Bulldozer – offenbar einen ganz guten Pro/MHz-Schwung bringen. Im Vergleich mit einem auf nahezu gleichen Taktraten laufenden FX-8150 gewinnen die beiden Trinity-Modelle im Schnitt 9 Prozent Integer-Performance hinzu, gegenüber dem schnellsten Llano-Modell (auf deutlich niedrigerem Takt) liegt der Gewinn sogar bei im Schnitt 30 Prozent mehr Integer-Performance. In der Realität von Anwendungs-Benchmarks wird dieser Wert allerdings niedriger liegen, da dort dann nicht nur ein Rechenkern belastet wird und im Mehrkern-Betrieb die Bulldozer-basierten Designs wegen der gesharten Elemente eines Bulldozer-Moduls [3] schwächer sind als die "vollwertigen" Rechenkerne anderer Prozessoren-Designs. Auf den kompletten Prozessor gerechnet kann man somit ungefähr von 20 Prozent mehr Integer-Performance im Vergleich des schnellsten Trinity- gegenüber des schnellsten Llano-Modells ausgehen.
Inwiefern die Fließkomma-Messung wirklich alle Rechenkerne belastet, ist vakant – höchstwahrscheinlich werden bei diesem Benchmark nur maximal zwei Rechenkerne ausgenutzt, da ein Vierkern-Bulldozer mit nur zwei Fließkomma-Einheiten auf ähnliche Werte wie der FX-8150 mit dessen vier Fließkomma-Einheiten kommt. Dies hilft dann den Trinity-Modellen weiter, da diese ebenfalls nur zwei Fließkomma-Einheiten aufbieten, jene jedoch im Vergleich zum FX-8150 auf ungefähr gleicher Taktrate im Schnitt 3 Prozent schneller rechnen – gegenüber dem besten Llano-Modell sind es im Schnitt 13 Prozent mehr. Unter Anwendungs-Benchmarks mit eben auch der teilweisen Ausnutzung von vier Fließkomma-Einheiten bei Llano sollte Trinity dann wiederum etwas schlechter aussehen, vermutlich verliert Trinity im Schnitt aller Messungen dann seinen Fließkomma-Vorteil gegenüber Llano weitestgehend.
Da der Taktraten-Vorsprung von Trinity gegenüber Llano bei zwischen 27 und 40 Prozent liegt (default-Taktrate zu TurboCore-Taktrate), behält Llano weiterhin die Führung in der Frage der reinen Pro/MHz-Leistung – was aber letztlich keine besonders relevante Größe mehr darstellt, da Trinity wie bekannt mit deutlich höheren Taktraten zur gleichen TDP [2] antreten wird. Ein Trinity A10-5800K wird einen Llano A8-3870K bei der CPU-Performance um ungefähr 15 Prozent schlagen können (die Integer-Performance spielt hier weit mehr hinein als die Fließkomma-Performance) – was AMD im Preisbereich von Llano erheblich weiterhelfen wird, wo Intels Sandy-Bridge-Modelle bisher die bessere CPU-Performance boten. Zusammen mit der schon bei Llano überlegenen und bei Trinity dann nochmals stark verbesserten Grafikeinheit wird AMD mit Trinity das vermutlich klar bessere Insgesamt-Angebot im Llano-Preisbereich anbieten.
Für den Bulldozer-Nachfolger Vishera mit ebenfalls den Piledriver-Rechenkernen ergeben diese Benchmarks zudem die Aussicht auf 10 bis 15 Prozent mehr Pro/MHz-Performance – genauer läßt sich dies noch nicht sagen, da Vishera mit Level3-Cache antreten wird und diese Trinity-Benchmarks natürlich ohne Level3-Cache abliefen, da Trinity ohne jeden Level3-Cache daherkommt. Zudem besteht die Chance auf noch mehr Performance bei Vishera durch den Punkt, daß die Piledriver-Rechenkerne in Vishera gemäß früheren Informationen [4] über mehr Funktionen verfügen sollen als die Piledriver-Rechenkerne in Trinity. Ob der Unterschied aber nur rein funktionell oder auch Performance-wirksam ist, kann derzeit leider noch nicht gesagt werden. Vorerst gelten die 10 bis 15 Prozent mehr Pro/MHz-Performance zugunsten von Vishera – was aber bei weitem noch nicht ausreicht, um den Bulldozer-Nachfolger richtig voranzubringen. AMD wird wenn dann Vishera auch noch höhere Taktraten spendieren müssen, um wirklich wieder ernsthaft gegen Intels Vierkern-Modelle von Sandy Bridge und Ivy Bridge [5] in den Ring steigen zu können.
Verweise:
[1] http://citavia.blog.de/2012/04/08/trinity-piledriver-performance-13460109/
[2] https://www.3dcenter.org/news/exakte-modelldaten-taktraten-zu-den-ersten-trinity-prozessoren-bekannt
[3] https://www.3dcenter.org/artikel/amd-bulldozer-rechenkerne-modul-bauweise
[4] https://www.3dcenter.org/news/amd-piledriver-rechenkerne-vorab-version-fuer-trinity-vollausbau-fuer-vishera
[5] https://www.3dcenter.org/news/intel-ivy-bridge