Intel hat mittlerweile eine ansehnlich breite Palette an Prozessoren der Core-2-Familie auf den Markt gebracht. Die wesentlichen Unterschiede, die es bei den Core-2-Prozessoren gibt, sind neben Takt und Kernanzahl auch die Größe des Level2-Cache und die Anbindung der CPU an den FrontSideBus (FSB). Mit den Merkmalen Level2-Cache und FSB-Takt stuft Intel die Prozessoren insbesondere in verschiedene Marktsegmente ein: So gibt es 1 und 2 MB Level2-Cache (Allendale-Core) sowie den FSB800 nur bei den günstigsten Angebot, 4 MB Level2-Cache (Conroe-Core) und FSB1066 bilden das Mittelfeld, während es den FSB1333 nur bei den neuesten und teuersten Prozessoren gibt.
In diesem Artikel wird es nun darum gehen, Unterschiede in der Leistungsfähigkeit bei differierenden Cache-Größen und bei differierendem FSB-Takt aufzuzeigen. Hierbei geht es natürlich allein um die Leistungsfähigkeit unter Spielen, andere Anwendungsgebiete sind für diesen Artikel nicht relevant. Daher setzt sich der Artikel mit folgenden Fragen auseinander:
Die Frage No.3 genießt sicherlich die geringste Priorität, da hier kaum noch Informationsbedarf herrscht: In CPU-limitierten Szenarien haben bereits vorangegangene Tests gezeigt, daß die Skalierung hier am Besten ist – im Normalfall ist sie 1:1, im Extremfall jedoch kann sie, wie wir noch sehen werden, deutlich höher ausfallen.
Die Frage No.2 wirft hingegen die erneute Frage auf, welcher Anteil der Performancesteigerung auf die Erhöhung des Speichertakts zurückzuführen ist – die Erhöhung des Speichertakts geht schließlich Hand in Hand mit Erhöhung des FSB-Takts.
Der Core 2 Duo E6420 wird dabei simuliert durch einen Core 2 Duo E6750 mit einem auf 266 MHz reduzierten FSB-Takt. Ebenfalls wurde der Core 2 Duo E6400 bei den Tests auch übertaktet auf 2667 MHz getestet, der Core 2 Duo E6750 wurde zudem auch auf 2000 MHz untertaktet. Ersteres, um auch bei höheren Takten den Leistungsunterschied bei verschiedenen Cachegrößen deutlich zu machen, zweiteres, um die Auswirkungen des höheren FSB zu unterstreichen.
Die verwendete Grafikkarte ist eine ATI Radeon HD 2900 XT, in dem System sind 4 GB RAM verbaut, genauere Daten zum System sind hier [3] zu finden. Wie immer, wenn es um CPU-basierte Tests geht, wurden die Grafikeinstellungen heruntergedreht, um einen Einfluß der Grafikkarte möglichst auszuschließen. Wir testen also in der niedrigsten Auflösung, die in dem jeweiligen Spiel möglich ist, die Details lassen wir zwar auf hoch, Kantenglättung und anisotrope Filterung sind allerdings deaktiviert. Jedes Spiel wird getestet mit vier verschiedenen Savegames, um Ausreisser zu identifizieren und somit den Wahrheitsgehalt der Ergebnisse zu erhöhen.
Vorab sei an dieser Stelle den Firmen Intel [4] und Sapphire [5] für die unkomplizierte Stellung von Testsamples für unsere Teststationen gedankt, womit auch dieser Artikel wieder ermöglicht wurde.
Der erste Test-Kandidat auf der Checkliste ist Anno 1701:
Erwartungsgemäß schneidet der Core 2 Duo E6750 am Besten ab, hat er doch von allen drei variablen Parametern (CPU-Takt, FSB-Takt, Größe des Level2-Caches) jeweils den Superlativ. Am anderen Ende finden wir den Core 2 Duo E6400 auf Werkseinstellung. Interessant ist die Beobachtung, daß die 25 Prozent mehr Takt, die ein E6750 gegenüber einem E6420 hat, in 28 Prozent mehr fps resultiert, was außerhalb der Messungenauigkeit liegt.
Ein erster Hinweis auf den Einfluss des FSB-Takt auf die Pro/MHz-Leistung der CPUs ist die Tatsache, daß der auf 2000 MHz untertaktete E6750 auf Augenhöhe mit dem auf 2133 MHz untertakteten E6750 liegt – der erhöhte FSB egalisiert hier die 133 MHz Taktunterschied. Zusammengefasst erhöht ein von 2 MB auf 4 MB vergrösserter Level2-Cache die Pro/MHz-Leistung in Anno 1701 um 9 Prozent. Die Erhöhung des FSB-Takts und die damit einhergehende Verringerung des Multiplikators von 8 auf 6 erhöht die Pro/MHz-Leistung um 6,6 Prozent.
Als nächstes testen wir Command & Conquer 3:
Command & Conquer 3 zeigt geringfügige Unterschiede bei der Skalierung – es skaliert geringfügig schlechter mit einer Vergrößerung des Level2-Caches, jedoch geringfügig besser mit der Erhöhung des FSB. Die Unterschiede zwischen den unterschiedlichen Prozessoren bleiben jedoch nahezu gleich. Der größere Level2-Cache bewirkt eine Steigerung der Pro/MHz-Leistung von 8,6 Prozent, mit Erhöhung des FSB steigt die Pro/MHz-Leistung um 7,2 Prozent. C&C 3 skaliert nicht ganz 1:1 mit dem CPU-Takt, eine Taktsteigerung von 25 Prozent bewirkt eine fps-Steigerung von 22 Prozent. Die Ergebnisse des ersten Tests werden insgesamt jedoch bestätigt.
Das Testen von Gothic 3 brachte folgende Ergebnisse:
25 Prozent Takterhöhung bringen in Gothic 3 durchschnittlich 29 Prozent mehr Leistung – mit Ausnahme des zweiten Tests, hier limitiert offenbar die Grafikkarte. Gothic 3 reagiert nicht ganz so positiv auf Cachevergrößerung und FSB-Takt-Steigerung wie die ersten beiden Kanditaten, der größere Cache wird mit 6,2 Prozent Leistungszuwachs belohnt – der erhöhte FSB bringt dagegen 6,9 Prozent und hat somit in Gothic 3 einen geringfügig größeren Effekt als die Cachevergrößerung.
Mit GTR 2 setzen wir unsere Testreihe fort:
GTR2 reagiert außergewöhnlich gut auf den vergrößerten Cache des Allendale-Cores: 10,7 Prozent sind es im Durchschnitt, während es bei Erhöhung des FSBs 8,5 Prozent sind. Immerhin 30 Prozent Leistung gewinnt das Spiel durch eine Takterhöhung von 25 Prozent, womit GTR2 seinen Ruf als CPU-lastiges Spiel gerecht wird. Auch hier fällt wieder ins Auge, daß der auf 2000 MHz untertaktete Conroe schneller ist als der auf 2133 MHz untertaktete Conroe.
Das Echtzeitstrategiespiel Supreme Commander ist die nächste Station im Test:
Je mehr auf der Karte los ist, umso besser skaliert das Spiel mit dem Takt – im Extremfall bis zu 60 Prozent, sind es im Schnitt immer noch fast 40 Prozent. Der Aufwand für KI, Physik und anderen CPU-Aufgaben erhöht sich bei heftigen Gefechten enorm, das erklärt die massiven Performancegewinne bei viel Action. Der Level2-Cache mit 7,5 Prozent und der FSB-Takt mit 6,6 Prozent leisten zwar auch ihren Beitrag, jedoch reagiert das Spiel außergewöhnlich positiv auf eine Erhöhung des CPU-Takts. Dies zeigt sich auch darin, daß der 2000 MHz Conroe sich nicht wie in den anderen Tests immer gegenüber dem 2133 MHz Conroe durchsetzen kann, weil CPU-Takt einfach die wichtigste "Stellschraube" für die Performance von Supreme Commander ist.
Abschließend sei noch Test Drive Unlimited getestet:
TDU skaliert nahezu 1:1 mit dem CPU-Takt, eine Takterhöhung von 25 Prozent resultiert in einem Performancegewinn von 26 Prozent. Die Vergrösserung des Level2-Caches bringt durchschnittlich 7,4 Prozent, die FSB-Erhöhung 7,1 Prozent. Auch wenn man die Ergebnisse der CPUs untereinander vergleicht, ergeben sich hier keine Überraschungen.
Erwartungsgemäß hat die Steigerung des CPU-Takts die größten Auswirkungen auf die Spieleperformance. 29 Prozent Performancesteigerung sind es im Schnitt bei einer Takterhöhung von 25 Prozent. Die nächstgrößere Schraube, an der es sich zu drehen lohnt, ist der Level2-Cache mit durchschnittlich 7,4 Prozent Performancesteigerung. 7,1 Prozent Performancesteigerung bringt hingegen die Erhöhung des FSB-Takts von 266 auf 333 MHz im Durchschnitt. Diese Tatsache zeigt sich besonders in den Werten des auf 2000 MHz untertakteten Core 2 Duo E6750, der auf Augenhöhe mit dem auf 2133 MHz untertakteten Core 2 Duo E6750 liegt, in den meisten Tests sogar minimal darüber.
Eigentlich sind die Werte ein wenig verwunderlich: Denn wie ein noch folgender Test zeigen wird, sind die Unterschiede zu AMD nicht besonders groß in Bezug auf den Leistungsgewinn durch vergrößerten Level2-Cache und erhöhten Speichertakt. Da die AMD Athlon 64 X2/FX Prozessoren einen im Prozessorkern integrierten Speichercontroller haben, müssten die Prozessoren der Core-2-Reihe eigentlich deutlich mehr von erhöhtem Speichertakt und vergrößertem Level2-Cache profitieren. Denn theoretisch müsste die Core-2-Reihe sehr viel empfindlicher auf Speicherzugriffe reagieren, als das bei einem Athlon 64 X2/FX der Fall ist – dort ist schließlich die Verbindung zum Hauptspeicher durch den integrierten Speichercontroller auf den ersten Blick viel schneller.
Allerdings scheint ein Core 2 Duo diesen Umstand mit einem sehr effektiven Cache-System und sehr effizientem Prefetching so gut wie auszugleichen. Zusammen mit der Tatsache, dass der überwältigende Großteil des ausgeführten Codes in relativ kleinen Bereichen des Caches verweilt, wirken sich größere Caches und schnellerer Speicherzugriff eben nur teilweise auf die Performance aus. Der erhoffte Gewinn bleibt damit niedriger, als man sich eigentlich wünschen würde.
Abschließend sei noch etwas zum Preisgefüge gesagt: Der Core 2 Duo E6400 liegt derzeit bei ca. 150 Euro [7] in der Tray-Ausführung, der Core 2 Duo E6420 bei ca. 160 Euro [8], der Core 2 Duo E6750 bei ca. 155 Euro [9]. Bei Werkseinstellungen ist der Core 2 Duo E6750 deutlich schneller als die anderen beiden CPUs, alle liegen aber in einem Rahmen von 10 Euro preislich beieinander. Kompatiblität des Motherboards vorausgesetzt gibt es eigentlich keinen Grund, sich einen Core 2 Duo E64x0 zuzulegen, der Core 2 Duo E6750 ist Preis-/Leistungsmässig momentan einfach nicht zu toppen.
Verweise:
[1] https://www.3dcenter.org/users/madkiller
[2] https://www.3dcenter.org/users/warmachine79
[3] https://www.3dcenter.org/artikel/radeon_hd_2900_xt/index9.php
[4] http://www.intel.de/
[5] http://www.sapphiretech.com/ge/
[6] http://www.forum-3dcenter.org/vbulletin/showthread.php?t=388352
[7] http://geizhals.at/eu/?fs=Core+2+Duo+E6400&x=0&y=0&in=
[8] http://geizhals.at/eu/?fs=Core+2+Duo+E6420&x=0&y=0&in=
[9] http://geizhals.at/eu/?fs=Core+2+Duo+E6750&x=0&y=0&in=