Launch-Analyse: Intel Sandy Bridge (Seite 2)

Dienstag, 4. Januar 2011
 / von Leonidas
 

Und damit zum Prozessor selber bzw. den Änderungen der Sandy-Bridge-Architektur: Größtes Merkmal von Sandy Bridge ist sicherlich die durchgehende 32nm-Fertigung und die damit einhergehende Ausnutzung der Möglichkeiten dieser neuen, kleineren Fertigungsgröße. Dies zeigt sich in den angesetzten Taktraten, welche gerade im QuadCore-Bereich höher als bei Nehalem sind, und dann natürlich auch in einem besseren Übertaktungsverhalten der Sandy-Bridge-Prozessoren. Der reine Pro/MHz-Gewinn – also daß, was man eigentlich von einer neuen Prozessorenarchitektur erwarten würde – fällt dagegen mit runden 15 Prozent eher mittelprächtig aus. Dies hängt primär daran, daß die großen Verbesserungen mit einer Ausnahme (AVX) ausgeblieben sind, an Sandy Bridge wurde in erster Linie sehr viel im Detail optimiert – wobei jede der Detailoptimierungen für sich gesehen wohl relativ wenig bringt und erst die Summe aller Optimierungen für die (etwas) höhere Pro/MHz-Leistung steht.

Erwähnenswert unter den ganzen Detailänderungen ist vielleicht der Level3-Cache, welcher bei Sandy Bridge nunmehr mit Prozessorentakt betrieben wird und nicht mehr wie bei Nehalem mit dem Uncore-Takt (fest auf zwischen 2.13 und 2.66 GHz). Dies ist relevant für die schneller getakteten Prozessoren (und auch für übertaktete Prozessoren), da diese bei Sandy Bridge durch diese Maßnahme besser mit höheren Taktfrequenzen skalieren dürften. Generell betrachtet ist Taktraten-Skalierung aber derzeit kein echtes Problem bei Intel, seit den Core-2-Prozessoren skalieren die Intel-Prozessoren sehr gut selbst mit extrem hohen Taktraten.

Bleibt als einzige größere Änderung die neue CPU-Befehlssatzerweiterung AVX, welche früher mal unter dem Namen "SSE5" lief und aufgrund dieser Namenserweiterung auch schon gut einordenbar ist: Grob gesehen handelt es sich erneut um einen Stream-Beschleuniger, welcher durch das Zusammenpacken von mehreren Befehlen in ein größeres Datenformat diese entsprechend schneller ausführen kann. Bei AVX steigt das (maximale) Datenformat von vorher 128 Bit bei SSE4 auf nunmehr 256 Bit, was natürlich in zwei 128-Bit, vier 64-Bit-Datenpakete oder acht 32-Bit-Datenpakete aufgeteilt werden kann. Im Idealfall kann man mittels AVX entsprechend angepassten Programmcode mit ausschließlich streambaren Datenpaketen um das Doppelte gegenüber Nehalem beschleunigen, das zeigen auch entsprechende Benchmarks.

Solcherart Programmcode taucht üblicherweise dort auf, wo hohe Datenmengen auf immer die gleichen und nicht voneinander abhängigen Berechnungen treffen – sprich außerhalb des professionellen Bereichs eigentlich nur bei Bild- und Videobearbeitung. Alle andere Software wird durch AVX nur dann profitieren, wenn mal hier und da passende Berechnungen durchgeführt werden müssen – sprich, im zumeist eigentlich unmerkbaren Bereich. Das größtes Problem von AVX ist allerdings der Punkt, daß es bei Microsoft erst mit dem Service Pack 1 von Windows 7 unterstützt wird und eine Unterstützung für frühere Windows-Versionen seitens Microsoft nicht geplant ist.

Der Software-Programmierer, welcher seine Software auf eine AVX-Unterstützung umstellen will, hat somit aktuell nur 25 bis 30 Prozent der weltweiten PC-Basis als Zielmarkt für diese Änderung, da Windows XP bei der installierten PC-Basis noch unglaublich weit verbreitet ist. Damit sinkt der Effekt einer Umstellung der eigenen Software auf AVX deutlich ab und es ist möglich, daß der eine oder andere Software-Entwickler demzufolge mit dem Support von AVX wartet, bis Windows 7 bei der installierten PC-Basis auf freundlichere Werte gekommen ist. Andererseits ist es zu erwarten, daß Programme, welche absolut deutliche Performance-Gewinne durch AVX erwarten können, doch eher früher als später auf AVX umgestellt werden – eben wegen des teilweise heftigen Performance-Gewinns. Trotzdem passiert in dieser Frage nichts über Nacht, üblicherweise dauert eine solche Umstellung einige Jahre bis zur vollständigen Durchsetzung der neuen Technologie.

Eine deutliche Änderung hat der bereits von Nehalem bekannte TurboMode erfahren: Waren die TurboMode-Aufschläge bei Nehalem noch sehr unterschiedlich verteilt (die HighEnd-Prozessoren mit zumeist recht geringen Taktaufschlägen, die LowCost- und Mainstream-Prozessoren mit eher höheren Taktaufschlägen), ist dies bei Sandy Bridge einheitlicher, aber auch niedriger geworden: Bei den "normalen" Modellen gibt es im QuadCore-Betrieb einen TurboMode-Aufschlag von 100 MHz und pro abgeschaltetem Core dann jeweils nochmals 100 MHz mehr – sprich, bis zu 400 MHz TurboMode-Aufschlag im SingleCore-Betrieb (manche Prozessoren sogar mit nur mit maximal 300 MHz mehr). Nur bei den stromsparenden Modellen sind die TurboMode-Aufschläge im SingleCore- und DualCore-Betrieb höher, ausgehend allerdings von deutlich niedrigeren default-Taktraten.

Zwar hat Intel eine neue Funktion eingebaut, die es dem TurboMode erlaubt, kurzfristig (für 30 Sekunden) über das Limit der TDP zu gehen – weil üblicherweise der Prozessor bei Übertaktung nicht umgehend seine Höchsttemperatur erreicht, hier also noch ein gewisser zeitlicher Spielraum existiert. Allerdings macht diese neue Funktion das Kraut auch nicht mehr fett, der neue TurboMode ist wider Erwarten (und trotz der 32nm-Fertigung) handzahmer als der von Nehalem. Vor allem wird das eigentliche Ziel des TurboMode nicht erreicht, im Fall der Belastung weniger Cores deutlich mehr Takt zur Verfügung zu stellen – dies trifft wie gesagt nur auf die stromsparenden S- und T-Modelle zu:

SingleCore DualCore TripleCore QuadCore
Core i3-2100T (2.5 GHz), Core i3-2100 (3.1 GHz), Core i3-2120 (3.3 GHz) - - - -
Core i5-2300 (2.8 GHz), Core i5-2400 (3.1 GHz), Core i5-2500 (3.3 GHz), Core i5-2500K (3.3 GHz) +300 MHz +200 MHz ? +100 MHz
Core i7-2600 (3.4 GHz), Core i7-2600K (3.4 GHz) +400 MHz +300 MHz +200 MHz +100 MHz
Core i5-2390T (2.7 GHz) +800 MHz +400 MHz - -
Core i5-2400S (2.5 GHz) +800 MHz +700 MHz ? +100 MHz
Core i5-2500T (2.3 GHz), Core i5-2500S (2.7 GHz), Core i7-2600S (2.8 GHz) +1000 MHz +900 MHz ? +100 MHz

Man muß wohl ganz deutlich davon abkommen, bei der Nennung des TurboMode-Takts eines Prozessors immer den TurboMode-Höchsttakt anzugeben – weil der nunmehr klar nur im SingleCore-Modus erreicht wird, was aber unter Windows eher selten vorkommt (zwar belasten viele Programme nach wie vor nur einen Prozessorkern, die Windows-Hintergrundtätigkeiten halten üblicherweise aber immer einen weiteren Prozessorkern am laufen). Und selbst die DualCore-Aufschläge sind meist eher unbeachtenswert – 200 oder 300 MHz Taktaufschlag ergeben bei den hohen Taktraten der entsprechenden Sandy-Bridge-Prozessoren gerade einmal zwischen 6 und 9 Prozent Mehrtakt.

Die grundsätzliche Idee, mittels des TurboMode deutlich mehr SingleCore- und DualCore-Performance zur Verfügung zu stellen, erfüllt der TurboMode nunmehr nur bei den stromsparenden S- und T-Modellen – dort allerdings auf Kosten einer teilweise deutlich niedrigeren QuadCore-Performance durch geringere default-Taktraten. Nichtsdestotrotz ist dies ein interessanter Tausch: Unter SingleCore und DualCore sind die S- und T-Modelle trotz niedrigerer default-Taktraten mittels hoher TurboMode-Aufschläge nicht langsamer als die normalen Modelle, nur im QuadCore-Bereich gibt es ein paar Performance-Einbußen, denen allerdings bei den S- und T-Modellen eine deutlich freundlichere TDP gegenübersteht. Ein gutes Beispiel hierfür ist der Core i7-2600S mit 2.8 GHz, da dieser Prozessor zu einer TDP von 65 Watt eine anständige QuadCore-Performance bietet und mittels TurboMode im SingleCore-Bereich auf 3.8 GHz Takt und im DualCore-Bereich auf 3.7 GHz Takt kommt und dort (theoretisch) nicht langsamer ist als selbst das Top-Modell Core i7-2600K.

Von diesen Ausnahmen bei den S- und T-Modellen abgesehen ist der Effekt des TurboMode auf die Performance der normalen Sandy Bridge Desktop-Prozessoren eher gering und liegt im Bereich von null bis bestenfalls fünf Prozent. Im Mobile-Bereich operiert Intel dagegen durchgehend mit höheren TurboMode-Aufschlägen, allerdings dürfte dann viel eher die TDP als limitierender Faktor greifen und somit auch dort wirklich deutliche Performancegewinne durch den TurboMode verhindern. Generell betrachtet (und natürlich mit Ausnahmen) ist der TurboMode auch bei Sandy Bridge immer noch im Status eines netten Gimmicks, aber noch kein Feature mit echter Zugkraft.

Eine elementare Änderung von Sandy Bridge betrifft die Übertaktungs-Funktionen: Erstens einmal wird hierbei durch die Koppelung diverser Systemtakte die bisher gern benutzte Bus-Übertaktung faktisch unmöglich gemacht, entsprechende Versuche scheierten meist schon bei mehr als (lächerlichen) 5 Prozent Übertaktung. Unklar ist an dieser Stelle aber weiterhin, ob die Mainboard-Hersteller dieses Problem nicht durch den Verbau weiterer Taktgeber lösen könnten – bisher ist davon noch nichts zu sehen, obwohl dies technisch (mit einem gewissen Aufwand) möglich sein sollte. Eventuell stehen die Mainboard-Hersteller aber auch bei Intel im Wort, keine solche Funktionalität anzubieten, denn Intel will ab Sandy Bridge Übertaktung eigentlich nur noch per Multiplikator sehen.

Hierfür dienen die K-Modelle des Sandy-Bridge-Portfolios, welche über einen freien Multiplikator verfügen, derzeit also bis 5.7 GHz übertaktbar sind – sofern der Prozessor dies mitmacht. Wie schon erwähnt soll allerdings nur der P67-Chipsatz über die entsprechende Funktionalität verfügen – und wie ebenfalls schon erwähnt, ist unklar, warum dies nicht auch mit anderen Chipsätzen möglich sein soll, schließlich ist das Übertakten per Multiplikator eine reine BIOS-Funktion. Der TurboMode skaliert im übrigen jeweils mit der Übertaktung mit nach oben, dieser ist also unter Umständen für einen maximalen Übertaktungserfolg der K-Modelle auszuschalten.

In der Praxis gibt es derzeit mit Core i5-2500K (3.3 GHz) und Core i7-2600K (3.4 GHz) nur zwei K-Prozessoren mit freiem Multiplikator und zudem ziemlich eng aneinanderliegenden Taktfrequenzen, so daß sich kaum ein Unterschied bei den in den Launch-Reviews aufgestellten Übertaktungsergebnissen zeigt. Im Schnitt liegen beide Prozessoren bei 4.6 bis 4.7 GHz Übertaktungserfolg, insofern erscheint es aus Sicht der Übertaktung ziemlich egal, ob man zum Core i5-2500K oder zum Core i7-2600K greift. Beachtenswert ist zudem, das bei maßvoller Spannungszugabe bis 1.35V fast immer mindestens 4.5 GHz herauskamen – das weitere Zugeben von mehr Spannung lockt dann meist noch 100 bis 200 MHz Mehrtakt heraus, lohnt aber angesichts der damit verbundenen Risiken (stärkere CPU-Alterung) nicht wirklich.

Core i5-2500K (3.3 GHz) Core i7-2600K (3.4 GHz)
AnandTech - @ 4.42 GHz mit 1.272V
Benchmark Reviews - @ 4.73 GHz
Bit-Tech @ 4.90 GHz mit 1.35V @ 4.80 GHz mit 1.35V
Bjorn3D - @ 4.80 GHz
ComputerBase @ 4.50 GHz mit 1.336V @ 5.00 GHz mit 1.400V
Guru3D - @ 4.29 GHz mit 1.248V
Hardware.fr @ 4.58 GHz mit 1.416V @ 4.68 GHz mit 1.416V
Hartware @ 4.60 GHz mit 1.384V @ 4.80 GHz mit 1.360V
Hot Hardware - @ 4.57 GHz mit 1.35V
HT4U @ 4.49 GHz mit 1.336V @ 4.59 GHz mit 1.320V
Legit Reviews - @ 4.9 GHz mit 1.525V
Neoseeker @ 4.68 GHz mit 1.400V @ 4.58 GHz mit 1.400V
Overclockers Club @ 4.77 GHz mit 1.416V @ 4.60 GHz mit 1.384V
PC Games Hardware - @ 4.80 GHz mit 1.4V
PC Perspective - @ 4.51 GHz mit 1.320V
PureOC @ 4.42 GHz mit 1.360V @ 4.84 GHz mit 1.456V
The Tech Report - @ 4.50 GHz mit 1.304V
Durchschnitt @ 4.61 GHz @ 4.67 GHz

Damit liegt man zweifelsfrei gut gegenüber der Core-2- und der Nehalem-Architektur, wo doch schon deutlich früher Schluß war beim Übertakten von QuadCore-Prozessoren. Als (defensiv angesetztes) Taktziel bei Übertaktung kann man beim Core 2 Quad in etwa 3.6 GHz ansehen, bei den Nehalems dann 3.8 GHz – hier kann Sandy Bridge mit 4.5 GHz dann die Vorteile der 32nm-Fertigung voll ausspielen. Prozentual gesehen sind dies im übrigen gegenüber dem Core 2 Quad 25 Prozent und gegenüber Nehalem 18 Prozent mehr Takt durch Übertaktung. Zudem ist zu erwarten, daß die 32nm-Fertigung im Laufe des Jahres in kleinen Schritten verbessert wird und mit der Zeit also noch bessere Übertaktungsergebnisse bei Sandy-Bridge-Prozessoren neueren Baudatums möglich werden.

Bei den restlichen Modellen des Sandy-Bridge-Portfolios ist dann reguläres Übertakten wie gesagt nicht mehr möglich – mit einer kleinen Ausnahme: Man kann den TurboMode – sofern beim konkreten CPU-Modell vorhanden – um 400 MHz nach oben setzen. Jede einzelne TurboMode-Stufe wird dann um 400 MHz erhöht: Ein Core i5-2500 mit regulär 3.3 GHz Takt geht im TurboMode dann nicht mehr auf 3.7 GHz (SingleCore), 3.6 GHz (DualCore), 3.5 GHz (TripleCore) und 3.4 GHz (QuadCore) hinauf, sondern auf 4.1 GHz (SingleCore), 4.0 GHz (DualCore), 3.9 GHz (TripleCore) und 3.8 GHz (QuadCore). Der reguläre Takt ohne TurboMode ist davon allerdings nicht betroffen und das Feature funktioniert, da es nur die TurboMode-Frequenzen erhöht, eben auch nur mit aktivem TurboMode – und erneut offiziell nur mit dem P67-Chipsatz.

Von den teilweise in einigen Launch-Artikeln angegangenen Experimenten mit der gleichzeitigen Busübertaktung, um gerade die non-K-Modelle noch stärker zu übertakten, möchten wir im übrigen dringend abraten: Wenn das Bussystem üblicherweise schon bei fünfprozentiger Übertaktung austeigt, dann ist eben dieses Bussystem als äußerst heikel in Bezug auf seine Taktraten zu betrachten – und dann sollte man diese 5 Prozent doch als Reserve belassen und nicht ausnutzen. Die Aktivierung jeglicher Übertaktungsfunktionen geht im übrigen nach wie vor mit einem totalen Garantieverlust einher, auch bei den K-Modellen mit explizit freiem Multiplikator.