Veröffentlicht auf 3DCenter.org (http://www.3dcenter.org)

Startseite > Launch-Analyse: Intel Sandy Bridge

Launch-Analyse: Intel Sandy Bridge

Dienstag, 4. Januar 2011
 / von Leonidas [1]
 

Mit einem kleinen Frühstart (der Launch war ursprünglich erst am 5. Januar geplant) hat Intel am ersten Arbeitstag des neuen Jahres seine Sandy-Bridge-Prozessorenarchitektur vorgestellt und in den Markt entlassen. Bei Sandy Bridge handelt es sich grob um eine weiter verbesserte Nehalem-Abwandlung, welche allerdings in Form neuer Prozessorensockel eine komplett neue Mainboard-Infrastuktur benötigt. Wichtige weitere Punkte sind eine neue integrierte Grafikeinheit und die durchgängige Fertigung in 32nm – womit es bei Intel erstmals QuadCore-Prozessoren in 32nm gibt, was natürlich diverse Taktspielräume eröffnet.

Technisch betrachtet handelt es sich bei Sandy Bridge um (derzeit) drei verschiedene Prozessoren derselben Architektur: Einen QuadCore-Prozessor mit voll ausgefahrener Grafikeinheit ("GT2" aka Intel HD Graphics 3000), einen DualCore-Prozessor mit derselben GT2-Grafik und einen DualCore-Prozessor mit halbierter Grafikeinheit ("GT1" aka Intel HD Graphics 2000). Gemeinsam ist allen Prozessoren ein integriertes DualChannel-Speicherinterfaces, welches offiziell bis zu DDR3/1333-Speicher zuläßt (einige Mobile-Prozessoren lassen bis zu DDR3/1600 zu, technisch ist also mehr möglich) samt einem integrierten PCI Express 2.0 x16 Interface zur Ansteuerung einer extra Grafikkarte.

Technik Fertigung
Nehalem Gulftown Sockel 1366, 6 Kerne + HyperThreading, 256 kByte Level2-Cache pro Kern, 12 MB Level3-Cache insgesamt, TripleChannel-Speicherinterface bis DDR3/1066, kein PCI Express, keine Grafik 1170 Millionen Transistoren auf 240mm² Chip-Fläche in 32nm
Nehalem Bloomfield Sockel 1366, 4 Kerne + HyperThreading, 256 kByte Level2-Cache pro Kern, 8 MB Level3-Cache insgesamt, TripleChannel-Speicherinterface bis DDR3/1066, kein PCI Express, keine Grafik 731 Millionen Transistoren auf 263mm² Chip-Fläche in 45nm
Nehalem Lynnfield Sockel 1156, 4 Kerne + HyperThreading, 256 kByte Level2-Cache pro Kern, 8 MB Level3-Cache insgesamt, DualChannel-Speicherinterface bis DDR3/1066, PCI Express 2.0 x16, keine Grafik 774 Millionen Transistoren auf 296mm² Chip-Fläche in 45nm
Nehalem Clarkdale Sockel 1156, 2 Kerne + HyperThreading, 256 kByte Level2-Cache pro Kern, 4 MB Level3-Cache insgesamt, DualChannel-Speicherinterface bis DDR3/1333, PCI Express 2.0 x16, integrierte Grafik 384 Millionen Transistoren auf 81mm² Chip-Fläche in 32nm, zuzüglich 177 Millionen Transistoren für die extra gefertigte GPU auf 114mm² Chip-Fläche in 45nm (zusammen: 561 Millionen Transistoren auf 195mm² Chip-Fläche)
Sandy Bridge 4C Sockel 1155, 4 Kerne + HyperThreading, 256 kByte Level2-Cache pro Kern, 8 MB Level3-Cache insgesamt, DualChannel-Speicherinterface bis DDR3/1333, PCI Express 2.0 x16, integrierte GT2-Grafik 995 Millionen Transistoren auf 216mm² Chip-Fläche in 32nm
Sandy Bridge 2C+GT2 Sockel 1155, 2 Kerne + HyperThreading, 256 kByte Level2-Cache pro Kern, 4 MB Level3-Cache insgesamt, DualChannel-Speicherinterface bis DDR3/1333, PCI Express 2.0 x16, integrierte GT2-Grafik 624 Millionen Transistoren auf 149mm² Chip-Fläche in 32nm
Sandy Bridge 2C+GT1 Sockel 1155, 2 Kerne + HyperThreading, 256 kByte Level2-Cache pro Kern, 4 MB Level3-Cache insgesamt, DualChannel-Speicherinterface bis DDR3/1333, PCI Express 2.0 x16, integrierte GT1-Grafik 504 Millionen Transistoren auf 131mm² Chip-Fläche in 32nm

Die doppelte Fertigung desselben DualCore-Prozessors nur mit unterschiedlichen Grafikeinheiten überrascht ein wenig – wenn man sich allerdings den Unterschied in der Transistorenanzahl nur durch die halbierte Grafik ansieht, wird klar, daß es sich hier um eine Sparmaßnahme für LowCost-Bedürfnisse handelt, wo aufgrund der niedrigen Abgabepreise eben die Fertigungskosten des einzelnen Prozessors eine bedeutende Rolle spielen. Schließlich ist das kleinste Sandy-Bridge-Modell trotz dieser Abspeckung immer noch deutlich größer als das kleinste Nehalem-Modell mit integrierter Grafik (von 81mm² auf 131mm² Chip-Fläche).

Ausgehend von diesen drei Prozessoren bietet Intel dann ein sehr abgestuftes Programm an verschiedenen Sandy-Bridge-Modellen im DualCore- und QuadCore-Bereich, bei welchen allerdings oftmals nicht alle möglichen Features zum Einsatz kommen. Sehr oft gibt es weniger Level3-Cache als maximal möglich und im Desktop-Bereich wird fast durchgehend nur die schwächere Intel HD Graphics 2000 geboten. Zudem sind diverse Technologien wie HyperThreading, TurboMode, vPro, TXT, VT-d und AES-NI nicht bei allen Prozessoren aktiviert, durchgehend bei allen derzeit vorgestellten Prozessoren ist nur 64-Bit, XD-Bit, SSE4, AVX und VT-x mit an Bord.

Technik Grafik Features TDP Preis
Core i7-2600K 4 Kerne + HT, 3.4 GHz (TM 3.8/3.7/3.6/3.5 GHz), 8 MB L3 HD3000 @ 850 MHz (TM 1350 MHz) HyperThreading, TurboMode, 64-Bit, XD-Bit, VT-x, SSE4, AVX, AES-NI
fehlend: vPro, VT-d, TXT
95W 317$
Core i7-2600 4 Kerne + HT, 3.4 GHz (TM 3.8/3.7/3.6/3.5 GHz), 8 MB L3 HD2000 @ 850 MHz (TM 1350 MHz) HyperThreading, TurboMode, 64-Bit, XD-Bit, VT-x, SSE4, AVX, AES-NI, vPro, VT-d, TXT
fehlend: nichts
95W 294$
Core i7-2600S 4 Kerne + HT, 2.8 GHz (TM 3.8/3.7/?/2.9 GHz), 8 MB L3 HD2000 @ 850 MHz (TM 1350 MHz) HyperThreading, TurboMode, 64-Bit, XD-Bit, VT-x, SSE4, AVX, AES-NI, vPro, VT-d, TXT
fehlend: nichts
65W 306$
Core i5-2500K 4 Kerne, 3.3 GHz (TM 3.7/3.6/3.5/3.4 GHz), 6 MB L3 HD3000 @ 850 MHz (TM 1100 MHz) TurboMode, 64-Bit, XD-Bit, VT-x, SSE4, AVX, AES-NI
fehlend: HyperThreading, vPro, VT-d, TXT
95W 216$
Core i5-2500 4 Kerne, 3.3 GHz (TM 3.7/3.6/3.5/3.4 GHz), 6 MB L3 HD2000 @ 850 MHz (TM 1100 MHz) TurboMode, 64-Bit, XD-Bit, VT-x, SSE4, AVX, AES-NI, vPro, VT-d, TXT
fehlend: HyperThreading
95W 205$
Core i5-2500S 4 Kerne, 2.7 GHz (TM 3.7/3.6/?/2.8 GHz), 6 MB L3 HD2000 @ 850 MHz (TM 1100 MHz) TurboMode, 64-Bit, XD-Bit, VT-x, SSE4, AVX, AES-NI, vPro, VT-d, TXT
fehlend: HyperThreading
65W 216$
Core i5-2500T 4 Kerne, 2.3 GHz (TM 3.3/3.2/?/2.4 GHz), 6 MB L3 HD2000 @ 650 MHz (TM 1250 MHz) TurboMode, 64-Bit, XD-Bit, VT-x, SSE4, AVX, AES-NI, vPro, VT-d, TXT
fehlend: HyperThreading
45W 216$
Core i5-2400 4 Kerne, 3.1 GHz (TM 3.4/3.3/?/3.2 GHz), 6 MB L3 HD2000 @ 850 MHz (TM 1100 MHz) TurboMode, 64-Bit, XD-Bit, VT-x, SSE4, AVX, AES-NI, vPro, VT-d, TXT
fehlend: HyperThreading
95W 184$
Core i5-2400S 4 Kerne, 2.5 GHz (TM 3.3/3.2/?/2.6 GHz), 6 MB L3 HD2000 @ 850 MHz (TM 1100 MHz) TurboMode, 64-Bit, XD-Bit, VT-x, SSE4, AVX, AES-NI, vPro, VT-d, TXT
fehlend: HyperThreading
65W 195$
Core i5-2300 4 Kerne, 2.8 GHz (TM 3.1/3.0/?/2.9 GHz), 6 MB L3 HD2000 @ 850 MHz (TM 1100 MHz) TurboMode, 64-Bit, XD-Bit, VT-x, SSE4, AVX, AES-NI, vPro, VT-d, TXT
fehlend: HyperThreading
95W 177$
Core i5-2390T 2 Kerne + HT, 2.7 GHz (TM 3.5/3.1 GHz), 3 MB L3 HD2000 @ 650 MHz (TM 1100 MHz) HyperThreading, TurboMode, 64-Bit, XD-Bit, VT-x, SSE4, AVX, AES-NI, vPro, VT-d, TXT
fehlend: nichts
35W 195$
Core i3-2120 2 Kerne + HT, 3.3 GHz, 3 MB L3 HD2000 @ 850 MHz (TM 1100 MHz) HyperThreading, 64-Bit, XD-Bit, VT-x, SSE4, AVX,
fehlend: TurboMode, AES-NI, vPro, VT-d, TXT
65W 138$
Core i3-2100 2 Kerne + HT, 3.1 GHz, 3 MB L3 HD2000 @ 850 MHz (TM 1100 MHz) HyperThreading, 64-Bit, XD-Bit, VT-x, SSE4, AVX
fehlend: TurboMode, AES-NI, vPro, VT-d, TXT
65W 117$
Core i3-2100T 2 Kerne + HT, 2.5 GHz, 3 MB L3 HD2000 @ 650 MHz (TM 1100 MHz) HyperThreading, 64-Bit, XD-Bit, VT-x, SSE4, AVX
fehlend: TurboMode, AES-NI, vPro, VT-d, TXT
35W 127$
64-Bit: 64-Bit-Technologie von Intel (x86-64 oder EM64T), XD-Bit: No-Execute-Bit für die Datenausführungsverhinderung von Windows, VT-x: Hardware-Unterstützung für Virtualisierung, SSE4 & AVX: CPU-Befehlssatzerweiterungen, wurden bei früheren Billig-CPUs von Intel teilweise deaktiviert, AES-NI: Hardware-Unterstützung für AES-Verschlüsselung, vPro: Business-Plattform von Intel mit TPM, nur interessant mit den passenden Q-Chipsätzen, VT-d: Virtualisierung für vPro, nur interessant zusammen mit vPro, TXT: Trusted-Computing-Erweiterung von Intel, gewöhnlich nur interessant zusammen mit vPro

Leider ist die Produktbenennung bei Sandy Bridge wiederum nicht eindeutig: Zwar ist ein Core i7 nunmehr immer ein Vierkerner mit HyperThreading und ein Core i3 immer ein Zweikerner mit HyperThreading, beim Core i5 gibt es dann jedoch wieder Mischmasch: Gewöhnlich sind das Vierkerner ohne HyperThreading, in einem Fall jedoch nennt sich auch ein Zweikerner mit HyperThreading "Core i5". Im Mobile-Bereich wirft Intel diese Einstufungen jedoch komplett wieder um, dort sind alle Vierkerner als "Core i7M" unterwegs und die Zweikerner teilen sich den Namensbereich "Core i3M" und "Core i5M". Mit der reinen Namensgebung kommt man also gewöhnlich nicht weiter, es ist überall der prüfende Blick in Spezifikationslisten notwendig.

Aufgrund des neuen Sockels 1155 erfordert Sandy Bridge erneut neue Mainboards und Chipsätze, Sandy Bridge wird derzeit nur von der 6er Chipsatz-Serie seitens Intel unterstützt. Wie üblich bietet Intel hierbei verschiedene Chipsätze für verschiedene Bedürfnisse an, wobei für den Heimanwender in erster Linie die Chipsätze H67 und P67 interessant sein dürften – während der B65 für den OEM-Bereich und der Q67 für den Business-Bereich aufgelegt werden. Relevanter Unterschied zwischen H67 und P67 ist, daß der P67 nicht das Flexible Display Interface unterstützt, welches zur Ausleitung des Display-Signals der integrierten Sandy-Bridge-Grafik benötigt wird – mit dem P67 ist die integrierte Sandy-Bridge-Grafik also komplett nicht nutzbar.

Wer aufgrund dieser Information dann zum H67 tendiert, muß allerdings dort auch gewisse Abstriche in Kauf nehmen: Erstens einmal unterstützt der Chipsatz nicht von Haus aus die Auftrennung der von der CPU kommenden x16 PCI Express 2.0 Lanes auf zwei Grafikkarten-Slots (Aufteilung in zweimal x8 Lanes), dies kann nur der P67. Beim H67 ist damit SLI und CrossFire nicht gänzlich unmöglich, es müsste halt vom Mainboard-Hersteller ein extra PCI-Express-Switch wie nVidias NF200 verbaut werden – was aber sicherlich selten oder auch gar nicht passieren wird. Und zweitens unterstützt der H67 Intel-offiziell keine Übertaktung – wobei an dieser Stelle nicht ganz klar ist, ob diese Einschränkung nicht eventuell nur auf Intel-eigene Mainboards zutrifft, denn bei der Übertaktung handelt es sich eigentlich nur um eine BIOS-Funktion.

Unter Umständen bieten H67-Mainboards anderer Hersteller dann doch die Übertaktungsfunktionen an, dies bliebe erst einmal abzuwarten. Falls ja, wäre der H67-Chipsatz möglicherweise sogar die bessere Wahl gegenüber dem P67-Chipsatz, weil man mit dem H67 eben auch die integrierte Sandy-Bridge-Grafik nutzen kann, was aus Gründen der Ausfallsicherheit einfach ein Pluspunkt ist. Abzuwarten bleibt ebenfalls, was der allerdings erst im zweiten Quartal zu erwartende Z68-Chipsatz diesbezüglich besser machen kann – angeblich soll dieser alle Funktionen von H67 und P67 zusammenführen und wäre dann natürlich die erste Wahl für ein Sandy-Bridge-System.

Die anderen Unterschiede zwischen den einzelnen Chipsätzen sind dann eher marginal und hier [2] komplett aufgelistet. Erwähnenswert wäre noch, daß Intel mit der 6er Chipsatz-Serie SATA III endlich nativ unterstützt, USB 3.0 aber weiterhin nicht. Da sich letzteres Feature aber inzwischen deutlich durchgesetzt hat, dürften Sandy-Bridge-Mainboards (bis auf den Einsteiger-Bereich) durchgehend mit extra USB-3.0-Chips aufwarten.


Kommentare - Registrierung ist nicht notwendig [3]
Mit einem kleinen Frühstart (der Launch war ursprünglich erst am 5. Januar geplant) hat Intel am ersten Arbeitstag des neuen Jahres seine Sandy-Bridge-Prozessorenarchitektur vorgestellt und in den Markt entlassen. Bei Sandy Bridge handelt es sich grob um eine weiter verbesserte Nehalem-Abwandlung, welche allerdings in Form neuer Prozessorensockel eine komplett neue Mainboard-Infrastuktur benötigt. Wichtige weitere Punkte sind eine neue integrierte Grafikeinheit und die durchgängige Fertigung in 32nm - womit es bei Intel erstmals QuadCore-Prozessoren in 32nm gibt, was natürlich diverse Taktspielräume eröffnet.
[4]

Launch-Analyse: Intel Sandy Bridge (Seite 2)

Dienstag, 4. Januar 2011
 / von Leonidas [1]
 

Und damit zum Prozessor selber bzw. den Änderungen der Sandy-Bridge-Architektur: Größtes Merkmal von Sandy Bridge ist sicherlich die durchgehende 32nm-Fertigung und die damit einhergehende Ausnutzung der Möglichkeiten dieser neuen, kleineren Fertigungsgröße. Dies zeigt sich in den angesetzten Taktraten, welche gerade im QuadCore-Bereich höher als bei Nehalem sind, und dann natürlich auch in einem besseren Übertaktungsverhalten der Sandy-Bridge-Prozessoren. Der reine Pro/MHz-Gewinn – also daß, was man eigentlich von einer neuen Prozessorenarchitektur erwarten würde – fällt dagegen mit runden 15 Prozent eher mittelprächtig aus. Dies hängt primär daran, daß die großen Verbesserungen mit einer Ausnahme (AVX) ausgeblieben sind, an Sandy Bridge wurde in erster Linie sehr viel im Detail optimiert – wobei jede der Detailoptimierungen für sich gesehen wohl relativ wenig bringt und erst die Summe aller Optimierungen für die (etwas) höhere Pro/MHz-Leistung steht.

Erwähnenswert unter den ganzen Detailänderungen ist vielleicht der Level3-Cache, welcher bei Sandy Bridge nunmehr mit Prozessorentakt betrieben wird und nicht mehr wie bei Nehalem mit dem Uncore-Takt (fest auf zwischen 2.13 und 2.66 GHz). Dies ist relevant für die schneller getakteten Prozessoren (und auch für übertaktete Prozessoren), da diese bei Sandy Bridge durch diese Maßnahme besser mit höheren Taktfrequenzen skalieren dürften. Generell betrachtet ist Taktraten-Skalierung aber derzeit kein echtes Problem bei Intel, seit den Core-2-Prozessoren skalieren die Intel-Prozessoren sehr gut selbst mit extrem hohen Taktraten.

Bleibt als einzige größere Änderung die neue CPU-Befehlssatzerweiterung AVX, welche früher mal unter dem Namen "SSE5" lief und aufgrund dieser Namenserweiterung auch schon gut einordenbar ist: Grob gesehen handelt es sich erneut um einen Stream-Beschleuniger, welcher durch das Zusammenpacken von mehreren Befehlen in ein größeres Datenformat diese entsprechend schneller ausführen kann. Bei AVX steigt das (maximale) Datenformat von vorher 128 Bit bei SSE4 auf nunmehr 256 Bit, was natürlich in zwei 128-Bit, vier 64-Bit-Datenpakete oder acht 32-Bit-Datenpakete aufgeteilt werden kann. Im Idealfall kann man mittels AVX entsprechend angepassten Programmcode mit ausschließlich streambaren Datenpaketen um das Doppelte gegenüber Nehalem beschleunigen, das zeigen auch entsprechende Benchmarks [5].

Solcherart Programmcode taucht üblicherweise dort auf, wo hohe Datenmengen auf immer die gleichen und nicht voneinander abhängigen Berechnungen treffen – sprich außerhalb des professionellen Bereichs eigentlich nur bei Bild- und Videobearbeitung. Alle andere Software wird durch AVX nur dann profitieren, wenn mal hier und da passende Berechnungen durchgeführt werden müssen – sprich, im zumeist eigentlich unmerkbaren Bereich. Das größtes Problem von AVX ist allerdings der Punkt, daß es bei Microsoft erst mit dem Service Pack 1 von Windows 7 unterstützt wird und eine Unterstützung für frühere Windows-Versionen seitens Microsoft nicht geplant ist.

Der Software-Programmierer, welcher seine Software auf eine AVX-Unterstützung umstellen will, hat somit aktuell nur 25 bis 30 Prozent der weltweiten PC-Basis als Zielmarkt für diese Änderung, da Windows XP bei der installierten PC-Basis noch unglaublich weit verbreitet ist. Damit sinkt der Effekt einer Umstellung der eigenen Software auf AVX deutlich ab und es ist möglich, daß der eine oder andere Software-Entwickler demzufolge mit dem Support von AVX wartet, bis Windows 7 bei der installierten PC-Basis auf freundlichere Werte gekommen ist. Andererseits ist es zu erwarten, daß Programme, welche absolut deutliche Performance-Gewinne durch AVX erwarten können, doch eher früher als später auf AVX umgestellt werden – eben wegen des teilweise heftigen Performance-Gewinns. Trotzdem passiert in dieser Frage nichts über Nacht, üblicherweise dauert eine solche Umstellung einige Jahre bis zur vollständigen Durchsetzung der neuen Technologie.

Eine deutliche Änderung hat der bereits von Nehalem bekannte TurboMode erfahren: Waren die TurboMode-Aufschläge bei Nehalem noch sehr unterschiedlich verteilt (die HighEnd-Prozessoren mit zumeist recht geringen Taktaufschlägen, die LowCost- und Mainstream-Prozessoren mit eher höheren Taktaufschlägen), ist dies bei Sandy Bridge einheitlicher, aber auch niedriger geworden: Bei den "normalen" Modellen gibt es im QuadCore-Betrieb einen TurboMode-Aufschlag von 100 MHz und pro abgeschaltetem Core dann jeweils nochmals 100 MHz mehr – sprich, bis zu 400 MHz TurboMode-Aufschlag im SingleCore-Betrieb (manche Prozessoren sogar mit nur mit maximal 300 MHz mehr). Nur bei den stromsparenden Modellen sind die TurboMode-Aufschläge im SingleCore- und DualCore-Betrieb höher, ausgehend allerdings von deutlich niedrigeren default-Taktraten.

Zwar hat Intel eine neue Funktion eingebaut, die es dem TurboMode erlaubt, kurzfristig (für 30 Sekunden) über das Limit der TDP zu gehen – weil üblicherweise der Prozessor bei Übertaktung nicht umgehend seine Höchsttemperatur erreicht, hier also noch ein gewisser zeitlicher Spielraum existiert. Allerdings macht diese neue Funktion das Kraut auch nicht mehr fett, der neue TurboMode ist wider Erwarten (und trotz der 32nm-Fertigung) handzahmer als der von Nehalem. Vor allem wird das eigentliche Ziel des TurboMode nicht erreicht, im Fall der Belastung weniger Cores deutlich mehr Takt zur Verfügung zu stellen – dies trifft wie gesagt nur auf die stromsparenden S- und T-Modelle zu:

SingleCore DualCore TripleCore QuadCore
Core i3-2100T (2.5 GHz), Core i3-2100 (3.1 GHz), Core i3-2120 (3.3 GHz) - - - -
Core i5-2300 (2.8 GHz), Core i5-2400 (3.1 GHz), Core i5-2500 (3.3 GHz), Core i5-2500K (3.3 GHz) +300 MHz +200 MHz ? +100 MHz
Core i7-2600 (3.4 GHz), Core i7-2600K (3.4 GHz) +400 MHz +300 MHz +200 MHz +100 MHz
Core i5-2390T (2.7 GHz) +800 MHz +400 MHz - -
Core i5-2400S (2.5 GHz) +800 MHz +700 MHz ? +100 MHz
Core i5-2500T (2.3 GHz), Core i5-2500S (2.7 GHz), Core i7-2600S (2.8 GHz) +1000 MHz +900 MHz ? +100 MHz

Man muß wohl ganz deutlich davon abkommen, bei der Nennung des TurboMode-Takts eines Prozessors immer den TurboMode-Höchsttakt anzugeben – weil der nunmehr klar nur im SingleCore-Modus erreicht wird, was aber unter Windows eher selten vorkommt (zwar belasten viele Programme nach wie vor nur einen Prozessorkern, die Windows-Hintergrundtätigkeiten halten üblicherweise aber immer einen weiteren Prozessorkern am laufen). Und selbst die DualCore-Aufschläge sind meist eher unbeachtenswert – 200 oder 300 MHz Taktaufschlag ergeben bei den hohen Taktraten der entsprechenden Sandy-Bridge-Prozessoren gerade einmal zwischen 6 und 9 Prozent Mehrtakt.

Die grundsätzliche Idee, mittels des TurboMode deutlich mehr SingleCore- und DualCore-Performance zur Verfügung zu stellen, erfüllt der TurboMode nunmehr nur bei den stromsparenden S- und T-Modellen – dort allerdings auf Kosten einer teilweise deutlich niedrigeren QuadCore-Performance durch geringere default-Taktraten. Nichtsdestotrotz ist dies ein interessanter Tausch: Unter SingleCore und DualCore sind die S- und T-Modelle trotz niedrigerer default-Taktraten mittels hoher TurboMode-Aufschläge nicht langsamer als die normalen Modelle, nur im QuadCore-Bereich gibt es ein paar Performance-Einbußen, denen allerdings bei den S- und T-Modellen eine deutlich freundlichere TDP gegenübersteht. Ein gutes Beispiel hierfür ist der Core i7-2600S mit 2.8 GHz, da dieser Prozessor zu einer TDP von 65 Watt eine anständige QuadCore-Performance bietet und mittels TurboMode im SingleCore-Bereich auf 3.8 GHz Takt und im DualCore-Bereich auf 3.7 GHz Takt kommt und dort (theoretisch) nicht langsamer ist als selbst das Top-Modell Core i7-2600K.

Von diesen Ausnahmen bei den S- und T-Modellen abgesehen ist der Effekt des TurboMode auf die Performance der normalen Sandy Bridge Desktop-Prozessoren eher gering und liegt im Bereich von null bis bestenfalls fünf Prozent. Im Mobile-Bereich operiert Intel dagegen durchgehend mit höheren TurboMode-Aufschlägen, allerdings dürfte dann viel eher die TDP als limitierender Faktor greifen und somit auch dort wirklich deutliche Performancegewinne durch den TurboMode verhindern. Generell betrachtet (und natürlich mit Ausnahmen) ist der TurboMode auch bei Sandy Bridge immer noch im Status eines netten Gimmicks, aber noch kein Feature mit echter Zugkraft.

Eine elementare Änderung von Sandy Bridge betrifft die Übertaktungs-Funktionen: Erstens einmal wird hierbei durch die Koppelung diverser Systemtakte die bisher gern benutzte Bus-Übertaktung faktisch unmöglich gemacht, entsprechende Versuche scheierten meist schon bei mehr als (lächerlichen) 5 Prozent Übertaktung. Unklar ist an dieser Stelle aber weiterhin, ob die Mainboard-Hersteller dieses Problem nicht durch den Verbau weiterer Taktgeber lösen könnten – bisher ist davon noch nichts zu sehen, obwohl dies technisch (mit einem gewissen Aufwand) möglich sein sollte. Eventuell stehen die Mainboard-Hersteller aber auch bei Intel im Wort, keine solche Funktionalität anzubieten, denn Intel will ab Sandy Bridge Übertaktung eigentlich nur noch per Multiplikator sehen.

Hierfür dienen die K-Modelle des Sandy-Bridge-Portfolios, welche über einen freien Multiplikator verfügen, derzeit also bis 5.7 GHz übertaktbar sind – sofern der Prozessor dies mitmacht. Wie schon erwähnt soll allerdings nur der P67-Chipsatz über die entsprechende Funktionalität verfügen – und wie ebenfalls schon erwähnt, ist unklar, warum dies nicht auch mit anderen Chipsätzen möglich sein soll, schließlich ist das Übertakten per Multiplikator eine reine BIOS-Funktion. Der TurboMode skaliert im übrigen jeweils mit der Übertaktung mit nach oben, dieser ist also unter Umständen für einen maximalen Übertaktungserfolg der K-Modelle auszuschalten.

In der Praxis gibt es derzeit mit Core i5-2500K (3.3 GHz) und Core i7-2600K (3.4 GHz) nur zwei K-Prozessoren mit freiem Multiplikator und zudem ziemlich eng aneinanderliegenden Taktfrequenzen, so daß sich kaum ein Unterschied bei den in den Launch-Reviews aufgestellten Übertaktungsergebnissen zeigt. Im Schnitt liegen beide Prozessoren bei 4.6 bis 4.7 GHz Übertaktungserfolg, insofern erscheint es aus Sicht der Übertaktung ziemlich egal, ob man zum Core i5-2500K oder zum Core i7-2600K greift. Beachtenswert ist zudem, das bei maßvoller Spannungszugabe bis 1.35V fast immer mindestens 4.5 GHz herauskamen – das weitere Zugeben von mehr Spannung lockt dann meist noch 100 bis 200 MHz Mehrtakt heraus, lohnt aber angesichts der damit verbundenen Risiken (stärkere CPU-Alterung) nicht wirklich.

Core i5-2500K (3.3 GHz) Core i7-2600K (3.4 GHz)
AnandTech [6] - @ 4.42 GHz mit 1.272V
Benchmark Reviews [7] - @ 4.73 GHz
Bit-Tech [8] @ 4.90 GHz mit 1.35V @ 4.80 GHz mit 1.35V
Bjorn3D [9] - @ 4.80 GHz
ComputerBase [10] @ 4.50 GHz mit 1.336V @ 5.00 GHz mit 1.400V
Guru3D [11] - @ 4.29 GHz mit 1.248V
Hardware.fr [12] @ 4.58 GHz mit 1.416V @ 4.68 GHz mit 1.416V
Hartware [13] @ 4.60 GHz mit 1.384V @ 4.80 GHz mit 1.360V
Hot Hardware [14] - @ 4.57 GHz mit 1.35V
HT4U [15] @ 4.49 GHz mit 1.336V @ 4.59 GHz mit 1.320V
Legit Reviews [16] - @ 4.9 GHz mit 1.525V
Neoseeker [17] @ 4.68 GHz mit 1.400V @ 4.58 GHz mit 1.400V
Overclockers Club [18] @ 4.77 GHz mit 1.416V @ 4.60 GHz mit 1.384V
PC Games Hardware [19] - @ 4.80 GHz mit 1.4V
PC Perspective [20] - @ 4.51 GHz mit 1.320V
PureOC [21] @ 4.42 GHz mit 1.360V @ 4.84 GHz mit 1.456V
The Tech Report [22] - @ 4.50 GHz mit 1.304V
Durchschnitt @ 4.61 GHz @ 4.67 GHz

Damit liegt man zweifelsfrei gut gegenüber der Core-2- und der Nehalem-Architektur, wo doch schon deutlich früher Schluß war beim Übertakten von QuadCore-Prozessoren. Als (defensiv angesetztes) Taktziel bei Übertaktung kann man beim Core 2 Quad in etwa 3.6 GHz ansehen, bei den Nehalems dann 3.8 GHz – hier kann Sandy Bridge mit 4.5 GHz dann die Vorteile der 32nm-Fertigung voll ausspielen. Prozentual gesehen sind dies im übrigen gegenüber dem Core 2 Quad 25 Prozent und gegenüber Nehalem 18 Prozent mehr Takt durch Übertaktung. Zudem ist zu erwarten, daß die 32nm-Fertigung im Laufe des Jahres in kleinen Schritten verbessert wird und mit der Zeit also noch bessere Übertaktungsergebnisse bei Sandy-Bridge-Prozessoren neueren Baudatums möglich werden.

Bei den restlichen Modellen des Sandy-Bridge-Portfolios ist dann reguläres Übertakten wie gesagt nicht mehr möglich – mit einer kleinen Ausnahme: Man kann den TurboMode – sofern beim konkreten CPU-Modell vorhanden – um 400 MHz nach oben setzen. Jede einzelne TurboMode-Stufe wird dann um 400 MHz erhöht: Ein Core i5-2500 mit regulär 3.3 GHz Takt geht im TurboMode dann nicht mehr auf 3.7 GHz (SingleCore), 3.6 GHz (DualCore), 3.5 GHz (TripleCore) und 3.4 GHz (QuadCore) hinauf, sondern auf 4.1 GHz (SingleCore), 4.0 GHz (DualCore), 3.9 GHz (TripleCore) und 3.8 GHz (QuadCore). Der reguläre Takt ohne TurboMode ist davon allerdings nicht betroffen und das Feature funktioniert, da es nur die TurboMode-Frequenzen erhöht, eben auch nur mit aktivem TurboMode – und erneut offiziell nur mit dem P67-Chipsatz.

Von den teilweise in einigen Launch-Artikeln angegangenen Experimenten mit der gleichzeitigen Busübertaktung, um gerade die non-K-Modelle noch stärker zu übertakten, möchten wir im übrigen dringend abraten: Wenn das Bussystem üblicherweise schon bei fünfprozentiger Übertaktung austeigt, dann ist eben dieses Bussystem als äußerst heikel in Bezug auf seine Taktraten zu betrachten – und dann sollte man diese 5 Prozent doch als Reserve belassen und nicht ausnutzen. Die Aktivierung jeglicher Übertaktungsfunktionen geht im übrigen nach wie vor mit einem totalen Garantieverlust einher, auch bei den K-Modellen mit explizit freiem Multiplikator.


Kommentare - Registrierung ist nicht notwendig [3]
Und damit zum Prozessor selber bzw. den Änderungen der Sandy-Bridge-Architektur: Größtes Merkmal von Sandy Bridge ist sicherlich die durchgehende 32nm-Fertigung und die damit einhergehende Ausnutzung der Möglichkeiten dieser neuen, kleineren Fertigungsgröße. Dies zeigt sich in den angesetzten Taktraten, welche gerade im QuadCore-Bereich höher als bei Nehalem sind, und dann natürlich auch in einem besseren Übertaktungsverhalten der Sandy-Bridge-Prozessoren. Der reine Pro/MHz-Gewinn - also daß, was man eigentlich von einer neuen Prozessorenarchitektur erwarten würde - fällt dagegen mit runden 15 Prozent eher mittelprächtig aus. [23]

Launch-Analyse: Intel Sandy Bridge (Seite 3)

Dienstag, 4. Januar 2011
 / von Leonidas [1]
 

Bleibt ein Technik-Thema übrig: Das der neuen integrierten Grafiklösungen. Diese nennen sich Intel HD Graphics 2000 mit 6 "Execution Units" sowie Intel HD Graphics 3000 mit 12 "Execution Units" und bieten nur DirectX 10.1, aber eine gegenüber der bisherigen integrierten Nehalem-Grafik teilweise deutlich verbesserte Performance. Denn dies trifft nur auf die Intel HD Graphics 3000 zu, welche deutlich schneller ist als bisherige integrierte Grafik ist und sogar die Performance einer Radeon HD 5450 überbieten kann. Die Intel HD Graphics 2000 ist dagegen nur knapp schneller als die integrierte Nehalem-Grafik und liegt in etwa auf dem Performanceniveau der integrierten Grafikchips von AMD.

Wirklich als Spieler-Lösung selbst für den Einsteigerbereich sind beide Sandy-Bridge-Grafiklösungen aber nicht geeignet, weil flüssige Frameraten meist nur auf Auflösungen bis zu 1280x1024 erreicht werden. Eine Radeon HD 5550 erreicht schnell das Doppelte bis Dreifache der Frameraten einer Intel HD Graphics 3000 und hat demzufolge dann auch die Reserven, Spiele in der nativen Display-Auflösung nutzen zu können. Wer Spielefähigkeit wünscht – selbst nur für ein "Spielchen zwischendurch" – kommt weiterhin kaum um eine extra Grafikkarte herum. Die sicherlich beachtenswerte Performancesteigerung der integrierten Sandy-Bridge-Grafik reicht immer noch nicht aus, um mehr als eine grundsätzliche Spiele-Fähigkeit zur Verfügung zu stellen – aber eben keine echte Spiele-Tauglichkeit.

Zudem wird das Bild durch einige weitere Punkte getrübt: Erstens wird die Performance nicht unter einer gleichwertigen Filterqualität [24] erreicht – der anisotrope Filter von Intel ist stark winkelabhängig und weit entfernt von den hohen Standards von AMD und nVidia. Und zweitens hat die Intel-Grafiklösung weiterhin ihre Probleme mit diversen Spielen [25], die entweder gar nicht starten oder verschieden schwere Grafikfehler bringen – bis hin sogar zu Bluescreens. Ein sofort nutzbarer Ersatz für LowCost-Grafiklösungen von AMD und nVidia ist die Intel-Grafik damit nur außerhalb des 3D-Feldes – und dafür braucht sie dann aber ihre gestiegene 3D-Performance nicht. Intel hat hier noch sehr viel Arbeit vor sich, damit man wirklich auf Augenhöhe mit den Grafikchips von AMD und nVidia operieren kann, rein eine gleichwertige LowCost-Performance ist hierzu nicht ausreichend.

Und damit zur alles entscheidenden Frage der Performance der reinen CPU. Hierzu gibt es jede Menge Benchmarks, allerdings haben viele Tester vergessen, dem Leser ein Gesamtbild zu vermitteln, so daß man sich oftmals in haufenweise Benchmark-Diagrammen verliert. Als relevant für eine grundsätzliche Betrachtung der Sandy-Bridge-Architektur sehen wir zuerst einmal eine Herausarbeitung der Pro/MHz-Performance an, was nur mit Benchmarks auf vergleichbarer Taktrate möglich ist. Sehr hilfreich hierzu sind die Benchmarks der ComputerBase [26], da auf gleichen Taktraten ausgeführt und gut zusammengefasst:

Anwendungen Spiele (LowQuality)
Core i7-2600K @ 2.8 GHz +HT +TM ¹ +12,6% (-11,4%) +0,1% (-0,1%)
Core i7-2600K @ 2.8 GHz -HT +TM ¹ +3,7% (-3,6%) +4,0% (-3,8%)
Core i7-2600K @ 2.8 GHz +HT -TM +8,7% (-8,0%) -1,0% (+1,0%)
Core i7-2600K @ 2.8 GHz -HT -TM 100% 100%
Core i7-930 @ 2.8 GHz +HT +TM -6,1% (+6,5%) -8,8% (+9,7%)
Core i7-930 @ 2.8 GHz +HT -TM -10,3% (+11,5%) -12,4% (+14,1%)
Core i7-930 @ 2.8 GHz -HT -TM -18,3% (+22,5%) -12,3% (+14,0%)
Core 2 Quad Q9550 @ 2.83 GHz -HT -TM -26,1% (+35,2%) -32,6% (+48,4%)
¹ Hochrechnung, da keine explizite Messung dieser Settings vorliegt (der Core i7-2600K gewinnt auf seinem default-Takt bei aktivem HyperThreading 3,8% in Anwendungen und 1,0% in LQ-Spielen durch den TurboMode sowie ohne aktives HyperThreading 3,7% in Anwendungen und 4,0% in LQ-Spielen durch den TurboMode)

Danach läßt sich grob sagen (Mix aus Anwendungs- und Spiele-Performance), daß im QuadCore-Feld Intel durch Sandy Bridge ca. 15 Prozent Pro/MHz-Leistung gegenüber Nehalem hinzugewonnen hat, unter Einbeziehung der Effekte von HyperThreading und TurboMode. Gegenüber der Core-2-Architektur beträgt der Pro/MHz-Gewinn sogar satte 50 Prozent – das ist dann mal eine Hausnummer, die sich absolut sehen lassen kann. Entscheidet man sich für ein Sandy-Bridge-Modell ohne HyperThreading, liegen diese Werte immer noch bei 12 bzw. 47 Prozent. Man verliert also nur unmerkbare 2½ Prozent durch den Verzicht auf HyperThreading bei Sandy Bridge – bis auf Spezialfälle besteht keine Notwendigkeit zum Griff zu HyperThreading bei Sandy Bridge.

 Performance-Hochrechnung (gleicher Takt)

Richtig interessant wird das ganze aber erst, wenn man es mit den üblichen Übertaktungen zusammenrechnet. Dies ist gerade für Core-2-Nutzer relevant, welche mit ihren zumeist hohen Übertaktungen für eine lange Laufzeit des Systems gesorgt haben und sich nun fragen, ob Sandy Bridge wirklich Sinn macht angesichts von quicklebendigen Core-2-Prozessoren nahe der 4-GHz-Grenze. Ausgehend von üblichen Übertaktungserfolgen und der vorstehend genannten Mehrperformance im Pro/MHz-Vergleich ergibt sich dabei folgende Hochrechnung (eingerechnet wurden 85% Skalierung mit steigender Taktrate bei Core 2 und Sandy Bridge, wegen des nicht mit dem Takt skalierenden Level3-Caches bei Nehalem jedoch nur 75% Skalierung mit steigender Taktrate):

 Performance-Hochrechnung (übertaktet)

Leider ist das ganze nur eine (fehlbare) Hochrechnung, weil erstaunlicherweise solcherart Benchmarks in den Launch-Artikeln kaum angetreten wurden – dabei ist es aufgrund der Einfachheit, einen Core 2 Quad oder Nehalem zu übertakten (und gleiches gilt natürlich auch für die K-Modelle von Sandy Bridge) eigentlich naheliegend, dieses bei den Nutzern häufig anzutreffende Szenario nachzumessen. Dabei zeigt gerade der Vergleich im Overclocking-Modus die Stärken von Sandy Bridge viel deutlicher auf: Sandy Bridge liegt übertaktet viel weiter vor Core 2 Quad und Nehalem als im unübertakteten Auslieferungszustand. Während der Sprung vom übertakteten Core 2 Quad zum übertakteten Nehalem noch sehr überschaubar ist, legt der übertaktete Sandy Bridge deutlichst an Performance oben drauf.

Und damit läßt sich auch die eigentliche Frage, die sich aus dem Sandy-Bridge-Launch ergibt, beantworten: Kann Sandy Bridge ein erstklassiger Ersatz für gut übertaktete Core 2 Quad Systeme sein? Einfache Frage, einfache Antwort – ja, auf jeden Fall, der Performancegewinn ist mit zwischen hochgerechnet 70 und 80 Prozent absolut überzeugend. Selbst auf 4.0 GHz laufende Core-2-Quad-Systeme werden deutlich mit hochgerechnet ca. 60 Prozent Performancegewinn geschlagen – bei einer Standard-Übertaktung bei Sandy Bridge von 4.5 GHz, welche sicherlich bei den allermeisten dieser Prozessoren erreichbar sein wird. Insofern ist Sandy Bridge ein bei der Performance doch absolut überzeugendes Produkt geworden. Daß man die direkt vorhergehende Nehalem-Architektur nicht so deutlich hinter sich läßt, ist dagegen verständlich, denn nicht aller Tage passiert so ein gewaltiger Sprung wie seinerzeit zwischen Pentium 4 und Core 2.

Hinzu kommt als Bonus, daß die Verbrauchswerte der Sandy Bridge QuadCore-Modelle sehr gut aussehen und trotz höherem Takt deutlich unter denen der schnellsten Nehalem QuadCore-Modelle liegen. Ein Core i7-2600K mit 3.4 GHz Takt verbraucht in etwa so viel wie ein Core 2 Quad oder Nehalem auf 3.0 GHz, was auf einen reinen CPU-Verbrauch (echte Messungen hierzu liegen noch nicht vor) von grob 70 Watt für das aktuelle Sandy-Bridge-Topmodell schließen läßt. Ein Core i5-2300 mit nur 2.8 GHz default-Takt dürfte locker unterhalb von 60 Watt Verbrauch liegen und könnte demzufolge eigentlich sogar das 65W-TDP-Siegel erhalten.

Allerdings finden sich im regulären Sandy-Bridge-Portfolio derzeit noch keine QuadCore-Modelle mit (realen) Verbrauchswerten bis maximal 40 Watt, welche (real) von den Core 2 Quad Q8xxx Modellen geboten werden. Zwar gibt es den Core i5-2500T mit einer TDP von 45 Watt, der diesen Wert erreichen sollte – diese CPU kostet allerdings auch 216 Dollar bei nur 2.3 GHz default-Takt, während es die Core 2 Quad Q8xxx Modelle für üblicherweise um die 130 Euro [27] mit sogar etwas besseren Taktfrequenzen zum niedrigeren Preis gibt. Für den (sicherlich speziellen) Fall eines besonders laufruhigen QuadCore-Systems ist nach wie vor der Core 2 Quad mit im Feld der Möglichkeiten – ansonsten aber löst Intel mit Sandy Bridge faktisch alle anderen vorherigen Intel-Prozessoren gleichwertig oder besser ab.

Dabei besteht derzeit sicherlich kein besonderer Zwang zur Aufrüstung, wenn man schon ein schnelles PC-System hat – momentan fehlen breitflächig einfach die Performance-fressenden Anwendungen, um so etwas rechtfertigen zu können. Aber für einen Neukauf ist Sandy Bridge klar zu empfehlen, da Preis, Performance, Übertaktungsspielraum und Verbrauchswerte ein sehr rundes Gesamtpaket ergeben. AMD hingegen hatte schon seine liebe Mühe mit den Nehalem-Prozessoren und sieht gegen die neuen Sandy-Bridge-Prozessoren nun gar keinen Land mehr – AMD braucht zweifelsfrei die dieses Jahr anstehenden neuen CPU-Architekturen Llano und Bulldozer [28], um zu Intel aufschließen und eventuell sogar mithalten zu können.


Kommentare - Registrierung ist nicht notwendig [3]
Bleibt ein Technik-Thema übrig: Das der neuen integrierten Grafiklösungen. Diese nennen sich Intel HD Graphics 2000 mit 6 "Execution Units" sowie Intel HD Graphics 3000 mit 12 "Execution Units" und bieten nur DirectX 10.1, aber eine gegenüber der bisherigen integrierten Nehalem-Grafik teilweise deutlich verbesserte Performance. Denn dies trifft nur auf die Intel HD Graphics 3000 zu, welche deutlich schneller ist als bisherige integrierte Grafik ist und sogar die Performance einer Radeon HD 5450 überbieten kann. Die Intel HD Graphics 2000 ist dagegen nur knapp schneller als die integrierte Nehalem-Grafik und liegt in etwa auf dem Performanceniveau der integrierten Grafikchips von AMD.
[29]
  • Prozessoren & Speicher

Quellen-URL: http://www.3dcenter.org/artikel/launch-analyse-intel-sandy-bridge

Verweise:
[1] http://www.3dcenter.org/users/leonidas
[2] http://ht4u.net/reviews/2011/intel_sandy_bridge_sockel_1155_quadcore/index8.php
[3] http://www.forum-3dcenter.org/vbulletin/showthread.php?t=500121
[4] http://www.3dcenter.org/artikel/launch-analyse-intel-sandy-bridge
[5] http://ht4u.net/reviews/2011/intel_sandy_bridge_sockel_1155_quadcore/index18.php
[6] http://www.anandtech.com/show/4083/the-sandy-bridge-review-intel-core-i5-2600k-i5-2500k-and-core-i3-2100-tested/3
[7] http://benchmarkreviews.com/index.php?option=com_content&task=view&id=622&Itemid=63&limit=1&limitstart=12
[8] http://www.bit-tech.net/hardware/cpus/2011/01/03/intel-sandy-bridge-review/5
[9] http://www.bjorn3d.com/read.php?cID=1979&pageID=9990
[10] http://www.computerbase.de/artikel/prozessoren/2011/test-intel-sandy-bridge/50/
[11] http://www.guru3d.com/article/core-i5-2500k-and-core-i7-2600k-review/11
[12] http://www.hardware.fr/articles/815-14/intel-core-i7-core-i5-lga-1155-sandy-bridge.html
[13] http://hartware.net/review_1213_11.html
[14] http://hothardware.com/Reviews/Intel-Core-i72600K-and-i52500K-Processors-Debut/?page=3
[15] http://ht4u.net/reviews/2011/intel_sandy_bridge_sockel_1155_quadcore/index33.php
[16] http://www.legitreviews.com/article/1501/7/
[17] http://www.neoseeker.com/Articles/Hardware/Reviews/Intel_i7_2600K_i5_2500K/5.html
[18] http://www.overclockersclub.com/reviews/intel_corei7_2600k_and_corei5_2500k/5.htm
[19] http://www.pcgameshardware.de/aid,805899/Intel-Sandy-Bridge-im-CPU-Test-Core-i7-2600K-Core-i5-2500K-und-Core-i5-2400-auf-dem-Pruefstand/CPU/Test/?page=4
[20] http://www.pcper.com/article.php?aid=1057&type=expert&pid=13
[21] http://www.pureoverclock.com/review.php?id=1178&page=5
[22] http://techreport.com/articles.x/20188/18
[23] http://www.3dcenter.org/artikel/launch-analyse-intel-sandy-bridge/launch-analyse-intel-sandy-bridge-seite-2
[24] http://ht4u.net/reviews/2011/intel_sandy_bridge_sockel_1155_quadcore/index25.php
[25] http://www.computerbase.de/artikel/prozessoren/2011/test-intel-sandy-bridge/53/
[26] http://www.computerbase.de/artikel/prozessoren/2011/test-intel-sandy-bridge/46/
[27] http://www.preisroboter.de/search.php?search=Core+2+Quad+Q8200
[28] http://www.3dcenter.org/news/amd-bobcat-llano-bulldozer
[29] http://www.3dcenter.org/artikel/launch-analyse-intel-sandy-bridge/launch-analyse-intel-sandy-bridge-seite-3