28

News des 28. April 2011

Expreview hat mit dem 17. Mai einen Launch-Termin für die GeForce GTX 560 (ohne "Ti"), der kleineren GF114-Ausführung. Derzeit wird diese neue Performance-Karte als mit 336 Shader-Einheiten, 56 TMUs, 32 ROPs und einem 256 Bit DDR Speicherinterface ausgerüstet beschrieben, der Chiptakt soll nicht unterhalb von 800 MHz liegen. In wie weit diese Angaben eine reale Grundlage haben oder aber nur gut geraten sind, ist derzeit jedoch unklar – so richtige Daten auf Basis von Wissen gibt es zu dieser Karte allerdings noch nicht. Nichtsdestotrotz: Mit diesen Daten würde sich die GeForce GTX 560 ziemlich in die Mitte zwischen GeForce GTX 460 1024MB und GeForce GTX 560 Ti legen, in etwa auf dem Niveau einer gut ab Werk übertakteten GeForce GTX 460 1024MB. Bei angenommen exakt 800 MHz Chiptakt der GeForce GTX 560 hätte diese Karte 18 Prozent mehr Rechenleistung als die GeForce GTX 460 1024MB zur Verfügung, während die GeForce GTX 560 Ti wiederum 18 Prozent mehr Rechenleistung als die GeForce GTX 560 hätte.

GeForce GTX 460 1024MB GeForce GTX 560 GeForce GTX 560 Ti
Chipbasis nVidia GF104, 1950 Millionen Transistoren in 40nm auf 365mm² Die-Fläche nVidia GF114, 1950 Millionen Transistoren in 40nm auf 358mm² Die-Fläche
Technik DirectX 11, 2 Raster Engines, 7 Polymorph Engines mit 7 Tesselations-Einheiten, 336 Shader-Einheiten, 56 TMUs, 56 SFUs, 32 ROPs, 256 Bit DDR Interface (bis GDDR5) DirectX 11, 2 Raster Engines, 8 Polymorph Engines mit 8 Tesselations-Einheiten, 384 Shader-Einheiten, 64 TMUs, 64 SFUs, 32 ROPs, 256 Bit DDR Interface (bis GDDR5)
Taktraten 675/1350/1800 MHz >=800 MHz Chiptakt 822/1644/2000 MHz
Rohleistungen 902 GFlops
37,8 MTex/sec
115 GB/sec
>=1068 GFlops
>=44 MTex/sec
1262 GFlops
52,6 MTex/sec
128 GB/sec
Spieleverbrauch 123W ? 153W
Preisbereich 132-150 Euro ? 181-200 Euro

Aufgrund dieser Ausgangslage bei der Performance steht zu erwarten, daß die GeForce GTX 460 1024MB weiterhin am Markt bleiben dürfte und die neue GeForce GTX 560 sich preislich schlicht zwischen diesen Karten einordnet – auf vielleicht 150 Euro. Die GeForce GTX 460 1024MB hat zwar weiteres Preispotential nach unten hin, aber derzeit sieht es noch nicht nach einem Auslaufen dieser Karte aus der originalen Fermi-Generation aus, schließlich werden sogar noch GeForce GTX 470 & 480 Karten verkauft. Langfristig gesehen wird die GeForce GTX 560 natürlich die Rolle der GeForce GTX 460 1024MB einnehmen und bei einem Auslaufen der GeForce GTX 460 kann man dann auch auf gute Abverkaufspreise dieser spekulieren – wie derzeit bei den Sapphire Radeon HD 5830 & 5850 Xtreme-Karten zu beobachten. Allerdings ist über das Jahr über noch viel Zeit für dieserart Angebotsbereinigungen, denn gerade nach der GeForce GTX 560 steht sowohl bei AMD als auch bei nVidia bis zum Jahreswechsel nicht performantes mehr an und werden sich somit voraussichtlich nur zähe Preiskämpfe ergeben.

Bei RealWorld Technologies hat man sich mit dem Einfluß der Speicherbandbreite auf die Grafikkarten-Performance beschäftigt und hierzu einige passenden Vergleiche von Grafiklösungen mit der gleichen oder nahezu der gleichen Rechenleistung und aber stark unterschiedlicher Speicherbandbreite herausgesucht. Dabei kamen durchaus beachtbare Unterschiede heraus, im idealsten Beispiel (Mobility Radeon HD 3870 gegen 4670 auf nahezu gleicher Rechenleistung und identischem Technologie-Level) kamen auf 113 Prozent mehr Speicherbandbreite immerhin 36 Prozent mehr Performance heraus. Andere Beispiele brachten mal größere und mal kleinere Differenzen hervor, wobei diese auch an den von RealWorld Technologies nicht beachteten Nebenpunkten wie differierender Anzahl an TMUs und ROPs liegen können. Trotz der Ungenauigkeit der Vergleiche ließ sich aber erkennen, daß bei schnelleren Lösungen der Einfluß der Speicherbandbreite klar abnahm – es kommt halt auf die zur Performance der jeweiligen Karte passende Speicherbandbreite an, nicht auf beliebige Steigerungen.

Allerdings haben sich RealWorld Technologies sowieso eher auf die niedrigen Performance-Gefilde konzentriert und wollten mit ihrer Aufstellung primär die Frage aufwerfen, woher zukünftige integrierte Grafikchips ihre Bandbreite für eine gute Performance beziehen wollen. Und dies ist in der Tat eine interessante Frage, welche sich wohl erstmals beim kommenden Llano-Prozessor stellen wird, welche zwar über eine potente AMD-Grafik mit bis zu 400 Shader-Einheiten auf 600 MHz Chiptakt verfügt, aber nur mit einem DualChannel-Speicherinterface bis DDR3/1866 für CPU und GPU zusammen in den Ring steigt. Dies sind gerade einmal 30 GB/sec gesharte Speicherbandbreite – nehmen wir den Idealfall, daß der integrierte Radeon-Chip sich davon 80% greifen kann, dann entspricht dies umgerechnet auf die Verhältnisse von extra Grafikkarte einem 128 Bit DDR Speicherinterface mit DDR3-Speicher und 750 MHz Speichertakt. Dies ist selbst für Mainstream-Verhältnisse unterdurchschnittlich und so könnte die Llano-Grafikeinheit mehrheitlich an ihrer Speicherbandbreite hängen.

Für Llano mag dies aber gerade noch so angehen, schließlich gibt es bei den extra Grafikkarten ähnlich ausgeführte Modelle mit vergleichbarer Rechenleistung und Speicherbandbreite (Radeon HD 5550 DDR3) – die sich ergebende Frage ist wie gesagt eher, wie man dieses Problem bei zukünftigen integrierten Grafiklösungen lösen will. Der augenscheinliche Weg führt über die blanke Erhöhung der Speicherbandbreite – was angesichts der Taktlimits von DDR3-Speicher nur über größere Speicherinterfaces lösbar wäre. Für den Mainstream-Markt ist dies aber keine gute Lösung, weil dann mehr Speicherbänke auf den Mainboards zu bestücken wären. Ein QuadChannel-Interface wie in den kommenden Sandy Bridge E Prozessoren bedingt eben auch mindestens vier Speicherbänke auf dem Mainboard, die zur Ausnutzung dieses Speicherinterfaces auch alle bestückt werden müssen – kein Problem im HighEnd-Markt, aber im Mainstream-Markt mit seiner starken OEM-Lastigkeit kaum durchsetzbar aufgrund der höheren Kosten durch vier anstatt zwei Speicherriegel sowie die entsprechend aufwendigeren Mainboard-Layouts.

Weil dieser Weg also weitgehend versperrt ist, müssen andere Lösungen her – oder aber die integrierte Grafik klopft mit Llano an die Schwelle des Mainstream-Segments – nur um dann dort zu verharren, während bei den extra Grafikkarte die Entwicklung sicherlich nicht stehenbleibt. Eine Möglichkeit wäre diejenige eines eingebetteten Speichers, welcher mit höherer Bandbreite angebunden werden kann als der Hauptspeicher – an so etwas arbeitet Intel für die kommenden Ivy-Bridge-Architektur. Eher mittel- und langfristig kann man natürlich auch auf die höheren Taktraten von DDR4-Speicher hoffen, dieser ist allerdings kaum vor dem Jahr 2013 im Massenmarkt zu erwarten und dürfte anfänglich (man erinnere sich an den Start von DDR3-Speicher) auch zu teuer für Mainstream-PCs sein. Eine durchschlagskräftige Lösung für diese Problematik scheint noch nicht gefunden und so steht zu erwarten, daß integrierte Grafik möglicherweise mit dem LowCost-Segment von extra Grafikkarten aufräumt, aber nie mehr als untere Mainstream-Performance bringen wird – sprich Einsteiger-Niveau. Es mag für die CPU-Bauer recht problemlos sein, viel Grafik-Rechenleistung zu integrierten, die benötigte Speicherbandbreite für höhere Performance-Sphären ist dagegen bei weitem nicht so einfach realisierbar und das Performance-Niveau von integrierten Grafiklösung damit auch in Zukunft deutlich limitiert.

AnandTech haben noch einmal weitere Details zu den im vierten Quartal anstehenden Sandy Bridge E Prozessoren bzw. den einzelnen Modellen dieser HighEnd-Architektur. Neu ist hierbei die Nennung der TurboMode-Taktfrequenzen, wobei Intel-typisch leider nur die maximale TurbMode-Frequenz angegeben wurde, welche üblicherweise nur im Einkern-Betrieb erreicht wird. Die viel interessanten TurboMode-Aufschläge für den Zweikern-, Vierkern- und Sechskern-Betrieb wurden nicht genannt und sollten niedriger liegen. Auf den TurboMode sollte man aber angesichts von sechs Rechenkernen, bis zu 15 MB Level3-Cache und einer TDP von 130 Watt generell nicht setzen – dieser dürfte an Bord sein, aber bei diesen Prozessoren doch eher wenig ausrichten können. Zudem klärt sich, was Intel mit "limited unlocked" des kleinsten Sandy-Bridge-E-Modell meint: Dieser Prozessor kann auf sechs Taktstufen überhalb des TurboMode-Niveaus übertaktet werden, dies ergibt maximal 4.5 GHz Takt für diesen Vierkerner.

Core i7-2600K SBE 3.6 GHz SBE 3.2 GHz SBE 3.3 GHz
Technik Sandy Bridge, 4 Rechenkerne + HyperThreading, TurboMode, integrierte HD Graphics 3000 Sandy Bridge E, 4 Rechenkerne + HyperThreading, TurboMode, keine Grafik Sandy Bridge E, 6 Rechenkerne + HyperThreading, TurboMode, keine Grafik
Takt 3.4 GHz 3.6 GHz 3.2 GHz 3.3 GHz
TurboMode 3.8/3.7/3.6/3.5 GHz max. 3.9 GHz max. 3.8 GHz max. 3.9 GHz
Übertaktung unlimitiert limitiert auf maximal 4.5 GHz unlimitiert unlimitiert
PCI Express integriertes PCI Express 2.0 x 16 Interface, aufteilbar in 2x8 integriertes PCI Express 3.0 x16 Interface, aufteilbar in 2x16 oder 4x8
TDP 95W 130W 130W 130W
Preislage Listenpreis 317$
Straßenpreis ab 244 Euro
Listenpreis vermutlich ~500$ Listenpreis vermutlich ~700$ Listenpreis wahrscheinlich 999$
Plattform Z68/P67/H67 – nativer Support von SATA III und USB 2.0 X79 – nativer Support von SATA III und USB 2.0, SSD-Caching

Interessant ist daneben der Vergleich der Chipsätze X58 und X79, welcher ergibt, daß Intel beim X79-Chipsatz das integrierte PCI-Express-Interface der Sandy-Bridge-E-Prozessoren nicht nur für Grafikkarten, sondern auch für an PCI Express angebundene Speicherträger (SSDs, HDDs) nutzbar macht – die Daten fließen also nicht mehr über das PCI-Express-Interface des Mainboard-Chipsatzes (und dann mittels DMI zum Prozessor), sondern sind direkt an die CPU angebunden, was niedrigere Latenzen verheisst. Dies könnte interessant werden für direkt an PCI Express angeschlossene Solid State Disks und entspricht generell dem HighEnd-Gedanken der Sandy-Bridge-E-Plattform. Nativer Support für USB 3.0 fehlt allerdings weiterhin – diesen wird Intel erst bei den Ivy-Bridge-Chipsätzen Anfang 2012 bringen. Allerdings dürften auf allen Retail-Boards mit X79-Chipsatz sicherlich extra USB 3.0 Controller sitzen, dies ist heutzutage keine größere Frage bei höherpreisigen Mainboards mehr.