13

Die Nachteile eines "krummen" Speicherinterfaces mit "geraden" Speichermengen

Mit der höchstwahrscheinlich am Donnerstag erscheinenden GeForce GTX 660 Ti tritt – nach der GeForce GTX 550 Ti – erneut eine Grafikkarte mit "krummen" Speicherinterface von 192 Bit DDR Breite, jedoch aber "gerader" Speichermenge von 2 GB GDDR5-Speicher an. Grafikkarten mit "krummen" Speicherinterface gibt es zwar schon recht lange, diese wurden jedoch früher immer mit der dafür exakt passenden Speichermenge ausgestattet – sprich, die Speichermenge war ein (durch 2 teilbares) Vielfaches der Interface-Breite, beispielsweise 768 MB zu 192 Bit bei der GeForce GTX 460 768MB oder auch 1280 MB zu 320 Bit bei der GeForce GTX 570. Mit der GeForce GTX 550 Ti ging nVidia seinerzeit erstmals von diesem erprobten Weg ab und stattet eine Grafikkarte mit "krummen" Speicherinterface von 192 Bit DDR mit einer üblichen Speichermenge von 1 GB GDDR5-Speicher aus – obwohl diese Speichermenge natürlich nicht zu jenem "krummen" Speicherinterface passt.

Technisch wurde dabei nicht anderes getan, als an einen der drei 64-Bit-Controller des Speicherinterfaces der GeForce GTX 550 Ti eine größere Menge Speicher als an die beiden anderen 64-Bit-Controller zu hängen: An den ersten beiden Speichercontrollern hängen bei der GeForce GTX 550 Ti also jeweils 256 MB Speicher, am dritten Speichercontroller dann aber gleich 512 MB Speicher. Bei der GeForce GTX 660 Ti dürfte das gleiche Schema Verwendung finden – nur dann eben mit doppelten Speichermengen, da die Karte gleich mit insgesamt 2 GB GDDR5-Speicher erscheinen wird. Das Problem der geraden Speichermengen an einem "krumme" Speicherinterface wird damit zwar gelöst – die technische Lösung dessen bedingt jedoch neue Probleme, welche bisher die GeForce GTX 550 Ti und zukünftig eben auch die GeForce GTX 660 Ti betreffen werden.

Und zwar sinkt durch diese gemischte Speicherbestückung die praktisch erreichbare Speicherbandbreite erheblich ab. Die eine Hälfte des Speichers von GeForce GTX 550 Ti & 660 Ti wird mit der nominellen Bandbreite von zwei Speichercontrollern erreicht, die andere Hälfte des Speichers muß sich jedoch einen Speichercontroller teilen – und ist demzufolge in der Praxis noch langsamer, als es das 192 Bit DDR Speicherinterface ohnehin schon ist. Dabei existieren zwei Theorien, was hierbei genau passiert: Gemäß Theorie No.1 wird der Speicher bis zur Nutzung von 768 MB (bei 1 GB insgesamt) bzw. 1536 MB (bei 2 GB insgesamt) mit 192 Bit DDR angesteuert, bei Nutzung der restlichen 256 bzw. 512 MB dann jedoch nur noch mit 64 Bit DDR . In diesem Fall würde sich ein Performance-Nachteil erst dann ergeben, wenn man über 768 MB (bei 1 GB insgesamt) bzw. 1536 MB (bei 2 GB insgesamt) Speichernutzung hinausgeht. Gemäß dieser Theorie wären die oberhalb dieser Barrieren liegenden Speicherteile zwar sehr langsam, aber nicht gänzlich nutzlos und keineswegs bremsend.

Diese Theorie No.1 setzt allerdings einen intelligenten Speichercontroller-Algorithmus voraus, welcher die Speichernutzung versucht gleichmäßig auf die drei Controller aufzuteilen. Theorie No.2 tritt dagegen in Kraft, falls dies nicht möglich ist oder aber in der Praxis nicht überall gelingt, wenn also der Speicher mehr oder weniger per Zufall gefüllt wird. Dann läuft die Hälfte des Speichers mit der vollen dafür gedachten Interfacebreite, die andere Hälfte des Speichers aber nur noch mit der Hälfte der dafür gedachten Interfacebreite. Da der Speicher unter dieser Theorie wie gesagt per Zufall gefüllt wird, kann man sich auch nicht aussuchen, daß zuerst die schnellere Speicherhälfte benutzt wird, somit sorgt die schwache Anbindung der langsameren Speicherhälfte auch schon vom ersten benutzten Megabyte an für einen Performanceverlust.

Wieviel dies an effektiver Speicherbandbreite kosten mag, dafür gibt es verschiedene Rechenansätze – welche aber konform von einer effektiven Speicherbandbreite weit unter den offiziellen 192 Bit DDR sprechen. Im schlimmsten Fall ist das 192 Bit DDR Speicherinterface einer GeForce GTX 550 Ti nur marginal schneller als wenn die Karte nur ein 128 Bit DDR Speicherinterface hätte – wie AnandTech schon zum Launch der Karte nachgewiesen haben. Interessant ist, daß dieser seinerzeitige Test mit einer Speicherbeanspruchung von nur 325 MB durchgeführt wurde – wenn Theorie No.1 zutreffen würde, hätte sich bei dieser eher geringfügigen Speicherbeanspruchung keinerlei Nachteil durch ein 192 Bit DDR Speicherinterface ergeben dürfen. Allerdings muß natürlich angemerkt werden, daß nVidia im Laufe der Zeit durch neue Treiber diese damalige Situation verbessert haben könnte – oder aber daß ein Test unter dem CUDA-SDK vielleicht auch nicht auf die Spielerealität zutrifft.

Bandbreite-Test der GeForce GTX 550 Ti
Bandbreite-Test der GeForce GTX 550 Ti © AnandTech
Auf gleichen Taktraten (violette Balken) ist die GeForce GTX 550 Ti mit 192 Bit DDR Interface und 1 GB Speicher nur marginal schneller als die GeForce GTS 450 mit 128 Bit DDR Interface – und deutlich langsamer als die GeForce GTX 460 768MB mit ebenfalls 192 Bit DDR Interface und aber den dafür passenden 768 MB Speicher.

Nichtsdestotrotz gilt es ausgehend von diesem Test festzustellen, daß es einen klaren Verdacht darauf gibt, daß eine "gerade" Speichermenge an einem "krummen" Speicherinterface eher kontraproduktiv ist, weil es die Effektivität des Speicherinterfaces geradezu extrem nach unten drückt. Sollten sich bei der kommenden GeForce GTX 660 Ti das gleiche Verhalten reproduzieren lassen, würde dies bedeuten, daß die Karte mit "nur" 1,5 GB (oder gleich 3 GB) Speicher regelrecht schneller wäre. All dies wäre natürlich sorgsam auszutesten, ehe man hierzu eine Wertung abgibt – die größte Chance liegt wie gesagt darin, daß die neueren nVidia-Treiber viel besser mit dieser ungleichen Speicherbestückung zurechtkommen als zu Zeiten des Launchs der GeForce GTX 550 Ti. Es bleibt zu hoffen, daß sich die kommenden Launchtests zur GeForce GTX 660 Ti dieses Themas annehmen werden – immerhin stellt es eine durchaus relevante Information dar, ob eine GeForce GTX 660 Ti mit 1,5 oder 3 GB Speicher schneller als eine GeForce GTX 660 Ti mit 2 GB Speicher wäre, da entsprechende Hersteller-Ausführungen der GeForce GTX 660 Ti mit 1,5 oder 3 GB Speicher durchaus zu erwarten sind.

Nachtrag vom 13. August 2012

Bei Videocardz gibt es eine hübsche Übersicht der kommenden GeForce GTX 660 Ti Grafikkarten, zu denen deren Hersteller offenbar schon eifrig entsprechende Daten herausgeben bzw. sich diese aufgrund der Marktverfügbarkeit direkt am Launchtag schon automatisch ergeben. Interessant ist dabei, daß schon zwei Karten mit 3 GB Speicher in dieser Übersicht gelistet sind – womit umgehend die vorstehende Meldung zu "krummen" Speicherinterfaces mit "geraden" Speichermengen relevant wird: Denn sollte an den dabei geäußerten Theorien etwas dran sein, dann könnten die 3-GB-Versionen – selbst auf dem Referenztakt und ohne besonders speicherfressende Grafiksettings – schneller als die regulären 2-GB-Versionen der GeForce GTX 660 Ti sein, einfach weil bei der GeForce GTX 660 Ti 3GB der Speicher symmetrisch zum Speicherinterface angebunden ist. Was es natürlich zu beweisen gilt – und hoffentlich wird eine dieser 3-GB-Karten demnächst mal fair (d.h. auf gleichen Taktraten) gegen eine 2-GB-Karte getestet.

Nachtrag vom 19. August 2012

Nach dem Launch der GeForce GTX 660 Ti konnte die hier gestellte Frage mittels einer extra Ausarbeitung beantwortet werden.