nVidia räumt das "3,5-GB-Problem" der GeForce GTX 970 ein

Dienstag, 27. Januar 2015
 / von Leonidas
 

Wie an dieser Stelle schon zweimal vermeldet – No.1 & No.2 – wird seit Anfang des Jahres sowohl im Guru3D-Forum als auch im 3DCenter-Forum eine Performance-Schwäche der GeForce GTX 970 bei der Überschreitung einer Speicherbelegung von 3,5 GB diskutiert, welche sich in heftigen Rucklern bis hin zu kompletten Spiel-Aussetzern bemerkbar machen kann. Im Laufe der Diskussion konnte das Problem klarer umrissen werden, als rein auf die GeForce GTX 970, aber nicht die GeForce GTX 980 zutreffend, und aus einer dramatisch schwächeren Anbindung der obersten Speicherbereiche bei eben der GeForce GTX 970 resultierend. An dieser Stelle angekommen ging es dann kaum noch entscheident weiter, sondern wurde ein klärendes Wort von Chipentwickler nVidia immer mehr erforderlich und dementsprechend erwartet.

Jene klärenden Worte hat nVidia am Sonnabend und Montag nunmehr geliefert, wobei das erste Statement (im Original beim Tech Report) das Problem eher nur als geringfügig abstritt und erst das zweite Statement eine gewisse Erklärung brachte. So hat nVidia die GeForce GTX 970 zum einen mehr beschnitten als bislang eingeräumt: Anstatt 64 Raster Operation Units, wie zum Launch offiziell verkündet, gibt es bei der GeForce GTX 970 nur 56 aktive ROPs. nVidia redet an dieser Stelle von einem Kommunikationsproblem zwischen Technik- und Marketing-Abteilung – wie dies allerdings bei nVidia monatelang niemanden auffallen konnte, bleibt unklar. Dabei liegt hier der eigentliche Bock im damit einhergehenden Marketing-GAU – und weniger in einem Performance-Problem. Denn mit ROPs ist der GM204-Chip reichlich gesegnet, ob nun 56 oder 64 davon bei der GeForce GTX 970 aktiv sind, dürfte keinerlei beachtbare Performance-Auswirkungen bei dieser Karte haben.

Das eigentliche Problem liegt jedoch beim Speicherinterface, an welchem nVidia sehr feine Deaktivierungen vorgenommen hat: Rein technisch gesehen sind weiterhin ein 256 Bit DDR Speicherinterface und 4 GB Grafikkartenspeicher vorhanden. Aber das, was diverse Auslesetools bereits vorhergesagt haben, trifft in der Tat zu: Die Karte kommt nur mit 1,8 MB aktivem Level2-Cache daher (der Vollausbau des GM204-Chip hat 2 MB) – und dies hat entscheidende Auswirkungen auf die Wirkungsweise des Speicherinterfaces: Durch den fehlenden Level2-Cache für den letzten der acht 64-Bit-Speichercontroller ist jener letzte Speichercontroller extrem in seiner Performance gehandicapt und kann – dies haben die Praxis-Rückmeldungen der Nutzer angestoßen sowie die User-Benchmarks in den Foren bewiesen – nur mit sehr langsamen Tempo genutzt werden.

nVidia GeForce GTX 970 – 3,5-GB-Problem
nVidia GeForce GTX 970: "3,5-GB-Problem"
Der letzte der acht Level2-Caches ist deaktiviert und zieht damit die Performance des letzten der acht Speichercontroller nach unten.

nVidia ist sich dieses Problems bewusst gewesen, womit die GeForce GTX 970 treiberseitig die Spiele anweist, doch bitte nicht mehr als 3,5 GB Speicher zu belegen, faktisch also als 3,5-GB-Karte zu agieren. Wahrscheinlich genau deswegen zeigt sich jenes "3,5-GB-Problem" auch nicht bei jedem Nutzer der GeForce GTX 970 und vor allem nicht unter allen Spielen: Meistens dürfte jener Treiberschutz funktionieren, oftmals auch die Spiele gar nicht so viel Speicher benötigen bzw. bei hoher Speicherbelegung keine Performance-Probleme zeigen, weil der Speicher nur für Extra-Dateien ohne Performane-Bedeutung belegt wird. Wegen dieser nicht durchgehend auftretenden Problematik kam man bisher auch auf Erklärungsansätze wie differierende Speichersorten oder aber die Art wie nVidia die Shader-Cluster deaktiviert hat (nebeneinander oder nicht nebeneinander liegende Cluster). Mittels der Erklärungen von nVidia wird nun aber klar, daß das "3,5-GB-Problem" eine generell auf jeder GeForce GTX 970 vorhandene Ursache hat, auch wenn sich die Auswirkungen in der Praxis nicht in jeder Situation zeigen.

Dabei ergibt sich ein in den meisten Berichterstattungen noch gar nicht einmal thematisiertes weiteres Problem: Arbeitet die Karte wirklich mit dieser Speichergrenze von nur 3,5 GB, wird der letzte der Speichercontroller ergo nicht genutzt – und läuft die Karte somit rein praktisch wirklich nur mit 224 Bit DDR Speicherinterface und mit 3,5 GB Speicher. Erst wenn man eine Speicherbelegung von mehr als 3,5 GB anstrebt (was der Treiber wie gesagt zu verhindern versucht), kommt man auf das volle 256 Bit DDR Speicherinterface – welches aber in seinem letzten Achtel auch wieder so langsam ist, daß man es glatt vergessen kann. Rein ideel ist die GeForce GTX 970 somit in der Tat besser als 224-Bit-Karte mit 3,5 GB Speicher beschrieben, der Rest ist nur faktisch unnutzbar langsame "Spezifikationsauffüllung" der besseren Optik wegen.

Rein technisch ist es dagegen schwer, der Karte das 256 Bit DDR Speicherinterface und die 4 GB Speicher abzusprechend – auf der Verpackung sowie bei nVidia steht nun einmal genau dies, und technisch ist es schließlich auch wirklich vorhanden. Besser ist es daher für die Zukunft, in Spezifikationslisten diesen Umstand extra zu erwähnen, daß bei der GeForce GTX 970 nur 224 Bit von 256 Bit DDR Speicherinterface wirklich performant nutzbar sind, genauso wie nur 3,5 GB von 4 GB Grafikkartenspeicher performant ansprechbar sind. Dies bedeutet auch, daß in Rohleistungs-Rechnungen eigentlich nur die 224 Bit bei der GeForce GTX 970 beachtet werden dürfen – beispielsweise wie nachfolgend notiert, die Veränderungen zu den Launch-Spezifikationen sind grün markiert:

GeForce GTX 970
(alt & falsch!)
GeForce GTX 970
(neu & korrigiert)
GeForce GTX 980
Technik 4 Raster-Engines (mit verdoppelter Raster-Power), 1664 Shader-Einheiten, 104 TMUs, 64 ROPs, 256 Bit DDR Interface, 2 MB Level2-Cache 4 Raster-Engines (mit verdoppelter Raster-Power), 1664 Shader-Einheiten, 104 TMUs, 56 ROPs, 256 Bit DDR Interface (nur 224 Bit performant nutzbar), 1,8 MB Level2-Cache 4 Raster-Engines (mit verdoppelter Raster-Power), 2048 Shader-Einheiten, 128 TMUs, 64 ROPs, 256 Bit DDR Interface, 2 MB Level2-Cache
ROP-Leistung 70,4 GPix/sec 61,6 GPix/sec 73,2 GPix/sec
Speicherbandbreite 224 GB/sec 196 GB/sec
(nur 224 Bit performant nutzbar)
224 GB/sec
Speicherausbau 4 GB GDDR5 4 GB GDDR5
(nur 3,5 GB performant nutzbar)
4 GB GDDR5

An der Karten-Performance der GeForce GTX 970 ändert sich mit diesen Korrekturen natürlich überhaupt nichts, die Karte wird nicht schlechter, langsamer oder weniger nutzbar dadurch. Selbst der geringere performant nutzbare Speicher dürfte letztlich kaum jemals wirklich relevant werden: Ein paar Jahre in der Zukunft dürfte es den dann existierenden speicherfressenden Spielen wohl egal sein, ob sie nur 3,5 oder 4 GB Speicher vorgesetzt bekommen – wenn von diesen Spielen dann 8 GB oder mehr Grafikkartenspeicher benötigt werden, macht dies keinen Unterschied.

Der eigentliche Lapsus liegt darin, daß nVidia hier fehlerhafte Spezifikationen an die Presse und die Kunden gegeben hat und dies dann monatelang nicht bemerkt haben will, es erst durch energisches Nachforschen von Foren-User zu einer Situation kam, wo nVidia endlich einmal Farbe bekennen musste. Ohne diese engagierte Arbeit in den Foren wäre dieses "3,5-GB-Problem" der GeForce GTX 970 womöglich niemals entdeckt worden und die Karte mit blitzsauberer Weste irgendwann in den Ruhestand gegangen. Nun aber hat nVidia das Problem, daß die meister User & Leser recht bissig auf diese Enthüllungen reagieren – wobei nicht abstreitbar ist, daß nachträglich korrigierte Spezifikationen (nur 56 anstatt 64 ROPs, nur 1,8 anstatt 2 MB Level2-Cache) heutzutage einfach keine gangbare Sache mehr sind, der Ärger für nVidia also wohlverdient ist (bei AMD rennen sie jetzt wahrscheinlich alle w.o. um den Tisch – Insidergag).

Wir halten es für sehr enttäuschend, was nVidia hier den Nutzern an Fehlinformationen über viele Monate vorgesetzt hat, obwohl es nVidia-intern sicherlich ziemlich schnell aufgefallen sein dürfte, daß die Spezifikationen nicht korrekt angegeben waren. Das Argument einer "fehlerhaften Kommunikation" mag für ein paar Tage gelten, aber nicht dauerhaft – und daß keiner der nVidia-Techniker irgendwann einmal die nVidia- oder Hersteller-Webseiten nachschlägt, darf nVidia dem Osterhasen erzählen. Genauso enttäuschend ist, daß man schon fast zwanghaft die 4 GB Speicher als Ausstattungsmerkmal erreichen wollte, obwohl aufgrund der angesetzten Limitierungen klar sein musste, daß alles oberhalb von 3,5 nur noch scherzhaft langsam angesprochen werden kann. Daß Produktspezifikationen immer ein Kompromiß zwischen Technik und Marketing sind, ist schon klar – aber hier ist kein Kompromiß erkennbar, sondern eher ein Plattwalzen der Technik- durch die Marketing-Abteilung mit am Ende nachteiligen Folgen für alle, die Konsumenten zuallererst.

nVidias Marketing darf sich nun überlegen, ob man nicht besser gefahren wäre, die GeForce GTX 970 gleich mit 3,5 GB Speicher (nebenbei kostengünstiger) und einem echten 224 Bit DDR Speicherinterface auszuliefern. Dies hätte am Anfang zwar komisch ausgesehen, aber so wie die GeForce GTX 970 am Markt eingeschlagen ist, deren Erfolg sicherlich nicht verhindert. Eher hätte nVidia vielleicht noch ein extra Lob bekommen, aus einer solch "komisch" aussehenden Konfiguration soviel Performance herausgeholt zu haben. Langsamer würde man mit einer solchen Konfiguration nicht sein, da die GeForce GTX 970 schließlich jetzt schon versucht, nicht mehr als 3,5 GB zu belegen – und damit dann automatisch nur das 224 Bit DDR Speicherinterface nutzt.

Andere Überlegung gehen in Richtung eines möglichen Produktmangels bei der GeForce GTX 970 durch diese offiziell geänderten Spezifikationen. Dies kann sich natürlich nur auf Anzahl der ROPs und die Größe des Level2-Caches beziehen – daß das 256 Bit DDR Speicherinterface sowie der 4 GB Speicher im letzten Achtel besonders langsam sind, ändert nichts daran, daß jene vorhanden und damit die offiziellen Spezifikationen in diesem Punkt erfüllt sind. Zur Frage der ROPs und des Level2-Caches kann man zwar davon reden, daß hier eine zuvor "zugesicherte Eigenschaft" später abgeändert wurde – andererseits ist die Frage, ob jene beiden Eigenschaften nicht am Ende in die Gesamteigenschaft der "Performance" einfließen, welche sich natürlich nicht geändert hat. Es fehlt hier also kein versprochenes Autoradio, sondern die PS-Zahl wurde nur auf anderem Wege erreicht als ursprünglich kundgetan – die PS-Zahl ist aber dennoch gleich geblieben. Nur Programmierer, welche für ihre Arbeit unbedingt die vollen 2 MB Level2-Cache benötigen, könnten eventuell auf diesen Sonderfall pochen – ansonsten dürfte sich da rein rechtlich wenig machen lassen, ist die GeForce GTX 970 wegen dieser geänderten Spezifikationen nicht automatisch rückgabefähig.

Dafür könnte sich nVidia aber durchaus ein kleines Extra einfallen lassen, um sich bei den Käufern der GeForce GTX 970 zu entschuldigen – wirkliche Schuld oder echter Produktmangel hin oder her. Daß, was man bisher gemacht hat – zuerst eine halbseidene Abwiegelung, danach ein technisches Eingeständnis ohne aber eine Anerkennung eventueller Performance-Probleme – ist dafür nicht wirklich ausreichend. Das Kind ist an dieser Stelle ganz deutlich in den Brunnen gefallen, nVidia muß sich nur einmal die Nutzerkommentare in den Foren und auf den News-Webseiten durchlesen. Ein klareres "Wir haben es verbockt" würde die Wogen wieder etwas glätten, ein kleines Extra das ganze wohl eher vergessen lassen. So steht nVidia derzeit nämlich als jemand mit falschen Spezifikationsangaben und einem über mehrere Monate nicht kommunizierten Speicherproblem da – und das hat in nachvollziehbarer Vergangenheit kein Grafikchip-Entwickler geschafft. Wir lieben zwar sicherlich "Oldschool", aber die Fehler aus den Anfangstagen der Grafikchip-Entwicklung müssen dennoch nicht wieder aufgewärmt werden.

PS:
In gewisser Weise ist jenes Speicherproblem der GeForce GTX 970 eine halbe Fortschreibung dessen, was nVidia bei der GeForce GTX 660 gemacht hat: Die Karte hat ein 192 Bit DDR Speicherinterface, an welchem aber 2 GB Speicher hängen – eigentlich nicht machbar, aber nVidia hat hier einfach die letzten 512 MB Speicher an nur einen der drei Speichercontroller drangehängt. Damit sind 1,5 GB Speicher dieser Karte mit dem vollen 192 Bit DDR Speicherinterface ansprechbar, die letzten 512 MB Speicher nur mit einem 64 Bit DDR Speicherinterface, ergo mit gedrittelter Kraft. Dies ist bei weitem noch nicht so stark wie bei der GeForce GTX 970, wo die letzten 512 MB Speicher nur mit einer ins bodenlose fallenden Performance ansprechbar sind. Auch spricht nVidia bei der GeForce GTX 660 nicht über ein zu großes Speicherinterface, die 192 Bit DDR sind real und auch (auf 1,5 GB Speicher) absolut voll performant ansprechbar.