Launch-Analyse: nVidia GeForce GTX 970 & 980 (Nachträge)

Freitag, 19. September 2014
 / von Leonidas
 

Nachtrag vom 3. Oktober 2014

Es hat etwas gedauert, aber das Warten lohnt sich immer auf den HT4U Testbericht zu den neuen Maxwell-Grafikkarten GeForce GTX 970 & 980. Verschiedene Messungen und Vorgehensweisen findet man (leider) nur bei HT4U, gerade was die Beurteilung von realer Leistungsaufnahme, realen Taktraten sowie BIOS-Limits für Temperatur und Stromverbrauch angeht. Als erstes konnten so die bisherigen Aussagen zur real anliegenden Taktrate bei der GeForce GTX 980 im Referenzdesign bestätigt werden: Die ComputerBase kam hierbei auf Ø 1144 MHz im geschlossenen Gehäuse nach Aufwärmphase, Hardwareluxx ohne solche Maßnahmen auf Ø 1186 MHz – und HT4U nunmehr auf Ø 1130 MHz, ebenfalls im geschlossenen Gehäuse nach Aufwärmphase.

GeForce GTX 980
Referenz-Takt 1126/1216/3500 MHz
realer Takt laut ComputerBase Ø 1144 MHz geschlossenes Gehäuse, Takt nach 20 Minuten, Schnitt aus 16 Spielen
realer Takt laut Hardwareluxx Ø 1186 MHz Schnitt aus 8 Spielen
realer Takt laut HT4U Ø 1130 MHz geschlossenes Gehäuse, Takt nach 5 Minuten, Schnitt aus 11 Spielen

Diesbezügliche Angaben zur GeForce GTX 970 sind nach wie vor Mangelware, da es faktisch kein frei verkäufliches Referenzdesign dieser Karte gibt und die Hersteller-Varianten in aller Regel ab Werk mit anderen Stromverbrauchs-Limits antreten. Allerdings scheint es fast so, als würden die "halbwegs normalen" Herstellervarianten zur GeForce GTX 970 irgendwo den von nVidia angegebenen Boost-Takt (von 1178 MHz) erreichen – dies wäre dann sogar etwas mehr als bei der GeForce GTX 980. Die vielen gut übertakteten Hersteller-Varianten zur GeForce GTX 970 erreichen dagegen bekannterweise spielend reale Taktraten von 1200 MHz und mehr.

Die zweite wichtige Information aus dem HT4U-Testbericht bezieht sich auf die realen Power-Limits der beiden neuen nVidia-Karten – ein Punkt, der extrem interessant ist zur Beurteilung von ab Werk übertakteten Varianten (höheres Power-Limit bedeutet in den Zeiten von Boost-Taktraten bessere Übertaktungsfähigkeiten), von den meisten Testberichten jedoch unverständlicherweise nicht beantwortet wird. Die GeForce GTX 980 im Referenzdesign riegelt dabei bei 180 Watt ab und besitzt ein Erhöhungspotential von +25%, die GeForce GTX 970 im (wie gesagt recht zahmen) Inno3D-Design riegelt bei 160 Watt ab und besitzt ein Erhöhungspotential von nur +6%. Ganz nebenbei gesagt liegen diese Abriegelungspunkte im übrigen klar oberhalb der TDP-Angaben von 165W bzw. 145W, an dieser Stelle versucht nVidia (unverständlicherweise) zu schummeln. Dies erscheint angesichts der trotzdem hervorragenden Energieeffizienz von GeForce GTX 970 & 980 als vollkommen unnötig.

GeForce GTX 970 GeForce GTX 980
Referenz Hersteller Referenz Hersteller
Taktraten 1050/1178/3500 MHz je nach Modell 1088/1228/3500 bis 1216/1367/3500 MHz 1126/1216/3500 MHz je nach Modell 1178/1279/3500 bis 1291/1393/3600 MHz
realer Takt ~1178 MHz die Hersteller-Karten halten in aller Regel ihren Boost-Takt ~1144 MHz die Hersteller-Karten halten in aller Regel ihren Boost-Takt
Power-Limit 150W je nach Modell bis zu ~250W 180W je nach Modell bis zu ~300W
Power-Erhöhung +6% je nach Modell bis zu +20% +25% ?
Spiele-Stromverbrauch ~150W je nach Modell bis zu ~185 Watt ~180W je nach Modell bis zu ~200 Watt
TDP 145 Watt 165 Watt

Wenn irgendwo Stromverbrauchsmessungen von Hersteller-Varianten einen deutlich höheren Stromverbrauch aufzeigen, so dürften bei den dort gemessenen Karten dann das Power-Limit seitens des Herstellers entsprechend erhöht worden sein. Darüber erklären sich auch die teilweise monströs hohen Stromverbrauchs-Messungen bei Tom's Hardware, wo eine GeForce GTX 980 im Gigabyte-Design in einem GPGPU-Test auch mal bei satten 280 Watt Leistungsaufnahme herauskam. Die Karte dürfte schlicht ab Werk über ein deutlich nach oben gesetztes Power-Limit verfügen – im konkreten Fall ein Power-Limit Richtung 300 Watt, was erneut wenig zur von nVidia angegebenen TDP passt. In jedem Fall ergeben sich zwischen Referenz- und Herstellerdesigns erhebliche Differenzen beim Stromverbrauch und auch den Power-Limits. Gerade für echte Übertakter sind die Hersteller-Karten somit sehr sinnvoll – weniger wegen der höheren Taktraten ab Werk, sondern wegen des automatisch höheren Power-Limits sowie des sich damit auftuenden größeren Stromverbrauchs-Spielraums. Eine gut übertaktete GeForce GTX 980 wird dann aber natürlich kaum noch unter 200 Watt laufen, der ganz große Energieeffizienz-Vorteil geht da schnell flöten.

Nachtrag vom 13. Oktober 2014

Tom's Hardware haben sich mit der Auswirkung verschiedener, weit voneinander entfernter Power Targets auf Performance und Stromverbrauch der neuen Maxwell-Grafikkarten am Beispiel einer GeForce GTX 970 beschäftigt. Jene Karten bieten wie bekannt weitreichende Möglichkeiten zur Beeinflußung der Performance und damit des Stromverbrauchs über das gesetzte Power Target. Selbiges liegt bei einem Referenzdesign bei nur 150 Watt mit eigentlich nur +6% Spielraum, verschiedene Herstellerdesigns haben jedoch völlig andere Power Targets bis hin zu 250 Watt bei der benutzten Gigabyte-Grafikkarte. Damit könnten folgende Performance-Werte und damit Stromverbräuche erzielt werden:

Power Target eingestellter Chip-Takt höchster Boost-Takt durchschnittlicher Boost-Takt Performance (Thief) Stromverbrauch
145W 1300 MHz 1291 MHz 1266 MHz 43,5 fps 131,4W
175W 1300 MHz 1481 MHz 1461 MHz 48,0 fps 160,5W
200W 1300 MHz 1531 MHz 1519 MHz 49,5 fps 183,3W
225W 1350 MHz 1544 MHz 1531 MHz 50,1 fps 205,3W
250W 1375 MHz 1564 MHz 1552 MHz 51,0 fps 229,1W

Leider liegen nur die Performance-Messungen eines einzelnen Spiels (Thief) vor, was etwas mager für eine abschließende Aussage ist. Dennoch läßt sich die Beobachtung einer klaren Tendenz mitnehmen: Zwar lassen sich die neuen Maxwell-Grafikkarten auf extreme Power-Target-Werte setzen und verbrauchen dann auch entsprechend viel Strom, der Performance-Gewinn sinkt jedoch ab einem gewissem Maß in völlig uninteressante Bereiche ab. Im Fall der benutzten GeForce GTX 970 lohnt kaum mehr als ein Power Target von 175 Watt – für ein Power Target von 200 Watt bekommt man nur 3,1% mehr Performance für einen gleich um 14,2% höheren Stromverbrauch. Für den Sprung von 200W auf 225W Power Target sieht es noch drastischer aus: Für 12,0% mehr Stromverbrauch bekommt man nur 1,2% mehr Performance.

Im Fall der GeForce GTX 970 & 980 bringt das Setzen extremer Power Target also relativ wenig bis gar nichts – dies sind Reserven für Extrem-Übertakter mit entsprechenden Kühlmaßnahmen, aber im Hausgebrauch nicht sinnvoll nutzbar. Viel mehr als 20% bis maximal 35% über das jeweilige TDP-Limit muß man GeForce GTX 970 & 980 nicht setzen. Danach fängt der Bereich an, wo die Grafikkarte mehr Watt nicht in mehr Pixel, sondern nur noch in mehr Abwärme umwandelt, wo die die Grenzen der Maxwell-Effizienz dann deutlich erreicht sind.

Nachtrag vom 13. Oktober 2014

HT4U bieten eine Auflistung von GeForce GTX 970 Modellen samt deren Besonderheiten an, welche auch Angaben zum jeweils angesetztem Power Target sowie zur maximalen Erhöhbarkeit desselben umfasst. Leider sind letztere Angaben wegen der mangelhaften Informationspolitik der Hersteller unvollständig, gerade von den stark ab Werk übertakteten Karten fehlen oftmals die entsprechenden Angaben. Erkennen läßt sich jedoch, daß entgegen der nVidia-Vorgabe eines Power Targets von 150 Watt auch die gar nicht oder niedrig ab Werk übertakteten Modelle generell mindestens ein Power Target von 160 Watt tragen – und hieraus natürlich auch eine gewisse Mehrperformance beziehen, wie kürzlich erst dargelegt. Faktisch kann man die Performance dieser Modelle mit Power Target von 160 Watt jedoch als die Referenz zur GeForce GTX 970 betrachten, in Ermanglung dessen, daß es wirkliche Referenzmodelle zu dieser Karte am Markt zu kaufen gibt. Wenn man also mit einem Herstellerdesign die Performance der regulären GeForce GTX 970 zu simulieren versucht, sollte man nicht nur die Referenz-Taktraten einstellen, sondern eben auch das Power Target der Karte auf 160 Watt herabsetzen.

Nachtrag vom 30. Oktober 2014

Bei PC Perspective hat man sich eingehend mit dem Performancegewinnen unter Mehrfach-SLI bei einer GeForce GTX 980 beschäftigt. Einzurechnen ist dabei vorab, daß bei einer Grafikkarte am obersten Ende des Leistungsspektrums der SLI-Gewinn gerade bei mehr als zwei Grafikkarten oftmals unterdurchschnittlich ausfallen kann – einfach, weil die Rohpower unter Paarung von drei oder vier der derzeit schnellsten SingelChip-Grafikkarten derart hoch ausfällt, das viele Spiele damit nichts mehr anfangen können bzw. daß man oftmals platt in CPU-Limits hineinläuft. Aus diesem Grunde hat man bei PC Perspective auch gleich nur noch unter 2560x1440 und 3840x2160 gemessen – zumindest unter letzterer Auflösungen sollte es eigentlich weniger das Problem geben, auch mit vielen Grafikkarte noch Leistungsgewinne zu erzielen.

eine GTX 980 zwei GTX 980 drei GTX 980 vier GTX 980
theoretische Leistungsfähigkeit 100% 200%  (+100%) 300%  (+50%) 400%  (+33%)
reale Performance unter 2560x1440 100% 161,3%  (+61,3%) 192,9%  (+19,6%) 204,3%  (+5,9%)
reale Performance unter 3840x2160 100% 178,8%  (+78,8%) 224,3%  (+25,4%) 241,2%  (+7,5%)
SLI-Effizienz unter 2560x1440 - 61,3% 64,3% 51,1%
SLI-Effizienz unter 3840x2160 - 78,8% 74,8% 60,3%

Unter 2560x1440 zeigt sich jedoch das befürchtete Problem deutlich: Zwischen drei und vier Grafikkarten bewegt sich recht wenig, eine Reihe von Spielen zeigt nur die nahezu identische Performance, ein einzelnes läuft sogar deutlich langsamer. Ausnahmen wie Crysis, welches wie aus dem Lehrbuch skaliert, können dies nicht mehr retten – die vierte Grafikkarte ist hier übertrieben, sie bringt schließlich auch nur 5,9% Performancegewinn gegenüber der dritten Grafikkarte. Die SLI-Effizienz ist zudem allgemein schlecht, bei zwei Grafikkarte gewinnt man 61,3% vom theoretischen Maximum, bei drei Grafikkarten auch nur 64,3%. Dies dürfte aber darauf zurückzuführen sein, daß 2560x1440 einfach keine Anforderung für eine GeForce GTX 980 unter SLI darstellt.

Unter 3840x2160 ändert sich dies dann schnell: Insbesondere die SLI-Effizienz geht auf 78,8% mit zwei Grafikkarten und 74,8% mit drei Grafikkarten hinauf, dies sind gangbare Werte – im Normalfall sind 80% SLI/CrossFire-Effizienz über eine größere Anzahl von Spielen erreichbar, mehr ist aufgrund einzelner Problemtitel kaum realistisch. Nach wie vor macht die vierte Karte aber Probleme, deren SLI-Effizienz liegt wieder nur bei 60,3%, der Performancegewinn gegenüber der dritten Karte bei unrentablen 7,5%. Es sieht fast so aus, als hätte nVidia die SLI-Treiber speziell auf die Anforderungen von drei Grafikkarten hin optimiert – wohl wissend, daß mit den meisten Mainboards und Gehäusen sowieso keine vier DualSlot-Grafikkarten verbaubar sind.

In der Summe der Dinge zeigt sich, daß SLI (und bei CrossFire wird es ähnlich sein) derzeit eine Spielwiese für 4K ist – unter regulären Auflösungen jedoch kaum benötigt wird bzw. nur unterdurchschnittliche Performancegewinne abwirft, zumindest mit einer GeForce GTX 980. Unter 4K kommt jede Grafikkarte jedoch schnell auf eine SLI-Effizienz von nahezu 80%, was in der Nähe des normalerweise erreichbaren liegt. Allerdings sind nur maximal drei GeForce GTX 980 im SLI-Verbund sinnvoll, die vierte Karte muckt bei einigen Spielen und bringt insgesamt nur noch einen minimalen Leistungsgewinn, ist daher vollkommen verzichtbar.