Launch-Analyse: nVidia GeForce GTX 960

Freitag, 23. Januar 2015
 / von Leonidas
 

Nach den ersten Maxwell-basierten Grafikkarten in Form von GeForce GTX 750 & 750 Ti sowie GeForce GTX 970 & 980 baut nVidia mit dem Launch der GeForce GTX 960 die GeForce 900 Serie in die Mittelklasse aus und bringt dafür mit dem GM206-Chip den passenden Midrange-Chip zwischen GM107 und GM204 an den Start. Mit dem Preispunkt von 199$ für die GeForce GTX 960 geht nVidia zudem wieder recht aggressiv vorwärts und wird das bisherig Kepler-basierte Midrange-Portfolio von nVidia über kurz oder lang durch die GeForce GTX 960 sowie weitere GM204- und GM206-basierte Programmergänzungen ersetzen werden. Aufgrund Preispunkt, Performance und auch der Speicherbestückung geht die GeForce GTX 960 dabei natürlich in direkte Konkurrenz zu AMDs Radeon R9 285.

nVidia GM206-Chip Block-Diagramm
nVidia GM206-Chip Block-Diagramm
nVidia GM206-Chip Shader-Cluster (SMM) Block-Diagramm
nVidia GM206-Chip Shader-Cluster (SMM) Block-Diagramm

Die GeForce GTX 960 basiert auf dem von nVidia ausdrücklich bestätigten Vollausbau des GM206-Chips, welcher 2,94 Milliarden Transistoren auf einer Chipfläche von 227mm² beherbergt und erneut in der 28nm-Fertigung von TSMC hergestellt wird. Darin packt nVidia eine glatte Halbierung des GM204-Chips: 2 Raster Engines, 1024 Shader-Einheiten, 64 Textureneinheiten und 32 Raster Operation Units an einem 128 Bit DDR Speicherinterface – selbst der Level2-Cache wurde auf 1 MB halbiert (und ist damit sogar kleiner als beim GM107-Chip). Was sich nun nicht unbedingt beeindruckend anhört, soll vor allem für ein effiziente und kostengünstige Lösungen sorgen – und immerhin bringt der direkte Kontrahent in Form der Radeon R9 285 gleich 5 Milliarden Transistoren auf einer Chipfläche von viel größeren 359mm² auf die Waage.

GM104 GM107 GM206 GM204
Architektur Kepler Maxwell Maxwell 2.0 Maxwell 2.0
DirectX-Level 11.0 11.0 11.2b 11.2b
Raster-Engines 4 1 2 4
Durchsatz pro Raster-Eng. 8 Pixel/Takt 16 Pixel/Takt 16 Pixel/Takt 16 Pixel/Takt
Aufbau der Shader-Cluster SMX: 192 Shader-Einheiten, 16 Textureneinheiten, 32 Load/Store-Einheiten, 32 SFUs, 8 FP64-Einheiten, 1x Kontrolllogik, 65536 x 32-bit Register File, 64 kByte Level1-Cache, 48 kByte Texturen-Cache SMM: 128 Shader-Einheiten, 8 Textureneinheiten, 32 Load/Store-Einheiten, 32 SFUs, 4 FP64-Einheiten, 4x Kontrolllogik, 65536 x 32-bit Register File, 64 kByte Level1-Cache, 24 kByte Texturen-Cache SMM: 128 Shader-Einheiten, 8 Textureneinheiten, 32 Load/Store-Einheiten, 32 SFUs, 4 FP64-Einheiten, 4x Kontrolllogik, 65536 x 32-bit Register File, 96 kByte Level1-Cache, 48 kByte Texturen-Cache SMM: 128 Shader-Einheiten, 8 Textureneinheiten, 32 Load/Store-Einheiten, 32 SFUs, 4 FP64-Einheiten, 4x Kontrolllogik, 65536 x 32-bit Register File, 96 kByte Level1-Cache, 48 kByte Texturen-Cache
TMUs zu Shader-Einheit. 1:12 1:16 1:16 1:16
DP/SP-Verhältnis 1/24 1/32 1/32 1/32
Shader-Cluster Perf. 100% 90% ~90% ~90%
Shader-Einheiten Perf. 100% 135% ~135% ~135%
Shader-Cluster 8 5 8 16
Shader-Einheiten 1536 640 1024 2048
Textureneinheiten 128 40 64 128
Raster Operation Units 32 16 32 64
Speicherinterface 256 Bit DDR 128 Bit DDR 128 Bit DDR 256 Bit DDR
Level2-Cache 0,5 MB 2 MB 1 MB 2 MB

Durch die glatte Halbierung des GM204-Chips ist der GM206-Chip dem GM107-Chip näher als dem GM204-Chip: Ausgehend vom GM107-Chip hat der GM206-Chip nur 60% mehr Shader- und Textureneinheiten, das Speicherinterface ist sogar vollkommen identisch breit. Nur bei den Raster Engines und den Raster Operation Units gibt es auch hier eine Verdopplung. Gerade letztes ist interessant – der GM206 ist ein Grafikchip mit nur 128 Bit DDR Speicherinterface, aber gleich 32 ROPs, welche bislang eher dem HighEnd-Bereich vorbehalten waren. Hier versucht nVidia wohl das eher magere Speicherinterface wieder etwas auszugleichen – was unter Umständen designtechnisch einfach billiger war als ein breiteres Speicherinterface.

Der GM206-Chip trägt zudem alle technischen Neuerungen des GM204-Chips in sich, wobei insbesondere die verbesserte Farbkompression für den GM206-Chip aufgrund dessen limitierten Speicherinterface von Wichtigkeit sein dürfte. Die einzigen Neuerungen gegenüber dem GM204-Chip betreffen die Video-Engine des GM206-Chips, welche nun auch das Decodieren von H.265-Material (GeForce GTX 970 & 980 unterstützen nur H.265-Encoding) sowie den Kopierschutz HDCP 2.2 unterstützt (GeForce GTX 970 & 980 unterstützen zwar HDMI 2.0, aber kein HDCP 2.2).

Der GM206-Chip wird derzeit wie gesagt allein für die GeForce GTX 960 verwendet, welche laut nVidia dem Vollausbau dieses Grafikchips entsprechen soll. Diese etwas magere Hardware-Ansetzung wird zum einen über die hohe Maxwell-Effizienz sowie zum anderen über nette Taktraten wettgemacht. Die Referenz-Taktraten liegen schon bei 1127/1178/3500 MHz, es werden jedoch viele ab Werk übertaktete Karten angeboten und vor allem gehen die realen Boost-Taktraten oftmals weit höher als die offiziellen Angaben. Als klaren Pferdefuß der Karte gilt jedoch allgemein die default-Speicherbestückung von nur 2 GB GDDR5, selbst wenn dies bei der Radeon R9 285 nicht anders ist. nVidia hat zwar den Grafikkartenherstellern die Freigabe für 4-GB-Modelle gegeben, zum Launch der GeForce GTX 960 liegen jene jedoch noch nicht vor bzw. sind auch noch bei keinem Hersteller direkt in der Pipeline. Ein offizielles Referenzmodell existiert im übrigen wie schon bei der GeForce GTX 970 nicht, demzufolge wird es am Markt nur Hersteller-Designs zur GeForce GTX 960 geben.

Radeon R9 280 Radeon R9 285 GeForce GTX 760 GeForce GTX 960
Chipbasis AMD Tahiti, 4,31 Mrd. Transistoren in 28nm auf 365mm² Chipfläche AMD Tonga, 5,0 Mrd. Transistoren in 28nm auf 359mm² Chipfläche nVidia GK104, 3,54 Mrd. Transistoren in 28nm auf 294mm² Chipfläche nVidia GM206, 2,94 Mrd. Transistoren in 28nm auf 227mm² Chipfläche
Architektur GCN 1.0, DirectX 11.2a, Mantle GCN 1.2, DirectX 11.2b, Mantle & TrueAudio Kepler, DirectX 11.0, PhysX Maxwell 2.0, DirectX 11.2b, PhysX
Technik 2 Raster-Engines, 1792 Shader-Einheiten, 112 TMUs, 32 ROPs, 384 Bit DDR Interface 4 Raster-Engines, 1792 Shader-Einheiten, 112 TMUs, 32 ROPs, 256 Bit DDR Interface 3-4 Raster-Engines, 1152 Shader-Einheiten, 96 TMUs, 32 ROPs, 256 Bit DDR Interface 2 Raster-Engines, 1024 Shader-Einheiten, 64 TMUs, 32 ROPs, 128 Bit DDR Interface
Taktraten ≤933/2500 MHz
(Ø-Chiptakt: 933 MHz)
≤918/2750 MHz
(Ø-Chiptakt: 918 MHz)
980/1033/3000 MHz
(Ø-Chiptakt: 1033 MHz)
1127/1178/3500 MHz
(Ø-Chiptakt: 1316 MHz)
Speicherausbau 3 GB GDDR5 2 GB GDDR5 2 GB GDDR5
(4 GB mit Aufpreis verfügbar)
2 GB GDDR5
Layout DualSlot DualSlot DualSlot DualSlot
Kartenlänge 26-30cm
(Herstellerdesigns)
22-27cm
(Herstellerdesigns)
24,5cm
(Referenzdesign)
21,5-27cm
(Herstellerdesigns)
Stromstecker 1x 6pol. + 1x 8pol. 2x 6pol. 2x 6pol. 1x 6pol. oder 1x 8pol.
(je nach Karte)
TDP/TBP/GBP 250W (TDP) 190W (TBP) 170W (GBP) 120W (GBP)
Idle-Verbrauch 15W 14W 11W 10W
Spiele-Verbrauch 189W 183W 155W 98W
Ausgänge 2x DualLink DVD-D, HDMI 1.4a, DisplayPort 1.2 2x DualLink DVD-D, HDMI 1.4a, DisplayPort 1.2 DualLink DVD-D, DualLink DVI-I, HDMI 1.4a, DisplayPort 1.2 DualLink DVI-I, HDMI 2.0 (mit HDCP 2.2), 3x DisplayPort 1.2
Perf.Index 330% 330% 310% 330%
Listenpreis 249$ 249$ 249$ 199$
Straßenpreis 180-200€ 200-230€ 180-210€ 195-220€
Release 4. März 2014 2. September 2014 25. Juni 2013 22. Januar 2015

Gerade bei der GeForce GTX 960 sind die offiziellen Taktraten jedoch nur die Hälfte der Wahrheit, da die Karte in der Spiele-Praxis – selbst auf default-Taktraten – weitaus höher taktet. Derzeit liegen leider allein Testberichte von ab Werk übertakteten Varianten vor, welche zudem in aller Regel auch noch auf ein leicht höhergesetztes Power Target zurückgreifen können. Da aber eine seitens HT4U manuell auf 1178 MHz Boost-Takt gebrachte Karte nur ganze 94,5 Watt verbrauchte und damit weit unter dem regulären Power Target von 120 Watt liegt, ist davon auszugehen, daß sich unübertaktete Karten in dieser Frage weitgehend wie die getesteten ab Werk übertakteten Modelle verhalten. Und jene takten laut Ausführungen der ComputerBase unter Dauerlast ständig auf ihrem Maximaltakt – was auf default-Taktung augenscheinlich 1316 MHz sind.

Die GeForce GTX 960 läuft somit unübertaktet wohl ständig auf jenen 1316 MHz – ab Werk übertaktete Modelle dagegen auf bis zu 1430 MHz (je nach vom Hersteller eingestellten Maximaltakt). Wer nach ab Werk übertakteten Modellen der GeForce GTX 960 Ausschau hält, sollte aufgrund dieser hervorragenden Boost-Eigenschaften nicht nach dem Modell mit den höchsten nominellen Taktraten schauen, sondern nach dem Modell mit dem höchsten Maximaltakt – weil die GeForce GTX 960 jenen Maximaltakt faktisch ständig erreicht bzw. ein niedrig angesetzter Maximaltakt die Karte regelrecht Performance kostet. Für die Hardware-Tester bedeutet dies zudem, daß man mit der GeForce GTX 960 keine Tests mit einem festen Boosttakt anstellen darf, damit würde die Karte gegenüber ihrem Normalzustand glatt untertaktet laufen.