Launch-Analyse: nVidia GeForce GTX 960

Freitag, 23. Januar 2015

/ von Leonidas

Nach den ersten Maxwell-basierten Grafikkarten in Form von GeForce GTX 750 & 750 Ti sowie GeForce GTX 970 & 980 baut nVidia mit dem Launch der GeForce GTX 960 die GeForce 900 Serie in die Mittelklasse aus und bringt dafür mit dem GM206-Chip den passenden Midrange-Chip zwischen GM107 und GM204 an den Start. Mit dem Preispunkt von 199$ für die GeForce GTX 960 geht nVidia zudem wieder recht aggressiv vorwärts und wird das bisherig Kepler-basierte Midrange-Portfolio von nVidia über kurz oder lang durch die GeForce GTX 960 sowie weitere GM204- und GM206-basierte Programmergänzungen ersetzen werden. Aufgrund Preispunkt, Performance und auch der Speicherbestückung geht die GeForce GTX 960 dabei natürlich in direkte Konkurrenz zu AMDs Radeon R9 285.

nVidia GM206-Chip Block-Diagramm

nVidia GM206-Chip Shader-Cluster (SMM) Block-Diagramm

Die GeForce GTX 960 basiert auf dem von nVidia ausdrücklich bestätigten Vollausbau des GM206-Chips, welcher 2,94 Milliarden Transistoren auf einer Chipfläche von 227mm² beherbergt und erneut in der 28nm-Fertigung von TSMC hergestellt wird. Darin packt nVidia eine glatte Halbierung des GM204-Chips: 2 Raster Engines, 1024 Shader-Einheiten, 64 Textureneinheiten und 32 Raster Operation Units an einem 128 Bit DDR Speicherinterface – selbst der Level2-Cache wurde auf 1 MB halbiert (und ist damit sogar kleiner als beim GM107-Chip). Was sich nun nicht unbedingt beeindruckend anhört, soll vor allem für ein effiziente und kostengünstige Lösungen sorgen – und immerhin bringt der direkte Kontrahent in Form der Radeon R9 285 gleich 5 Milliarden Transistoren auf einer Chipfläche von viel größeren 359mm² auf die Waage.

	GK104	GM107	GM206	GM204
Architektur	Kepler	Maxwell	Maxwell 2.0	Maxwell 2.0
DirectX-Level	11.0	11.0	11.2b	11.2b
Raster-Engines	4	1	2	4
Durchsatz pro Raster-Eng.	8 Pixel/Takt	16 Pixel/Takt	16 Pixel/Takt	16 Pixel/Takt
Aufbau der Shader-Cluster	SMX: 192 Shader-Einheiten, 16 Textureneinheiten, 32 Load/Store-Einheiten, 32 SFUs, 8 FP64-Einheiten, 1x Kontrolllogik, 65536 x 32-bit Register File, 64 kByte Level1-Cache, 48 kByte Texturen-Cache	SMM: 128 Shader-Einheiten, 8 Textureneinheiten, 32 Load/Store-Einheiten, 32 SFUs, 4 FP64-Einheiten, 4x Kontrolllogik, 65536 x 32-bit Register File, 64 kByte Level1-Cache, 24 kByte Texturen-Cache	SMM: 128 Shader-Einheiten, 8 Textureneinheiten, 32 Load/Store-Einheiten, 32 SFUs, 4 FP64-Einheiten, 4x Kontrolllogik, 65536 x 32-bit Register File, 96 kByte Level1-Cache, 48 kByte Texturen-Cache	SMM: 128 Shader-Einheiten, 8 Textureneinheiten, 32 Load/Store-Einheiten, 32 SFUs, 4 FP64-Einheiten, 4x Kontrolllogik, 65536 x 32-bit Register File, 96 kByte Level1-Cache, 48 kByte Texturen-Cache
TMUs zu Shader-Einheit.	1:12	1:16	1:16	1:16
DP/SP-Verhältnis	1/24	1/32	1/32	1/32
Shader-Cluster Perf.	100%	90%	~90%	~90%
Shader-Einheiten Perf.	100%	135%	~135%	~135%
Shader-Cluster	8	5	8	16
Shader-Einheiten	1536	640	1024	2048
Textureneinheiten	128	40	64	128
Raster Operation Units	32	16	32	64
Speicherinterface	256 Bit DDR	128 Bit DDR	128 Bit DDR	256 Bit DDR
Level2-Cache	0,5 MB	2 MB	1 MB	2 MB

Durch die glatte Halbierung des GM204-Chips ist der GM206-Chip dem GM107-Chip näher als dem GM204-Chip: Ausgehend vom GM107-Chip hat der GM206-Chip nur 60% mehr Shader- und Textureneinheiten, das Speicherinterface ist sogar vollkommen identisch breit. Nur bei den Raster Engines und den Raster Operation Units gibt es auch hier eine Verdopplung. Gerade letztes ist interessant – der GM206 ist ein Grafikchip mit nur 128 Bit DDR Speicherinterface, aber gleich 32 ROPs, welche bislang eher dem HighEnd-Bereich vorbehalten waren. Hier versucht nVidia wohl das eher magere Speicherinterface wieder etwas auszugleichen – was unter Umständen designtechnisch einfach billiger war als ein breiteres Speicherinterface.

Der GM206-Chip trägt zudem alle technischen Neuerungen des GM204-Chips in sich, wobei insbesondere die verbesserte Farbkompression für den GM206-Chip aufgrund dessen limitierten Speicherinterface von Wichtigkeit sein dürfte. Die einzigen Neuerungen gegenüber dem GM204-Chip betreffen die Video-Engine des GM206-Chips, welche nun auch das Decodieren von H.265-Material (GeForce GTX 970 & 980 unterstützen nur H.265-Encoding) sowie den Kopierschutz HDCP 2.2 unterstützt (GeForce GTX 970 & 980 unterstützen zwar HDMI 2.0, aber kein HDCP 2.2).

Der GM206-Chip wird derzeit wie gesagt allein für die GeForce GTX 960 verwendet, welche laut nVidia dem Vollausbau dieses Grafikchips entsprechen soll. Diese etwas magere Hardware-Ansetzung wird zum einen über die hohe Maxwell-Effizienz sowie zum anderen über nette Taktraten wettgemacht. Die Referenz-Taktraten liegen schon bei 1127/1178/3500 MHz, es werden jedoch viele ab Werk übertaktete Karten angeboten und vor allem gehen die realen Boost-Taktraten oftmals weit höher als die offiziellen Angaben. Als klaren Pferdefuß der Karte gilt jedoch allgemein die default-Speicherbestückung von nur 2 GB GDDR5, selbst wenn dies bei der Radeon R9 285 nicht anders ist. nVidia hat zwar den Grafikkartenherstellern die Freigabe für 4-GB-Modelle gegeben, zum Launch der GeForce GTX 960 liegen jene jedoch noch nicht vor bzw. sind auch noch bei keinem Hersteller direkt in der Pipeline. Ein offizielles Referenzmodell existiert im übrigen wie schon bei der GeForce GTX 970 nicht, demzufolge wird es am Markt nur Hersteller-Designs zur GeForce GTX 960 geben.

	Radeon R9 280	Radeon R9 285	GeForce GTX 760	GeForce GTX 960
Chipbasis	AMD Tahiti, 4,31 Mrd. Transistoren in 28nm auf 365mm² Chipfläche	AMD Tonga, 5,0 Mrd. Transistoren in 28nm auf 359mm² Chipfläche	nVidia GK104, 3,54 Mrd. Transistoren in 28nm auf 294mm² Chipfläche	nVidia GM206, 2,94 Mrd. Transistoren in 28nm auf 227mm² Chipfläche
Architektur	GCN 1.0, DirectX 11.2a, Mantle	GCN 1.2, DirectX 11.2b, Mantle & TrueAudio	Kepler, DirectX 11.0, PhysX	Maxwell 2.0, DirectX 11.2b, PhysX
Technik	2 Raster-Engines, 1792 Shader-Einheiten, 112 TMUs, 32 ROPs, 384 Bit DDR Interface	4 Raster-Engines, 1792 Shader-Einheiten, 112 TMUs, 32 ROPs, 256 Bit DDR Interface	3-4 Raster-Engines, 1152 Shader-Einheiten, 96 TMUs, 32 ROPs, 256 Bit DDR Interface	2 Raster-Engines, 1024 Shader-Einheiten, 64 TMUs, 32 ROPs, 128 Bit DDR Interface
Taktraten	≤933/2500 MHz (Ø-Chiptakt: 933 MHz)	≤918/2750 MHz (Ø-Chiptakt: 918 MHz)	980/1033/3000 MHz (Ø-Chiptakt: 1033 MHz)	1127/1178/3500 MHz (Ø-Chiptakt: 1316 MHz)
Speicherausbau	3 GB GDDR5	2 GB GDDR5	2 GB GDDR5 (4 GB mit Aufpreis verfügbar)	2 GB GDDR5
Layout	DualSlot	DualSlot	DualSlot	DualSlot
Kartenlänge	26-30cm (Herstellerdesigns)	22-27cm (Herstellerdesigns)	24,5cm (Referenzdesign)	21,5-27cm (Herstellerdesigns)
Stromstecker	1x 6pol. + 1x 8pol.	2x 6pol.	2x 6pol.	1x 6pol. oder 1x 8pol. (je nach Karte)
TDP/TBP/GBP	250W (TDP)	190W (TBP)	170W (GBP)	120W (GBP)
Idle-Verbrauch	15W	14W	11W	10W
Spiele-Verbrauch	189W	183W	155W	98W
Ausgänge	2x DualLink DVD-D, HDMI 1.4a, DisplayPort 1.2	2x DualLink DVD-D, HDMI 1.4a, DisplayPort 1.2	DualLink DVD-D, DualLink DVI-I, HDMI 1.4a, DisplayPort 1.2	DualLink DVI-I, HDMI 2.0 (mit HDCP 2.2), 3x DisplayPort 1.2
Perf.Index	330%	330%	310%	330%
Listenpreis	249$	249$	249$	199$
Straßenpreis	180-200€	200-230€	180-210€	195-220€
Release	4. März 2014	2. September 2014	25. Juni 2013	22. Januar 2015

Gerade bei der GeForce GTX 960 sind die offiziellen Taktraten jedoch nur die Hälfte der Wahrheit, da die Karte in der Spiele-Praxis – selbst auf default-Taktraten – weitaus höher taktet. Derzeit liegen leider allein Testberichte von ab Werk übertakteten Varianten vor, welche zudem in aller Regel auch noch auf ein leicht höhergesetztes Power Target zurückgreifen können. Da aber eine seitens HT4U manuell auf 1178 MHz Boost-Takt gebrachte Karte nur ganze 94,5 Watt verbrauchte und damit weit unter dem regulären Power Target von 120 Watt liegt, ist davon auszugehen, daß sich unübertaktete Karten in dieser Frage weitgehend wie die getesteten ab Werk übertakteten Modelle verhalten. Und jene takten laut Ausführungen der ComputerBase unter Dauerlast ständig auf ihrem Maximaltakt – was auf default-Taktung augenscheinlich 1316 MHz sind.

Die GeForce GTX 960 läuft somit unübertaktet wohl ständig auf jenen 1316 MHz – ab Werk übertaktete Modelle dagegen auf bis zu 1430 MHz (je nach vom Hersteller eingestellten Maximaltakt). Wer nach ab Werk übertakteten Modellen der GeForce GTX 960 Ausschau hält, sollte aufgrund dieser hervorragenden Boost-Eigenschaften nicht nach dem Modell mit den höchsten nominellen Taktraten schauen, sondern nach dem Modell mit dem höchsten Maximaltakt – weil die GeForce GTX 960 jenen Maximaltakt faktisch ständig erreicht bzw. ein niedrig angesetzter Maximaltakt die Karte regelrecht Performance kostet. Für die Hardware-Tester bedeutet dies zudem, daß man mit der GeForce GTX 960 keine Tests mit einem festen Boosttakt anstellen darf, damit würde die Karte gegenüber ihrem Normalzustand glatt untertaktet laufen.

Bookmark/Search this post with:

Launch-Analyse: nVidia GeForce GTX 960

Hauptlinks

Suchen

Navigation

Launch-Analyse: nVidia GeForce GTX 960

Die weiteren Seiten des Artikels

Translate

3DCenter unterstützen

Neueste Blogeinträge

Neue Forenbeiträge

Neue Beiträge im Forum Technologie

Uns folgen

Partner

Umfrage