Launch-Analyse nVidia GeForce GTX 1050 & 1050 Ti

Mittwoch, 26. Oktober 2016
 / von Leonidas
 

In Form der neuen Grafikkarten "GeForce GTX 1050" und "GeForce GTX 1050 Ti" tritt mit dem GP107-Chip der vorerst kleinste Grafikchip der Pascal-Generation an. Mit den darauf basierenden Grafikkarten versucht nVidia neuen Schwung ins Mainstream-Segment zu bringen – die kleinere GeForce GTX 1050 gibt dabei einen klassischen Kontrahenten zur Radeon RX 460, die größere GeForce GTX 1050 Ti geht in den großen Zwischenraum zwischen Radeon RX 460 und 470. In beiden Fällen handelt es sich um klare Einsteigerprodukte im Gaming-Gefilde – was demzufolge nur einen gewissen Teil der Enthusiasten-Gemeinde interessiert, aber dennoch betrachtet werden muß, weil im Massenmarkt sicherlich millionenfach verkauft. Unsere Launch-Analyse trägt demzufolge alle Daten zu den beiden neuen Grafikkarten zusammen sowie wird deren Performance auf Basis der Auswertung möglichst vieler Testberichte abschließend einordnen.

Der beiden neuen Grafikkarten zugrundeliegende GP107-Chip stammt erstmals in der Pascal-Generation nicht von nVidias üblichem Chipfertiger TSMC, sondern von Samsung – ein kleine Ironie, denn Samsungs 14nm-Fertigung hatte AMDs Chipfertiger GlobalFoundries für deren 14nm-Fertigung lizenziert und 1:1 übernommen. Mit dem GP107-Chip bietet sich somit sogar die Möglichkeit eines Vergleichs auf Basis der gleichen Fertigungstechnologie – welcher positiv für nVidia ausgeht, denn die 3,3 Mrd. Transistoren auf 132mm² Chipfläche ergeben eine minimal bessere Transistoren-Packdichte (25,0 vs. 24,4 Mill. Transistoren pro mm²) gegenüber AMDs konkurrierendem Polaris-11-Chip mit dessen 3,0 Mrd. Transistoren auf 123mm² Chipfläche. Hinzu kommt, das nVidia aus dem leicht größeren Design dann sogar noch deutlich höhere Taktraten zu einem klar niedrigeren Stromverbrauch herausholt – an der Chipfertigung selber liegt es also nicht, das nVidia bei der Energieeffizienz seiner Grafikchips weiterhin klar vorn liegt.

In die genannte Chipfläche hat nVidia dann 2 Raster-Engines mit 768 Shader- samt 48 Textureneinheiten sowie 32 ROPs an einem 128 Bit GDDR5-Speicherinterface gequetscht. Dabei überraschen die gleich 2 Raster-Engines etwas (identisch zum nächstgrößeren GP106-Chip) – was aber nur zugunsten des GP107-Chips spricht, so verhungert dieser nicht an einer zu schwachen Dreiecks-Erstellung/Vorbereitung. AMD bietet beim Polaris-11-Chip zwar (in dessen Vollausbau) bei ebenfalls 2 Raster-Engines gleich 1024 Shader-Einheiten in einer etwas kleineren Chipfläche, spart dafür aber an den ROPs (nur 16) sowie hat die klar zurückliegende Taktraten (vor allem bei den real anliegenden Taktraten).

nVidia GP107 & GeForce GTX 1050 Ti Blockdiagramm
nVidia GP107 & GeForce GTX 1050 Ti Blockdiagramm
nVidia GeForce GTX 1050 Blockdiagramm
nVidia GeForce GTX 1050 Blockdiagramm
nVidia Pascal GP102/GP104/GP106/GP107 Shader-Cluster
nVidia Pascal GP102/GP104/GP106/GP107 Shader-Cluster

Aus jener Grundvoraussetzung beim GP107-Chip hat nVidia dann zwei Grafikkarten geschnitzt: Zum einen die größere GeForce GTX 1050 Ti im Vollausbau des Grafikchips – und generell mit 4 GB GDDR5-Speicher antretend. Und zum anderen die kleinere GeForce GTX 1050 mit einem deaktivierten Shader-Cluster und somit nur noch 640 Shader- samt 40 Textureneinheiten, was aber teilweise durch etwas höhere (nominelle) Taktraten wieder ausgeglichen wird. Der entscheidende Unterschied der GeForce GTX 1050 liegt eher beim Speicherausbau, welcher augenscheinlich fest auf 2 GB GDDR5 bei dieser kleineren GP107-Karte lautet – bislang wurden noch keine Herstellerdesigns der GeForce GTX 1050 mit mehr Speicher gesichtet. Trotz der natürlich klar im Mainstream-Bereich liegenden Performance der GeForce GTX 1050 sollte diese Limitierung die Karte doch einigermaßen behindern, nur 2 GB Grafikkartenspeicher kann man heutzutage für einen Neukauf eigentlich niemanden mehr empfehlen. Die GeForce GTX 1050 Ti geht ab Launch direkt in den Handel, die GeForce GTX 1050 soll in zwei Wochen (Anfang November) nachfolgen.

Radeon R7 370 Radeon RX 460 GeForce GTX 950 GeForce GTX 1050
Chipbasis AMD Pitcairn AMD Polaris 11 nVidia GM206 nVidia GP107
Fertigung 2,8 Mrd. Transistoren in 28nm auf 212mm² Chipfläche bei TSMC 3,0 Mrd. Transistoren in 14nm auf 123mm² Chipfläche bei GlobalFoundries 2,94 Mrd. Transistoren in 28nm auf 227mm² Chipfläche bei TSMC 3,3 Mrd. Transistoren in 14nm auf 132mm² Chipfläche bei Samsung
Architektur GCN1, DirectX 12 Feature-Level 11_1 GCN4, DirectX 12 Feature-Level 12_0 Maxwell 2, DirectX 12 Feature-Level 12_1 Pascal, DirectX 12 Feature-Level 12_1
Features Vulkan, OpenGL, Mantle, Asynchonous Compute, VSR, CrossFire Vulkan, OpenGL, Mantle, Asynchonous Compute, VSR, CrossFire, TrueAudio Next, FreeSync Vulkan, OpenGL, DSR, SLI, PhysX, G-Sync Vulkan, OpenGL, Asynchonous Compute, DSR, PhysX, G-Sync
Technik 2 Raster-Engines, 1024 Shader-Einheiten, 64 TMUs, 32 ROPs, 256 Bit GDDR5-Interface (Salvage) 2 Raster-Engines, 896 Shader-Einheiten, 56 TMUs, 16 ROPs, 128 Bit GDDR5-Interface (Salvage) 2 Raster-Engines, 768 Shader-Einheiten, 48 TMUs, 32 ROPs, 128 Bit GDDR5-Interface (Salvage) 2 Raster-Engines, 640 Shader-Einheiten, 40 TMUs, 32 ROPs, 128 Bit GDDR5-Interface (Salvage)
Taktraten ≤975/2800 MHz
(Ø-Chiptakt: ~975 MHz)
1090/1200/3500 MHz
(Ø-Chiptakt: ~1170 MHz)
1024/1188/3300 MHz
(Ø-Chiptakt: 1332 MHz)
1354/1455/3500 MHz
(Ø-Chiptakt: ~1730 MHz)
Speicherausbau 2/4 GB GDDR5 2/4 GB GDDR5 2 GB GDDR5 2 GB GDDR5
Layout DualSlot DualSlot DualSlot DualSlot
Kartenlänge 17-28cm 18-24cm 17-28cm 15-24cm
Ref./Herst./OC / / / / / / / /
Stromstecker 1x 6pol. keiner (Referenz) 1x 6pol. oder 1x 8pol. keiner (Referenz)
off. Verbrauch 110W (TBP) <75W (TBP) 90W (GCP) 75W (GCP)
Idle-Verbrauch 11W ~10W 9W ~5W
Spiele-Verbr. 108W ~70W 92W ~55W
Ausgänge DualLink DVD-D, HDMI 1.4a (kein HDCP 2.2), DisplayPort 1.2 DualLink DVI-D, HDMI 2.0b, DisplayPort 1.3 (DP1.4-ready) DualLink DVI-I, HDMI 2.0 (mit HDCP 2.2), DisplayPort 1.2 DualLink DVI-I, HDMI 2.0b, DisplayPort 1.2 (DP1.4-ready)
FHD Perf.Index 260% 260% 290% 310%
Listenpreis 149$ 99$ 159$ 109$
Straßenpreis 2GB: 130-160€
4GB: 140-190€
(Auslauf)
2GB: 110-130€
4GB: 125-150€
2GB: 145-170€
(Auslauf)
2GB: 125-140€
(verfügbar ab Anfang November)
Launch 18. Juni 2015 8. August 2016 20. August 2015 25. Oktober 2016

Für beide neuen Grafikkarten gibt es kein Referenzdesign seitens nVidia, dafür aber jede Menge Herstellerdesigns in allen möglichen Abmessungen und Taktraten. Springender Punkt ist dabei jeweils, ob sich der Grafikkartenhersteller an die Referenzvorgabe gehalten hat, ohne extra Stromstecker auszukommen, was ganz automatisch das Power-Limit der Karten und damit deren Taktspielraum begrenzt. Dies ist interessanterweise sogar die häufigere Variante – beim Geizhals-Preisvergleich sind derzeit von der GeForce GTX 1050 immerhin 13 Modelle ohne Stromstecker gelistet, aber nur 3 mit extra Stromstecker, bei der GeForce GTX 1050 Ti liegt das Verhältnis mit 16 zu 5 ziemlich ähnlich. Die insbesondere von den Hardwaretestern also gern betrachteten Overclocking-trächtigen Modelle sind also im Handel in der klaren Minderheit – die Mehrheit der GeForce GTX 1050 & 1050 Ti Karten geht den von nVidia vorgesehenen Weg und bleibt unterhalb einer (maximalen) Stromaufnahme von 75 Watt.

Radeon R9 380 Radeon RX 470 GeForce GTX 960 GeForce GTX 1050 Ti
Chipbasis AMD Tonga AMD Polaris 10 nVidia GM206 nVidia GP107
Fertigung 5,0 Mrd. Transistoren in 28nm auf 359mm² Chipfläche bei TSMC 5,7 Mrd. Transistoren in 14nm auf 232mm² Chipfläche bei GlobalFoundries 2,94 Mrd. Transistoren in 28nm auf 227mm² Chipfläche bei TSMC 3,3 Mrd. Transistoren in 14nm auf 132mm² Chipfläche bei Samsung
Architektur GCN3, DirectX 12 Feature-Level 12_0 GCN4, DirectX 12 Feature-Level 12_0 Maxwell 2, DirectX 12 Feature-Level 12_1 Pascal, DirectX 12 Feature-Level 12_1
Features Vulkan, OpenGL, Mantle, Asynchonous Compute, VSR, CrossFire, TrueAudio, FreeSync Vulkan, OpenGL, Mantle, Asynchonous Compute, VSR, CrossFire, TrueAudio Next, FreeSync Vulkan, OpenGL, DSR, SLI, PhysX, G-Sync Vulkan, OpenGL, Asynchonous Compute, DSR, PhysX, G-Sync
Technik 4 Raster-Engines, 1792 Shader-Einheiten, 112 TMUs, 32 ROPs, 256 Bit DDR GDDR5-Interface (Salvage) 4 Raster-Engines, 2048 Shader-Einheiten, 128 TMUs, 32 ROPs, 256 Bit DDR GDDR5-Interface (Salvage) 2 Raster-Engines, 1024 Shader-Einheiten, 64 TMUs, 32 ROPs, 128 Bit GDDR5-Interface (Vollausbau) 2 Raster-Engines, 768 Shader-Einheiten, 48 TMUs, 32 ROPs, 128 Bit GDDR5-Interface (Vollausbau)
Taktraten ≤970/2850 MHz
(Ø-Chiptakt: ~970 MHz)
926/1206/3300 MHz
(Ø-Chiptakt: ? MHz)
1127/1178/3500 MHz
(Ø-Chiptakt: 1316 MHz)
1290/1382/3500 MHz
(Ø-Chiptakt: ~1640 MHz)
Speicherausbau 2/4 GB GDDR5 4/8 GB GDDR5 2/4 GB GDDR5 4 GB GDDR5
Layout DualSlot DualSlot DualSlot DualSlot
Kartenlänge 17-28cm 22-28cm 17-30cm 15-26cm
Ref./Herst./OC / / / / / / / /
Stromstecker 2x 6pol. 1x 6pol. oder 1x 8pol. 1x 6pol. oder 1x 8pol. keiner (Referenz)
off. Verbrauch 190W (TBP) 120W (TBP) 120W (GCP) 75W (GCP)
Idle-Verbrauch 14W 14W 10W ~5W
Spiele-Verbr. 179W 138W 109W ~58W
Ausgänge DualLink DVD-D, HDMI 1.4a (kein HDCP 2.2), DisplayPort 1.2 DualLink DVI-D, HDMI 2.0b, DisplayPort 1.3 (DP1.4-ready) DualLink DVI-I, HDMI 2.0 (mit HDCP 2.2), DisplayPort 1.2 DualLink DVI-I, HDMI 2.0b, DisplayPort 1.2 (DP1.4-ready)
FHD Perf.Index 370% 480% 340% 360%
Listenpreis 199$ 179$ 199$ 139$
Straßenpreis 2GB: 160-200€
4GB: 180-220€
(Auslauf)
4GB: 190-220€ 2GB: 175-220€
4GB: 200-230€
(Auslauf)
4GB: 155-170€
Launch 18. Juni 2015 5. August 2016 22. Januar 2015 25. Oktober 2016

Interessanterweise sind bei GeForce GTX 1050 & 1050 Ti – nicht unähnlich zu den indirekten Vorgängern GeForce GTX 950 & 960 – die nominellen Taktraten nur die Hälfte der Miete. Vielmehr takten GeForce GTX 1050 & 1050 Ti auch schon mit Referenz-Taktraten und ohne extra Stromstecker bzw. erhöhtem Power-Limit in der Praxis deutlich höher als es die Spezifikationen aussagen. Gemessen anhand von Modellen ohne extra Stromstecker kommt die GeForce GTX 1050 in etwa auf einen realen Boosttakt von 1730 MHz, die GeForce GTX 1050 Ti in etwa auf 1640 MHz. Dies ergibt satte Aufschläge von 250-300 MHz gegenüber den nominellen Boosttaktraten und damit letztendlich auch wieder die von der Pascal-Generation her gewohnten Chiptaktraten.

GeForce GTX 1050  (Ref.) GeForce GTX 1050 Ti  (Ref.)
Temperatur-Limit 83°C 83°C
Power-Limit 75W 75W
Power-Limit-Erhöhung ohne extra Stromstecker generell nicht möglich
nominelle Taktraten 1354/1455/3500 MHz 1290/1382/3500 MHz
maximaler Boost-Takt 1810 MHz 1734 MHz
durchschn. realer Takt 1729 MHz = ~1730 MHz 1625 MHz, 1691 MHz & 1645 MHz = ~1640 MHz
reale Rechenleistung 2,21 TFlops 2,52 TFlops

Damit wird auch klar, warum sich GeForce GTX 1050 & 1050 Ti trotz nominell kleinerer Hardware bei der reinen Performance gegenüber GeForce GTX 950 & 960 behaupten können: In der Summe der Rechnung von Shader-Einheiten x real anliegendem Boosttakt hat die GeForce GTX 1050 ~8% mehr Rechenleistung gegenüber der GeForce GTX 950 aufzubieten (2,21 TFlops zu 2,05 TFlops), bei der GeForce GTX 1050 Ti sind es allerdings -6,5% weniger Rechenleistung gegenüber der GeForce GTX 960 (2,52 TFlops zu 2,70 TFlops). Hier müssen dann in der Tat die Verbesserungen der Pascal-Architektur dazu beitragen, das sich die neue Karte vor der alten Karte plaziert – denn mehr Speicherbandbreite gibt es wegen des gleich breiten Speicherinterfaces und des identischen Speichertakts wie bekannt nicht.