Launch-Analyse nVidia GeForce GTX 1660 Ti

Sonntag, 24. Februar 2019
 / von Leonidas
 

Mit der GeForce GTX 1660 Ti schickt nVidia nunmehr seine "echte" Midrange-Lösungen innerhalb der Turing-Generation in den Markt. Die Karte wird untypischerweise nicht der "GeForce 20" Serie zugeschlagen sowie auch nicht mit dem Namenszusatz "RTX" ausgezeichnet, da nVidia beim zugrundliegenden TU116-Chip auf gewisse Teile der Turing-Architektur verzichtet hat – im genauen die RT-Cores für RayTracing sowie die Tensor-Cores für die DLSS-Kantenglättung. Damit sollen TU116-Chip sowie GeForce GTX 1660 Ti besser tauglich für den Massenmarkt gemacht werden, für welchen hochgezogene Preispunkte (wie bei den bisherigen Turing-Grafikkarten) kaum verträglich sind. Herausgekommen ist eine zur Ablösung der GeForce GTX 1060 6GB gedachte Grafikkarte, welche auf einem Listenpreis von 279 Dollar neuen Schwung ins Midrange-Segment bringen soll und dafür in vielgestaltigen Herstellerausführungen antritt. Die nachfolgende Launch-Analyse fasst zusammen, was die Launchreviews zur Performance, Stromverbrauch und Übertaktungseignung der GeForce GTX 1660 Ti ausgesagt haben – und wo sich nVidias neue Midrange-Lösung somit im Gesamtbild einordnen muß.

Die GeForce GTX 1660 Ti basiert wie gesagt auf dem TU116-Chip, welcher nicht einfach nur kleiner ist als der TU106-Chip von GeForce RTX 2060 & 2070, sondern Hardware-seitig um RT- und Tensor-Cores erleichtert wurde. Die eigentliche Grafikchip-Architektur ist jedoch weiterhin einwandfrei Turing, ergo gibt es wie üblich ein gutes Stück Mehrperformance bei gleicher Rohleistung, hervorgerufen durch den veränderten Aufbau der Shader-Cluster von Turing. Mittels dem Verzicht auf RT- und Tensor-Cores spart sich nVidia etwas an Chipfläche an einer Stelle, welche für diese klare Midrange-Lösung sowieso nicht von Relevanz wäre: Für RayTracing wäre der TU116-Chip wohl sowieso etwas zu schwach – und die DLSS-Kantenglättung wird derzeit zumeist auch nur zur Performance-Verbesserung unter RayTracing eingesetzt. Allerdings spart sich nVidia hiermit auch nicht wirklich viel, die eigentlichen Architektur-Änderungen von Turing wiegen schwerer und machen damit den TU116-Chip immerhin 284mm² groß.

nVidia GP106 nVidia TU116 nVidia TU106
Fertigung 4,4 Mrd. Transistoren auf 200mm² Chipfläche in der 16nm-Fertigung von TSMC 6,6 Mrd. Transistoren auf 284mm² Chipfläche in der 12nm-Fertigung von TSMC 10,6 Mrd. Transistoren auf 445mm² Chipfläche in der 12nm-Fertigung von TSMC
Architektur Pascal Turing ohne RT Turing mit RT
Shader-Einheiten max. 10 (Pascal-basierte) Shader-Cluster = max. 1280 Shader-Einheiten max. 24 (Turing-basierte) Shader-Cluster = max. 1536 Shader-Einheiten max. 36 (Turing-basierte) Shader-Cluster = max. 2304 Shader-Einheiten
RayTracing max. 36 RT-Cores
Tensor-Cores max. 288 Tensor-Cores
Grafikkarten GeForce GTX 1060 GeForce GTX 1660 & 1660 Ti GeForce RTX 2060 & 2070

Dies sind im Vergleich zum vorhergehenden GP106-Chip der GeForce GTX 1060 bei 20% mehr Shader-Einheiten und einem gleich breiten Speicherinterface eine um 42% größere Chipfläche – trotz der etwas besseren 12nm-Fertigung, welche eine um 5-8% bessere Packdichte aufweist. nVidia fehlt an dieser Stelle augenscheinlich die eigentlich für die Turing-Generation angedachte 10nm-Fertigung (von Samsung), mittels welcher man denselben Hardware-Aufbau auf einer Chipfläche von wiederum ~200mm² hätte unterbringen können. Hieran erklärt sich auch, wieso nVidia letztlich keinen größere Sprung hat aufbieten können: Jedes Stück mehr an Hardware-Einheiten hätte den TU116-Chip dann in Richtung einer Chipfläche von ~300mm² vergrößert – was irgendwann sicherlich zu groß wird, um Midrange-Grafikkarten noch wirklich wirtschaftlich anbieten zu können. Zudem hat nVidia natürlich auch schon den TU106-Chip für höhere Performancebedürfnisse im Portfolios, welcher mit +50% Shader-Einheiten sogar vergleichsweise nahe am TU116-Chip rangiert.

Eben wegen des TU106-Chips und der darauf basierenden GeForce RTX 2060 & 2070 Grafikkarten braucht nVidia beim TU116-Chip und der darauf basierenden GeForce GTX 1660 Ti Grafikkarte nicht wirklich höhere Auflösungen als FullHD anpeilen – für höhere Auflösungen hat man schließlich schon reihenweise entsprechende Grafikkarten im Angebot. Zudem sind das nur 192 Bit breite Speicherinterface sowie die nur 6 GB Grafikkartenspeicher generell weniger für höhere Auflösungen geeignet – andere die WQHD-Auflösung beackernden Grafikkarten haben in aller Regel mindestens ein 256 Bit breites Speicherinterface sowie generell gleich 8 GB Grafikkartenspeicher. Dies gilt insbesondere für die direkten Kontrahenten der GeForce GTX 1660 Ti in Form von GeForce GTX 1070 und Radeon RX Vega 56. Beide Grafikkarten sind einstmals zu ihrem Launch zwar eher zugunsten der WQHD-Auflösung angetreten – dies ist nun aber inzwischen grob zwei Jahre her und in letzter Zeit gab es durchaus schon die ersten Spiele-Systemanforderungen, welche GeForce GTX 1070 & Radeon RX Vega 56 bereits nur für die FullHD-Auflösung empfohlen haben.

Radeon RX Vega 56 GeForce GTX 1060 6GB GeForce GTX 1070 GeForce GTX 1660 Ti
Chipbasis AMD Vega 10 nVidia GP106 nVidia GP104 nVidia TU116
Fertigung 12,5 Mrd. Transistoren auf 495mm² Chipfläche in der 14nm-Fertigung von GlobalFoundries 4,4 Mrd. Transistoren auf 200mm² Chipfläche in der 16nm-Fertigung von TSMC 7,2 Mrd. Transistoren auf 314mm² Chipfläche in der 16nm-Fertigung von TSMC 6,6 Mrd. Transistoren auf 284mm² Chipfläche in der 12nm-Fertigung von TSMC
Architektur Vega (GCN5), DirectX 12 Feature-Level 12_1 (Tier 3) Pascal, DirectX 12 Feature-Level 12_1 (Tier 2) Pascal, DirectX 12 Feature-Level 12_1 (Tier 2) Turing, DirectX 12 Feature-Level 12_1 (Tier 3)
Features DirectX 12, OpenGL, Vulkan, Asynchonous Compute, VSR, FreeSync, TrueAudio Next, XConnect DirectX 12, OpenGL, Vulkan, Asynchonous Compute, DSR, PhysX, G-Sync, FreeSync DirectX 12, OpenGL, Vulkan, Asynchonous Compute, DSR, SLI, PhysX, G-Sync, FreeSync DirectX 12, OpenGL, Vulkan, Asynchonous Compute, DSR, PhysX, G-Sync, FreeSync
Technik 4 Raster-Engines, 56 Shader-Cluster, 3584 Shader-Einheiten, 224 TMUs, 64 ROPs, 4 MB Level2-Cache, 2048 Bit HBM2-Interface (Salvage) 2 Raster-Engines, 10 Shader-Cluster, 1280 Shader-Einheiten, 80 TMUs, 48 ROPs, 192 Bit GDDR5-Interface, 1.5 MB Level2-Cache (Vollausbau) 3 Raster-Engines, 15 Shader-Cluster, 1920 Shader-Einheiten, 120 TMUs, 64 ROPs, 2 MB Level2-Cache, 256 Bit GDDR5-Interface (Salvage) 3 Raster-Engines, 24 Shader-Cluster, 1536 Shader-Einheiten, 96 TMUs, 48 ROPs, 1.5 MB Level2-Cache, 192 Bit GDDR6-Interface (Vollausbau)
Taktraten 1156/1471/800 MHz (DDR) 1506/1708/4000 MHz (DDR) 1506/1683/4000 MHz (DDR) 1500/1770/3000 MHz (QDR)
Speicherausbau 8 GB HBM2 6 GB GDDR5 8 GB GDDR5 6 GB GDDR6
Ref./Herst./OC / / / / / / / /
Layout DualSlot DualSlot DualSlot DualSlot
Kartenlänge 27,0cm (Referenz) 24,9cm (Referenz) 27,0cm (Referenz) 16,8-30,1cm (Herstellermodelle)
Stromstecker 2x 8pol. 1x 6pol. 1x 8pol. 1x 8pol.
off. Verbrauch 210W (TBP) 120W (GCP) 150W (GCP) 120W (GCP)
realer Verbr. 223W 114W 147W 117W
Ausgänge HDMI 2.0b, 3x DisplayPort 1.4 DualLink DVI-I, HDMI 2.0b, 3x DisplayPort 1.4 DualLink DVI-D, HDMI 2.0b, 3x DisplayPort 1.4 üblicherweise DualLink DVI-D, HDMI 2.0b, DisplayPort 1.4
FHD Perf.Index 840% 590% 800% 780%
4K Perf.Index 114% 76% 107% 103%
Listenpreis 399$ 249$ 379$ 279$
Straßenpreis 310-350€ 200-220€ 320-370€ (Auslauf) 280-300€
Release 14. August 2017 19. Juli 2016 30. Mai 2016 22. Februar 2019

Abweichend von den bisherigen Turing-Grafikkarten gibt es bei der GeForce GTX 1660 Ti weder eine Founders Edition noch irgendeine andere nVidia-eigene Ausführung – den Markt bestreiten bei dieser Karte allein die Herstellermodelle. Jene treten schon zum Launch in zahlreicher Anzahl und vielfältigen Ausführungen an, von einfachen Modellen auf Referenztakt bis hin zu den üblichen Werksübertaktungen in allen Leistungsklassen. Jene Vielfalt trifft dann auch auf die Limits der jeweiligen Karten zu: Manche treten mit dem von nVidia vorgegebenen Power-Limit von 120 Watt an, andere mit einem auf 130 Watt erhöhten Power-Limit, noch höhere Limits wären durchaus denkbar (und sind teilweise im Overclocking-Modus schon verfügbar). Vor allem der zugunsten von Übertaktung gedachte Spielraum beim Power-Limit ist dann allerdings bei jeder Karte anders – genauso natürlich auch wie die thermischen Eigenschaften aufgrund jeweils anderer Kühler sich teilweise erheblich von Karte zu Karte unterscheiden.

Wie nicht unüblich bei einem Launch ohne Referenzdesign treten viele Hardwaretests mit werksübertakteten Grafikkarten an, was einen exakten Vergleich zu anderen Grafikkarten auf Referenz-Taktraten etwas erschwert. Allerdings gab es auch Testberichte, welche sich explizit der Frage gewidmet haben, um wieviel schneller die einzelnen Herstellerdesigns gegenüber den Referenz-Taktraten wirklich sind. Dies ist im Fall der GeForce GTX 1660 Ti vergleichsweise wenig, die besten derzeit getesteten Herstellerkarten können sich im Schnitt der Messungen nur um +3% vom Referenztakt absetzen, selbst deren teilweise höheres Power-Limit trägt hier nicht wesentlich mehr dazu bei. Auf Basis dieser Erkenntnisse lassen sich letztlich auch die Benchmark-Werte von weiteren Hardwaretests mit dem Einsatz von werksübertakteten Grafikkarten auf ein Referenz-Performanceniveau normalisieren.

Taktraten Power-Limit Mehrperf. Testberichte
Zotac GeForce GTX 1660 Ti 1500/1770/3000 MHz (wie Ref.) 120W (wie Ref.) wie Ref. TechPowerUp
Palit GeForce GTX 1660 Ti Storm X 1500/1770/3000 MHz (wie Ref.) 120W (wie Ref.) wie Ref. Guru3D
EVGA GeForce GTX 1660 Ti XC Black Gaming 1500/1770/3000 MHz (wie Ref.) 130W (+10W) ca. +1% AnandTech: +0,4%, TechPowerUp: +2,2%
PNY GeForce GTX 1660 Ti XLR8 OC 1500/1815/3000 MHz (+45 MHz Boostt.) 120W (wie Ref.) ca. +1% ComputerBase: +1,1%
Asus Phoenix GeForce GTX 1660 Ti OC 1500/1815/3000 MHz (+45 MHz Boostt.) 120W (wie Ref.) ca. +1% PCLab
MSI GeForce GTX 1660 Ti Ventus XS 1500/1830/3000 MHz (+60 MHz Boostt.) 120W (wie Ref.) ca. +1,5% Guru3D: +1,2%, TechPowerUp: +3,0%
Asus GeForce GTX 1660 Ti Strix OC 1500/1860/3000 MHz (+90 MHz Boostt.) 130W (+10W) ca. +3% ComputerBase: +3,2%, Guru3D: +2,5%, SweClockers: +2,9%
MSI GeForce GTX 1660 Ti Gaming X 1500/1875/3000 MHz (+105 MHz Boostt.) 130W (+10W) ca. +3% Guru3D: +2,2%, Le Comptoir d.H.: +4,8%, SweClockers: +2,0%, TechPowerUp: +4,5%

Wirklich genau ist diese Methode aber auch nicht, so das nachfolgend die Testberichte auf Referenztakt bevorzugt betrachtet werden sollen. Hierbei gab es leider auch "Fehlschüsse", wo man die GeForce GTX 1660 Ti zwar auf Referenztakt umgetaktet, dann allerdings das vom Kartenhersteller vorgegebene erhöhte Power-Limit (welches bei einem automatisch hochgehenden Boosttakt sicherlich seinen Einfluß hat) nicht beachtet hat. Weiterhin waren bei dieser Performance-Auswertung teilweise mitlaufende werksübertaktete Versionen zu Radeon RX 590, GeForce GTX 1060 und GeForce GTX 1070 zu beachten, jene Benchmark-Werte mussten dann für die Durchschnitts-Bildung entsprechend normalisiert werden. Leider musste auch auf einige Testberichte ganz verzichtet werden, deren Benchmark-Dokumentation Zweifel darüber erlaubte, ob die getesteten Karten wirklich gemäß deren Referenz-Taktraten oder eben als werksübertaktete Ausführungen im Spiel waren. Die jeweiligen Differenzen mögen im einzelnen Benchmark marginal ausfallen, im Sinne der Aufstellung eines insgesamten Performance-Bildes geht es jedoch nicht ohne größtmögliche Exaktheit.

Demzufolge wurde für diese Launch-Analyse die Gewichtung der Benchmarks (bei der Durchschnitts-Bildung) auch zugunsten jener Hardwaretests durchgeführt, welche eine GeForce GTX 1660 Ti auf Referenz-Taktraten im Test hatten. Zwar wurden die Ergebnisse der Hardwaretests mit werksübertakteten GeForce GTX 1660 Ti Karten nach den vorstehend schon genannten Benchmarks entsprechend normalisiert, aufgrund der dort vergleichsweise schwankenden Ergebnissen kann dies allerdings nur eine gewisse Näherung an die Realität darstellen. Der sehr hohen Anteil an Benchmark-Ergebnissen zu werksübertakteten Karten speziell bei Radeon RX 590 und GeForce GTX 1660 Ti ergibt letztlich auch eine höhere Fehlerquote beim insgesamten Performance-Bild dieser beiden Grafikkarten. Diesem wurde durch Einrechnung von besonders vielen Testergebnissen versucht vorzubeugen – bis zu dem Punkt, das der zuletzt hinzugenommene 18. Hardwaretest den insgesamten Durchschnitt der einzelnen Grafikkarten dann nur noch um jeweils +0,1 Prozentpunkt verändern konnte.

FullHD-Perf. 580-8GB 590 Vega56 1060-6GB 1660Ti 1070 1070Ti 2060
AnandTech  (9 Tests) 72,3% 79,2% 105,1% 73,6% 100% 99,3% - 115,9%
Babel Tech Reviews  (40 Tests) - 84,8% * - 77,3% * 100% * 100,7% - -
Bit-Tech  (6 Tests) 76,6% 83,7% * 111,4% 75,1% * 100% 109,1% * 109,4% 117,9%
ComputerBase  (19 Tests) 72,8% 79,4% 106,5% 72,7% 100% 101,7% - 115,6%
Golem  (7 Tests) - 81,2% * 106,4% 75,1% 100% * - - 116,5%
Guru3D  (11 Tests) 77,1% 84,6% * 110,5% 72,1% 100% 100,5% 114,3% 114,2%
Hardwareluxx  (10 Tests) 82,0% * 88,7% * 109,2% 80,3% 100% * 105,1% - 112,4%
KitGuru  (6 Tests) 79,3% 87,6% * 110,8% 74,3% 100% * 98,6% 109,5% 112,0%
Lab501  (9 Tests) - 79,9% * 103,0% 78,0% * 100% * 97,1% 109,5% 109,4%
Le Comptoir d.h.  (20 Tests) 77,4% * 85,3% * 107,0% 73,4% 100% * 99,9% 113,8% 119,7%
PC Games Hardware  (10 Tests) 72,5% 78,8% 103,6% 72,8% 100% 100,9% 115,4% 118,8%
PC Perspective  (7 Tests) - 79,1% * - 73,8% 100% * 100,5% 110,3% 113,1%
PCLab  (12 Tests) 74,8% 83,6% * - 77,4% 100% * 104,8% 118,4% 121,3%
PCWorld  (9 Tests) 76,8% * 83,3% * 106,5% 75,4% * 100% * 97,3% - 111,2%
SweClockers  (10 Tests) 75,0% 83,4% * 112,6% 76,7% 100% 105,2% 118,8% 118,4%
TechPowerUp  (21 Tests) 72,3% 80,7% 106,1% 73,0% 100% 100,0% 114,3% 118,3%
Tom's Hardware  (12 Tests) - 84,1% * 109,0% 75,9% 100% * 102,8% 115,1% 114,4%
WASD  (14 Tests) - 85,5% * 108,2% 78,9% * 100% * 98,9% 112,1% 114,7%
gemittelte FullHD Performance 75,4% 82,2% 108,6% 74,8% 100% 102,0% 114,9% 117,2%
Listenpreis 229$ 279$ 399$ 249$ 279$ 379$ 449$ 349$
Performance-Durchschnitt gewichtet zugunsten jener Hardwaretests mit Benutzung der Referenz-Taktung; gesamte ausgewertete Benchmark-Anzahl: ca. 1560
* ... werksübertaktete Karte, deren Performance-Wert wurde für die Durchschnitts-Bildung entsprechend normalisiert

Letztendlich ergibt sich dann also doch noch ein recht solides Bild: Die GeForce GTX 1660 Ti kommt in die Nähe der Performance der GeForce GTX 1070, erreicht jene bei genauer Betrachtung (und unter Normalisierung der vielen Ergebnisse von werksübertakteten Modellen) nicht gänzlich. Die Performance-Differenz beider Grafikkarten ist mit 2,0% natürlich überhaupt nicht bedeutsam, jene vernünftige Werksübertaktung überwindet diese geringe Differenz. Die GeForce GTX 1660 Ti wird damit im FullHD Performance-Index auf einen Wert von 780% festgesetzt, minimal unterhalb der GeForce GTX 1070 (800%) liegend. Ironischerweise darf die GeForce GTX 1660 Ti auch gar nicht wirklich schneller werden, denn die GeForce RTX 2060 ist nur +17,2% schneller (und kostet derzeit nur +23% mehr). Die vorhergehende GeForce GTX 1060 6GB wird zwar um +33,7% klar geschlagen, wirklich großartig ist dieser Performancegewinn im Vergleich der ähnlichpreisigen Grafikkarten von Pascal- und Turing-Generation aber auch nicht. Die Radeon RX Vega 56 bleibt somit logischerweise etwas schneller, deren +8,6% Mehrperformance muß die GeForce GTX 1660 Ti dann zukünftig ihren besseren Preispunkt entgegensetzen.