Launch-Analyse nVidia GeForce RTX 2070

Sonntag, 21. Oktober 2018
 

Mit der GeForce RTX 2070 schickt nVidia nunmehr seine dritte Turing-basierte Grafiklösung ins Rennen – auf dem inzwischen schon dritten Turing-Grafikchip (TU106), ungewöhnlich viel zu diesem vergleichsweise frühen Zeitpunkt. Jene dritte Turing-Lösung kommt zu einem Preispunkt von (idealerweise) 499 Dollar daher, verbleibt also immer noch klar im HighEnd-Bereich und stellt damit sicherlich das höchste (und auch teuerste) dar, was nVidia jemals im Rahmen einer x70er Grafikkarte geboten hat. Mit diesem Preispunkt geht die Karte dann in direkte Konkurrenz zur genauso ausgepreisten GeForce GTX 1080 aus der vorhergehenden Pascal-Generation – und wir werden uns nachfolgend ansehen, was die vielen Launchreviews zu den Themen Performance, Taktraten, Stromverbrauch, Übertaktungseignung und Performance/Preis-Verhältnis der GeForce RTX 2070 zu sagen haben.

Der TU106-Chip der GeForce RTX 2070 stellt ein für nVidia-Verhältnisse speziell im Vergleich zum darüberliegenden TU104-Chip der GeForce RTX 2080 etwas gewöhnungsbedürfiges Produkt dar: Mit 2304 zu 3072 Shader-Einheiten gibt es gleich satte 75% der Rechenkraft jenes TU104-Chips – dies ist vergleichsweise viel, normalerweise strebt man Abspeckungen im Verhältnis 1:2 bzw. auf 50% des Niveaus des größeren Chips an. Abweichend davon wurden die Raster-Engines von 6 auf 3 beim TU106-Chip wiederum glatt halbiert – wobei man an dieser Stelle wohl eher sagen muß, das der TU104 mit seinen 6 Raster-Engines eher überdimensioniert ist, gerade da der (nochmals) größere TU102-Chip genauso nur deren 6 Stück trägt. Und letztlich ist das Speicherinterface dann wieder gleich zum TU104-Chip – womit, da auf dem gleichen Speichertakt laufend, zwischen TU104 und TU106 somit die identische Speicherbandbreite zur Verfügung steht.

Wieso nVidia für diese (nominell) geringe Differenz einen extra Grafikchip aufgelegt hat, verdient sicherlich noch einmal einer schlüssigen Erklärung. Immerhin führt dies zu einem Chipflächen-Unterschied von nur -18% weniger (bzw. 22% mehr) zwischen TU104 und TU106. Für den Augenblick kann man annehmen, das eine solche relative Differenz zwar bei den kleineren Grafikchips keine echte Rolle spielt (weil dort dann nur eine geringe absolute Differenz herauskommt), es bei größeren Grafikchips dann jedoch wirtschaftlich interessant wird, jene dennoch extra zu fertigen. Der Grund dürfte also schlicht in der erreichten absoluten Differenz von immerhin 100mm² mehr/weniger Chipfläche zwischen TU104- und TU106-Chip liegen. An weiteren fehlenden Features kann es dagegen kaum hängen: Zwar hat nVidia dem TU106 keinen NVLink spendiert, aber RayTracing und Tensor-Cores sind in (relativ) derselben Stärke wie bei TU104 und TU102 mit an Bord.

nVidia Turing TU106 nVidia Turing TU104 nVidia Turing TU102
Chip 10,6 Mrd. Transistoren auf 445mm² Chipfläche in der 12nm-Fertigung von TSMC 13,6 Mrd. Transistoren auf 545mm² Chipfläche in der 12nm-Fertigung von TSMC 18,6 Mrd. Transistoren auf 754mm² Chipfläche in der 12nm-Fertigung von TSMC
Hardware 3 Raster-Engines, 36 Shader-Cluster, 2304 Shader-Einheiten, 144 TMUs, 36 RT-Cores, 288 Tensor-Cores, 64 ROPs, 4 MB Level2-Cache, 256 Bit GDDR6-Speicherinterface 6 Raster-Engines, 48 Shader-Cluster, 3072 Shader-Einheiten, 192 TMUs, 48 RT-Cores, 384 Tensor-Cores, 64 ROPs, 4 MB Level2-Cache, 256 Bit GDDR6-Speicherinterface 6 Raster-Engines, 72 Shader-Cluster, 4608 Shader-Einheiten, 288 TMUs, 72 RT-Cores, 576 Tensor-Cores, 96 ROPs, 6 MB Level2-Cache, 384 Bit GDDR6-Speicherinterface
NVLink & SLI - ein NVLink 2.0 x8-Anschluß (50 GB/sec), Support für maximal 2fach SLI zwei NVLink 2.0 x8-Anschlüsse (100 GB/sec), Support für maximal 2fach SLI
verbaut bei GeForce RTX 2070 (Vollausbau) GeForce RTX 2080 (Salvage) & Quadro RTX 5000 (Vollausbau) GeForce RTX 2080 Ti (Salvage) & Quadro RTX 6000/8000 (Vollausbau)
Vorgänger-Chip - Pascal GP104, 7,2 Mrd. Transistoren auf 314mm² Chipfläche in der 16nm-Fertigung von TSMC, 4 Raster-Engines, 20 Shader-Cluster, 2560 Shader-Einheiten, 160 TMUs, 64 ROPs, 2 MB Level2-Cache, 256 Bit GDDR5X-Speicherinterface Pascal GP102, 12 Mrd. Transistoren auf 471mm² Chipfläche in der 16nm-Fertigung von TSMC, 6 Raster-Engines, 30 Shader-Cluster, 3840 Shader-Einheiten, 256 TMUs, 96 ROPs, 3 MB Level2-Cache, 384 Bit GDDR5X-Speicherinterface

Aufgrund der Nähe zum TU104-Chip stellt der TU106 somit sicherlich auch keinen typischen Midrange-Chip von nVidia dar – wie man ansonsten anhand der Nummierung als "x06" vermuten könnte. Der echte Midrange-Chip der Turing-Generation wird (sofern nVidia einen solchen auflegt) sicherlich anders, vermutlich deutlich kleiner herauskommen. Der TU106-Chip ist somit trotz des Namens ein weiterer HighEnd-Chip – nVidia legt halt innerhalb der Turing-Generation gleich zwei davon auf. Die Preislage der GeForce RTX 2070 von nicht unter 499 Dollar sowie die Beibehaltung der RayTracing-Funktionalität für diesen Grafikchips bzw. diese Grafikkarte deuten genauso darauf hin, das hierbei nicht das Midrange-Segment die Zielsetzung darstellt.

Die aus dem TU106-Chip entnommene GeForce RTX 2070 Grafikkarte entspricht dann dem Vollausbau jenes Grafikchips – und stellt damit die bislang einzige im Gaming-Segment verfügbare Lösung basierend auf einem Vollausbau eines der drei Turing-Grafikchips dar. Abweichend von den bisherigen GeForce RTX 2080 & 2080 Ti Karten kommt die GeForce RTX 2070 mit klar kürzerer Platine daher, welche nur 22,9cm lang ist – gegenüber den 26,7cm der beiden anderen Turing-Karten. Die meisten Herstellerkarten scheinen sich im übrigen an diese Vorgabe zu halten, wobei es natürlich auch kürzere wie auch längere Herstellermodelle zur GeForce RTX 2070 gibt. Generell dürften bei der GeForce RTX 2070 in einem noch viel stärkeren Maß jene Herstellerkarten das Geschehen dominieren, da nVidias eigene Founders Edition (mit ihrem Preisaufschlag) für dieses Marktsegment einfach zu teuer ist.

Radeon RX Vega 64 GeForce GTX 1080 GeForce GTX 2070 GeForce GTX 1080 Ti
Chipbasis AMD Vega 10 nVidia GP104 nVidia TU106 nVidia GP102
Fertigung 12,5 Mrd. Transistoren auf 486mm² Chipfläche in der 14nm-Fertigung von GlobalFoundries 7,2 Mrd. Transistoren auf 314mm² Chipfläche in der 16nm-Fertigung von TSMC 10,6 Mrd. Transistoren auf 445mm² Chipfläche in der 12nm-Fertigung von TSMC 12 Mrd. Transistoren auf 471mm² Chipfläche in der 16nm-Fertigung von TSMC
Architektur Vega, DirectX 12 Feature-Level 12_1 (Tier 3) Pascal, DirectX 12 Feature-Level 12_1 (Tier 2) Turing, DirectX 12 Feature-Level 12_1 (Tier 3) Pascal, DirectX 12 Feature-Level 12_1 (Tier 2)
Features DirectX 12, OpenGL, Vulkan, Asynchonous Compute, VSR, FreeSync, TrueAudio Next, XConnect DirectX 12, OpenGL, Vulkan, Asynchonous Compute, DSR, SLI, PhysX, G-Sync DirectX 12, OpenGL, Vulkan, Asynchonous Compute, RayTracing, DSR, DLSS, PhysX, G-Sync DirectX 12, OpenGL, Vulkan, Asynchonous Compute, DSR, SLI, PhysX, G-Sync
Technik 4 Raster-Engines, 64 Shader-Cluster, 4096 Shader-Einheiten, 256 TMUs, 64 ROPs, 2048 Bit HBM2-Interface, 4 MB Level2-Cache (Vollausbau) 4 Raster-Engines, 20 Shader-Cluster, 2560 Shader-Einheiten, 160 TMUs, 64 ROPs, 256 Bit GDDR5X-Interface, 2 MB Level2-Cache (Vollausbau) 3 Raster-Engines, 36 Shader-Cluster, 2304 Shader-Einheiten, 144 TMUs, 64 ROPs, 256 Bit GDDR6-Interface, 4 MB Level2-Cache (Vollausbau) 6 Raster-Engines, 28 Shader-Cluster, 3584 Shader-Einheiten, 224 TMUs, 88 ROPs, 352 Bit GDDR5X-Interface, 2.75 MB Level2-Cache (Salvage)
Taktraten 1247/1546/945 MHz 1607/1733/2500 MHz Ref: 1410/1620/3500 MHz
FE: 1410/1710/3500 MHz
1480/1582/2750 MHz
Speicherausbau 8 GB HBM2 8 GB GDDR5X 8 GB GDDR6 11 GB GDDR5X
Layout DualSlot DualSlot DualSlot DualSlot
Kartenlänge 27cm 26,7cm 22,9cm 26,7cm
Ref/Herst./OC / / / / / / / /
Stromstecker 2x 8pol. 1x 8pol. 1x 8pol. 1x 6pol. + 1x 8pol.
TDP 295W 180W Ref: 175W   FE: 185W 250W
realer Verbr. 297W 175W Ref: ~174W   FE: ~191W 238W
Ausgänge HDMI 2.0b, 3x DisplayPort 1.4 DualLink DVI-D, HDMI 2.0b, 3x DisplayPort 1.4 HDMI 2.0b, 3x DisplayPort 1.4, VirtualLink per USB Type C HDMI 2.0b, 3x DisplayPort 1.4
FHD Perf.Index 930% 960% Ref: 1030%   FE: 1070% 1180%
4K Perf.Index 132% 132% Ref: 146%   FE: 151% 175%
Listenpreis 499$ 499$ Ref: 499$   FE: 599$ 699$
Straßenpreis 480-560€ 480-540€ Ref: 520-600€   FE: 639€ 770-900€ (Auslauf)
Release 14. August 2017 17. Mai 2016 16. Oktober 2018 10. März 2017

Denn auch die GeForce RTX 2070 setzt das bisherige Karten-Schema von Turing fort: Es gibt Herstellerkarten zu einem Referenztakt samt (relativ) günstigem Listenpreis – und dann nVidias eigene Founders Edition mit höheren Taktraten (aka werksübertaktet) zum klar höheren Preispunkt. Daneben werden die Grafikkartenhersteller natürlich auch noch ihre eigenen Werksübertaktungen herausbringen – und mit diesen die Founders Edition preislich wahrscheinlich gehörig unter Druck setzen. Zu beachten wäre daneben eine gewisse Differenz auf Chip-Seite: Karten mit non-A-Chips dürfen nicht werksübertaktet angeboten werden, bedeuten also immer den Referenztakt. Nur Karten mit "A"-Chips dürfen für werksübertaktete Grafikkarten verwendet werden und können dann auch solcherarts Limits bzw. Limit-Erweiterungen bieten, welche Übertaktung bis an die Grenzen der Hardware überhaupt erst ermöglichen.

Selbstverständlich bleibt die manuelle Übertaktung (durch den Benutzer) auch auf den Karten mit non-A-Chips weiterhin erlaubt – die große Differenz liegt in den Limits, die jeweils zur Verfügung stehen: Auf einer GeForce RTX 2070 Grafikkarte mit non-A-Chip (nachfolgend dann einfach als "Referenz" bezeichnet) kann man vom originalen Power-Limit von 175 Watt maximal auf 200 Watt erhöhen. Da direkte BIOS-Modifikationen nicht mehr möglich sind und das Flashen des BIOS einer anderen Chip-Variante inzwischen ebenfalls unterbunden ist, bleibt es auch bei diesen 200 Watt – es sei denn, man würde sich an eine regelrecht Hardware-Modifikation waagen. Ein gewisses Overclocking ist damit zwar drin, aber an die wirklich Grenzen der Hardware kommt man damit dann sicherlich nicht (annähernd) heran.

GeForce RTX 2070 Referenz GeForce RTX 2070 FE GeForce RTX 2070 Werks-OC
Grafikchip-Variante non-A  (TU106-400) "A"  (TU106-400A) "A"  (TU106-400A)
Taktraten (ausschließlich) Referenztakt: 1410/1620/3500 MHz FE-Takt: 1410/1710/3500 MHz frei nach Herstellergusto (üblicherweise um den FE-Takt herum)
Power-Limit Referenz-Power-Limit: 175W FE-Power-Limit: 185W frei nach Herstellergusto (üblicherweise FE-Power-Limit oder höher)
OC durch Benutzer
BIOS modifizierbar
anderes BIOS nutzbar
(maximal zu anderen non-A-Karten = zwecklos)

(wahrscheinlich, aber bisher nicht belegt)
Platinenlayout nVidia-Referenz oder Herstellerdesign nVidia-Referenz nVidia-Referenz oder Herstellerdesign
Kühlerdesign Herstellerdesign nVidia-Referenz Herstellerdesign

Zwar haben die Karten allesamt einen 8poligen Stromanschluß, könnten demzufolge bis zu 225 Watt noch innerhalb der entsprechenden Spezifikationen ziehen (und noch einiges mehr wird rein praktisch möglich sein). Das Power-Limit der Referenzkarten regelt dies allerdings bei maximal 200 Watt alles schon weg – woran auch zu sehen ist, wie wenig bedeutsam die Nennung der Stromanschlüsse in Zeiten von Power-Limits geworden ist. Wer also wirklich übertakten will, muß zwingend zu einer Karte mit "A"-Chip greifen – und sollte dabei schauen, wo der Hersteller das Power-Limit bzw. vor allem die maximale Erhöhung für das Power-Limit angesetzt hat. Man muß es dabei zwar auch nicht übertreiben, aber generell gilt: Mehr ist besser bzw. ergibt die geringere Chance darauf, am Ende mit seinem Übertaktungserfolg allein am Power-Limit festzuhängen. Gerade die GeForce RTX 2070 mit ihrer zur GeForce RTX 2080 identischen Speicherbandbreite sollte sich eigentlich für HighEnd-Übertaktungen eignen, um (halbwegs) in die Nähe des Performance-Niveaus der größeren Karte zu kommen.

Der nominell niedrigere Takt der GeForce RTX 2070 dürfte an dieser Stelle nicht weiterhelfen (jener würde aus Overclocking-Sicht einen höheren Overclocking-Spielraum bedeuten) – denn diese Taktrate gibt es augenscheinlich nur auf dem Papier. So hat die GeForce RTX 2070 gegenüber der GeForce RTX 2080 nominell jeweils um 90 MHz niedrige (offizielle) Boost-Taktraten, der real ausgemessene Takt der Founders Edition sagt jedoch etwas anderes: Zur GeForce RTX 2080 wurden durchschnittliche Spiele-Taktraten von 1897 MHz sowie 1867 MHz ermittelt, die GeForce RTX 2070 kommt hierbei mit 1862 MHz auf grob dem gleichen Niveau heraus. Die entsprechenden Messungen zu Referenzkarten ergaben dann reale Taktraten von 1735 MHz, 1792 MHz sowie 1781 MHz – sprich jeweils (sehr) deutlich mehr als das offizielle Taktraten-Niveau einer Referenzkarte (1620 MHz Boosttakt), sowie beachtbar oberhalb des offiziellen Taktratenniveau der Founders Edition (1710 MHz Boosttakt). In der Summe kann man sagen, das die GeForce RTX 2070 in der Praxis klar höhere reale Taktraten als gemäß deren offizieller Spezifikationen erreicht.

GeForce RTX 2070 Referenz GeForce RTX 2070 FE GeForce RTX 2070 Werks-OC
Temperatur-Limit 81°C 81°C 81°C
max. Temp-Limit bis 88°C einstellbar bis 88°C einstellbar bis 88°C einstellbar
Power-Limit 175W 185W variabel je nach Karte
max. Power-Limit bis +14% einstellbar (= 200W) bis +16% einstellbar (= 215W) variabel je nach Karte
nominelle Taktraten 1410/1620/3500 MHz 1410/1710/3500 MHz variabel je nach Karte
höchster Chiptakt ? 1935 MHz -
realer Chiptakt ComputerBase: Ø 1735 MHz (16 Tests)
Hardwareluxx: 1792 MHz (9 Tests)
Overclock3D: Ø 1781 MHz
TechPowerUp: Ø 1862 MHz (23 Tests) -