14

nVidia stellt mit Quadro RTX 5000, 6000 & 8000 die ersten Teile der Turing-Generation vor

Der nVidia-Event auf der Siggraph 2018 letzte Nacht (Replay) brachte die Vorstellung neuer Quadro-Karten mit sich – welche ganz offiziell auf der Turing-Architektur basieren und damit deren Startschuß geben. Konkret wurden Quadro RTX 5000, 6000 & 8000 mit einige technischen Daten für eine Auslieferung in diesem Herbst vorgestellt, woraus sich auch schon gute Rückschlüsse auf die zugrundeliegenden Grafikchips und sowie die späteren darauf basierenden Gaming-Lösungen ziehen lassen. Zwar nannte nVidia keine Grafikchip-Codenamen, aber in jedem Fall basieren Quadro RTX 6000 & 8000 auf dem größeren Turing-Chip, welcher immerhin 18,6 Mrd. Transistoren in einer Chipfläche von satten 754mm² unterbringt – während die Quadro RTX 5000 auf dem kleineren Turing-Chip basiert, zu welchem noch keine derartig detaillierten Informationen vorliegen. Da aber die Speicherinterfaces der beiden Turing-Chips mit 384 bzw. 256 Bit GDDR6 bekannt sind, dürfte klar sein, das sich hierunter jenes verbirgt, was man bisher als GV102/GT102 bzw. GV104/GT104 bezeichnet hatte.

GV104 GV102 GV100
Chip geschätzt ~11,5 Mrd. Transistoren auf ~500mm² Chipfläche in der 12nm-Fertigung von TSMC 18,6 Mrd. Transistoren auf 754mm² Chipfläche in der 12nm-Fertigung von TSMC 21,1 Mrd. Transistoren auf 815mm² Chipfläche in der 12nm-Fertigung von TSMC
Raster-Engines whrschl. 4 whrschl. 6 6
Shader-Einheiten 3072 Shader-Einheiten 4608 Shader-Einheiten 5376 Shader-Einheiten
FP32-Rechenleistung geschätzt ~11 TFlops 16 TFlops 14,8 TFlops
TMUs whrschl. 192 whrschl. 288 336
ROPs whrschl. 64 whrschl. 96 128
Tensor-Cores 384 576 640
RT-Core 6 GigaRays/sec 10 GigaRays/sec -
Speicherinterface 256 Bit GDDR6 384 Bit GDDR6 4096 Bit HBM2
Speicherausbau 8/16/32 GB GDDR6 12/24/48 GB GDDR6 16/32 GB HBM2
Grafikkarten Quadro RTX 5000 Quadro RTX 6000 & 8000 Titan XV, Quadro GV100 & Tesla V100
Release Herbst 2018 Herbst 2018 Q3/2017
Pascal-Vorgänger GP104: 2560 Shader-Einheiten @ 256 Bit GDDR5X, 8.9 TFlops GP102: 3840 Shader-Einheiten @ 384 Bit GDDR5X, 12.1 TFlops GP100: 3840 Shader-Einheiten @ 4096 Bit HBM2, 10.9 TFlops

Die Codenamen GV102 & GV104 wurden ja zuletzt auch mehrfach in Hardwareinfo-Tools genannt und dürften wahrscheinlich dann doch korrekt sein – nun natürlich gleichzeitig auch auf die sehr enge Verwandtschaft zur Volta-Architektur hindeuten. Von jener erben die beiden Turing-Chips in jedem Fall die Tensor-Cores, welche somit nunmehr auch ins Profi-Segment und nachfolgend dann ins Gaming-Segment gehen werden. Hinzu kommt nun auch noch ein extra "RT-Core", welches eine Besonderheit der Turing-Architektur darstellt. Beides soll dem Zweck von Hardware-RayTracing dienen, was wie erwartet das große Thema der Turing-Generation wird – wahrscheinlich sowohl bei Profi- wie auch Gaming-Lösungen. Natürlich dürfte nVidia sich im klaren darüber sein, das RayTracing derzeit eine Nischenanwendung im Gaming-Bereich ist und auch für die kommenden Monate bleiben wird – aber als Werbethema ist das ganze dennoch geeignet, gerade wenn man ansonsten kaum noch gravierende Neuigkeiten bei heutigen Grafik-Beschleunigern aufbieten kann.

Allerdings setzt nVidia dafür auch ziemlich heftige Chipflächen an: Der Enthusiasten-Chip GV102 kommt auf eine Chipfläche von satten 754mm² – wer dachte, die bisherige Schätzung von ~676mm² wäre schon zu viel, sieht sich unerwarteterweise eines besseren belehrt. In diese Chipfläche packt nVidia allerdings nicht unendlich mehr an konventioneller Grafik-Hardware aka Shader-Einheiten – vielmehr gibt es "nur" 4608 Shader-Einheiten, was weit unterhalb der bisherigen Schätzungen für eine derartige Chipfläche liegt. Jene früheren Schätzungen haben allerdings den enormen Flächenbedarf für Tensor-Cores und RT-Core nicht mit einbezogen, welche in den nVidia-Schaubildern schnell einmal die Hälfte der Chipfläche belegen können. Ganz so viel dürfte es in der Realität nicht sein, aber in jedem Fall wird damit die enorme Chipfläche erklärt, trotz gegenüber dem GP102-Chip nur um 20% höherer Anzahl an konventionellen Shader-Einheiten. Zum GV104-Chip kann man diesbezüglich nur schätzen, aber da die Hardware-Einheiten allesamt symetrisch skaliert sind und zwischen GP102 & GP104 ein Faktor von 1.5 liegt, dürfte der GV104-Chip wahrscheinlich um die 500mm² groß sein.

Für einen HighEnd-Chip ist dies ebenfalls sehr heftig – und nebenbei sicherlich ein Grund dafür, den GP104-Chip mit seinen deutlich kleineren 314mm² Chipfläche auch innerhalb der Turing-Generation weiterleben zu lassen. Zwar gibt es derzeit noch keinerlei Anzeichen dafür, ob es noch kleinere Turing-Chips geben oder jene nicht geben wird – aber wir denken weiterhin, das es für nVidia derzeit noch keinen großen Sinn macht, außerhalb des HighEnd- und Enthusiasten-Feldes derart viel Chipfläche für RayTracing zu verbrauchen, gerade wo die Anwendungsmöglichkeiten hierfür auf absehbare Zeit eher begrenzt sein werden. Die Kosten für diese Chipflächen lohnen nur dort, wo die Grafikkarten-Preise entsprechend hoch sind, sprich bei HighEnd-, Enthusiasten- und Profi-Lösungen. Im Massenmarkt macht dies dagegen erst Sinn, wenn RayTracing ein klein wenig raus den Kinderschuhen ist – und gleichzeitig die 7nm-Fertigung zu Verfügung steht, wo man sehr viel mehr Transistoren in sogar wiederum etwas kleineren Chipflächen unterbringen kann.

Überschaubar ist derzeit aber sowieso nur das, was im Rahmen der Grafikchips GV102 & GV104 an Gaming-Lösungen kommen könnte. In beiden Fällen gibt es 20% mehr Shader-Einheiten, augenscheinlich auch etwas mehr Takt (die FP32-Rechenleistung der Quadro RTX 8000 ergibt einen Chiptakt von ~1735 MHz) und mittels GDDR6-Speicher auf 14 Gbps eine um ~25% höhere Speicherbandbreite. Der ganz große Sprung ist damit sicherlich nicht zu erreichen, möglicherweise reicht es noch nicht einmal zu einem mittleren Performance-Boost – sondern kommen die Turing-basierten GeForce-Grafikkarten bei einer Mehrperformance unterhalb 40% gegenüber der vorhergehenden Pascal-Generation heraus. Ob die (reichlich) verbaute RayTracing-Hardware daran etwas ändern kann, bleibt abzuwarten – vielleicht findet nVidia ja Mittel und Wege, diese großen Chipteile auch in normaler Rasterizer-Grafik mit Aufgaben zu belegen. Für den Augenblick sieht nVidias Turing aus Gamer-Sicht zwar sicherlich wie ein sehr dickes Stück Hardware aus, ein großer hiermit einhergehender Performancegewinn muß allerdings zum jetzigen Zeitpunkt eher angezweifelt werden.

Zur Frage der mit der Turing-Generation im Gaming-Segment gebotenen Speichermengen gibt es dagegen derzeit noch keine Antwort. Die genannten Speicherinterfaces definieren erst einmal die möglichen Speichermengen für beide Turing-Grafikchips – aber natürlich nicht, wieviel nVidia dann bei den Gaming-Lösungen in der Praxis einsetzt. Zumindest ist die technische Möglichkeit zu höheren Speichermengen in jedem Fall vorhanden, wenn die GV104-basierte Quadro RTX 5000 mit 16 GB antritt sowie die GV102-basierte Quadro RTX 8000 sogar mit satten 48 GB. Für letztere wird nVidia schon Zugriff auf 2-GByte-Chips haben, auch wenn jene derzeit noch nicht zur Standardware im GDDR6-Geschäft gehören. Im Gaming-Segment wird dies primär zur reinen Preisfrage, denn für den Sprung von 8 auf 16 GB bzw. von 12 auf 24 GB müssten die Grafikkartenpreise um 100-150 Euro angehoben werden. Ob nVidia diesen Weg geht oder dies späteren Grafikchip-Generation (zu hoffentlich besseren Speicherpreise) vorbehält, bleibt die konkrete Vorstellung neuer Gaming-Lösungen auf Turing-Basis abzuwarten.

Der nVidia-Event auf der Siggraph 2018 letzte Nacht (Replay) brachte die Vorstellung neuer Quadro-Karten mit sich - welche ganz offiziell auf der Turing-Architektur basieren und damit deren Startschuß geben. Konkret wurden Quadro RTX 5000, 6000 & 8000 mit einige technischen Daten für eine Auslieferung in diesem Herbst vorgestellt, woraus sich auch schon gute Rückschlüsse auf die zugrundeliegenden Grafikchips und sowie die späteren darauf basierenden Gaming-Lösungen ziehen lassen. Zwar nannte nVidia keine Grafikchip-Codenamen, aber in jedem Fall basieren Quadro RTX 6000 & 8000 auf dem größeren Turing-Chip, welcher immerhin 18,6 Mrd. Transistoren in einer Chipfläche von satten 754mm² unterbringt - während die Quadro RTX 5000 auf dem kleineren Turing-Chip basiert, zu welchem noch keine derartig detaillierten Informationen vorliegen. Da aber die Speicherinterfaces der beiden Turing-Chips mit 384 bzw. 256 Bit GDDR6 bekannt sind, dürfte klar sein, das sich hierunter jenes verbirgt, was man bisher als GV102/GT102 bzw. GV104/GT104 bezeichnet hatte.





GV104
GV102
GV100





Chip
geschätzt ~11,5 Mrd. Transistoren auf ~500mm² Chipfläche in der 12nm-Fertigung von TSMC
18,6 Mrd. Transistoren auf 754mm² Chipfläche in der 12nm-Fertigung von TSMC
21,1 Mrd. Transistoren auf 815mm² Chipfläche in der 12nm-Fertigung von TSMC



Raster-Engines
whrschl. 4
whrschl. 6
6



Shader-Einheiten
3072 Shader-Einheiten
4608 Shader-Einheiten
5376 Shader-Einheiten



FP32-Rechenleistung
geschätzt ~11 TFlops
16 TFlops
14,8 TFlops



TMUs
whrschl. 192
whrschl. 288
336



ROPs
whrschl. 64
whrschl. 96
128



Tensor-Cores
384
576
640



RT-Core
6 GigaRays/sec
10 GigaRays/sec
-



Speicherinterface
256 Bit GDDR6
384 Bit GDDR6
4096 Bit HBM2



Speicherausbau
8/16/32 GB GDDR6
12/24/48 GB GDDR6
16/32 GB HBM2



Grafikkarten
Quadro RTX 5000
Quadro RTX 6000 & 8000
Titan XV, Quadro GV100 & Tesla V100



Release
Herbst 2018
Herbst 2018
Q3/2017



Pascal-Vorgänger
GP104: 2560 Shader-Einheiten @ 256 Bit GDDR5X, 8.9 TFlops
GP102: 3840 Shader-Einheiten @ 384 Bit GDDR5X, 12.1 TFlops
GP100: 3840 Shader-Einheiten @ 4096 Bit HBM2, 10.9 TFlops