Wie nVidias Pascal-Generation für das Jahr 2016 aussehen könnte

In unserem Forum [1] wird derzeit intensiv über die Maxwell-Nachfolgearchitektur "Pascal [2]" diskutiert – hierzu liegen derzeit zwar noch wenige griffige Informationen außer ein paar neueren nVidia-Roadmaps [3] und Allgemeinplätze wie jene der 16FF+ Fertigung von TSMC sowie dem Einsatz von HBM2-Speicher [4] vor, aber genau dann lohnt sich die Spekulation schließlich um so mehr. Mangels größerer Ansatzpunkte für eine Technik-Diskussion geht es derzeit in erster Linie darum, die Pascal-Architektur terminlich genauer zu bestimmen. Hierzu gab es mal die nVidia-eigene Aussage von "Anfang 2016" für den Spitzenchip GP100 – was man allerdings durchaus in Frage stellen kann, denn die anderen in dieser Auflistung [5] angegebenen Termine wurden schließlich auch nicht eingehalten. Ganz generell ist es eher unwahrscheinlich, daß ausgerechnet dieser Spitzenchip GP100 als erster der neuen Generation erscheint – neue Fertigungsverfahren versucht man heutzutage eher mit kleineren Chips einzuweihen, größere Chips machen das nur unnötig kompliziert und teuer.

Die wahrscheinlichste Auflösung ist daher eine ähnliche Herangehensweise wie bei den ersten 28nm-Beschleunigern von nVidia: Da kam zuerst der HighEnd-Chip GK104 [6] – und erst lange 11 Monate später der Enthusiasten-Chip GK110 [7]. Bei dieser ausgesprochen hohen zeitlichen Differenz mögen sicherlich auch Verzögerungen bei der Designphase des GK110-Chips mit hineingespielt haben, aber auch ohne diese Verzögerungen wäre der GK104-Chip sowieso zuerst im Markt gewesen: nVidia geht derzeit generell den Weg, zuerst mit einem schnellen HighEnd-Chip abzukassieren – und erst später den Enthusiasten-Chip zu bringen, innerhalb einer Generation damit also zweimal einen jeweils schnellsten Chip vorzustellen (siehe auch zuerst GM204 [8] und dann erst GM200 [9] in der aktuellen Maxwell-2-Generation). So lange AMD hier nicht dazwischenfunkt, dürfte nVidia diese Releaseabfolge auch bei der Pascal-Generation durchziehen – GP104 zuerst, dann etwas später der GP100. Dies hat sogar den Vorteil, daß bei rechtzeitiger GP100-Fertigstellung viele frühzeitig gefertigte Chips dann in den (lukrativeren) Profi-Markt gehen können.

Eher unwahrscheinlich ist im übrigen, daß nVidia versuchen sollte, noch eine weitere Generation zwischen Maxwell 2 und Pascal dazwischenzudrücken: Hierzu wird gern eine hypothetische Maxwell-3-Generation in der 16nm-Fertigung genannt. nVidia ist aber nicht dafür bekannt, besonders viele echte Grafikchips aufzulegen – sondern eher dafür, teilweise komplette Grafikkarten-Generationen aus Rebrandings zu bestreiten (GeForce 500 & 700 Serien). Zudem wird die Pascal-Generation im eigentlichen schon als "weitgehend Maxwell-2-Architektur" nur in eben der 16nm-Fertigung und mit HBM2-Speicher beschrieben, größere Architektur-Veränderungen wird es mit Pascal wohl nicht geben. nVidia wird wohl schlicht die 16nm-Fertigung für eine Aufstockung der Anzahl der Hardware-Einheiten nutzen – und jene (deutlich) dickere Hardware-Power bedingt dann bei den größeren Chips ebenso deutlich mehr Speicherbandbreite, welches man dann mittels HBM2-Interfaces und HBM2-Speicher lösen will.

Wieviel mehr Hardware nVidia dabei bieten wird, ist derzeit natürlich ebenfalls rein spekulativ. Wenigstens kann man damit rechnen, daß durch die Verkleinerungen der 16FF+ Fertigung von TSMC wieder eine glatte Verdopplung der Anzahl der Ausführungseinheiten innerhalb derselben Chipfläche möglich wird. Allerdings ist es gut möglich, daß nVidia zum Start der ersten 16nm-Generation diese Fertigungstechnologie kaum derart ausreizt wie derzeit bei der 28nm-Fertigung zu sehen (siehe nVidias Monster-Chip GM200 mit 601mm² Chipfläche). Schon allein aus Gründen höherer Kosten und der (in den Anfangsmonaten) deutlich schlechteren Ausbeute größerer Chips in einem neuen Fertigungsverfahren könnte sich nVidia bei der Chipgröße der ersten 16nm-Generation möglicherweise klar beschränken. Nicht auszuschließen ist daher, daß der GP100-Chip von nVidia mit nur 50-70% mehr Ausführungseinheiten als der aktuelle GM200-Chip erscheint – oder aber, daß nVidia tatsächlich sehr große Chips innerhalb der Pascal-Generation auflegt, diese anfänglich aber ausschließlich teildeaktiviert in den Markt entläßt.

	Kepler	Maxwell	Pascal
Enthusiast	GK110 551mm² @ 28nm TSMC 2880 Shader-Einheiten 384 Bit DDR GDDR5-Interface Release: Februar 2013	GM200 601mm² @ 28nm TSMC 3072 Shader-Einheiten 384 Bit DDR GDDR5-Interface Release: März 2015	GP100 vmtl. ~500-550mm² @ 16FF+ TSMC vmtl. ~4500-6000 Shader-Einheiten vmtl. 4096 Bit DDR HBM2-Interface vmtl. Release: Mitte/Ende 2016
HighEnd	GK104 294mm² @ 28nm TSMC 1536 Shader-Einheiten 256 Bit DDR GDDR5-Interface Release: März 2012	GM204 398mm² @ 28nm TSMC 2048 Shader-Einheiten 256 Bit DDR GDDR5-Interface Release: September 2014	GP104 vmtl. ~300-350mm² @ 16FF+ TSMC vmtl. ~3000-4000 Shader-Einheiten vmtl. 2048 Bit DDR HBM2-Interface vmtl. Release: Anfang/Mitte 2016
Performance	GK106 221mm² @ 28nm TSMC 960 Shader-Einheiten 192 Bit DDR GDDR5-Interface Release: September 2012	GM206 227mm² @ 28nm TSMC 1024 Shader-Einheiten 128 Bit DDR GDDR5-Interface Release: Januar 2015	GP106 vmtl. ~200mm² @ 16FF+ TSMC vmtl. ~1500-2000 Shader-Einheiten vmtl. 256 Bit DDR GDDR5-Interface (oder 1024 Bit DDR HBM2-Interface) vmtl. Release: Anfang/Mitte 2016
Mainstream	GK107 118mm² @ 28nm TSMC 384 Shader-Einheiten 128 Bit DDR GDDR5-Interface Release: September 2012	GM107 148mm² @ 28nm TSMC 640 Shader-Einheiten 128 Bit DDR GDDR5-Interface Release: Februar 2014	GP107 vmtl. ~120mm² @ 16FF+ TSMC vmtl. ~700-1000 Shader-Einheiten vmtl. 128 Bit DDR GDDR5-Interface vmtl. Release: Anfang/Mitte 2016
Anm.: Diese Tabelle enthält für die 2016er Pascal-Generation rein spekulative Angaben.

Obige Hardware-Daten für die Pascal-Chips GP107, GP106, GP104 und GP100 sind natürlich rein spekulativ und geben auch nur das wieder, was mittels der angesetzten 16FF+ Fertigung von TSMC möglich sein sollte. Was nVidia hierzu letztlich wirklich ansetzt, ist derzeit noch (lange) nicht bekannt, vermutlich wird es erst in Richtung Jahreswechsel erste reale Vorabinformationen zu den Pascal-Grafikchips und den darauf basierenden Grafikkarten geben. Da nVidia derzeit schon bei der "GeForce 900" Grafikkarten-Serie angelangt ist, steht im übrigen vielleicht sogar ein neues Benennungsschema an – oder aber es kommt zum schlichten Wechsel auf die "GeForce 1000" Serie.

Nachtrag vom 2. April 2015

Ein wenig fehlend in unserer Ausarbeitung, wie nVidias Pascal-Generation aussehen könnte, sind die (bisher bekannten) Architektur-Features von Pascal: Dazu gehört (wie schon beschrieben) der breite, aber wohl nicht ausschließliche Einsatz von HBM2-Interfaces und -Speicher, mittels welchem die Speicherbandbreiten deutlich nach oben gedrückt werden können – was auch notwendig ist angesichts der vermutlich verbauten Einheiten-Anzahl. Daneben wird es höchstwahrscheinlich generell neu gestaltete Shader-Einheiten geben, welche bezüglich der Rechengenauigkeit einen Mixed-Mode [10] beherrschen: Entweder volle FP32-Performance oder halbe FP64-Performance. Damit spart sich nVidia das Heranpflaschen von extra FP64-Einheiten, die neuen Shader-Einheiten werden aber natürlich wegen des Mixed-Modes trotzdem etwas größer ausfallen müssen als die bisherigen Shader-Einheiten der Maxwell-Architektur. Bei einer angenommen glatten Verdopplung der Transistorenanzahl durch den Wechsel von der 28nm- auf die 16nm-Fertigung würde es demzufolge knapp werden mit einer glatten Einheiten-Verdopplung.

Andererseits kann man in der Pascal-Generation gewisse Flächeneinsparungen durch die Verwendung von HBM-Speicherinterfaces [11] verbuchen – zudem ist auch noch nicht klar, wie groß der Flächenvorteil von der 28nm- zur 16nm-Fertigung in der Praxis von großen Grafikchips wirklich ausfällt. Gut möglich ist in diesem Zusammenhang auch eine Umgestaltung der Shader-Cluster – als erstes würde einem hierzu ein höheres Verhältnis von Shader- zu Texturenpower einfallen. Ein GM200-Chip mit angenommen 6144 Shader-Einheiten hätte im Maxwell-Modus schließlich schon satte 384 Textureneinheiten, was womöglich zu viel sein und daher eingespart werden könnte. Daneben ist zur Pascal-Generation noch die Verwendung des NVLink-Interfaces als neue, sehr breitbandige Anbindung zum Rest des PC-Systems bekannt – welche vermutlich jedoch nur im GP100-Chip verbaut wird, da eher nur für professionelle Zwecke benötigt. Im Gaming-Bereich dürfte es weiterhin PCI Express als Anbindung zum PC-System geben – wahrscheinlich weiterhin in der Version 3.0, da die lange vorbereitete Version 4.0 nicht vor dem Jahr 2017 von den dann erhältlichen Prozessoren & Mainboards unterstützt werden wird.