11

nVidias Performance-Chip GP106 zeigt sich, Release im September 2016 anzunehmen

Über die Zauba Import/Export-Datenbank ging erstmals eine Reihe an Grafikkarten zu nVidias indischen Testlaboren, welche recht klar dem GP106-Chip zuzuordnen sind. Geliefert wurden hierbei am 6. Mai immerhin gleich 34 Grafikkarten zu einem Zollwert von ~464 Euro pro Stück, zuzüglich noch zwei Stück dieser Grafikkarten am nachfolgenden 7. Mai zu einem Zollwert von ~604 Euro. Die hohen Zollwerte müssen dabei nicht stören, denn nVidia benutzt seit einiger Zeit um den Faktor 2-3 bewußt überhöhte Zollwerte, um die Produkteinordnung anhand der jeweiligen Preislagen zu erschweren. Beide Grafikkarten-Lieferungen enthalten die klare Markierung "GP106" und zudem andere nVidia-typische Kennzeichen, sind also doch ziemlich sicher dem GP106-Chip von nVidia zuzuordnen:

Mit den Lieferungen kompletter GP106-Grafikkarten deutet sich im übrigen immer mehr ein Herbst-Termin für den GP106-Release an. Vergleichsweise wurden erste komplette GP104-Lieferungen Anfang Februar gesichtet, die Auslieferung Ende Mai ergibt (für den GP104) eine Zeitspanne von 3½ Monaten zwischen diesen beiden Fixpunkten. Bezogen auf den GP106 würde dies auf Anfang Semptember 2016 hinauslaufen – was sich natürlich noch um gut einen Monat (in beide Richtungen) verschieben kann, derart genau kann man hierbei sicherlich nicht rechnen. Aber man kann ausgehend von diesen Vorgaben einen GP106-Release in diesem Herbst (September/Oktober) bzw. bestenfalls noch im Spätsommer (August) annehmen.

Was in der GP106-Hardware dann enthalten ist, erschließt sich natürlich noch nicht aus diesen Sample-Lieferungen. Hierfür gibt es nur Anhaltspunkte aus der bekannten GP104-Hardware sowie den bekannten Chipgrößen von GP104 & GP106. Die größte Ungewißheit ist derzeit noch das verbaute Speicherinterface beim GP106-Chip: Normalerweise müsste nVidia seiner Performance-Lösung nun endlich einmal ein größeres Speicherinterface spendieren, aber 256 Bit sind angesichts der Chipgröße arg unwahrscheinlich und 192 Bit sind letztlich eine ungünstige Wahl bezüglich der Speichermenge: Damit sind 3 oder 6 GB Speicher möglich, was aber kaum nVidias Zielsetzung bei dieser Karte sein dürfte. Mit 4 GB Speicher wird nVidia gegenüber seinem aktuellen Angebot in der Performance-Klasse in Form der GeForce GTX 960 eine glatte Verdopplung hinlegen, mehr wird zudem für die Zielauflösung dieserart Karten (FullHD) nicht benötigt – und am Ende gilt, das nVidia ungern mit zuviel Speicher antritt, weil dies die Karten nur länger leben läßt und daher ungünstig für die Grafikkarten-Umsätze der Zukunft ist.

So gesehen deutet alles auf 4 GB Speicher bei GP106-basierten Grafikkarten hin, was dann nur mit einem 128 Bit breitem Speicherinterface zu realisieren sein wird. Damit auf diesem kleinem Speicherinterface genügend Speicherbandbreite (für die wachsende Rohleistung) zur Verfügung steht, dürfte nVidia zumindest eine der GP106-Grafikkarten wieder mit GDDR5X-Speicher ausrüsten. Dies kommt im übrigen bei der Speicherbandbreite in etwa aufs gleiche hinaus, als wenn man ein 192 Bit GDDR5-Interface nutzen würde – nur das letzteres den Chip größer macht, die Boards komplizierter macht und zu gleich 6 GB Speicherbestückung zwingt, also nur ein Kostentreiber ist. Die Ausweichmöglichkeit mit nur 3 GB Speicher an einem 192 Bit GDDR5-Speicherinterface dürfte nVidia sich im übrigen wohlweislich sparen, diese Speichermenge klingt gegenüber den inzwischen allgemeinübliche "4 GB" als deutlich rückständig und wäre ein enormer (psychologischer) Verkaufshemmer.

Technik Rohleistungen Performance Preisbereich
GeForce GTX 1080 GP104, 2560 Shader-Einheiten @ 256 Bit GDDR5X-Interface, 1607/1733/2500 MHz, 8 GB GDDR5X 8,87 TFlops
320 GB/sec
FullHD:  ~900-950%
4K:    ~125%
599-699$
(27. Mai 2016)
GeForce GTX 1070 GP104, mglw. 2048 Shader-Einheiten @ 256 Bit GDDR5-Interface, 8 GB GDDR5 6,5 TFlops
ca. 224 GB/sec
FullHD:  ~670-730%
4K:    ~90-95%
379-449$
(10. Juni 2016)
"GeForce GTX 1065" GP104, mglw. 1792 Shader-Einheiten @ 192 Bit GDDR5-Interface, 6 GB GDDR5 ca. 5,5 TFlops
ca. 168 GB/sec
FullHD:  ca. 550-600%
4K:    ca. 65-75%
ca. 300$
(Juni 2016 ?)
"GeForce GTX 1060 Ti" GP106, mglw. 1408 Shader-Einheiten @ 128 Bit GDDR5X-Interface, 4 GB GDDR5X ca. 4,5 TFlops
ca. 160 GB/sec
FullHD:  ca. 450-500% ca. 250$
(September 2016 ?)
"GeForce GTX 1060" GP106, mglw. 1152 Shader-Einheiten @ 128 Bit GDDR5-Interface, 4 GB GDDR5 ca. 3,5 TFlops
ca. 112 GB/sec
FullHD:  ca. 350-400% ca. 200$
(September 2016 ?)
Bei den Angaben dieser Tabelle handelt es sich primär um Spekulationen, da unterhalb von GeForce GTX 1070 & 1080 noch keinerlei sicheren Werte vorliegen.

Ausgehend vom Speicherinterface und den bekannten Chipgrößen läßt sich dann gut hochrechnen, was nVidia in die ~205mm² des GP106-Chips packen könnte. Klar ist dabei, das es mehr werden muß als eine pure Halbierung der Anzahl der Shader-Einheiten des GP104-Chips, denn dafür ist die GP106-Chipfläche im Verhältnis zur GP104-Chipfläche von ~298mm² zu hoch. In der Maxwell-Generation gab es denselben Fall, dort hatte der GM206-Chip auch das halbe Speicherinterface und brauchte für die halbe Anzahl an Shader-Einheiten aber nur 57% der Chipfläche des GM204-Chips. Bezogen auf die kommenden Pascal-Chips würde dies bedeuten, das der GP106-Chip bei der Hälfte der GP104-Shader-Einheiten auf nur ~170mm² Chipfläche kommen könnte (selbst bei ~330mm² für den GP104-Chip sind es nur ~190mm² für den GP106-Chip) – da bleibt noch viel Platz gegenüber der aktuellen Angabe von ~205mm² Chipfläche. Daher denken wir, das der GP106-Chip mehr Shader-Einheiten trägt als eine bloße Halbierung gegenüber dem GP104-Chip – sprich, mehr als 1280 Shader-Einheiten.

Ob es 1280, 1408 oder 1536 Shader-Einheiten sind, wird sich noch zeigen – wir rechnen für den Augenblick mit 1408 Shader-Einheiten, da dies auf einer gutklassigen Chiptaktrate von 1600 MHz für eine theoretische Rechenleistung in Richtung 4,5 TFlops sorgen würde. Sofern nVidia wirklich eine dritte GP104-Variante herausbringt (derzeit unsererseits spekulativ "GeForce GTX 1065" genannt), darf es gar nicht höher hinausgehen, um sich mit eben dieser dritten GP104-Variante nicht ins Gehege zu kommen. Kommt selbige nicht, würde sich die Situation natürlich völlig anders gestalten – andererseits kann nVidia dann den Taktspielraum der Pascal-Architektur voll ausnutzen, auf 1800 MHz Chiptakt sind mit dem GP106 dann schon 5 TFlops Rechenleistung möglich. In vorstehender Tabelle sind demzufolge noch jede Menge Änderungen und Verschiebungen möglich – jene zeichnet nur das Bild, welches sich aktuell zu den Grafikkarten basierend auf den Pascal-Chips GP104 & GP106 andeutet.

Nachtrag vom 11. Mai 2016

In der kürzlichen Betrachtung zu nVidias GP106-Chip fehlte noch der Punkt, das diverse Kommentatoren die auf Zauba zu lesenden Liefer-Informationen dahingehenden interpretieren, das der GP106-Chip tatsächlich mit einem 256 Bit Speicherinterface antritt. So gab es einmal die Notiz "256B" und zum anderen die Notiz "256MX32" zu lesen – welche man wie gesagt dahingehend auslegen kann. Dies ist aber kein muß, weil damit kann am Ende auch sonst etwas gemeint sein. Als Hauptargument gegen ein großes 256 Bit Speicherinterface beim kleinen GP106-Chip (angeblich ~205mm² Chipfläche) gilt nach wie vor der Punkt, da nVidia in dieser Frage bislang immer arg konservativ war – die Performance-Chips von nVidia hatten bisher immer nur ein 128 oder 192 Bit Speicherinterface, selbst letzteres wurde dabei nicht immer ausgenutzt. Zudem läßt sich mehr Speicherbandbreite ja auch einfacherem Wege über die Benutzung von GDDR5X-Speicher erreichen – jene neue Speichersorte kostet zwar mehr, aber ein größeres Speicherinterface frisst Chipfläche und verursacht daher auch Mehrkosten.

All dies spricht aus prinzipiellen Gründen gegen ein 256 Bit Speicherinterface beim GP106-Chip. Dabei soll aber auch ein Pro-Argument nicht verschwiegen werden: Wie schon dargelegt, ist der GP106-Chip vergleichsweise groß für eine reine Hardware-Halbierung gegenüber dem GP104-Chip. Selbst wenn es also zu mehr Shader-Einheiten beim GP106-Chip (als eine Halbierung) kommt, wäre rein bezogen auf die Chipfläche vielleicht sogar Platz für ein größeres Speicherinterface. Ungeachtet der bisherigen nVidia-Abneigung gegenüber großen Speicherinterfaces auf Performance-Chips ist ein 256 Bit Speicherinterface auf einer Chipfläche knapp bei 200mm² durchaus realisierbar, wie AMDs Pitcairn-Chip (212mm²) der Radeon HD 7800, R9 270 und R7 370 Serien beweist. In dieser Frage taumeln die Spekulationen derzeit allesamt noch ein wenig ziellos daher – ohne konkrete Anhaltspunkte kann man sich den GP106-Chip in sehr verschiedenen Ausführungen vorstellen, von 1280 bis 1536 Shader-Einheiten, von 128 Bit bis 256 Bit Speicherinterface, mit GDDR5- oder GDDR5X-Speicher.