Über das 3DCenter-Forum wurde einige Warenlieferungen von Taiwan nach Indien zum Jahresschluß 2015 entdeckt, welche gemäß Wissen zu früheren, ähnlichen Warenlieferungen, nVidia zugerechnet werden – auch wenn nVidia inzwischen versucht, in den Artikelbeschreibungen keine großen Anhaltspunkte dafür mehr zu hinterlassen. Die Warenlieferungen betreffen Teile von Grafikkarten und Testequipment, wobei sich alles um ein und denselben Grafikchip handeln wird: Auf einem Package von 37,5x37,5mm sitzend und mit immerhin 2152 Pins ausgerüstet. Da der GP100-Chip aus nVidias Pascal-Generation auf ein Package von 55x55mm sowie 2621 Pins kommt, dürfte es sich bei diesem neuen Chip wahrscheinlich um den GP104 handeln – sprich, den Chip für die Nachfolge-Grafikkarten von GeForce GTX 970 & 980, welche dann aber auch GeForce GTX 980 Ti & Titan X schlagen können sollten.
Das deutlich kleinere Package von 37,5x37,5mm gegenüber dem GP100-Chip (55x55mm) und auch gegenüber dem direkten Vorgänger GM204 (40x40mm) läßt dann die Vermutung zu, daß es sich beim GP104-Chip nicht um einen ganz so großvolumigen Chip wie den GM204 (398mm² Chipfläche) handeln dürfte – und daß der Einsatz von HBM-Speicher beim GP104 mit großen Fragezeichen zu versehen ist. Nachdem man anfänglich davon ausging, daß das Jahr 2016 schon den breiten Durchbruch von HBM sehen würde, gingen die letzten Anzeichen allesamt eher in die Richtung einer Koexistenz von HBM und GDDDR5, eventuell auch unter Hinzunahme von GDDR5X – insofern muß der GP104-Chip sicherlich nicht zwingend mit HBM-Speicher daherkommt. Gerade wenn man davon ausgeht, daß das ungewöhnlich große Package des GP100-Chips (55x55mm, sehr viel fetter als das Package des GM200 von nur 45x45mm) dem mit auf dem Package sitzenden HBM-Speicher geschuldet ist (wie beim mit 50x50mm ebenfalls sehr großen Fiji-Package), scheint der GP104-Chip noch ohne HBM-Speicher auskommen zu müssen.
Package | Pin-Count | Chipfläche | Speicherinterface | |
---|---|---|---|---|
nVidia GP100 | 55x55mm (angbl.) | 2621 (angbl.) | erwartet Richtung 550-600mm² | 4096 Bit DDR HBM2 |
nVidia GP104 | 37,5x37,5mm (angbl.) | 2152 (angbl.) | vermutlich Richtung 300-350mm² | ? |
nVidia GM204 | 40x40mm | 1745 | 398mm² | 256 Bit DDR GDDR5 |
nVidia GM200 | 45x45mm | 2397 | 601mm² | 384 Bit DDR GDDR5 |
AMD Fiji | 50x50mm | ? | 596mm² | 4096 Bit DDR HBM1 |
Allerdings würde die Nichtverwendung von HBM beim GP104-Chip die Frage aufwerfen, woher dieser Grafikchips dann die Speicherbandbreite hernehmen soll, um den GM200-Chip zu erreichen und zu schlagen. Hier spielt erschwerend mit hinein, daß auf dem kleineren GP104-Package vermutlich auch eine kleinere GPU sitzt – eher im Bereich von 300-350mm² Chipfläche und kaum so groß wie der aktuelle GM204-Chip (398mm²). In die kleinere Chipfläche wird es dann schwer bis unmöglich für nVidia sein, noch ein größeres Speicherinterface als 256 Bit DDR GDDR5 hineinzupacken – für mehr braucht man regelrecht mehr Chipfläche, um die Interface-Kontakte allesamt anbringen zu können. Denkbar wäre unter Umständen eine Lösung mit 320 Bit DDR GDDR5-Speicherinterface, was für einen Bandbreitenvorteil von +25% allerdings so komische Speicherbestückungen wie 5, 10 und 20 GB mitbringt.
Daher geht man im 3DCenter-Forum derzeit davon aus, daß ein GP104-Chip ohne HBM-Einsatz höchstwahrscheinlich GDDR5X-Speicher oder eben nochmals deutlich höher getakteten GDDR5-Speicher verwenden wird. Von konventionellem GDDR5 gibt es inzwischen Speichertaktungen á 4000 MHz DDR, als Sample sogar schon 4500 MHz DDR – besser ist da natürlich gleich GDDR5X mit Taktraten von (derzeit sicher realisierbar) 5000 MHz DDR. Jene hohen Speichertaktungen fressen dann natürlich auch wieder mehr Strom – aber da der GP104-Chip ähnlich wie beim GM204-Chip eine generelle Leistungsklasse von unter 200 Watt Realverbrauch haben dürfte, geht dies wohl noch nirgendwo in Grenzbereiche. Zudem könnte die Stromersparnis durch die 16nm-Fertigung (nVidia fertigt das komplette Pascal-Portfolio bei TSMC in 16FF+) sogar eher dominierend sein und der GP104 somit in der Summe sogar weniger Strom ziehen als der GM204.
mögliche Speicherinterfaces für nVidias GP104-Chip (rein spekulativ) | |||
---|---|---|---|
GDDR5 | GDDR5X | HBM2 | |
kleine Variante | 256 Bit DDR GDDR5-Interface 4500 MHz DDR Taktrate 288 GB/sec 4/8/16 GB GDDR5-Speicher |
256 Bit DDR GDDR5-Interface 5000 MHz DDR Taktrate 320 GB/sec 4/8/16 GB GDDR5X-Speicher |
2048 Bit DDR HBM2-Interface 900 MHz DDR Taktrate 461 GB/sec 8/16 GB HBM2-Speicher |
große Variante | 320 Bit DDR GDDR5-Interface 4000 MHz DDR Taktrate 320 GB/sec 5/10/20 GB GDDR5-Speicher |
320 Bit DDR GDDR5-Interface 5000 MHz DDR Taktrate 400 GB/sec 5/10/20 GB GDDR5X-Speicher |
2048 Bit DDR HBM2-Interface 1000 MHz DDR Taktrate 512 GB/sec 8/16 GB HBM2-Speicher |
Vor/Nachteile | einfach zu realisieren schwer auf hohe Bandbreiten zu bringen |
guter HBM-Kontrahent frisst viel Strom bei hohen Taktraten unsicher, ob Speicher rechtzeitig verfügbar |
beste Bandbreite geringster Stromverbrauch unsicher, ob Speicher rechtzeitig verfügbar zu teuer für den GP104-Preisbereich |
Vergleich & Referenzpunkt: GM200 mit 384 Bit DDR Interface, 3500 MHz DDR Taktrate und 336 GB/sec Bandbreite |
Machbar wird das ganze in der einen oder anderen Form sicherlich sein. Zudem braucht der GP104-Chip auch nicht zwingend in den am stärksten die Speicherbandbreite belastenden Szenarien glänzen – dies wird dann Aufgabe des nachfolgenden GP102-Chips sein (unter der Annahme, daß der GP100 ein reiner Profi-Chip wird und nicht im Gamer-Segment erscheint). Sofern der GP104 den GM200 unter FullHD und WQHD mit ausreichendem Abstand schlägt (bei GM204 gegen GK110 waren es letztendlich +13%), reicht dies völlig aus als Startschuß der Pascal-Generation seitens nVidia. Denn der GP104-Chip dürfte wahrscheinlich der erste Pascal-Chip sein, zu welchem nVidia Gamer-Grafikkarten in den Markt entläßt, alle größeren Lösungen (auf Basis GP100 & GP102) dürften trotz eines früheren GP100-Tapeouts später in den Consumer-Markt kommen. Als Terminlage erscheint der Spätsommer als wahrscheinlich, da Chips auf Basis einer neuen Fertigung gewöhnlich längere Evaluierungszeiträume benötigen und nVidia zudem absolut nichts hetzt, unbedingt noch vorher herauszukommen.