4

nVidias GeForce GTX Titan X kommt mit 8 Mrd. Transistoren, 7 TeraFlops Rechenleistung und 12 GB Speicher

nVidia hat im Rahmen der Game Developer Conference (GDC) seine kommende Enthusiasten-Grafikkarte "GeForce GTX Titan X" ein wenig geteasert – indem nVidia-Chef Jen-Hsun Huang ein solches Exemplar (hoffentlich nicht wieder ein Holz- oder Plastemodell) öffentlich an Epic-Chef Tim Sweeney übergeben hat (Bilder im Forum oder bei Heise, man kann sich das ganze auch noch bei Twitch im nachhinein ansehen). Von einer "Vorstellung" oder "Ankündigung" kann damit natürlich keine Rede sein – dies könnte auf nVidias Hausmesse GPU Technology Conference (GTC) vom 17.-20. März stattfinden, bestätigt ist in dieser Richtung jedoch noch gar nichts.

Wenigstens wurden durch diesen Teaser einige wichtige Daten zur neuen Enthusiasten-Karte geklärt: Der exakte Verkaufsname "GeForce GTX Titan X", die Anzahl der Transistoren des verwendeten GM200-Chips mit 8 Milliarden, die theoretische Rechenleistung von 7 TeraFlops (SinglePrecision; allerdings ist unsicher, ob diese Angabe von nVidia selbst stammt, da nur Golem jene notieren) und die zum Einsatz kommende Speichermenge von 12 GB GDDR5-Speicher. nVidia geht damit bei der Speichermenge gleich auf das Maximum dessen, was derzeit machbar ist – unabhängig der Sinnhaftigkeit. Aber eine Auflösung mit 6 GB Speicher wäre auch zu einfach übertölpelbar gewesen, schließlich kann man die Radeon R9 290X jetzt schon als 8-GB-Variante erwerben. Mit den 12 GB Speicherausbau geht nVidia allen eventuellen Schwierigkeiten aus dem Weg und läßt sich selbst sogar noch die Möglichkeit, eigene 8-GB-Varianten der GeForce GTX 980 herausbringen zu können.

AMD Hawaii AMD Fiji nVidia GM204 nVidia GM200
Chipbasis 6,2 Mrd. Transistoren in 28nm auf 438mm² Chipfläche ~550mm² Chipfläche 5,2 Mrd. Transistoren in 28nm auf 398mm² Chipfläche 8 Mrd. Transistoren in 28nm auf ~600mm² Chipfläche
Architektur GCN-Architektur 1.1, DirectX 11.2b, Mantle & TrueAudio GCN-Architektur 1.2+, DirectX 11.2b, Mantle & TrueAudio Maxwell-Architektur 2.0, DirectX 11.2b & PhysX Maxwell-Architektur 2.0, DirectX 11.2b & PhysX
Technik 4 Raster-Engines, 2816 Shader-Einheiten, 176 TMUs, 64 ROPs, 512 Bit DDR GDDR5-Interface, 1 MB Level2-Cache unsicher: 6-8 Raster-Engines, 4096 Shader-Einheiten, 256 TMUs, 4096 Bit DDR HBM-Interface 4 Raster-Engines (mit verdoppelter Raster-Power), 2048 Shader-Einheiten, 128 TMUs, 64 ROPs, 256 Bit DDR GDDR5-Interface, 2 MB Level2-Cache unsicher: 6 Raster-Engines (mit verdoppelter Raster-Power), 3072 Shader-Einheiten, 192 TMUs, 96 ROPs, 384 Bit DDR GDDR5-Interface
Rechenleistung ~6 TeraFlops ~ 8 TeraFlops 5 TeraFlops ~7 TeraFlops
Speicherausbau 4/8 GB GDDR5 4 GB HBM 4 GB GDDR5 12 GB GDDR5
Zielrichtung HighEnd Enthusiast HighEnd Enthusiast
Topmodell Radeon R9 380X Radeon R9 390X GeForce GTX 980 GeForce GTX Titan X
Terminlage Frühsommer 2015
(als Radeon R9 290X bereits im Markt)
Frühsommer 2015 bereits im Markt März 2015 (?)
Preislage vermutlich 350-400€ vermutlich unterhalb von 1000 Euro 500-540€ 1000 Euro oder mehr
(bis zu 1350 Euro genannt)

Sofern die Vorab-Angabe passt und der GM200-Chip tatsächlich über 3072 Shader-Einheiten verfügt, wird die GeForce GTX Titan X dann im übrigen einen Chiptakt von immerhin ~1140 MHz haben müssen, um die genannten ~7 TeraFlops Rechenleistung zu erzielen (wie gesagt ist unsicher, ob diese Angabe wirklich direkt von nVidia stammt). Selbst wenn nVidia für diese Rechenleistungs-Angabe einen maximalen Boost-Takt verwenden sollte (und die Rechenleistung damit in der Realität etwas niedriger ist), scheint der Chiptakt der GeForce GTX Titan X doch klar oberhalb von 1000 MHz zu liegen – was für einen so großen Chip eher ungewöhnlich ist. Allerdings ist die Maxwell-Architektur generell sehr taktfreudig und hat nVidia beim GM200-Chip natürlich gewisse Vorteile durch den offensichtlichen Verzicht auf großartige DoublePrecision-Fähigkeiten.

Interessant ist daneben noch die Frage, was nVidia eventuell noch an kleinen Überraschungen in die 8 Milliarden Transistoren hereinquetschen kann. Denn ausgehend von den bekannten Zahlen zum GM206-Chip und zum GM204-Chip läßt sich jetzt schon ausrechnen, daß der GM200-Chip auf den genannten 3072 Shader-Einheiten unter Beibehaltung der restlichen Architektur ungefähr 7,46 Milliarden Transistoren auf 569mm² Chipfläche schwer sein sollte. Die Chipfläche passt in etwa, bei der Transistoren-Anzahl ergibt sich dagegen eine Differenz von immerhin 540 Millionen Transistoren zur nVidia-Angabe. DoublePrecision-Einheiten im GK110-Stil passen da sicherlich nicht mehr hinein, aber andere kleinere Dinge schon – oder aber das ganze ist einfach nur jeweils falsch gerundet und es kommt da nichts mehr zusätzliches hinein bzw. hat der GM200 einfach mehr Massetransistoren zur Erhöhung der Schaltfähigkeit (aka Taktrate).

Nachtrag vom 4. März 2015

PC Perspective konnten auch noch eine echte, in ein PC-Gehäuse eingebaute GeForce GTX Titan X auf der GDC erspähen. Jene trug im übrigen einen 6poligen und einen 8poligen Stromstecker, was auf eine TDP weiterhin im Bereich bis 250 Watt hindeutet – was allerdings nicht zwingend bedeutet, daß die Serienprodukte ähnlich bestückt sind. Angesichts der punktgenauen Effizienz der bisherige Maxwell-Beschleuniger ist aber ein Stromverbrauch von real 250 Watt wohl sogar ausreichend, um der GeForce GTX Titan X Gelegenheit zu geben, ihre Hardware-Power auch auszuspielen – insofern könnte diese Bestückung durchaus auch bei den Serienmodellen so auftauchen. Overclocker-Exemplare – wobei unbekannt ist, ob nVidia solche bei der GeForce GTX Titan X zulassen wird – sollten dann aber besser zwei 8polige Stromstecker aufweisen, denn im Overclocking-Betrieb dürften jene 250 Watt umgehend zu knapp werden (wobei natürlich auch in einem 6poligen + 8poligen Stecker diesbezüglich genügend Reserven schlummern).