3

Hardware- und Nachrichten-Links des 3. März 2020

Seitens Twitter-User 'Wat ArU' wurde nunmehr noch eine weitere Ausführung des (augenscheinlichen) nVidia GA100-Chips mit diesesmal gleich 124 Shader-Clustern (höchstwahrscheinlich 7936 Shader-Einheiten) auf einer Taktrate von 1.11 GHz und mit 32 GB HBM2-Speicher in der Geekbench-Datenbank entdeckt. Wie die bisherigen Messungen stammt auch jene neu entdeckte schon vom letzten Herbst – was um so besser zu einer Frühlings-Vorstellung des GA100-Chips passen würde. Der neue Meßwert ist nochmals substantiell höher, allerdings aufgrund derselben Basis zu den Vergleichswerten (nunmehr allesamt Geekbench 5) auch besser vergleichbar. Dabei wird fast schon eine perfekte Skalierung gegenüber dem gebotenen Mehr an Shader-Clustern erreicht, trotz der augenscheinlich niedrigeren Taktrate des GA100-Beschleunigers. Taktnormiert würde speziell dieser neue Benchmark-Wert somit auf eine um ca. 25-30% höhere OpenCL-Leistung pro Shader-Cluster für den GA100-Chip hinauslaufen. Und dies ist sogar nur auf den besten GV100-Vergleichswert gerechnet – gegenüber den anderen, niedrigeren GV100-Werten wäre diese Steigerung nochmals höher. nVidia scheint hier also entscheidende Architektur-Fortschritte erzielt zu haben – ob dann doch durch mehr Recheneinheiten pro Shader-Cluster oder andere Methoden, wäre noch herauszufinden.

Technik off. Takt GB-Taktangabe GB5 OpenCL
nVidia GA100 (7936SE) Ampere GA100, 7936 SE @ 4096 Bit SI, 32 GB HBM2 ? 1.11 GHz 222'377
nVidia Tesla V100 (PCIe) Volta GV100, 5120 SE @ 4096 Bit SI, 32 GB HBM2 1370 MHz ? 153'741
nVidia Tesla V100 (SXM2) Volta GV100, 5120 SE @ 4096 Bit SI, 16 GB HBM2 1455 MHz 1.53 GHz 139'921
nVidia Titan V Volta GV100, 5120 SE @ 3072 Bit SI, 12 GB HBM2 1455 MHz ? 132'601
nVidia Titan RTX Turing TU102, 4608 SE @ 384 Bit SI, 24 GB GDDR6 1770 MHz 1.77 GHz 131'974
gemäß der von Wat ArU @ Twitter gefundenen GA100-Messung; Vergleichswerte gemäß den offiziellen Geekbench-Angaben; alles für Geekbench 5

Golem berichten über einen neuen Interposer, welchen TSMC und Broadcom für entsprechende Chips der 7nm- und 5nm-Generationen entwickelt haben. Jener ist numehr gleich 1700mm² groß und soll laut TSMC für entsprechende ASICs samt bis zu sechs 6 HBM-Speicherchips dienen – eine hochinteressante Aussage, welche durchaus mit Hinblick auf nVidias HPC-Chip "GA100" getroffen sein könnte, welcher aufgrund seines angeblich 6144 Bit breiten HBM2-Speicherinterfaces genau mit dieser Anzahl an HBM2-Speicherchips anrücken dürfte. Sofern sich an der Größe der HBM2-Chips nichts gegenüber der AMDs Vega-Generation geändert hat, würden 6 davon ca. 550 mm² auf dem Interposer belegen, was unter Berücksichtigung von etwas Abstand zwischen den Einzelchips somit einen ASIC von maximal ca. 1100 mm² Größe zulassen würde. Ganz so hoch dürfte aber wohl niemand gehen wollen, da laut Golem die Belichtungsmaschinen derzeit maximal Chips mit 858mm² Chipfläche in einem Durchgang belichten können. Für den neuen TSMC-Interposer werden damit mehrere Belichtungsvorgänge notwendig, was man sich bei diesem Sonderprojekt aber durchaus leistet. Reguläre Chips dürften jedoch immer unterhalb dieser Grenze bleiben wollen – was deren reale Größe somit auf ca. 830-840mm² limitiert. Das letzte Gerücht zur GA100-Größe von immerhin 826mm² wäre somit rein technisch durchaus haltbar – ob nVidia wirklich so viel Fläche benötigt, wenn man von der 12nm-Fertigung auf 7nm+ mit EUV-Einsatz geht, bleibt noch abzuwarten.

Einige Webseiten berichten derzeit über angeblich zwei PS5-Konsolen – sprich, das Sony dem Microsoft nachgesagtem Modell folgen würde. Ausgangspunkt des ganzen ist ein Forenposting bei Neogaf, womit ergo keinerlei echte Quelle geboten wird und das ganze ein reinrassiges Gerücht darstellt. Interessanterweise sollen die früher schon spekulativ zur Sony-Konsole genannten 9 TFlops Rechenleistung der kleineren der beiden PS5-Konsolen entsprechen – sprich, die größere PS5 (eine eventuelle "Playstation 5 Pro") dürfte dann sicherlich mindestens die 12 TFlops der Xbox Series X bieten, möglicherweise auch noch mehr – ansonsten würde diese Unterteilung schließlich keinen größeren Sinn ergeben. Letzteres passt gut zu einem kürzlich in unserem Forum diskutierten Gerücht mit 13,3 TFlops Rechenleistung für eine NextGen-Konsolen von Sony. Jenes Gerücht war allerdings sowieso schon über die komische Speicherbandbreite unter Druck und hat nunmehr gänzlich "verloren", da die hiermit prophezeite Konsolen-Ankündigung am 3. März wie zu sehen nicht eingetreten ist. Bis auf die offiziellen Daten zur Xbox Series X liegt somit derzeit noch gar nichts griffiges zur Rechenkraft der anderen NextGen-Konsolen vor – wie auch seitens beider Konsolen-Hersteller derzeit keineswegs bereits eine jeweils zweite Konsole bestätigt ist.

Sony Microsoft
kleines Modell (wahrscheinlich) Playstation 5 @ (angeblich) 9 TFlops (möglicherweise) Xbox Series S @ (angeblich) 4 TFlops
großes Modell (angeblich) Playstation 5 Pro @ (wahrscheinlich) ~12 TFlops oder mehr (bestätigt) Xbox Series X @ (bestätigt) 12 TFlops
alle Angaben rein spekulativ (Ausnahme: Xbox Series X)

Angesichts der genannten Rechenleistungs-Werte kommt aus unserem Forum dann die sicherlich bedenkenswerte Anmerkung, was das für entsprechend große Konsolen-SoCs ergeben würde bzw. bezüglich der Konsolen-Preise dann aussagt. Denn beispielsweise die zur Playstation 5 kolportierten 9 TFlops Rechenleistung findet man exakt so auch bei der Radeon RX 5700 XT – auf Basis des 251mm² großen Navi-10-Chips. Zuzüglich des Hardware-RayTracings von RDNA2 (welches Sony soeben nochmals für die Playstation 5 bestätigt hat), der Zen-2-CPU sowie der Chipsatz-Kapazität kommt da schnell ein Konsolen-Chip von ca. 400mm² in der 7nm-Fertigung heraus, was unter 7nm+ dann vielleicht noch ~350mm² sein könnten. Dies liegt zwar im Rahmen der früheren Xbox One X, wäre aber für die kleinere von zwei Konsolen-Versionen immer noch ziemlich dick. Microsofts Xbox Series X ist mit 12 TFlops Rechenleistung dagegen sicherlich mindestens auf ~400mm² unter 7nm+ zu schätzen – und jeder, der da noch was oben drauf legen wollte, zahlt dann mit nochmals mehr Chipfläche und demzufolge anziehenden Kosten. Nicht umsonst geht das vorgenannten Neogaf-Gerücht von 600 Dollar für die größere Sony-Konsole aus – wenn tatsächlich derart kräftige Rechenleistungen geboten werden, geht es wohl auch nicht anders.

Seitens Twitter-User 'Wat ArU' wurde nunmehr noch eine weitere Ausführung des (augenscheinlichen) nVidia GA100-Chips mit diesesmal gleich 124 Shader-Clustern (höchstwahrscheinlich 7936 Shader-Einheiten) auf einer Taktrate von 1.11 GHz und mit 32 GB HBM2-Speicher in der Geekbench-Datenbank entdeckt. Wie die bisherigen Messungen stammt auch jene neu entdeckte schon vom letzten Herbst - was um so besser zu einer Frühlings-Vorstellung des GA100-Chips passen würde. Der neue Meßwert ist nochmals substantiell höher, allerdings aufgrund derselben Basis zu den Vergleichswerten (nunmehr allesamt Geekbench 5) auch besser vergleichbar. Dabei wird fast schon eine perfekte Skalierung gegenüber dem gebotenen Mehr an Shader-Clustern erreicht, trotz der augenscheinlich niedrigeren Taktrate des GA100-Beschleunigers. Taktnormiert würde speziell dieser neue Benchmark-Wert somit auf eine um ca. 25-30% höhere OpenCL-Leistung pro Shader-Cluster für den GA100-Chip hinauslaufen. Und dies ist sogar nur auf den besten GV100-Vergleichswert gerechnet - gegenüber den anderen, niedrigeren GV100-Werten wäre diese Steigerung nochmals höher. nVidia scheint hier also entscheidende Architektur-Fortschritte erzielt zu haben - ob dann doch durch mehr Recheneinheiten pro Shader-Cluster oder andere Methoden, wäre noch herauszufinden.





Technik
off. Takt
GB-Taktangabe
GB5 OpenCL




nVidia GA100 (7936SE)
Ampere GA100, 7936 SE @ 4096 Bit SI, 32 GB HBM2
?
1.11 GHz
222'377


nVidia Tesla V100 (PCIe)
Volta GV100, 5120 SE @ 4096 Bit SI, 32 GB HBM2
1370 MHz
?
153'741


nVidia Tesla V100 (SXM2)
Volta GV100, 5120 SE @ 4096 Bit SI, 16 GB HBM2
1455 MHz
1.53 GHz
139'921


nVidia Titan V
Volta GV100, 5120 SE @ 3072 Bit SI, 12 GB HBM2
1455 MHz
?
132'601


nVidia Titan RTX
Turing TU102, 4608 SE @ 384 Bit SI, 24 GB GDDR6
1770 MHz
1.77 GHz
131'974


gemäß der von Wat ArU @ Twitter gefundenen GA100-Messung; Vergleichswerte gemäß den offiziellen Geekbench-Angaben; alles für Geekbench 5