29

Gerüchteküche: nVidias NextGen kommt später als erwartet, Ampere muß wohl bis Ende 2022 durchhalten

Der gewöhnlich in nVidia-Fragen sehr gut informierte Twitterer Kopite7kimi sagt mit seiner neuesten Wasserstandsmeldung, dass nVidias NextGen-Grafik erst sehr viel später als (bisher) erwartet antreten soll. Dies bezieht sich explizit auf die Gaming-Lösungen und damit nicht nVidias nächsten HPC-Chip – welcher allerdings wie üblich gar nicht im Gaming-Segment zum Einsatz kommen dürfte. Allerdings ist die Aussage einer größeren Verzögerung gegenüber den bisherigen Erwartungen auch maximal biegsam – weil weder die bisherige Erwartungshaltung notiert wurde noch daraus klar wird, ob es sich hierbei wirklich um eine Verschiebung bzw. Verzögerung des Chipprojekts handelt, oder ob einfach nur die bisherige Erwartungshaltung falsch war. nVidias jüngste offizielle Roadmap hilft in dieser Frage im übrigen nicht weiter, da zum einen terminlich zu ungenau gehalten und zum anderen nicht trennend zwischen HPC- und Gaming-Architekturen.

The next-gen gaming cards will come much much much later than expected.
Quelle:  Kopite7kimi @ Twitter am 28. April 2021

Eine ganz profane Auflösung jenes Gerüchts läge beispielsweise darin, dass man bisher für nVidias NextGen-Grafik den Jahreswechsel 2021/22 angenommen hat, nun jedoch einen konkreten Termin zum Jahreswechsel 2022/23 hört – was dann exakt die Formulierung "später als erwartet" zuläßt, obwohl eigentlich gar keine (größere) Verschiebung stattfand. Dass der Twitterer in einem zweiten Tweet den Lebenszyklus der aktuellen Ampere-Generation nunmehr bis zum Jahresende 2022 ausgedehnt vermutet, deutet eine solche Auflösung an – sprich, dass man bislang schlicht von zeitigeren NextGen-Terminen ausgegangen ist, welche sich nun allerdings nicht erfüllen. Von einer echten Verschiebung könnte man vermutlich erst dann reden, wenn nVidias NextGen-Grafik erst tief im Jahr 2023 antreten würde – was dann deutlich nach den ersten PC-Chips aus der 5nm-Fertigung von TSMC wäre, welche grob zur Jahresmitte bis Herbst 2022 zu erwarten sind. So oder so sind hierzu weitere Informationen abzuwarten, um diese Meldung besser einordnen zu können.

I guess Ampere's life will be extended at least until the end of next year.
Quelle:  Kopite7kimi @ Twitter am 28. April 2021

Mitnehmen kann man allerdings den Punkt, dass Ampere sicherlich noch bis mindestens Ende 2022 durchhalten muß – diese Einschätzung des Twitters dürfte auf dessen (augenscheinlich vorhandenen) Erfahrungswerten basieren und erscheint somit als recht solide. Ein Start der Hopper/Lovelace-Generation ist somit frühestens im Herbst/Winter 2022 zu erwarten, mit einer (angenommenen) Ausbreitung des kompletten Portfolios bis tief ins Jahr 2023 hinein (recht ähnlich der Ausbreitung des Ampere-Portfolio). Es wäre allerdings auch ein späterer Termin irgendwann im Jahr 2023 denkbar – jene Tür öffnen die neuen Gerüchte durchaus. Der Lebenszyklus von Ampere liegt somit bei mindestens zwei vollen Jahren (als jeweilige "Current-Gen"), was zudem eine eingeschobene Refresh-Generation zu Ampere als zumindest denkbar erscheinen läßt. Jene basiert bei nVidia traditionell nicht auf neuen Chips, sondern nur auf neuen Karten basierend auf den bekannten Chips (sprich, möglicherweise neue "SUPER"-Modelle auf Ampere-Basis). Aber natürlich könnte die aktuelle Liefersituation auch dazu führen, dass man sich diesen Refresh komplett spart – da derzeit einfach zu wenig planbar ist, eine solche Refresh-Generation jedoch sicherlich bald in die Vorbereitung gehen müsste.

nVidias nächste Gaming-Generation soll hingegen gemäß früheren Gerüchten mit drastisch mehr Hardware-Power erscheinen – derzeit werden 144 Shader-Cluster aka 18'432 FP32-Einheiten für den Nachfolger des GA102-Chips kolportiert (möglicherweise "AD102" genannt). Mit in der Spitzen +71% mehr Recheneinheiten gegenüber der Ampere-Generation wäre ein heftiger Performance-Sprung drin, deutlich größer als der Performance-Sprung von Pascal zu Turing (+43%) sowie Turing zu Ampere (+49%). Dafür wird nVidia allerdings auch die bestmöglichen Fertigungsverfahren bemühen müssen – was einen Vorteil für TSMC ergibt, denn dort ist 5nm ein neuer Fullnode (mit entsprechend besseren Werten), während Samsungs 5nm nur ein Derivat der 7nm-Fertigung darstellt. Von der reinen Chipfertigung her sollten beide Möglichkeiten jedoch (spätestens) ab Herbst 2022 spruchreif sein, Verzögerungen von dieser Seite her sind kaum zu erwarten.

Pascal Turing Ampere Lovelace
Chipfertigung 16nm TSMC 12nm TSMC 8nm Samsung angeblich 5nm
Karten-Serie GeForce 10 Serie GeForce 16/20 Serien GeForce 30 Serie vermutlich GeForce 40 Serie
Gaming-Topchip GP102
(12 Mrd. Xtors auf 471mm²)
TU102
(18,6 Mrd. Xtors auf 754mm²)
GA102
(28,3 Mrd. Xtors auf 628mm²)
AD102
maximale Hardware-Daten 6 GPC
30 TPC
30 SM
3840 CUDA Cores
6 GPC
36 TPC
72 SM
4608 CUDA Cores
7 GPC
42 TPC
84 SM
10752 CUDA Cores
(angeblich)
12 GPC
72 TPC
144 SM
18432 CUDA Cores
maximale FP32-Power ~12 TFlops @ 1.6 GHz ~16 TFlops @ 1.7 GHz ~37 TFlops @ 1.7 GHz ~66 TFlops @ (angenommen) 1.8 GHz
FP32 pro SM 128 64 128 angenommen 128
Veränderungen - 128?64 FP32-Einheiten pro Shader-Cluster, zusätzlich 64 INT32-Einheiten pro Shader-Cluster 64?128 FP32-Einheiten pro Shader-Cluster unbekannt
Level2-Cache 3 MB 6 MB 6 MB angeblich größerer Cache
Speicherinterface 384 Bit GDDR5X 384 Bit GDDR6 384 Bit GDDR6X unbekannt
Release 10. März 2017: GeForce GTX 1080 Ti 19. Sept. 2018: GeForce RTX 2080 Ti 17. Sept. 2020: GeForce RTX 3080 vermutlich 2022

Nachtrag vom 29. April 2021

Es sei besser nochmals herauszustreichen, dass die kürzliche Meldung zu einer möglichen Verschiebung der nächsten Grafikchip-Generation bei nVidia nicht zwingend bedeuten muß, dass jene tatsächlich bereits Ende 2022 erscheint. Dies ist nur die bestmögliche Auslegung aus diesem Gerücht – welches allerdings sogar deutliche Ansätze liefert, an eine größere Verzögerung bis tief ins Jahr 2023 hinein zu denken. Wie üblich hat Twitterer 'Kopite7kimi' seine beiden Tweets – No.1 & No.2 – recht vorsichtig formuliert (um nicht später auf dem falschen Fuß erwischt zu werden), aber die gewählten Formulierungen lassen jederzeit auch viel spätere Starttermine der nächsten Chip-Generation seitens nVidia zu. Im Sinne dessen, dass es im Grundsatz dieser Tweets schließlich um eine explizite Verzögerung gegenüber der bisherigen Erwartungshaltung ging, hat die Auflösung "2023" möglicherweise eine ähnliche hohe Chance wie die Auflösung "Jahresende 2022".

In der Summe der Dinge könnte es aber nichtsdestotrotz auf einen gewissen Zeitvorsprung von AMD gegenüber nVidia bei den nächsten Grafikchip-Generationen hinauslaufen. Gemäß der bisher bekannten Rahmenbedingungen hat nVidia diesesmal schlicht den späteren Terminansatz, sollte ergo bei halbwegs normalen Verlauf auch tatsächlich später erscheinen. Nur bei einem eher ungünstigen Verlauf bei AMD und einem sehr günstigen Verlauf bei nVidia wäre es möglich, dass beide NextGen-Projekte grob im selben Zeitrahmen zum Jahresende 2022 erscheinen – und nVidia eventuell einen um ein paar Tage oder Wochen früheren Vorstellungstermin erreicht. In allen anderen Verlaufsszenarien kommt AMD um ein paar Monate bis einige Quartale früher heraus – wobei die großen Differenzen dann schon ziemlich unwahrscheinlich sind. Ein grob zeitgleicher Start der jeweiligen NextGen-Grafik ist nach wie vor möglich, ein beachtbarer Zeitvorsprung AMDs hat aber wohl wenigstens eine gleich große (oder gar größere) Chance.

Terminlage technische Daten
AMD RDNA3 2022 – frühestens im Frühling 2022, spätestens zum Jahresende 2022 angeblich 2x 80 Shader-Cluster (im MultiChip-Ansatz) bei "Navi 31" auf Basis von TSMCs 5nm-Fertigung
nVidia NextGen 2022-2023 – frühestens zum Jahresende 2022, spätestens tief im Jahr 2023 angeblich 144 Shader-Cluster bei "AD102" auf Basis der 5nm-Fertigung von TSMC oder Samsung
Anmerkung: alle Angaben basierend auf Gerüchten & Annahmen