16

Hardware- und Nachrichten-Links des 16. September 2021

Von Twitterer Greymon55 kommt eine neue Wasserstandsmeldung zur Performance der Lovelace-basierten GeForce RTX 40 Serie – bezogen natürlich auf das jeweilige Spitzenmodell, nicht auf die komplette Serie. Hierfür dürften aktuelle Industrie-Gerüchte als Basis dienen – etwas anderes existiert derzeit mangels entsprechender Hardware sowie noch nicht. Danach wird eine Performance-Verdopplung gegenüber einer GeForce RTX 3090 durch eine kommende Lovelace-Spitzenlösung (auf AD102-Basis) als "konservativ" eingeschätzt – sprich, da soll dann noch Platz nach oben hin sein. Damit ist Faktor 2,0 eher als unterer Maßstab der Performance-Steigerung zu sehen, es könnte in der Realität dann auch leicht mehr werden – anzunehmenderweise vielleicht Faktor 2,2. Viel genauer läßt sich dies derzeit sowieso nicht sagen, da bei nVidia derzeit erst am reinen AD102-Chip gearbeitet wird, noch nicht an darauf basierenden Grafikkarten.

I think 2x 3090 is conservative.
Quelle:  Greymon55 @ Twitter am 11. September 2021

So könnte auch eine GeForce RTX 4090 auf AD102-Basis diverse Abspeckungen aus Salvage-Gründen tragen, welche dann wiederum negativ in diese Rechnung eingehen – derzeit aber natürlich noch nicht abzusehen sind, die Arbeit an konkreten Grafikkarten wird erst nach (erfolgreichem) Tape-Out und Validierungsphase beginnen (grob Frühling/Mitte 2022). Allerdings muß nVidia bei Lovelace auch nicht zwingend dem Schema der bisherigen nVidia-Grafikkarten folgen und könnte die GeForce RTX 4090 durchaus noch näher an den Vollausbau des AD102-Chips heranbringen – einfach weil AMD zuletzt für den nVidia-Geschmack zu nahe herangekommen ist und nVidia somit vom Start weg alles einsetzen muß, was man an Hardware-Power zur Verfügung hat. Dass genannte Performance-Plus von (konservativ) +100% bedeutet aber auch, dass nVidia entweder/oder aus Architektur und Chiptakt noch so einiges herausholen muß, denn bezüglich der reinen Hardware wird AD102 "nur" +71% mehr FP32-Einheiten gegenüber dem aktuellen GA102-Chip mitbringen.

Andererseits wechselt nVidia für die Lovelace-Generation wie bekannt von Chipfertiger Samsung wieder zu Chipfertiger TSMC – womit nach der Taktraten-mäßig eher wenig (gegenüber der Turing-Generation) verbesserten Ampere-Generation somit ein kräftiger Taktraten-Sprung winken sollte. Interessant ist allerdings an dieser Stelle durchaus, dass sich bei Performance & Terminen die beiden NextGen-Designs von AMD und nVidia immer mehr anzunähern scheinen: Mit den ersten aufkommenden Gerüchten erschien AMDs RDNA3-Ansatz sowohl mächtiger als auch früher am Start. Der prognostizierte Performance-Vorteil für AMD ist nunmehr geschrumpft (allerdings noch vorhanden), bei der Terminlage ist es gemäß der letzten Gerüchte hingegen schon zu einem Gleichstand gekommen. Man will es nicht beschwören, aber dies folgt doch auffällig dem Schema von früheren AMD/nVidia-Generationen, wo AMD im frühen Gerüchte-Verlauf nahezu jedesmal deutlich höher eingeschätzt wurde, als was dann letztlich an realer Hardware-Power herausgekommen ist.

AMD Navi 21 → Navi 31 nVidia GA102 → AD102
Architektur augenscheinlich deutlich veränderte Architektur (nicht nur wegen MCM), Wegfall der CUs (WGPs als neue hauptsächliche Ordnungseinheit), anscheinend 4 → 6 Shader-Engines, anscheinend 128 → 256 FP32 pro WGP vermutlich vergleichweise ähnliche Grundarchitektur, 7 → 12 Raster-Engines (GPC), erwartbarer Taktraten-Sprung wegen Wechsels von Samsung auf TSMC
FP32-Recheneinheiten 5'120 → 15'360  (+200%) 10'752 → 18'432  (+71%)
(hochgerechnete) Rohpower 21 TFlops → ~75-80 TFlops  (+257-281%) 36 TFlops → ~80 TFlops  (+122%)
Performance-Target 2,5 bis 2,7fache  (+150-170%) 2,0 bis ~2,2fache  (+100-120%)
Terminlage angeblich Oktober 2022 angeblich Oktober 2022
Anmerkung: reine Wiedergabe von Gerüchten – keine offiziellen Daten

VideoCardz berichten mit fernöstlicher Quelle über einen möglichen Termin für neue HEDT-Prozessoren seitens Intel: Danach soll der W790-Chipsatz als Ablösung des X299 im dritten Quartal 2022 antreten – was dann auch das Datum für entsprechende HEDT-Prozessoren sein sollte. Hierfür wird Intel die Server-Architektur "Sapphire Rapids" bemühen, welche dieselben "Golden Cove" CPU-Kerne wie Alder Lake benutzt – allerdings ohne dessen kleine "Gracemont" CPU-Kerne daherkommt. Wahrscheinlich dürfte dies Intel-intern dann unter "Sapphire Rapids-X" laufen, auch wenn dies bislang seitens Intel noch nirgendwo bestätigt wurde. Da Intel auch perspektivisch im Consumer-Segment weiterhin nur 8 große CPU-Kerne bieten wird, besteht mittels "Sapphire Rapids-X" eine Chance für Interessenten an ManyCore-Prozessoren, welche für diesen Zweck eben keine "kleinen" CPU-Kerne wünschen. Je nachdem wie kraftvoll AMDs nächste 12- und 16-Kerner werden, muß Intel mit dieser HEDT-Schiene eventuell auch gegenüber AMDs größten Consumer-Modellen antreten – und dürfte im Fall des Falles dann auch zu vergleichbaren Preislagen gezwungen sein.

Laut ExecutableFix @ Twitter kommen die Epyc-Prozessoren mit 3D V-Cache mittels dieses zusätzlichem Caches dann auf immerhin gleich 768 MB Level3-Cache insgesamt heraus – 256 MB über die CPU selber, weitere 512 MB als 3D V-Cache. Hardwareluxx weisen allerdings darauf hin, dass die entsprechenden Epyc-X-Modelle dafür mit beachtbar niedrigeren Taktraten gegenüber ihren TDP-gleichen Vorgängern ohne 3D V-Cache antreten sollen. Laut AMD soll der 3D V-Cache zwar kaum Stromverbrauchs-wirksam werden, jene Aussage war aber mehr auf Ryzen-Prozessoren bezogen – und nicht auf Epyc-Prozessoren mit ihren sehr viel größeren Caches. Andererseits könnte AMD die Taktraten von Epyc-X auch bewußt etwas niedriger angesetzt haben, um beiden Angeboten ihren Spielraum zu geben – demjenigem mit dem höchsten Takt und demjenigen mit dem größeren Level3-Cache. Eine sichere Aussage, dass auch die kommenden Ryzen-Modelle mit 3D V-Cache niedriger takten müssen, ist hieraus noch nicht zu ziehen.