2

Hardware- und Nachrichten-Links des 2. August 2021

Von Twitterer TtLexington kommt eine Serie an Tweets zur GeForce RTX 40 Serie bzw. natürlich primär auf deren Spitzen-Chip "AD102" bezogen. Der Twitterer ist bislang noch nicht in Erscheinung getreten, insofern muß die Qualität dessen Informationen erst noch eruiert werden. Nach eigenen Angabe handelt es sich um Mitglied des chinesischen Zhihu-Forums, welcher dort im September 2020 für eine vergleichsweise gut zutreffende Performance-Aussage zu AMDs Navi-21-Chip (mindestens 3080er Level, im besten Fall nahe der 3090) gesorgt hatte. Zugunsten der neueren Tweets zur GeForce RTX 40 Serie spricht auch, dass jene entweder halbwegs auf bekanntes Wissen passen oder aber direkt von anderen Leakern bestätigt werden: So spricht Greymon55 @ Twitter genauso von "hohen" Taktraten bei der Lovelace-Generation – was der "TtLexington"-Aussage von 2.2 bis 2.5 GHz gleich ein ganz anderes Gewicht verleiht.

RTX 40 series: 2.2g-2.5g boost
Quelle:  TtLexington @ Twitter am 1. August 2021
 
rtx30series—rtx40series like Maxwell—Pascal
Quelle:  TtLexington @ Twitter am 1. August 2021
 
2022 12or2023Q1
Quelle:  TtLexington @ Twitter am 1. August 2021
 
TSMC ,not can be samsung
Quelle:  TtLexington @ Twitter am 3. August 2021

Mittels der höheren Taktraten sollte sich nVidia bei der FP32-Power weiterhin von AMD absetzen, könnte allerdings dann tatsächlich bei einem höheren Stromverbrauch landen. Womöglich liegt hierin die Erklärung dafür, dass die Tendenz der Leaker zuletzt dahin ging, AD102 den höheren Stromverbrauch zuzusprechen als Navi 31 – trotz dass AMD mit deutlich höheren Silizium-Aufwand herangeht und auch "TtLexington" wiederum TSMC als Chipfertiger bei nVidias 5nm-Generation bestätigt, nicht Samsung. Genauso bestätigt wird der hohe damit erzielbare Performance-Sprung, welcher sinngemäß ähnlich kräftig wie zwischen nVidias Maxwell- und Pascal-Generation aussehen soll (GeForce GTX 980 Ti → GeForce GTX 1080 Ti: +73%). Genauso wie die bekannten, verläßlichen Quellen ist "TtLexington" dann arg zurückhaltend bei der Terminlage: AD102 ist demnach nicht vor Dezember 2022 zu sehen – oder sogar erst im ersten Quartal 2023. In dieser Frage scheint AMD etwas schneller zu sein, wo zumindest das vierte Quartal 2022 angepeilt wird, sogar das späte dritte Quartal 2022 noch nicht ganz unmöglich ist.

Laut Bondrewd @ Beyond3D-Forum soll der Navi-33-Chip als der drittgrößte Chip der kommenden RDNA3-Architektur einen Midrange-Ansatz verfolgen, sprich für die Preisklasse von 450 Dollar gedacht sein. Dafür gibt es dann allerdings auch weniger Speicher als bei Navi 22 – welcher in Form der Radeon RX 6700 XT seine 12 GB trägt. Dies erhärtet die (vorher schon hier und da genannte) These, wonach Navi 33 nur mit einem 128-Bit-Interface anrückt, dazu passen dann wirklich nur 8 (oder 16 GB) Speicher. Trotzdem würde es verwundern, wenn AMD in dieser Frage bei einer 450-Dollar-Karte knausrig wäre – dies ist dann immerhin schon Ende 2022 und muß voraussichtlich bis ins Jahr 2024 reichen. Andererseits sind Fragen der Speicherbestückung auch eine Angelegenheit der konkreten Kartengestaltung, welche man – wie zuletzt ausgeführt – eigentlich erst mit Vorliegen eines validierten Grafikchips angeht.

Ballpark ~440mm^2 but it's also less mem than N22.
Feasiable for 450 buck.

Quelle:  Bondrewd @ Beyond3D-Forum am 28. Juli 2021

Interessant ist zudem die Notiz zur Chipgröße von Navi 33: Danach sollen es immerhin 440mm² sein. Dies erscheint gegenüber den 519mm² von Navi 21 als ziemlich kleiner Unterschied – erklärt sich allerdings wohl darin, dass die für Navi 33 (im Gegensatz zu Navi 31/32) angesetzte 6nm-Fertigung gegenüber 7nm nur einen Flächenvorteil von –16% erbringt. Navi 33 wird augenscheinlich dieselbe Anzahl an FP32-Einheiten wie Navi 21 mitbringen, zu allerdings einem halbierten Speicherinterface (256 Bit → 128 Bit) und jedoch voraussichtlich derselben Menge an Infinity Cache (128 MB). Unklar ist, wie stark dann die Architektur-Änderungen ins Transistoren-Budget sowie den Flächenbedarf einschlagen – aber angesichts dessen, dass AMD mit Navi 33 (angeblich) in Richtung der Performance von Navi 21 gehen will (und man zudem einigen Nachholbard beim Thema "RayTracing" hat), ist eine gewisse dickere Architektur eigentlich obligatorisch.

Navi 33 Navi 32 Navi 31
Chips monolithisch 2 GCD + MCD 2 GCD + MCD
Fertigung 6nm TSMC GCD: 5nm TSMC, MCD: 6nm TSMC
Chipfläche ~440mm² unbekannt geschätzt ~800mm² (oder mehr)
Hardware-Daten 2 Shader-Engines
20 WGP mit 5'120 FP32
4 Shader-Engines
wahrscheinlich:
40 WGP mit 10'240 FP32
6 Shader-Engines
60 WGP mit 15'360 FP32
Speicherinterface 128 Bit GDDR6 unbekannt 256 Bit GDDR6
Infinity Cache vermutlich 128 MB unbekannt vermutlich 512 MB
Perf-Ziel Richtung Navi 21 unbekannt Navi 21 x2,5-2,7
Tape-Out Q4/2021 unbekannt in Bälde
Anmerkung: reine Wiedergabe von Gerüchten – keine offiziellen Daten

Nochmals Bondrewd notiert hierzu beispielsweise, dass AMD bei der RNDA3-Architektur nicht den Weg von nVidia bei der Ampere-Architektur gegangen sein soll, wo nVidia die verdoppelten FP32-Einheiten mehrheitlich ohne entsprechend mehr Verwaltungslogik hingestellt hatte. AMD hat bei RDNA3 zwar die "Compute Units" (CU) zugunsten der WGPs abgelöst sowie die WGPs mit doppelter FP32-Anzahl aufgestockt, soll dazu aber (angeblich) auch insgesamt das ganze "Drumherum" entsprechend verbreitert haben. Damit könnte man dann einen größeren Performanceeffekt als nVidia bei deren FP32-Verdopplung generieren – was auch notwendig ist, denn ansonsten kommt Navi 33 niemals in die Nähe des Performance-Niveaus von Navi 21 (und wäre genauso die hohe Performance-Zielsetzung von Navi 31 außer Reichweite).

Instead of moar FP32 per same amount of regs they throw moar everything in a fat SM config.
Quelle:  Bondrewd @ Beyond3D-Forum am 28. Juli 2021

Twitterer Greymon55 gibt ein paar grobe Terminlagen zu NextGen-Prozessoren von AMD zum besten, ein nachfolgender Tweet macht dann klar, was hierbei jeweils gemeint ist. So soll im Jahr 2023 Zen 4 mittels "Phoenix" dann auch in das APU-Feld (und damit ins Mobile-Segment) gehen, nachdem die Desktop- und Server-Prozessoren der Zen-4-Generation bereits Ende 2022 zu erwarten sind. Eher überraschend ist der schnelle Umstieg auf Zen 5, welcher noch im gleichen Jahr anstehen soll – wiederum zuerst mit den Desktop-Modellen (Granite Ridge, 2023) und nachfolgend den APUs (Strix Point, 2024). Selbst wenn Zen 4 erst kurz vor Jahresschluß 2023 ansteht, ergäbe dies eine Zeitspanne von nicht viel mehr als einem Jahr zwischen Zen 4 & 5 – womit sich auch Überlegungen zu einem eventuellen Zen-4-Refresh erübrigen würden. Ein staffer Zeitplan seitens AMD ist per se nichts falsches, die wirklichen Bedenken liegen eher darin, ob man so schnell von der 5nm- auf die 3nm-Fertigung wechseln kann – oder ob Zen 5 damit vielleicht weiterhin bei 5mn bleibt.

Codename & Termin = Produkt
Quelle: Greymon55 @ Twitter Quelle: Greymon55 @ Twitter
Phoenix 2023 Zen 4 Mobile
Granite Ridge 2023 Zen 5 Desktop
Strix Point 2024 Zen 5 Mobile

Notebookcheck berichten über den Fall eines wirklich mißlungenen Gaming-Notebooks mit GeForce RTX 3050 Ti Laptop Grafiklösung – welche nicht schneller als eine GeForce GTX 1650 Ti Mobile aus derselben Notebook-Reihe von Dell herauskommt. Grundlage hierfür ist zum einen die niedrige, allerdings durchaus Spezifikations-gerechte TGP-Einstellung von maximal 45 Watt. In der Praxis fällt das Gerät jedoch schnell auf einen GPU-Stromverbrauch von um die 35 Watt zurück. Technisch gesehen liegt dies allerdings nicht außerhalb der nVidia-Spezifikation, welche für die GeForce RTX 3050 Ti Laptop einen Mindestwert von 35 Watt vorsehen. Denkbar sind hierbei thermische Problem – es könnte aber auch sein, dass das Notebook real mit einer Mindest-TGP von 35 Watt läuft und der Rest nur dynamischer Spielraum sind. Es ist weiterhin ein Nachteil der offiziellen Spezifikationen-Angaben, dass nVidia die Notebook-Hersteller nur zur Angabe einer max-TGP zwingt, woraus nicht klar wird, welchen Anteil die Base-TGP und welchen Anteil der dynamische Spielraum hat.

Generell sollte auf gleicher TGP-Klasse die ältere Mobile-Grafiklösung (wegen des Unterschieds in der Fertigungstechnologie) zwar geschlagen werden, sofern die genannte GeForce GTX 1650 Ti Mobile jedoch mit beachtbar höheren TGP-Werten antritt, kann durchaus ein Gleichstand herauskommen. Für diesen konkreten Vergleich scheint letzteres zuzutreffen, denn die GeForce GTX 1650 Ti Mobile im benutzten Dell-Notebook lief gemäß dem seinerzeitigen Testbericht mit grob 50 Watt Realverbrauch. Dass man dies nur eine Chip-Generation später mit nur 35 Watt Stromverbrauch nicht gerade mit fliegenden Fahnen schlagen kann, musste eigentlich von Anfang an klar sein. So groß ist der Effizienzgewinn zwischen Turing und Ampere letztlich nicht, zwischen GeForce RTX 2080 Ti FE (247%, 272W) und GeForce RTX 3070 (250%, 221W) sind es nur +25%, zwischen GeForce RTX 2080 FE (192%, 228W) und GeForce RTX 3070 (250%, 221W) auch nur +26%. Dumm natürlich, wenn Dell das Turing-Notebook mit 50 Watt TGP laufen läßt, der mehr oder weniger direkter Nachfolger sich dann Grafikkarten-seitig nur 35 Watt dauerhafte TGP genehmigen darf.