3

News des 3. Februar 2023

Von Moore's Law Is Dead @ Twitter kommen Bilder & Größenangaben zu den nVidia-Chips AD106 & AD107 – welche für das Mobile-Segment bereits vorgestellt sind, im Desktop-Segment jedoch erst im weiteren Verlauf des ersten Halbjahrs 2023 erwartet werden können. Hierbei handelt es sich um klare Mainstream-Grafikchips, ausgedrückt durch das beiderseits nur 128 Bit breite Speicherinterface (was über den 32 MB großen Level2-Cache auch nur mittelmäßig gerettet wird) sowie beiderseits unter 200mm² liegenden Chipflächen. Jene sind zwischen AD107 mit 150-160mm² und AD106 mit 180-190mm² dabei nur wenig unterschiedlich, was allerdings durchaus zum Hardware-Unterschied (24 vs. 36 Shader-Cluster, aber keine weiteren Differenzen) passt.

AD107 AD106 AD104 AD103 AD102
Chip-Daten 150-160mm² 180-190mm² 35,8 Mrd. Xtors @ 294,5mm² 45,9 Mrd. Xtors @ 378,6mm² 76,3 Mrd. Xtors @ 608,5mm²
Hardware 3 GPC, 24 SM (3072 FP32), 128 Bit, 32 MB L2, 8 GB 3 GPC, 36 SM (4608 FP32), 128 Bit, 32 MB L2, 8 GB 5 GPC, 60 SM (7680 FP32), 192 Bit, 48 MB L2, 12 GB 7 GPC, 80 SM (10'240 FP32), 256 Bit, 64 MB L2, 16 GB 12 GPC, 144 SM (18'432 FP32), 384 Bit, 96 MB L2, 24 GB
Vorgänger GA107: ~9 Mrd. Xtors ~200@ mm², 20 SM @ 128 Bit, GeForce RTX 3050 GA106: 12 Mrd. Xtors @ 276mm², 30 SM @ 192 Bit, GeForce RTX 3050 & 3060 GA104: 17,4 Mrd. Xtors @ 392mm², 48 SM @ 256 Bit, GeForce RTX 3060 Ti, 3070 & 3070 Ti GA103: ~22 Mrd. Xtors @ ~496mm², 60 SM @ 320 Bit, GeForce RTX 3070 Ti GA102: 28,3 Mrd. Xtors @ 628mm², 84 SM @ 384 Bit, GeForce RTX 3080, 3080 Ti, 3090 & 3090 Ti
Chip-Preis (~) AD107: $44 — GA107: $22 AD106: $53 — GA106: $31 AD104: $88 — GA104: $45 AD103: $117 — GA103: $59 AD102: $199 — GA102: $77
Anmerkungen: Derzeit sind nur noch die Angaben zu AD106 & AD107 (minimal) unsicher, der Rest betrifft bereits offiziell vorgestellte Grafikchips. Die Chip-Preise basieren auf dem Silicon Cost Calculator bei 90% Yield und Wafer-Preisen von (angenommen) 5nm TSMC bei $16'000 und 8nm Samsung bei $6000, logischerweise handelt es sich um nicht zuverlässige Hochrechnungen.

Zudem dürfte es in diesem Segment aus betriebswirtschaftlicher Sicht relevant sein, die kleinsten Lösungen tatsächlich mit einem passenden Silizium laufen zu lassen. Gegenteiliges kann man sich in den oberen Preissegmenten problemlos leisten, aber bei den kleineren Chips ist die Kalkulation knapper und zudem (über das Mobile-Segment) die Masse auch größer, da lohnt die Auflage eines extra Grafikchips selbst mit dieser geringen Differenz bei der Chipfläche. Dabei unterscheiden sich AD106 & AD107 nicht einmal mehr beim PCI-Express-Interface: Beide Chips treten mit nur 8 Lanes PCI Express 4.0 an. Hinzugefügt wurde an dieser Stelle eine grobe Kalkulation der reinen Chip-Herstellungspreise von Ampere- und Ada-Lovelace-Generation, welche allerdings mangels exakter Kenntnis über die von nVidia zu löhnenden Waferkosten sowie die Vertragsbedingungen zur Fertigungsausbeute (Bezahlung nach Wafern oder nach funktionierenden Chips) nur sehr ungenau sein kann.

Wichtig ist hierbei vor allem die sich ergebende Relation: Ja, nVidia bezahlt in der Ada-Lovelace-Generation deutlich mehr für die Grafikchips, trotz kleinerer Chipflächen. Aber nein, dies rechtfertigt keine Preissteigerungen für die komplette Grafikkarte in dem zu sehenden Ausmaß. Um hierzu ein normales Beispiel zu bringen: Im Midrange-Segment verdoppelt sich der Chip-Preis zwischen GA104 und AD104 nahezu. Trotzdem sind es (im groben Maßstab) nur 43 Dollar mehr – und zwar ohne dass sich andere größere Kostentreiber ergeben (Ausnahme: größere Speichermenge). Hier gilt genauso auch einzurechnen, dass Samsungs Waferkosten wohl echte Preisbrecher sind, grob auf der Hälfte von TSMCs 7nm-Fertigung liegend. Hätte nVidia die Ampere-Generation bei TSMC unter deren 7nm-Node hergestellt, wäre der GA104-Preis nicht bei $45 ausgefallen: Die (durch 7nm) etwas kleinere Chipfläche beachtend wären es eher ca. $65 gewesen – mit demzufolge grob halbierter Preisdifferenz zum nachfolgenden AD104-Chip.

Laut WCCF Tech wird der 15. Februar, von Intel eigentlich als Launch-Datum der neuen "Sapphire Rapids-WS" HEDT/Workstation-Prozessoren genannt, eher nur eine breite Vorstellung dieser Prozessoren bringen, denn die Launch-Reviews selber sind erst zum 22. Februar angesetzt. Der Verkaufsstart ist dann sogar nochmals später: Die eher HEDT-mäßige "Xeon W-2400" Serie zwischen dem 8. bis 22. März (offenbar noch nicht final festgelegt), die eher Workstation-mäßige "Xeon W-3400" Serie dann zwischen dem 12. bis 26. April. Ob sich hierbei überhaupt wirklich Consumer-geeignet Prozessoren ergeben, bleibt weiterhin in der Schwebe: Denn mit Maximal-Taktraten von (beiderseits) 4.8 GHz dürften weder Singlethread-Aufgaben noch Gaming-Performance gegenüber den aktuellen Consumer-Modellen von AMD & Intel wirklich konkurrenzfähig sein.

Kern-Varianten Interfaces TDPs
Xeon W-3400 12C, 16C, 20C, 24C, 28C, 36C, 56C 8Ch. DDR5, 116x PCIe 5.0 220-350W
Xeon W-2400 6C, 8C, 10C, 12C, 16C, 20C, 24C 4Ch. DDR5, 64x PCIe 5.0 110-275W
Hinweis: Angaben zu noch nicht offiziell vorgestellter Hardware basierend auf Gerüchten & Annahmen.

Zwei TimeSpy-Werte zur Radeon 780M aus dem chinesischen Bilibili-Forum – No.1 & No.2 geben einen Hinweis auf die Performance dieser mittels Ryzen 7000 Mobile kommenden neuen iGPU-Lösungen auf RDNA3-Basis. Dabei geht es je nach Benchmark-Wert um +20-22% nach oben – gegenüber der Radeon 680M mit der gleichen Anzahl an Shader-Clustern nach RDNA2. Hier kann man also auch die Shader-Cluster-normierte Performance-Differenz zwischen RDNA2 und RDNA3 sehen, wobei Mobile-üblich den Benchmark-Werten etwas Spielbreite einzuräumen ist – anderer Speicher, andere CPU und generell anderes Notebook-System werden hier und da die Werte auch noch beeinflußen. Auch ist derzeit unklar, inwiefern bei der Radeon 700M Serie ein höherer iGPU-Takt anliegt, dies würde die vorgenannten +20-22% ebenfalls beeinflussen bzw. speziell den Shader-Cluster-normierten Vergleich schmälern.

Hardware TimeSpy (GPU)
Radeon RX 6400 Desktop, 12 CU RDNA3 (768 FP32) @ 64 Bit 3610
Radeon 780M Ryzen 9 7940HS, 12 CU RDNA3 (1536 FP32), LPDDR5X/7500 3000
Radeon 780M Ryzen 9 7940HS, 12 CU RDNA3 (1536 FP32), DDR5/5600 2750-2791
GeForce GTX 1050 Ti Desktop, 6 SM Pascal (768 FP32) @ 128 Bit 2338
Radeon 680M Ryzen 6900 HS, 12 CU RDNA2 (768 FP32), DDR5/4800 2292
Wertequellen: Radeon 780M @ Bilibili #1, Bilibili #2, Radeon 680M @ WCCF Tech, GeForce GTX 1050 Ti @ 3DMark, Radeon RX 6400 @ 3DMark

Denkbar also, dass hier am Ende nur +10-15% realer Architektur-Einfluß herauskommen – was sich nicht besonders viel anhört angesichts der nominell verdoppelten FP32-Rohleistung (durch die verdoppelten FP32-Einheiten von RDNA3). Allerdings war wohl auch der Transistoren-Aufwand von RDNA2 zu RDNA3 nicht besonders hoch bei +20% mehr Transistoren zwischen Navi 23 und 33 mit ebenfalls gleicher Anzahl der Shader-Cluster (samt gleichem Infinity Cache und gleichem Speicherinterface). Davon abgesehen schlägt AMDs Radeon 780M sowieso alles andere, was sich derzeit im iGPU-Feld tummelt – und kommt mit dieser iGPU schon langsam nahe von Desktop-Einsteigerlösungen wie der Radeon RX 6400. Eine Desktop-Ausführung der Radeon 780M könnte eventuell (mit mehr Takt da höherem Power-Limit) die hierzu fehlenden ca. 20% überbrücken und somit die Radeon RX 6400 obsolet machen.