6

News des 6. Februar 2023

WCCF Tech haben eine Bestätigung der Existenz von AMDs "Phoenix2" APU mittels Treiber-Patches für Linux erspäht, welche bereits letzten Dezember kolportiert wurde. Die reguläre Phoenix-APU wurde inzwischen in Form der Ryzen 7000 Mobile-Serie vorgestellt, "Phoenix2" dürfte sich da im zweiten Halbjahr einreihen. Die Gerüchteküche nannte seinerzeit einen 6-Kern-Prozessor mit nur 4 Shader-Clustern als iGPU. Die 6 CPU-Kerne unterteilen sich dabei in 2x regulärer Zen4-Kern und 4x taktabgesenkter Zen4c-Kern. Dabei besteht Feature-Gleichheit zwischen beiden Kern-Varianten, technisch fehlt Zen4c wohl nur die Hälfte des Level3-Caches. Der Ansatz dieses eher ungewöhnlichen big.LITTLE-Designs liegt in einer Beschränkung der Taktraten, worauf bislang zum Hochhalten der Taktrate benutzte Schaltkreise bzw. Transistoren aus dem Zen4c-Design herausfallen können.

Zen4-Kern Zen4c-Kern
Zielsetzung Standard Performance-Kern Effizienz-Kern, bei jedoch Feature-Gleichheit
Unterschiede - weniger Cache, vermutlich weniger Masse-Transistoren, da weniger Takt angestrebt wird
max. Taktrate 5.7 GHz angeblich ähnlich wie bei Zen 2, sprich ~4.5 GHz
Level2-Cache 1 MB pro Kern 1 MB pro Kern
Level3-Cache 2-4 MB pro Kern 1-2 MB pro Kern
IPC - grob gleich (der geringere Cache könnte minimale Auswirkungen haben)
Chipfläche 4-Kern-CCD = 71mm² (inkl. L3-Cache) lt. AMD-Aussage grob die Hälfte von Zen4 (vermutlich mit Cache gemeint)
Performance - wahrscheinlich anhand des niedrigeren Takts um ca. –20-25% niedriger
verbaut in Raphael, Phoenix, Genoa Phoenix2, Bergamo

Damit kann dieser CPU-Kern nur halb so groß wie ein regulärer Zen4-Kern ausfallen (wahrscheinlich gerechnet mit Cache, Aussage stammend von AMDs Mark Papermaster). Der Taktraten-Verlust hält sich wohl in Grenzen (ähnlich wie bei Zen 2, sprich bei ~4.5 GHz), dafür dürfte die Effizienz steil nach oben gehen und AMD spart wie gesagt ungefähr die Hälfte der Chipfläche. Grob kann man hochrechnen, dass (bei nahezu selber IPC) dann 4 Zen4c-Kerne in etwa so viel leisten wie drei 3 Zen4-Kerne – auf der Chipfläche von 2 Zen4-Kernen. Hier oben drauf kommt der Effizienzgewinn und die größere Kern-Anzahl, welche natürlich auch verkaufsfördernd ist. Der eigentliche Clou dieses Ansatzes ist dann, dass AMD jenen für alle nachfolgenden Prozessoren-Architekturen recht einfach adaptieren kann (immer eine extra c-Variante auflegend), ohne wie Intel die ganze Zeit an zwei getrennten Mikroarchitekturen arbeiten zu müssen (welche zudem auch nicht ganz Feature-gleich sind). Zen4c ist zudem augenscheinlich die Grundlage von AMDs "Bergamo" ManyCore-Server-Prozessoren, diese Entwicklung wird somit über gleich zwei Produktsparten re-finanziert.

Viel Beachtung fand die Aussage von Twitterer OneRaichu über das (angebliche) Entwicklungsziel Intels bei Meteor Lake: +50% mehr Effizienz soll hierbei herausgeholt werden – bei gleicher Performance, basierend auf gleicher Kern-Konfiguration. Anders formuliert soll mit selber Kern-Konfiguation der Stromverbrauch ein Drittel niedriger ausfallen, dann ergibt sich automatisch jener Effizienz-Gewinn. Dies passt generell zu einer Prozessoren-Generation auf Basis einer neuen Fertigung (Intel 4) und expliziter Mobile-Ausrichtung. Auf einen tatsächlichen Performance-Gewinn scheint diese Prozessoren-Generation hingegen nicht ausgerichtet zu sein, eventuell ergibt sich aber trotzdem irgendwo ein kleiner Vorteil. Auf iGPU-Seite soll es hingegen deutlich vorangehen, wobei die genannte Performance-Verdopplung angesichts des nominell kleinen Sprungs von 96 auf 128 EU nur mit (sehr) deutlich höheren Taktraten als realisierbar erscheint.

The target of Meteor is to realize 1.5x+ efficiency compare to the Raptor when it has the same perf. (same core processor, P+E)
Quelle:  OneRaichu @ Twitter am 6. Februar 2023
 
About iGPU, I think it maybe will reach almost 2x perf levels. (128EU@2.0+GHz VS 96EU)
Quelle:  OneRaichu @ Twitter am 6. Februar 2023
 
This one twitter is just talking about the efficiency target instead of the perf target. About the perf target, it still has some adjustments.
Quelle:  OneRaichu @ Twitter am 6. Februar 2023
 
"efficiency" means that perf/watt. 1.5x efficiency in the same perf means that less 1/3 power consumption in the same perf.
Quelle:  OneRaichu @ Twitter am 6. Februar 2023

Die ComputerBase berichtet über zwei weitere Varianten zur "GeForce RTX 3060", welche jetzt entdeckt wurden, in Komplett-PCs jedoch sicherlich schon eine ganze Weile herumschwirren. Hier handelt es sich grundsätzlich um eine GeForce RTX 3060 mit zwei mehr Shader-Clusterns, welche dann also mit 4608 FP32-Einheiten den Vollausbau des zugrundeliegenden GA106-Chips benutzt. Erstaunlicherweise gibt es sogar leicht mehr Chip-Takt, dafür wird allerdings der Speichertakt leicht ausgebremst: Anstatt GDDR6-Speicher mit 15 Gbps Datenrate gibt es solchen mit nur 14 Gbps Datenrate. Da der Gewinn an FP32-Rechenleistung (+12%) größer ausfällt als der Nachteil an Speicherbandbreite (–7%), dürfte diese Vollausbau-Variante ca. 5% schneller gegenüber der default-Variante zur GeForce RTX 3060 herauskommen.

GeForce RTX 3060 8GB GeForce RTX 3060 12GB GeForce RTX 3060 (4608SP) 6 GB GeForce RTX 3060 (4608SP) 12 GB
Chip-Basis nVidia GA106-? nVidia GA106-300 nVidia GA106-? nVidia GA106-?
Hardware 3 Raster-Engines, 28 Shader-Cluster, 3584 FP32-Einheiten, 48 ROPs, 1.5 MB L2, 128 Bit GDDR6-Interface (Salvage) 3 Raster-Engines, 28 Shader-Cluster, 3584 FP32-Einheiten, 48 ROPs, 2.25 MB L2, 192 Bit GDDR6-Interface (Salvage) 3 Raster-Engines, 30 Shader-Cluster, 3840 FP32-Einheiten, 48 ROPs, 2.25 MB L2, 192 Bit GDDR6-Interface (Vollausbau) 3 Raster-Engines, 30 Shader-Cluster, 3840 FP32-Einheiten, 48 ROPs, 2.25 MB L2, 192 Bit GDDR6-Interface (Vollausbau)
Taktraten 1320/1777 MHz & 15 Gbps 1320/1777 MHz & 15 Gbps 1627/1852 MHz & 14 Gbps 1627/1852 MHz & 14 Gbps
Rohleistungen 12,7 TFlops & 240 GB/sec 12,7 TFlops & 360 GB/sec 14,2 TFlops & 336 GB/sec 14,2 TFlops & 336 GB/sec
Speicherausbau 8 GB GDDR6 12 GB GDDR6 6 GB GDDR6 12 GB GDDR6
Differenz ein Drittel weniger Speicher, ein Drittel weniger Speicherbandbreite = Performance-Abschlag ca. –15% default-Variante 12% mehr FP32-Rechenleistung, minimal weniger Speicherbandbreite, halbierter Speicher = wahrscheinlich um ca. 5% schneller, aber untauglich für 4K 12% mehr FP32-Rechenleistung, minimal weniger Speicherbandbreite = wahrscheinlich um ca. 5% schneller
offizieller Verbrauch 170W 170W 170W 170W
FullHD / 4K Perf.Index ? 1130%  /  165% ? ?
Listen/Straßenpreis ?  /  330-370€ $329  /  350-370€ rein OEM rein OEM
Release Oktober 2022 25. Februar 2021 irgendwann 2022 irgendwann 2022

Dies rechnet allerdings nicht abweichende Power-Limits oder eventuelle weitere Werksübertaktungen mit ein, welche im OEM-Geschäft auftreten können – jeder PC-Hersteller darf da durchaus sein eigenes Süppchen kochen. Als großer Nachteil tritt jene Vollausbau-Variante jedoch üblicherweise nur mit 6 GB Grafikkartenspeicher an, was sowohl Eignung als auch Performance für höhere Auflösungen limitiert. Es soll die Vollausbau-Variante allerdings auch mit gleich 12 GB VRAM geben, wie gesagt ist im OEM-Geschäft alles an Varianten möglich. Jene würde sich auf dem passenden Power-Limit natürlich über die reguläre GeForce RTX 3060 erheben – der seltene Fall, dass eine OEM-Variante mal durchgehend besser ist als das reguläre Desktop-Modell. Vorher abschätzbar ist dies allerdings nicht, da kaum ein PC-Hersteller ausreichend genaue Spezifikationen zu derart tiefen Details bekanntgibt. Der gezielte Kauf einer (leicht) stärkeren GeForce RTX 3060 (OEM) im Rahmen eines Komplett-PCs ist somit nur in den wenigsten Fällen realisierbar.

VideoCardz vermelden den Marktstart von Core i5-13490F & Core i7-13790F in China, wo letzterer nur in Komplett-PCs und nicht im Einzelhandel zu finden sein wird. Zudem gibt es weitere Spezifikations-Angaben zum Core i7-13790F: Jener kommt auf einen maximalen Boost-Takt von 5.1 GHz daher, liegt demzufolge unterhalb der Vorgabe des normalen F-Modells (5.2 GHz). Dafür ist der Level3-Cache etwas größer (33 anstatt 30 MB), was allerdings kaum einen beachtbaren Effekt ergeben sollte. Die Taktraten-Differenz ist jedoch klein genug, auf dass sich diese beiden Änderungen ausgleichen könnten, der Core i7-13790F dürfte also glatt so schnell wie ein regulärer Core i7-13700F sein. Sofern das 90er Modell hier zu einem beachtbaren Mehrpreis führt, wäre dies faktisch ein Nepp-Angebot. Aber natürlich sind beide 90er "Black Edition" Prozessoren auch in dieser Prozessoren-Generation allein nur in China erhältlich, entwickelt dies für westliche Märkte somit keine Relevanz.

Basis Kerne P-Takt E-Takt L2+L3 iGPU PBP/MTP Liste Release
Core i7-13790F Raptor Lake 8C+8c/24T ?/5.1 GHz ? 24+33 MB deaktiviert ? ? Febr. 2023
Core i7-13700 Raptor Lake 8C+8c/24T 2.1/5.2 GHz 1.5/4.1 GHz 24+30 MB 32 EU 65/219W $384 3. Jan. 2023
Core i7-13700F Raptor Lake 8C+8c/24T 2.1/5.2 GHz 1.5/4.1 GHz 24+30 MB deaktiviert 65/219W $359 3. Jan. 2023
Core i5-13490F Alder Lake 6C+4c/16T ?/4.8 GHz ? 9.5+24 MB deaktiviert ? ? Febr. 2023
Core i5-13400 Alder Lake 6C+4c/16T 2.5/4.6 GHz 1.8/3.3 GHz 9.5+20 MB 24 EU 65/148W $221 3. Jan. 2023
Core i5-13400F Alder Lake 6C+4c/16T 2.5/4.6 GHz 1.8/3.3 GHz 9.5+20 MB deaktiviert 65/148W $196 3. Jan. 2023
Anmerkung: Spezifikationen der neuen Modelle 13490F & 13790F natürlich inoffiziell & unbestätigt