30

News des 30. Mai 2022

Twitterer Kopite7kimi hat bestätigt, dass die Launch-Strategie von nVidia zur kommenden GeForce RTX 40 Serie auf "4090 → 4080 → 4070" lauten wird – und damit vom bisherigen Prozedere abweicht, welche die xx80er Lösung immer zuerst gesehen hat. Bei der Ampere-Generation war dies allerdings auch nur noch pro Forma der Fall, faktisch wurden GeForce RTX 3080 & 3090 zusammen vorgestellt und später im Abstand von nur einer Woche zueinander in den Markt gebracht. Wie sich dies bei der GeForce RTX 40 zeitlich aufteilt, ist noch nicht sicher, allerdings dürfte nVidia den Launch von GeForce RTX 4070, 4080 und 4090 vermutlich allesamt innerhalb von grob zwei Monaten abhandeln (zu ermessen anhand der Daten zum Start der jeweiligen Test-Phase). Wann es damit losgeht, bleibt genauso noch in der Schwebe – der bisher genannte Termin "Juli" bezieht sich wahrscheinlich nur auf die offizielle Vorstellung und noch nicht auf den realen Produkt-Launch.

nVidia's launch strategy for "Ada Lovelace": 2 paths seem possible.
A) 4080 → 4090 → 4070
B) 4090 → 4080 → 4070

Quelle:  3DCenter @ Twitter am 30. Mai 2022
 
Choose B. Confirmed.
Quelle:  Kopite7kimi @ Twitter am 30. Mai 2022

Grundsätzlich gesehen hängt diese Release-Abfolge schlicht an weit zurückreichenden Entscheidungen, welche Chips zuerst in den Tape-Out gehen. Zu diesem Zeitpunkt irgendwann im Jahr 2021 musste nVidia mit einer sehr kräftigen RDNA3-Generation rechnen, mit Navi 31 als explizitem Angriff auf die Leistungsspitze. Dies erklärt die Eile von nVidia, um bei der "Ada Lovelace" Generation zumindest in jedem Fall einen zeitlichen Vorteil gegenüber AMD zu erzielen. Wohl auch auf Basis der Strategie-Überlegungen des Jahres 2021 wurde dann schlicht der AD102-Chip zuerst angesetzt – womit die GeForce RTX 4090 ziemlich automatisch an die Spitze der Release-Abfolge rutscht. Nur insofern von AMD keine Gefahr drohen würde, könnte nVidia dies nachträglich noch umdrehen (durch Verzögerung des AD102-Chips) – doch ansonsten gilt die Faustregel: Produkte rauswerfen, sobald die Technik fertig ist.

Laut einer bei VideoCardz zu sehenden Hersteller-Unterlage kommt AMDs "Mendocino"-APU mit Zen2/RDNA2-Unterbau mit nur 2 Shader-Clustern daher – sprich, nur 128 FP32-Einheiten. Damit geht das ganze Projekt nochmals eine Kategorie weiter nach unten in den wirklichen Einsteiger-Bereich, denn mit diesem Hardware-Unterbau kann man die integrierte Grafikeinheit kaum noch zum Spielen benutzen – das ganze ist dann eher ein Display- und Video-Beschleuniger. Passend hierzu trägt die APU nur ein SingleChannel-Speicherinterface (die beiden SubChannels von DDR5 ergeben einen gewöhnlichen Speicherkanal), was dann allerdings auch der Realität in diesem Marktsegment entspricht – wo seitens der Geräte-Hersteller sehr gern nur ein Speichermodul bestückt und der Prozessor damit automatisch in den SingleChannel-Modus gezwungen wird. Diese harschen Einschnitte werden sich dann auch nicht mehr mittels RDNA2-Architektur und eventuell hohen Taktraten übertünchen lassen, Mendocino geht damit eher in Richtung der früheren "Atom"-Entwicklungen von Intel.

Bei Angstronomics hat man sich dagegen intensiv mit der Vorstellung von AMDs Ryzen 7000 auf der Computex beschäftigt – und kann hierzu auch jeweils noch weitere Details hinzutragen. So soll die integrierte Grafik von "Zen 4" auf den Codenamen "Coral Bandfish" hören, unter der Kennung "GFX1036" laufen – und nur eine WGP der RDNA2-Architektur mitbringen. Dies sind dann 2 Shader-Cluster mit insgesamt 128 FP32-Einheiten – sprich, wie "Mendocino", wenngleich am besseren Speicherinterface hängend (da DualChannel). Für die Zen4-iGPU ist diese niedrige Ansetzung allerdings kein Beinbruch, denn an dieser Stelle muß wirklich nur eine simple Display- und Video-Beschleunigung geboten werden – für alle höheren Anwendungen wird man extra Grafikkarten verwenden. Letztlich war es ja von AMD sogar gefordert worden, bei einer solchen iGPU nicht zu übertreiben – denn dort, wo die iGPU sowieso nie zum Spielen verwendet wird, muß man dafür kein Silizium (sowie Fläche auf dem Package) verschwenden.

Daneben berichtet man zu den Taktraten der Ryzen-7000-Prozessoren: So lief AMDs eigenes Demo-System auf der Computex – womit der mißverständliche Blender-Wert abgeliefert wurde – noch etwas unterhalb des maximalen Sockel-Limits, sprich noch nicht bei 230 Watt PPT. Hier sind also noch (kleinere) Reserven zu vermuten – wie dies häufig der Fall ist bei Vorserien-Produkten, von denen man sich allerdings auch keine großen Wunderdinge versprechen sollte. Richtig interessant ist allerdings der Punkt, dass "Angstronomics" Informationen über eine OPN-Nummer aus dem Zen-4-Portfolio haben, deren maximale Taktrate (Fmax) bei satten 5.85 GHz liegen soll. Ob AMD dies tatsächlich so herausbringt bzw. bewirbt, bleibt noch abzuwarten. Denkbar ist an dieser Stelle, dass AMD bei den finalen Produktspezifikationen dann lieber wieder etwas tiefstapelt, damit auch wirklich jeder einzelne verkaufte Prozessor die beworbene (maximale) Taktrate in der Praxis aufzeigen kann.

So oder so deutet dies erneut darauf hin, dass die Zielsetzung von AMD bei Zen 4 schlicht Taktrate war. AMD wollte wohl endlich einmal den Nachteil gegenüber Intel in dieser Disziplin ausgleichen – was AMD bislang dazu gewungen hat, immer mit größerer Technik anzurücken, um den Taktraten-Nachteil auszugleichen. Zen 4 scheint ein primär auf (hohe) Taktraten optimiertes Design zu sein, während etwaige IPC-Vorteile vermutlich nur aus den gewissen Verbesserungen von mehr Level2-Cache und DDR5-Support resultieren, nicht jedoch aus ernsthafter Arbeit am eigentlichen Kern. Laut "Angstronomics" liegt die Zielsetzung von AMD für "Zen 4" bei +7% Singlethread Performance Per Clock (PPC) sowie +10% Multithread PPC – wobei jene PPC somit durchaus als "IPC" übersetzt werden kann (wobei "PPC" allerdings den besseren Begriff darstellt, denn "IPC" bezieht sich eigentlich nicht auf "Performance", sondern nur auf "Instruktionen").

    AMD Ryzen 7000

  • Desktop-Prozessoren (Codename "Raphael"), basierend auf der Zen-4-Architektur
  • Package mit zwei CCDs á ~72mm² (5nm TSMC) und einem I/O-Die mit ~126mm² (6nm TSMC)
  • ein CCD umfasst 8 CPU-Kerne (wie bisher) mit 1 MB Level2-Cache per Kern (verdoppelt gegenüber Zen 3)
  • I/O-Die umfasst DualChannel-Interface für DDR5, Northbridge mit 28 PCI Express 5.0 Lanes sowie RDNA2-basierte iGPU (mit 2 CU)
  • damit (vorerst weiterhin) maximal 16 CPU-Kerne im Desktop-Bereich
  • Performance-Ziel: +7% Singlethread Performance Per Clock und +10% Multithread Performance Per Clock
  • Boosttakt: wahrscheinlich 5.5 GHz oder leicht höher
  • Realtakt: bei durchschnittlichen Workloads (Gaming) ca. 5.2-5.5 GHz
  • insgesamter Performance-Gewinn (inkl. Takt-Plus): ca. 15-20% Singlethread, ca. 30-45% Multithread, ca. 20-30% im Schnitt (Schätzungen!!!)
  • Sockel AM5 (1718 Pins), bedingt neue Mainboards von AMDs 600er Chipsatz-Serie
  • AM5-Plattform ist ausgelegt für bis zu 170 Watt TDP und 230 Watt PPT (mindestens ein Ryzen 7000 Modell mit diesen Werten)
  • Releasedatum: Herbst 2022

Wo Zen 4 bzw. Ryzen 7000 letztlich herauskommt, hängt damit (nach wie vor) an den real erreichten Taktraten bzw. dem Taktraten-Plus gegenüber Ryzen 5000 – und nur zum geringeren Teil am IPC-Plus. Im Singlethread-Bereich ist da wahrscheinlich nicht viel zu holen, da kam auch Ryzen 5000 schon der 5-GHz-Marke nahe. Im Multithread-Bereich schlummern dagegen größere Reserven, dort ist bei Ryzen 5000 die Differenz zwischen Max-Takt und Real-Takt bekanntlich viel größer – ein Schatz, welchen AMD nunmehr mittels Ryzen 7000 heben will. Die konservative Schätzung von 20-30% Performance-Gewinn im Schnitt über alle Benchmarks hinweg bleibt vorerst bestehen, genauer sollte man es vorsichtigerweise derzeit sowieso noch nicht ausdrücken. PS: Der Webseiten-Name "Angstronomics" dürfte sich weniger auf das deutsche (inzwischen aber auch im englischen verwendete) Wort "Angst" als vielmehr den Technik-Begriff "Angström" beziehen – was ein Größenmaß für den atomaren Bereich ist, dabei 0,1 Nanometer entspricht und von Intel für zukünftige Fertigungsverfahren verwendet werden wird.