19

News des 19. September 2023

Der "Intel Innovation" Event brachte (bisher) nicht die eigentlich erwartete offizielle Ankündigung der nächsten Desktop-Generation von Intel in Form des Raptor Lake Refreshs – sondern die offizielle Vorstellung der "Meteor Lake" Prozessoren-Architektur, welche erst zum Jahresende (14. Dezember) in ersten Mobile-Modellen resultieren soll. Intel fuhr dabei einiges an Folien und Info-Material auf, da aus rein Fertigungs-technischer Sicht "Meteor Lake" sicherlich ein Wunderwerk geworden ist: Der Prozessor wird aufgeteilt in vier Einzel-Chips ("Tiles"), welche auf einem Interposer zusammenarbeiten. Intel benutzt diese Aufteilung aber im Gegensatz zu AMD nicht, um tatsächlich mehrere CPU-Dies zu verbauen, sondern trennt streng Aufgaben-gemäß: Ein SoC-Tile, ein CPU-Tile, ein GPU-Tile und ein I/O-Tile. Der Clou des ganzen ist, dass man jedes dieser Tiles unabhängig von den anderen in der jeweils passenden Fertigung herstellen lassen kann – wobei Intel bei "Meteor Lake" sogar drei der fünf benötigten Chips von TSMC bezieht.

Intel Meteor Lake Fähigkeiten Fertigung
SoC-Tile 2 E-Kerne ("Island"), Speicherinterface, USB 2/3, SATA, WiFi, Ethernet, Media-Controller, Display-Controller, NPU (AI-Beschleuniger) TSMC N6
CPU-Tile 6 P-Kerne ("Redwood Cove"), 8 E-Kerne ("Crestmont") Intel 4
GPU-Tile 8 Xe-Kerne ("Xe-LPG", 128 EU = 1024 FP32) TSMC N5
I/O-Tile PCI Express 5.0, USB 4.0, Thunderbolt 4 TSMC N6
Interposer Trägermaterial für alle Tiles Intel 22FFL

Technisch ist es zudem möglich, die einzelnen Tiles durch kleinere Versionen ihrer selbst zu ersetzen: Beispielsweise ein kleineres CPU-Tile für Einsteiger-Prozessoren, oder auch ein kleineres GPU-Tile für denselben Zweck. Es ist sogar möglich, ganze Tiles wegzulassen: Da die wichtigsten I/O-Fähigkeiten bereits im SoC-Tile liegen, wird das eigentliche "I/O-Tile" für viele Anwendungs-Zwecke nicht benötigt und kann daher weggelassen werden. Denkbarerweise könnte dies sogar für das GPU-Tile zutreffen, da Media- und Display-Controller aus jenem herausgelöst wurden und nunmehr im SoC-Tile sitzen. Letzteres beinhaltet zudem zwei zusätzliche E-Kerne, welche einen gewissen Grundbetrieb des Prozessors ermöglichen, womit bei Leerlauf oder Niedrigstlasten alle anderen Tiles schlafengelegt werden können. Die zwei zusätzlichen E-Kerne werden auch von Windows angezeigt, womit Meteor Lake insgesamt somit auf 6 P-Kerne und 10 E-Kerne kommt.

Die auffällige Konzentration der Intel-Folien auf Fortschritte, die primär dem Chipfertigungs-Bereich zuzuordnen sind, zeigte jedoch indirekt schon an, was auf der anderen Seite fehlt: Große Performance-Fortschritte sind hier Fehlanzeige. Für die "Redwood Cove" Architektur der P-Kerne gibt Intel gar keinen IPC-Gewinn an, für die "Crestmont" CPU-Architektur der E-Kerne sollen es +4-6% IPC sein. Zudem (oder deshalb?) kommt "Meteor Lake" nicht in größeren Ausführungen, sondern verbleibt rein im Mobile-Segment – und dies nur bis zur H-Klasse, die neue HX-Klasse wird vom Raptor Lake Refresh gebildet werden. Intel hat also massiv am Prozessor-Aufbau umgebaut, kann dafür allerdings wohl kaum eine beachtbare Mehrperformance bieten – oder nur eine Mehrperformance, welche sich erst unter Mobile-typischen Verbrauchslimits ergibt. Intel wird sicherlich die neu gewonnenen Tile-Fähigkeiten in Zukunft auch für Desktop-Prozessoren nutzen, aber derzeit führt dies alles (noch) nicht zu Mehrperformance unter Desktop-Bedingungen.

Da zum Fall von nVidias "Blackwell"-Architektur schon wieder Informationen zu HPC- und Gaming-Chips miteinander vermischt bzw. durcheinander gebracht werden, hiermit zur Klarstellung: Wie seit Jahren üblich, wird nVidia zwei getrennte GPU-Architekturen pflegen, auch wenn in diesem Fall der Codename wieder einmal derselbe ist: "HPC-Blackwell" setzt also die aktuelle "Hopper" HPC-Architektur fort, während "Gaming-Blackwell" die aktuelle "Ada Lovelace" Gaming-Architektur fortsetzt. Bis auf den gleichen Codenamen ist da allerdings wenig gleich: Viele interne Bauteile werden gemeinsam designt, aber schon bei der Zusammenfügung zu Bauteil-Gruppen ergeben sich beträchtliche Unterschiede: So sehen die Shader-Cluster von Ada Lovelace und Hopper zuerst nicht unähnlich aus. Der genauere Blick zeigt allerdings, dass Hopper jegliche RayTracing-Kerne fehlt, dafür aber FP64-Fähigkeiten und eine deutlich höhere Tensor-Power mit an Bord sind.

Design Chips Fertigung
"HPC-Blackwell" Multi-Chip (MCM) GB102, GB100 (vermtl. 2x GB102) 3nm TSMC
"Gaming-Blackwell" monolithisch GB207, GB206, GB205, GB203, GB202 vermtl. 3nm TSMC
Hinweis: Angaben zu noch nicht offiziell vorgestellter Hardware basierend auf Gerüchten & Annahmen

Anders formuliert nutzt nVidia hier bei den Grund-Einheiten durchaus Synergie-Effekte, um nicht alles doppelt machen zu müssen. Aber wenn es zur konkreten Ausführung kommt, dann unterscheidet sich die verbaute Hardware doch schon erheblich – bis hin zum Punkt, dass beim GH100-Chip wegen weiterer Einsparungen in der Rendering-Pipeline nur 2 der 144 Shader-Cluster wirklich fähig sind, reguläre Spiele-Grafik zu erzeugen. Bei Blackwell wird dies wiederum schwerer auseinanderzuhalten sein, der gemeinsame Codename lädt zu Mißverständnissen ein. Hier kann es gut und gerne passieren, dass demnächst Wunder-Daten zu "Blackwell" gemeldet werden, welche sich aber real auf HPC-Blackwell beziehen und damit eben nicht auf Gaming-Blackwell applizierbar sind. Wenigstens bei den Chip-Codenamen gibt es eine klare Trennung: GB10x is HPC-Blackwell, während GB20x dann Gaming-Blackwell ist.

Daneben soll noch einmal explizit darauf hingewiesen werden, dass der 1,7fache Sprung bei Gaming-Blackwell (von der GeForce RTX 4090 ausgehend), welchen Chiphell-Nutzer "Panzerlied" derart angegeben hatte, wirklich nur den Rohleistungs-Sprung angibt. Hierzu kann man sich selber überzeugen, indem man die angegebenen Shader-Cluster (1,5fach) mit dem Mehrtakt (1,15fach) multipliziert – dies ergibt genau jenen 1,7fachen Sprung. Und ein Rohleistungssprung muß eben keineswegs in einem gleichartigen Performancesprung enden, gerade bei heutigen Spitzen-Grafikchips ist da eigentlich immer mit deutlichen Abschlägen zu kalkulieren. Im Fall der GeForce RTX 4090 gibt es beispielsweise eine Rohleistung vom 2,3fachen zur GeForce RTX 3090, die Performance zwischen diesen beiden Karten steigt aber gewöhnlich nur auf das 1,7fache. Dies auf Gaming-Blackwell interpoliert, würde sich eine reale Mehrperformance von nur ca. +40% ergeben.

Rohleistungs-Sprung reale Mehrperformance
GeForce RTX 3090GeForce RTX 4090 +131% +72%
GeForce RTX 4090Gaming-Blackwell angeblich ca. +70% ?
Hinweis: Angaben zu noch nicht offiziell vorgestellter Hardware basierend auf Gerüchten & Annahmen

VideoCardz berichten über einen umfangreichen Leak von offiziellen Microsoft-Dokumenten, welche Einblick in die geplante Xbox-Zukunft gibt. So steht für Oktober 2024 ein Refresh der aktuellen Xbox Series S/X an, welcher allerdings augenscheinlich nicht mehr Performance mit sich bringt, sondern eher andere, kleinere Verbesserungen umfasst. So sollen beide Xbox-SoCs wohl neu aufgelegt werden, dabei kommen aktualisierte Standards bei WiFi (6E) und Bluetooth (5.2) hinzu. Der neue SoC der kleineren XBSS dürfte dabei wohl bei der bislang genutzten 7nm-Fertigung bleiben, während der neue SoC der größeren XBSX zur 6nm-Fertigung wechselt – was für 15% weniger Energieverbrauch sorgt. Augenscheinlich wird dieser Vorteil jedoch nicht für eine Mehrperformance verwendet, Gaming-technisch bringt dieser Refresh keine beachtbaren Änderungen mit sich. Da auch die Preispunkte identisch ausfallen sollen, könnte dies eher unter "interne Bauteil-Umstellung" laufen und nichts am eigentlichen Produkt ändern.

Die neue XBSX könnte man somit eher als "Slim-Ausführung" bezeichnen, selbst die Bezeichnung "Refresh" ist schon hochgegriffen. Mit der angeblich im selben Zeitrahmen erscheinenden PlayStation 5 Pro läßt sich dies sicherlich nicht vergleichen. Noch sehr in der Konzeptions-Phase sind hingegen die ebenfalls offerierten Daten zur nächsten Xbox-Generation: Mit jener will man im Jahr 2028 herauskommen – und stellt sich derzeit eine CPU auf entweder Zen6- oder ARM-Basis mit einer GPU auf RDNA5-Basis vor, welche zudem einen Teil ihrer Leistung aus der Cloud beziehen können soll. Wegen der noch ungeklärten Frage der CPU-Architektur und weil dies alles noch 5 Jahre entfernt ist, handelt es sich allerdings eher nur um ein frühes Konzept, ohne Anspruch darauf, dass dies tatsächlich so gebaut wird. Bei der Termin-Lage (vermutlich Ende) 2028 dürfte Microsoft eher erst 2025/26 in die ernsthafte Design-Arbeit einsteigen, da der Entwicklungsschluß mit anschließendem Tape-Out nicht vor 2027 stattfinden muß.