12

News des 12. September 2025

Von Twitterer (und YouTube-Creator) High Yield kommt ein beschrifteter Die-Shot zu "Rubin CPX", der Inference-Lösung für die "Rubin"-Generation, welche erstaunlich nahe an einem Gaming/Consumer-Grafikchips aussieht. Dieser Eindruck wird über den Die-Shot bzw. die darin gefundenen Hardware-Einheiten noch einmal verstärkt, denn es zeigen sich hierbei gleich 16 Raster-Engines (GPC), 128 MB Level2-Cache und 256 ROPs. Beim HPC/AI-DualChip "GB100" sind es hingegen nur 8 GPC, 60 MB L2-Cache und 24 ROPs, bezogen schon auf das DualChip-Konstrukt aus zwei ~800mm² großen Einzel-Dies. Über den Cache kann man sicherlich diskutieren, jener wird zudem für beide Verwendungszwecke gebraucht. Aber Raster-Engines und gerade ROPs braucht man bei HPC/AI-Lösungen eher weniger, bei Gaming/Consumer-Lösungen hingegen eher mehr, gerade für HighEnd-Chips. Und in dieser Frage sieht Rubin CPX nunmehr um so stärker wie ein Consumer-Chip aus.

Diese Kerbe wird noch breiter durch die gleich 4 Display-Engines von Rubin CPX – ein Punkt, welcher expliziten HPC/AI-Chips in aller Regel komplett fehlt, da sie keine eigene Display-Ausgabe leisten müssen, sondern nur als Parallelbeschleuniger eingesetzt werden. Ob Rubin CPX damit allerdings wirklich als Consumer-Chip arbeiten könnte, hängt auch an Punkten, die zu kleinteilig sind, um jene dem Die-Shot entnehmen zu können. So fehlt bei nVidias HPC/AI-Chips gewöhnlich die RayTracing-Einheit in den Shader-Clustern, wohingegen dort Wert auf eine vergrößerte Tensor-Einheit gelegt wird. Bei Rubin CPX könnte dies sogar auf die Spitze getrieben worden sein, denn für den Anwendungszweck als reiner Inferencing-Beschleuniger wird primär Tensor-Power benötigt – selbst die regulären FP32-Einheiten könnten somit entfallen. Ganz generell gilt zudem die Überlegung, dass nVidia es sich im HPC/AI-Segment sehr wohl leisten kann, extra Chips auch für Nebenaufgaben aufzulegen, man dort keine Zweitverwertung betreiben muß.

GB100 GB202 Rubin CPX
Aufbau Dual-Chip (2x GB102) monolithisch monolithisch
Raster-Engines (GPC) 8 12 16
Shader-Cluster (SM) 160 192 192
ROPs 24 192 256
Level2-Cache 60 MB 128 MB 128 MB
Speicherinterface 8192-bit HBM3e 512-bit GDDR7 512-bit GDDR7
Hinweis: Angaben zu GB202 sind teilweise unbestätigt sowie zu Rubin CPX durchgehend unbestätigt

Auch wäre (im Fall des Falles) der Hardware-Sprung gegenüber dem GB202-Chip eher ernüchternd: Auf Chip-Ebene sind es dieselben 192 Shader-Cluster an einem 512-Bit-Speicherinterface, selbst wenn die GB202-basierte GeForce RTX 5090 dies wie bekannt nicht ganz ausfährt (170 SM @ 512-bit). Trotz vielen Gleichheiten dürfte Rubin CPX somit doch ein eigenständiger Chip sein, auch angepasst auf seine primäre Aufgabe und somit wohl nicht einmal (vernünftig) als Gaming-Beschleuniger verwendbar. Denkbar ist viel eher denn eine Zweitverwendung als dedizierter AI-Beschleuniger für PC-Systeme: Eine entsprechende PCIe-Steckkarte könnte lokale KIs beschleunigen, mit 30 PetaFlops FP4-Rechenleistung wäre man drastisch schneller als Microsofts Anforderung für den KI-PC (40 TOPs). nVidias nächste Gaming/Consumer-Chips sollten jedoch normalerweise mit mehr Hardware antreten als jene 192 Shader-Cluster – selbst wenn nVidia dann (wie bei der GeForce RTX 5090) nicht alles davon nutzt.

Wie die ComputerBase entdeckt hat, sind bei nVidias eigenem Marktplatz die GeForce RTX 5080 FE und 5090 FE entschwunden, werden nicht einmal mehr als "nicht verfügbar" gelistet. Die Delistung ist in aller Regel ein gutes Anzeichen dafür, dass deren Fertigung eingestellt ist – was wiederum den Hinweis daraus ergibt, dass entsprechende Nachfolger anrücken. Für die GeForce RTX 5090 dürfte dies nicht zutreffen, bislang gibt es außer Hypothesen keine ernstzunehmenden Gerüchte zugunsten weiterer GB202-basierter Grafikkarten. Die GeForce RTX 5080 sollte hingegen Richtung Jahreswechsel durch die GeForce RTX 5080 Super ersetzt werden, zu welcher nVidia sicherlich auch eine Founders Edition auflegen wird. Die GeForce RTX 5070 Ti hat keine Founders Edition, entfällt damit in dieser Betrachtung. Bleibt nur die GeForce RTX 5070 übrig, welche weiterhin im nVidia-Marktplatz gelistet wird – was wiederum den Hinweis darauf ergibt, dass nVidia diese Karte auch nach Launch des RTX50-Refreshs im Portfolio behalten dürfte.

Chip Hardware VRAM TDP Liste Release
GeForce RTX 5090 GB202 170 SM @ 512-bit 32 GB 575W $1999 30. Januar 2025
GeForce RTX 5080 Super GB203 84 SM @ 256-bit 24 GB 415W ? Anfang 2026 (Vorstellung zur CES)
GeForce RTX 5080 GB203 84 SM @ 256-bit 16 GB 360W $999 30. Januar 2025
GeForce RTX 5070 Ti Super GB205 70 SM @ 256-bit 24 GB 350W ? Anfang 2026 (Vorstellung zur CES)
GeForce RTX 5070 Ti GB203 70 SM @ 256-bit 16 GB 300W $749 20. Februar 2025
GeForce RTX 5070 Super GB205 50 SM @ 192-bit 18 GB 275W ? Anfang 2026 (Vorstellung zur CES)
GeForce RTX 5070 GB205 48 SM @ 192-bit 12 GB 250W $549 5. März 2025
GeForce RTX 5060 Ti 16GB GB206 36 SM @ 128-bit 16 GB 180W $429 16. April 2025
GeForce RTX 5060 Ti 8GB GB206 36 SM @ 128-bit 8 GB 180W $379 16. April 2025
GeForce RTX 5060 GB206 30 SM @ 128-bit 8 GB 145W $299 19. Mai 2025
GeForce RTX 5050 GB207 20 SM @ 128-bit 8 GB (GDDR6) 130W $249 Juli 2025
Hinweis: Angaben zu noch nicht offiziell vorgestellter Hardware basieren auf Gerüchten & Annahmen

Von YouTuber Moore's Law Is Dead kommen (vorgebliche) Spezifikationen der PlayStation 6 – welche allerdings fast durchgehend als Spannen abgefasst sind, sprich noch nichts festgenageltes berichten können. Grundsätzlich sollen hierbei die Architekturen Zen 6 und RDNA5/UDNA zum Einsatz kommen – was allerdings angesichts des angepeilten Releasedatums von Herbst 2027 auch irgendwie selbstverständlich ist. Prozessoren-seitig sollen 9-10 CPU-Kerne geboten werden, interessanterweise ausschließlich Zen 6c und Zen 6 LP, ergo keine "regulären" Kerne. Da sich reguläre und c-Kerne bei AMD aber nur minimal unterscheiden (im eigentlichen eine Sache des Maximaltakts), spielt dies wohl keine gewichtige Rolle – die Spieleentwickler werden sich somit mit dem einrichten, was man diesbezüglich vorfindet. Grafik-seitig sollen es hingegen 52-54 Shader-Cluster von RDNA5 sein, mit Taktraten von 2.6-3.0 GHz. Anno 2027 dürften diese Taktraten sicherlich auch wieder nur als "maßvoll" angesehen werden, somit entsprechend den Taktraten früherer Spielekonsolen.

PS5 PS5Pro PS6 (Gerücht)
Fertigung 7nm TSMC monolithisch 4nm TSMC monolithisch 3nm TSMC monolithisch
Prozessor 8C/16T Zen 2 @ ≤3.5 GHz 8C/16T Zen 2 @ ≤3.85 GHz 7-8C Zen 6c + 2C Zen 6 LP
Grafiklösung 36 CU RDNA2 @ ≤2.23 GHz (≤10,3 TFlops) 60 CU RDNA3 @ ≤2.35 GHz (≤18,1/33,5 TFlops) 52-54 CU RDNA5 @ 2.6-3.0 GHz
Speicherinterface 256 Bit GDDR6 @ 14 Gbps (448 GB/sec) 256 Bit GDDR6 @ 18 Gbps (576 GB/sec) 160 Bit GDDR7 @ 32 Gbps (640 GB/sec)
Speicherausbau 16 GB GDDR6 16 GB GDDR6 30 oder 40 GB GDDR7
Release 12. November 2020 (Europa: 19. Nov.) 7. November 2024 Herbst 2027
Hinweis: Angaben zu noch nicht offiziell vorgestellter Hardware basieren auf Gerüchten & Annahmen

Unklar bleibt an dieser Stelle, ob hiermit die sich abzeichnende Verdopplung der Shader-Prozessoren pro Shader-Cluster bei RDNA5/UDNA schon mit eingerechnet ist oder oben drauf kommt. Es geht wahrscheinlich eher in letztere Richtung, denn 52-54 Shader-Cluster sind angesichts der 60 Shader-Cluster der PS5Pro nun keineswegs übermäßig viel. Der YouTuber nennt Performance-Werte von 2,5-3mal so schnell wie die PS5, unter RayTracing dann sogar 6-12mal so schnell. Letzteres ist aber auch kein Wunder, die originale PS5 basiert noch auf der RDNA2-Architektur mit demzufolge magerer RayTracing-Performance. Denkbarerweise dürfte "RayTracing" sogar das große Thema dieser kommenden neuen Spielekonsolen-Generation werden. Dies bedingt zum einen erhebliche RayTracing-Zugewinne bei RDNA5/UDNA, dürfte zum anderen aber auch jenes Grafik-Feature nochmals erheblich vorantreiben bei der Adaptionsrate unter neuen Spieletiteln. Wie leistungsstark sich da speziell die PS6 zeigt, bleibt noch abzuwarten, hierzu fehlt derzeit eine gewisse Referenz, welche sich erst mit dem Release erster RDNA5-Beschleuniger für den PC-Bereich ergeben wird.