Die Aussagen von Twitterer & Leaker Kopite7kimi zum GB202-Chip beinhalteten zugleich auch Aussagen zur grundsätzlichen Hardware von "GB100", dem HPC/KI-Chip der kommenden Blackwell-Generation. Jene sind recht kurz gehalten: 8 GPC samt jeweils 10 TPC und ein 8192 Bit breites Speicherinterface (natürlich dann wieder für HBM-Speicher, bei dieser Interface-Breite). Sofern wiederum 2 Shader-Cluster pro TPC gelten, ergibt dies 160 Shader-Cluster – und damit einen verhältnismäßig kleinen Sprung gegenüber dem GH100-Chip (144 SM @ 6144 Bit). Natürlich muß dieses Prinzip von 2 Shader-Cluster pro TPC bei HPC-Blackwell nicht zwingend gelten, gleichfalls könnte nVidia die Shader-Cluster erneut aufblähen und mehr Fließkomma-, Integer- und Tensor-Einheiten integrieren.
GB100 will have a basic structure like 8*10.
Quelle: Kopite7kimi @ Twitter am 28. September 2023
GB100 8192-bit
Quelle: Kopite7kimi @ Twitter am 28. September 2023
Von YouTuber Moore's Law is Dead kommt der Leak zweier AMD-interner Präsentationsfolien, welche sich mit der Fortentwicklung der "Zen" Prozessoren-Architekturen beschäftigen. So zeigt eine "AMD x86 Core-Roadmap 2020-2024" die geplanten IPC- und Architektur-Verbesserungen für Zen 5 (Kern-Codename "Nirvana", CCD-Codename "Eldora") und Zen 6 (Kern-Codename "Morpheus", CCD-Codename "Monarch"), wärend eine weitere Folie den grundsätzlichen Aufbau eines Zen-5-Kerns wiedergibt. Die Terminangaben der Roadmap sind im übrigen eher schematisch zu sehen, jene sagen nichts zu den Releaseterminen verkaufsfertiger Produkte aus. Sofern nicht gerade aufwendig gefälscht, stammen beide Folien wohl von AMD und sind dort nur für den internen Gebrauch gedacht gewesen. Leider fehlt (bis auf das Jahr "2023") ein Hinweis auf deren (genaues) Alter, sprich ob die hiermit präsentierten Informationen überhaupt noch aktuell sind. Nichtsdestotrotz handelt es sich hierbei um Bestätigungen für einige herumschwirrende Gerüchtefetzen zu Zen 5/6, hinzukommend einige neue Informationen zu diesen zukünftigen Prozessoren-Architekturen von AMD.
Twitterer & Leaker Kopite7kimi hat die kürzlichen fernöstlichen Andeutungen zur Hardware von "Gaming-Blackwell" bestätigt sowie präzisiert: So soll der Consumer-Spitzenchip "GB202" derzeit mit einer Hardware-Konfiguration von 12x8 geplant sein, damit meinend die Anzahl der "Graphics Processing Cluster" (GPC) und 8 "Texture Processing Cluster" (TPC). Dies ergäbe für den gesamten GB202-Chip somit 96 TPCs – und insofern nVidia nichts am langjährigen Schema von "1 TPC = 2 SM" ändert, somit 192 Shader-Cluster insgesamt. Letzteres ist allerdings natürlich noch nicht ganz sicher, wegen des größeren internen Umbaus kann eine Änderung auch an dieser Stelle derzeit noch nicht gänzlich ausgeschlossen werden (ist also unwahrscheinlich, benötigt aber eine klare Bestätigung).
As I mentioned before, GA100 is 8*8, and GH100 is 8*9. GB100 will have a basic structure like 8*10. GB202 looks like 12*8.
Quelle: Kopite7kimi @ Twitter am 28. September 2023
GB100 8192-bit, GB202 512-bit.
Quelle: Kopite7kimi @ Twitter am 28. September 2023
YouTuber RedGamingTech liefert einen Spezifikations-Zwischenstand zur kommenden RDNA4-Generation – bei welcher wie bekannt die beiden Spitzen-Chips gemäß mehreren Quellen gestrichen worden sein sollen. In Folge dessen scheint AMD das Projekt neu ausgerichtet zu haben, so dass nicht die bislang verbliebenen Chips Navi 43 & 44 erhalten werden, sondern es nunmehr Navi 44 & 48 sein sollen. Hierfür rückt der YouTuber mit zwei verschiedenen Konfigurations-Varianten an, welche sich bei Breite des Speicherinterface und Menge des Infinity Caches unterscheiden (nicht aber bei der Anzahl der Shader-Cluster). Die zwei vorhandenen Varianten zeigen nebenbei auch darauf hin, dass diese Information noch nicht wirklich sicher ist, eventuell selbst AMD-intern noch gar nichts final entschieden wurde.
RDNA 4 Possible Config 1:
N48: 32 WGP, 48MB Infinity Cache, 192-bit GDDR7, PCIe Gen 5 x16
N44: 20 WGP, 32MB Infinity Cache, 128-bit GDDR7, PCIe Gen 5 x8
RDNA 4 Possible Config 2:
N48: 32 WGP, 32MB Infinity Cache, 128-bit GDDR7, PCIe Gen 5 x8
N44: 20 WGP, 24MB Infinity Cache, 96-bit GDDR7, PCIe Gen 5 x8
Quelle: RedGamingTech @ YouTube am 27. September 2023
Wie bekannt ist Intels "Meteor Lake" grundsätzlich nur für Notebook-Prozessoren gedacht – inklusive auch jener Desktop-Geräte, wo man üblicherweise Mobile-Prozessoren einsetzt (AiOs und Mini-PCs). Eine regelrechte Desktop-Ausführung (sprich gesockelte Modelle) ist hingegen wohl nicht geplant, resultierend aus dem Umstand, dass Meteor Lake hierfür die großen Dies fehlen, welche die ausreichende Anzahl an CPU-Kernen bieten. Bei "Alder Lake" und "Raptor Lake" hat Intel für denselben Bedarf an CPU-Kernen folgende Dies angesetzt: Ein großes Raptor-Lake-Die mit 8C+16E samt kleiner iGPU sowie ein mittelgroßes Alder-Lake-Die mit 6C+8E samt großer iGPU (nebst eventuell weiteren, noch kleineren Dies). Bei Meteor Lake wurde hingegen jenes große Die gestrichen und gibt es maximal das mittelgroße Die – welches wie gesagt auf 6 Performance- und 8 Effizienz-Kerne limitiert ist.
|
Laut der DigiTimes (maschinelle Übersetzung ins Deutsche) hat sich nVidia auf TSMCs 3nm-Node für "HPC-Backwell" aka den GB100-Chip festgelegt und sogar schon entsprechende Lieferverträge unterschrieben. Allerdings wurde dies von der Gerüchteküche bereits derart vorhergesagt und kommt somit kaum überraschend – nVidia braucht nun einmal für seine HPC-Beschleuniger immer die beste verfügbare Fertigung. Noch unsicher ist in diesem Zusammenhang nur der Punkt, welchen Sub-Node nVidia hierfür benutzt: N3 und N3E stehen zweifelsfrei zur Verfügung, während die (aus Performance-Sicht) eher interessanten Sub-Nodes N3P und N3X laut TSMC-Roadmap allerdings erst 2025 verfügbar werden sollen.
Design | Chips | Fertigung | Release | |
---|---|---|---|---|
"HPC-Blackwell" | Multi-Chip (MCM) | GB102, GB100 (vermtl. 2x GB102) | 3nm TSMC | Ende 2024 |
"Gaming-Blackwell" | monolithisch | GB207, GB206, GB205, GB203, GB202 | vermtl. 3nm TSMC | H1/2025 |
Hinweis: Angaben zu noch nicht offiziell vorgestellter Hardware basierend auf Gerüchten & Annahmen |
Im weiteren Verlauf der jüngst thematisierten Diskussionsrunde der Digital Foundry @ YouTube hat nVidias Bryan Catanzaro (Vice President Applied Deep Learning Research) nochmals klarer gemacht, dass man bei allen Aktivitäten, um Pixel zukünftig effektiver und Rohpower-schonender zu rendern, DLSS einen gewichtigen Anteil nehmen wird – in dem bis zu einem (derzeit hypothetischen) DLSS 10 mit kompletten neuralen Rendering-System gedacht wurde. Natürlich wird nVidia auch jede andere Möglichkeit nutzen, um effizient zu rendern, keine Frage. Doch mit der Verbesserung der herkömmlichen Rendering-Pipeline beschäftigen sich die Grafikchip-Entwickler schon seit mehreren Dekaden, ergo sind an dieser Stelle große Sprünge inzwischen eher unwahrscheinlich. Ein vergleichsweise neuer Ansatz wie DLSS bzw. Upscaler im allgemeinen hat da durchaus größere Chancen, genau diese größeren Sprünge auch zukünftig noch bieten zu können.
I do think that let's say DLSS 10 in the far, far future is going to be a completely neural rendering system that interfaces with a game engine in different ways, and because of that, it's going to be more immersive and more beautiful.
Quelle: nVidias Bryan Catanzaro in einer Gesprächsrunde der Digital Foundry @ YouTube, veröffentlicht am 19. September 2023
Die PC Games Hardware weist auf bemerkenswerte nVidia-Aussagen zur zukünftigen Technologie-Ausrichtung hin, welche im Rahmen einer Diskussionsrunde der Digital Foundry @ YouTube gefallen sind. Danach sieht nVidia die Verbesserung der Rohpower nicht mehr als beste Lösung zugunsten einer höheren Grafikqualität an, da "Moore's Law" nicht mehr funktionieren würde. Vielmehr wären laut nVidia verbesserte Upscaler wie DLSS 3.5 ein einfacherer Weg zu höherer Grafikqualität. Dies spielt zum einen auf die mit DLSS 3/3.5 erreichte Grafikqualität an, den Hauptteil liefert hier aber natürlich die Performance-Verbesserung von DLSS, welche die Darstellung dieser Grafikqualität zu spielbaren Frameraten überhaupt erst ermöglicht. Ohne DLSS ist diese Grafikqualität zwar auch schon da, doch die ohne DLSS erreichbaren Frameraten sind oftmals zu niedrig für einen sinnvollen praktischen Einsatz.
If you really internalize the idea that Moore's Law is dead then you fundamentally realize that you have to be more intelligent about the graphics rendering process.
At the same time that traditional ways have just turn the crank to make graphics bigger, they don't work anymore, we have new opportunities to be smarter about how we do graphics and you can look at ray reconstruction as an example.
Quelle: nVidias Bryan Catanzaro in einer Gesprächsrunde der Digital Foundry @ YouTube, veröffentlicht am 19. September 2023
In einem Video-Interview mit PCWorld (via VideoCardz) verspricht Intel nun doch wieder explizit Meteor Lake für Desktop-Bedürfnisse – und zwar nächstes Jahr. Dabei stellt man sogar die Behauptung auf, dass Meteor Lake ebenfalls eine Generation für alle Anwendungs-Zwecke sowie "bottom-to-top" wäre. Zumindest letzteres ist allerdings Nonsens, sofern Intel nicht nachträglich noch ein MTL-Die mit mehr CPU-Kernen auflegen sollte. Denn die Desktop-Leistungsspitze läßt sich mit dem aktuellen 6P+8E-Die von Meteor Lake zweifelsfrei nicht erklimmen. Das nachträgliche Auflegen eines größeren MTL-Dies macht jedoch keinen größeren Sinn, denn Ende 2024 steht mit "Arrow Lake" bereits die planmäßige Ablösung an. Intel hatte in der Vergangenheit sicherlich Fälle, wo man mal weniger als 12 Monate Differenz zwischen zwei Desktop-Generationen hatte – aber noch nie den Fall, innerhalb von 12 Monaten gleich drei Desktop-Generationen herauszubringen.
PCWorld: Let me ask you, is there gonna be a Meteor Lake desktop?
Intel: Desktop will come in 2024.
PCWorld: So you are confirming Meteor Lake desktop?
Intel: Yes.
PCWorld: Whether or not you guys are returning to an era where there is gonna be a processor family for mobile and a seprate processor family for desktop but doesn’t sound like that’s the case.
Intel: That is not the case. I want one processor family top to bottom for both segments, doesn’t everybody?
Quelle: Interview mit Intels Michelle Johnston Holthaus mit PCWorld @ YouTube, veröffentlicht am 23. September 2023
Mit der Umfrage der letzten Woche wurde nach dem Ersteindruck zur Radeon RX 7800 XT gefragt, der größeren der beiden neuen Navi-32-Grafikkarten. Die Karte erhielt mit 41,5% positiver Ersteindruck zu 44,6% durchschnittlichem Ersteindruck samt 13,9% negativem Ersteindruck eine mittelprächtige Bewertung – welche sich allerdings dadurch optisch verbessert, als dass die Radeon RX 7800 XT damit klar besser herauskommt als fast alle anderen Grafikkarten der aktuellen Ada/RDNA3-Generation. Nur die GeForce RTX 4090 (40,6% positiv) kaum auf ein ähnlich gutes Ergebnis, die anderen Ada/RDNA3-Grafikkarten erreichten hingegen größtenteils deutlich niedrigere Bewertungen.