3

News des 2./3. März 2024

VideoCardz weisen auf Aussagen seitens Dell hin, welche im Rahmen ihres jüngsten Geschäftsberichts eine "B200" HPC/AI-Lösung auf augenscheinlicher "Blackwell"-Basis nächstes Jahr erwarten. Jene sieht Dell mit Wattagen von bis zu 1000 Watt, nachdem H100 derzeit bis 700W erreicht. Dies ergibt zudem ganz automatisch ein Erscheinen von "B100" (ebenfalls seitens Dell genannt) bereits in diesem Jahr – was allerdings wohl auch die reguläre Planung nVidias darstellt. Eine "B200"-Lösung kann derzeit wie die aktuelle H200-Lösung eingeordnet werden – als Refresh auf Basis eines bestehenden Chips (H100 & H200 = GH100, B100 & B200 = GB100), zumindest aber in jedem Fall noch keiner neuen Architektur zugehörig. Dies beißt sich natürlich etwas mit einer früheren HPC/AI-Roadmap von nVidia, welche gemäß der Namenswahl eher eine ganz neue HPC/AI-Architektur für das Jahr 2025 erwarten ließ:

Wirklich sicher war diese Auslegung jedoch nicht, da nVidia dies zum einen nie bestätigt hat und zum anderen augenscheinliche Platzhalter-Codenamen (X100, X40, GX200) keine wirkliche Verbindlichkeit entwickeln können. Jene sollen im eigentlichen nur ein für den jeweiligen Zeitpunkt avisiertes Produkt andeuten, ansonsten aber möglichst wenig über selbiges preisgeben. Dass es nVidia in seiner Roadmap dabei mit den Codenamen nicht so genau genommen hat bzw. nicht bedachte, was man in jene hinein interpretieren würde, ist nur zu verständlich. In jedem Fall ist diese Dell-Aussage somit ein beachtbarer Hinweis darauf, dass nVidia mitnichten zu einer einjährigen Architektur-Kadenz wechselt. Sicher ist diesbezüglich natürlich noch gar nichts, hierzu bräuchte man dann schon klarere Infos. Mit nVidias Roadmap im Gaming-Bereich hat diese HPC/AI-Roadmap hingegen kaum etwas zu tun.

Derweil wird im 3DCenter-Forum schon intensiv über nVidia "Blackwell" diskutiert, dies natürlich eher aus Sicht der zu erwartenden Gaming-Lösungen, welche allesamt Chips der Namensklasse "GB2xx" verwenden werden (und somit nichts mit GB100 für den HPC/AI-Einsatz zu tun haben werden). Beachtenswerte Postings hierzu sind No.1, No.2, No.3 und No.4, wobei derzeit alles ganz natürlich noch im Feld der Spekulationen liegt, da der Blackwell-Tapeout derzeit noch nicht vonstatten gegangen sein dürfte. Für ein Release des initialen GB202-Chip noch zum Jahresende 2024 muß nVidia kaum vor dem Frühling 2024 den Tape-Out vornehmen, die kleineren Blackwell-Chips bräuchten eventuell sogar erst im Laufe des dritten Quartals nachfolgen. nVidia benötigt erfahrungsgemäß nur ca. 6-9 Monate zwischen Tape-Out und Marktstart, bei den kleineren Chips wird dies auf Basis der dann bereits gemachten Erfahrungen mit den größeren Chips tendentiell weniger sein.

Damit befindet sich nVidia derzeit anzunehmenderweise kurz vor dem Tape-Out von Gaming-Blackwell, faktisch am Designende – und dies bedeutet, dass die finale Design-Zielsetzung schon längst getroffen wurde. Dies gilt zumindest für GB202, bei den kleineren Blackwell-Chips wäre auch eine Verzögerung bis kurz vor Ultimo denkbar. Allerdings wird zwischen finaler Design-Zielsetzung und echtem Designende immer auch noch etwas Zeit benötigt, selbst wenn die Chip-Entwickler mit modularen Bauteilgruppen arbeiten und somit recht fix aus existierenden Architektur-Vorlagen neue Chips am Reißbrett kreieren können. Danach muß das ganze jedoch immer noch Tape-Out-fähig gemacht werden, ein paar finale Simulationen zur Bestätigung des Erreichens der Design-Zielsetzung dürften auch noch dazugehören. Lange Rede, kurzer Sinn: Für GB202 stehen die Hardware-Details nVidia-intern schon sicher fest, für die kleineren Chips ergibt sich eine gute Chance darauf, anderenfalls dürfte dies in den nächsten Wochen passieren.

Denkbarerweise ergeben sich dann auch die entsprechenden Leaks speziell zu den kleineren Blackwell-Chips, da zum GB202 dessen Hardware-Gestaltung eigentlich bereits bekannt ist. Zu den anderen Blackwell-Chips ist die (belastbare) Gerüchteküche hingegen auffallend ruhig, nachdem es beispielsweise bei der Ampere-Generation gelungen war, die komplette Konfiguration aller Ampere-Chips bereits im Mai 2019 (und somit fast anderthalb Jahre vor Release) korrekt vorherzusagen. Derart frühe Leaks sind aber eher die Ausnahme von der Regel, bei der Ada-Lovelace-Generation gab es derart komplette (wie korrekte) Chip-Informationen erst im März desselben Jahres – somit 7 Monate vor dem Startschuß jener Generation mit der GeForce RTX 4090. Sicherlich ist die Zeit somit langsam ran, zu welcher ein ähnlicher Leak zur (vollständigen) Hardware-Gestaltung von Gaming-Blackwell zu erwarten wäre.

Der TechSpot hat sich angesehen, wie AMDs Zen 3-Prozessoren im Spiele-Einsatz auf ihre unterschiedlichen Cache-Größen reagieren: Von den regulären Varianten mit 16 und 32 MB Level3-Cache bis zu den X3D-Modellen mit gleich 96 MB Level3-Cache. Hierbei ergab sich eine erstaunlich eindeutige Bevorzugung von mehr Cache, selbst wenn gewisse Taktraten- und TDP-Differenzen hierbei auch mit am Start waren. Vor allem aber zeigte sich kaum eine beachtbare Differenz zwischen 6- und 8-Kernern, die Performance hing maßgeblich vom Level3-Cache und nicht an der Menge an CPU-Kernen ab. Natürlich dürfte sich dies unterhalb von 6-Kernern ändern, aber ab diesem Niveau spielen dann eben andere Faktoren eine Rolle. Nach wie vor sind 6 CPU-Kerne für Spiele im allgemeinen somit der Goldstandard – abseits von Ausnahmen unter einzelnen Spiele-Titeln.

1% low fps 16 MB L3 32 MB L3 96 MB L3
AMD Zen 3 8-Kerner 72 fps 87 fps 109 fps
AMD Zen 3 6-Kerner 71 fps 87 fps 105 fps
gemäß den Benchmarks von TechSpot im Schnitt von 12 Spiele-Titeln unter FullHD/1080p