13

Gerüchteküche: Weitere GB203- & GB205-Leaks lassen die Hardware-Daten zu "Gaming-Blackwell" nahezu komplett erkennen

Leaker Kopite7kimi hat die bislang getroffene Annahme bestätigt, dass der GB203-Chip der "Blackwell"-Generation über ein 256-Bit-Speicherinterface verfügt, welches somit gleichlautend zum AD103-Chip der Ada-Lovelace-Generation liegt. Damit würde der GB203-Chip wie gesagt in allen Kern-Punkten wie Raster-Engines, Shader-Cluster und Speicherinterface eine glatte Halbierung des GB202-Chips darstellen – was erneut Vermutungen aufkommen lassen hat, dass es sich bei "GB202" um ein MultiChip-Konstrukt (aus zweimal GB203) handeln könnte. Sicher kann diese Frage derzeit nicht beantwortet werden, aber der Leaker selber vermutet wie schon erwähnt derzeit noch kein "MCM" im Consumer-Bereich – während hingegen der GB100-Chip für HPC/AI-Bedürfnisse schlicht aus zwei GB102-Chips bestehen soll.

GB203 is 256-bit and GB205 is 192-bit.
Quelle:  Kopite7kimi @ Twitter am 12. März 2024

Zugleich gab es hiermit und zuzüglich eines weiteren Tweets erste Hardware-Daten zum GB205-Chip der "Blackwell"-Generation, welcher den inoffiziellen Nachfolger des AD104-Chips gibt, nachdem es keinen "GB204"-Chip geben soll. So bestätigte der Leaker erst einmal ein 192-Bit-Speicherinterface bei GB205 – was man sich schon denken konnte, aber dennoch bislang in der Schwebe war. Zudem geht der Leaker von einer Hardware-Anordnung á "4x8" aus, was als 4 Raster-Engines (GPC) mal 8 Texturencluster (TPC) zu lesen ist und somit üblicherweise 64 Shader-Cluster ergeben sollte (da bislang immer eine TPC aus 2 SM besteht). Letztere Aussage ist dann allerdings noch kein Leak, sondern eben nur eine Vermutung seitens Kopite7kimi – welche sicherlich naheliegt, aber dennoch einer Bestätigung bedarf.

gb205 6*8 config?
Quelle:  Nibosshi @ Twitter am 12. März 2024
 
i meant 4*8
Quelle:  Nibosshi @ Twitter am 12. März 2024
 
Very possible.
Quelle:  Kopite7kimi @ Twitter am 12. März 2024

Das ganze entspricht allerdings durchaus dem sich inzwischen herauskristallierenden Ansatz von "Gaming-Blackwell", unterhalb des Spitzen-Chips mit eher weniger Raster-Engines und zudem generell einer höheren Anzahl an Shader-Clustern per Raster-Engine zu arbeiten: Bei "Ada Lovelace" sind es gewöhnlich 12 Shader-Cluster pro Raster-Engine, bei "Blackwell" geht dies augenscheinlich auf 16 Shader-Cluster pro Raster-Engine hinauf. Damit bestätigen sich inzwischen einige der zuletzt getroffenen Annahmen zur Hardware des Chip-Portfolios von "Gaming-Blackwell". Vergleichsweise sicher lassen sich somit bereits die Hardware der Blackwell-Chips GB202, GB203 und GB205 beschreiben – wonach sich die beiden restlichen Chips GB206 und GB207 (mit etwas Spielraum) vernünftig ableiten lassen.

Die ganz große Sicherheit existiert hier natürlich noch nicht, nVidia könnte sich sogar auf den letzten Metern bei allen Chips unterhalb GB202 noch umentscheiden. Diese Möglichkeit ist schlicht nicht auszuschließen, da das Design-Ende der kleineren Blackwell-Chips (unterhalb GB202) wohl erst im Sommer erreicht ist. Aber natürlich reduzieren sich mit dem Näherkommen dieses Termins die Chancen, dass nVidia an seiner Design-Zielsetzung noch einmal etwas ändert. Nimmt man die derzeit kolportierten bzw. daraus ableitbaren Hardware-Daten für den Augenblick als korrekt an, sieht es ganz nach einem sehr maßvollen Sprung bei der nominellen Hardware aus, gerade im mittleren Bereich. Denn bei den dort auflaufenden Chips gibt es jeweils das gleiche Speicherinterface und dann nur +20% bzw. +7% mehr Shader-Cluster.

Raster-Engines Shader-Cluster Speicherinterface max. Speicher Ada-Vorgänger SM vs Vorg.
GB202 angbl. 12 angbl. 192 angbl. 512 Bit 32 GB AD102: 12 GPC, 144 SM, 384 Bit, 24 GB GDDR6X +33%
GB203 angbl. 6 angbl. 96 angbl. 256 Bit 16 GB AD103: 7 GPC, 80 SM, 256 Bit, 16 GB GDDR6X +20%
GB205 whrschl. 4 whrschl. 64 angbl. 192 Bit 12 GB AD104: 5 GPC, 60 SM, 192 Bit, 12 GB GDDR6X +7%
GB206 whrschl. 3 möglw. 42 oder 48 whrschl. 128 Bit 8/16 GB AD106: 3 GPC, 36 SM, 128 Bit, 8 GB GDDR6 +17/33%
GB207 whrschl. 2 möglw. 28 oder 32 96 oder 128 Bit 6-16 GB AD107: 3 GPC, 24 SM, 128 Bit, 8 GB GDDR6 +17/33%
Hinweis: Angaben zu noch nicht offiziell vorgestellter Hardware basieren auf Gerüchten & Annahmen ... "max. Speicher" bezogen auf 2GByte-Chips

Selbst der GB202-Chip ist mit +33% Shader-Clustern nicht übermäßig stark angelegt, gerade wenn unsicher bleibt, ob das große 512-Bit-Speicherinterface im Gaming-Bereich überhaupt ausgefahren wird. Selbst wenn die kleineren Blackwell-Chips GB206 & GB207 mit dem größeren der beiden denkbaren Hardware-Sprünge antreten (und somit ebenfalls jeweils +33% mehr Shader-Cluster aufweisen), sieht der Hardware-Ansatz der Blackwell-Generation in der Summe doch eher mager aus. Man muß hier regelrecht darauf hoffen, dass es ordentlich Mehrtakt gibt sowie dass nVidia auch noch einen gutklassigen IPC-Zuwachs durch interne Architektur-Verbesserungen erreichen kann. Ansonsten kann da eine sehr schwache Grafikkarten-Generation drohen – und mehr als ein mittelmäßiger Performance-Gewinn ist auf Basis dieser Hardware-Ansetzung sowieso nicht zu erwarten.

Natürlich ist klar, dass nVidia letztlich nicht mehr bieten muß. Von AMD & Intel ist Gegenwehr nur bis zum Midrange-Segment zu erwarten, schon eine denkbarerweise GB203-basierte "GeForce RTX 5080" wäre für die Gegenangebote aus RDNA4-Generation sowie Battlemage-Generation nicht zu erreichen. Zugleich sieht nVidia auch anhand der Radeon RX 7800 XT, dass selbst eine gut aufgenommene AMD-Grafikkarte, welche sich zumindest in Deutschland prächtig verkauft, nichts an den weltweiten Marktanteilen ändert. In einer solchen Situation dürfte für nVidia der Gedanke durchaus naheliegen, lieber nicht all zu viel oben drauf zu legen, sondern mit "optimierter" Kostenlage zu arbeiten – sprich die Grafikchips möglichst klein zu gestalten und nicht mehr VRAM mitzugeben.

Denkbarerweise kommen die 3GByte-Speicherchips von Micron somit erst bei einem möglichen Refresh der GeForce RTX 50 Serie zum Einsatz, zumindest für den Einsatz beim initialen RTX50-Portfolio sollen die Chancen schlecht stehen. 50% mehr Speicher wären ein schöner Midlife-Kicker und bringen nVidia sogar in die Lage, vielleicht nicht einmal besonders viel mehr Hardware-Einheiten für diese Refresh-Generation freischalten zu müssen. Das Augenmerk von nVidia bei "Gaming-Blackwell" dürfte generell auf der Kostenlage liegen, gerade da die 3nm-Fertigung teuer und (noch) nicht für gute Yield-Raten bekannt ist. Denkbarerweise sieht das initiale RTX50-Portfolio somit gar keine Grafikkarten im Vollausbau des zugrundeliegenden Grafikchips, was dann nachfolgend mit der Refresh-Generation realisiert werden könnte. Aber dies ist wohl zu weit in die Zukunft gedacht, denn derzeit steht selbst bei nVidia noch nicht einmal die Produkt-Gestaltung zur GeForce RTX 50 Serie an – sondern zuerst das Designende sowie die Tape-Outs der zugrundeliegenden GB20x-Chipserie.