10

Gerüchteküche: Denkbare Hardware-Gestaltungen von "Gaming-Blackwell"

Kopite7kimi hat kürzlich die interessante Bemerkung getätigt, wonach nVidias GB203-Chip – der zweitbeste Chip des Portfolios von "Gaming-Blackwell" – eventuell nur 6 Raster-Engines (GPC) trägt. Die Bemerkung ist wohl noch kein Leak, dürfte aber auch nicht gänzlich grundlos gefallen sein. Dabei ist dies kein großer Unterschied zum aktuellen AD103-Chip (7 GPC), zudem tariert gerade nVidia das Verhältnis zwischen Raster-Engines und Shader-Cluster (SM) in jeder Grafikchip-Generation immer wieder neu aus. Aber es deutet eventuell auf die Anzahl der Shader-Cluster jenes GB203-Chips hin: Jener könnte (im Ada-Lovelace-Schema) mit 12 SM per GPC auf 72 Shader-Cluster kommen, was angesichts des AD103-Chips mit 80 Shader-Clustern jedoch unwahrscheinlich ist. Passendere Auflösungen wären vielmehr 16 SM per GPC = 96 Shader-Cluster oder 20 SM per GPC = 120 Shader-Cluster. Die mittlere Auflösung würde dabei dem technischen Ansatz des GB202-Chips entsprechen (16 SM per GPC).

I am just thinking that GB203 may only have 6 GPCs.
Quelle:  Kopite7kimi @ Twitter am 6. März 2024

Setzt man die drei denkbaren Modelle auf alle Grafikchips des Blackwell-Portfolios an, ergibt sich, dass 12 SM per GPC generell nicht passen dürfte, da teilweise kleine Grafikchips ergebend als bereits mit der Ada-Lovelace-Generation vorhanden. 16 SM per GPC hat demnach die größten Chancen, 20 SM per GPC gewisse Außenseiter-Chancen. Denkbar ist auch ein Mix beider letztgenannten Modelle, auch bei "Ada Lovelace" ist der Ansatz von 12 SM per GPC schließlich nicht durchgehend (mit der Ausnahme des AD107-Chips). Die mittlere Variante könnte zudem eine Erklärung dafür liefern, wieso der GB205-Chip als "GB205" und nicht als "GB204" läuft: Bei 16 SM per GPC ist jeder der Blackwell-Chips beachtbar größer als der jeweilige Ada-Lovelace-Vorgänger, allein beim GB205 wäre dies mit 64 Shader-Clustern nur ein kleiner (nomineller) Fortschritt gegenüber den 60 Shader-Clustern des AD104-Chips.

GPC 12 SM per GPC 16 SM per GPC 20 SM per GPC Ada-Vorgänger
GB202 angbl. 12 - angbl. 192 SM - AD102: 12 GPC, 144 SM
GB203 angbl. 6 72 SM 96 SM 120 SM AD103: 7 GPC, 80 SM
GB205 möglw. 4 48 SM 64 SM 80 SM AD104: 5 GPC, 60 SM
GB206 möglw. 3 36 SM 48 SM 60 SM AD106: 3 GPC, 36 SM
GB207 möglw. 2 24 SM 32 SM 40 SM AD107: 3 GPC, 24 SM
Hinweis: spekulative Annahmen, kein Leak

Die mittlere Variante würde natürlich dennoch nur einen mittleren Hardware-Sprung ergeben, mit zudem einem auffallenden Ungleichgewicht an der Leistungsspitze: Der GB202-Chip wäre somit glatt doppelt so mächtig wie der GB203-Chip. Unter regulären Umständen wäre dies arg unwahrscheinlich, aber da nVidia mit der GeForce RTX 50 Serie mangels Konkurrenz an der Leistungsspitze nicht weiter springen muß, könnte dies durchaus so passieren. Es würde zudem die Tendenz nVidias unterstützen, den größten Grafikchip speziell im Gaming-Segment eher nur verhalten einzusetzen, lieber mehr mit den kleineren Chips darunter zu arbeiten (weil der größte Chip auch zu viel höheren Preisen im Profi-Segment absetzbar ist). Natürlich ist dieses herauskommende Bild der kleineren Blackwell-Chips nur ein potentielles Bild, Gewißheiten lassen sich aus diesen Überlegungen nicht ableiten.

Raster-Engines Shader-Cluster Speicherinterface Ada-Vorgänger
GB202 angbl. 12 angbl. 192 angbl. 384 Bit AD102: 12 GPC, 144 SM, 384 Bit
GB203 angbl. 6 96 oder 120 whrschl. 256 Bit AD103: 7 GPC, 80 SM, 256 Bit
GB205 möglw. 4 64 oder 80 whrschl. 192 Bit AD104: 5 GPC, 60 SM, 192 Bit
GB206 möglw. 3 48 oder 60 128 oder 192 Bit AD106: 3 GPC, 36 SM, 128 Bit
GB207 möglw. 2 32 oder 40 96 oder 128 Bit AD107: 3 GPC, 24 SM, 128 Bit
Hinweis: spekulative Annahmen, kein Leak

Dabei darf man davon ausgehen, dass nVidia intern die finale Design-Zielsetzung (Festlegung der zum Tape-Out zu bringenden Hardware-Konfiguration) zum GB202-Chip längst beschlossen hat, immerhin naht der anzunehmende Tape-Out in diesem Frühling. Bei den kleineren Grafikchips von "Gaming-Blackwell" hat nVidia etwas mehr Zeit, je nachdem von deren Release-Plan: Kommt ein Teil der kleineren Blackwell-Chips noch nahe des Jahreswechsels 2024/25 heraus, sollte deren Tape-Out grob zur Jahresmitte 2024 stattfinden müssen. Findet der Release von GB2023 & Co. hingegen erst später im Jahr 2025 statt, kann sich nVidia mehr Zeit lassen. In jedem Fall ist die Design-Zielsetzung von GB203 bis GB207 somit wohl noch nicht final. Jener Schritt ist allerdings demnächst zu erwarten und dürfte auch in einem Rutsch passieren, unabhängig des Tape-Out der kleinsten Chips: Denn natürlich muß das Chip-Portfolio insgesamt stimmig sein, womit sich nach der Festlegung der Hardware-Daten zu den größeren Chips die Hardware-Daten zu den kleineren Chips oftmals fast von selbst ergeben.