11

Gerüchteküche: Die Hardware-Daten der Consumer-Chips von nVidias "Blackwell"

Leaker Kopite7kimi @ X hat nun endlich die grundsätzlichen Hardware-Daten der Consumer-Chips von nVidias "Blackwell"-Generation bekanntgegeben, denkbarerweise basierend auf finalen Informationen beispielsweise nach den ersten abgeschlossenen Tape-Outs. Die Gerüchteküche hatte sich vorab zwar schon im Fall der beiden größeren Chips an den aktuellen Stand herangerobbt, musste dafür aber dennoch den einen oder anderen Irrweg nehmen – was nunmehr hoffentlich vorbei ist. Gegenüber dem letzten Stand ändert sich nur etwas dort, wo noch keine Gerüchtedaten vorlagen und man sich daher mit Annahmen weiterhelfen musste. Jene Annahmen lagen beim GB206-Chip richtig, bei den GB205- und GB207-Chip hingegen falsch: Insbesondere die GB205-Hardware ist nochmals etwas kleiner als bislang angenommen, womit sich nunmehr zumindest eine solide Erklärung der Namenswahl ergibt.

GB202  12*8  512-bit GDDR7
GB203  7*6  256-bit GDDR7
GB205  5*5  192-bit GDDR7
GB206  3*6  128-bit GDDR7
GB207  2*5  128-bit GDDR6

Quelle:  Kopite7kimi @ X am 11. Juni 2024

Zu lesen sind diese Daten im Sinne von "GPC x TPC", sprich Raster-Engines mal Texturen-Cluster. Da jeder Texturen-Cluster bei nVidia traditionell zwei Shader-Cluster enthält, ergeben sich beispielsweise aus den Daten des GB202-Chip somit 12 Raster-Engines mit je 8 Texturen-Cluster und 16 Shader-Cluster, ergo 192 Shader-Cluster insgesamt. Nicht irritieren lassen muß man sich im übrigen von der Angabe "GDDR6" beim GB207-Chip: Laut Nachfrage soll der Grafikchip selber nicht an diese Speichersorte gebunden sein, kann also denkbarerweise auch GDDR7 unterstützen. Möglicherweise nutzt nVidia diese Möglichkeit schlicht nur nicht bei den anfänglichen Desktop-Modellen aus. Ein anderer Hinweis auf die GDDR7-Fähigkeit von GB207 kommt von der kürzlichen Clevo-nVidia-Roadmap: Da dort die Grafikchip-Codenamen jedoch nicht explizit genannt wurden und die Roadmap zudem einigermaßen alt ist, ergibt sich daraus noch keine erschöpfende Gewißheit.

GB207 is limited to GDDR6?
Quelle:  MEGAsizeGPU @ X am 11. Juni 2024
 
Probably not.
Quelle:  Kopite7kimi @ X am 11. Juni 2024

In der Summe der Dinge tritt somit der GB202-Chip wie erwartet mit einigermaßen stärkerer Hardware an, der GB203-Chip wie auf seinen zuletzt heruntergestuften Spezifikationen, der GB205-Chip deutlich kleiner als erwartet und vor allem kleiner als der AD104-Chip, der GB206-Chip nur auf dem Niveau von dessen Ada-Lovelace-Vorgänger und der GB207-Chip dann sogar noch leicht unterhalb des Niveaus seines Ada-Lovelace-Vorgängers. Außerhalb des GB202 ist das Chip-Portfolio von "Gaming-Blackwell" somit eher ein Trauerspiel: 1x gibt es dieselbe Hardware wie bei "Ada Lovelace", 1x nur minimal mehr (aber auch nur begünstig durch einen Fehler im AD103-Design, welcher bei GB203 dann behoben ist) und 2x sogar beachtbar weniger Hardware als in der Vorgänger-Generation. Selbstverständlich ist die Anzahl der Recheneinheiten (bei weitem) nicht alles, aber mit einem derart schwachen Hardware-Sprung ist nVidia eigentlich noch nie angetreten.

Chip Raster-Engines Shader-Cluster Speicherinterface max. Speicher Ada-Vorgänger SM vs Vorg.
GB202 angeblich 12 angeblich 192 angeblich 512 Bit GDDR7 32 GB AD102: 12 GPC, 144 SM, 384 Bit, 24 GB GDDR6X +33%
GB203 angeblich 7 angeblich 84 256 Bit GDDR7 16 GB AD103: 7 GPC, 80 SM, 256 Bit, 16 GB GDDR6X +5%
GB205 angeblich 5 angeblich 50 192 Bit GDDR7 12 GB AD104: 5 GPC, 60 SM, 192 Bit, 12 GB GDDR6X –17%
GB206 angeblich 3 angeblich 36 128 Bit GDDR7 8/16 GB AD106: 3 GPC, 36 SM, 128 Bit, 8 GB GDDR6 ±0
GB207 angeblich 2 angeblich 20 128 Bit GDDR7 8/16 GB AD107: 3 GPC, 24 SM, 128 Bit, 8 GB GDDR6 –17%
Hinweis: Angaben zu noch nicht offiziell vorgestellter Hardware basieren auf Gerüchten & Annahmen ... "max. Speicher" bezogen auf 2GByte-Chips

Vor allem überrascht dabei das Ungleichgewicht des Hardware-Sprungs innerhalb jenes Blackwell-Portfolios: Bei den vier kleineren Grafikchips ändert sich nichts oder wird es weniger, beim Spitzen-Chip gibt nVidia dann allerdings doch ein Drittel mehr Shader-Cluster sowie ein größeres Speicherinterface hinzu. Letzteres wäre eigentlich nicht notwendig, wenn nVidia angenommenerweise einen riesigen Sprung bei IPC und/oder Taktraten erreicht hätte. Die Existenz jenes Hardware-Sprungs beim GB202-Chip deutet somit eher nicht darauf hin, dass nVidia hier einen besonders großen IPC-Sprung hinlegt, bei den Taktraten ist dies auf Basis der 4nm-Fertigung schon per se nicht zu erwarten. Damit kommt der GB202-Chip in einer frühen Performance-Prognose zwischen mittelprächtig und gutklassig heraus, alle kleineren Blackwell-Grafikchips hingegen zwischen schwach bis bestenfalls unterdurchschnittlich.

Um hieraus dennoch ein griffiges Grafikkarten-Angebot (mit echter Mehrperformance auf allen Positionen) zu machen, müsste nVidia wahrscheinlich zum Mittel des Hochsetzens der Grafikchips innerhalb des Portfolio-Aufbaus greifen. Sprich, unterhalb der GeForce RTX 5090 müssten alle weiteren RTX50-Modelle die gegenüber dem Ada-Lovelace-Vorgänger jeweils um eine Stufe verbesserte Grafikchip-Ausführungen erhalten – so die GeForce RTX 5080 nicht auf dem zweitbesten Grafikchip, sondern einer Salvage-Variante des stärksten Chips basieren. Hiermit würde nVidia auch die Problematik eines VRAM-Stillstands ersticken, da es dann wenigstens ab der GeForce RTX 5060 Ti jeweils mehr Speicher sowie wenigstens ab 12 GB VRAM geben würde. Ob nVidia ein solches "inspirierendes" Blackwell-Portfolio auflegt, ist derzeit natürlich rein spekulativ. Allerdings dürfte man die grundsätzliche Richtung wohl schon vergleichsweise früh erkennen können: Kommt die GeForce RTX 5080 auf Basis des GB203-Chips, geht es in Richtung des konventionellen Portfolios. Ist die Chip-Basis hingegen der GB202, steht alles zugunsten des "inspirierenden" Portfolios.

(initiales) Ada-Lovelace-Portfolio konventionelles Blackwell-Portfolio "inspirierendes" Blackwell-Portfolio
GeForce RTX 4090
AD102, 128 SM @ 384 Bit, 24 GB GDDR6X
GeForce RTX 5090
GB202, 150-170 SM @ 448 Bit, 28 GB GDDR7
GeForce RTX 5090
GB202, 160-170 SM @ 448 Bit, 28 GB GDDR7
GeForce RTX 4080
AD103, 76 SM @ 256 Bit, 16 GB GDDR6X
GeForce RTX 5080
GB203, ~80 SM @ 256 Bit, 16 GB GDDR7
GeForce RTX 5080
GB202, ~120-130 SM @ 256/320 Bit, 16-20 GB GDDR7
GeForce RTX 4070 Ti
AD104, 60 SM @ 192 Bit, 12 GB GDDR6X
GeForce RTX 5070 Ti
GB203, ~60 SM @ 192/256 Bit, 12/16 GB GDDR7
GeForce RTX 5070 Ti
GB203, ~80 SM @ 256 Bit, 16 GB GDDR7
GeForce RTX 4070
AD104, 46 SM @ 192 Bit, 12 GB GDDR6X
GeForce RTX 5070
GB205, 48 SM @ 192 Bit, 12 GB GDDR7
GeForce RTX 5070
GB203, ~60 SM @ 192/256 Bit, 12/16 GB GDDR7
GeForce RTX 4060 Ti
AD106, 34 SM @ 128 Bit, 8/16 GB GDDR6
GeForce RTX 5060 Ti
GB206, 34 SM @ 128 Bit, 8/16 GB GDDR7
GeForce RTX 5060 Ti
GB205, 48 SM @ 192 Bit, 12 GB GDDR7
GeForce RTX 4060
AD107, 24 SM @ 128 Bit, 8 GB GDDR6
GeForce RTX 5060
GB207/GB206, 20-24 SM @ 128 Bit, 8 GB GDDR6
GeForce RTX 5060
GB206, 34 SM @ 128 Bit, 8/16 GB GDDR7
Hinweis: rein hypothetischer Aufbau des "Blackwell"-basierten Portfolios an Desktop-Grafikkarten