Twitter & Leaker Kopite7kimi hat seine frühere Aussage zugunsten eines 512-Bit-Speicherinterfaces bei "Gaming-Blackwell" korrigiert – nunmehr sollen es 384 Bit GDDR7 beim GB202-Chip sein. Die frühere Angabe wurde seinerzeit schon bezweifelt, da dies für Consumer-Chips zumindest im Gaming-Bereich einfach zu breit ist, zudem durch die Hinzunahme von GDDR7-Speicher eigentlich bereits ein großer Bandbreiten-Boost zur Verfügung steht. Mittels der klaren Aussage "384 Bit GDDR7" ergibt dies dann alles einen besseren Sinn, denn auf 32 Gbps Datenrate (wie seitens Micron angekündigt) kommt man an einem 384-Bit-Interface auf eine Speicherbandbreite von 1536 GB/sec – was wiederum perfekt zu einem anderen Leak passt, welcher von einer 52%igen Steigerung der Speicherbandbreite gegenüber der GeForce RTX 4090 sprach.
I think I probably made an empirical mistake. I mistakenly applied the ratio of Ada Lovelace's L2 and MC to Blackwell.
Quelle: Kopite7kimi @ Twitter am 15. November 2023
So 384 Bit for GB202?
Quelle: RawMango @ Twitter am 15. November 2023
And GDDR7.
Quelle: Kopite7kimi @ Twitter am 15. November 2023
So gesehen ändert sich mit dieser Spezifikations-Korrektur auch nicht viel, denn es handelt sich nur um einen anderen Weg, um die Ziel-Speicherbandbreite zu erreichen. Die grundsätzlichen Rohdaten zum GB202-Chip zeigen somit nach wie vor eine Steigerung der Rechenleistung um +53% sowie eine Steigerung der Speicherbandbreite um +52% an – bezogen auf den Chip-Vergleich AD102 vs GB202. Insofern man es auf die GeForce RTX 4090 als derzeit stärkste AD102-Ausführung des Gaming-Segments beziehen will, käme der GB202-Chip im Vollausbau auf +73% Rechenleistung sowie +52% Speicherbandbreite – wobei nicht dafür garantiert werden kann, dass es einen GB202 im Vollausbau jemals zu kaufen gibt. Diese Rohdaten sind natürlich vor etwaigen Architektur-Änderungen, welche über eine bessere Auslastung der Recheneinheiten auch noch einiges herausholen können. Dennoch ist davor zu warnen, diese bestenfalls +73% mehr Rechenleistung als Ansatz zur Ermittlung der voraussichtlichen Mehrperformance zu benutzen.
Zwischen GeForce RTX 3090 Ti und 4090 liegen grob +110% mehr Rechenleistung, die real erreichte Mehrperformance liegt dagegen nur bei +55%. Logischerweise ist es Architektur-spezifisch, wie gut die Skalierung jeweils ausfällt, aber bei (bestenfalls) +73% mehr Rechenleistung zwischen GeForce RTX 4090 und GB202-Chip im Vollausbau sind +70% Mehrperformance einfach zu hoch gegriffen. Gemäß der zuletzt erreichten Skalierung wäre jedes Ergebnis oberhalb von +40% Mehrperformance schon gutklassig. Selbst dies könnte allerdings schon schwierig erreichbar sein, wenn nVidia den GB202-Chip ähnlich stark beschnitten wie die GeForce RTX 4090 in den Markt entläßt (–11% Shader-Cluster gegenüber Vollausbau). Das nominelle Potential zwischen den jeweiligen Spitzen-Chips ist zwischen Ada Lovelace und Blackwell in jedem Fall bemerkbar kleiner als zwischen Ampere und Ada Lovelace.
GeForce RTX 4090 | AD102 (Vollausbau) | GB202 (Vollausbau) | Chip-Differenz | |
---|---|---|---|---|
GPCs | 11 | 12 | angeblich 12 | ±0 |
Shader-Cluster | 128 | 144 | angeblich 192 | +33% |
Chip-Takt | nominell 2520 MHz, real ~2.7 GHz | - | angeblich ca. ~2.9 GHz | +15% |
Rechenpower | nominell 83 TFlops, real 88 TFlops | auf RTX4090-Takrate: nominell 93 TFlops, real 100 TFlops | nominell ~143 TFlops | +53% |
ROPs | 176 | 192 | angeblich 384 oder 768 | +100% oder +300% |
Level2-Cache | 72 MB | 96 MB | angeblich 128 MB | +33% |
Speicherinterface | 384 Bit GDDR6X | 384 Bit GDDR6X | angeblich 384 Bit | ±0 |
Speicherbandbreite | 1008 GB/sec (21 Gbps GDDR6X @ 384 Bit) | - | angeblich 1536 GB/sec (whrschl. 32 Gbps GDDR7 @ 384 Bit) | +52% |
Hinweis: Angaben zu noch nicht offiziell vorgestellter Hardware basierend auf Gerüchten & Annahmen |
Die Benutzung eines 384-bit-Interfaces beim GB202-Chip hat dabei womöglich die größten Auswirkungen sogar auf die kleineren Blackwell-Chips – denn jene können somit nicht mehr auf ebenfalls breitere Speicherinterfaces hoffen, sondern dürften auf dem Stand von "Ada Lovelace" verbleiben. Denkbarerweise tritt somit GB203 mit 256 Bit an, GB205 mit 192 Bit sowie GB206 & GB207 dann mit 128 Bit. Sollte dies so zutreffen, dann wird es für nVidia nahezu zwingend, bei den kleinsten Blackwell-Chips mit 3-GByte-Speicherchips zu arbeiten, welche GDDR7 schließlich mitbringen soll. Nur damit ist an einem 128-Bit-Speicherinterface eine sinnvolle Speichermenge à 12 GByte möglich. Die einzige Alternative bestände in einer glatten Verdopplung auf 16 GB, über welche man für Grafikkarten des Jahres 2025 durchaus genauso nachdenken kann, was allerdings wenig zur (bisherigen) Strategie von nVidia in VRAM-Fragen passt.
Interface | VRAM @ 2GB-Chips | VRAM @ 3GB-Chips | |
---|---|---|---|
GB202 | angeblich 384 Bit | 24 GB | 36 GB |
GB203 | whrschl. 256 Bit | 16 GB | 24 GB |
GB205 | denkbar 192 Bit | 12 GB | 18 GB |
GB206 | denkbar 128 Bit | 8 GB | 12 GB |
GB207 | whrschl. 128 Bit | 8 GB | 12 GB |
Hinweis: Angaben zu noch nicht offiziell vorgestellter Hardware basierend auf Gerüchten & Annahmen |
Nachzutragen zum Raptor Lake Refresh und in Bezug auf einen kommenden Core i9-14900KS vielleicht ganz interessant sind die tendentiell eher schlechten Performance-Ergebnisse des Core i9-13900KS aus den Launch-Reviews zum Raptor Lake Refresh. Dieses Sondermodell wurde vergleichsweise selten getestet, zeigte in den wenigen vorhandenen Tests aber üblicherweise eine geringfügige, dennoch meßtechnisch bemerkbar schlechtere Performance als der Core i9-14900K – und dies trotz gleicher Hardware und Taktraten sowie sogar einer geringeren TDP auf Seiten des neueren Prozessoren-Modells (wobei die TDP/PBP bei diesen Prozessoren eigentlich keine Wirkung mehr entfalten sollte). Anders formuliert hat Intel beim Core i9-14900K trotz identischer Spezifikationen ein klein Wenig mehr herausgeholt als ein halbes Jahr vorher beim Core i9-13900KS.
Core i9-13900K vs ... | 13900KS: Anwend. | 14900K: Anwend. | 13900KS: Spiele | 14900K: Spiele |
---|---|---|---|---|
Hardware & Co | +0,7% | +2,1% | +0,9% | +2,5% |
PC Games Hardware | +1,3% | +2,2% | +0,9% | +1,1% |
QuasarZone | +2,3% | +4,6% | +1,4% | +1,7% |
TechPowerUp | +3,4% | +2,9% | +1,6% | +4,4% |
Nicht jeder Benchmark bestätigt dies, denn es gibt auch Tests, welche (minimal) zugunsten des Core i9-13900KS ausfallen. Aber ein schnell gezogener Durchschnitt sieht sowohl den Core i9-14900KS vorn, als auch die Mehrheit der Tests zugunsten des neueren Modells ausfallen. Eine gute Erklärung hierfür gibt es derzeit nicht, denkbarerweise war jene Taktstufe zum Jahresanfang 2023 für Intel schlicht schwieriger zu erreichen als jetzt. Für den nachfolgenden Core i9-14900KS dürfte dies bedeuten, dass man da die Mehrperformance genauso mit der Lupe wird suchen müssen. Ähnlich wie im Verhältnis zwischen Core i9-13900K und 13900KS dürfte es unterdurchschnittlich an Mehrperformance geben, eigentlich kaum der Rede wert für ein neues Prozessoren-Modell mit voraussichtlich wiederum überzogenen Preispunkt.