News des 15. November 2023

Twitter & Leaker Kopite7kimi hat seine frühere Aussage zugunsten eines 512-Bit-Speicherinterfaces bei "Gaming-Blackwell" korrigiert – nunmehr sollen es 384 Bit GDDR7 beim GB202-Chip sein. Die frühere Angabe wurde seinerzeit schon bezweifelt, da dies für Consumer-Chips zumindest im Gaming-Bereich einfach zu breit ist, zudem durch die Hinzunahme von GDDR7-Speicher eigentlich bereits ein großer Bandbreiten-Boost zur Verfügung steht. Mittels der klaren Aussage "384 Bit GDDR7" ergibt dies dann alles einen besseren Sinn, denn auf 32 Gbps Datenrate (wie seitens Micron angekündigt) kommt man an einem 384-Bit-Interface auf eine Speicherbandbreite von 1536 GB/sec – was wiederum perfekt zu einem anderen Leak passt, welcher von einer 52%igen Steigerung der Speicherbandbreite gegenüber der GeForce RTX 4090 sprach.

I think I probably made an empirical mistake. I mistakenly applied the ratio of Ada Lovelace's L2 and MC to Blackwell.
Quelle: Kopite7kimi @ Twitter am 15. November 2023

So 384 Bit for GB202?
Quelle: RawMango @ Twitter am 15. November 2023

And GDDR7.
Quelle: Kopite7kimi @ Twitter am 15. November 2023

So gesehen ändert sich mit dieser Spezifikations-Korrektur auch nicht viel, denn es handelt sich nur um einen anderen Weg, um die Ziel-Speicherbandbreite zu erreichen. Die grundsätzlichen Rohdaten zum GB202-Chip zeigen somit nach wie vor eine Steigerung der Rechenleistung um +53% sowie eine Steigerung der Speicherbandbreite um +52% an – bezogen auf den Chip-Vergleich AD102 vs GB202. Insofern man es auf die GeForce RTX 4090 als derzeit stärkste AD102-Ausführung des Gaming-Segments beziehen will, käme der GB202-Chip im Vollausbau auf +73% Rechenleistung sowie +52% Speicherbandbreite – wobei nicht dafür garantiert werden kann, dass es einen GB202 im Vollausbau jemals zu kaufen gibt. Diese Rohdaten sind natürlich vor etwaigen Architektur-Änderungen, welche über eine bessere Auslastung der Recheneinheiten auch noch einiges herausholen können. Dennoch ist davor zu warnen, diese bestenfalls +73% mehr Rechenleistung als Ansatz zur Ermittlung der voraussichtlichen Mehrperformance zu benutzen.

Zwischen GeForce RTX 3090 Ti und 4090 liegen grob +110% mehr Rechenleistung, die real erreichte Mehrperformance liegt dagegen nur bei +55%. Logischerweise ist es Architektur-spezifisch, wie gut die Skalierung jeweils ausfällt, aber bei (bestenfalls) +73% mehr Rechenleistung zwischen GeForce RTX 4090 und GB202-Chip im Vollausbau sind +70% Mehrperformance einfach zu hoch gegriffen. Gemäß der zuletzt erreichten Skalierung wäre jedes Ergebnis oberhalb von +40% Mehrperformance schon gutklassig. Selbst dies könnte allerdings schon schwierig erreichbar sein, wenn nVidia den GB202-Chip ähnlich stark beschnitten wie die GeForce RTX 4090 in den Markt entläßt (–11% Shader-Cluster gegenüber Vollausbau). Das nominelle Potential zwischen den jeweiligen Spitzen-Chips ist zwischen Ada Lovelace und Blackwell in jedem Fall bemerkbar kleiner als zwischen Ampere und Ada Lovelace.

	GeForce RTX 4090	AD102 (Vollausbau)	GB202 (Vollausbau)	Chip-Differenz
GPCs	11	12	angeblich 12	±0
Shader-Cluster	128	144	angeblich 192	+33%
Chip-Takt	nominell 2520 MHz, real ~2.7 GHz	-	angeblich ca. ~2.9 GHz	+15%
Rechenpower	nominell 83 TFlops, real 88 TFlops	auf RTX4090-Takrate: nominell 93 TFlops, real 100 TFlops	nominell ~143 TFlops	+53%
ROPs	176	192	angeblich 384 oder 768	+100% oder +300%
Level2-Cache	72 MB	96 MB	angeblich 128 MB	+33%
Speicherinterface	384 Bit GDDR6X	384 Bit GDDR6X	angeblich 384 Bit	±0
Speicherbandbreite	1008 GB/sec (21 Gbps GDDR6X @ 384 Bit)	-	angeblich 1536 GB/sec (whrschl. 32 Gbps GDDR7 @ 384 Bit)	+52%
Hinweis: Angaben zu noch nicht offiziell vorgestellter Hardware basierend auf Gerüchten & Annahmen

Die Benutzung eines 384-bit-Interfaces beim GB202-Chip hat dabei womöglich die größten Auswirkungen sogar auf die kleineren Blackwell-Chips – denn jene können somit nicht mehr auf ebenfalls breitere Speicherinterfaces hoffen, sondern dürften auf dem Stand von "Ada Lovelace" verbleiben. Denkbarerweise tritt somit GB203 mit 256 Bit an, GB205 mit 192 Bit sowie GB206 & GB207 dann mit 128 Bit. Sollte dies so zutreffen, dann wird es für nVidia nahezu zwingend, bei den kleinsten Blackwell-Chips mit 3-GByte-Speicherchips zu arbeiten, welche GDDR7 schließlich mitbringen soll. Nur damit ist an einem 128-Bit-Speicherinterface eine sinnvolle Speichermenge à 12 GByte möglich. Die einzige Alternative bestände in einer glatten Verdopplung auf 16 GB, über welche man für Grafikkarten des Jahres 2025 durchaus genauso nachdenken kann, was allerdings wenig zur (bisherigen) Strategie von nVidia in VRAM-Fragen passt.

	Interface	VRAM @ 2GB-Chips	VRAM @ 3GB-Chips
GB202	angeblich 384 Bit	24 GB	36 GB
GB203	whrschl. 256 Bit	16 GB	24 GB
GB205	denkbar 192 Bit	12 GB	18 GB
GB206	denkbar 128 Bit	8 GB	12 GB
GB207	whrschl. 128 Bit	8 GB	12 GB
Hinweis: Angaben zu noch nicht offiziell vorgestellter Hardware basierend auf Gerüchten & Annahmen

Nachzutragen zum Raptor Lake Refresh und in Bezug auf einen kommenden Core i9-14900KS vielleicht ganz interessant sind die tendentiell eher schlechten Performance-Ergebnisse des Core i9-13900KS aus den Launch-Reviews zum Raptor Lake Refresh. Dieses Sondermodell wurde vergleichsweise selten getestet, zeigte in den wenigen vorhandenen Tests aber üblicherweise eine geringfügige, dennoch meßtechnisch bemerkbar schlechtere Performance als der Core i9-14900K – und dies trotz gleicher Hardware und Taktraten sowie sogar einer geringeren TDP auf Seiten des neueren Prozessoren-Modells (wobei die TDP/PBP bei diesen Prozessoren eigentlich keine Wirkung mehr entfalten sollte). Anders formuliert hat Intel beim Core i9-14900K trotz identischer Spezifikationen ein klein Wenig mehr herausgeholt als ein halbes Jahr vorher beim Core i9-13900KS.

Core i9-13900K vs ...	13900KS: Anwend.	14900K: Anwend.	13900KS: Spiele	14900K: Spiele
Hardware & Co	+0,7%	+2,1%	+0,9%	+2,5%
PC Games Hardware	+1,3%	+2,2%	+0,9%	+1,1%
QuasarZone	+2,3%	+4,6%	+1,4%	+1,7%
TechPowerUp	+3,4%	+2,9%	+1,6%	+4,4%

Nicht jeder Benchmark bestätigt dies, denn es gibt auch Tests, welche (minimal) zugunsten des Core i9-13900KS ausfallen. Aber ein schnell gezogener Durchschnitt sieht sowohl den Core i9-14900KS vorn, als auch die Mehrheit der Tests zugunsten des neueren Modells ausfallen. Eine gute Erklärung hierfür gibt es derzeit nicht, denkbarerweise war jene Taktstufe zum Jahresanfang 2023 für Intel schlicht schwieriger zu erreichen als jetzt. Für den nachfolgenden Core i9-14900KS dürfte dies bedeuten, dass man da die Mehrperformance genauso mit der Lupe wird suchen müssen. Ähnlich wie im Verhältnis zwischen Core i9-13900K und 13900KS dürfte es unterdurchschnittlich an Mehrperformance geben, eigentlich kaum der Rede wert für ein neues Prozessoren-Modell mit voraussichtlich wiederum überzogenen Preispunkt.

Webweite Links

Files

Tiny Nvidia Update Checker in der Version 1.17.1
CCleaner 6.18.10824
PRTG Network Monitor 23.4.90.1299
Personal Backup 6.3.9

Grafikkarten

Update zu Starfield: GeForce RTX 4090 nun vor Radeon RX 7900 XTX – ohne DLSS [PC Games Hardware]
GeForce RTX 4090: "Ernsthafte" Angebote bis beinahe 5.000 Euro [PC Games Hardware]
GB202: 384 Bit GDDR7 [Kopite7kimi @ Twitter]
Intel Arc “Meteor Lake” integrated GPU has been tested in OpenCL benchmark, faster Arc A350M [VideoCardz]