17

Gerüchteküche: GeForce RTX 4090 mit 126 Shader-Clustern und der doppelten Performance einer RTX 3090

Twitterer 'Kopite7kimi' hat sich nochmals zu den nVidia-Plänen bei der kommenden Ada-Generation geäußert: Zum einen wurde die kürzliche Termin-Angabe von "frühem dritten Quartal" nunmehr auf "Mitte Juli" präzisiert – womit sich nVidia deutlich vor allen bisher angenommenen Releaseterminen bewegen würde. Natürlich muß zu diesem Termin kein direkter Marktstart erfolgen und auch die Release-Reifenfolge der verschiedenen RTX40-Grafikkarten ist noch nicht bekannt – dies ist dann jedoch zumindest ein Termin, wo es losgehen soll mit der GeForce RTX 40 Serie. Und zugleich gibt es neue, weiter detaillierte Daten zur GeForce RTX 4090 als dem initialen Top-Modell der kommenden neuen Grafikkarten-Serie: Jene wird auf Basis des AD102-300 Grafikchips mit 16'128 FP32-Einheiten genannt, was auf 126 freigeschaltete Shader-Cluster hinausläuft – hinzukommend 24 GB GDDR6-Speicher auf 21 Gbps Datenrate.

Mid July.
Quelle:  Kopite7kimi @ Twitter am 16. Mai 2022
 
OK, let's do a new summary.
RTX 4090, AD102-300, 16128FP32, 21Gbps 24G GDDR6X, 450W, ~2x3090.

Quelle:  Kopite7kimi @ Twitter am 16. Mai 2022

Dies ist beachtbar unterhalb des Vollausbaus des AD102-Chips, was jedoch teilweise bereits derart erwartet wurde. Denn erstens ist der AD102-Chip mit physikalisch 144 Shader-Clustern ziemlich "fett", desweiteren ist der Abstand zum nächstkleineren AD103-Chip (84 Shader-Cluster, +71% zum AD102) ziemlich riesig und letztlich sichert sich nVidia somit genügend Reserven, damit sich eine spätere "GeForce RTX 4090 Ti" dann auch wirklich beachtbar absetzen kann. Als weiterer Vorteil dieser Abspeckung kann gelten, dass somit der Stromverbrauch der GeForce RTX 4090 keine neuen Rekordhöhen erreicht – sondern bei den 450 Watt der GeForce RTX 3090 Ti bleibt. Neben der geringeren Anzahl an Shader-Clustern könnte hierfür natürlich auch ein maßvoller Taktraten-Sprung beigetragen haben. Trotzdem sind 450 Watt eigentlich zu hoch – aber wenn die Grafikkarten-Enthusiasten dann die Mehrleistung sehen, könnte dies eventuell einige Meinungen wieder kippen lassen.

In dieser Frage soll die GeForce RTX 4090 glatt die doppelte Performance der GeForce RTX 3090 erreichen – üblicherweise dürfte es hierbei um echte Spiele-Performance und nicht um die Rohleistung gehen. Mit letzterer hantiert man eigentlich nur in der Simulations-Phase, welche der AD102-Chip auf dem Weg zu echten Grafikkarten augenscheinlich bereits hinter sich gelassen hat. Dabei könnte man sogar darüber spekulieren, ob diese doppelte Performance vielleicht etwas zu niedrig angesetzt ist, denn die reinen Daten zeigen einen klar höheren Rechenleistungs-Gewinn an: Es gibt zwischen diesen beiden Grafikkarten +54% mehr Shader-Cluster, welche ihrerseits wie schon extra ausgeführt das Potential zu einem um +36% höheren Durchsatz haben. Kumuliert sind dies schon +109% – wovon allerdings noch Skalierungs-Verluste in nicht unerheblichen Maßstab abgehen. Normalerweise rechnet man mit 70-80%, um was ein Hardware-Vorteil tatsächlich durchschlägt, dies wären in diesem Fall also +77-88% reale Mehrperformance.

Darauf kommt dann allerdings noch der Mehrtakt oben drauf, welcher regulär 1:1 in Leistung skaliert. Und an dieser Stelle muß man nur harmlose Taktraten-Zuschläge annehmen, um spielend auf die doppelte Real-Performance zu kommen: Schon mit 15% Mehrtakt (ergäbe ~2.1 GHz) steht man bei +103-116% Mehrperformance, bei 40% Mehrtakt (ergäbe ~2.5 GHz) wären es gar +147-163% Mehrperformance. Über noch höhere Taktraten, welche gerüchteweiser schon vermeldet wurden, will man dann lieber erst einmal nicht nachdenken, dies ergäbe schnell utopische Zahlen. In der Praxis dürfen jedoch diverse Bremsfaktoren auftauchen, darunter auch die CPU-Power selbst unter höheren Auflösungen. Insofern ist es nicht unnormal, wenn nVidia mit einem deutlich höheren Rohleistungs-Vorteil antreten muß, um in der Praxis "nur" die doppelte Real-Performance zu erreichen. Aber es läßt eben auch die Möglichkeit offen, dass bei einem sehr hohen Rohleistungs-Vorteil, forciert durch steilgehende Taktraten, mehr als die doppelte Performance herauskommen könnte.

GeForce RTX 3090 GeForce RTX 3090 Ti GeForce RTX 4090
Chip-Basis nVidia GA102-300 nVidia GA102-350 nVidia AD102-300
Architektur Gaming-Ampere Gaming-Ampere Ada Lovelace
Raster-Engines 7 GPC 7 GPC vermutlich 11 GPC
Recheneinheiten 82 Shader-Cluster, 5248 FP32 + 5248 FP32/INT32 (10'496 Recheneinheiten insgesamt) 84 Shader-Cluster, 5376 FP32 + 5376 FP32/INT32 (10'752 Recheneinheiten insgesamt) 126 Shader-Cluster, 16'128 FP32 + 8064 INT32 (24'192 Recheneinheiten insgesamt)
Boost/Real-Takt 1700 MHz / ~1.8 GHz 1860 MHz / ~1.95 GHz angeblich deutlich höher als bei Ampere
ROPs 112 112 vermutlich 352
Level2-Cache 6 MB 6 MB 96 MB
Speicherinterface 384 Bit GDDR6X 384 Bit GDDR6X 384 Bit GDDR6X
Speichertakt 19,5 Gbps 21 Gbps 21 Gbps
Stromverbrauch 350W TDP 450W TDP 450W TDP
Performance-Level 100% +8% ca. +100%  (oder mehr?)
Listenpreis $1499 / 1649€ $1999 / 2249€ unbekannt
Release 24. September 2020 29. März 2022 Q3/2022
Anmerkung: alle Angaben zur GeForce RTX 4090 basieren auf Gerüchten & Annahmen

Inwiefern die GeForce RTX 4090 als erste Ada-basierte Grafikkarte vorgestellt wird, ist noch offen – denkbarerweise fängt nVidia die neue Generation wieder mit der 80er Lösung in Form der GeForce RTX 4080 an. Allerdings dürfte die GeForce RTX 4090 sicherlich zu den ersten drei Ada-Grafikkarten gehören, welche den Markt erreichen – denn auffälligerweise kursieren derzeit nur Hardware-Daten zur GeForce RTX 4070, 4080 & 4090, nicht aber zu anderen Ada-Lösungen. Passend hierzu zeigen VideoCardz mit fernöstlicher Quelle die (angebliche) Kühlkonstruktion der GeForce RTX 4090. Insofern diese Meldung den Tatsachen entspricht, darf man dies als weiteren Hinweis darauf verstehen, dass nVidia schon seit weit ist mit seinen Vorbereitungen der ersten Ada-Grafikkarten – womit einer Vorstellung im Juli sowie dem eigentlichen Launch im weiteren Verlauf des dritten Quartals nicht mehr viel im Wege stehen sollte.