4

Gerüchteküche: GeForce RTX 4090 soll mit 2.52 GHz Boost-Takt antreten

Twitterer Kopite7kimi präzisiert seine Vorausschau auf das initiale Portfolio der GeForce RTX 40 Serie mittels aktualisierter Daten zu GeForce RTX 4070, 4080 & 4090. In der nachfolgenden Tweet-Kopie wurden die Änderungen gegenüber dem Stand von vor anderthalb Wochen fett markiert, jene betreffen allein eine Präzisierung zu Speicherart und Speichertakt der GeForce RTX 4080 – sowie vor allem die erste konkrete Taktratenangabe zur GeForce RTX 4090. Jene lautet auf 2235 Base- und 2520 MHz Boost-Takt, das Taktraten-Maximum soll aktuell bei oberhalb 2750 MHz liegen. Dies sind schon vergleichsweise präzise Angaben, augenscheinlich befindet sich nVidia schon in der letzten Phase der Produkt-Gestaltung zur GeForce RTX 4090 – wo dann "nur" noch die finalen Taktraten eruiert werden.

Continue to update.
RTX 4090, AD102-300-A1, 16384FP32, 384bit 21Gbps 24G GDDR6X, 450W, base 2235 boost 2520 actual max >2750;
RTX 4080, AD103-300-A1, 10240FP32, 256bit 21Gbps 16G GDDR6X, 420W,
RTX 4070, AD104-275-Kx(x is a number)-A1, 7168FP32, 160bit 18Gbps 10G GDDR6, 300W.

Quelle:  Kopite7kimi @ Twitter am 4. Juli 2022

Jene liegen gegenüber der Ampere-Generation zwar (richtig) hoch, gegenüber den bisherigen Äußerungen des Twitterers ("man kann mehr als 2.8 GHz erwarten") jedoch durchaus niedriger. Allerdings war dies speziell bei der GeForce RTX 4090 zu erwarten, die Karte wird augenscheinlich bewußt mittels einer (relativ) niedrigen TDP ausgebremst. Dies läßt mehr Platz für die später nachfolgende GeForce RTX 4090 Ti, zugleich steigert sich somit auch die Fertigungs-Ausbeute beim zugrundeliegenden AD102-Chip – was gerade in der Anfangszeit durchaus bedeutsam sein kann. Interessant wird an diese Stelle zu sehen sein, ob die GeForce RTX 4090 auf dieser Taktrate dann nicht vielleicht über ein gehöriges Overclocking-Potential verfügt. nVidia könnte dies mittels Limits bei Spannungs-Zugabe und maximaler TDP einzuschränken versuchen, aber bei bewußt handzahm taktenden Grafikkarten ergibt sich eigentlich immer ein beachtbarer Übertaktungsspielraum.

Und natürlich kommt die GeForce RTX 4090 auch bei "nur" 2.52 GHz schon richtig auf Touren, nominell sind dies dann immerhin 82,6 TFlops FP32-Rechenleistung – und damit leicht mehr als das Doppelte gegenüber der GeForce RTX 3090 Ti bzw. sogar das 2,3fache gegenüber der GeForce RTX 3090 (Rechnung basierend auf offiziellen Boost-Taktraten). Wie bekannt, dürfte hierzu dann auch noch die Verbreiterung der Shader-Cluster oben drauf kommen – welche zwar nicht die nominelle Rechenpower steigert, allerdings hingegen die effektive. Allein auf Basis von Rechenpower-Hochrechnung läßt sich das Ada-Lovelace-Design allerdings schwer einschätzen, denn andere Architektur-Änderungen sind derzeit unbekannt, genauso ist der Effekt des großen Level2-Caches nur sehr grob vorhersagbar. In jedem Fall wird dieser zwingend benötigt, denn bei der nominellen Speicherbandbreite gibt es zwischen GeForce RTX 3090 Ti und GeForce RTX 4090 augenscheinlich keinen Fortschritt.

GeForce RTX 3090 GeForce RTX 3090 Ti GeForce RTX 4090
Chip-Basis nVidia GA102-300 nVidia GA102-350 nVidia AD102-300
Raster-Engines 7 GPC 7 GPC vermtl. 11 GPC
Recheneinheiten 82 Shader-Cluster, 5248 FP32 + 5248 FP32/INT32 (10'496 Recheneinheiten insgesamt) 84 Shader-Cluster, 5376 FP32 + 5376 FP32/INT32 (10'752 Recheneinheiten insgesamt) 128 Shader-Cluster, 16'384 FP32 + 8192 INT32 (24'576 Recheneinheiten insgesamt)
Taktraten 1400/1700 MHz (real ~1.8 GHz) 1560/1860 MHz (real ~1.95 GHz) 2235/2520 MHz
ROPs 112 112 vermtl. 352
Level2-Cache 6 MB 6 MB 96 MB
Speicherinterface 384 Bit GDDR6X 384 Bit GDDR6X 384 Bit GDDR6X
Speicher 24 GB GDDR6X @ 19,5 Gbps 24 GB GDDR6X @ 21 Gbps 24 GB GDDR6X @ 21 Gbps
Rohleistungen 35,7 TFlops & 936 GB/sec 40,0 TFlops & 1008 GB/sec 82,6 TFlops & 1008 GB/sec
Stromverbrauch 350W TDP / real 359W 450W TDP / real 462W 450W TDP
4K Perf.-Index 376% 408% ?
Listenpreis $1499 / 1649€ $1999 / 2249€ ?
Launch 24. September 2020 29. März 2022 September/Oktober 2022
Anmerkung: alle Angaben zu noch nicht vorgestellter Hardware basieren auf Gerüchten & Annahmen

Insofern lohnt es derzeit noch nicht, die einmal gesetzten Performance-Prognosen zu überarbeiten – welche sowieso schon mit Taktraten von um die 2.5 GHz kalkuliert wurden. Man kann allerdings sagen, dass diese Performance-Prognosen, welche derzeit der GeForce RTX 4090 ein Performance-Potential von dem 1,8-2,3fachen der GeForce RTX 3090 (non-Ti) geben, unter Berücksichtigung aller neuer Informationen weiterhin als gut haltbar erscheinen. Genauer wird es dann werden, wenn nVidia die Spezifikationen zur GeForce RTX 4090 finalisiert und wenn es möglicherweise einen ersten Benchmark-Leak gibt. Sobald die Performance der GeForce RTX 4090 besser als durch Hochrechnungen & Schätzungen umrissen werden kann, läßt sich auch zu den weiteren Grafikkarten des RTX40-Portfolios eine präzisere Performance-Prognose abgeben.

Bei diesen Karten – GeForce RTX 4070 & 4080 – ist nVidia augenscheinlich noch nicht so weit wie bei der GeForce RTX 4090, sprich hier wären sogar noch diverse Hardware-Änderungen realisierbar. Optimisten hoffen beispielsweise weiterhin auf ein 192-Bit-Interface bei der GeForce RTX 4070 – aber vermutlich hat nVidia jenes bewußt heruntergesetzt, um schlicht beim Grafikkartenspeicher sparen zu können. Innerhalb der nächsten Wochen sollten dann allerdings auch die Grund-Spezifikationen von GeForce RTX 4070 & 4080 festgezimmert werden, womit sich nVidia nachfolgend der Festlegung von deren Taktraten widmen kann. An dieser Stelle sind dann sicherlich die bewußten 2.8 GHz (und mehr) zu erwarten, denn anders wäre es gar nicht möglich, dass die TDP der GeForce RTX 4080 (420W) so nahe an jene der GeForce RTX 4090 (450W) heranreicht.

GeForce RTX 4070 GeForce RTX 4080 GeForce RTX 4090
Chip-Basis nVidia AD104-275 nVidia AD103-300 nVidia AD102-300
Referenz-Board PG141-SKU341 PG139-SKU360 PG139-SKU330
Raster-Engines 5 GPC 7 GPC vermtl. 11 GPC
Recheneinheiten 56 Shader-Cluster, 7168 FP32 + 3584 INT32 (10'752 Recheneinheiten insgesamt) 80 Shader-Cluster, 10'240 FP32 + 5120 INT32 (15'360 Recheneinheiten insgesamt) 128 Shader-Cluster, 16'384 FP32 + 8192 INT32 (24'576 Recheneinheiten insgesamt)
Taktraten ? ? 2235/2520 MHz
ROPs vermtl. 160 vermtl. 224 vermtl. 352
Level2-Cache 48 MB 64 MB 96 MB
Speicherinterface 160 Bit GDDR6 256 Bit GDDR6X 384 Bit GDDR6X
Speicher 10 GB GDDR6 @ 18 Gbps 16 GB GDDR6X @ 21 Gbps 24 GB GDDR6X @ 21 Gbps
Rohleistungen ca. 37-42 TFlops & 360 GB/sec ca. 53-59 TFlops & 672 GB/sec 82,6 TFlops & 1008 GB/sec
Stromverbrauch 300W TDP 420W TDP 450W TDP
Performance-Level 3070→4070: ca. 1,6-2,0fache 3080→4080: ca. 1,6-2,0fache 3090→4090: ca. 1,8-2,3fache
(reduziert wegen offenbar klar niedrigerer Taktrate)
Listenpreis ? ? ?
Launch November/Dezember 2022 Oktober/November 2022 September/Oktober 2022
Vorgänger GeForce RTX 3070: GA104, 6 GPC, 46 SM @ 256 Bit, 20,3 TFlops & 448 GB/sec, 96 ROPs, 8 GB GDDR6, $499 GeForce RTX 3080: GA102, 6 GPC, 68 SM @ 320 Bit, 29,8 TFlops & 760 GB/sec, 96 ROPs, 10 GB GDDR6X, $699 GeForce RTX 3090: GA102, 7 GPC, 82 SM @ 384 Bit, 35,7 TFlops & 936 GB/sec, 112 ROPs, 24 GB GDDR6X, $1499
Anmerkung: alle Angaben zu noch nicht vorgestellter Hardware basieren auf Gerüchten & Annahmen

Nachtrag vom 4. Juli 2022

Zu den derzeit offerierten RTX40-Spezifikationen gibt es zwei Kritikpunkte: Zum einen passt zwischen GeForce RTX 4080 mit 80 Shader-Clustern bei 420W TDP sowie GeForce RTX 4090 mit 128 Shader-Clustern und "nur" 450W TDP etwas offensichtlich nicht zusammen. Und zum anderen kommt die GeForce RTX 4090 nun mit "nur" 2520 MHz Boost-Takt doch deutlich unterhalb der Versprechung von "mehr als 2.8 GHz" daher. Allerdings lassen sich beide Kritikpunkte gemeinsam mittels eines Kunstgriffs erklären, welchen nVidia augenscheinlich bei der GeForce RTX 4090 ansetzt: Die Karte wird vergleichsweise handzahm getaktet – gegenüber dem, was das Ada-Lovelace-Silizium unter der 5nm-Fertigung von TSMC wirklich zulassen würde. In selbige Kerbe schlägt auch Twitterer AGF (welcher früher schon nVidia-Interna von sich gab), nach welchem die GeForce RTX 4090 durchaus mehr könnte – nur wegen limitierter TDP schlicht nicht darf.

2 points on RTX4090 power curve:
2780MHz boost at 450W and 3020MHz at 550W

Quelle:  AGF @ Twitter am 4. Juli 2022

Das grundsätzliche Design läßt somit wohl tatsächlich Taktraten von 3 GHz zuzulassen – nur fährt nVidia dies bei der GeForce RTX 4090 bewußt nicht aus. Denn zum einen kann man damit das TDP-Level (vergleichsweise) niedrig halten, zum anderen bringt der AD102-Chip den klar größten Hardware-Sprung mit sich (+71% mehr Shader-Cluster gegenüber GA102, die anderen AD10x-Chips liegen hingegen bei um die +20%), muß sich also keineswegs bei der Taktrate verausgaben. Der Leistungssprung, welchen die GeForce RTX 4090 bieten wird, dürfte trotzdem enorm sein – und alles was durch die niedrige Taktrate liegengelassen wird, geht dann eines Tages sowieso zugunsten der GeForce RTX 4090 Ti, ist also mitnichten verloren. Die wahre Taktrate, welche das Ada-Lovelace-Silizium zu leisten imstande ist, wird man dann bei GeForce RTX 4070, 4080 & 4090 Ti sehen.

Als Nachteil wird sich dort allerdings auch eine schlechtere Energie-Effizienz ergeben, weil über die höheren Taktraten der Stromverbrauch unverhältnismäßig stark steigt. Man kann jetzt schon grob kalkulieren, dass eine GeForce RTX 4090 bei 184 GFlops/Watt herauskommen sollte (auf 2520 MHz Boost-Takt und 450W TDP), jener Wert bei GeForce RTX 4070 & 4080 jedoch eher um die 140 GFlops/Watt liegen sollte, einen Boost-Takt von ca. 2.9 GHz annehmend. Selbst die GeForce RTX 4090 Ti dürfte nicht ganz das Effizienz-Niveau der 4090 non-Ti erreichen, weil dann bei der Ti-Lösung wiederum keine Hemmungen bei der Taktraten zu erwarten sind. Die GeForce RTX 4090 wird also wohl das untypische Produkt der GeForce RTX 40 Serie, als vergleichsweise energieeffiziente Lösung (sofern man dies angesichts von 450 TDP sagen kann).

Hardware Taktraten TDP Effizienz Termin
GeForce RTX 4090 Ti AD102, ~140-144 SM @ 384 Bit GDDR6X whrschl. hochgezogen: ~2.8 GHz möglw. 600W ~165 GFlops/W nach Navi 31 (Frühjahr 2023)
GeForce RTX 4090 AD102, 128 SM @ 384 Bit GDDR6X handzahm: 2235/2520 MHz 450W 184 GFlops/W September/Oktober 2022
GeForce RTX 4080 AD103, 80 SM @ 256 Bit GDDR6X whrschl. hochgezogen: 2.8-3.0 GHz 420W ~140 GFlops/W Oktober/November 2022
GeForce RTX 4070 AD104, 56 SM @ 160 Bit GDDR6 whrschl. hochgezogen: 2.8-3.0 GHz 300W ~140 GFlops/W November/Dezember 2022
Anmerkung: alle Angaben zu noch nicht vorgestellter Hardware basieren auf Gerüchten & Annahmen

Doch weil die GeForce RTX 4090 handzahm taktet, die GeForce RTX 4080 dagegen beim Takt wohl in die Vollen geht, ergeben sich somit diese ähnlichen TDP-Werte. Die Grundlage hierfür lieferte letztlich schon die einige Wochen zurückliegende Information über diesselben Referenz-Boards (PG139) für GeForce RTX 4080 & 4090: Dies zwingt förmlich zu einer ähnlichen TDP – denn wenn nicht, würde sich die Auflage eines extra Boards definitiv lohnen. Aber dies soll letztlich nicht sagen, dass die Leaker-Aussagen unbedingt korrekt sein müssen – auch dort sind Fehler möglich, genauso kann man auch auf bewußt falsch gestreute Fährten seitens der Chip-Entwickler hereinfallen. Es soll hiermit nur gesagt werden, dass es durchaus eine (halbwegs) plausible Erklärung für diese Hardware-Daten zu GeForce RTX 4080 & 4090 auf ihrer nahe beieinanderliegenden TDP gibt.

Nachtrag vom 6. Juli 2022

Der vorgestern erwähnte Undervolting-Test seitens Hartware gibt nebenbei auch einen guten Hinweis darauf, wie dies mit GeForce RTX 4080 auf 420W und GeForce RTX 4090 auf 450W funktionieren kann: Die GeForce RTX 4090 läuft in dieser Konstellation augenscheinlich mit abgesenkter Taktrate, um eine nahe zur GeForce RTX 4080 liegende TDP halten zu können. Dabei dürfte sich trotzdem ein erhebliches Performance-Plus einstellen, wie eine ähnlich limitierte GeForce RTX 3080 beweist: Auf nur noch 221 Watt Stromverbrauch (ein Viertel unterhalb des regulären Power-Limits) verliert die Karte gerade einmal –6% Performance.

default Setting #1 Setting #2
GeForce RTX 3080 10GB ~1815 MHz
301W
100% Perf.
~1727 MHz
253W
97% Perf.
~1637 MHz
221W
94% Perf.
gemäß der Ausführungen von Hartware, Performance ist ein Schnitt von 3 Spielen unter der 4K-Auflösung

Umgerechnet auf den 4K Performance-Index ergibt dies einen Index-Wert von ~310%, dies sind immerhin +24% oberhalb einer GeForce RTX 3070 zu grob derselben Verlustleistung. Da zwischen GeForce RTX 4080 und 4090 ein etwas höherer Hardware-Unterschied existiert (+60% Shader-Cluster) als zwischen GeForce RTX 3070 und 3080 (+48% Shader-Cluster), sollte dort der Performance-Sprung trotz ähnlicher TDP noch etwas größer ausfallen. Seltsam sieht diese Konstruktion eigentlich nur deswegen aus, weil die GeForce RTX 4090 augenscheinlich handzahm bei Taktraten und TDP antritt, diese Karte somit eine nVidia-untypisch "effiziente" Lösung darstellt. Das wahre Taktraten-Potential des AD102-Chips wird man dann erst später bei nachfolgenden AD102-Lösungen sehen – dann allerdings bei TDPs bis zu 600 Watt.