13

Gerüchteküche: TimeSpy-Werte zur GeForce RTX 4090 Ti sowie zum AD106-Chip

Über das Wochenende sind wieder zwei Benchmarks-Leaks bezüglich zukünftiger RTX40-Grafikkarten aufgetaucht. Zuerst hatte Twitterer Harukaze5719 ein fernöstliches Ergebnis von 24'357 Grafik-Punkten im TimeSpy Extreme kundgetan, welches im Original aus dem Chiphell-Forum stammt. Hier schwinkt natürlich latent die Gefahr eines "Fakes" mit, da das ganze nur als Screenshot von einem vergleichsweise neuen User kommt. Die benutzte Grafikkarte wurde nicht genannt, allerdings ist der Wert kaum von einer GeForce RTX 4090 zu schaffen, welche mit Werksübertaktung bei 20'192 Punkten stehen soll. Somit sieht man hier wahrscheinlich das Ergebnis einer GeForce RTX 4090 Ti – oder einer "Ada Titan", je nachdem wie nVidia diese stärkere AD102-Karte letztlich nennen will.

RTX 4090 Ti, Time Spy Extreme Score
x2.15 vs RTX 3090 Ti

Quelle:  Harukaze5719 @ Twitter am 10. September 2022
 
AD106 is not very strong. The typical TSE score is < 7000.
And both AD106 and AD107 are using PCIE x8.

Quelle:  Kopite7kimi @ Twitter am 10. September 2022

Zumindest die Ergebnis-Höhe verspricht auch nichts unerreichbares für eine solche AD102-Karte im Vollausbau des Grafikchips (oder nahe dessen), denn mehr als 24'000 Punkte wurden für eine ähnliche Hardware-Konfiguration bereits vorhergesagt. Überraschend wäre eher, dass hierzu derzeit schon Benchmarks außerhalb von nVidia existieren sollen, da die GeForce RTX 4090 Ti derzeit nicht direkt auf dem Launch-Plan nVidias steht. Allerdings könnten natürlich dennoch bereits gewisse Vorbereitungen hierzu laufen, da diese nVidia-Karte dem Topmodell auf Navi-31-Basis wohl zeitnah nachgeschoben werden soll. Letztlich ist der zugrundeliegende AD102-Chip logischerweise spruchreif und benötigt es bei guter Silizium-Qualität nur das passende BIOS, um diesbezügliche Testboards aufzubauen. In Richtung finaler Hardware dürfte es bei der GeForce RTX 4090 Ti / Ada Titan allerdings noch eine Zeitlang nicht gehen, dazu wartet nVidia erst einmal den Navi-31-Launch ab.

Der zweite Benchmark-Wert erging zum AD106-Chip, welcher seitens Twitterer Kopite7kimi grob mit "unter 7000 GPU-Punkte" im TimeSpy Extreme genannt wurde. Aller Wahrscheinlichkeit nach dürfte nVidia hieraus eine GeForce RTX 4060 aufbauen, selbst wenn dies in diesem Fall den Rückschritt auf wieder nur 8 GB Grafikkartenspeicher bedeutet. Wenn man mal defensiv auf 6600 Punkte schätzt, sind dies +63% mehr als bei der GeForce RTX 3060 – deutlich geringer als der Ada-Performancegewinn an der Leistungsspitze, aber basierend auf dem deutlich kleineren Sprung an Shader-Clustern zwischen GA106- und AD106-Chip (nur +20%) absolut im Rahmen des zu erwartenden. Die Differenz zwischen dem Hardware- und dem Performance-Sprung ergibt dann im übrigen den eigentlichen Generations-Sprung von "Ada Lovelace", was durchaus 40-45% sind (erzeugt durch Mehrtakt sowie auch taktnormiert mehr Power aus den einzelnen Shader-Clustern).

Die GeForce RTX 4060 ist allerdings unabhängig der derzeit unklaren Release-Situation von GeForce RTX 4070 & 4080 in jedem Fall erst im Jahr 2023 einzuordnen, wahrscheinlich auch nicht gleich am Jahresanfang. Denn zwar soll auch der AD106-Grafikchip bereits spruchreif sein, nVidia zieht in diesem Fall jedoch das Mobile-Segment vor und dürfte zur CES 2023 erst einmal eine "GeForce RTX 40 Mobile" Serie ankündigen. In diesem Portfolio wird der AD106-Chip sicherlich eine größere Rolle einnehmen, da zwar die Notebooks mit "GeForce RTX 4080 Mobile" vornehmlich getestet werden, der eigentliche Absatz hingegen bei "GeForce RTX 4060 Mobile" und kleiner stattfindet. Zugleich gilt, dass nVidia für den Desktop-Launch der GeForce RTX 4060 große Mengen an AD106-Chips benötigen dürfte, demzufolge wohl einige Wochen vorproduzieren muß – und somit ein Desktop-Launch dieser Karte eher erst im Frühjahr 2023 zu erwarten ist.

Hardware TS Extreme GF30/GF40 Quelle
"GeForce RTX 4090 Ti" AD102-?, unbekannte Hardware (max. 144 SM @ 384 Bit) 24'357 +120% Harukaze5719, 10. Sept.
AD102, 144 SM @ <600W AD102-?, 144 SM @ 384 Bit, <600W >24'000 - AGF, 5. Aug.
GeForce RTX 4090 @ 3 GHz AD102-300, 128 SM @ 384 Bit, 21 Gbps GDDR6X, whrschl. Werks-OC 20'192 Chiphell, 9. Sept.
GeForce RTX 4090 AD102-300, 128 SM @ 384 Bit, 2.52 GHz, 21 Gbps GDDR6X, 450W TBP >19'000 +86% Kopite7kimi, 18. Jul.
AD103, 80 SM @ 420W AD103-300, 80 SM @ 256 Bit, 21 Gbps GDDR6X, 420W TBP >15'000 Kopite7kimi, 29. Jul.
AD103, 76 SM @ ~420W AD103-300, 76 SM @ 256 Bit, 21 Gbps GDDR6X, ~420W TBP ~15'000 +70% Kopite7kimi, 5. Aug.
RTX 3090 Ti Founders Edition 11'056 PC Games Hardware
AD104, 60 SM @ 300W AD104-?, 60 SM @ 192 Bit, 21 Gbps GDDR6X, 300W TBP >11'000 Kopite7kimi, 4. Aug
AD104, 60 SM @ 285W AD104-?, 60 SM @ 192 Bit, 21 Gbps GDDR6X, 285W TBP <11'000 +63% Kopite7kimi, 29. Aug
RTX 3090 Founders Edition 10'208 PC Games Hardware
AD104, 56 SM @ 300W AD104-275, 56 SM @ 160 Bit, 18 Gbps GDDR6, 300W TBP ~10'000 Kopite7kimi, 29. Jul.
AD104, 56 SM @ 250W AD104-?, 56 SM @ 160 Bit, 21 Gbps GDDR6X, 250W TBP <10'000 Kopite7kimi, 29. Aug.
RTX 3080 Founders Edition 8798 PC Games Hardware
AD106 AD106-?, unbekannte Hardware (max. 36 SM @ 128 Bit) <7000 +63% Kopite7kimi, 10. Sept.
RTX 3070 Founders Edition 6563 PC Games Hardware
RTX 3060 Ti Founders Edition 5569 PC Games Hardware
RTX 3060 simuliert auf Referenz-Takt 4040 PC Games Hardware
Anmerkungen: alle Angaben zu noch nicht vorgestellter Hardware basieren auf Gerüchten & Annahmen; TimeSpy Extreme = Graphics Score

Mittels der vorhandenen Grafikchips kann man natürlich auch jetzt schon Benchmarks aufstellen. Der angegebene TSE-Wert ist zudem grob genug, womit spätere eventuelle Veränderungen der Hardware-Konfiguration (geringere Anzahl an freigeschalteten Shader-Clustern, optimiertes Power-Limit) daran nicht mehr viel drehen dürften. Eher interessant ist daher die kleine Anmerkung, wonach AD106 & AD107 nur über 8 Lanes von PCI Express verfügen werden – augenscheinlich auf Hardware-Ebene, da hier über Grafikchips und nicht Grafikarten-Modellen gesprochen wird. Damit folgt nVidia dem Weg von AMD und reduziert etwas den Silizium-Aufwand der kleineren und damit schwerer gewinnträchtig zu bekommenden Grafikchips. Allerdings wird dies wohl noch auf Basis von PCI Express 4.0 stattfinden, denn der AD102-Chip soll laut früherer Kopite7kimi-Aussage ebenfalls noch kein PCI Express 5.0 erhalten.

Die damit erzielbare System-Bandbreite ist für diese Leistungsklasse wohl ausreichend, selbst wenn PCI Express 5.0 als Checklisten-Feature netter klingen würde (aber von nVidia augenscheinlich bewußt nicht geboten wird, denn der GH100-Chip hat es bereits). Das eigentliche Problem ergibt sich immer erst dann, wenn eine solche Grafikkarte mit einem Altsystem auf PCI Express 3.0 konfrontiert wird. An dieser Stelle wäre es dann auch komplett egal, ob die GeForce RTX 40 Serie bereits PCI Express 5.0 beherrscht oder nicht, auf Alt-Systemen zählen nur PCIe-Lanes. Da liegen AD106 & AD107 mit 8 Lanes noch im grünen Bereich für ihr Performance-Segment – kritisch wird es nur bei 4 Lanes (Navi 24), gerade wenn die Speicherbestückung knapp bemessen ist (Radeon RX 6400 & 6500 XT). Dies dürfte bei GeForce RTX 4050 & 4060 wohl nicht passieren, ergo ist diese Hardware-Abspeckung in dieser Form wohl gangbar.

Hardware FP32 Interface L2-Cache Speicher PCI Express Vorgänger
AD102 12 GPC, 72 TPC, 144 SM 18'432 384 Bit 96 MB 24 GB PCIe 4.0 x16 GA102: 7 GPC, 84 SM @ 384 Bit, 6 MB L2
AD103 7 GPC, 42 TPC, 84 SM 10'752 256 Bit 64 MB 16 GB PCIe 4.0 x16 GA103: 6 GPC, 60 SM @ 320 Bit, 4 MB L2
AD104 5 GPC, 30 TPC, 60 SM 7680 192 Bit 48 MB 12 GB PCIe 4.0 x16 GA104: 6 GPC, 48 SM @ 256 Bit, 4 MB L2
AD106 3 GPC, 18 TPC, 36 SM 4608 128 Bit 32 MB 8 GB PCIe 4.0 x8 GA106: 3 GPC, 30 SM @ 192 Bit, 3 MB L2
AD107 3 GPC, 12 TPC, 24 SM 3072 128 Bit 32 MB 8 GB PCIe 4.0 x8 GA107: 2 GPC, 20 SM @ 128 Bit, 2 MB L2
Anmerkung: Angaben zu noch nicht vorgestellter Hardware basieren auf Gerüchten & Annahmen