26

News des 26. März 2024

Eine mit der Launch-Analyse zur Radeon RX 7900 GRE offengeblieben Frage war diese, inwiefern die kleineren nVidia-Modelle bis zur GeForce RTX 4060 Ti eventuell noch eine Anpassung der Index-Werte im 3DC Performance-Index benötigen würden, so wie nach der Launch-Analyse zum GeForce RTX 40 "SUPER" Refresh für die größeren nVidia-Modell ab der GeForce RTX 4070 getan. Im Blickfeld steht dabei insbesondere die FullHD-Performance, wo durch neuere Prozessoren sowie selbst unter kleineren Auflösungen forderndere Spiele-Titel die Index-Werte beachtbar nach oben getrieben wurden. Ausgangspunkt hierfür waren die teils zu großen gemessenen Differenzen zwischen GeForce RTX 4060 Ti und 4070, was gemäß 3DC-Index unter FullHD +25,3% betragen sollte, bei einigen Hardwaretestern hingegen Werte von bis zu +35% erreichte.

FullHD/1080p TPU-alt TPU-neu 3DC-Index
GeForce RTX 3070 8GBGeForce RTX 3080 10GB +21,9% +26,1% +23,2%
GeForce RTX 3060 12GBGeForce RTX 3070 8GB +50,6% +46,8% +48,7%
GeForce RTX 3060 12GBGeForce RTX 3080 10GB +83,5% +85,1% +83,2%
Quellen: TechPowerup #1 (alt), TechPowerUp #2 (neu), 3DC FullHD Performance-Index

Auf Basis der wenigen zur Verfügung stehenden Werte zu diesem Vergleichs-Paar war dieser Fall nicht aufzuklären, allerdings ergab sich aufgrund anderer Vergleiche der Verdacht, dass hier die jeweilige VRAM-Menge schon am wirken war – gerade auch, weil die 16GB-Ausführung der GeForce RTX 4060 Ti im Schnitt durchaus den erwarteten Index-Wert erreichte. Jener Verdacht kam auf, da sich die Performance von GeForce RTX 3070 (8GB) und GeForce RTX 3080 (10GB) gegenüber umliegenden Grafikkarten anderer Generationen unauffällig verhielten, der direkte Vergleich jedoch ebenfalls eine höhere Differenz als erwartet ergab. Genauer läßt sich dies nunmehr mit den vorstehenden Benchmarks eruieren, welche aktuelle Performance-Werte dieser GeForce RTX 30 Modelle gegenüber der Performance zum Launch der GeForce RTX 4060 von letztem Sommer in den Vergleich stellen. Hierbei zeigt sich erst einmal zwischen GeForce RTX 3070 und 3080 der schon genannte Vorteil unter neueren Benchmarks zugunsten der stärkeren Karte – von bisher +21,9% auf nunmehr +26,1% Performance-Differenz.

Allerdings kommt jene Differenz gemäß der weiteren Vergleiche nicht über eine tatsächliche Leistungssteigerung zustande, sondern wohl eher über einen VRAM-gebundenen Effekt. Denn genauso wie die Performance-Differenz zwischen GeForce RTX 3070 und 3080 größer ausfällt, wird jene zwischen GeForce RTX 3060 und 3070 hingegen kleiner – die 3070 rutscht somit nur etwas zurück in der Hackordnung, es findet jedoch kein allgemeiner Performance-Boost statt. Gut läßt sich dies mittels des Vergleichs von GeForce RTX 3060 zu 3080 belegen, welcher nahezu identisch ausfällt. Natürlich gibt es hier noch eine kleine restliche Differenz, aber jene ist aufgrund der Rundung der Performance-Werte bei TechPowerUp nicht belegkräftig genug (und natürlich auch zu klein). Der größte Teil dieser Performance-Differenz kommt augenscheinlich aus der VRAM-Ansetzung, denn dies ist der große Nachteil der GeForce RTX 3070 (8GB) gegenüber GeForce RTX 3060 (12GB) und 3080 (10GB).

Im groben dürfte diese Erklärung auch für den Fall der GeForce RTX 4060 Ti gelten, die Benchmark-Werte zu deren 16-GB-Ausführung hatten selbiges schließlich bereits vermuten lassen. Die Index-Werte dieser kleineren Grafikkarten müssen somit nicht geändert werden bzw. ist der hiermit zu sehende "Restbetrag" an nicht VRAM-gebundenem Performanceboost zu gering, um dies tun zu müssen. Die bis hier her eigentlich kleine Nebengeschichte führt damit allerdings auch zu einer insgesamt bedeutsamen Erkenntnis: 8-GB-Grafikkarten können heutzutage ihre volle Performance (selbst unter FullHD) schon nicht mehr ausfahren, verlieren aus VRAM-Mangel hier und da einige Prozentpunkte. Der Effekt ist derzeit noch klein und fällt daher nur bei sehr genauer Betrachtung auf, fängt aber eben schon an zu wirken (und wird natürlich nie mehr besser werden).

Dabei kann jener Effekt bei anderen Hardwaretests auch schon größer ausfallen, immerhin testen TechPowerUp mit einem Benchmark-Feld von 25 Spieletiteln, wovon nicht jeder brandneu ist. Konzentriert man sich auf weniger Benchmarks aus vorwiegend sehr neuen Spieletiteln, sind auch griffigere Performance-Differenzen gegen 8-GB-Grafikkarten vorstellbar. Die Performance von 8-GB-Grafikkarten ist damit heuer gar nicht mehr fair zu ermitteln, wenn man VRAM-Neutralität anstrebt – weswegen deren Index-Werte im 3DC Performance-Index zukünftig nicht weiter aktualisiert werden können, da nunmehr eher zurückgehende Performance-Ergebnisse zu erwarten sind. Und für neu herauskommende Grafikkarten bedeutet dies, dass sich jene eigentlich keineswegs mehr mit nur 8 GB VRAM blicken lassen dürfen. Die 10 GB einer GeForce RTX 3080 sind derzeit augenscheinlich das neue Mindestmaß, um die vorhandene Rohpower selbst schon unter der FullHD-Auflösung komplett ausfahren zu können.

Auch wenn "Gaming-Blackwell" angeblich mit nicht (bedeutsam) mehr TDP als bisher "Ada Lovelace" antreten soll, sowie die augenscheinlich benutzte 4nm-Fertigung kein großes Potential zur Effizienz-Steigerung (gegenüber der 5nm-Fertigung von "Ada Lovelace") hat, bringt der verwendete GDDR7-Speicher dennoch einen gewissen Einspareffekt mit sich – was dann an anderer Stelle zugunsten von mehr Strom für die eigentlichen Recheneinheiten des Grafikchips verbraten werden kann. Denn damit spart man sich den GDDR6X-Speicher mit aufwendigem PAM4-Signalverfahren, welches die Speicherinterfaces in den Grafikchips selber beachtbar mehr Strom verbrauchen läßt. Dies war seinerzeit am deutlichsten im Vergleich von GeForce RTX 3070 zu 3070 Ti zu sehen, welche von Hardware und Performance her eng beeinander liegen, wo allerdings das Ti-Modell primär wegen des GDDR6X-Speichers gleich gut 70 Watt mehr verbrauchte.

Hardware Taktraten 4K-Perf. Real-Verbr.
GeForce RTX 3070 Ti GA104, 48 SM @ 256 Bit GDDR6X 1575/1770 MHz & 19 Gbps 272% 292W
Differenz:   +4,3% (SM) +5,0%, +2,6%, +35,7% +7,9% +32,1%
GeForce RTX 3070 GA104, 46 SM @ 256 Bit GDDR6 1500/1725 MHz & 14 Gbps 252% 221W
Performance gemäß 3DC 4K Perf-Index, Realverbrauch gemäß Stromverbrauchs-Übersicht

In dieser Differenz ist natürlich auch ein Anteil enthalten, welcher in den anderen Hardware-Spezifikationen der GeForce RTX 3070 Ti begründet liegt, so etwas mehr freigeschaltete Shader-Cluster sowie höherer Chiptakt. Zugleich kostet das Herausholen der letzten Reserven immer übermäßig an Stromverbrauch, ergo läßt sich nur ein Teil dieser 70W-Differenz auf den GDDR6X-Speicher zurückführen. Ein anderes Beispiel ist die GeForce RTX 3060 Ti in ihrer seltenen GDDR6X-Ausführung, welche ansonsten Hardware-technisch gleich zur regulären GeForce RTX 3060 Ti ist. Jenes Sonder-Modell bekam nur wegen des GDDR6X-Speichers sogar eine abweichende TDP von 225 Watt, in diesem Fall sind es somit also nur +25 Watt Differenz wegen des GDDR6X-Speichers. Da hierbei natürlich auch ein wenig vom Verbrauchspotential der eigentliche Recheneinheiten abgeknabbert sein könnte, dürfte die Wahrheit zum Mehrverbrauch von GDDR6X irgendwo in der Mitte zwischen 25 bis ca. 50 Watt liegen.

Die Formulierung "Mehrverbrauch von GDDR6X" bezieht sich dabei immer auf das Speicherinterface im Grafikchip selber, denn die eigentlichen Speicherchips verbrauchen derart wenig (im Bereich 1-2 Watt pro Speicherchip), dass es bei diesen eher nur auf die verbaute Anzahl ankommt. Auch beziehen sich die Verbrauchs- und Effizienz-Angaben der Speicherchip-Hersteller immer nur auf ihre eigenen Speicherchips, was jedoch den eigentlich größten Verbraucher der ganzen Konstruktion außer acht läßt – eben das Speicherinterface im Grafikchip. Selbiges könnte bei "Gaming-Blackwell" durch den Schritt von GDDR6X zu GDDR7 maßgeblich entlastet werden, da GDDR7 das einfachere Signalmodulierungs-Verfahren PAM3 (anstatt dem komplizierten PAM4 bei GDDR6X) verwendet. Wenn hierüber denkbarerweise 30-40 Watt eingespart werden, ist dies aus Sicht von Grafikchips im Rahmen von 200-300 Watt TDP eine ganze Menge. Damit wäre dann eine Ausweitung der Transistorenmenge, höhere Taktraten oder ein Mix aus beidem realisierbar, ohne die letztlich herauskommende TDP steigern zu müssen.

Dies ist somit ein Potential, welches Gaming-Blackwell heben kann – und heben muß, denn auf Basis der 4nm-Fertigung wird man alles an kleinen und kleinsten Verbesserungen zusammenkehren müssen, um auf ein insgesamt vorzeigbares Resultat zu kommen. Daneben könnte nVidia bemüht sein, Ansatzpunkte zugunsten der neuen Grafik-Generation zu finden, welche außerhalb einer platten, regulären Performance-Steigerungen liegen. Dies könnte im Feld von Upscalern liegen – wobei da die großen Performance-Potentiale eigentlich nur bei der Frame-Generierung liegen, was bei vielen Nutzern jedoch wenig Begeisterung hervorruft. Oder aber nVidia könnte sich der weiteren Beschleunigung von RayTracing zuwenden, womit man dort zulegen würde, wo aktuell noch echter Leistungsbedarf herrscht – was somit viel eher goutiert werden dürfte. Leider besteht aufgrund der für die nachfolgende Generation wohl eingestellten Gegenwehr (im HighEnd-Segment) seitens AMD durchaus das Risiko, dass nVidia zwar an solchen Dingen arbeitet, jenes bei Gaming-Blackwell aber noch nicht ausfährt, sondern sich für nachfolgende Generationen aufbehält.