3

News des 3. November 2022

Wahrscheinlich weiterhin der Pferdefuß der RDNA3-Riege wird deren RayTracing-Performance sein, da die von AMD gezeigten Benchmarks derzeit keinen Ansatz ergeben, dort einen generell größeren Performance-Gewinn als unter gewöhnlichen Raster-Rendering zu sehen. Möglicherweise ist es in der Praxis noch leicht besser, aber eine gravierende Differenz in der Mehrperformance zwischen Raster & RayTracing hätte eigentlich auch mit den wenigen von AMD gezeigte Benchmarks sichtbar sein müssen (die +85% unter Dying Light 2 könnten ein Ausreißer sein, wurden zudem unter FSR erzielt). Bei RayTracing wird nVidia also weiterhin (klar) vorn liegen – aber dennoch reicht AMDs besserer Preisansatz aus, um dies wenigstens beim Preis/Leistungs-Verhältnis zu übertünchen.

Liste 4K Raster P/L 4K RayTr P/L
GeForce RTX 4090 $1599 640% ~104% 100% ~104%
Radeon RX 7900 XTX $999 ~530-560% ~142% ~55-60% ~96%
Radeon RX 7900 XT $899 ~470-500% ~141% ~50% ~95%
GeForce RTX 4080 $1199 ~450-470% 100% ~70-75% 100%
GeForce RTX 4080 12GB (unlaunched) $899 ~350-370% ~104% ~55% ~104%
Performance-Angaben außerhalb der GeForce RTX 4090: Allesamt spekulative Hochrechnungen! Darauf basierende Preis/Leistungs-Rechnungen sind demzufolge mit einiger Fehlerquote zu verstehen, sollen nur die grobe Richtung anzeigen.

Zu dessen Ermittlung kamen wieder Performance-Hochrechnungen zum Einsatz, deren Kern die Annahme darstellt, dass zwischen Radeon RX 6950 XT und Radeon RX 7900 XTX eine Mehrperformance von +45-50% existiert. Hier ist also sehr wohl noch Platz nach oben, hoffentlich hingegen kein Platz nach unten. Rechnet man darauf basierend Raster- und RayTracing-Performance der neuen AMD-Grafikkarten hoch und setzt dies ins Verhältnis zu den jeweiligen Listenpreisen, dann erzielen beide neuen AMD-Grafikkarten ein um ca. +40% besseres Preis/Leistungs-Verhältnis gegenüber der GeForce RTX 4080 bei der Raster-Performance. Doch selbst unter RayTracing liegt AMD gemäß dieser Hochrechnung nur 4-5% schlechter, da zwar nVidia bei der reinen RayTracing-Performance vorn liegt, dies jedoch auch mit einem klar höheren Preispunkt der GeForce RTX 4080 erkauft wird.

Der beste Vergleich auf preislicher Waffengleichheit wäre dann die (bekanntlich zurückgezogene) GeForce RTX 4080 12GB gegen eine Radeon RX 7900 XT zu beiderseits 899 Dollar Listenpreis: Hierbei sollte AMD ca +35% mehr Raster-Performance bieten, während der Rückstand bei der RayTracing-Performance mit ca. –10% vergleichsweise ertragbar wäre. nVidias großer Vorteil bei der RayTracing-Performance liegt also vor allem in Preisbereichen, welche AMD mit der Radeon RX 7900 Serie (derzeit) gar nicht beackert. Tiefer im Portfolio und zu gleichen Preisen gerechnet nähern sich RDNA3 und Ada Lovelace dagegen deutlich an bei der RayTracing-Performance. Dass AMD nach wie vor den größeren Performance-Abschlag bei der RayTracing-Performance aufweist, ändert sich damit mitnichten, dies wird nur eben ganz gut über den gemachten Preispunkt egalisiert.

Nichtsdestrotz ist auch die Sichtweise auf die reinen Performance zu berücksichtigen – und da hinterließ die RDNA3-Vorstellung teilweise lange Gesichter, hatte man sich zumeist einiges mehr vorstellt. Die Leaker sind nunmehr trotz sicherlich korrekt vorhergesagter technischer Daten zum zweiten Mal bei der Performance-Prognose um ein gutes Stück daneben (zu optimistisch) gelegen – inzwischen sollte man wohl überlegen, deren Angaben mit einem "Leaker-Offset" zu betrachten. Dabei gibt AMD selber schon Hinweise, wieso da nicht mehr drin war: Die Chipfläche ist deutlich kleiner als bei nVidia (522mm² mit einem 2/5tel 6nm-Anteil vs. 609mm²) und die hohe nominelle Rechenleistung (nahezu dreifache FP32-Power gegenüber Navi 21) wird über den gleichen Kunstgriff wie seinerzeit bei nVidias Ampere-Architektur gelöst: Die Shader-Cluster werden auf einen Durchsatz von 128 FP32 aufgepumpt.

Navi 21 Navi 31 Differenz
Chipfläche 519mm² (7nm) 522mm² (300mm² @5nm + 222mm² @6nm) ~ fast gleich
Transistoren 26,8 Mrd. 58 Mrd. +116%
Raster-Engines 4 6 +50%
Shader-Cluster 80 96 +20%
FP32 pro Shader-Cluster 64 128 +100%
FP32-Einheiten insgesamt 5120 12'288 +140%
FP32-Rechenleistung 21,5 TFlops  (6950XT) 61,6 TFlops  (7900XTX) +186%
ROPs 128 192 +50%
Infinity Cache 128 MB 96 MB –25%
Speicherinterface 256 Bit GDDR6 384 Bit GDDR6 +50%

Wie bei nVidia hat man sich dabei wohl die ganz großen Investitionen in Verdrahtungslogik zum Hochhalten der Rechenwerks-Auslastung gespart. Von der doppelten FP32-Anzahl pro Shader-Cluster kommt somit immer nur ein maßvoller Teil als Mehrleistung an, die Differenz zwischen nomineller FP32-Mehrleistung und praktisch in realen Spielen erreichter FP32-Mehrleistung dürfte gravierend sein. Dies hätte man vorab wohl stärker thematisieren sollen, denn die Methode der aufgepumpten Shader-Cluster wird augenscheinlich gezielt dann eingesetzt, wenn man sich das "Mehr" an Verdrahtungslogik tatsächlich sparen will. Wollte man dies nicht, hätte AMD schließlich auch einfach die doppelte Anzahl an Shader-Clustern mit gewöhnlichen 64x FP32 pro CU verbauen können (was dann deutlich größer geworden wäre und andere/weitere Problem nach sich zieht).

AMD hat sich für den kleineren Ansatz entschieden, liefert damit ähnlich viel Mehrperformance wie nVidia ab, kommt dafür aber auch mit dem deutlich kleineren, ergo wirtschaftlicherem Chip heraus. Dass Navi 31 mit dem klar geringeren Silizium-Aufwand gegenüber nVidias AD102 selbigen nicht bei der Performance schlagen kann, ist dann das natürlichste von der Welt. Dies musste AMD sicherlich bereits ahnen können, als man über die Chip-Größe von AD102 Bescheid wusste. Damit kann AMD unmöglich ganz an der Leistungsspitze mitspielen – was dann aber einfach eine frühe Design-Entscheidung darstellt und auch nichts wirklich schlechtes bedeuten muß. Schließlich entfacht AMD nunmehr den Konkurrenzkampf dort, wo nVidia derzeit die Preislagen maßgeblich hochziehen will: In allen Segmenten unterhalb des im vierstelligen Preisbereich liegenden Enthusiasten-Segments.

ComputerBase und VideoCardz berichten über die Vorstellung der nächsten Grafikkarten-Generation seitens des chinesischen Grafikchip-Entwicklers "Moore Threads". Dessen Erstlingswerke gab es erst in diesem März, die neue Generation legt dann insbesondere im Spiele-Bereich deutlich oben drauf: Während die vorherige Gaming-Karte "MTT S60" mit 2048 FP32-Einheiten, 6 TFlops Rechenleistung und 128 Bit LPDDR4X-Interface sicherlich nur dem Einsteiger-Segment zuzuordnen war, geht die neue Gaming-Karte "MTT S80" mindestens in den Mainstream-Bereich hinein: 4096 FP32-Einheiten, 12 TFlops Rechenleistung und ein 256-Bit-Interface mit 16 GB GDDR6-Speicher werden hiermit geboten.

MTT S60 MTT S2000 MTT S80 MTT S3000
Architektur MUSA "Sudi" MUSA "Chunxiao"
MUSA-Cores (FP32) 2048 4096 4096 4096
Rechenleistung 6 TFlops 12 TFlops 14 TFlops 15,2 TFlops
Speicher 8 GB LPDDR4X 32 GB 16 GB GDDR6 32 GB GDDR6
Bauweise & Kühlung SingleSlot, SingleFan SingleSlot, passiv DualSlot, TripleFan DualSlot, passiv
Ausgänge 3x DisplayPort 1.4 keine 3x DisplayPort 1.4a, 1x HDMI 2.1 2x DisplayPort 1.4a
API-Support DirectX, OpenCL, OpenGL, Vulkan, CUDA DirectX, OpenCL, OpenGL, Vulkan
Einsatzzweck Gaming (Entry-Segment) Workstation Gaming (Mainstream) Workstation
Vorstellung März 2022 November 2022

Auf AMD-Seite entspricht diese Rechenleistung grob einer Radeon RX 6700 XT, auf nVidia-Seite hingegen einer GeForce RTX 3060 – womit auch schon klar ist, das eine Einordnung nur anhand der FP32-Rechenleistung wenig zielführend ist. Doch wenigstens deutet sich hiermit ein tatsächlich kraftvolles Stück Hardware an, insofern natürlich der Hersteller diese Rechenleistung auch anständig auf die Straße bekommt. Leider wurde auch diesesmal nichts zu den genauen Versionsnummern des Supports von DirectX, OpenGL und Vulkan gesagt, eine Aufstellung unterstützter Spiele zeigte primär etwas ältere Titel à League of Legends & Modern Warfare 3. Einen CUDA-Support erwähnte man diesesmal nicht, wobei immer noch unklar ist, wie man jenen zur letztjährigen Vorstellung hat nennen können.

Hieran schließt sich gleich ein grundsätzliches Problem dieser "Moore Threads" Grafikkarten an: Deren Vorgänger wurden wie gesagt in diesem Frühjahr vorstellt – und dann war nie wieder etwas davon zu hören bis zur Vorstellung jenes Nachfolgers. Ob diese vorherige Grafikkarten-Generation also tatsächlich gebaut und verbaut wurde, ist im eigentlichen unbelegt. Zumindest kann man sagen, dass das Projekt sicherlich China-only ist, der Hersteller dieses Geschäftsmodell womöglich auch noch für die nächste Zeit beibehält. Eine wirkliche Konkurrenz zu AMD, Intel & nVidia ergibt sich hieraus somit noch nicht. Dabei könnte im Gegensatz zur vorherigen Generation die neue Gaming-Lösung durchaus interessant sein, vorbehaltlich natürlich der Klärung kleiner, unwichtiger Details wie des exakten Spiele-Supports unter neueren DirectX-Versionen.