14

News des 14. Juni 2023

Igor's Lab haben die Workstation-Karte "Radeon Pro W7800" als hypothetische "Radeon RX 7800 XT" einem kompletten Gaming-Test unterzogen – in Vorwegnahme einer möglicherweise mit selber Hardware antretenden Consumer-Karte. Da die TDP und auch das Energieeffizienz-Profil beider Karten (gerade zwischen diesen unterschiedlichen Marktsegmenten) keineswegs deckungsgleich ist, hat man auf die derart simulierte Radeon RX 7800 XT immer noch einen Offset oben drauf gerechnet – woraus dann die Performance einer "kalkulierten" Radeon RX 7800 XT entstand. Selbige kommt grob in der Mitte zwischen GeForce RTX 4070 und 4070 Ti heraus, was eine Markt-technisch sinnvolle Sache für AMD wäre: Mit der 4070Ti legt sich schon die Radeon RX 7900 XT an, darunter befindet sich allerdings viel preislicher Platz, welcher derzeit nicht von Ada/RDNA3-Lösungen beackert wird.

Hardware R+RT: WQHD R+RT: 4K Raster: WQHD Raster: 4K
Radeon RX 7900 XT Navi 31, 84 CU @ 320 Bit, 20 GB GDDR6, 315W 129,8% 134,4% 128,4% 132,8%
GeForce RTX 4070 Ti AD104, 60 SM @ 192 Bit, 12 GB GDDR6X, 285W 117,1% 122,4% 114,3% 119,3%
Radeon RX 7800 XT (kalkuliert) Navi 31, 70 CU @ 256 Bit, 16 GB GDDR6, ~300W 108,0% 112,5% ~107% ~111%
Radeon RX 7800 XT (simuliert) Navi 31, 70 CU @ 256 Bit, 16 GB GDDR6, 260W 102,5% 103,9% 101,7% 102,3%
GeForce RTX 4070 AD104, 46 SM @ 192 Bit, 12 GB GDDR6X, 200W 97,6% 98,5% 94,7% 98,1%
Radeon RX 6800 XT Navi 21, 72 CU @ 256 Bit, 16 GB GDDR6, 300W 100% 100% 100% 100%
gemäß der Benchmarks von Igor's Lab mit 7 Raster- und 2 RayTracing-Tests

Bemerkenswert an diesem Vorab-Test ist der wieder einmal magere RDNA3-Gewinn, wenn sich zwischen Radeon RX 6800 XT und kalkulierter Radeon RX 7800 XT eine Mehrperformance von gerade einmal +8-12% ergibt. Vielleicht kommt die reale Radeon RX 7800 XT hier und da noch etwas besser heraus, denn in einigen Benchmarks liegt die simulierte Karte auffällig hinter der Radeon RX 6800 XT zurück – dies zeigt eher auf nicht funktioniertende Spieloptimierungen zugunsten der getesteten Workstation-Karte hin. Wo die Performance der Radeon RX 7800 XT auf dieser Hardware-Basis landet, ist aber am Ende sowieso eine reine Entscheidung AMDs: Mit dem Navi-31-Chip hat man alle Möglichkeiten offen, kann genau das passende Performance-Level anpeilen und erreichen. Auf Basis des kleineren Navi-32-Chips wäre man hingegen an dessen technischer Maximalgestaltung limitiert, wo es eben nur 60 Shader-Cluster gibt.

Eingedenk das bisher von RDNA3 gezeigte, ist mit diesen 60 Shader-Clustern des Navi-32-Chips selbst bei hohen Taktraten und viel TDP kaum mehr als das Performance-Level der Radeon RX 6800 XT erreichbar. Dies würde dann einen Kontrahenten zur GeForce RTX 4070 ergeben, was allerdings auch klar niedrigere Preislagen erfordert. Mit der Radeon RX 7800 XT auf Navi-31-Basis würde AMD somit eher eine 700-Euro-Karte im Zwischenraum zwischen GeForce RTX 4070 & 4070Ti ansiedeln können, während der Navi-32-Chip sich in Form der Radeon RX 7800 non-XT dann auf den Zweikampf mit der GeForce RTX 4070 im Feld von 550-600 Euro konzentrieren könnte. Aller Vermutung nach lag AMDs ursprünglicher Plan wohl darin, dies beides mit dem Navi-32-Chip zu erreichen, die hier aufgezeigte Lösung würde aber natürlich den Zweck vernünftiger Midrange-Angebote auf RDNA3-Basis genauso erfüllen.

AMD RDNA3 Preislage nVidia Ada Lovelace
Radeon RX 7900 XT
Navi 31, 84 CU @ 320 Bit, 20 GB GDDR6, 315W
ca. 800-900 Euro GeForce RTX 4070 Ti
AD104, 60 SM @ 192 Bit, 12 GB GDDR6X, 285W
Radeon RX 7800 XT
Navi 31, 70 CU @ 256 Bit, 16 GB GDDR6, ~300W
ca. 700 Euro
Radeon RX 7800
Navi 32, 60 CU @ 256 Bit, 16 GB GDDR6
ca. 550-600 Euro GeForce RTX 4070
AD104, 46 SM @ 192 Bit, 12 GB GDDR6X, 200W

Tom's Hardware berichten über den japanischsprachigen Test der "MTT S80" Grafikkarte seitens PC Watch. Jener wurde allein mit DirectX-9/11-Spieletiteln angetreten, da die MTT-Karte bis jetzt kein DirectX 12 oder Vulkan beherrscht. Die Benchmark-Ergebnisse bleiben allerdings schwach, im Vergleich zur GeForce GTX 1050 Ti kommt man (unter Herauslassung des Extrems von "Asetto Corsa") auf grob nur die Hälfte von deren Performance. Wie mit vorherigen Tests dieser chinesischen Grafikkarte bereits ermittelt, ergibt dies die Performance-Klasse der GeForce GT 1030 GDDR5 – was bei einer Leistungsaufnahme von gemittelt 142 Watt unter Spielen (die doppelt so schnelle GeForce GTX 1050 Ti liegt bei 60W) wirklich mager ist.

Nochmals (deutlich) weiter zurückliegend ist die Glenfly Arise 1020, eine neue Grafikkarte des chinesischen Anbieters "Glenfly", einer Tochter des CPU-Unternehmens "Zhaoxin" mit Zugriff auf die früheren VIA/S3-Patente, welche Twitterer Löschzwerg derzeit austestet. Vorteilhaft ist der (vollständige) Support für OpenGL und DirectX 11, nachteilig sind die nur 256 Shader-Einheiten an einem 64-Bit-Interface (mit nur 2 GB DDR4-Speicher). Davon ist logischerweise keine gute Performance zu erwarten, die Benchmark-Werte unter dem 3DMark13 (FireStrike: 562 Graphics-Punkte) liegen dann auch weit unterhalb selbst einer GeForce GT 1030 (3369 Graphics-Punkte). Hier handelt es sich ergo um eine reine Office-Karte für den Fall eines Prozessors ohne iGPU oder aber zum Zweck weiterer Monitor-Anschlüsse. Jenes Feld wird von AMD & nVidia kaum noch mit neuen Lösungen beackert, typische Gegner wären somit GeForce GT 1010 und 710 – wobei letztere im 3DMark13 immer noch doppelt so schnell herauskommt (1064 Graphics-Punkte) wie die Glenfly-Karte.

Zur PCI-Express-Entwicklung gab es in den Kommentaren zur gestrigen News den beachtenswerten Hinweis, dass es für derart viel PCIe-Bandbreite derzeit noch keine Speicherbandbreite gibt. Zwar liegt das PCIe-Interface in der CPU selber, aber letztlich verschickt jene in diesem Ausmaß dann auch nur Daten, welche im PC-Hauptspeicher liegen – womit die Speicherbandbreite (zum RAM) größer sein muß als die PCIe-Bandbreite, ansonsten kann letztere gar nicht ausgenutzt werden. Derzeit ist dies noch kein Problem, selbst die Bandbreite von PCI Express 5.0 könnte man schon mit DDR4/4000 toppen. Auch für PCI Express 6.0 existiert schon eine technische Lösung, wenngleich nur in der Form des sehr teuren DDR5/7600-Speichers. Für PCI Express 7.0 wird man dagegen abwarten müssen, was das Jahr 2027 an Speicher-Taktungen mit sich bringt.

DDR-Speicher (DualChannel) PCI Express
DDR4/2133 = 34,1 GB/sec PCI Express 4.0 x16 = 31,5 GB/sec
DDR4/4000 = 64,0 GB/sec PCI Express 5.0 x16 = 63,0 GB/sec
DDR5/7600 = 121,6 GB/sec PCI Express 6.0 x16 = 120,7 GB/sec
? PCI Express 7.0 x16 = 240,7 GB/sec

Es ist aber jetzt schon abzusehen, dass es auf DDR6/13200 hinauslaufen wird – sofern jenes bis dahin verfügbar ist. Dies könnte gerade so gelingen, wird aber knapp – und spätestens danach sieht es schlecht aus: Sofern PCI Express 8.0 wieder derart schnell hinterher folgt, ist die aktuelle Entwicklungsgeschwindigkeit im Speicherbereich nicht ausreichend, um dies mit ausreichend Speicherbandbreite füttern zu können. Spätestens dann könnte eine Auftrennung der konkreten Produktentwicklung in HPC- und Consumer-Segment erfolgen. Angesicht dieser nahezu automatischen Entwicklung könnte jene Auftrennung aber auch schon früher erfolgen – sprich das Consumer-Segment neue PCIe-Normen nicht mehr oder nur stark verspätet übernehmen. Im Server- und HPC-Segment dürfte man hingegen (wegen der größeren Speicherinterfaces) nie ein Problem mit diesen stark ansteigenden PCIe-Bandbreiten haben.