29

Hardware- und Nachrichten-Links des 29. März 2021

Twitterer Kepler_L2 hat in Linux-Patches seitens AMD eine belastbare Angabe zur Größe des Infinity Cache bei Navi 23 erspäht: Im Gegensatz zum letzten Spezifikations-Leak sind es nur 32 MB – und nicht 64 MB. Vermutlich ändert dies jedoch gar nichts an der Zielsetzung der Karte, welche offiziell als "Premium FullHD" Beschleuniger antreten soll. Der kleinere Infinity Cache kann dafür ebenfalls ausreichend sein, allein der Leistungsverlust zu größeren Auflösungen wird dann um so harscher ausfallen und Navi 23 somit oberhalb von FullHD wohl kaum benutzbar sein. Die größere Abspeckung an dieser Stelle passt allerdings ganz gut zur (gegenüber Navi 22) wesentlich kleineren Chipfläche (336mm² → 236mm²) bei gleichzeitig nur wenig veränderter Anzahl an Shader-Clustern (40 → 32). Denkbar, dass diese vergleichsweise ungewöhnliche Konstellation eben genau unter FullHD eine gute Performance entfaltet – und für etwas anderes ist der Navi-23-Chip dann einfach nicht gedacht.

RDNA1 RDNA2
HighEnd - Navi 21
80 CU @ 256-bit, 128MB IF$, 16 GB
Midrange Navi 10
40 CU @ 256-bit, 6-8 GB
Navi 22
40 CU @ 192-bit, 96MB IF$, 6-12 GB
Mainstream Navi 14
24 CU @ 128-bit, 3-8 GB
Navi 23
32 CU @ 128-bit, 32MB IF$, 4-8 GB
Entry - Navi 24
16-24 CU @ 64/128-bit, 4 GB
Anmerkung: Hardware-Daten zu noch nicht veröffentlichten Chips basieren weitgehend auf Gerüchten & Annahmen

Mittels dieser stärkeren Abspeckung des Infinity Caches bei Navi 23 erübrigt sich wohl gleichzeitig auch die Frage, ob der im zweiten Halbjahr 2021 zu erwartende "Navi 24" Chip ebenfalls einen solchen tragen wird: Wenn Navi 23 bereits derart deutlich abgespeckt wird, ist bei Navi 24 dann sicherlich kein Platz mehr für diesen extra Cache. Indirekt deutet auch die genauso dem vorstehend verlinkten Tweet zu entnehmende Information darauf hin, wonach AMDs "van Gogh" APU mit erstmals RDNA2-basierter Grafiklösung ebenfalls ohne Infinity Cache antritt. Wie schon bei den Spielekonsole-SoCs vorexerziert, ist der Infinity Cache keine Bedingung von RDNA2, sondern kann in AMDs Baukasten-System hinzugetan oder weggelassen werden. Jener Cache lohnt sich primär dann, wenn es darum geht, große Speicherinterfaces zu vermeiden – sei es wegen deren Stromdurst, der eingesparten Chipfläche oder weil sich somit ungünstige Konstellationen zwischen Interface-Breite und Größe des Speicherausbaus vermeiden lassen (Navi 22 mit 256-Bit-Interface aber ohne IPC hätte nur 8 oder 16 GB Grafikkartenspeicher zugelassen).

Abseits des fast sicher fehlenden Infinity Caches sowie einer gerüchteweisen Information zu einem angeblichen 64-Bit-Speicherinterface ist jedoch noch so gut wie überhaupt nichts zu "Navi 24" bekannt. AMD könnte hier einen vergleichsweise "normal" abgespeckten Einsteiger-Chip mit vielleicht sogar bis zu 24 Shader-Cluster an einem 128-Bit-Interface aufstellen – dies wäre im übrigen exakt die Hardware des Navi-14-Chips der Radeon RX 5500 Serie. Alternativ kann man dieses Performance-Feld aber auch mit Navi-23-Salvagelösungen beackern und bei Navi 24 noch tiefer heruntergehen: Denkbar wären somit ab 16 Shader-Cluster an einem 64-Bit-Interface. Dies wäre dann eine echte LowCost-Lösung, wie sie lange Zeit nicht mehr aufgelegt wurde – und welche dann üblicherweise viele Jahre lang weiterverwendet wird. Es gibt halt immer noch einen gewissen Markt an einfachen Billig-Grafikkarten, wo zuerst die zusätzlichen Display-Kapazitäten wichtig sind, weniger denn die 3D-Performance. Gänzlich leistungslos würde Navi 24 selbst bei der genannten minimalistischen Hardware-Ausführung nicht werden (Niveau GeForce GTX 1650 erscheint machbar) – aber dafür kann die Chipfläche tief herunter, runde 110mm² wären in der minimalistischen Ausführung anpeilbar.

VideoCardz berichten über Benchmarks aus dem chinesischen Chiphell-Forum, mit welchen die Performance-Auswirkungen von Resizable BAR bei der GeForce RTX 3090 gemessen wurden. Unter 6 Spielen ergab sich hierbei ein gemittelter rBAR-Vorteil von +3,2% – was um so beachtlicher aussieht, als dass dieses Ergebnis unter der 4K-Auflösung erzielt wurde. Die PCGH hatte in ihrem neuen Testparcour für die Radeon RX 6900 XT unter der 4K-Auflösung gemittelt nur +2,0% herausbekommen – was allerdings durch das größere Testfeld (20 Titel) erklärt wird, damit werden dann auch einige Spieletitel darunter sein, wo rBAR bzw. SAM nichts bringt. Auch bei nVidia wird der Vorteil unter größeren Testfeldern im Schnitt kleiner ausfallen – dafür aber unter kleineren Auflösungen wiederum nach oben gehen. Damit ergibt sich ein erster guter Hinweis darauf, dass auch nVidia von Resizable BAR gutklassig profitieren kann. Allerdings muß nVidia bei den Spieletiteln mit rBAR-Support noch zulegen, denn die derzeitige Liste von gerade einmal 8 Spielen ist definitiv zu kurz, dies läßt AMD in diesem Wettstreit weiterhin einen Vorteil.

Denn Performance-Vergleich der Grafikchip-Architekturen RDNA1 vs. RDNA2 ist man bei der ComputerBase sowie ExtremeTech angegangen, jeweils realisiert über Performance-Messungen zwischen den jeweils mit 40 Shader-Clustern ausgestatteten Radeon RX 5700 XT (Navi 10, RDNA1) und Radeon RX 6700 XT (Navi 22, RDNA2) auf gleichen Taktraten. Trotz anderer Herangehensweise sind sich beide Testberichte dabei einig, dass unter regulären Bedingungen die RDNA2-Architektur auf gleicher Anzahl an Shader-Clustern sowie gleicher Taktrate etwas schneller als RDNA1 ist – bei der ComputerBase sind dies gemittelt +1,9% unter der WQHD-Auflösung. Hier spielt natürlich (fast) untrennbar der Infinity Cache mit hinein – ein Punkt, welcher das etwas kleinere Speicherinterface der Radeon RX 6700 XT (nur 192 bit gegenüber den 256 Bit der Radeon RX 5700 XT) mehr als ausgleicht. Ihren hauptsächlichen Vorteil hat die RDNA2-Architektur natürlich über ihre hohen Taktraten, der IPC-Vorteil gegenüber RDNA1 ist wie zu sehen minimal (oder auch einmal negativ).

Navi 10 Navi 22
Chipbasis 10,3 Mrd. Transistoren auf 251mm² in der 7nm-Fertigung von TSMC 12,7 Mrd. Transistoren auf 336mm² in der 7nm-Fertigung von TSMC
Raster-Engines 4 2
Shader-Cluster 40 40
Speicherinterface 256 Bit 192 Bit + Infinity Cache
verbaut bei Radeon RX 5600, 5600 XT, 5700 (alle Salvage) sowie Radeon RX 5700 XT (Vollausbau) Radeon RX 6700 (Salvage) sowie Radeon RX 6700 XT (Vollausbau)

Die ComputerBase hat diesbezüglich versucht, den Effekt von Speicherinterface und Infinity Cache durch eine besonders niedrige Chiptaktung unter der FullHD-Auflösung zu minimieren (niedriger Chiptakt = weniger Speicherbandbreite wird benötigt, Unterschiede bei der Bandbreite wirken sich weniger aus) – mit dem interessanten Ergebnis, dass dann vielmehr RDNA1 um +3,8% vor RDNA2 liegt. Dies ist der einzige Fall, wo sich die Halbierung der Anzahl der Raster-Engines zwischen Navi 10 und Navi 22 beachtbar auswirkt. Ansonsten geht dieser Effekt generell unter – wird dies Navi 22 sicherlich hier und da etwas Performance kosten, ist aber wahrscheinlich das Gesamtbild betrachtend effizienter als die Hinzunahme weiterer Raster-Engines mit gleichzeitigem Zuwachs an Chipfläche, Stromverbrauch und Herstellungspreis. Ein abschließender Skalierungs-Test der ComputerBase von Radeon RX 6700 XT bis Radeon RX 6900 XT brachte noch das Ergebnis, dass alle RDNA2-Lösungen auf gleicher Taktrate grob gleich anhand der Anzahl ihrer aktiven Shader-Cluster skalieren.