26

News des 25./26. November 2023

Die schon seit längerem im Auslauf-Status befindlichen RDNA2-Grafikkarten Radeon RX 6800, 6800 XT & 6950 XT gehen nunmehr im deutschen Einzelhandel dem tatsächlichen Angebots-Ende entgegen. Noch gibt es entsprechende Händlernotierungen, aber zuletzt haben sich die lieferbaren Preispunkte zumindest zu Radeon RX 6800 XT wie 6950 XT deutlich erhöht, weil sich die günstigen Angebote ausverkauft haben. Was übrig geblieben ist, sind die Angebote aus der "zweiten Reihe", welche jedoch deutlich mehr kosten und damit dann eher den Blick auf die Alternativen lenken sollten – welche AMD im Midrange-Feld inzwischen schließlich anbieten kann. Nur die Radeon RX 6800 non-XT konnte ihren Preispunkt halten – mit allerdings dem Nachteil, dass auch dort das (durchaus günstige) BlackFriday-Angebot derzeit nicht mehr lieferbar ist. Angeblich erwartet die Mindfactory diesbezüglich noch Nachlieferungen zu Radeon 6800 sowie 6800 XT, aber beim angesetzten günstigen Angebotspreis könnte dies über Vorbesteller und Schnellentschlossene auch umgehend wieder weggehen.

Radeon RX 6800 Radeon RX 6800 XT Radeon RX 6950 XT
20. August 460-530€ 540-570€ 630-660€
23. August 460-530€ 540-570€ 630-690€
27. August 460-530€ 540-590€ 630-660€
3. September 460-550€ 540-580€ 640€
4. September 460-550€ 540-590€
8. September 460-540€ 540-600€
21. September 450-530€ 540-590€ 640-700€
5. Oktober 450-530€ 540-600€ 640-720€
18. Oktober 470-510€ 540-620€ 640-720€
3. November 450-510€ 540-620€ 640-730€
12. November 450-480€ 500-590€ 600-730€
26. November 460-530€ 570-610€ 700-750€
aktuelle Verfügbarkeit ★☆☆☆☆ ★★☆☆☆ ★☆☆☆☆
aktuelle Verfügbarkeit zur zuletzt genannten Preislage, alle Daten gemäß Geizhals-Preisvergleich

Sofern hier keine substantielle Nachlieferungen bei der Mindfactory aufschlagen, hätte nur noch die Radeon RX 6800 non-XT ein paar Händler-Angebote zu einem vernünftigen Preispunkt (aber nicht so gut wie das BlackFriday-Niveau). Ohne diese substantiellen Nachlieferungen wäre die Radeon RX 6800 XT derzeit zu teuer gegenüber der Radeon RX 7800 XT (ab 540€), die Radeon RX 6950 XT mit ihrem stark erhöhten Preisniveau sowieso ungangbar – wobei jene wohl überhaupt keine Nachlieferungen mehr bekommt. Die wahrscheinlichste Auflösung für den weiteren Verlauf ist, dass die eventuell noch kommenden Nachlieferungen nichts mehr an diesem Bild ändern, womit sich Radeon RX 6800 XT und 6950 XT über ihre erhöhten Preislagen bereits selbst aus dem Spiel genommen haben und nur noch die Radeon RX 6800 non-XT ihre letzten Käufer sucht. Damit ist das Marktende dieser RDNA2-Grafikkarten mehr oder weniger erreicht, in wenigen Wochen werden sich auch die letzten Restposten abverkauft haben und hat AMD hat dann in diesem Marktsegment nur noch RDNA3-Beschleuniger im Angebot.

Twitterer I_Leak_VN zeigt Bilder aus chinesischen Warenhäusern mit auf AI-Anforderungen umgebaute GeForce RTX 4090 Karten in der Stückzahl mehrerer Paletten. Augenscheinlich soll dies eher die Normalität sein, sprich das Bilder-Set könnte sehr gut für weitere Warenhäuser stehen, in welchen ein ähnliches Angebot existiert. Dies zeigt an, dass der kürzlich beschrieben Umbau von regulären Consumer-Karten in HPC/AI-Lösungen (eigene Platine, eigenes Blower-Kühlsystem auf nur zwei Slots) wohl regelrecht Industrie-mäßig betrieben wird, mit demzufolge einem hohen Ausstoß an entsprechenden Karten. Die Material-Menge hierfür ist sicherlich vorhanden, denn China hat für mehr als einen Monat mehr oder weniger alle weltweiten Nachlieferungen an GeForce RTX 4090 Karten erhalten, zuzüglich sicherlich auch der bei vielen Distributoren vorhandenen Lagerbestände.

Da die GeForce RTX 4090 in China (relativ in der Marktverteilung) vermutlich keine so stark verkaufte Grafikkarte wie in Deutschland ist, kann diese Warenumleitung durchaus dafür gesorgt haben, dass China nunmehr auf 1-2 regulären Jahreslieferungen an GeForce RTX 4090 Karten (für China) sitzt. Dies ist natürlich nur bezogen auf den regulären Konsumenten-Markt, doch im HPC/AI-Business klingeln derzeit die Kassen, ergo wird selbst diese große Warenmenge sicherlich in kurzer Zeit zu HPC/AI-Modellen umgebaut, der chinesische Einzelhandel sieht wohl genauso nichts mehr. Preislich spricht der Twitterer vom doppelten des normalen Preises – wenn dies auf den US-Listenpreis bezogen ist, wären es umgerechnet oberhalb von 3000 Dollar. Es könnte auch noch etwas höher liegen, wenn vom ursprünglichen chinesischen Einzelhandelspreis der GeForce RTX 4090 ausgegangen wurde, da die Grafikkarten-Preise in China üblicherweise etwas höher als in der westlichen Welt liegen.

Damit ist aber natürlich klar, wieso sich dieser Umbau lohnt: Eigene Platine und Kühlkörper werden billig in China selber hergestellt, kosten ganz grob gepeilt 100 Dollar Materialeinsatz. Die Karten kommen hingegen zum Großhandelspreis an, sprich basierend auf dem US-Listenpreis. Da steckt dann für die Umbauer und Händler eine ungewöhnlich hohe Spanne drin, wenn das ganze zum doppelten Preis weggeht. Abnehmer dürften KI-Farmen sein, welche ihre Hardware aufstocken wollen und gleichzeitig nicht mehr an nVidias eigentliche HPC-Chips (aus der "Hopper"-Generation) herankommen. Jene sind über graue Märkte zwar dennoch erhältlich, die aufgerufenen Preise sind jedoch massiv erhöht und große Mengen zeitnah schwerlich zu bekommen. Die GeForce RTX 4090 stellt einen billigen Ersatz dar, auch wenn der Materialaufwand dafür recht hoch ist. Unter INT8 kann man grob damit rechnen, dass drei Stück GeForce RTX 4090 eine H100 ersetzen – wobei letztere deutlich teurer ist und in China offiziell nie zu bekommen war.

GeForce RTX 4090 H100 SXM5 Faktor
Peak FP8 Tensor (Accumulate) /mit Sparsity 661/1321 TFlops 2000/4000 TFlops x3,0
Peak FP16 Tensor (Accumulate) /mit Sparsity 330/661 TFlops 1000/2000 TFlops x3,0
Peak BF16 Tensor (Accumulate) /mit Sparsity 165/330 TFlops 1000/2000 TFlops x6,0
Peak FP64 Tensor ? 60 TFlops ?
Peak TF32 Tensor /mit Sparsity 83/165 TFlops 500/1000 TFlops x6,0
Peak INT8 Tensor /mit Sparsity 661/1321 TOPs 2000/4000 TOPs x3,0
Peak INT4 Tensor /mit Sparsity 1321/2642 TOPs ? ?
Peak FP16 non-Tensor 82,6 TFlops 120 TFlops x1,45
Peak BF16 non-Tensor 82,6 TFlops 120 TFlops x1,45
Peak FP32 non-Tensor 82,6 TFlops 60 TFlops x0,73
Peak FP64 non-Tensor 1,3 TFlops 30 TFlops x23
Peak INT32 non-Tensor 41,3 TOPs 30 TOPs x0,73
Datenquelle Ada Lovelace Whitepaper (PDF) Vorstellung GH100-Chip

Leider hat sich keine Angabe zur INT4-Rechenleistung bei der "H100" HPC-Lösung finden lassen. Diese niedrigen Rechengenauigkeiten werden gerade bei KI-Aufgaben gern verwendet, denn der hiermit eintretende Qualitätsverlust liegt deutlich unterhalb des Performancegewinns, zumindest wenn das Feature mit doppelter Geschwindigkeit (gegenüber INT8) unterstützt wird. Einzig für FP64-Aufgaben ist der AD102-Chip der GeForce RTX 4090 bei einem FP64/32-Verhältnis von 1/64 wirklich nicht zu gebrauchen. Diese frühere HPC-Paradedisziplin ist allerdings gegenüber den heute üblichen Aufgaben als KI-Beschleuniger inzwischen weit in den Schatten getreten. Speziell für KI-Aufgaben ist somit auch der AD102-Chip gut zu gebrauchen – womit man in Zukunft in China auch weiterhin diesen Weg gehen dürfte. Wie schon einmal dargestellt, folgt daraus nicht automatisch eine Grafikkarten-Knappheit, denn es bestehen derzeit große Fertigungsreserven für Grafikchips, welche kein "Advanded Packaging" benötigen: Um den Jahreswechsel 2021/22 herum wurden mehr als doppelt so viele Desktop-Grafikkarten gefertigt wie aktuell.

Desktop-Gfx AMD nVidia Intel insgesamt Marktvert.
Q1/2019 ~2,0M ~6,9M - 8,9M Stück 22,7% vs 77,3%
Q2/2019 ~2,4M ~5,0M 7,4M Stück 32,1% vs 67,9%
Q3/2019 ~2,8M ~7,7M 10,5M Stück 27,1% vs 72,9%
Q4/2019 ~3,6M ~8,1M 11,7M Stück 31,1% vs 68,9%
Q1/2020 ~2,9M ~6,6M 9,5M Stück 30,8% vs 69,2%
Q2/2020 ~2,2M ~7,8M 10,0M Stück 22% vs 78%
Q3/2020 ~2,6M ~8,9M 11,5M Stück 23% vs 77%
Q4/2020 ~1,9M ~9,1M 11,0M Stück 17% vs 83%
Q1/2021 ~2,4M ~9,4M 11,8M Stück 20% vs 80%
Q2/2021 ~2,3M ~9,2M 11,5M Stück 20% vs 80%
Q3/2021 ~2,7M ~10,0M 12,7M Stück 21% vs 79%
Q4/2021 ~3,0M ~10,2M 13,2M Stück 22,8% vs 77,2%
Q1/2022 ~3,2M ~10,1M ~0,1M 13,4M Stück 24% vs 75% vs ~1%
Q2/2022 ~2,1M ~8,2M ~0,1M 10,4M Stück 20% vs 79,6% vs ~1%
Q3/2022 0,7M 5,9M 0,3M 6,9M Stück 10,0% vs 86,2% vs 3,8%
Q4/2022 ~0,8M ~6,2M ~0,2M 7,2M Stück 12% vs 86% vs 2%
Q1/2023 ~0,7M ~5,3M ~0,3M 6,3M Stück 12% vs 83,7% vs 4%
Q2/2023 1,1M 5,2M 0,1M 6,4M Stück 17,5% vs 80,3% vs 2,3%
basierend auf ausgelieferten Stückzahlen, Quelle: Jon Peddie Research (teilweise interpoliert)