An das Thema der RayTracing-Performance wurde sich lange Zeit eher vorsichtig herangetastet. Zu Zeiten der Turing-Generation gab es generell nur vereinzelne entsprechende Benchmarks, auch derzeit bei den aktuellen Ampere- und RDNA2-Generationen sind die RayTracing-Benchmarks in vielen Hardwaretests immer noch eine Neben-Disziplin. Selbige wird zudem abgetrennt von der hauptsächlichen Performance-Ermittlung unter gewöhnlichen Rasterizer-Benchmarks durchgeführt – wobei sich an dieser Aufteilung in Rasterizer- und RayTracing-Benchmarks prinzipbedingt wohl auch nichts so schnell ändern wird. Allerdings ergeben sich inzwischen ausreichend tiefe Benchmark-Felder unter RayTracing, um den Versuch eines ersten (fehlbaren) Überblicks zur RayTracing-Performance von Turing, Ampere & RDNA2 aufstellen zu können ... zum Artikel.
Mit den Leaks & Gerüchten der letzten Tage formt sich langsam ein erstes Bild der 5nm-Generation im Grafikchip-Bereich. AMD und nVidia werden hierbei beiderseits mit getrennten Architekturen für HPC- und Gaming-Belange antreten. Auf nVidia-Seite besteht also keine Konkurrenz zwischen "Hopper" und "Lovelace", sondern jene Ansätze ergänzen sich genauso wie CDNA2 und RDNA3 auf AMD-Seite. Interessanterweise soll die Anzahl der FP32-Einheiten bei allen vier Spitzenchips in einem sehr ähnlichen Feld von 15'360 bis 18'432 liegen – bei allerdings je nach HPC- und Gaming-Segment anderem Aufbau, Effektivitätsrate und Zielsetzung der eigentlichen Recheneinheiten. Als Chipfertigung wird man durchgehend TSMCs 5nm-Prozeß benutzen – mit allerhöchstens der Varianz, ob es der "normale" N5-Node oder der (leicht) verbesserte N5P wird ... zum Artikel.
| AMD Navi 21 → Navi 31 | nVidia GA102 → AD102 | |
|---|---|---|
| FP32-Recheneinheiten | 5'120 → 15'360 (+200%) | 10'752 → 18'432 (+71%) |
| (hochgerechnete) Rohpower | 21 TFlops → ~75-80 TFlops (+257-281%) | 36 TFlops → ~80 TFlops (+122%) |
| Performance-Target | 2,5-2,7fache (+150-170%) | 1,9-2,0fache (+90-100%) |
| Anmerkung: reine Wiedergabe von Gerüchten – keine offizielle Daten | ||
Seit dem Jahr 2012 werden auf 3DCenter systematisch Spiele-Stromverbrauchswerte von Grafikkarten aus diversen Hardwaretests erfasst, immer mit dem Augenmerk auf Meßwerte der reinen Grafikkarte natürlich. Seinerzeit war dies ein gewichtiges Thema, da mit den ersten DirectX-11-Grafikkarten deren Spiele-Stromverbrauch über die 200-Watt-Marke getrieben wurde, sich oftmals allerdings erhebliche Abweichungen zwischen offizieller TDP und realem Grafikkarten-Stromverbrauch ergaben. Das ganze wurde im Jahr 2014 mittels eines fortlaufend aktualisierten Artikels professionalisiert, welcher allerdings für die heutige Zeit nicht mehr ganz passend ist und daher mit diesem neuen (wiederum fortlaufend aktualisierten) Artikel zum Grafikkarten-Stromverbrauch abgelöst wird ... zum Artikel.
Mit dem Launch der Radeon RX 6700 XT in diesem März deutete sich bereits ein neues Performance-Bild an, da sich seinerzeit die größeren RDNA2-Beschleuniger schon leicht besser gegenüber den jeweiligen nVidia-Grafikkarten positionieren konnten als noch im Dezember 2020 zum Launch der Radeon RX 6900 XT. Die neuerlichen Launches zu GeForce RTX 3080 Ti & 3070 Ti haben diesen Ansatz dann bestätigt und sogar vertieft, das alte Performance-Bild vom Jahresende 2020 ist somit bereits wieder überholt. Auch wenn mittels der Launch-Analyse zur GeForce RTX 3070 Ti die neuen Performance-Zahlen bereits offeriert wurden, soll mittels dieser extra Betrachtung gezielt auf die seit dem Herbst 2020 herausgearbeiteten Performance-Fortschritte bei AMD & nVidia sowie die neuen Differenz-Werte zwischen RDNA2- & Ampere-Beschleunigern eingegangen werden ... zum Artikel.
Von Apisak @ Twitter kommen erste Performance-Werte zu Intels DG2 – wenngleich leider ohne wirkliche Erklärung über deren Herkunft sowie den benutzten Benchmark-Ansatz. Höchstwahrscheinlich dürfte es sich hierbei um die Ergebnisse Intel-interner Tests handeln. Offen bleibt hingegen der Punkt, inwiefern hierfür eine Reihe von Spiele-Benchmarks, eventuell nur einzelne Spiele-Titel, nur 3DMark-Werte oder etwas ganz abweichendes wie der Geekbench herangezogen wurde. Dass es sich hierbei eher nicht um Spiele-Benchmarks handelt, deutet sich mittels der um 3% besser als die GeForce RTX 3070 einsortierte Radeon RX 6700 XT an – normalerweise sollte eher die nVidia-Karte in diesem Vergleich vorn liegen. Damit ergeben sich leider auch zwei Ansätze zur Performance-Einordnung der Intel-Grafik – welche in ihrem Ergebnis doch einigermaßen voneinander abweichen.
RX 6700 XT
RTX 3070
448EU100%
97%
92%----------------------------- 128EU
GTX 1650100%
88%Quelle: Apisak @ Twitter am 18. Juni 2021
Wie bekannt, bringt nVidias neue Cryptomining-Bremse die GeForce RTX 3060 in mehr oder weniger unwirtschaftliche Regionen beim Ethereum-Mining herunter. Dies wird erst einmal den Markt (leicht) entspannen und nach dem anstehenden Launch am 25. Februar (voraussichtlich) mehr GeForce RTX 3060 Grafikkarten in Gamer-Händen sehen. Für die bisher bereits existierenden Ampere-Grafikkarten kommt diese Lösung jedoch zu spät, denn nachträgliche Änderungen an Treiber und/oder BIOS lassen sich seitens nVidia nicht durchsetzen, die Miner würden einfach mit den jeweils älteren Versionen weiterarbeiten bzw. frühere BIOS-Versionen flashen. Demzufolge existiert laut dem treffsicheren Twitterer Kopite7kimi (welcher nVidias Antimining-Bestrebungen bereits am 28. Januar vorhersagte) bei nVidia wohl die Idee, das komplette bisherige Ampere-Portfolio durch eine faktische Neuauflage ("Ampere 2.0") zu ersetzen:
The old specs and device-ids of gaming cards will EOL.
Quelle: Kopite7kimi @ Twitter am 18. Februar 2021
Could nVidia possibly bring the crypto mining nerf to it's complete gaming portfolio via a full Ampere refresh AND simultaneously EOLing its previous Ampere solutions?
Quelle: 3DCenter @ Twitter am 19. Februar 2021
Thanks, I should explain that. Maybe we won't see new specs, but every old spec will have a new sku. That is possible.
Quelle: Kopite7kimi @ Twitter am 19. Februar 2021
Als Teaser zur nachfolgenden Launch-Analyse soll hiermit schon einmal die Benchmark-Auswertung zur UltraHD/4K-Performance der Radeon RX 6900 XT kredenzt werden. AMDs neues Flaggschiff im Vollausbau des Navi-21-Chips (aka "Big Navi") kommt dabei erst einmal um +8,1% schneller als die Radeon RX 6800 XT heraus – was angesichts von +11% mehr Shader-Clustern ohne höhere Taktrate, höheren Speichertakt sowie ein großzügigeres Power-Limit ein durchaus annehmbares Ergebnis darstellt. Da allerdings die Radeon RX 6800 XT ihrerseits noch um einiges von der GeForce RTX 3080 entfernt liegt, reicht dieses Ergebnis gerade einmal so aus, um sich seitens der Radeon RX 6900 XT erfolgreich mit jener GeForce RTX 3080 anzulegen: Gegenüber dieser liefert AMDs neues Flaggschiff einen knappen Benchmark-Sieg mit gemittelt +1,4% Mehrperformance ab. Dabei reicht es unter immerhin 10 von 14 ausgewerteten Launchreviews zu einem Sieg der AMD-Lösung, in vier dieser Launchreviews liegt aber weiterhin die GeForce RTX 3080 (zumeist denkbar knapp) vorn.
| 4K-Differenz | Testsiege | |
|---|---|---|
| Radeon RX 6900 XT vs. GeForce RTX 3090 | +10,8% zugunsten der 3090 | 12/12 zugunsten der 3090 |
| Radeon RX 6900 XT vs. GeForce RTX 3080 | +1,4 % zugunsten der 6900XT | 10/14 zugunsten der 6900XT, 4/14 zugunsten der 3080 |
| Radeon RX 6900 XT vs. Radeon RX 6800 XT | +8,1% zugunsten der 6900XT | 14/14 zugunsten der 6900XT |
Seitens Twitterer Kopite7kimi sind die letzten Tage interessante Gerüchte zu einem neuen nVidia-Konter gegenüber der Radeon RX 6800 hereingekommen – welche wie bekannt die GeForce RTX 3070 bei der Performance beachtbar hinter sich läßt und das ganze dann mit einer doppelten Speichermenge versüßt. Um dies auszugleichen, soll nun doch wieder eine neue Ampere-Karte zwischen GeForce RTX 3070 und 3080 aufgelegt werden, von welcher derzeit nur der Chip-Codename "GA103-300-A1" sowie der Board-Codename "PG132-SKU40" bekannt sind, für welche aber natürlich eigentlich nichts anderes als "GeForce RTX 3070 Ti" als Verkaufsname übrig bleibt. Hierbei handelt es sich dann um die erste Grafikkarte basierend auf dem nachgeschobenen GA103-Chip, welcher aber gemäß kürzlichen Informationen weiterhin aus Samsungs 8nm-Fertigung stammt.
maybe, RTX 3070 Ti
GA103-300-A1
7424 FP32
320bit GD6X
10G GD6X, confirmed.
The PG132-SKU40 is confirmed. Maybe it's the RTX 3070 Ti.
Quelle: Twitterer 'Kopite7kimi' in drei Meldungen: Tweet #1 vom 19. Nov., Tweet #2 vom 25. Nov. & Tweet #3 vom 25. Nov.
Als Teaser zur kommenden Launch-Analyse sollen hiermit bereits die ersten ausgewerteten Testresultate zu Radeon RX 6800 & 6800 XT unter der UltraHD/4K-Auflösung offeriert werden. Danach kommt die größere Radeon RX 6800 XT leicht unterhalb der Erwartungen heraus, da das Performance-Ergebnis der GeForce RTX 3080 vergleichsweise klar verfehlt wird: Laut den hierzu ausgewerteten Benchmarks von 17 Launchreviews fehlen zur nVidia-Karte −6,9% Performance bzw. ist die GeForce RTX 3080 um +7,4% gegenüber der Radeon RX 6800 XT schneller. Selbiges Ergebnis zieht sich durch alle visitierten Testberichte, nur die Differenzen unterscheiden sich: Minimal +3,3%, maximal dagegen +12,4% liegt die nVidia-Karte vorn – im Mittel wie gesagt um +7,4%. Gegenüber AMDs eigenen Benchmarks, welche selbst ohne SAM-Feature die Radeon RX 6800 XT minimal (um +1,7%) vor der GeForce RTX 3080 gesehen haben, ist dies doch eine erstaunlich große Diskrepanz. Selbiges SAM-Feature wurde bei diesen unabhängigen Benchmarks im übrigen außen vor gelassen – dies meist ganz automatisch über die Wahl der Test-Plattform (vornehmlich Intel- oder Zen2-Systeme).
| vs 3070 | vs 2080Ti | vs 6800 | vs 6800XT | vs 3080 | vs 3090 | |
|---|---|---|---|---|---|---|
| GeForce RTX 3070 | ♦ | −1,2% | −7,5% | −19,8% | −25,3% | −33,4% |
| GeForce RTX 2080 Ti | +1,2% | ♦ | −6,3% | −18,8% | −24,4% | −32,6% |
| Radeon RX 6800 | +8,1% | +6,8% | ♦ | −13,3% | −19,3% | −28,0% |
| Radeon RX 6800 XT | +24,7% | +23,2% | +15,3% | ♦ | −6,9% | −16,9% |
| GeForce RTX 3080 | +33,9% | +32,3% | +23,9% | +7,4% | ♦ | −10,8% |
| GeForce RTX 3090 | +50,1% | +48,3% | +38,9% | +20,4% | +12,1% | ♦ |
Die ablaufende Woche leider etwas untergegangen sind die Ausführungen von Twitterer 'Kopite7kimi' über die kommenden GeForce-30-Grafikkarten auf Basis der kleineren Grafikchips GA106 und GA107. An deren grundsätzlichen Hardware-Daten hat sich gegenüber dem Leak von Mai 2019 nichts geändert, ergo dürften die Karten-bezogenen Angaben wohl korrekt sein – sofern sich nVidia nicht doch noch kurzfristig umentscheidet. Im groben Maßstab tritt der GA106-Chip mit 30 Shader-Clustern an einem 192 Bit Speicherinterface an, der GA107-Chip mit 20 Shader-Clustern an einem 128 Bit Speicherinterface. Daraus schnitzt nVidia diverse Grafikkarten: GA106-basiert sind GeForce RTX 3060 im Vollausbau des GA106-Grafikchips sowie GeForce RTX 3050 Ti mit 28 anstatt 30 Shader-Clustern. GA107-basiert ist dann die GeForce RTX 3050 mit allerdings nur 18 von 20 maximal möglichen Shader-Clustern des GA07-Chips. Erwartet werden können alle diese Karten im Januar 2021 – womit nVidia sein initiales Ampere-Portfolio vergleichsweise fix abschließen würde.
The desktop cards based on GA106 will be called RTX 3060(3840FP32) and RTX 3050 Ti(3584FP32).
RTX 3050, GA107-300, 2304FP32, 90W TGP.
Quelle: Kopite7kimi @ Twitter in Tweet #1 & Tweet #2 am 4./8. November 2020