nVidia-Grafik

18

nVidia gibt die Unterstützung für "implicit SLI" mit dem Jahresende 2020 auf

Die "Release Notes" (PDF) zum neuen nVidia-Treiber 465.38 mit der erstmaligen Unterstützung der GeForce-30-Serie enthalten eine interessante Passage zum SLI-Support der Ampere-Grafikkarten. Einen SLI-Support wird es wie bekannt sowieso nur auf der GeForce RTX 3090 geben, nicht auf kleineren Ampere-Grafikkarten, auch nicht auf der Chip-gleichen GeForce RTX 3080. Jene GeForce RTX 3090 sowie alle zukünftigen SLI-fähigen nVidia-Grafikkarten werden allerdings nicht mehr "implicit SLI" unterstützen, sprich die bisherige SLI-Variante mit SLI-Profilen im nVidia-Treiber. Für die GeForce RTX 3090 wird es nur noch "explicit SLI" geben, was auf einem eigenen SLI-Support durch die jeweilige Anwendung selber basiert, was derzeit nur unter den Grafik-APIs DirectX 12, Vulkan und OpenGL möglich ist. nVidia streicht somit für Ampere und nachfolgende Grafik-Generationen den bisher üblichen SLI-Support komplett.

Implicit SLI, where the driver makes assumptions with application profiles to achieve GPU scaling, is disabled on NVIDIA Ampere GPUs. Explicit SLI is still supported, where the application knows the SLI state and uses extensions (such as DirectX 12 linked nodes, Vulkan device groups, or OpenGL multicast extensions) to issue commands to each device in the SLI group.
Quelle:  Release Notes (PDF) der nVidia-Treiber 465.38

16

GeForce RTX 3080 Launchreviews: Die Testresultate zur UltraHD/4K-Performance im Überblick

Als kleinen Vorgeschmack und Teaser für die nachfolgenden Launch-Analyse zur GeForce RTX 3080 sollen hiermit bereits die inzwischen ausgewerteten Performance-Werte der neuen nVidia-Karte unter der UltraHD-Auflösung präsentiert werden. Hierzu wurden die Benchmarks von (derzeit) 18 Launchreviews erfasst und miteinander verrechnet, aufgrund der Masse an ~1910 ausgewerteten Einzel-Benchmarks dürfte das herauskommende Ergebnis das Gesamtbild dieses Grafikkarten-Launches wohl recht treffsicher einfangen können. Zu beachten wäre, dass hierbei Wert auf Hardwaretests mit größerer Anzahl an Einzeltests gelegt wurde, gleichfalls auch die (maßvolle) Gewichtung beim der finalen Index-Bildung zugunsten jener Tests mit besonders hoher Benchmark-Anzahl erging. Denn insbesondere Gaming-Ampere hat die Tendenz, in einzelnen Benchmarks mal besonders gut davonzuziehen – darunter die von nVidia selber getesteten Titel, aber beispielsweise auch Red Dead Redemption läuft auf der GeForce RTX 3080 überdurchschnittlich gut.

AMD Pascal Turing
Mehrperformance
GeForce RTX 3080 (FE)
+31% vs. 2080Ti
+58% vs. 2080S
+69% vs. 2080
+83% vs. Radeon VII +87% vs. 1080Ti +82% vs. 2070S
+98% vs. 5700XT
+142% vs. Vega64 +149% vs. 1080
basierend auf 18 ausgewerteten Launchreviews zur GeForce RTX 3080 FE
16

Launch der nVidia GeForce RTX 3080: Die Launchreviews gehen online

Mit dem heutigen Launch der GeForce RTX 3080 startet nVidia seine Ampere-Architektur nunmehr auch für Gaming-Grafikkarten. Hiermit soll zum einen die Scharte der eher durchschnittlich bewerteten Turing-Generation ausgewetzt werden, als auch dem kommenden Ansturm der RDNA2-Grafikkarten sowie der NextGen-Konsolen vorgebeugt werden. Die GeForce RTX 3080 führt dafür – ungewöhnlich für eine xx80er Lösung – den besten Chip des Gaming-Portfolios in allerdings einer erheblichen Abspeckung ins Feld. Die gebotenen 68 Shader-Cluster entsprechend exakt dem Niveau der vorhergehenden GeForce RTX 2080 Ti – aber natürlich kann Gaming-Ampere mit seinen verdoppelten FP32-Einheiten deutlich mehr und so soll die GeForce RTX 3080 gemäß nVidias eigenen Benchmarks ca. +69% auf die GeForce RTX 2080 Super drauflegen. Ob dies der Realität entspricht, dürfen nun endlich die unabhängigen Hardwaretester anhand der "Founders Edition" zur GeForce RTX 3080 herausfinden, entsprechende Tests zu den Herstellermodellen sind erst für den morgigen 17. September freigegeben. Die Launchreviews zur GeForce RTX 3080 füllen somit derzeit das Internet, die Diskussion zum Launch in unserem Forum startet – und nachfolgend ist die obligatorische Launch-Analyse an dieser Stelle zu erwarten, welche insbesondere die aufgelaufenen Benchmarks zusammenfassen wird.

Technik Liste Launch
GeForce RTX 3090 Ampere GA102, 82 SM @ 384 Bit, 24 GB GDDR6X $1499 24. Sept. 2020
GeForce RTX 3080 Ampere GA102, 68 SM @ 320 Bit, 10 GB GDDR6X $699 16. Sept. 2020
GeForce RTX 3070 Ampere GA104, 46 SM @ 256 Bit, 8 GB GDDR6 $499 15. Okt. 2020
12

Weitere Benchmarks zur GeForce RTX 3080 geleakt

Bei Videocardz haben sich weitere Vorab-Benchmarks zur GeForce RTX 3080 angesammelt. Jene stammen wohl aus den kommenden Launchreviews zur GeForce RTX 3080 FE, haben ergo – insofern nVidia nicht noch eine andere Treiber-Version herausbringt – einen "zukünftig offiziellen" Charakter. Interessant ist der Hintergrund, wieso Videocardz an dieser Benchmarks gekommen sind: Die Hardware-Tester wollen angeblich ihre Benchmark-Resultate verifizieren, sprich mit denen anderer Tester abgleichen. Ein solches Vorhaben deutet gewöhnlich darauf hin, dass sich die Tester ob ihrer Test-Ergebnisse unsicher sind – sprich, jene fallen entweder zu hoch oder zu niedrig gegenüber der Erwartungslage aus. In Fall dieser Benchmarks zur GeForce RTX 3080 dürfte ersteres "Problem" sicherlich nicht vorliegen, dafür aber zweiteres: Die GeForce RTX 3080 kommt auch bei diesen Benchmarks nicht ganz auf dem hohen Level der nVidia-Vorhersagen heraus, sondern doch schon beachtbar niedriger.

Auflösung 2070S → 3080 2080S → 3080 2080Ti → 3080
3DMark13 FireStrike Ultra (GPU) UltraHD +77% +63% +36%
3DMark13 TimeSpy Extreme (GPU) UltraHD +83% +68% +36%
3DMark13 Port Royal (Score) WQHD +94% +65% +33%
Far Cry 5 UltraHD +64% +49% +23%
Shadow of the Tomb Raider UltraHD +91% +65% +33%
Shadow of the Tomb Raider @ RT/DLSS UltraHD +69% +43% +23%
Performance-Durchschnitt - +79% +59% +30%
(nVidias Performance-Prognose) - (+93%) (+69%) -
gemäß der von Videocardz verbreiteten Benchmark-Werte zur GeForce RTX 3080
9

Erster geleakter Test sieht die GeForce RTX 3080 um +53% vor der GeForce RTX 2080 Super

Twitterer 'Rogame' berichtet in zwei Tweets – No.1 & No.2 – über die Ergebnisse eines geleakten Reviews zur GeForce RTX 3080 seitens des chinesischen Magazins 'TecLab'. Deren Video-Test war eine gewisse Zeit auf der chinesischen Plattform Bilibili einzusehen, wurde jedoch im Laufe des frühen Abends dann doch von dort heruntergenommen. Über "TecLab" selber gibt es verschiedene Meinungen, aber zumindest dieser Test soll laut Twitterer Kopite7kimi echt sein. Der Umfang der angetretenen Benchmarks ist nicht besonders hoch und die Art der Werte-Präsentation suboptimal (es wurden allein Spiele-Ausschnitte samt fps-Counter gezeigt, zu denen Performance-Differenz genannt wurden). Damit muß man mit den seitens TecLab genannten Differenz-Werten der GeForce RTX 3080 zur GeForce RTX 2080 Super sowie zur GeForce RTX 2080 Ti leben – und auch, dass es selbige bei den 3DMark13-Messungen immer nur zum Gesamt-Score und nicht zum reinen GPU-Wert gibt. Andererseits liegt der Vorteil dieser TecLab-Benchmarks schlicht darin, das hierbei erstmals unabhängige Spiele-Benchmarks präsentiert werden konnten – und zwar unter vier Spielen, welche weder RayTracing noch DLSS beherrschen.

2080S → 3080 FullHD WQHD UltraHD
3DMark13 FireStrike (overall Score) +43% +45% +64%
3DMark13 TimeSpy (overall Score) - +49% +59%
3DMark13 Port Royal (overall Score) - +64% -
Assassin's Creed: Odyssey - - +48%
Borderlands 3 - - +56%
Far Cry 5 - - +62%
Forza Horizon 4 - - +48%
Durchschnitt inkl. 3DMarks - - +56%
Durchschnitt reine Spiele-Tests - - +53%
basierend auf dem bei Bilibili geleakten Test von TecLab, notiert seitens Rogame @ Twitter: Tweet #1 & Tweet #2
8

Gerüchteküche: GeForce GTX 3060 Ti/Super tritt mit 38 Shader-Clustern an 8 GB GDDR6-Speicher an

Twitterer Kopite7kimi bringt eine weitere Ampere-Grafikkarte ins Spiel, welche sich "GeForce RTX 3060 Ti" oder "GeForce RTX 3060 Super" nennen, auf dem GA104-Chip basieren und wie die GeForce RTX 3070 mit 8 GB GDDR6-Speicher antreten soll. Wenn die GeForce RTX 3070 nahezu den Vollausbau des GA104-Chips benutzt (46 von maximal 48 Shader-Cluster sind aktiv), stellt diese GeForce RTX 3060 Ti/Super dann die kleinere, preisgünstigere GA104-Ausführung dar, denn jene Karte soll nur 38 aktive Shader-Cluster und somit 4864 CUDA-Cores aufbieten. Dies ist leicht weniger als bei unserer bisherigen Annahme von 40-42 Shader-Cluster für eine solcherart zweite GA104-basierte Grafikkarte, soll aber vermutlich zu einer besseren Produktabgrenzung zwischen GeForce RTX 3070 und GeForce RTX 3060 Ti/Super beitragen. Die Differenz bei der Anzahl der aktiven Shader-Cluster liegt somit bei +21% zur GeForce RTX 3070, was angenommen einer ähnlichen Differenz bei der Speicherbandbreite dann zu einer Performance-Differenz von +15-18% führen kann.

PG142-SKU20
GA104-200
8G GDDR6
4864 FP32
= RTX 3060 Ti or Super

Quelle:  Kopite7kimi @ Twitter am 8. September 2020

7

Erster Geekbench-Wert zur GeForce RTX 3080 aufgetaucht

In unserem Forum wurde der erste Eintrag einer GeForce RTX 3080 Grafikkarte unter dem Geekbench 5 bzw. dem dortigen OpenCL-Test erspäht (Update: CUDA-Werte hinzugefügt). Wie bei den bereits vorliegenden Benchmark-Werten einer GeForce RTX 3080 unter dem CompuBench handelt es sich hierbei um Rechenleistungs-Messungen, welche wenig mit der Spiele-Performance zu tun haben und regulärerweise nur für OpenCL-Nutzer von Interesse sind. Allerdings kann man hieran recht gut erahnen, wie speziell die verdoppelten FP32-Einheiten der "Ampere" Shader-Cluster in der Praxis wirken bzw. welche Recheneffizienz jene aufbieten können. Die Ergebnisse sind leicht besser als unter dem CompuBench und vor allem rasiert die GeForce RTX 3080 – als immerhin nur zweitbeste Grafikkarte des kommenden Ampere-Portfolios – alle bisher unter dem Geekbench 5 OpenCL-Tests gelisteten GeForce-Grafikkarten mit Abstand weg. Selbst eine GV100-basierte "GRID V100S-32Q" als bisher an der Spitzenposition gelistete Server-Lösung wird mit gleich +25% OpenCL-Mehrperformance klar geschlagen.

Hardware GB5 OpenCL Anmerkung (GB5 CUDA)
GeForce RTX 3080 Ampere, GA102, 68 SM @ 320 Bit GDDR6X 191'891 +86% vs. 2080, +74% vs. 2080S, +46% vs. 2080Ti (215'361)
GRID V100S-32Q Volta, GV100, 80 SM @ 4096 Bit HBM2 153'272 - -
Titan RTX Turing, TU102, 72 SM @ 384 Bit GDDR6 134'369 - (143'168)
GeForce RTX 2080 Ti Turing, TU102, 68 SM @ 352 Bit GDDR6 131'494 +28% vs. 2080, +19% vs. 2080S (162'452)
GeForce RTX 2080 Super Turing, TU104, 48 SM @ 256 Bit GDDR6 110'399 +7% vs. 2080 (125'433)
GeForce RTX 2080 Turing, TU104, 46 SM @ 256 Bit GDDR6 102'969 - (119'746)
Quellen in der Geekbench 5 Datenbank: RTX 3080 OpenCL, RTX 3080 CUDA, GB5 OpenCL-Bestenliste & GB5 CUDA-Bestenliste
7

Die Grafikchip- und Grafikkarten-Marktanteile im zweiten Quartal 2020

Die Marktbeobachter von Jon Peddie Research berichten über den Grafikkarten-Markt im zweiten Quartal 2020, welcher erhebliche Verschiebungen bei den Marktanteilen unter zugleich einer (teilweise) enormen Zunahme der Grafikkarten-Absätze gesehen hat. Jene Absätze legten gegenüber dem Vorquartal um +6,6% und gegenüber dem Vorjahreszeitraum aber gleich um +36,7% zu – letztlich der gleiche Effekt, welcher schon mit dem Mindfactory Grafikkarten Retail-Verkaufsreport Q2/2020 beschrieben wird. Profitieren konnte hiervon allerdings eigentlich nur nVidia, welche ihren Marktanteil gegenüber dem Vorquartal um gleich ca. 9 Prozentpunkte steigern konnten. Während das Marktanteils-Verhältnis zwischen AMD und nVidia im ersten Quartal 2020 mit 31:69% (angesichts der Gesamtsituation) noch halbwegs annehmlich aussah, wurden im zweiten Quartal 2020 mit 22:78% wieder einmal Zahlen erzielt, welche nVidia als klaren Dominator des Markts an Desktop-Grafikkarten sehen.

AiB-Grafikchips Q2/2019 Q3/2019 Q4/2019 Q1/2020 Q2/2020
AMD 32,1% 27,1% 31,1% 30,8% 22%
nVidia 67,9% 72,9% 68,9% 69,2% 78%
Quelle: Jon Peddie Research
4

Die (vermutlichen) Hardware-Spezifikationen der kompletten "Ampere"-Chipserie

Nachdem sich die früheren Vorhersagen zur Ampere-Hardware durch Twitterer Kopite7kimi nunmehr nach dem GA100-Chip auch beim GA102- sowie beim GA104-Chip bestätigt haben, kann man davon ausgehen, das jene bereits seit Mai 2019 vorliegende Vorhersage auf durchgehend echten Daten beruht. Schließlich stimmen auch die selten beachteten Details wie die 7 Graphics Processing Cluster (GPC) beim GA102-Chips, welche man wegen der ungerade Zahl kaum "freiwillig" vorhersagen würde. Zusammen mit der kürzlichen Klarstellung, wie sich die Shader-Cluster von Gaming-Ampere aufbauen (zuzüglich einer Detail-Infos zu den Ampere-ROPs sowie zu den Tensor-Cores von Ampere), kann man davon ausgehend bereits die komplette "Ampere"-Chipserie in ihren grundsätzlichen Hardware-Spezifikationen erkennen. Nachfolgende Aufstellung ist bezüglich der Ampere-Chips GA107 & GA106 natürlich noch nicht gefeit vor letztendlichen Fehlern, bezüglich GA104 & GA102 kann man sich hingegen nahezu sicher sein, fehlt zumeist nur noch eine hochoffizielle Bestätigung des allerdings bereits offensichtlichen:

GA107 GA106 GA104 GA102 GA100
Raster-Engines (GPC) 2 3 6 7 8
Shader-Cluster (SM) 20 30 48 84 128
FP32-Einh. (CUDA-Cores) 2560 3840 6144 10752 8192
INT32-Einheiten 1280 1920 3072 5376 8192
Textureneinh. (TMUs) 80 120 192 336 512
Tensor-Cores 80 120 192 336 512
RT-Cores möglw. 20 (?) möglw. 30 (?) 48 84
ROPs 32 48 96 112 whrschl. 128
Level2-Cache ? ? 4 MB 6 MB 48 MB
Speicherinterface 128 Bit GDDR6 192 Bit GDDR6 256 Bit GDDR6 384 Bit GDDR6X 6144 Bit HBM2
Grafikkarten GTX/RTX 3040 Serie (?) GTX/RTX 3050 Serie (?) RTX 3060, 3070 & 3070 Ti RTX 3080 & 3090 rein HPC
Release Q1/2021 Q1/2021 Oktober 2020 17. September 2020 14. Mai 2020
Basis: Ampere Hardware-Vorhersage von 'Kopite7kimi' & nVidia-Aussagen zur Ampere-Architektur
3

Wie Gaming-Ampere die verdoppelte Anzahl an Shader-Einheiten erreicht

Mit den Gaming-Lösungen der Ampere-Generation fuhr nVidia bei seinem "GeForce Special Event" schwere Geschütze auf: Mehr als verdoppelte Anzahl an CUDA-Cores (Shader-Einheiten), das 1,7fache an Shader-Rechenkraft samt einer Performance-Projektion von grob dem Doppelten gegenüber Turing. Die vorherigen Annahmen zu Gaming-Ampere lagen zwar bei der Anzahl der gebotenen Shader-Cluster richtig, haben jedoch – bis auf vereinzelte frühere Gerüchte – bis zuletzt jene (mehr als) Verdopplung der FP32-Performance nicht auf dem Plan gehabt. Dabei war es zuerst etwas unklar, wie nVidia dies konkret realisierte: Gerade weil die Tendenz der Grafikchip-Entwickler klar in Richtung kleinerer Shader-Cluster mit (relativ) weniger Recheneinheiten pro Shader-Cluster ging, erschien eine plötzliche Entwicklung in die andere Richtung hin schwer vorstellbar. Genau dies hat nVidia jedoch tatsächlich getan: Die Shader-Cluster (SM) von Ampere tragen laut einer offiziellen nVidia-Aussage auf Reddit nunmehr gleich 128 FP32-Einheiten – anstatt wie bei der vorhergehenden Turing-Generation nur 64 FP32-Einheiten.

The Ampere SM includes new datapath designs for FP32 and INT32 operations. One datapath in each partition consists of 16 FP32 CUDA Cores capable of executing 16 FP32 operations per clock. Another datapath consists of both 16 FP32 CUDA Cores and 16 INT32 Cores. As a result of this new design, each Ampere SM partition is capable of executing either 32 FP32 operations per clock, or 16 FP32 and 16 INT32 operations per clock.
Quelle:  nVidias Tony Tamasi auf Reddit am 2. September 2020

Inhalt abgleichen