nVidia-Grafik

8

Gerüchteküche: GeForce GTX 3060 Ti/Super tritt mit 38 Shader-Clustern an 8 GB GDDR6-Speicher an

Twitterer Kopite7kimi bringt eine weitere Ampere-Grafikkarte ins Spiel, welche sich "GeForce RTX 3060 Ti" oder "GeForce RTX 3060 Super" nennen, auf dem GA104-Chip basieren und wie die GeForce RTX 3070 mit 8 GB GDDR6-Speicher antreten soll. Wenn die GeForce RTX 3070 nahezu den Vollausbau des GA104-Chips benutzt (46 von maximal 48 Shader-Cluster sind aktiv), stellt diese GeForce RTX 3060 Ti/Super dann die kleinere, preisgünstigere GA104-Ausführung dar, denn jene Karte soll nur 38 aktive Shader-Cluster und somit 4864 CUDA-Cores aufbieten. Dies ist leicht weniger als bei unserer bisherigen Annahme von 40-42 Shader-Cluster für eine solcherart zweite GA104-basierte Grafikkarte, soll aber vermutlich zu einer besseren Produktabgrenzung zwischen GeForce RTX 3070 und GeForce RTX 3060 Ti/Super beitragen. Die Differenz bei der Anzahl der aktiven Shader-Cluster liegt somit bei +21% zur GeForce RTX 3070, was angenommen einer ähnlichen Differenz bei der Speicherbandbreite dann zu einer Performance-Differenz von +15-18% führen kann.

PG142-SKU20
GA104-200
8G GDDR6
4864 FP32
= RTX 3060 Ti or Super

Quelle:  Kopite7kimi @ Twitter am 8. September 2020

7

Erster Geekbench-Wert zur GeForce RTX 3080 aufgetaucht

In unserem Forum wurde der erste Eintrag einer GeForce RTX 3080 Grafikkarte unter dem Geekbench 5 bzw. dem dortigen OpenCL-Test erspäht (Update: CUDA-Werte hinzugefügt). Wie bei den bereits vorliegenden Benchmark-Werten einer GeForce RTX 3080 unter dem CompuBench handelt es sich hierbei um Rechenleistungs-Messungen, welche wenig mit der Spiele-Performance zu tun haben und regulärerweise nur für OpenCL-Nutzer von Interesse sind. Allerdings kann man hieran recht gut erahnen, wie speziell die verdoppelten FP32-Einheiten der "Ampere" Shader-Cluster in der Praxis wirken bzw. welche Recheneffizienz jene aufbieten können. Die Ergebnisse sind leicht besser als unter dem CompuBench und vor allem rasiert die GeForce RTX 3080 – als immerhin nur zweitbeste Grafikkarte des kommenden Ampere-Portfolios – alle bisher unter dem Geekbench 5 OpenCL-Tests gelisteten GeForce-Grafikkarten mit Abstand weg. Selbst eine GV100-basierte "GRID V100S-32Q" als bisher an der Spitzenposition gelistete Server-Lösung wird mit gleich +25% OpenCL-Mehrperformance klar geschlagen.

Hardware GB5 OpenCL Anmerkung (GB5 CUDA)
GeForce RTX 3080 Ampere, GA102, 68 SM @ 320 Bit GDDR6X 191'891 +86% vs. 2080, +74% vs. 2080S, +46% vs. 2080Ti (215'361)
GRID V100S-32Q Volta, GV100, 80 SM @ 4096 Bit HBM2 153'272 - -
Titan RTX Turing, TU102, 72 SM @ 384 Bit GDDR6 134'369 - (143'168)
GeForce RTX 2080 Ti Turing, TU102, 68 SM @ 352 Bit GDDR6 131'494 +28% vs. 2080, +19% vs. 2080S (162'452)
GeForce RTX 2080 Super Turing, TU104, 48 SM @ 256 Bit GDDR6 110'399 +7% vs. 2080 (125'433)
GeForce RTX 2080 Turing, TU104, 46 SM @ 256 Bit GDDR6 102'969 - (119'746)
Quellen in der Geekbench 5 Datenbank: RTX 3080 OpenCL, RTX 3080 CUDA, GB5 OpenCL-Bestenliste & GB5 CUDA-Bestenliste
7

Die Grafikchip- und Grafikkarten-Marktanteile im zweiten Quartal 2020

Die Marktbeobachter von Jon Peddie Research berichten über den Grafikkarten-Markt im zweiten Quartal 2020, welcher erhebliche Verschiebungen bei den Marktanteilen unter zugleich einer (teilweise) enormen Zunahme der Grafikkarten-Absätze gesehen hat. Jene Absätze legten gegenüber dem Vorquartal um +6,6% und gegenüber dem Vorjahreszeitraum aber gleich um +36,7% zu – letztlich der gleiche Effekt, welcher schon mit dem Mindfactory Grafikkarten Retail-Verkaufsreport Q2/2020 beschrieben wird. Profitieren konnte hiervon allerdings eigentlich nur nVidia, welche ihren Marktanteil gegenüber dem Vorquartal um gleich ca. 9 Prozentpunkte steigern konnten. Während das Marktanteils-Verhältnis zwischen AMD und nVidia im ersten Quartal 2020 mit 31:69% (angesichts der Gesamtsituation) noch halbwegs annehmlich aussah, wurden im zweiten Quartal 2020 mit 22:78% wieder einmal Zahlen erzielt, welche nVidia als klaren Dominator des Markts an Desktop-Grafikkarten sehen.

AiB-Grafikchips Q2/2019 Q3/2019 Q4/2019 Q1/2020 Q2/2020
AMD 32,1% 27,1% 31,1% 30,8% 22%
nVidia 67,9% 72,9% 68,9% 69,2% 78%
Quelle: Jon Peddie Research
4

Die (vermutlichen) Hardware-Spezifikationen der kompletten "Ampere"-Chipserie

Nachdem sich die früheren Vorhersagen zur Ampere-Hardware durch Twitterer Kopite7kimi nunmehr nach dem GA100-Chip auch beim GA102- sowie beim GA104-Chip bestätigt haben, kann man davon ausgehen, das jene bereits seit Mai 2019 vorliegende Vorhersage auf durchgehend echten Daten beruht. Schließlich stimmen auch die selten beachteten Details wie die 7 Graphics Processing Cluster (GPC) beim GA102-Chips, welche man wegen der ungerade Zahl kaum "freiwillig" vorhersagen würde. Zusammen mit der kürzlichen Klarstellung, wie sich die Shader-Cluster von Gaming-Ampere aufbauen (zuzüglich einer Detail-Infos zu den Ampere-ROPs sowie zu den Tensor-Cores von Ampere), kann man davon ausgehend bereits die komplette "Ampere"-Chipserie in ihren grundsätzlichen Hardware-Spezifikationen erkennen. Nachfolgende Aufstellung ist bezüglich der Ampere-Chips GA107 & GA106 natürlich noch nicht gefeit vor letztendlichen Fehlern, bezüglich GA104 & GA102 kann man sich hingegen nahezu sicher sein, fehlt zumeist nur noch eine hochoffizielle Bestätigung des allerdings bereits offensichtlichen:

GA107 GA106 GA104 GA102 GA100
Raster-Engines (GPC) 2 3 6 7 8
Shader-Cluster (SM) 20 30 48 84 128
FP32-Einh. (CUDA-Cores) 2560 3840 6144 10752 8192
INT32-Einheiten 1280 1920 3072 5376 8192
Textureneinh. (TMUs) 80 120 192 336 512
Tensor-Cores 80 120 192 336 512
RT-Cores möglw. 20 (?) möglw. 30 (?) 48 84
ROPs 32 48 96 112 whrschl. 128
Level2-Cache ? ? 4 MB 6 MB 48 MB
Speicherinterface 128 Bit GDDR6 192 Bit GDDR6 256 Bit GDDR6 384 Bit GDDR6X 6144 Bit HBM2
Grafikkarten GTX/RTX 3040 Serie (?) GTX/RTX 3050 Serie (?) RTX 3060, 3070 & 3070 Ti RTX 3080 & 3090 rein HPC
Release Q1/2021 Q1/2021 Oktober 2020 17. September 2020 14. Mai 2020
Basis: Ampere Hardware-Vorhersage von 'Kopite7kimi' & nVidia-Aussagen zur Ampere-Architektur
3

Wie Gaming-Ampere die verdoppelte Anzahl an Shader-Einheiten erreicht

Mit den Gaming-Lösungen der Ampere-Generation fuhr nVidia bei seinem "GeForce Special Event" schwere Geschütze auf: Mehr als verdoppelte Anzahl an CUDA-Cores (Shader-Einheiten), das 1,7fache an Shader-Rechenkraft samt einer Performance-Projektion von grob dem Doppelten gegenüber Turing. Die vorherigen Annahmen zu Gaming-Ampere lagen zwar bei der Anzahl der gebotenen Shader-Cluster richtig, haben jedoch – bis auf vereinzelte frühere Gerüchte – bis zuletzt jene (mehr als) Verdopplung der FP32-Performance nicht auf dem Plan gehabt. Dabei war es zuerst etwas unklar, wie nVidia dies konkret realisierte: Gerade weil die Tendenz der Grafikchip-Entwickler klar in Richtung kleinerer Shader-Cluster mit (relativ) weniger Recheneinheiten pro Shader-Cluster ging, erschien eine plötzliche Entwicklung in die andere Richtung hin schwer vorstellbar. Genau dies hat nVidia jedoch tatsächlich getan: Die Shader-Cluster (SM) von Ampere tragen laut einer offiziellen nVidia-Aussage auf Reddit nunmehr gleich 128 FP32-Einheiten – anstatt wie bei der vorhergehenden Turing-Generation nur 64 FP32-Einheiten.

The Ampere SM includes new datapath designs for FP32 and INT32 operations. One datapath in each partition consists of 16 FP32 CUDA Cores capable of executing 16 FP32 operations per clock. Another datapath consists of both 16 FP32 CUDA Cores and 16 INT32 Cores. As a result of this new design, each Ampere SM partition is capable of executing either 32 FP32 operations per clock, or 16 FP32 and 16 INT32 operations per clock.
Quelle:  nVidias Tony Tamasi auf Reddit am 2. September 2020

1

nVidia stellt GeForce RTX 3070, 3080 & 3090 offiziell vor

Mit seinem "GeForce Special Event" hat nVidia die ersten Ampere-basierten Gaming-Grafikkarten vorgestellt. Dabei hat man sich vergleichsweise wenig auf Technik und Spezifikationen konzentriert, sondern versuchte vor allem mittels der (eigenen) Performance-Projektion sowie der Preislage zu punkten. Insbesondere letzteres ist nVidia zweifelsfrei gelungen, denn angesichts der vorherigen Befürchtungen über (wieder einmal) steigende Grafikkarten-Preise hören sich 499 Dollar/Euro für eine GeForce RTX 3070 8GB (erhältlich im Oktober) sowie 699 Dollar/Euro für eine GeForce RTX 3080 (erhältlich ab 17. September) durchaus vernünftig an. Dem gegenüber fällt die GeForce RTX 3090 24GB (erhältlich ab 24. September) mit 1499 Dollar/Euro deutlich ab – allerdings war diese Preislage zumindest erwartet worden. Die Formulierung auf der nVidia-Webseite gibt daneben Anlaß anzunehmen, dass es innerhalb der Ampere-Generation keine Preisdifferenz zwischen Hersteller- und FE-Karten mehr gibt, genauso liegen die bereits offiziell genannten deutschen UVP-Preise exakt auf dem Niveau der US-Listenpreise.

GeForce RTX 3070 GeForce RTX 3080 GeForce RTX 3090
Technik 5888 CUDA-Cores @ 1.73 GHz Boost-Takt, 256 Bit GDDR6-Interface 8704 CUDA-Cores @ 1.71 GHz Boost-Takt, 320 Bit GDDR6X-Interface @ 19 Gbps 10496 CUDA-Cores @ 1.70 GHz Boost-Takt, 384 Bit GDDR6X-Interface @ 19.5 Gbps
Speicherausbau 8 GB GDDR6 10 GB GDDR6X 24 GB GDDR6X
Rohleistungen 20 TFlops, 40 RT-TFlops, 163 Tensor-TFlops 30 TFlops, 58 RT-TFlops, 238 Tensor-TFlops, 760 GB/sec 36 TFlops, 69 RT-TFlops, 285 Tensor-TFlops, 936 GB/sec
off. Verbrauch 220W (GCP) 320W (GCP) 350W (GCP)
Kartengröße FE: 242mm, 2-Slot FE: 285mm, 2-Slot FE: 313mm, 3-Slot
Listenpreis $499  (UVP: 499€) $699  (UVP: 699€) $1499  (UVP: 1499€)
Release Oktober 2020 17. September 2020 24. September 2020
Anmerkung: basierend allein auf dem "GeForce Special Event" sowie den offiziellen Daten auf nVidias Webseite
1

GeForce RTX 3060 mit 8 GB, RTX 3070 mit 8/16 GB und RTX 3080 mit 10/20 GB nahezu bestätigt

Twitterer 326powah weisst auf den hochinteressanten Umstand hin, dass sich aus den ganzen Palit-Eintragungen gemäß der gewählten Produktnummern sogar die benutzten Grafikchips sowie Differenzen in den Speichermengen herauslesen lassen. Relevant ist der benutzte Grafikchip speziell bei der GeForce RTX 3060, bei den anderen Ampere-Grafikkarten ist jener dato schon bekannt. Die Angaben erfolgt in der Produktnummer nach dem Bindestrich, beispielsweise zeigt "NE6306T019P2-1041A" auf die Verwendung des GA104-Chip für diese GeForce RTX 3060 hin. Wenn man die anderen Grafikkarten kontrolliert, passt dies auffallend, zur GeForce RTX 3070 wird (wie zu erwarten) ebenfalls der GA104-Chip notiert, zu GeForce RTX 3080 & 3090 (wie zu erwarten) der GA102-Chip. Teilweise finden sich auch andere Notierungen, aber jene zeigen wohl nicht auf andere Grafikchips hin, sondern geben die jeweiligen Grafikboards wieder: "PG132" bei GeForce RTX 3080 & 3090 sowie "PG190" bei der GeForce RTX 3060 – so, wie früher bereits vermeldet.

30

Microsoft bringt das DirectX Feature-Level 12_2 mit verpflichtendem Support von RayTracing und Shader Model 6.5

Nach dem erst im März vorgestellten "DirectX 12 Ultimate" bringt Microsoft nunmehr mit dem "Feature-Level 12_2" von DirectX (im eigentlichen dem für 3D-Grafik gedachten Teil "Direct3D") eine weitere Ausbaustufe der DirectX 12 Grafik-API. Dabei beinhaltet DirectX 12_2 (inoffizielle Abkürzung) alle Änderungen von DirectX 12 Ultimate – welche ja sowieso "nur" die vier neuen Hauptfeatures "DirectX RayTracing", "Mesh Shaders", "Variable Rate Shading" (VRS) und "Sampler Feedback" umfasst, sprich vergleichsweise plakative Veränderungen. DirectX 12_2 ist hingegen dann wiederum ein echtes DirectX-Update, sprich zuzüglich zu den Verbesserungen von DirectX 12 Ultimate gibt auch noch noch einen ganzen Strauß an weiteren Detail-Verbesserungen. Am Hardware-Support ändert sich hingegen nichts: Wie auch bei DirectX 12 Ultimate, wird DirectX 12_2 von den Grafik-Architekturen AMD RDNA2, Intel Xe-HPC, nVidia Turing (nur GeForce-20-Modelle) und nVidia Ampere unterstützt.

Feature-Level 12_0 Feature-Level 12_1 Feature-Level 12_2
AMD GCN2, GCN3, GCN4 GCN5, RDNA1 RDNA2
Intel - - Xe-HPG
nVidia - Maxwell 2, Pascal, Turing (GF16) Turing (GF20), Ampere
28

Erste Hardware-Daten von nVidias GeForce RTX 3070, 3080 & 3090 aufgetaucht

Videocardz haben (angebliche) erste Hardware-Daten zu den Ampere-basierten Grafikkarten GeForce RTX 3070, GeForce RTX 3080 und GeForce RTX 3090 aus leider nicht weiter ausgeführten Quellen erhalten. Da hierbei auch eine später allein bei nVidias Boardpartnern (nicht als FE) erscheinende "GeForce RTX 3080 20GB" erwähnt wird, könnten jene Quellen in den Kreisen der Grafikkarten-Hersteller liegen – was wichtig wäre bei der Beurteilung der Taktraten, falls nVidia wie bei der initialen GeForce-20-Serie wieder eine Taktraten-Differenz zwischen Herstellermodellen und seiner eigenen Founders Edition macht. Dies ist für die anstehende GeForce-30-Serie natürlich noch nicht gegeben, eventuell rückt nVidia auch wieder von diesem Modell ab, wie schon beim "SUPER"-Refresh zur GeForce-20-Serie. Zu beachten wäre zu den angebenen Taktraten von GeForce RTX 3080 & 3090 zudem der Punkt, dass nVidias Grafikkarten in der Praxis gewöhnlich klar oberhalb jener Referenzwerte takten, die offizielle Taktraten-Angabe inzwischen kaum noch wertbar und nur schwerlich vergleichbar ist.

GeForce RTX 3070 GeForce RTX 3080 GeForce RTX 3090
Chipbasis GA104 (GA104-300) GA102 (GA102-200) GA102 (GA102-300)
Referenzboard PG142-10 PG132-10 PG132-30
Technik ? SM, 256 Bit GDDR6-Interface 68 SM, 320 Bit GDDR6X-Interface 82 SM, 384 Bit GDDR6X-Interface
Speicher & Takt 8 GB, ?/? MHz, 16 Gbps, 220W TGP 10 oder 20 GB, ?/1710 MHz, 19 Gbps, 320W TGP 24 GB, ?/1695 MHz, 19.5 Gbps, 350W TGP
basierend auf den Ausführungen von Videocardz; Chip-Takt: 1. Base-Clock, 2. Boost-Clock
27

Gerüchteküche: Aktualisierte TimeSpy-Werte zeigen auf +60% Mehrperformance bei Gaming-Ampere hin

Von Twitterer Kopite7kimi (bislang mit einer exzellenten Trefferquote bezüglich Ampere-basierten Gerüchten aufwartend) kommen aktualisierte Benchmark-Werte zu GeForce RTX 3080 & 3090 unter dem 3DMark13 TimeSpy Extreme. Gemäß der vorherigen TimeSpy-Benchmarks handelt es sich um GPU-Werte, inzwischen wurde nunmehr auch präzisiert, dass die teilnehmenden Ampere-Grafikkarten beiderseits Founders-Edition-Ausführungen darstellen. An den Werten selber ändert sich kaum etwas: Die GeForce RTX 3090 FE wurde zuletzt mit "almost 10000" angegeben, nunmehr sollen es mit "100xx" leicht mehr sein, während die GeForce RTX 3080 FE mit bislang "almost 8600" und nunmehr "85xx" komplett auf Kurs liegt. Die nachfolgende Tabelle wurde zudem um neuere Vergleichswerte der GeForce RTX 2080 Super FE ergänzt – deren Werte gleichzeitig auch einen Hinweis darauf liefern, dass die älteren TimeSpy-Ergebnisse von GeForce RTX 2080 & 2080 Ti nach wie vor korrekt sind: Denn die GeForce RTX 2080 Super liegt im TimeSpy fast exakt dort, wo jene gemäß des 3DCenter UltraHD Performance-Index hingehört, ergo dürfte es hierbei keine beachtbare Performance-Entwicklung über neuere Treiberversionen gegeben haben und diese "alten" TimeSpy-Werte sind somit nach wie vor vergleichbar.

Hardware TimeSpy Extr. (GPU) Quellen 4K Perf.Index
GeForce RTX 3090 FE nVidia Ampere, whrschl. GA102, 82 SM @ 384 Bit GDDR6X 100xx Kopite7kimi ca. 370-380%
GeForce RTX 3080 FE nVidia Ampere, whrschl. GA102, 68 SM @ 320 Bit GDDR6X 85xx Kopite7kimi ca. 310-320%
GeForce RTX 2080 Ti FE nVidia Turing, TU102, 68 SM @ 352 Bit GDDR6 Ø 6333 HWLuxx & OC3D 236%
GeForce RTX 2080 Super FE nVidia Turing, TU104, 48 SM @ 256 Bit GDDR6 Ø 5311 HWLuxx & OC3D 198%
GeForce RTX 2080 FE nVidia Turing, TU104, 46 SM @ 256 Bit GDDR6 Ø 4912 HWLuxx & OC3D 186%
"4K Perf.Index" = 3DCenter UltraHD Performance-Index
Inhalt abgleichen