nVidia-Grafik

4

Die (vermutlichen) Hardware-Spezifikationen der kompletten "Ampere"-Chipserie

Nachdem sich die früheren Vorhersagen zur Ampere-Hardware durch Twitterer Kopite7kimi nunmehr nach dem GA100-Chip auch beim GA102- sowie beim GA104-Chip bestätigt haben, kann man davon ausgehen, das jene bereits seit Mai 2019 vorliegende Vorhersage auf durchgehend echten Daten beruht. Schließlich stimmen auch die selten beachteten Details wie die 7 Graphics Processing Cluster (GPC) beim GA102-Chips, welche man wegen der ungerade Zahl kaum "freiwillig" vorhersagen würde. Zusammen mit der kürzlichen Klarstellung, wie sich die Shader-Cluster von Gaming-Ampere aufbauen (zuzüglich einer Detail-Infos zu den Ampere-ROPs sowie zu den Tensor-Cores von Ampere), kann man davon ausgehend bereits die komplette "Ampere"-Chipserie in ihren grundsätzlichen Hardware-Spezifikationen erkennen. Nachfolgende Aufstellung ist bezüglich der Ampere-Chips GA107 & GA106 natürlich noch nicht gefeit vor letztendlichen Fehlern, bezüglich GA104 & GA102 kann man sich hingegen nahezu sicher sein, fehlt zumeist nur noch eine hochoffizielle Bestätigung des allerdings bereits offensichtlichen:

GA107 GA106 GA104 GA102 GA100
Raster-Engines (GPC) 2 3 6 7 8
Shader-Cluster (SM) 20 30 48 84 128
FP32-Einh. (CUDA-Cores) 2560 3840 6144 10752 8192
INT32-Einheiten 1280 1920 3072 5376 8192
Textureneinh. (TMUs) 80 120 192 336 512
Tensor-Cores 80 120 192 336 512
RT-Cores möglw. 20 (?) möglw. 30 (?) 48 84
ROPs 32 48 96 112 whrschl. 128
Level2-Cache ? ? 4 MB 6 MB 48 MB
Speicherinterface 128 Bit GDDR6 192 Bit GDDR6 256 Bit GDDR6 384 Bit GDDR6X 6144 Bit HBM2
Grafikkarten GTX/RTX 3040 Serie (?) GTX/RTX 3050 Serie (?) RTX 3060, 3070 & 3070 Ti RTX 3080 & 3090 rein HPC
Release Q1/2021 Q1/2021 Oktober 2020 17. September 2020 14. Mai 2020
Basis: Ampere Hardware-Vorhersage von 'Kopite7kimi' & nVidia-Aussagen zur Ampere-Architektur
3

Wie Gaming-Ampere die verdoppelte Anzahl an Shader-Einheiten erreicht

Mit den Gaming-Lösungen der Ampere-Generation fuhr nVidia bei seinem "GeForce Special Event" schwere Geschütze auf: Mehr als verdoppelte Anzahl an CUDA-Cores (Shader-Einheiten), das 1,7fache an Shader-Rechenkraft samt einer Performance-Projektion von grob dem Doppelten gegenüber Turing. Die vorherigen Annahmen zu Gaming-Ampere lagen zwar bei der Anzahl der gebotenen Shader-Cluster richtig, haben jedoch – bis auf vereinzelte frühere Gerüchte – bis zuletzt jene (mehr als) Verdopplung der FP32-Performance nicht auf dem Plan gehabt. Dabei war es zuerst etwas unklar, wie nVidia dies konkret realisierte: Gerade weil die Tendenz der Grafikchip-Entwickler klar in Richtung kleinerer Shader-Cluster mit (relativ) weniger Recheneinheiten pro Shader-Cluster ging, erschien eine plötzliche Entwicklung in die andere Richtung hin schwer vorstellbar. Genau dies hat nVidia jedoch tatsächlich getan: Die Shader-Cluster (SM) von Ampere tragen laut einer offiziellen nVidia-Aussage auf Reddit nunmehr gleich 128 FP32-Einheiten – anstatt wie bei der vorhergehenden Turing-Generation nur 64 FP32-Einheiten.

The Ampere SM includes new datapath designs for FP32 and INT32 operations. One datapath in each partition consists of 16 FP32 CUDA Cores capable of executing 16 FP32 operations per clock. Another datapath consists of both 16 FP32 CUDA Cores and 16 INT32 Cores. As a result of this new design, each Ampere SM partition is capable of executing either 32 FP32 operations per clock, or 16 FP32 and 16 INT32 operations per clock.
Quelle:  nVidias Tony Tamasi auf Reddit am 2. September 2020

1

nVidia stellt GeForce RTX 3070, 3080 & 3090 offiziell vor

Mit seinem "GeForce Special Event" hat nVidia die ersten Ampere-basierten Gaming-Grafikkarten vorgestellt. Dabei hat man sich vergleichsweise wenig auf Technik und Spezifikationen konzentriert, sondern versuchte vor allem mittels der (eigenen) Performance-Projektion sowie der Preislage zu punkten. Insbesondere letzteres ist nVidia zweifelsfrei gelungen, denn angesichts der vorherigen Befürchtungen über (wieder einmal) steigende Grafikkarten-Preise hören sich 499 Dollar/Euro für eine GeForce RTX 3070 8GB (erhältlich im Oktober) sowie 699 Dollar/Euro für eine GeForce RTX 3080 (erhältlich ab 17. September) durchaus vernünftig an. Dem gegenüber fällt die GeForce RTX 3090 24GB (erhältlich ab 24. September) mit 1499 Dollar/Euro deutlich ab – allerdings war diese Preislage zumindest erwartet worden. Die Formulierung auf der nVidia-Webseite gibt daneben Anlaß anzunehmen, dass es innerhalb der Ampere-Generation keine Preisdifferenz zwischen Hersteller- und FE-Karten mehr gibt, genauso liegen die bereits offiziell genannten deutschen UVP-Preise exakt auf dem Niveau der US-Listenpreise.

GeForce RTX 3070 GeForce RTX 3080 GeForce RTX 3090
Technik 5888 CUDA-Cores @ 1.73 GHz Boost-Takt, 256 Bit GDDR6-Interface 8704 CUDA-Cores @ 1.71 GHz Boost-Takt, 320 Bit GDDR6X-Interface @ 19 Gbps 10496 CUDA-Cores @ 1.70 GHz Boost-Takt, 384 Bit GDDR6X-Interface @ 19.5 Gbps
Speicherausbau 8 GB GDDR6 10 GB GDDR6X 24 GB GDDR6X
Rohleistungen 20 TFlops, 40 RT-TFlops, 163 Tensor-TFlops 30 TFlops, 58 RT-TFlops, 238 Tensor-TFlops, 760 GB/sec 36 TFlops, 69 RT-TFlops, 285 Tensor-TFlops, 936 GB/sec
off. Verbrauch 220W (GCP) 320W (GCP) 350W (GCP)
Kartengröße FE: 242mm, 2-Slot FE: 285mm, 2-Slot FE: 313mm, 3-Slot
Listenpreis $499  (UVP: 499€) $699  (UVP: 699€) $1499  (UVP: 1499€)
Release Oktober 2020 17. September 2020 24. September 2020
Anmerkung: basierend allein auf dem "GeForce Special Event" sowie den offiziellen Daten auf nVidias Webseite
1

GeForce RTX 3060 mit 8 GB, RTX 3070 mit 8/16 GB und RTX 3080 mit 10/20 GB nahezu bestätigt

Twitterer 326powah weisst auf den hochinteressanten Umstand hin, dass sich aus den ganzen Palit-Eintragungen gemäß der gewählten Produktnummern sogar die benutzten Grafikchips sowie Differenzen in den Speichermengen herauslesen lassen. Relevant ist der benutzte Grafikchip speziell bei der GeForce RTX 3060, bei den anderen Ampere-Grafikkarten ist jener dato schon bekannt. Die Angaben erfolgt in der Produktnummer nach dem Bindestrich, beispielsweise zeigt "NE6306T019P2-1041A" auf die Verwendung des GA104-Chip für diese GeForce RTX 3060 hin. Wenn man die anderen Grafikkarten kontrolliert, passt dies auffallend, zur GeForce RTX 3070 wird (wie zu erwarten) ebenfalls der GA104-Chip notiert, zu GeForce RTX 3080 & 3090 (wie zu erwarten) der GA102-Chip. Teilweise finden sich auch andere Notierungen, aber jene zeigen wohl nicht auf andere Grafikchips hin, sondern geben die jeweiligen Grafikboards wieder: "PG132" bei GeForce RTX 3080 & 3090 sowie "PG190" bei der GeForce RTX 3060 – so, wie früher bereits vermeldet.

30

Microsoft bringt das DirectX Feature-Level 12_2 mit verpflichtendem Support von RayTracing und Shader Model 6.5

Nach dem erst im März vorgestellten "DirectX 12 Ultimate" bringt Microsoft nunmehr mit dem "Feature-Level 12_2" von DirectX (im eigentlichen dem für 3D-Grafik gedachten Teil "Direct3D") eine weitere Ausbaustufe der DirectX 12 Grafik-API. Dabei beinhaltet DirectX 12_2 (inoffizielle Abkürzung) alle Änderungen von DirectX 12 Ultimate – welche ja sowieso "nur" die vier neuen Hauptfeatures "DirectX RayTracing", "Mesh Shaders", "Variable Rate Shading" (VRS) und "Sampler Feedback" umfasst, sprich vergleichsweise plakative Veränderungen. DirectX 12_2 ist hingegen dann wiederum ein echtes DirectX-Update, sprich zuzüglich zu den Verbesserungen von DirectX 12 Ultimate gibt auch noch noch einen ganzen Strauß an weiteren Detail-Verbesserungen. Am Hardware-Support ändert sich hingegen nichts: Wie auch bei DirectX 12 Ultimate, wird DirectX 12_2 von den Grafik-Architekturen AMD RDNA2, Intel Xe-HPC, nVidia Turing (nur GeForce-20-Modelle) und nVidia Ampere unterstützt.

Feature-Level 12_0 Feature-Level 12_1 Feature-Level 12_2
AMD GCN2, GCN3, GCN4 GCN5, RDNA1 RDNA2
Intel - - Xe-HPG
nVidia - Maxwell 2, Pascal, Turing (GF16) Turing (GF20), Ampere
28

Erste Hardware-Daten von nVidias GeForce RTX 3070, 3080 & 3090 aufgetaucht

Videocardz haben (angebliche) erste Hardware-Daten zu den Ampere-basierten Grafikkarten GeForce RTX 3070, GeForce RTX 3080 und GeForce RTX 3090 aus leider nicht weiter ausgeführten Quellen erhalten. Da hierbei auch eine später allein bei nVidias Boardpartnern (nicht als FE) erscheinende "GeForce RTX 3080 20GB" erwähnt wird, könnten jene Quellen in den Kreisen der Grafikkarten-Hersteller liegen – was wichtig wäre bei der Beurteilung der Taktraten, falls nVidia wie bei der initialen GeForce-20-Serie wieder eine Taktraten-Differenz zwischen Herstellermodellen und seiner eigenen Founders Edition macht. Dies ist für die anstehende GeForce-30-Serie natürlich noch nicht gegeben, eventuell rückt nVidia auch wieder von diesem Modell ab, wie schon beim "SUPER"-Refresh zur GeForce-20-Serie. Zu beachten wäre zu den angebenen Taktraten von GeForce RTX 3080 & 3090 zudem der Punkt, dass nVidias Grafikkarten in der Praxis gewöhnlich klar oberhalb jener Referenzwerte takten, die offizielle Taktraten-Angabe inzwischen kaum noch wertbar und nur schwerlich vergleichbar ist.

GeForce RTX 3070 GeForce RTX 3080 GeForce RTX 3090
Chipbasis GA104 (GA104-300) GA102 (GA102-200) GA102 (GA102-300)
Referenzboard PG142-10 PG132-10 PG132-30
Technik ? SM, 256 Bit GDDR6-Interface 68 SM, 320 Bit GDDR6X-Interface 82 SM, 384 Bit GDDR6X-Interface
Speicher & Takt 8 GB, ?/? MHz, 16 Gbps, 220W TGP 10 oder 20 GB, ?/1710 MHz, 19 Gbps, 320W TGP 24 GB, ?/1695 MHz, 19.5 Gbps, 350W TGP
basierend auf den Ausführungen von Videocardz; Chip-Takt: 1. Base-Clock, 2. Boost-Clock
27

Gerüchteküche: Aktualisierte TimeSpy-Werte zeigen auf +60% Mehrperformance bei Gaming-Ampere hin

Von Twitterer Kopite7kimi (bislang mit einer exzellenten Trefferquote bezüglich Ampere-basierten Gerüchten aufwartend) kommen aktualisierte Benchmark-Werte zu GeForce RTX 3080 & 3090 unter dem 3DMark13 TimeSpy Extreme. Gemäß der vorherigen TimeSpy-Benchmarks handelt es sich um GPU-Werte, inzwischen wurde nunmehr auch präzisiert, dass die teilnehmenden Ampere-Grafikkarten beiderseits Founders-Edition-Ausführungen darstellen. An den Werten selber ändert sich kaum etwas: Die GeForce RTX 3090 FE wurde zuletzt mit "almost 10000" angegeben, nunmehr sollen es mit "100xx" leicht mehr sein, während die GeForce RTX 3080 FE mit bislang "almost 8600" und nunmehr "85xx" komplett auf Kurs liegt. Die nachfolgende Tabelle wurde zudem um neuere Vergleichswerte der GeForce RTX 2080 Super FE ergänzt – deren Werte gleichzeitig auch einen Hinweis darauf liefern, dass die älteren TimeSpy-Ergebnisse von GeForce RTX 2080 & 2080 Ti nach wie vor korrekt sind: Denn die GeForce RTX 2080 Super liegt im TimeSpy fast exakt dort, wo jene gemäß des 3DCenter UltraHD Performance-Index hingehört, ergo dürfte es hierbei keine beachtbare Performance-Entwicklung über neuere Treiberversionen gegeben haben und diese "alten" TimeSpy-Werte sind somit nach wie vor vergleichbar.

Hardware TimeSpy Extr. (GPU) Quellen 4K Perf.Index
GeForce RTX 3090 FE nVidia Ampere, whrschl. GA102, 82 SM @ 384 Bit GDDR6X 100xx Kopite7kimi ca. 370-380%
GeForce RTX 3080 FE nVidia Ampere, whrschl. GA102, 68 SM @ 320 Bit GDDR6X 85xx Kopite7kimi ca. 310-320%
GeForce RTX 2080 Ti FE nVidia Turing, TU102, 68 SM @ 352 Bit GDDR6 Ø 6333 HWLuxx & OC3D 236%
GeForce RTX 2080 Super FE nVidia Turing, TU104, 48 SM @ 256 Bit GDDR6 Ø 5311 HWLuxx & OC3D 198%
GeForce RTX 2080 FE nVidia Turing, TU104, 46 SM @ 256 Bit GDDR6 Ø 4912 HWLuxx & OC3D 186%
"4K Perf.Index" = 3DCenter UltraHD Performance-Index
26

Gerüchteküche: Ampere-Launch am 21. September mit angeblich +35% Mehrperformance

Von Twitterer Leakbench kommt ein neues Gerücht mit einer Terminangabe sowie einer ungefähren Performance-Richtung zu den kommenden Ampere-Grafikkarten. Danach soll die Founders-Edition-Ausführung am 21. September antreten, die Herstellerdesigns eine Woche später am 28. September kommen. Da es üblicherweise keine zwei Launch-Termine gibt, dürften dies dann Markteinführungs-Termine sein, wobei zum ersteren von beiden dann auch der offizielle Launch mit den Launchreviews der Hardwaretester stattfindet (nVidias GeForce-Event am 1. September wird wie bekannt nur eine Ankündigung-Show). Auf welche Karte sich diese Terminlage dann bezieht, wurde allerdings nicht genannt: Sicherlich ist hierbei die GeForce RTX 3080 dabei, eventuell zeitgleich mit der GeForce RTX 3090 – dies bleibt abzuwarten. Normalerweise versucht nVidia seine Launches etwas zu strecken, dabei nur eine Karte pro Launch zu bringen – aber es gibt auch Gegenbeispiele, wie den seinerzeitigen Launch von GeForce RTX 2080 & 2080 Ti am selben Tag.

Ampere latest
21/09/2020 – FE
28/09/2020 – AIB
35% perf increase
 

Quelle:  Leakbench @ Twitter am 25. August 2020

21

Gerüchteküche: GeForce RTX 3090 gezeigt, Preislagen der Ampere-Modelle von 3060 bis 3090 genannt

Vom (bislang allerdings noch nicht aufgefallenen) Twitterer GarnetSunset (via Videocardz) kommt das Bild einer angeblichen GeForce RTX 3090, samt auch dem Größenvergleich zur direkt danebengelegten GeForce RTX 2080. Dies war auch notwendig, denn ansonsten hätte man schwerer erfassen können, was für ein "Riesel-Eumel" jene GeForce RTX 3090 doch ist. Der Kartenname zeigt sich zwar nicht anhand der abgebildeten Karte, wurde jedoch vom Twitterer derart genannt und ergibt sich letztlich auch allein anhand der Kartengröße. Jene belegt in der Breite ca. 32cm, geht in der Höhe ca. 3cm über die Oberkante des Slotblechs hinaus (problematisch für Mini-Gehäuse) und ist augenscheinlich gleich drei Slots dick (die Größenwerte sind wegen der Perspektivenverzerrung des Bilds nicht besonders genau zu nehmen). Gegenüber jener wahrhaftigen "BFGPU" sieht die GeForce RTX 2080 dann schon fast wie eine "Baby-Grafikkarte" aus.

14

Micron bestätigt GDDR6X-Speicher mit bis zu 21 Gbps - samt dessen Einsatz bei der GeForce RTX 3090

Videocardz haben in einem erst auf diesen August datierten Micron-Dokument eine klare Bestätigung für die Existenz von GDDR6X-Speicher und deren Einsatz bei kommenden Ampere-basierten Grafikkarten gefunden. Selbiger Speichertyp geistert seit einigen Wochen durch die Gerüchteküche, konnte jedoch mangels JEDEC-Spezifikation bislang nie für gänzlich voll genommen werden – was sich nunmehr erledigt, da sowohl die Existenz als auch der konkrete Einsatz bestätigt wurde. Allerdings könnte es sich in der Tat um eine "Marketing-Norm" seitens Speicherchip-Hersteller Micron handeln, womit schlicht besonders hoch getakteter GDDR6-Speicher im Verkauf als "GDDR6X" gelabelt wird. Denn aus den vorliegenden Daten ist keinerlei technischer Unterschied zum normalen GDDR6 zu erkennen – außer wie gesagt den höheren Bandbreiten, welche allerdings für einen Generation-Sprung (üblicherweise Verdopplung) doch noch zu niedrig liegen.

Inhalt abgleichen