Mit dem heutigen Launch der GeForce RTX 3080 startet nVidia seine Ampere-Architektur nunmehr auch für Gaming-Grafikkarten. Hiermit soll zum einen die Scharte der eher durchschnittlich bewerteten Turing-Generation ausgewetzt werden, als auch dem kommenden Ansturm der RDNA2-Grafikkarten sowie der NextGen-Konsolen vorgebeugt werden. Die GeForce RTX 3080 führt dafür – ungewöhnlich für eine xx80er Lösung – den besten Chip des Gaming-Portfolios in allerdings einer erheblichen Abspeckung ins Feld. Die gebotenen 68 Shader-Cluster entsprechend exakt dem Niveau der vorhergehenden GeForce RTX 2080 Ti – aber natürlich kann Gaming-Ampere mit seinen verdoppelten FP32-Einheiten deutlich mehr und so soll die GeForce RTX 3080 gemäß nVidias eigenen Benchmarks ca. +69% auf die GeForce RTX 2080 Super drauflegen. Ob dies der Realität entspricht, dürfen nun endlich die unabhängigen Hardwaretester anhand der "Founders Edition" zur GeForce RTX 3080 herausfinden, entsprechende Tests zu den Herstellermodellen sind erst für den morgigen 17. September freigegeben. Die Launchreviews zur GeForce RTX 3080 füllen somit derzeit das Internet, die Diskussion zum Launch in unserem Forum startet – und nachfolgend ist die obligatorische Launch-Analyse an dieser Stelle zu erwarten, welche insbesondere die aufgelaufenen Benchmarks zusammenfassen wird.
| Technik | Liste | Launch | |
|---|---|---|---|
| GeForce RTX 3090 | Ampere GA102, 82 SM @ 384 Bit, 24 GB GDDR6X | $1499 | 24. Sept. 2020 |
| GeForce RTX 3080 | Ampere GA102, 68 SM @ 320 Bit, 10 GB GDDR6X | $699 | 16. Sept. 2020 |
| GeForce RTX 3070 | Ampere GA104, 46 SM @ 256 Bit, 8 GB GDDR6 | $499 | 15. Okt. 2020 |
Bei Videocardz haben sich weitere Vorab-Benchmarks zur GeForce RTX 3080 angesammelt. Jene stammen wohl aus den kommenden Launchreviews zur GeForce RTX 3080 FE, haben ergo – insofern nVidia nicht noch eine andere Treiber-Version herausbringt – einen "zukünftig offiziellen" Charakter. Interessant ist der Hintergrund, wieso Videocardz an dieser Benchmarks gekommen sind: Die Hardware-Tester wollen angeblich ihre Benchmark-Resultate verifizieren, sprich mit denen anderer Tester abgleichen. Ein solches Vorhaben deutet gewöhnlich darauf hin, dass sich die Tester ob ihrer Test-Ergebnisse unsicher sind – sprich, jene fallen entweder zu hoch oder zu niedrig gegenüber der Erwartungslage aus. In Fall dieser Benchmarks zur GeForce RTX 3080 dürfte ersteres "Problem" sicherlich nicht vorliegen, dafür aber zweiteres: Die GeForce RTX 3080 kommt auch bei diesen Benchmarks nicht ganz auf dem hohen Level der nVidia-Vorhersagen heraus, sondern doch schon beachtbar niedriger.
| Auflösung | 2070S → 3080 | 2080S → 3080 | 2080Ti → 3080 | |
|---|---|---|---|---|
| 3DMark13 FireStrike Ultra (GPU) | UltraHD | +77% | +63% | +36% |
| 3DMark13 TimeSpy Extreme (GPU) | UltraHD | +83% | +68% | +36% |
| 3DMark13 Port Royal (Score) | WQHD | +94% | +65% | +33% |
| Far Cry 5 | UltraHD | +64% | +49% | +23% |
| Shadow of the Tomb Raider | UltraHD | +91% | +65% | +33% |
| Shadow of the Tomb Raider @ RT/DLSS | UltraHD | +69% | +43% | +23% |
| Performance-Durchschnitt | - | +79% | +59% | +30% |
| (nVidias Performance-Prognose) | - | (+93%) | (+69%) | - |
| gemäß der von Videocardz verbreiteten Benchmark-Werte zur GeForce RTX 3080 | ||||
Twitterer 'Rogame' berichtet in zwei Tweets – No.1 & No.2 – über die Ergebnisse eines geleakten Reviews zur GeForce RTX 3080 seitens des chinesischen Magazins 'TecLab'. Deren Video-Test war eine gewisse Zeit auf der chinesischen Plattform Bilibili einzusehen, wurde jedoch im Laufe des frühen Abends dann doch von dort heruntergenommen. Über "TecLab" selber gibt es verschiedene Meinungen, aber zumindest dieser Test soll laut Twitterer Kopite7kimi echt sein. Der Umfang der angetretenen Benchmarks ist nicht besonders hoch und die Art der Werte-Präsentation suboptimal (es wurden allein Spiele-Ausschnitte samt fps-Counter gezeigt, zu denen Performance-Differenz genannt wurden). Damit muß man mit den seitens TecLab genannten Differenz-Werten der GeForce RTX 3080 zur GeForce RTX 2080 Super sowie zur GeForce RTX 2080 Ti leben – und auch, dass es selbige bei den 3DMark13-Messungen immer nur zum Gesamt-Score und nicht zum reinen GPU-Wert gibt. Andererseits liegt der Vorteil dieser TecLab-Benchmarks schlicht darin, das hierbei erstmals unabhängige Spiele-Benchmarks präsentiert werden konnten – und zwar unter vier Spielen, welche weder RayTracing noch DLSS beherrschen.
| 2080S → 3080 | FullHD | WQHD | UltraHD |
|---|---|---|---|
| 3DMark13 FireStrike (overall Score) | +43% | +45% | +64% |
| 3DMark13 TimeSpy (overall Score) | - | +49% | +59% |
| 3DMark13 Port Royal (overall Score) | - | +64% | - |
| Assassin's Creed: Odyssey | - | - | +48% |
| Borderlands 3 | - | - | +56% |
| Far Cry 5 | - | - | +62% |
| Forza Horizon 4 | - | - | +48% |
| Durchschnitt inkl. 3DMarks | - | - | +56% |
| Durchschnitt reine Spiele-Tests | - | - | +53% |
| basierend auf dem bei Bilibili geleakten Test von TecLab, notiert seitens Rogame @ Twitter: Tweet #1 & Tweet #2 | |||
Twitterer Kopite7kimi bringt eine weitere Ampere-Grafikkarte ins Spiel, welche sich "GeForce RTX 3060 Ti" oder "GeForce RTX 3060 Super" nennen, auf dem GA104-Chip basieren und wie die GeForce RTX 3070 mit 8 GB GDDR6-Speicher antreten soll. Wenn die GeForce RTX 3070 nahezu den Vollausbau des GA104-Chips benutzt (46 von maximal 48 Shader-Cluster sind aktiv), stellt diese GeForce RTX 3060 Ti/Super dann die kleinere, preisgünstigere GA104-Ausführung dar, denn jene Karte soll nur 38 aktive Shader-Cluster und somit 4864 CUDA-Cores aufbieten. Dies ist leicht weniger als bei unserer bisherigen Annahme von 40-42 Shader-Cluster für eine solcherart zweite GA104-basierte Grafikkarte, soll aber vermutlich zu einer besseren Produktabgrenzung zwischen GeForce RTX 3070 und GeForce RTX 3060 Ti/Super beitragen. Die Differenz bei der Anzahl der aktiven Shader-Cluster liegt somit bei +21% zur GeForce RTX 3070, was angenommen einer ähnlichen Differenz bei der Speicherbandbreite dann zu einer Performance-Differenz von +15-18% führen kann.
PG142-SKU20
GA104-200
8G GDDR6
4864 FP32
= RTX 3060 Ti or Super
Quelle: Kopite7kimi @ Twitter am 8. September 2020
In unserem Forum wurde der erste Eintrag einer GeForce RTX 3080 Grafikkarte unter dem Geekbench 5 bzw. dem dortigen OpenCL-Test erspäht (Update: CUDA-Werte hinzugefügt). Wie bei den bereits vorliegenden Benchmark-Werten einer GeForce RTX 3080 unter dem CompuBench handelt es sich hierbei um Rechenleistungs-Messungen, welche wenig mit der Spiele-Performance zu tun haben und regulärerweise nur für OpenCL-Nutzer von Interesse sind. Allerdings kann man hieran recht gut erahnen, wie speziell die verdoppelten FP32-Einheiten der "Ampere" Shader-Cluster in der Praxis wirken bzw. welche Recheneffizienz jene aufbieten können. Die Ergebnisse sind leicht besser als unter dem CompuBench und vor allem rasiert die GeForce RTX 3080 – als immerhin nur zweitbeste Grafikkarte des kommenden Ampere-Portfolios – alle bisher unter dem Geekbench 5 OpenCL-Tests gelisteten GeForce-Grafikkarten mit Abstand weg. Selbst eine GV100-basierte "GRID V100S-32Q" als bisher an der Spitzenposition gelistete Server-Lösung wird mit gleich +25% OpenCL-Mehrperformance klar geschlagen.
| Hardware | GB5 OpenCL | Anmerkung | (GB5 CUDA) | |
|---|---|---|---|---|
| GeForce RTX 3080 | Ampere, GA102, 68 SM @ 320 Bit GDDR6X | 191'891 | +86% vs. 2080, +74% vs. 2080S, +46% vs. 2080Ti | (215'361) |
| GRID V100S-32Q | Volta, GV100, 80 SM @ 4096 Bit HBM2 | 153'272 | - | - |
| Titan RTX | Turing, TU102, 72 SM @ 384 Bit GDDR6 | 134'369 | - | (143'168) |
| GeForce RTX 2080 Ti | Turing, TU102, 68 SM @ 352 Bit GDDR6 | 131'494 | +28% vs. 2080, +19% vs. 2080S | (162'452) |
| GeForce RTX 2080 Super | Turing, TU104, 48 SM @ 256 Bit GDDR6 | 110'399 | +7% vs. 2080 | (125'433) |
| GeForce RTX 2080 | Turing, TU104, 46 SM @ 256 Bit GDDR6 | 102'969 | - | (119'746) |
| Quellen in der Geekbench 5 Datenbank: RTX 3080 OpenCL, RTX 3080 CUDA, GB5 OpenCL-Bestenliste & GB5 CUDA-Bestenliste | ||||
Die Marktbeobachter von Jon Peddie Research berichten über den Grafikkarten-Markt im zweiten Quartal 2020, welcher erhebliche Verschiebungen bei den Marktanteilen unter zugleich einer (teilweise) enormen Zunahme der Grafikkarten-Absätze gesehen hat. Jene Absätze legten gegenüber dem Vorquartal um +6,6% und gegenüber dem Vorjahreszeitraum aber gleich um +36,7% zu – letztlich der gleiche Effekt, welcher schon mit dem Mindfactory Grafikkarten Retail-Verkaufsreport Q2/2020 beschrieben wird. Profitieren konnte hiervon allerdings eigentlich nur nVidia, welche ihren Marktanteil gegenüber dem Vorquartal um gleich ca. 9 Prozentpunkte steigern konnten. Während das Marktanteils-Verhältnis zwischen AMD und nVidia im ersten Quartal 2020 mit 31:69% (angesichts der Gesamtsituation) noch halbwegs annehmlich aussah, wurden im zweiten Quartal 2020 mit 22:78% wieder einmal Zahlen erzielt, welche nVidia als klaren Dominator des Markts an Desktop-Grafikkarten sehen.
| AiB-Grafikchips | Q2/2019 | Q3/2019 | Q4/2019 | Q1/2020 | Q2/2020 |
|---|---|---|---|---|---|
| AMD | 32,1% | 27,1% | 31,1% | 30,8% | 22% |
| nVidia | 67,9% | 72,9% | 68,9% | 69,2% | 78% |
| Quelle: Jon Peddie Research | |||||
Nachdem sich die früheren Vorhersagen zur Ampere-Hardware durch Twitterer Kopite7kimi nunmehr nach dem GA100-Chip auch beim GA102- sowie beim GA104-Chip bestätigt haben, kann man davon ausgehen, das jene bereits seit Mai 2019 vorliegende Vorhersage auf durchgehend echten Daten beruht. Schließlich stimmen auch die selten beachteten Details wie die 7 Graphics Processing Cluster (GPC) beim GA102-Chips, welche man wegen der ungerade Zahl kaum "freiwillig" vorhersagen würde. Zusammen mit der kürzlichen Klarstellung, wie sich die Shader-Cluster von Gaming-Ampere aufbauen (zuzüglich einer Detail-Infos zu den Ampere-ROPs sowie zu den Tensor-Cores von Ampere), kann man davon ausgehend bereits die komplette "Ampere"-Chipserie in ihren grundsätzlichen Hardware-Spezifikationen erkennen. Nachfolgende Aufstellung ist bezüglich der Ampere-Chips GA107 & GA106 natürlich noch nicht gefeit vor letztendlichen Fehlern, bezüglich GA104 & GA102 kann man sich hingegen nahezu sicher sein, fehlt zumeist nur noch eine hochoffizielle Bestätigung des allerdings bereits offensichtlichen:
| GA107 | GA106 | GA104 | GA102 | GA100 | |
|---|---|---|---|---|---|
| Raster-Engines (GPC) | 2 | 3 | 6 | 7 | 8 |
| Shader-Cluster (SM) | 20 | 30 | 48 | 84 | 128 |
| FP32-Einh. (CUDA-Cores) | 2560 | 3840 | 6144 | 10752 | 8192 |
| INT32-Einheiten | 1280 | 1920 | 3072 | 5376 | 8192 |
| Textureneinh. (TMUs) | 80 | 120 | 192 | 336 | 512 |
| Tensor-Cores | 80 | 120 | 192 | 336 | 512 |
| RT-Cores | möglw. 20 (?) | möglw. 30 (?) | 48 | 84 | ✗ |
| ROPs | 32 | 48 | 96 | 112 | whrschl. 128 |
| Level2-Cache | ? | ? | 4 MB | 6 MB | 48 MB |
| Speicherinterface | 128 Bit GDDR6 | 192 Bit GDDR6 | 256 Bit GDDR6 | 384 Bit GDDR6X | 6144 Bit HBM2 |
| Grafikkarten | GTX/RTX 3040 Serie (?) | GTX/RTX 3050 Serie (?) | RTX 3060, 3070 & 3070 Ti | RTX 3080 & 3090 | rein HPC |
| Release | Q1/2021 | Q1/2021 | Oktober 2020 | 17. September 2020 | 14. Mai 2020 |
| Basis: Ampere Hardware-Vorhersage von 'Kopite7kimi' & nVidia-Aussagen zur Ampere-Architektur | |||||
Mit den Gaming-Lösungen der Ampere-Generation fuhr nVidia bei seinem "GeForce Special Event" schwere Geschütze auf: Mehr als verdoppelte Anzahl an CUDA-Cores (Shader-Einheiten), das 1,7fache an Shader-Rechenkraft samt einer Performance-Projektion von grob dem Doppelten gegenüber Turing. Die vorherigen Annahmen zu Gaming-Ampere lagen zwar bei der Anzahl der gebotenen Shader-Cluster richtig, haben jedoch – bis auf vereinzelte frühere Gerüchte – bis zuletzt jene (mehr als) Verdopplung der FP32-Performance nicht auf dem Plan gehabt. Dabei war es zuerst etwas unklar, wie nVidia dies konkret realisierte: Gerade weil die Tendenz der Grafikchip-Entwickler klar in Richtung kleinerer Shader-Cluster mit (relativ) weniger Recheneinheiten pro Shader-Cluster ging, erschien eine plötzliche Entwicklung in die andere Richtung hin schwer vorstellbar. Genau dies hat nVidia jedoch tatsächlich getan: Die Shader-Cluster (SM) von Ampere tragen laut einer offiziellen nVidia-Aussage auf Reddit nunmehr gleich 128 FP32-Einheiten – anstatt wie bei der vorhergehenden Turing-Generation nur 64 FP32-Einheiten.
The Ampere SM includes new datapath designs for FP32 and INT32 operations. One datapath in each partition consists of 16 FP32 CUDA Cores capable of executing 16 FP32 operations per clock. Another datapath consists of both 16 FP32 CUDA Cores and 16 INT32 Cores. As a result of this new design, each Ampere SM partition is capable of executing either 32 FP32 operations per clock, or 16 FP32 and 16 INT32 operations per clock.
Quelle: nVidias Tony Tamasi auf Reddit am 2. September 2020
Mit seinem "GeForce Special Event" hat nVidia die ersten Ampere-basierten Gaming-Grafikkarten vorgestellt. Dabei hat man sich vergleichsweise wenig auf Technik und Spezifikationen konzentriert, sondern versuchte vor allem mittels der (eigenen) Performance-Projektion sowie der Preislage zu punkten. Insbesondere letzteres ist nVidia zweifelsfrei gelungen, denn angesichts der vorherigen Befürchtungen über (wieder einmal) steigende Grafikkarten-Preise hören sich 499 Dollar/Euro für eine GeForce RTX 3070 8GB (erhältlich im Oktober) sowie 699 Dollar/Euro für eine GeForce RTX 3080 (erhältlich ab 17. September) durchaus vernünftig an. Dem gegenüber fällt die GeForce RTX 3090 24GB (erhältlich ab 24. September) mit 1499 Dollar/Euro deutlich ab – allerdings war diese Preislage zumindest erwartet worden. Die Formulierung auf der nVidia-Webseite gibt daneben Anlaß anzunehmen, dass es innerhalb der Ampere-Generation keine Preisdifferenz zwischen Hersteller- und FE-Karten mehr gibt, genauso liegen die bereits offiziell genannten deutschen UVP-Preise exakt auf dem Niveau der US-Listenpreise.
| GeForce RTX 3070 | GeForce RTX 3080 | GeForce RTX 3090 | |
|---|---|---|---|
| Technik | 5888 CUDA-Cores @ 1.73 GHz Boost-Takt, 256 Bit GDDR6-Interface | 8704 CUDA-Cores @ 1.71 GHz Boost-Takt, 320 Bit GDDR6X-Interface @ 19 Gbps | 10496 CUDA-Cores @ 1.70 GHz Boost-Takt, 384 Bit GDDR6X-Interface @ 19.5 Gbps |
| Speicherausbau | 8 GB GDDR6 | 10 GB GDDR6X | 24 GB GDDR6X |
| Rohleistungen | 20 TFlops, 40 RT-TFlops, 163 Tensor-TFlops | 30 TFlops, 58 RT-TFlops, 238 Tensor-TFlops, 760 GB/sec | 36 TFlops, 69 RT-TFlops, 285 Tensor-TFlops, 936 GB/sec |
| off. Verbrauch | 220W (GCP) | 320W (GCP) | 350W (GCP) |
| Kartengröße | FE: 242mm, 2-Slot | FE: 285mm, 2-Slot | FE: 313mm, 3-Slot |
| Listenpreis | $499 (UVP: 499€) | $699 (UVP: 699€) | $1499 (UVP: 1499€) |
| Release | Oktober 2020 | 17. September 2020 | 24. September 2020 |
| Anmerkung: basierend allein auf dem "GeForce Special Event" sowie den offiziellen Daten auf nVidias Webseite | |||
Twitterer 326powah weisst auf den hochinteressanten Umstand hin, dass sich aus den ganzen Palit-Eintragungen gemäß der gewählten Produktnummern sogar die benutzten Grafikchips sowie Differenzen in den Speichermengen herauslesen lassen. Relevant ist der benutzte Grafikchip speziell bei der GeForce RTX 3060, bei den anderen Ampere-Grafikkarten ist jener dato schon bekannt. Die Angaben erfolgt in der Produktnummer nach dem Bindestrich, beispielsweise zeigt "NE6306T019P2-1041A" auf die Verwendung des GA104-Chip für diese GeForce RTX 3060 hin. Wenn man die anderen Grafikkarten kontrolliert, passt dies auffallend, zur GeForce RTX 3070 wird (wie zu erwarten) ebenfalls der GA104-Chip notiert, zu GeForce RTX 3080 & 3090 (wie zu erwarten) der GA102-Chip. Teilweise finden sich auch andere Notierungen, aber jene zeigen wohl nicht auf andere Grafikchips hin, sondern geben die jeweiligen Grafikboards wieder: "PG132" bei GeForce RTX 3080 & 3090 sowie "PG190" bei der GeForce RTX 3060 – so, wie früher bereits vermeldet.