7

Erster Geekbench-Wert zur GeForce RTX 3080 aufgetaucht

In unserem Forum wurde der erste Eintrag einer GeForce RTX 3080 Grafikkarte unter dem Geekbench 5 bzw. dem dortigen OpenCL-Test erspäht (Update: CUDA-Werte hinzugefügt). Wie bei den bereits vorliegenden Benchmark-Werten einer GeForce RTX 3080 unter dem CompuBench handelt es sich hierbei um Rechenleistungs-Messungen, welche wenig mit der Spiele-Performance zu tun haben und regulärerweise nur für OpenCL-Nutzer von Interesse sind. Allerdings kann man hieran recht gut erahnen, wie speziell die verdoppelten FP32-Einheiten der "Ampere" Shader-Cluster in der Praxis wirken bzw. welche Recheneffizienz jene aufbieten können. Die Ergebnisse sind leicht besser als unter dem CompuBench und vor allem rasiert die GeForce RTX 3080 – als immerhin nur zweitbeste Grafikkarte des kommenden Ampere-Portfolios – alle bisher unter dem Geekbench 5 OpenCL-Tests gelisteten GeForce-Grafikkarten mit Abstand weg. Selbst eine GV100-basierte "GRID V100S-32Q" als bisher an der Spitzenposition gelistete Server-Lösung wird mit gleich +25% OpenCL-Mehrperformance klar geschlagen.

Hardware GB5 OpenCL Anmerkung (GB5 CUDA)
GeForce RTX 3080 Ampere, GA102, 68 SM @ 320 Bit GDDR6X 191'891 +86% vs. 2080, +74% vs. 2080S, +46% vs. 2080Ti (215'361)
GRID V100S-32Q Volta, GV100, 80 SM @ 4096 Bit HBM2 153'272 - -
Titan RTX Turing, TU102, 72 SM @ 384 Bit GDDR6 134'369 - (143'168)
GeForce RTX 2080 Ti Turing, TU102, 68 SM @ 352 Bit GDDR6 131'494 +28% vs. 2080, +19% vs. 2080S (162'452)
GeForce RTX 2080 Super Turing, TU104, 48 SM @ 256 Bit GDDR6 110'399 +7% vs. 2080 (125'433)
GeForce RTX 2080 Turing, TU104, 46 SM @ 256 Bit GDDR6 102'969 - (119'746)
Quellen in der Geekbench 5 Datenbank: RTX 3080 OpenCL, RTX 3080 CUDA, GB5 OpenCL-Bestenliste & GB5 CUDA-Bestenliste

Allerdings ergibt sich auch unter diesem OpenCL-Test eine weit vom Idealzustand entfernte Rechenleistungs-Skalierung der GeForce RTX 3080. Zwar skaliert der Geekbench 5 OpenCL-Test in der Spitze ganz augenscheinlich nicht wirklich gut nach oben, aber bei GeForce RTX 2080 Super & GeForce RTX 2080 Ti werden wenigstens noch OpenCL-Ergebnisse erzielt, welche in sichtbarer Nähe von deren Rechenleistungs-Plus' liegen. Bei der GeForce RTX 3080 gibt es zwar gleich +86% OpenCL-Performance auf die GeForce RTX 2080 oben drauf, dafür werden jedoch auch gleich +196% mehr Rechenleistung benötigt, sprich für etwas weniger als die doppelte Performance fast das Dreifache an Rechenleistung benötigt (gerechnet gegenüber den Referenz-Taktraten zur GeForce RTX 2080, da die Geekbench-Datenbank augenscheinlich primär mit Herstellerkarten und privat durchgeführten Benchmarks gefüttert wurde). Damit sinkt die OpenCL/FP32-Effizienz der GeForce RTX 3080 auf nur noch 63% des Niveaus der GeForce RTX 2080 ab – umgerechnet geht die GeForce RTX 2080 also um immerhin +59% besser mit ihrer Rohleistung um als die GeForce RTX 3080.

GB5 OpenCL FP32-Power OpenCL/FP32-Effizienz
GeForce RTX 3080 191'891  (186%) 29,77 TFlops  (296%) 63% effizient
GeForce RTX 2080 Ti 131'494  (128%) 14,23 TFlops  (141%) 91% effizient
GeForce RTX 2080 Super 110'399  (107%) 11,15 TFlops  (111%) 96% effizient
GeForce RTX 2080 102'969  (100%) 10,07 TFlops  (100%) Basis-Wert: 100%
Quellen in der Geekbench 5 Datenbank: GeForce RTX 3080 & offizielle Geekbench 5 OpenCL-Bestenliste

Hier dürfte einmal mehr der Effekt der pur verdoppelten FP32-Einheiten ohne aber ein insgesamt breiteres Grafikchip-Design bei der Ampere-Architektur zu sehen sein. Beide Seiten der Medaille sind dabei richtig: Zum einen erzielt die Ampere-Architektur mit den verdoppelten FP32-Einheiten einen gewaltigen Performance-Satz, welcher die Spitzenlösungen in bisher unbekannte Performance-Regionen katapultiert und es den kleineren Ampere-Grafikkarten (voraussichtlich) ermöglicht, gegenüber früheren HighEnd-Lösungen anzutreten. Zum anderen aber täuscht der enorme Sprung bei der FP32-Rechenleistung bzw. bei der Anzahl der Shader-Einheiten (CUDA-Cores) über den realen Performance-Effekt von Ampere hinweg – jener ist augenscheinlich deutlich kleiner als der nominelle Rohleistungssprung verheißt. nVidias eigene Performance-Prognosen zu Ampere dürften somit nicht gänzlich zu halten sein, nichtsdestotrotz wird der mit Ampere kommende Performancesprung ausreichend groß sein, um (so wie von neuen Grafikchip-Generationen zu erwarten) alle bisherigen Performance-Maßstäbe zu pulverisieren.

AMD nVidia Turing nVidia Ampere
GeForce RTX 3090  —  ~380-420%
Navi 21 ("Big Navi")  —  ~300-350% GeForce RTX 3080  —  ~320-360%
GeForce RTX 2080 Ti (FE)  —  236% GeForce RTX 3070  —  ~220-250%
GeForce RTX 2080 Super  —  198%
Radeon VII  —  173% GeForce RTX 2070 Super  —  172%
Radeon RX 5700 XT  —  156% GeForce RTX 2070 (FE)  —  151%
Performance-Angaben gemäß des 3DCenter UltraHD Performance-Index; für Navi 2X & Ampere natürlich geschätzt

Nachtrag vom 7. September 2020

Einen weiteren guten Hinweis darauf, dass die Ampere-Grafikkarten ihre extreme FP32-Rechenleistung nicht zwingend in Spiele-Performance ummünzen können bzw. dass es eben auch schlechter mit Ampere skalierende Benchmarks geben kann, ergibt sich mittels des von Twitterer Rogame erspähten und seitens Videocardz ausgewerteten AotS-Benchmarks der GeForce RTX 3080. Zu "Ashes of the Singularity" liegen leider keine guten Referenzwerte vor, aber Videocardz haben sich einfach damit beholfen, für die Turing-Grafikkarten den Median aller jemals in die AotS Benchmark-Datenbank eingeflossenen Werte anzusetzen – was gemäß vereinzelt genannter Benchmarks zu diesen Karten ganz praktikable Vergleichs-Werte ergibt. Danach kommt die GeForce RTX 3080 immer noch klar oberhalb der GeForce RTX 2080 Ti heraus, die erzielte Performance-Differenz ist mit +27% jedoch deutlich kleiner als beispielsweise im Geekbench 5 oder auch mit dem CompuBench vermessen. Beispielsweise würde in diesem Fall die Mehrperformance der GeForce RTX 3080 nicht ausreichend sein, um deren letzte Performance-Prognose von ~320-360% (im 3DCenter UltraHD Performance-Index) zu halten, der AoTS-Benchmark würde hochgerechnet "nur" für einen Performance-Index von ~290-300% langen.

Technik AotS "Crazy" 4K Anmerkungen
GeForce RTX 3080 Ampere, GA102, 68 SM @ 320 Bit GDDR6X 88,3 fps +55% vs. 2080S, +27% vs. 2080Ti
GeForce RTX 2080 Ti Turing, TU102, 68 SM @ 352 Bit GDDR6 69,7 fps +21% vs. 2080S
GeForce RTX 2080 Super Turing, TU104, 48 SM @ 256 Bit GDDR 57,4 fps -
gemäß des von Rogame @ Twitter erspähten Aots-Benchmarkwerts der GeForce RTX 3080 sowie den Vergleichswerten seitens Videocardz

Dies wäre für jene Grafikkarte mit deutlich niedrigerem Listenpreis gegenüber der GeForce RTX 2080 Ti immer noch gut und würde die GeForce RXT 3080 somit kaum stören. Die größere Auswirkung hiervon liegt eher bei der nachfolgenden kleineren GeForce RTX 3070, welche aufgrund ihrer Hardware-Ansetzung grob auf eine Performance-Differenz von +40% (bzw. -30%) zwischen 3070 & 3080 zu schätzen ist. Zu jener GeForce RTX 3070 verspricht nVidia wie bekannt eine Performance sogar oberhalb der GeForce RTX 2080 Ti – was aber nur zu halten sein wird, wenn die GeForce RTX 3080 ihrerseits oberhalb von +40% auf die GeForce RTX 2080 Ti drauflegt. Jener Aots-Benchmark stellt dies etwas in Frage – gut möglich, dass die GeForce RTX 3070 etwas unterhalb von nVidias Performance-Prophezeihung herauskommt und damit auch das Performance-Level der GeForce RTX 2080 Ti nicht ganz erreicht. Auch für die GeForce RTX 3070 wäre dies angesichts ihrer Preislage sicherlich kein Beinbruch, es geht bei diesen Überlegungen allein um eine möglichst korrekte Vorhersage zur Performance der kommenden Ampere-Grafikkarten. Inwiefern die reale Performance der GeForce RTX 3080 sich mehr in Richtung Geekbench/CompuBench oder mehr in Richtung AotS bewegt, wird sich mit den kommenden Launchreviews zeigen – bezüglich der GeForce RTX 3070 wird man dagegen wie bekannt auf Oktober warten müssen.

In unserem Forum wurde der erste Eintrag einer GeForce RTX 3080 Grafikkarte unter dem Geekbench 5 bzw. dem dortigen OpenCL-Test erspäht (Update: CUDA-Werte hinzugefügt). Wie bei den bereits vorliegenden Benchmark-Werten einer GeForce RTX 3080 unter dem CompuBench handelt es sich hierbei um Rechenleistungs-Messungen, welche wenig mit der Spiele-Performance zu tun haben und regulärerweise nur für OpenCL-Nutzer von Interesse sind. Allerdings kann man hieran recht gut erahnen, wie speziell die verdoppelten FP32-Einheiten der "Ampere" Shader-Cluster in der Praxis wirken bzw. welche Recheneffizienz jene aufbieten können. Die Ergebnisse sind leicht besser als unter dem CompuBench und vor allem rasiert die GeForce RTX 3080 - als immerhin nur zweitbeste Grafikkarte des kommenden Ampere-Portfolios - alle bisher unter dem Geekbench 5 OpenCL-Tests gelisteten GeForce-Grafikkarten mit Abstand weg. Selbst eine GV100-basierte "GRID V100S-32Q" als bisher an der Spitzenposition gelistete Server-Lösung wird mit gleich +25% OpenCL-Mehrperformance klar geschlagen.





Hardware
GB5 OpenCL
Anmerkung
(GB5 CUDA)





GeForce RTX 3080
Ampere, GA102, 68 SM @ 320 Bit GDDR6X
191'891
+86% vs. 2080, +74% vs. 2080S, +46% vs. 2080Ti
(215'361)



GRID V100S-32Q
Volta, GV100, 80 SM @ 4096 Bit HBM2
153'272
-
-



Titan RTX
Turing, TU102, 72 SM @ 384 Bit GDDR6
134'369
-
(143'168)



GeForce RTX 2080 Ti
Turing, TU102, 68 SM @ 352 Bit GDDR6
131'494
+28% vs. 2080, +19% vs. 2080S
(162'452)



GeForce RTX 2080 Super
Turing, TU104, 48 SM @ 256 Bit GDDR6
110'399
+7% vs. 2080
(125'433)



GeForce RTX 2080
Turing, TU104, 46 SM @ 256 Bit GDDR6
102'969
-
(119'746)



Quellen in der Geekbench 5 Datenbank: RTX 3080 OpenCL, RTX 3080 CUDA, GB5 OpenCL-Bestenliste & GB5 CUDA-Bestenliste