11

Hardware- und Nachrichten-Links des 10./11. Oktober 2020

Bezüglich AMDs Singlethread-Rekorden mit Ryzen 9 5900X & 5950X (unter dem Cinebench R20) wäre noch darauf hinzuweisen, wie nahe Intels Tiger-Lake-Prozessoren im Mobile-Segment diesem Ergebnis bereits kommen. Die ComputerBase erzielte seinerzeit mit Intels Demo-Gerät einen Wert von glatt 600 Punkten – was wohl auch der Grund dafür war, das AMD bei seiner Zen-3-Vorstellung explizit vom ersten Desktop-Prozessor im 600er Punkte-Bereich sprach. Dabei spielt es in diesem Zusammenhang wohl keine Rolle, ob Intels Tiger-Lake-Demogerät besonders bei TDP & Kühlung "gepimpt" war, hier wird sowieso eher der Vergleich zum Desktop gesucht – und da könnte Tiger Lake zumindest potentiell unter Desktop-Bedingungen noch weiter zulegen. Als Fakt gesetzt werden kann dies allerdings auch nicht, denn die reine Singlethread-Last könnte durchaus bereits unter das TDP-Limit selbst im Mobile-Bereich passen. Ob eine Desktop-Variante von Tiger Lake in dieser Frage also noch substantiell zulegen kann, ist nicht wirklich sicher.

CB20 ST Quelle
Ryzen 9 5950X Zen 3, 16C/32T, $799 640 Ryzen 5000 Vorstellung
Ryzen 9 5900X Zen 3, 12C/24T, $549 631 Ryzen 5000 Vorstellung
Core i7-1185G7 Tiger Lake, 4C/8T 600 ComputerBase
Core i9-10900K Comet Lake, 10C/20T, $488 544 Ryzen 5000 Vorstellung
Ryzen 9 3900XT Zen 2, 12C/24T, $499 539 ComputerBase
Ryzen 9 3900X Zen 2, 12C/24T, $499 532 ComputerBase

So oder so ist es beiderseits ein gutes Ergebnis: Tiger Lake mit einem Mobile-Prozessor bei 600 Punkten, AMD mit seiner besten Desktop-CPU auf 640 Punkten. Nimmt man hingegen den Vergleich zum Ryzen 9 5900X bei 631 Punkten, so stimmen sogar die (nominellen) maximalen Singlethread-Taktraten überein – es sind beiderseits 4.8 GHz. Insofern da in der Praxis keine großen Abweichungen existieren und Intel unter Desktop-Bedingungen nicht noch substantiell zulegen könnte, kann man damit sagen, dass die Zen-3-Architektur Intels großen IPC-Sprung mit den "Ice Lake" und "Tiger Lake" Architekturen zumindest egalisiert hat, im Idealfall sogar leicht überboten hat. Die Differenz ist in diesem Fall (+5,2%) dann allerdings auch schon wieder so klein, dass man jene durchaus über höhere Taktraten überbrücken könnte – wo Intel nach wie vor seine Stärke hat. Ein Rocket-Lake-Prozessor mit angenommen ähnlicher IPC und Taktraten oberhalb 5 GHz könnte Zen 3 also durchaus wiederum Paroli bieten – bei der reinen Singlethread-Performance wohlgemerkt.

Beim TechSpot hat man sich eingehend mit der Frage beschäftigt, ob die GeForce RTX 3080 unter kleineren Auflösungen als UltraHD/4K wirklich in ein CPU-Limit bei der Ampere-Generation läuft. Die hinzu untersuchten Benchmarks ergeben allerdings kein ganz eindeutiges Bild: Teilweise war ein CPU-Limit nachweisbar, in vielen Fällen jedoch auch nicht – trotz allerdings unterdurchschnittlicher Performance-Zuwächse unter der WQHD-Auflösung. Der Verdacht liegt somit nahe, dass das CPU-Limit hier nur einen Faktor darstellt, andere Dinge genauso auch mitspielen. Erhärtet wird dieser Verdacht dann durch einen Tweet seitens Hardware Unboxed (TechSpot & Hardware Unboxed gehören zusammen), wobei eine GeForce RTX 3080 durch Heruntertakten auf das Performance-Level der GeForce RTX 2080 Ti unter der UltraHD-Auflösung gebracht wurde – um nachfolgend die Performance-Ergebnisse unter den anderen, niedrigeren Auflösungen zu vergleichen:

Und hierbei stellt sich heraus, dass die Ampere-Karte doch erheblich schlechter abschneidet als die Turing-Karte: Jene Rohleistung, welche unter UltraHD noch für eine identische Performance ausreicht, genügt der Ampere-Karte dann unter WQHD, FullHD und 720p nicht mehr, Ampere kommt dort bemerkbar langsamer durchs Ziel. Ob dies nur ein Einzelfall ist oder durchgängig derart passiert bzw. ob der vergleichsweise niedrige Chiptakt hier nicht Seitenwirkungen hat, müsste man allerdings eigentlich noch mittels weiterer Test herausfinden. Was jedoch bei diesem Test wirklich ausgeschlossen werden kann, sind CPU-Limits: Denn da die Benchmark-Werte der Turing-Karte höher ausfallen, müsste jene (in diesem Test) zuerst hierfür anfällig sein. Als Erklärung kann man eher an den grundsätzlichen Aufbau von Ampere denken: Ähnliche Anzahl an Raster-Engines & Shader-Clustern, gleiches Verhältnis von Textureneinheiten pro Shader-Cluster – aber eben verdoppelte FP32-Einheiten pro Shader-Cluster. Insbesondere GeForce RTX 2080 Ti und GeForce RTX 3080 lassen sich hierbei exzellent miteinander vergleichen, da von den zugrundeliegenden Grafikchips beiderseits jeweils genau 68 Shader-Cluster freigeschalten wurden.

GeForce RTX 2080 Ti GeForce RTX 3080
Abstammung Turing TU102 Ampere GA102
Raster-Engines 6 6
Shader-Cluster 6 6
FP32 pro Shader-Cluster 64 128
TMUs pro Shader-Cluster 4 4

Damit stehen zwischen beiden Grafikkarten (auf ähnlichen Taktraten) exakt die doppelte Anzahl an FP32-Einheiten – während hingegen die Anzahl der Raster-Engines, Shader-Cluster (samt deren Verwaltungslogik) und Textureneinheiten jeweils gleich ausfällt. Die gewisse Ampere-Schwäche unter niedrigeren Auflösungen dürfte dann vermutlich schlicht an den dort üblicherweise erzeugten hohen Frameraten liegen: Dies verlagert die durch den Grafikchip zu erbringende Leistung mehr in Richtung Raster-Engines und insgesamter Durchsatz. An diesen Stellen hat nVidia jedoch kaum etwas im Ampere-Design getan, ergo liegen dort auch die niedrigsten Performance-Gewinne – dies allerdings natürlich auch dort, wo sowieso schon ausreichend hohe fps-Zahlen generiert werden. Die Ampere-Architektur hat ihre Stärken eher dann, wenn pro Frame möglichst viel pur gerechnet werden muß – dies ist unter UltraHD und allen neueren Spieletiteln der Fall. Dass nVidia die Ampere-Architektur in diese Richtung hin optimiert hat, kann man eher denn als Vorteil betrachten – wenngleich für die nachfolgenden kleineren Ampere-Beschleuniger dennoch die Aufgabe besteht, unter WQHD und FullHD genauso zu glänzen.