24

Hardware- und Nachrichten-Links des 23./24. März 2019

Als Nachtrag zu den ersten Grafikkarten-Benchmarks unter The Division 2 soll noch auf die entsprechenden Ausführungen seitens der PC Games Hardware als auch von WCCF Tech eingegangen werden, welche insbesondere in Bezug auf die benötigte Speichermenge interessant sind. So konnte man bei der PC Games Hardware (selbst unter der FullHD-Auflösung) eine noch etwas stärkere Speicherbelastung feststellen, welche dann beispielsweise zwischen GeForce GTX 970 und 980 in einer leicht unterdurchschnittlichen Performance der kleineren Karte (mit praktisch nur nutzbaren 3,5 GB Speicher) resultiert. Noch drastischer ist dann allerdings das Performance-Bild, welches WCCF Tech zwischen GeForce GTX 1060 3GB und 6GB ausgemessen haben. Hier verliert die kleinere Karte, welche normalerweise nur gut -10% langsamer sein sollte, sehr augenfällig zur größeren Karte schon unter der FullHD-Auflösung: Gleich -35% bei der durchschnittlichen Performance, -45% bei den 1% Min-Frameraten und satte -74% bei den 0,1% Min-Frameraten.

Im letztgenannten Fall kommt die GeForce GTX 1060 3GB mit 10 fps bei der 0,1% Min-Framerate dann auch in den sicher unspielbaren Bereich hinein, zumindest dürfte dies schon für sichtbare Ruckler sorgen. Dafür, das dies alles nur unter der FullHD-Auflösung passiert und das gewählte "Ultra"-Bildqualitätspreset noch nicht einmal die maximale Grafikqualität bei "The Division 2" darstellt (man kann Reflexionen und Schatten noch weiter erhöhen), ist dies schon eine klare Differenz. Bislang hatte die GeForce GTX 1060 3GB zumeist eher nur mit ungesunden Frametimes bzw. Minimum-Frameraten zu kämpfen, selten aber mit einem derart klaren Performance-Rückstand. Unter höheren Auflösungen wird dies dann schnell drastischer – aber dies wäre dann unfair für die GeForce GTX 1060 3GB, welche sicherlich maximal für die FullHD-Auflösung gedacht ist. Auch unter der WQHD-Auflösung ist in den Benchmarks beider Artikel im übrigen noch keine echte Performance-Differenz zwischen 4GB- und 8GB-Karten zu sehen. Selbige gibt es dann erst unter der UltraHD-Auflösung – wobei Grafikkarten, welche bei "The Division 2" unter dieser Auflösung noch anständigen Frameraten aufbieten können, sowieso mit mehr Grafikkartenspeicher ausgerüstet sind.

Bei Tom's Hardware hat man sich angesehen, was mit einer exzellenten Kühlung noch aus der Radeon VII herauszuholen ist. Hierzu kam eine Wasserkühlung mit EKWB "Vector" Wasserblock samt Alphacool-Chiller zum Einsatz. Dabei fiel auf, das die Karte ziemlich schnell an eine Taktraten-Grenze stoß, welche im konkreten Fall bei (stabil) 2062 MHz realer Chiptakt sowie 1250 MHz Speichertakt lag. Das Taktraten-Niveau schwankte dabei im Spiel natürlich, ging beispielsweise kurzzeitig bis auf 2110 MHz Chiptakt hinauf – wo dann wohl die echte "Mauer" liegt. Denn im Extremversuch war ein 3DMark13-Durchlauf noch bei 2118 MHz möglich – nur ist diese Taktrate dann keineswegs noch Spiele-stabil. Ausgehend von den regulären 1400/1750/1000 MHz der Radeon VII sind die hiermit erreichten +17,8% mehr Chiptakt sowie +12,5% mehr Speichertakt dann doch ein hochklassiges Ergebnis. Allerdings kommt man damit (und dies trotz der 7nm-Fertigung samt der eingesetzten Wasserkühlung) nicht auf höhere Taktraten als bei regulären Übertaktungen von Turing-Grafikkarten. Dennoch reicht es zu einer guten Mehrperformance der übertakteten Karte von immerhin +14,1%, was zudem eine vergleichsweise gute Skalierung ergibt.

Radeon VII GeForce RTX 2080 Radeon VII OC GeForce RTX 2080 Ti
Taktraten 1400/1750/1000 MHz - 2062/1250 MHz
(+17,8% bzw. +12,5%)
-
Schnitt aus vier UltraHD-Benchmarks
(BF5, FC5, TD1, W2)
100% 99,7% 114,1% 122,6
gemäß der Benchmarks von Tom's Hardware

Übertaktet läßt die Radeon VII dann die (unübertaktete) GeForce RTX 2080 klar hinter sich (unter den vier ausgewählten Benchmarks ergab sich allerdings sowieso schon ein eher untypischer Performance-Gleichstand zwischen Radeon VII und GeForce RTX 2080) und liegt letztlich gar nicht mehr so weit von der (unübertakteten) GeForce RTX 2080 Ti entfernt. Beide nVidia-Karten lassen sich natürlich genauso noch vernünftig übertakten, insofern ändert die Übertaktung wenig am gesamten Performance-Bild – auch für die GeForce RTX 2080 wurde beispielsweise bereits eine Mehrperformance unter Übertaktung von (je nach Karte) +10-15% genannt, dies kommt in etwa auf das Übertaktungsniveau der Radeon VII hinaus. Mitnehmen kann man aus diesem Test vor allem die Erkenntnis, das AMD über die 7nm-Fertigung des zugrundeliegenden Vega-20-Chips noch nicht dies an Taktrate gewonnen hat, was eigentlich gebraucht würde, um nVidia wirklich zu schlagen. Dies kann sich mit zukünftigen weiteren 7nm-Grafikchips aber natürlich noch ändern, der Vega-20-Chip der Radeon VII ist schließlich ein klares Pipecleaner-Produkt, wurde demzufolge wenig bis gar nicht auf die Möglichkeiten der 7nm-Fertigung angepasst.

Die PC Games Hardware berichtet über eine Samsung-eigene Erweiterung des HBM2-Standards, welche teilweise höhere Spezifikationen als sogar die offizielle Standard-Verbesserungen "HBM2.5" zuläßt. Samsungs "HMB2E" unter dem Samsung-eigenen Beinamen "Flashbolt" nutzt Speicherchips von bis zu 2 GByte Kapazität (HBM2: bis zu 1 GB), womit sich bei einem Hi8-Package bis zu 16 GB Speicher in einen einzelnen HBM2-Speicherstack packen passen. In diesem Punkt ist das offizielle HBM2.5 allerdings schon etwas weiter (maximal 24 GB in einem HBM2.5-Speicherstack bei Hi8), wobei bis dato noch keiner der Speicherhersteller entsprechendes im Angebot hat. Samsung bietet für HBM2E dann allerdings noch bis zu 1600 MHz DDR Speichertakt an, was klar oberhalb der (offiziellen) Möglichkeiten selbst von HBM2.5 (1200 MHz DDR) liegt. Selbiger Takt würde sich natürlich auch für gewöhnliches HBM2 lohnt, die technische Grundlage in Form der entsprechenden Stapel-DRAMs sollte dieselbe sein. Allerdings dürften diese schnellen HBM2E-Bausteine auch wieder teuer werden, womit sich das ganze wohl nur im professionellen Bereich wirklich lohnt. Sofern es dort mal zu beachtbaren Absatzmengen kommt, wäre dies jedoch nur positiv aus Gamer-Sicht – denn dann könnten die Preise für normal getakteten HBM2-Speicher entsprechend sinken und somit die entsprechenden Grafikkarten günstiger machen.

HBM1 HBM2 HBM2E HBM2.5
Status offiziell offiziell Samsung-eigen offiziell
HBM-Stacks üblicherweise 4 üblicherweise 2/4 ? üblicherweise 2/4
GPU-Interface pro Stack 1024 Bit pro Stack 1024 Bit pro Stack 1024 Bit pro Stack 1024 Bit
üblicher Speichertakt bis zu 500 MHz DDR bis zu 1000 MHz DDR bis zu 1600 MHz DDR bis zu 1200 MHz DDR
maximale Speicherbandbreite (4 Stacks) 512 GB/sec
(512 MHz DDR @ 4096 Bit)
1024 GB/sec
(1000 MHz DDR @ 4096 Bit)
1638 GB/sec
(1600 MHz DDR @ 4096 Bit)
1228 GB/sec
(1200 MHz DDR @ 4096 Bit)
realisierbare Speichermengen pro Stack 1 GB pro Stack 1/2/4/8 GB pro Stack 1/2/4/8/16 GB pro Stack 1/2/4/8/12/16/24 GB
maximale Speichermenge (4 Stacks) 4 GB 32 GB 64 GB 96 GB
maximale 2-Stack-Konfiguration 2 GB @ 256 GB/sec 16 GB @ 512 GB/sec 32 GB @ 819 GB/sec 48 GB @ 614 GB/sec
maximale 4-Stack-Konfiguration 4 GB @ 512 GB/sec 32 GB @ 1024 GB/sec 64 GB @ 1638 GB/sec 96 GB @ 1228 GB/sec
Verfügbarkeit voll verfügbar voll verfügbar unbekannt unbekannt