2

Hardware- und Nachrichten-Links des 2. Juli 2020

Videocardz zeigen das vermutlich erste Bild einer GeForce RTX 3080 Ti seitens Asus, welches von einem internen Asus-Meeting stammt. Allerdings handelt es sich beim gezeigten Platinen-Layout noch nicht um das finale Design, sondern um einen Design-Vorschlag – jener könnte in dieser oder abgewandelter Form erscheinen, Asus könnte sich aber auch noch für einen gänzlich anderen Design-Vorschlag entscheiden. Betextet ist das Bild im übrigen in chinesisch mit "next-generation ROG STRIX", links unten auf der Grafikkarten-Abdeckung wurde allerdings auch noch der Schriftzug "3080 TI" angebracht. Dies ergäbe dann den Hinweis, das es eher nicht zu einer "GeForce RTX 3090" kommt, sondern doch wieder zu einer neuen Ti-Karte. Aber auch in diesem Punkt muß die finale Entscheidung noch nicht getroffen worden sein, insbesondere Änderungen an Namen und Preisen sind noch vergleichsweise kurzfristig möglich (während kurzfristige Taktraten-Änderungen wegen der dann notwendigen Validierungen wohlüberlegt sein wollen, Stichwort "Radeon RX 5600 XT").

Die neue Wasserstandsmeldung von Twitterer Kopite7kimi beschreibt nahezu schon bekanntes, gegenüber der letzten Daten-Aufstellung kommt allein noch die Grafikkartenspeicher-Menge von 12 GB bei der mittleren GA102-Lösung "GA102-300" hinzu. Dies hatte Twitterer 'CatCorgi' bereits derart berichtet, nur bei Igor's Lab ging man in einer früheren Meldung von 11 GB Grafikkartenspeicher aus. Der auf 21 Gbps laufende GDDR6X-Speicher wird dann allerdings auch von Kopite7kimi gemeldet – versehen mit dem Hinweis, dass jene Speichertaktung derzeit wohl schwierig in der Praxis zu realisieren sein soll. Damit mehren sich letztlich die Hinweise, dass es tatsächlich zu der etwas seltsamen Konstruktion kommt, wonach die mittlere GA102-Karte den (klar) höchsten Speichertakt erhält. Möglicherweise hängt dies schlicht daran, dass die 24 GB Grafikkartenspeicher auf der (vermeintlichen) Ampere-Titan aus technischen Gründen einfach nicht so hoch takten können.

Grafikkarte Hardware Performance
Ampere-Titan 84 Shader-Cluster, 384 Bit Interface, 24 GB GDDR6X auf 17 Gbps geschätzt +20-25%
GeForce RTX 3080 Ti (oder "GeForce RTX 3090") 82 Shader-Cluster, 384 Bit Interface, 12 GB GDDR6X auf 21 Gbps geschätzt +20-25%
GeForce RTX 3080 68 Shader-Cluster, 320 Bit Interface, 10 GB GDDR6X auf 19 Gbps Base: 100%
Alle Angaben zu Ampere-Grafikkarten basierend auf Gerüchten & Annahmen!

Eine besondere Chance, dass jene Ampere-Titan dann wirklich schneller herauskommt, ergibt sich damit allerdings nicht – deren einziger beachtbarer Vorteil läge im verdoppelten Speicher. Sogar ein kleiner Performance-Rückschritt gegenüber der mittleren GA102-Lösung wäre angesichts dieser Vorgaben denkbar: Immerhin würde die mittlere GA102-Lösung dann mit +24% mehr Speicherbandbreite antreten, während die Ampere-Titan dagegen nur +2% mehr Shader-Cluster ins Feld führen kann. Dies mittels höherem Chiptakt etc. auszugleichen, erscheint eigentlich nicht möglich. Vorstehende Performance-Schätzung ist im übrigen als eher grob anzusehen: Nominell stehen zwischen mittlerer und kleinerer GA102-Lösung nur +21% mehr Shader-Cluster sowie +33% mehr Speicherbandbreite, je nach Chiptakt kann die Differenz bei der Rechenleistung dann noch etwas abweichen. In der Vorgänger-Generation erzielte nVidia zwischen GeForce RTX 2080 & 2080 Ti bei +34% mehr Rechenpower samt +38% mehr Speicherbandbreite im übrigen eine Performance-Differenz von +27% (allerdings auf Basis unterschiedlicher Grafikchips).

Speicherchip-Hersteller SK Hynix vermeldet den Start der Massenfertigung von HBM2E mit einer Datenübertragungsrate von bis zu 3,6 Gbps per Pin bzw. einer Bandbreite von 460 GB/sec auf 1024 I/Os. Interessanterweise hat es kaum jemand geschafft, basierend auf der Pressemitteilung diese Angabe in eine (besser bekömmliche) Taktrate umzurechen – es sind immerhin (bis zu) 1800 MHz, welche dieser HBM2E-Speicher erreicht. Gegenüber den Anfängen von HBM-Speicher, als es mit 500 MHz bei der Radeon R9 Fury X losging, ist dies schon eine klare Fortentwicklung. Rein vom Speichertakt her hat sich HBM-Speicher damit in der Zwischenzeit klar schneller entwickelt als GDDR-Speicher (seinerzeit auch schon bei üblicherweise 3500 MHz) – wobei HBM den Vorteil ausspielt, schon auf niedrigen Taktraten hohe Bandbreiten liefern zu können und somit eben bei den Taktraten noch viel Spielraum zu haben. Nachdem GDDR6-Speicher in der Zwischenzeit HBM2 bei den erzielbaren Bandbreiten mal recht nahe gekommen ist, verschiebt HBM2E das ganze wieder in Richtung eines klaren HBM-Vorteils. Abzuwarten bleibt allerdings, ob HBM2E jemals mit diesen hohen Taktraten eingesetzt wird – auch zu HBM2 existierten jederzeit höhere Taktraten, diese kamen jedoch in der Praxis nur arg selten vor.

Taktrate Bandbreite
HBM1 500 MHz DDR (1 Gbps) 256 GB/sec an einem 2048-Bit-Interface
GDDR5 4500 MHz DDR (9 Gbps) 288 GB/sec an einem 256-Bit-Interface
GDDR5X 2850 MHz QDR (11,4 Gbps) 365 GB/sec an einem 256-Bit-Interface
HBM2 1250 MHz DDR (2,5 Gbps) 640 GB/sec an einem 2048-Bit-Interface
GDDR6 4000 MHz QDR (16 Gbps) 512 GB/sec an einem 256-Bit-Interface
GDDR6X 5250 MHz QDR (21 Gbps) 672 GB/sec an einem 256-Bit-Interface
HBM2E (bis zu) 1800 MHz DDR (3,6 Gbps) (bis zu) 920 GB/sec an einem 2048-Bit-Interface

Notebookcheck berichten über ein neues Gerücht, wonach die (kleinere) Xbox Series S nur über 20 Shader-Cluster (1280 Shader-Einheiten) verfügen soll. Dies war anhand der zuletzt bestätigten Rohleistung von ~4 TFlops schon zu vermuten, auf guten Taktraten würden theoretisch sogar 18 Shader-Cluster ausreichend sein. Jene technische Angabe bringt aber natürlich neue Diskussionen hervor, wieviel man mit einer solch abgespeckten NextGen-Xbox erreichen kann, wenn jene sogar über weniger Shader-Cluster verfügt als eine Radeon RX 5500 XT (22 Shader-Cluster). Bei einem Rohleistungs-Unterschied von dem Dreifachen zwischen Xbox Series S und Xbox Series X sind dann wohl noch mehr Bildqualitäts-Konzessionen als nur eine niedrigere Ziel-Auflösung (FullHD anstatt 4K) vonnöten: Wahrscheinlich wird die kleinere Xbox Series S somit zu Mitteln wie einer nochmals niedrigeren internen Render-Auflösung, einer niedrigeren Texturenauflösung und möglicherweise auch noch weiter reduzierter Detaildichte greifen.

Die Zielsetzung von Microsoft bei der Xbox Series S liegt schließlich kaum darin, mit einer perfekten FullHD-Konsole der eigenen (teureren) Xbox Series X das Wasser abzugraben – insofern sind beachtbare Bildqualitätsunterschied wahrscheinlich sogar gewollt. Microsoft dürfte mit diesen beiden NextGen-Konsolen eher denn einen Zangenangriff auf die Playstation 5 in Planung haben: Die größere Xbox Series X für jenes Publikum, welches sich für die bestmögliche Technik interessiert, die kleinere Xbox Series S für jenes Publikum, wo die Preislage eher eine Rolle spielt (und 4K sowieso kein Thema ist). Eventuell wird dies auch deswegen notwendig, weil die größere Xbox Series X zu einem höheren Preis als die Playstation 5 erscheint. In jedem Fall will Microsoft beide Argumentationslinie (Technik & Preis) jeweils mit einem zielgerichten Produkt bedienen und die Playstation 5 sich dazwischen zerreiben lassen. Die Grundvoraussetzung dafür ist natürlich, dass die Spieleentwickler wegen der Xbox Series S keine Abstriche bei der Spielentwicklung machen müssen – ansonsten hätte Microsoft mit der Xbox Series X zwar die bessere Technik, diese würde dann aber zugunsten der Kompatibilität mit der Xbox Series S nicht (vollens) ausgenutzt.