RayTracing

30

Microsoft bringt das DirectX Feature-Level 12_2 mit verpflichtendem Support von RayTracing und Shader Model 6.5

Nach dem erst im März vorgestellten "DirectX 12 Ultimate" bringt Microsoft nunmehr mit dem "Feature-Level 12_2" von DirectX (im eigentlichen dem für 3D-Grafik gedachten Teil "Direct3D") eine weitere Ausbaustufe der DirectX 12 Grafik-API. Dabei beinhaltet DirectX 12_2 (inoffizielle Abkürzung) alle Änderungen von DirectX 12 Ultimate – welche ja sowieso "nur" die vier neuen Hauptfeatures "DirectX RayTracing", "Mesh Shaders", "Variable Rate Shading" (VRS) und "Sampler Feedback" umfasst, sprich vergleichsweise plakative Veränderungen. DirectX 12_2 ist hingegen dann wiederum ein echtes DirectX-Update, sprich zuzüglich zu den Verbesserungen von DirectX 12 Ultimate gibt auch noch noch einen ganzen Strauß an weiteren Detail-Verbesserungen. Am Hardware-Support ändert sich hingegen nichts: Wie auch bei DirectX 12 Ultimate, wird DirectX 12_2 von den Grafik-Architekturen AMD RDNA2, Intel Xe-HPC, nVidia Turing (nur GeForce-20-Modelle) und nVidia Ampere unterstützt.

Feature-Level 12_0 Feature-Level 12_1 Feature-Level 12_2
AMD GCN2, GCN3, GCN4 GCN5, RDNA1 RDNA2
Intel - - Xe-HPG
nVidia - Maxwell 2, Pascal, Turing (GF16) Turing (GF20), Ampere
12

Intel "Xe-HPG" als extra Gaming-Ausführung des Xe-Projekts

Laut Videocardz werden die zu erwartenden Gaming-Grafikkarten des Intel Xe-Projekts nunmehr unter einer eigenen Sub-Architektur namens "Xe-HPG" geführt – in Abgrenzung der bisher bekannten "Xe-LP", "Xe-HP" und "Xe-HPC". Videocardz ordnen das ganze unter "Intel hat bestätigt" ein, leider hat sich dafür aber bislang noch keine andere Quelle finden lassen und Videocardz haben nicht ausgeführt, woher das ganze kommt. In jedem Fall läßt sich somit besser erklären, wie Intel Gaming-Grafikkarten auf Basis der Xe-Architektur erstellen will, denn Xe-LP ist hierfür zu klein angesetzt und Xe-HP/HPC sind mit ihrer Stuktur aus mehreren Tiles (Chiplets) eher ungeeignet für Desktop-Grafikkarten, wo die Ausnutzung der Rechenkraft von mehreren Grafikchips zur Zeit Software-seitig nicht gewährleistet ist.

Codename Segment Fertigung Technik RT Release
Xe-LP - iGPUs & LowCost-Grafik Intel 10nm 96 EU Q3/2020
Xe-HPG - Gaming-Grafikkarten angebl. externer Fertiger unklare Hardware @ GDDR6 2021
Xe-HP Arctic Sound Datacenter-Beschleuniger Intel 10nm 1/2/4 Tiles á 512 EU @ HBM2 2021
Xe-HPC Ponte Vecchio Supercomputer-Beschleuniger Intel 7nm/10nm bis zu 16 Tiles @ HBM2 Ende 2021
21

Gerüchteküche: Aktuelle Performance-Projektionen sehen nVidias Ampere GA102 und AMDs "Big Navi" grob gleichauf

In einem YouTube-Video breiten Moore's Law Is Dead die neueste Gerüchtelage zu nVidias Ampere und AMDs "Big Navi" aus. Die dabei präsentierten Informationen werden nur zum kleineren Teil belegt, stammen aber augenscheinlich zum gehörigen Teil aus bereits bekannten Leaks/Gerüchten, teilweise werden jedoch auch neue Informationen eingeflochten. Man kann es somit als aktuellen Stand der Gerüchteküche verstehen, weniger denn als singulären Leak. Bezüglich nVidias Ampere werden die maximal 84 Shader-Cluster des GA102-Chips bestätigt, zudem soll ein Testsample mit 12 GB Speicher auf 18 Gbps ausgestattet sein und auf realen Boosttaktraten von ~2.0 GHz laufen, wofür aber auch über 300 Watt Stromverbrauch zu Buche stehen. Ohne TDP-Limit geht es dann auf real anliegende ~2.2 GHz hinauf und werden Stromverbrauch-Werte sogar oberhalb von 400 Watt erreicht.

nVidia "Ampere" GA102
voller Chip trägt 5376 Shader-Einheiten
12 GB Speicher auf 18 Gbps (auf diesem Testsample)
Testsample boostet real auf ~2.0 GHz, wobei mehr als 300 Watt Stromverbrauch erreicht werden
realer Boosttakt geht ohne TDP-Limit auf ~2.2 GHz hinauf, dabei werden 400 Watt Stromverbrauch überschritten
40% mehr Rasterization-Performance unter 4K
"solider" IPC-Gewinn gegenüber Turing
RayTracing-Performance soll keinen großen Performance-Verlust mehr produzieren
DLSS 3.0 als weitere Qualitäts-Verbesserung gegenüber DLSS 2.0 (möglicherweise per default aktiviert)
NVCache (nVidias Antwort auf AMDs HBCC)
Tensor Memory Compression (20-40% VRAM-Ersparnis mittels VRAM-Kompression durch Tensor-Kerne)
Launch: September

Quelle:  Moore's Law Is Dead @ YouTube am 19. Juli 2020

22

Gerüchteküche: Gaming-Ampere wieder nur mit ca. +35% Mehrperformance, dafür aber RTX für alle

Von den Twitterern KittyKitties und Kopite7kimi kommt der nächste Schwung an Gerüchten zu nVidias Gaming-Ampere – mit natürlich unsicherer, da nicht genauer ausgeführter Quellenlage. So beschreibt KittyKitties den erwarteten Enthusiasten-Chip "GA102" als denn schwerlich +40% schneller als eine GeForce GTX 2080 Ti – und in jedem Fall soll es unterhalb dieses Performancesprungs liegen, wenn man auf Chip-Basis gegenüber einem vollen TU102-Chip vergleicht (die GeForce RTX 2080 Ti stellt schließlich auch nicht den Vollausbau des TU102-Chips dar). Kopite7kimi schlägt in die gleiche Kerbe und nennt eine "GeForce RTX 3090" (augenscheinlich eine neue Namenswahl anstatt der bisherigen Ti-Modelle) als wahrscheinlich mit "nur" 4992 Shader-Einheiten ausgerüstet. Dies wären gerade einmal +15% mehr Shader-Einheiten als bei der GeForce RXT 2080 Ti, was demzufolge dann noch mittels Mehrtakt samt Architektur-Verbesserungen aufzuhübschen wäre – damit aber voraussichtlich doch unterhalb den vorgenannten (maximal) +40% Performance-Gewinn bleibt bzw. diese Marke in jedem Fall nicht gerade gravierend schlägt.

1. Surprisingly, the next gen chip will be based on Samsung 10nm node
2. Not very solid about what GA102 really got, may struggle to be 40% above 2080Ti, but bound to be under that number if compared against full bore TU102
3. SLi will be available to GA102 ONLY
4. RTX for everyone

Quelle:  KittyKitties @ Twitter am 11. März 2020

20

Microsoft stellt "DirectX 12 Ultimate" mit vier verpflichtenden "neuen" Grafik-Features vor

Microsoft hat mit "DirectX 12 Ultimate" eine neue, offizielle Ausbaustufe der DirectX 12 Grafik-API mittels eines Blog-Eintrags vorgestellt, welche ab dem kommenden Windows-Update 20H1 verfügbar wird. Für jene neue Ausbaustufe wählte man keine numerische Bezeichnung wie bisher mit den Feature-Levels – was immer leicht mißverständlich war und mittels der verschiedenen Tier-Levels auch ziemlich schwammig daherkommt. Inoffiziell kann man DirectX 12 Ultimate natürlich auch als "DirectX 12 Feature-Level 12_2" bezeichnen, treffender wäre aber eher die Abkürzung "DX12U". Unter dieser hat Microsoft dann schlicht vier bereits existierende optionale DirectX-12-Feature nunmehr verpflichtend gemacht: "DirectX RayTracing" (DXR) in der neuen Version 1.1, "Variable Rate Shading" (VSR), "Mesh Shaders" & "Sampler Feedback". Sinn und Zweck der Maßnahme ist natürlich die Abgrenzung neuerer Hardware gegenüber älterer Hardware – weswegen sich AMD & nVidia auch gleich bemühten zu betonen, welche ihrer Hardware nunmehr bereits DX12U unterstützt: Bei AMD wird dies die kommende RDNA2-basierte Generation um die Navi-2X-Grafikchips sein, während nVidia in dieser Angelegenheit vorn liegt, da bereits deren aktuelle RTX-Grafikkarten der GeForce-20-Serie für DX12U (und damit das entsprechende Logo) ausgelegt sind.

DirectX 12 FL 12_0 DirectX 12 FL 12_1 DirectX 12 Ultimate
AMD GCN2/GCN3, Polaris Vega, RDNA1 RDNA2
Intel - Skylake, Kaby Lake, Coffee Lake, Comet Lake ?
nVidia - Maxwell 2, Pascal, Turing (GF16) Turing (GF20), Ampere
19

Sony gibt die Hardware-Spezifikationen der Playstation 5 bekannt

Nach Microsoft hat nun auch Sony die mehr oder weniger vollständigen Hardware-Spezifikationen seiner NextGen-Konsole "Playstation 5" im Rahmen eines Videostream-Events bekanntgegeben. Eigentlich sollte diese Vorstellung auf der (nunmehr abgesagten) GDC erfolgen – war insofern wohl lange vorher geplant und ist demzufolge keine Reaktion auf die kürzliche Microsoft-Offenlegung der Xbox Series X. Gegenüber dieser hat es die Playstation 5 derzeit in den Augen der Öffentlichkeit schwer, da man mit der Playstation 5 unterhalb der Hardware-Daten der Microsoft-Konsole herauskommt: Bei der CPU ergibt sich noch ein grober Gleichstand, aber die GPU ist mit nur 36 Shader-Clustern und bis zu 10,3 TFlops Rechenleistung an einem 256 Bit GDDR6-Interface doch augenscheinlich kleiner ausgelegt als beim Microsoft-Pendant mit 52 Shader-Clustern auf 12,1 TFlops Rechenleistung an einem 320 Bit GDDR6-Interface.

Sony Playstation 5 Microsoft Xbox Series X
Prozessor 8C/16T Zen 2 @ ≤3.5 GHz 8C/16T Zen 2 @ 3.6 GHz (ohne SMT @ 3.8 GHz)
Grafiklösung 36 CU RDNA2 @ ≤2.23 GHz (≤10,3 TFlops) 52 CU RDNA2 @ 1.825 GHz (12,1 TFlops)
Speicherinterface 256 Bit GDDR6 @ 3500 MHz QDR (448 GB/sec) 320 Bit GDDR6 @ 3500 MHz QDR (Ø 476 GB/sec)
Speicher 16 GB GDDR6 16 GB GDDR6 (13,5 GB für Spiele)
Festplatte 825 GB NVMe-SSD @ 5,5 GB/sec (8-9 GB/sec mit Kompression) 1 TB NVMe-SSD @ 2,4 GB/sec (4,8 GB/sec mit Kompression)
Preislage ??? ???
Release "Holiday Season" 2020 "Holiday Season" 2020
16

Microsoft gibt die vollständigen Spezifikationen der Xbox Series X bekannt

Nach der bereits weitgehenden Microsoft-Offenlegung Ende Februar zur Technik der kommenden Spielekonsole "Xbox Series X" haben Microsoft im eigenen Xbox-Blog sowie Eurogamer mittels eines unter Mithilfe von Microsoft entstandenden Artikels die Konsolen-Spezifikationen nun nochmals genauer ausgeführt – und dabei insbesondere die bestehenden Wissenlücken bei CPU, Speicherinterface und Speichermenge geschlossen. Somit präsentiert sich der SoC der Xbox Series X nunmehr als ein 360mm² großer Chip mit 15,3 Mrd. Transistoren unter der N7P-Fertigung von TSMC – hierbei kommt also noch keine EUV-Belichtung zum Einsatz, sondern "nur" das zweitbeste der drei 7nm-Verfahren von TSMC. In diese nahe der Xbox One X kommende Chipfläche quetschen AMD und Microsoft dann 8 CPU-Kerne auf Basis von Zen 2 samt SMT auf Taktraten von 3.8 GHz sowie eine RDNA2-basierte Grafiklösung mit 52 Shader-Clustern (aka 3328 Shader-Einheiten) auf 1825 MHz GPU-Takt – was dann 12,1 TFlops FP32-Rechenleistung ergibt und damit früheren Microsoft-Vorgaben entspricht.

6

Neue Grafik-Roadmaps von AMD reichen bis zu RDNA3, Navi 3X & CDNA2 im Jahr 2022

Auf seinem "Financial Analyst Day" (FAD'20) hat AMD neue Grafik-Roadmaps ausgepackt, welche seit längerem mal wieder neue Eintragungen die zukünftige Entwicklung betreffen. Die wichtigste Neuerung liegt allerdings darin, das AMD sich zu einer echten Auftrennung von Gaming-Grafik und Compute-Grafik entschlossen hat – letztere bekommt nunmehr mittels der "Compute RDNA" (CDNA) eine eigene Architektur-Klasse und damit eine eigene Roadmap. Dies ermöglicht nicht nur im symbolischen, sondern auch ganz praktischen Sinn eine vollständig getrennte Weiterentwicklung der jeweiligen Chips – mit natürlich auch der Folge, das die Produkte nicht mehr im jeweils anderen Produktsegment zweitverwendet werden können. Ein erster klarer Schritt in diese Richtung hin dürfte der kommende "Arcturus"-Chip sein, welcher zwar auf dem FAD'20 nicht konkret genannt wurde, dennoch aber augenscheinlich der CDNA1-Generation zuzuordnen ist (während die Vega-20-basierten Compute-Beschleuniger noch zur GCN-Generation gehören).

24

Microsoft setzt die Xbox Series X offiziell mit 12 TFlops Grafik-Rechenleistung an

In einem Beitrag auf der Microsoft-eigenen Xbox-Seite hat Xbox-Chef Phil Spencer nochmals genaueres zur Hardware der kommenden Xbox Series X bekanntgegeben – darunter auch eine Bestätigung von 12 TFlops Grafikchip-Rechenleistung. Dies entspricht exakt einem Leak zum letzten Jahresende – wobei dann interessant wird zu sehen, ob jener Leak auch in den anderen Punkten (Speicherbandbreite der Xbox Series X sowie Hardware-Spezifikationen zur Playstation 5) recht behalten wird. Offen bleibt damit primär noch die Frage nach der Speicherbestückung der Xbox Series X – doch wenn die vom vorgenannten Leak verbreiteten 560 GB/sec Speicherbandbreite stimmen, dann ergibt dies fast nur mit einem 384 Bit GDDR6-Interface Sinn, was dann automatisch zu 24 GB GDDR6-Speicher für diese NextGen-Konsole führt. Und dies wäre dann schon ein netter Zugewinn gegenüber der ursprünglichen Xbox One mit 1,3 TFlops Grafik-Rechenleistung (XBSX hat das 9fache), 68 GB/sec Speicherbandbreite (das 8fache, ohne Betrachtung des eDRAM der Xbox One) sowie 8 GB Speicher (das 3fache).

    Microsoft Xbox Series X  (offizielle Spezifikationen)

  • Codename "Scarlett"
  • CPU auf Basis von Zen 2  (höchstwahrscheinlich 8C+SMT)
  • GPU auf Basis von RDNA2
  • 12 TFlops Grafikchip-Rechenleistung
  • Hardware-beschleunigtes RayTracing
  • Variable Rate Shading (VRS)
  • unterstützt Frameraten bis zu 120 fps
  • GDDR6-Speicher
  • HighEnd-SSD als Massenspeicher sowie virtueller Arbeitsspeicher
  • unterstützt Monitor-Auflösungen bis zu 8K
  • Auto Low Latency Mode (ALLM)
  • Variable Refresh Rate (VRR)
  • HDMI 2.1
  • angekündigt für die "Holiday Season 2020", sprich Zeitrahmen November/Dezember 2020
  • Quellen:  Microsoft-Ankündigung auf der E3 2019 sowie Microsoft-Verlautbarung im Februar 2020
6

nVidias Stadia-Konkurrent "GeForce Now" geht aus dem Beta-Status in den Regelbetrieb

Grafikchip-Entwickler nVidia hat zum 4. Februar seinen seit dem Jahr 2015 im Beta-Status betriebenen Spielestreaming-Service "GeForce Now" nun endlich in den Regelbetrieb überführt – und bringt damit einen Konkurrenten zu Googles Stadia ins Blickfeld, welcher die Internet-Großmacht Google durchaus vor Probleme stellt. Dies fängt schon allein mit der Anzahl der unterstützten Titel an, welche bei Stadia derzeit bei ca. 25 liegt (weitere unterstützte Spiele sind angekündigt, aber noch nicht veröffentlicht) – und bei GeForce Now bei satten 400. Hinzu kommen noch ca. 1000 weitere Titel, welche bei GeForce Now in einem sogenannten "SingleSession"-Modus nutzbar sind: Dafür wird das Spiel temporär von Steam zu GeForce Now kopiert, dort installiert und dann ausgeführt. Das funktioniert für die jeweilige Spiel-Season, muß allerdings bei jeder weiteren Nutzung wiederholt werden – ist aber sicherlich immer noch besser als gar kein Support. Jener Punkt weist dann auch gleich auf den zweiten entscheidenden Unterschied zwischen Stadia und GeForce Now hin: Der nVidia-Dienst kann natürlich auf die Spiele anderer Spieleshops zugreifen – man ist also nicht wie bei Stadia gezwungen, ausschließlich dort zu kaufen.

Google Stadia nVidia GeForce Now
(derzeit) unterstützte Spiele ca. 25 ca. 400
(weitere ca. 1000 im "SingleSession"-Modus)
eigener Spieleshop ja nein
kostenlose Spiele einzelne Titel ca. 30 Free2Play-Titel
weitere Spiele müssen zugekauft werden ja ja
unterstützt Spiele anderer Spieleshops nein ja: Blizzard, Epic, Origin, Steam & Uplay
Inhalt abgleichen