nVidia-Grafik

22

nVidia stellt den "GH100"-Chip der Hopper-Generation mit 18'432 FP32-Einheiten in 144 Shader-Clustern vor

Chipentwickler nVidia hat mit seiner GTC-Keynote die nächste Grafikchip-Generation rund um die 5nm-Fertigung eingeläutet – durch die Vorstellung des "GH100" GPGPU/HPC-Chips auf Basis der "Hopper"-Architektur. Hierbei handelt es sich um den nächsten reinen HPC-Chip von nVidia, sprich in Fortführung des mit der "Pascal"-Architektur begonnenen Wegs reiner HPC-Chips an der Angebots-Spitze: Zuerst GP100 von "Pascal", dann GV100 von "Volta" und GA100 von "Ampere" (trotz gleichen Architektur-Namens deutlich abweichend von den Gaming-Chips dieser Architektur) – und nun eben GH100 von "Hopper". Dabei ist spätetens ab dem GA100-Chip die Zweitverwendung im Gaming-Segment effektiv verbaut, denn GA100 und nun auch GH100 verfügen über keine RayTracing-Einheiten in Hardware – womit entsprechende Gaming-Auskopplungen auf dieser Chip-Basis heutzutage nicht mehr verkaufbar wären.

    nVidia "GH100"

  • 80 Mrd. Transistoren auf 814mm² in der 4nm-Fertigung von TSMC ("4N", eine auf nVidia optimierte Ausführung von N4)
  • nVidia Hopper-Architektur (mit augenscheinlich alleiniger Ausrichtung auf den HPC-Einsatz)
  • 8 Raster-Engines (Graphics Processing Cluster, GPC) mit jeweils 18 Shader-Clustern (Streaming Multiprocessor, SM), insgesamt also 144 Shader-Cluster
  • jeder Shader-Cluster enthält 128 FP32-Einheiten samt 4 Texturen-Einheiten (Texture Mapping Unit, TMU) und 4 Tensor-Cores
  • die FP32-Einheiten pro Shader-Cluster sind wie bei Gaming-Ampere verdoppelt, wodurch sich samt mehr Einheiten sowie Mehrtakt eine bis zu dreifache Rohleistung ergibt
  • die Tensor-Cores basieren auf der 4. Tensor-Generation, welche erneut neue Datenformate beherrscht sowie zumeist viel leistungsstärker ist
  • ergibt insgesamt 18'432 FP32-Einheiten, 576 Texturen-Einheiten und 576 Tensor-Cores in der (real nie genutzten) Maximal-Konfiguration
  • es gibt wie beim GA100-Chip keine expliziten RayTracing-Einheiten, womit der GH100-Chip nicht zum Gaming-Einsatz taugt
  • 60 MB Level2-Cache
  • 6144 Bit HBM-Speicherinterface für HBM2e oder HBM3 mit bis zu 3 TB/sec Bandbreite
  • PCI Express 5.0 (mit 128 GB/sec) und 4. NVLink-Generation (mit bis zu 900 GB/sec)
  • erste konkrete Produkte: "H100 SXM5" mit 132 Shader-Clustern auf 700W TDP bzw. "H100 PCIe" mit 114 Shader-Clustern auf 350W TDP
  • Verfügbarkeit: ab dem dritten Quartal 2022
21

Umfrage-Auswertung: Welche Monitorauflösung steht für den Spielerechner zur Verfügung (2021)?

Bedauerlicherweise liegengeblieben ist letztes Jahr noch eine Umfrage-Auswertung zur Frage der aktuellen Monitorauflösung für den Spielerechner – was hiermit nachträglich erledigt werden soll. Die Umfrage von November 2021 kann dabei auf eine Reihe an gleichlautenden Umfragen von 2008 bis 2019 zurückblicken, aus deren Werten sich somit auch eine gewisse "historische" Entwicklung ableiten läßt. Die Umfrage von letztem Winter sah dabei erstmals die WQHD-Auflösung kurz vor der absoluten Mehrheit über alle Umfrage-Teilnehmer hinweg stehen, während FullHD und UltraHD/4K sich fast paritätisch den Rest teilen und kleinere Auflösungen inzwischen weitgehend verschwunden sind. Logischerweise zeigt sich hier der langjährige Trend zu immer höheren Auflösungen – gleichzeitig aber auch, dass im Rahmen des 3DCenters die Monitor-Auflösungen jederzeit weit über dem allgemeinen Standard liegen, denn in Steam sind nach wie vor über 80% auf FullHD oder kleiner unterwegs.

17

Neuer Artikel: Chip-Spezifikation zu AMD RDNA3 und nVidia Ada im Vergleich

Die Diskussion über die kommenden 5nm-Grafikchips läuft schon seit letztem Sommer, seinerzeit waren immerhin schon die Spezifikationen der jeweiligen Top-Chips von AMDs RDNA3-Generation und nVidias Ada-Generation (vormals "Lovelace"-Generation) bekannt. In der Zwischenzeit hat sich das Bild hierzu weiter verdichtet und ist nun erstmals mit dem Vorliegen der Chip-Spezifikationen der weiteren Ada-Grafikchips ein vollständiger Vergleich zwischen diesen beiden 5nm-Generationen möglich. Zwar liegt es derzeit noch im Feld der Spekulationen, welche konkreten Grafikkarten AMD & nVidia aus der vorhandenen Hardware ableiten, doch die grundsätzliche Hardware auf Chip-Ebene dürfte feststehen bzw. über das Design-Ende hinaus sein. Damit ist eine grobe Beurteilung dessen, was zu erwarten ist, durchaus schon möglich und soll nachfolgend auf Basis der derzeit vorliegenden Informationen angetreten werden ... zum Artikel.

2

Gerüchteküche: Korrigierte Hardware-Daten zu nVidias Ada-Lovelace-Generation, inkl. GPC, TPC und L2-Größen

Innerhalb von weniger als einem Tag haben sich neue, korrigierte und sogar deutlich umfangreicher Hardware-Spezifikationen zu den Grafikchips von nVidias Ada-Lovelace-Generation eingefunden. Augenscheinlich basierten die gestern offerierten Daten auf einem früheren Design-Entwurf nVidias, wohingegen die neuen Hardware-Daten Teil des Leaks von nVidia-Dokumenten im Zuge des nVidia-Hacks sind. Im Zuge dessen sprudelten die Informationen nur so: Zuerst hatte La Frite David @ Twitter eine Gegenüberstellung der Shader-Cluster von Turing, Ampere & Ada gepostet, No one @ Twitter ergänzte dies um Angaben zum Speicherinterface sowie Kopite7kimi @ Twitter um Angaben zu GPCs und TPCs der Ada-Chips. Und während Harukaze5719 @ Twitter ein User-erstelltes Block-Diagramm zum AD102-Chip basierend auf diesen Hardware-Daten zeigte, kam von Xino Assassin @ Twitter der Hinweis auf deutlich größere Level2-Caches bei der Ada-Generation und letztlich von HXL @ Twitter eine Aufstellung zu den Cache-Größen der einzelnen Ada-Chips.

Hardware FP32 Interface L2-Cache Speicher Vorgänger
AD102 12 GPC, 72 TPC, 144 SM 18'432 384 Bit 96 MB 24 GB GA102: 7 GPC, 84 SM @ 384 Bit, 6 MB L2
AD103 7 GPC, 42 TPC, 84 SM 10'752 256 Bit 64 MB 16 GB GA103: 6 GPC, 60 SM @ 320 Bit, 4 MB L2
AD104 5 GPC, 30 TPC, 60 SM 7680 192 Bit 48 MB 12 GB GA104: 6 GPC, 48 SM @ 256 Bit, 4 MB L2
AD106 3 GPC, 18 TPC, 36 SM 4608 128 Bit 32 MB 8 GB GA106: 3 GPC, 30 SM @ 192 Bit, 3 MB L2
AD107 3 GPC, 12 TPC, 24 SM 3072 128 Bit 32 MB 8 GB GA107: 2 GPC, 20 SM @ 128 Bit, 2 MB L2
Anmerkung: Angaben zu noch nicht vorgestellter Hardware basieren auf Gerüchten & Annahmen
1

Gerüchteküche: Mögliche Hardware-Daten zu nVidias Ada-Lovelace-Grafikchips aufgetaucht

Twitterer Kopite7kimi hat im Zuge der mit dem nVidia-Hack öffentlich gewordenen nVidia-internen Dokumente eine hochinteressante Aussage zur grundsätzlichen Hardware-Ansetzung der Grafikchips von nVidias "Ada"-Architektur (bisher bekannt als "Lovelace"-Architektur) getätigt: Danach sollen die Ada-Chips (augenscheinlich von oben nach unten gezählt) über 144, 96, 48 und 32 Shader-Cluster verfügen. Da zum "Ada"-Topchip AD102 dessen 144 Shader-Cluster bereits seit langem bekannt sind, treffen die nachfolgenden Angaben somit augenscheinlich auf die weiteren "Ada"-Chips AD103, AD104 und AD106 zu. Fehlend sind somit noch Angaben zu den "Ada"-Chips AD107 und AD10B, wobei letzterer sowieso nur in Tegra-Gefilde gehen soll.

The early configs are 144, 96, 48, 32SMs.
Quelle:  Kopite7kimi @ Twitter am 1. März 2022

Hardware Interface Speicher Grafikkarten Vorgänger
AD102 12 GPC, 144 SM  (18'432 FP32) 384 Bit 24 GB womögl. GeForce RTX 4080 & 4090 GA102: 84 SM @ 384 Bit
AD103 96 SM  (12'288 FP32) womögl. 320 Bit womögl. 20 GB womögl. GeForce RTX 4060 Ti & 4070 GA103: 60 SM @ 320 Bit
AD104 48 SM  (6144 FP32) womögl. 256 Bit womögl. 16 GB womögl. GeForce RTX 4060 GA104: 48 SM @ 256 Bit
AD106 32 SM  (4096 FP32) womögl. 192 Bit womögl. 12 GB womögl. GeForce RTX 4050 GA106: 30 SM @ 192 Bit
Anmerkung: Angaben zu noch nicht vorgestellter Hardware basieren auf Gerüchten & Annahmen
1

nVidia-Dokumente bestätigen 10 Grafikchips der Architekturen Hopper, Ada (Lovelace) & Blackwell

VideoCardz haben mehrere interne nVidia-Dokumente zugespielt bekommen, welche aus dem kürzlichen Hack des Grafikchip-Entwicklers stammen sollen (Hintergründe hierzu bei Heise Security). Mit den ersten nVidia-Dokumenten wurde die Verwendung des Codenamens "Blackwell" für eine kommende nVidia-Architektur bestätigt. Dies hatte Twitterer Kopite7kimi bereits letzten Sommer derart angedeutet – und nunmehr im übrigen die Veröffentlichung dieser VideoCardz-Meldung mit einem klaren Hinweis auf die 3nm-Fertigung von TSMC kommentiert. Unklar ist allerdings nach wie vor, ob man die "Blackwell"-Architektur den Segmenten HPC, Gaming oder hingegen gleich beidem zuordnen kann.

Hopper Ada (Lovelace) Blackwell
Chipfertigung 5nm TSMC 5nm TSMC 3nm TSMC
Grafikchips GH100, GH202 AD102, AD103, AD104, AD106, AD107, AD10B GB100, GB102
Ausrichtung HPC (GH202 eventuell auch für Gaming) Gaming → GeForce RTX 40 Serie (AD10B jedoch für Tegra-SoCs) vermutlich HPC (GB102 eventuell für Gaming)
Release GH100-Ankündigung wohl auf der GTC im März 2022, Auslieferung irgendwann H2/2022; GH202: klar später angeblich ab September 2022, komplettes Portfolio sicherlich erst Anfang 2023 im Markt vermutlich 2024
26

Die Grafikchip- und Grafikkarten-Marktanteile im vierten Quartal 2021

Von den Marktforschern von Jon Peddie Research kommen in zwei Reports die neuesten Zahlen zum Geschehen auf dem Grafikkarten-Markt, betreffend diesesmal das abgelaufene vierte Quartal 2021. Der zuletzt erschienene Report widmet sich dabei den Grafikchips für Desktop-Grafikkarten, sprich dem eigentlichen Grafikkarten-Markt. Hierbei konnte für das vierte Quartal 2021 eine leichte Steigerung der Absatzmenge auf 13,1 Mio. Stück (+3,0% gegenüber dem Vorquartal) vermeldet werden. Der damit erzielte Umsatz fiel allerdings leicht auf 13,5 Mrd. Dollar (-1,5% gegenüber dem Vorquartal), was auf einem gewissen Rückgang der (überzogenen) Durchschnittspreise basiert. AMD konnte mit 22,8% Marktanteil wieder etwas besser abschneiden, allerdings bleibt nVidia natürlich der Marktdominator mit 77,2% Marktanteil bei Desktop-Grafikkarten (bzw. den Grafikchips dafür).

AiB-Grafikchips Q4/2020 Q1/2021 Q2/2021 Q3/2021 Q4/2021
AMD 17% 20% 20% 21% 22,8%
nVidia 83% 80% 80% 79% 77,2%
Auslieferungsmenge 11,0 Mio. Stück 11,8 Mio. Stück 11,47 Mio. Stück 12,72 Mio. Stück 13,1 Mio. Stück
Stückzahlen-Vergleich ~1,9 vs ~9,1 Mio. ~2,4 vs ~9,4 Mio. ~2,3 vs ~9,2 Mio. ~2,7 vs ~10,0 Mio. ~3,0 vs ~10,1 Mio.
Endverbraucher-Umsatz ~10,6 Mrd. $ ~12,4 Mrd. $ 11,8 Mrd. $ 13,7 Mrd. $ 13,5 Mrd. $
Karten-Durchschnittspreis ca. $964 ca. $1051 ca. $1029 ca. $1077 ca. $1031
Marktanteile basierend auf ausgelieferten Stückzahlen, Quelle: Jon Peddie Research
24

Die Grafikkarten-Performance unter Dying Light 2

Von ComputerBase, GameGPU, PC Games Hardware und TechPowerUp kommen umfangreiche Benchmark-Artikel, welche die Grafikkarten-Performance unter "Dying Light 2" betrachten. Das Survial-Spiel von Entwickler & Developer "Techland" basiert auf der Haus-eigenen "C-Engine", welche DirectX 11/12/12U, RayTracing, DLSS und FSR unterstützt. Oftmals als Hardware-Fresser benannt, ist die Performance ohne RayTracing zumindest unter der FullHD-Auflösung jedoch sehr anständig bzw. bei neueren Grafikkarten sogar herausragend. Auffallend ist dabei der extrem ansteigende VRAM-Verbrauch beim Wechsel von DirectX 11 auf 12: Unter der älteren Grafik-API belegt das Spiel 3-6 GB (je nach Auflösung), unter der neueren hingegen schon 7-8 GB (ohne Optik-Differenz). Beim Wechsel auf "DirectX 12 Ultimate" (Voraussetzung für RayTracing) steigt die VRAM-Befüllung sogar nochmals, mit aktivem RayTracing sind dann 8-13 GB belegt.

Dying Light 2 — FullHD/1080p @ "High" Preset (no RT, no DLSS, no FSR)
1080p Pascal Polaris+Vega Turing RDNA1 Ampere RDNA2
≥80 fps 2080Ti → 97 3090 → 149
3080Ti → 146
3080-12G → 139
3080-10G → 132
3070Ti → 106
3070 → 101
3060Ti → 90
6900XT → 142
6800XT → 134
6800 → 115
6700XT → 92
70-79 fps R7 → 71 2080S → 78
2080 → 74
2070S → 70
5700XT → 70 6600XT → 72
60-69 fps 1080Ti → 67 Vega64 → 60 2070 → 62 5700 → 63 3060 → 68 6600 → 63
50-59 fps 1080 → 51 Vega56 → 53 2060S → 59
2060-12G → 56
2060-6G → 52
5600XT-14 → 56
5600XT-12 → 54
40-49 fps 1070Ti → 48
1070 → 43
1660Ti → 44
1660S → 43
5500XT-8G → 40 3050 → 49
30-39 fps 1060-6G → 30 590 → 39
580-8G → 35
480-8G → 34
1660 → 39
1650S → 31
5500XT-4G → 33 6500XT → 31
≦29 fps 1060-3G → 20 570 → 28 1650-D6 → 24
Durchschnitt der Benchmarks von ComputerBase, GameGPU, PC Games Hardware & TechPowerUp, fehlende Werte interpoliert (±1-2 fps)
13

Neuer Artikel: Launch-Analyse nVidia GeForce RTX 3050

Mit der GeForce RTX 3050 bringt nVidia eine zweite Grafikkarte auf Basis des bereits knapp vor Jahresfrist für die GeForce RTX 3060 verwendeten GA106-Chips an den Start, welche primär ein möglichst günstiges Ampere-Angebot ergeben soll. Aufgrund eines zur kürzlich veröffentlichten Radeon RX 6500 XT ($199) ähnlichen Listenpreises von 249 Dollar wird die neue nVidia-Karte gern in den direkten Vergleich zu AMDs neuer Einsteiger-Lösung gestellt – hat aber am Ende einen deutlich anderen Hardware-Ansatz sowie erreicht eine klar andere Performance-Klasse. Wo sich die GeForce RTX 3050 gemäß der hierzu ausgewerteten 20 Testberichte im Vergleich zu 16 alten und neuen AMD- & nVidia-Lösungen einordnen muß, soll nachfolgend mittels dieser Launch-Analyse ausgebreitet werden ... zum Artikel.

Gen. & Speicher FHD-Index 4K-Index Real-Verbr. Listenpreis Straßenpreis
GeForce RTX 3060 Ampere, 12GB 1130% 165% 172W $329 / 329€ 590-700 Euro
Radeon RX 6600 RDNA2, 8GB 1100% ~134% 131W $329 / 339€ 470-520 Euro
GeForce RTX 2060 12GB Turing, 12GB ~990% ~141% ~185W unbekannt 470-570 Euro
GeForce RTX 2060 6GB Turing, 6GB 910% 123% 160W $299 / 319€ 440-500 Euro
GeForce RTX 3050 Ampere, 8GB 820% ~114% 129W $249 / 279€ 390-460 Euro
GeForce GTX 1660 Ti Turing, 6GB 790% 103% 117W $279 / 299€ 390-500 Euro
GeForce GTX 1660 Super Turing, 6GB 770% ~101% 126W $229 / 245€ 390-470 Euro
2

nVidia bringt die LowEnd-Lösung "GeForce GT 1010" auf GP108-Basis in den Handel

Twitterer 'MEGAsizeGPU' hat sich in drei Tweets mit der "GeForce GT 1010" beschäftigt, welcher als spätes Halali der Pascal-Generation derzeit im chinesischen Einzelhandel für ca. 70 Euro auftaucht. So gibt es Bilder einer Retail-Karte von Leadtek, GPU-Z-Screenshot samt TimeSpy-Wert und letztlich sogar einen Teardown. Danach stellt die Karte die erwartete Abspeckung des GP108-Chips von 384 auf 256 Shader-Einheiten dar, zugleich kommt wiederum nur DDR4-Speicher zum Einsatz, wie schon bei der "legendären" GeForce GT 1030 DDR4. Bezüglich Benchmarks fährt man mit den Angaben von HXL @ Twitter besser, da es dort das normale TimeSpy (und kein TimeSpy Extreme) gibt, zu welchem wesentlich mehr Vergleichswerte existieren.

Hardware TimeSpy (GPU) FHD Perf.-Index
GeForce GT 1030 GDDR5 Pascal GP108, 384 SE @ 64 Bit GDDR5 1089 ~170%
GeForce GT 1030 DDR4 Pascal GP108, 384 SE @ 64 Bit DDR4 641 ~85%
GeForce GT 1010 Pascal GP108, 256 SE @ 64 Bit DDR4 ~530 ~70%
GeForce GT 730 GDDR5 Kepler GK208, 384 SE @ 64 Bit GDDR5 538 ~75%
GeForce GT 730 DDR3 Kepler GK208, 384 SE @ 64 Bit DDR3 437 ~55%
Inhalt abgleichen