18

News des 18. März 2024

nVidia hat mittels der GTC-Keynote seine nächste HPC-Generation "Blackwell" vorgestellt, welche primär enorme Vorteile bei der KI-Beschleunigung mitbringen soll. Wie üblich konzentrierten sich die nVidia-Ausführungen dabei auf die konkreten Produkte B100, B200 und GB200, womit es schwierig war, Informationen zu den zugrundeliegenden Chips zusammenzuklauben. Jener augenscheinliche "GB100"-Chip besteht aus zwei Einzelchips mit jeweils 104 Mrd. Transistoren auf jeweils ~800mm² Chipfläche (Hopper GH100: 80 Mrd. Tr. auf 814mm²). Interessanterweise läuft dies alles unter TSMCs 4nm-Fertigung in wahrscheinlich der N4P-Ausbaustufe ab – und damit nur leicht besser als in der vorherigen Hopper-Generation (zu "4N" umbenannte 5nm-Fertigung). Dies stellt eine starke Überraschung dar, denn bislang wurde gerade "HPC-Blackwell" als eigentlich narrensicherer Kandidat für TSMCs 3nm-Fertigung angesehen.

    nVidia GB100

  • nVidia Blackwell-Architektur
  • bestehend aus zwei Einzelchips  (angeblicher Einzel-Codename: GB102)
  • 2x 104 Mrd. Transistoren in TSMC "4NP"  (wahrscheinlich umbenannte TSMC N4P Fertigung)
  • 2x ~800mm² Chipfläche
  • unbekannte Ausrüstung mit GPC, TPC, SM, etc.  (vorherige Gerüchte sagen 160 SM für den vollen Chip)
  • interner Die-to-Die-Interconnect mit 10 TB/sec
  • 2x 4096-bit HBM3e-Interface für max. 192 GB Speicher
  • PCI Express 6.0
  • NVLink5 mit gegenüber "Hopper" doppelter Bandbreite
  • Produkte: "B100" auf 700W TDP, "B200" auf 1000W TDP, "GB200" mit zwei GB100-GPUs, einer "Grace" CPU und extra "NVLink Switch 7.2T" auf 1200W TDP
  • Steigerung der Tensor-Power auf den Faktor x2,5 zwischen H100 und B200  (bei TDP 700W → 1000W)
  • (bislang) keine weiteren belastbaren Performance-Angaben
  • Unterstützung der neuen Rechenformate FP6 und FP4
  • Auslieferungstermin wurde nicht genannt  (anzunehmen: Jahresende)
17

News des 16./17. März 2024

Twitterer AGF teasert die am Montag startende nVidia-Hausmesse "GTC 2024" an, zu welchem nVidias nächste HPC/AI-Lösung "B100" vorgestellt werden soll. Jene basiert auf dem GB100-Chip der "Blackwell"-Architektur in ihrem HPC/AI-Zweig, welche also nichts mit "Gaming-Blackwell" und damit den GB20x-Grafikchips zu tun hat. Der Twitterer beschreibt "B100" dabei aus zwei Einzelchips auf CoWoS-L Packaging aufgebaut und mit insgesamt 192 GB HBM3e-Speicher ausgerüstet, der nächstjährige Refresh "B200" soll dann sogar 288 GB Speicher bieten. Letzteres wird offenbar über Verbesserungen der Speicherchip-Hersteller erreicht, denn B100 & B200 dürften auf demselben GB100-Chip mit kolportiert 160 Shader-Clustern samt 8192 Bit Speicherinterface basieren (B100 & B200 = Produkte, GB100 = Chip).

I dont want to spoil Nvidia B100 launch tomorrow but this thing is a monster. 2 dies on CoWoS-L, 8x8-Hi HBM3e stacks for 192GB of memory. One year later, B200 goes with 12-Hi stacks and will offer a beefy 288GB. And the performance! ...
Quelle:  AGF @ Twitter am 17. März 2024

17 17

Umfrage: Wie ist der Ersteindruck zu AMDs Radeon RX 7900 GRE?

Alle Entscheidungsgrundlagen zu dieser Frage findet man in den Launchreviews, dem Forendiskussions-Thread zum Launch sowie der Launch-Analyse zu dieser Karte.
PS: Diskussion zur Umfrage und zum Umfrageergebnis in unserem Forum.

4070S 7800XT 7900GRE 7900XT
VRAM 12 GB 16 GB 16 GB 20 GB
gemittelte WQHD Raster-Perf. 99,8% 92,5% 100% 120,0%
gemittelte 4K Raster-Perf. 99,5% 93,3% 100% 122,2%
gemittelte WQHD RayTr-Perf. 133,0% 91,7% 100% 120,6%
Stromverbrauch 221W 250W ~255W 309W
Straßenpreis 600-660 Euro 520-570 Euro 580-640 Euro 720-800 Euro
16

Gerüchteküche: PlayStation 5 Pro mit drastisch mehr RayTracing-Performance sowie KI-unterstütztem "PSSR" Upscaling

Von YouTuber Moore's Law Is Dead kommt ein hochinteressanter Leak zur PlayStation 5 Pro, welcher nachfolgend auch noch von Konsolen-Insider Tom Henderson bestätigt wird. Zu sehen sind einige angebliche Sony-Dokumente, welche Hardware-Details zum kommenden Konsolen-Refresh auspacken. So soll die PS5Pro über eine Rechenkraft von 67 TFlops FP16 verfügen, was somit 33,5 TFlops FP32 entspricht. Dies passt gut zu den letzten Hardware-Gerüchten und würde bei 60 Shader-Clustern á RDNA3 einen GPU-Takt von ca. 2180 MHz ergeben. Einzurechnen bei allen Vergleichen mit Xbox Series X und auch der originalen PlayStation 5 wäre natürlich, dass die neue Grafiklösung der PS5Pro auf Basis einer Verbesserung der RDNA3-Architektur bereits die FP32-Verdopplung von RDNA3 trägt, die TeraFlops-Angaben somit nicht direkt mit früheren Spielekonsolen vergleichbar sind.

    Sony PlayStation 5 Pro

  • 67 TFlops FP16 (=33,5 TFlops FP32)
  • unter Raster ca. +45% schneller als PS5
  • unter RayTracing ca. +100-200% schneller als PS5 (+300% in einigen Fällen)
  • KI-Beschleuniger mit 300 TOPs (8-bit)
  • "PlayStation Spectral Super Resolution Upscaling" (PSSR) Upscaling mit KI-Einsatz
  • Quelle: angebliche Sony-Dokumente, zu sehen bei Moore's Law Is Dead @ YouTube
15

News des 15. März 2024

Gemäß Twitterer AGF soll die Schlagkraft der Blackwell-Architektur ausreichend hoch sein, dass unter Raster-Rendering der GB203-Chip dem AD102-Chip nahekommen soll sowie jenen unter RayTracing gar überflügeln wird. Die Aussage ist augenscheinlich auf Chip-Ebene bezogen, denn zur Frage von konkreten Grafikkarten wollte der Twitterer noch keine Stellung nehmen – logisch, die Produktgestaltung zu GB203-Lösungen steht bei nVidia erst in einigen Monaten an. Aber selbst auf reiner Chip-Ebene wäre dies ein gutklassiges Ergebnis, immerhin bringt der AD102-Chip seine 144 Shader-Cluster an einem 384-Bit-Speicherinterface auf die Waage, der GB203-Chip hingegen augenscheinlich nur 96 Shader-Cluster an einem 256-Bit-Interface. Die Bandbreiten-Differenz kann man eventuell mit GDDR7-Speicher (knapp) übertünchen, bei der Rechenleistung-Differenz wird dies nicht ganz so einfach: Denn selbst mit 20% Mehrtakt (bei GB203) gerechnet hätte AD102 hier immer noch einen Vorteil von +25%.

Will the 5080 also get a decent performance uplift from the 4080?
Quelle:  Ciomdx @ Twitter am 13. März 2024
 
Will depend on AMD competitiveness. So its too early to say but GB203 is close to AD102 in raster and faster in RT
Quelle:  AGF @ Twitter am 13. März 2024

14

News des 14. März 2024

Mit dem Donnerstag hat Intel den Core i9-14900KS als neue Speerspitze seines Desktop-Portfolios in den Markt gebracht. Die KS-Ausführung bietet keine andere Hardware als der bekannte Core i9-14900K, sondern nur einen um +200 MHz höheren Boost-Takt sowie eine leicht höhere TDP (ohne aber ein höheres Powerlimit, beides liegt offiziell bei 253W). Damit ist logischerweise nicht viel Staat zu machen, im Testbericht von TechPowerUp ergibt sich hiermit eine um +3,0% höhere Anwendungs-Performance sowie eine um +1,6% höhere Spiele-Performance (1% low auf FullHD). Andere Reviews hatten teilweise noch geringere Performance-Gewinne erzielt oder auch über Schwierigkeiten zu berichten, überhaupt schneller als ein Core i9-14900K herauskommen. Dies trifft insbesondere auf den Test der PC Games Hardware zu, wo eine durchgehend höhere Performance nur unter Umgebung der nominellen Powerlimits erreichbar war. Hier könnte natürlich auch die Serienstreuung eine Rolle spielen und die PCGH einfach ein schwächeres Stück Silizium erwischt haben.

Basis Kerne P-Takt E-Takt L2+L3 iGPU PBP/MTP Liste Release
Core i9-14900KS Raptor Lake 8P+16E/32T 3.2/6.2 GHz 2.4/4.5 GHz 32+36 MB 32 EU 150/253W $699 14. März 2024
Core i9-14900K Raptor Lake 8P+16E/32T 3.2/6.0 GHz 2.4/4.4 GHz 32+36 MB 32 EU 125/253W $589 17. Okt. 2023
Core i9-14900KF Raptor Lake 8P+16E/32T 3.2/6.0 GHz 2.4/4.4 GHz 32+36 MB deaktiviert 125/253W $564 17. Okt. 2023
Core i7-14700K Raptor Lake 8P+12E/28T 3.4/5.6 GHz 2.5/4.3 GHz 28+33 MB 32 EU 125/253W $409 17. Okt. 2023
Core i7-14700KF Raptor Lake 8P+12E/28T 3.4/5.6 GHz 2.5/4.3 GHz 28+33 MB deaktiviert 125/253W $384 17. Okt. 2023
13

News des 13. März 2024

Gemäß Twitterer AGF, welcher früher oftmals wertvolle Hinweise auf NextGen-Hardware gegeben hat, soll nVidias "Blackwell"-Generation angeblich sogar den größten Generations-Sprung aller Zeiten hinlegen. Die Wortwahl dürfte leicht übertrieben sein, denn die Generations-Sprünge zum Anfang der 3D-Zeit (oder auch mit dem G80-Chip) sind heutzutage kaum noch zu übertreffen. Allerdings liefert der Twitterer auch eine vernünftige Begründung für diesen Ansatz: Zum einen war Blackwell ursprünglich mal gegen eine RDNA4-Ausführung im MCM-Ansatz geplant, musste also seitens der Konkurrenz von einem echten Angriff auf die Leistungsspitze ausgehen. Zu anderen dürfte Blackwell in seinem Verkaufszyklus nicht nur gegen AMDs RDNA4, sondern auch gegen AMDs RDNA5 antreten – gute Gründe also für eine eher dicke Hardware-Ansetzung.

People is confused about Nvidia Blackwell top die gaming GPU memory bus and VRAM capacity. I can't say too much right now but gen-to-gen performance uplift is the biggest ever. Don't forget that Blackwell was designed to compete with a monster 3nm MCM RDN4. More to come soon...
Quelle:  AGF @ Twitter am 13. März 2024
 
Biggest uplift ever?
Quelle:  Kendall Pino @ Twitter am 13. März 2024
 
Another factor to consider is that Blackwell will fight both RDN4 and RNDA5 during it's lifespan. So decisions will be different this round. It's a chess game...
Quelle:  AGF @ Twitter am 13. März 2024

13

Gerüchteküche: Weitere GB203- & GB205-Leaks lassen die Hardware-Daten zu "Gaming-Blackwell" nahezu komplett erkennen

Leaker Kopite7kimi hat die bislang getroffene Annahme bestätigt, dass der GB203-Chip der "Blackwell"-Generation über ein 256-Bit-Speicherinterface verfügt, welches somit gleichlautend zum AD103-Chip der Ada-Lovelace-Generation liegt. Damit würde der GB203-Chip wie gesagt in allen Kern-Punkten wie Raster-Engines, Shader-Cluster und Speicherinterface eine glatte Halbierung des GB202-Chips darstellen – was erneut Vermutungen aufkommen lassen hat, dass es sich bei "GB202" um ein MultiChip-Konstrukt (aus zweimal GB203) handeln könnte. Sicher kann diese Frage derzeit nicht beantwortet werden, aber der Leaker selber vermutet wie schon erwähnt derzeit noch kein "MCM" im Consumer-Bereich – während hingegen der GB100-Chip für HPC/AI-Bedürfnisse schlicht aus zwei GB102-Chips bestehen soll.

GB203 is 256-bit and GB205 is 192-bit.
Quelle:  Kopite7kimi @ Twitter am 12. März 2024

12

News des 12. März 2024

Twitterer & Leaker Kopite7kimi weist auf die kommende nVidia-Messe "GTC 2024" hin, welche vom 18. bis 22. März laufen wird und mittels welcher eigentlich irgendetwas zu nVidias nächster Hardware-Generation "Blackwell" erwartet werden kann. Für alles, was Consumer-Chips und damit Gaming-Grafiklösungen betrifft, dürfte es allerdings (deutlich) zu früh sein, nVidia hat da keinerlei Tendenzen, zu frühe Teaser zu setzen. Allerdings sollte eigentlich "HPC-Blackwell" vorgestellt werden, wenngleich derzeit noch unklar ist, wie breit diese Vorstellung erfolgt. Vor zwei Jahren hatte nVidia zu diesem Termin die "Hopper-Generation" samt des GH100-Chips bereits ziemlich umfassend vorgestellt – ungehindert des Punkts, dass entsprechende Produkte erst Richtung Jahresende ausgeliefert wurden. Allerdings ist diese Vorgehensweise im Profi-Bereich recht normal, da gibt es keine festen Launchtermine und somit festnagelbare Datumsangaben.

GTC2024 is coming. Let's see if there is a GB100.
Quelle:  Kopite7kimi @ Twitter am 12. März 2024

11

News des 11. März 2024

Interessant wie irritierend ist, dass sich die IT-Presse bezüglich der jüngsten Wasserstandsmeldungen zu "Blackwell" GB202 & GB203 seitens Leaker 'Kopite7kimi' so nahezu ausschließlich auf den Punkt des großen Speicherinterfaces konzentriert. Jenes ist mit 512 Bit sicherlich ungewöhnlich dick für einen Consumer-Chip, allerdings ist mit dieser Chip-Spezifikation auch nicht gesagt, dass nVidia dieses Speicherinterface auch wirklich bei Gamer-Lösungen ausfährt. Denkbar wäre genauso, dass die Gaming-Lösungen bei einem 384-Bit-Interface bleiben und es das volle Speicherinterfaces des GB202-Chips nur im Profi-Bereich gibt. Dort wird diese Speicherbandbreite eventuell auch nicht benötigt, aber das größere Interface ermöglicht mehr Speicher (64 GB im Clamshell-Mode mit 2GByte-Chips) – und dies ist für die heutige Aufgabenstellungen bei lokal laufenden KIs einfach Gold wert. Neben diesem sicherlich wichtigen Punkt wird allerdings vergessen, dass der Twitterer auch einen gewichtigen Hinweis auf die Anzahl der Recheneinheiten von GB202 & GB203 gegeben hat:

I think GB203 is half of GB202, just like GB102 and GB100. But I don't know if GB202 has a multi chip package.
Quelle:  Kopite7kimi @ Twitter am 11. März 2024
 
I am just thinking that GB203 may only have 6 GPCs.
Quelle:  Kopite7kimi @ Twitter am 6. März 2024

Inhalt abgleichen