nVidia hat mittels der GTC-Keynote [1] seine nächste HPC-Generation "Blackwell" vorgestellt, welche primär enorme Vorteile bei der KI-Beschleunigung mitbringen soll. Wie üblich konzentrierten sich die nVidia-Ausführungen dabei auf die konkreten Produkte B100, B200 und GB200, womit es schwierig war, Informationen zu den zugrundeliegenden Chips zusammenzuklauben. Jener augenscheinliche "GB100"-Chip besteht aus zwei Einzelchips mit jeweils 104 Mrd. Transistoren auf jeweils ~800mm² Chipfläche (Hopper GH100: 80 Mrd. Tr. auf 814mm² [2]). Interessanterweise läuft dies alles unter TSMCs 4nm-Fertigung in wahrscheinlich der N4P-Ausbaustufe ab – und damit nur leicht besser als in der vorherigen Hopper-Generation [3] (zu "4N" umbenannte 5nm-Fertigung). Dies stellt eine starke Überraschung dar, denn bislang wurde gerade "HPC-Blackwell" als eigentlich narrensicherer Kandidat für TSMCs 3nm-Fertigung angesehen.
|
Da jene 3nm-Fertigung nun doch nicht angesetzt wurde, musste nVidia den nahezu doppelten Silizium-Einsatz gehen, hierfür wurden die beiden Einzelchips mit einem hochwertigen Die-to-Die-Interconnect mit 10 TB/sec Bandbreite verbunden. Betrachtet man die einzige belastbare Performance-Angabe mit der 2,5fachen Tensor-Performance unter diesem Licht, so stellt sich HPC-Blackwell fast wie eine "SLI-Version von Hopper" zuzüglich weiterer Verbesserungen dar. Dafür spricht auch, dass jene 2,5fache Tensor-Performance wohl im unfairen Duell von 700W gegen 1000W erzielt wurde, eine Performance-Angabe auf gleicher TDP hat nVidia unterlassen. Intern dürfte dies wahrscheinlich alles ganz anders aussehen – was sich derzeit nicht solide beurteilen läßt, denn nVidia geizte mit genauen Angaben zum Aufbau des GB100-Chips. Möglich natürlich, dass die bisherigen Grafikchip-Merkmale bezüglich GPC, TPC & SM für einen HPC/KI-Chip wie "GB100" nicht mehr die große Rolle spielen, nVidia sich davon löst bzw. andere Schwerpunkte setzt.
Generation | Fertigung | Chip-Daten | SM, FP32 | Interface | |
---|---|---|---|---|---|
nVidia GP100 | Pascal | 16nm TSMC | 15,3 Mrd. Tr. auf 610mm² [4] | 60 SM, 3840 FP32 | 4096 Bit HBM2 |
nVidia GV100 | Volta | 12nm TSMC | 21,1 Mrd. Tr. auf 815mm² [5] | 84 SM, 5376 FP32 | 4096 Bit HBM2 |
nVidia GA100 | Ampere | 7nm TSMC | 54,2 Mrd. Tr. auf 826mm² [6] | 128 SM, 8192 FP32 | 6144 Bit HBM2 |
nVidia GH100 | Hopper | 5nm TSMC | 80 Mrd. Tr. auf 814mm² [2] | 144 SM, 18'432 FP32 | 6144 Bit HBM2e/HBM3 |
nVidia GB100 | Blackwell | 4nm TSMC | 2x 104 Mrd. Tr. auf 2x ~800mm² | 160 SM (?) | 8192 Bit HBM3e |
Hierzu gehört in jedem Fall die Unterstützung der Rechenformate FP6 und FP4, mittels welchem nochmals höhere Geschwindigkeiten bei der KI-Beschleunigung zu erwarten sind. Demzufolge ist das, was sich hieraus auf "Gaming-Blackwell" applizieren läßt, eigentlich minimal – bis natürlich auf das Thema der Chipfertigung. Denn wenn nVidia keinen 3nm-Node für HPC-Blackwell ansetzt, ist dies für Gaming-Blackwell nunmehr ebenfalls sehr fraglich. Eine verbesserte 5nm-Fertigung auch bei Gaming-Blackwell würde daneben "gut" zu dessen geringem Hardware-Sprung [7] passen. Allerdings wären damit dann auch die Möglichkeiten zur Taktraten-Steigerung, wesentlich mehr Transistoren für Architektur-Verbesserungen und letztlich die insgesamte Performance-Steigerung limitiert. Denn mit doppeltem Silizium-Einsatz wird nVidia bei Gaming-Blackwell sicherlich nicht antreten, dies läßt sich nur bei den Margen des HPC/KI-Geschäfts vertreten.
Konsolen-Insider Tom Henderson hat auf 'Insider Gaming' in zwei Berichten – No.1 [8] & No.2 [9] – bezüglich der Hardware-Gestaltung der PlayStation 5 Pro nachgelegt bzw. neue Details offenbart. So ist die CPU der PS5Pro entgegen bisherigen Angaben komplett gleich zur regulären PS5, sprich Zen-2-basierter Achtkerner mit bis zu 3.5 GHz Taktrate. Neu ist hier nur ein "High CPU Frequency Mode", welcher TDP von GPU zu CPU verschiebt, womit jene auf maximal 3.85 GHz takten kann, dies allerdings unter dem Verlust von ca. 1% GPU-Performance. Zudem wird die PS5Pro-GPU nunmehr fest mit 60 Shader-Clustern beschrieben, der zugrundliegende Chip dürfte demzufolge auf 64 Shader-Cluster kommen (traditionell werden bei Spielekonsolen aus Ausbeutegründen nicht alle Shader-Cluster freigeschaltet). Zugleich ergibt sich auch noch die Festplatten-Größe der PS5Pro mit 1 TeraByte.
PS5 "Digital Edition" | PlayStation 5 | PlayStation 5 Pro | ||
---|---|---|---|---|
Fertigung | 7nm TSMC | 4nm TSMC | ||
Prozessor | 8C/16T Zen 2 @ ≤3.5 GHz | 8C/16T Zen 2 @ ≤3.85 GHz | ||
Grafiklösung | 36 CU RDNA2 @ ≤2.23 GHz (≤10,3 TFlops) | 60 CU RDNA3.5 @ ≤2.2 GHz (≤16,7 TFlops) * | ||
KI-Beschleuniger | keiner | 300 TOPs (8bit) | ||
Speicherinterface | 256 Bit GDDR6 @ 14 Gbps (448 GB/sec) | 256 Bit GDDR6 @ 18 Gbps (576 GB/sec) | ||
Speicherausbau | 16 GB GDDR6 | 16 GB GDDR6 + extra DDR5 (letzteres unsicher) | ||
Festplatte | 825 GB NVMe-SSD @ 5,5 GB/sec (8-9 GB/sec mit Kompression) | 1 TB NVMe-SSD | ||
Laufwerk | keines | 4K UHD BluRay | ? | |
Upscaler | FSR1/2 | FSR1-3, PSSR | ||
Listenpreis | $400 / 400€ ab Aug 2022: 450€ |
$500 / 500€ ab Aug 2022: 550€ |
(angbl.) $500 | |
Release | 12. November 2020 (Europa: 19. Nov.) | November 2024 Vorstellung September 2024 |
||
Hinweis: Angaben zu noch nicht offiziell vorgestellter Hardware basierend auf Gerüchten & Annahmen — * FP32 gerechnet ohne RDNA3 Dual-Issue |
Und letztlich gab es noch eine bedeutsame Bemerkung zur RayTracing-Hardware der PS5Pro, welche auch deren drastische Steigerung der RayTracing-Performance erklären läßt: Denn während die originale PS5 RayTracing im BVH4-Format abarbeitet, beherrscht die PS5Pro bereits BVH8, ergo eine Shader- und Takt-normierte Durchsatz-Verdopplung. Zusammen mit der höheren Anzahl an Shader-Clustern sind die von Sony genannten RayTracing-Performancegewinne (auf das 2-3fache) somit durchaus machbar, wenn auch wohl nur auf den RayTracing-Part der Grafik bezogen (sprich der insgesamte Performance-Gewinn ist geringer). Zudem ergibt sich hieran auch eine Bedeutung für PC-Grafikkarten: Denn jenes BVH8-Format sollte dann auch Teil der RDNA4-Architektur [10] sein – und somit die RayTracing-Abarbeitung auf der kommenden Radeon RX 8000 Serie bedeutsam beschleunigen. All dies war bereits vermutet worden, aber eine technisch untermauerte Bestätigung ist natürlich immer besser als reine Vermutungen.
BVH8 is interesting, not only confirms PS5 Pro is using RDNA4's RT engine but also confirms RDNA4 doubles RT throughput per cycle, something which hasn't been mentioned in any open source patch yet!
Quelle: Kepler @ Twitter [11] am 17. März 2024
VideoCardz [12] berichten über den neuesten Streich des Hardware-Modder-Teams um Paulo Gomez [13], welche eine Radeon RX 5600 XT auf ein größeres Speicherinterface und gleich 16 GB Speicher umgebaut haben. Insbesondere ersterer Punkt ist beachtenswert, denn das reine Umlöten von Speicherbausteinen ist in Modder-Kreisen nun nichts besonderes mehr. Hier hat man allerdings der Radeon RX 5600 XT, welche eigentlich nur mit einem 192-Bit-Speicherinterface antritt, mittels BIOS-Mod das volle 256-Bit-Interface des zugrundeliegenden Navi-10-Chips entlocken können. Ausgangslage ist aber natürlich auch der Punkt, dass einige Radeon RX 5600 XT Grafikkarten mit Platinen anrücken, die bereits für 8 Speicherchips ausgelegt und verdrahtet sind, sprich auch für eine (regulär 256bittige) Radeon RX 5700 /XT Verwendung finden könnten.
Verweise:
[1] https://www.youtube.com/watch?v=Y2F8yisiS6E
[2] https://www.3dcenter.org/news/nvidia-stellt-den-gh100-chip-der-hopper-generation-mit-18432-fp32-einheiten-144-shader-clustern
[3] https://www.3dcenter.org/news/nvidia-hopper
[4] https://www.3dcenter.org/artikel/nvidia-kuendigt-den-pascal-chip-gp100
[5] https://www.3dcenter.org/news/nvidia-stellt-den-volta-chip-gv100-mit-5376-shader-einheiten-unter-der-12nm-fertigung-vor
[6] https://www.3dcenter.org/news/nvidia-stellt-den-ga100-chip-der-ampere-generation-mit-8192-shader-einheiten-einem-6144-bit-hbm
[7] https://www.3dcenter.org/news/geruechtekueche-weitere-gb203-gb205-leaks-lassen-die-hardware-daten-zu-gaming-blackwell-nahezu-
[8] https://insider-gaming.com/playstation-5-pro-more-specs/
[9] https://insider-gaming.com/playstations-spectral-super-resolution-pssr/
[10] https://www.3dcenter.org/news/amd-rdna4
[11] https://twitter.com/Kepler_L2/status/1769479246987051360
[12] https://videocardz.com/newz/modders-upgrade-radeon-rx-5600-xt-to-16gb-256b-memory-up-to-29-performance-increase-with-oc
[13] https://www.youtube.com/watch?v=vR9IwDug5T0
[14] https://winfuture.de/downloadvorschalt,4103.html
[15] https://winfuture.de/downloadvorschalt,3684.html
[16] https://winfuture.de/downloadvorschalt,3478.html
[17] https://winfuture.de/downloadvorschalt,3586.html
[18] https://winfuture.de/downloadvorschalt,3534.html
[19] https://winfuture.de/downloadvorschalt,3352.html
[20] https://winfuture.de/downloadvorschalt,470.html
[21] https://winfuture.de/downloadvorschalt,3781.html
[22] https://winfuture.de/downloadvorschalt,1972.html
[23] https://winfuture.de/downloadvorschalt,2827.html
[24] https://www.computerbase.de/2024-03/nvidia-blackwell-b200-gpu-kommt-als-dual-die-mit-208-milliarden-transistoren/
[25] https://www.computerbase.de/2024-03/nvidia-dgx-gb200-superpod-supercomputer-mit-576-blackwell-gpus-liefert-11-5-exaflops/
[26] https://www.golem.de/news/blackwell-b200-nvidias-stellt-riesige-doppel-gpu-vor-2403-183321.html
[27] https://www.hardwareluxx.de/index.php/news/hardware/grafikkarten/63194-zwei-grosse-chips-arbeiten-zusammen-nvidia-stellt-die-blackwell-architektur-vor.html
[28] https://www.heise.de/news/Nvidias-neue-KI-Chips-Blackwell-GB200-und-schnelles-NVLink-9658475.html
[29] https://www.pcgameshardware.de/Grafikkarten-Grafikkarte-97980/News/Nvidia-B200-Blackwell-KI-Beschleuniger-mit-20-PetaFLOPS-1443262/
[30] https://www.pcgameshardware.de/Grafikkarten-Grafikkarte-97980/News/Nvidia-GB200-Grace-Blackwell-Superchip-1443264/
[31] https://www.anandtech.com/show/21310/nvidia-blackwell-architecture-and-b200b100-accelerators-announced-going-bigger-with-smaller-data
[32] https://www.pcgameshardware.de/Geforce-RTX-4070-Ti-Grafikkarte-279172/News/Abverkauf-Lohnen-sich-die-Angebote-1443223/
[33] https://www.computerbase.de/2024-03/grafikkarten-benchmark-jagged-alliance-iii/
[34] https://www.hardware-mag.de/artikel/grafikkarten/inno3d_rtx_4080_super_ichill_frostbite_review/
[35] https://wccftech.com/review/galax-geforce-rtx-4070-super-ex-gamer-12-gb-graphics-card-review-rgb-triple-fan-goodness-msrp/
[36] https://twitter.com/TechnicallyLog1/status/1769372732817309956
[37] https://wccftech.com/nvidia-h100-ai-gpus-ends-up-chinese-researchers-despite-harsh-regulations/
[38] https://www.hartware.de/2024/03/18/qualcomm-snapdragon-8s-gen-3-neuer-premium-chip-fuer-mobile-endgeraete/
[39] https://videocardz.com/newz/amd-submits-zen5-patches-in-time-for-gcc-14-1-stable-release
[40] https://wccftech.com/dram-cache-gpus-performance-up-to-12-5x-significantly-reducing-power/
[41] https://www.scinexx.de/news/technik/boost-fuer-ionen-quantencomputer/
[42] https://www.heise.de/news/Intel-legt-Plaene-eines-Packing-Werks-in-Italien-fuer-Chips-aus-Magdeburg-auf-Eis-9657395.html
[43] https://www.computerbase.de/2024-03/advanced-packaging-tsmc-plant-neue-fabs-in-taiwan-und-auch-japan/
[44] https://www.tweakpc.de/news/49876/qnap-ts-216g-2-bay-nas-auf-arm-basis-mit-25-gbit-s-netzwerkanschluss/
[45] https://www.notebookcheck.com/ROG-Strix-XG27ACS-Gaming-Monitor-mit-hoher-Bildwiederholfrequenz-ist-kalibriert.814542.0.html
[46] https://www.notebookcheck.com/Xiaomi-Curved-Gaming-Monitor-G34WQi-Neuer-Gaming-Monitor-mit-180-Hz-und-1-ms-kommt-global-auf-den-Markt.814294.0.html
[47] https://www.hartware.de/2024/03/18/aoc-agon-pro-ag456uczd-neuer-oled-monitor-fuer-spieler/
[48] https://www.pcgameshardware.de/Outcast-2-Spiel-73470/News/PC-Spiele-Markt-Entwicklung-Survival-vs-Substanz-1443161/
[49] https://www.pcgameshardware.de/Dark-Souls-2-Scholar-of-the-First-Sin-Spiel-55447/News/120-fps-mod-1443221/
[50] https://www.computerbase.de/2024-03/hearts-of-iron-iv-drei-erweiterungen-kostenfrei-auf-steam/
[51] https://winfuture.de/news,141774.html
[52] https://www.notebookcheck.com/Erste-IoT-Device-Security-Specification-der-CSA-verlangt-offenen-Umgang-mit-Sicherheitsluecken-in-Geraeten.811457.0.html
[53] https://www.heise.de/news/Cheats-bei-Meisterschaftsspiel-Geruechte-um-Codeschmuggel-Luecke-in-Apex-Legends-9657626.html
[54] https://www.heise.de/news/Spring-Framework-Updates-beheben-neue-alte-Sicherheitsluecke-9657496.html
[55] https://www.heise.de/news/Microsoft-RSA-Schluessellaengen-von-2048-Bit-reichen-fuer-TLS-Zertifikate-9657480.html
[56] https://www.forum-3dcenter.org/vbulletin/showpost.php?p=13510418
[57] https://www.tweakpc.de/news/49877/steam-valve-plant-mit-ueberarbeitung-von-systemanforderungen-der-spiele/
[58] https://www.computerbase.de/2024-03/the-sphere-in-las-vegas-riesige-display-kugel-hat-4-pb-flash-speicher-fuer-400-gb-s/
[59] https://www.notebookcheck.com/PlayStation-VR-2-Sony-stoppt-Produktion-vorlaeufig-Zahlen-belegen-kleinen-Misserfolg.814692.0.html
[60] https://netzpolitik.org/2024/altersverifikation-in-texas-nach-pornhub-rueckzug-steigt-die-vpn-nachfrage/#netzpolitik-pw
[61] https://winfuture.de/news,141787.html
[62] https://winfuture.de/news,141767.html
[63] https://www.golem.de/news/handelstreit-mit-china-eu-will-risiko-chinesischer-legacy-chips-untersuchen-2403-183315.html
[64] https://www.golem.de/news/x-ai-grok-1-das-ki-modell-von-elon-musks-startup-steht-quelloffen-2403-183313.html
[65] https://www.golem.de/news/studie-moderne-technologie-senkt-lebensqualitaet-von-arbeitnehmern-2403-183307.html
[66] https://www.golem.de/news/im-namen-der-ihk-phishing-welle-trifft-firmen-in-ganz-deutschland-2403-183294.html
[67] https://www.golem.de/news/sanktionen-russische-unternehmen-verlieren-zugriff-auf-die-cloud-2403-183295.html
[68] https://www.golem.de/news/sam-bankman-fried-ehemaliger-ftx-chef-und-krypto-koenig-soll-50-jahre-in-haft-2403-183263.html
[69] https://www.heise.de/news/Kuendigungsbutton-Noch-nicht-jeder-Online-Vertrag-kann-einfach-gekuendigt-werden-9657512.html
[70] https://www.heise.de/news/Next-Level-KI-Coins-gehen-durch-die-Decke-9654967.html
[71] https://www.heise.de/news/Patentamt-Bosch-fuehrt-hierzulande-bei-KI-Patentanmeldungen-USA-insgesamt-vorn-9657425.html
[72] https://www.heise.de/news/Stadtrat-schreibt-Mindestlohn-vor-Uber-und-Lyft-verlassen-Minneapolis-9658074.html
[73] https://www.heise.de/news/Entlassungswelle-im-Tech-Sektor-auf-hoechstem-Punkt-seit-dem-Dotcom-Crash-9657136.html
[74] https://www.heise.de/news/Abstimmung-ueber-TikTok-Verbot-im-Senat-verzoegert-sich-9657110.html
[75] https://www.telepolis.de/features/TikTok-vor-der-Wahl-Verkauf-Verbot-oder-Klage-gegen-US-Gesetzgebung-9658103.html
[76] https://www.telepolis.de/features/Wieso-die-US-Regierung-mit-dem-TikTok-Verbot-scheitern-koennte-9658103.html
[77] https://www.linkedin.com/feed/update/urn:li:activity:7173933550092636160
[78] https://www.idc.com/getdoc.jsp?containerId=prAP51958024
[79] https://www.idc.com/getdoc.jsp?containerId=prAP51958124
[80] https://www.idc.com/getdoc.jsp?containerId=prUS51957524
[81] https://www.idc.com/getdoc.jsp?containerId=prAP51960924
[82] https://twitter.com/Tobyfrxdrgh/status/1769571816518111336
[83] https://twitter.com/PcPhilanthropy/status/1769526735740031402
[84] https://twitter.com/ThisOldTech2/status/1769379287533326452
[85] http://de.wikipedia.org/wiki/18._März
[86] http://de.wikipedia.org/wiki/19._März
[87] https://www.golem.de/news/kometen-sichtbarkeit-riesiger-teufelskomet-von-der-erde-aus-sichtbar-2403-183299.html
[88] https://www.scinexx.de/news/geowissen/mittelmeer-umgekippte-erdplatte-entdeckt/
[89] https://www.scinexx.de/news/biowissen/aeltester-langhals-meeressaurier-identifiziert/
[90] https://www.wissenschaft.de/erde-umwelt/wie-wasserstoff-schon-am-ursprung-des-lebens-nutzbar-wurde/
[91] https://www.wissenschaft.de/gesundheit-medizin/wie-eizellen-das-eindringen-vieler-spermien-verhindern/
[92] https://www.heise.de/news/Methan-Lecks-in-den-USA-sind-schlimmer-als-bislang-angenommen-9657696.html
[93] https://www.borncity.com/blog/2024/03/17/10-jahre-nach-google-street-view-neuer-ansatz-in-deutschland-ohne-widerstand/
[94] https://www.heise.de/news/Bundesrat-Streit-ueber-Aus-fuer-Pflicht-zu-betrieblichen-Datenschutzbeauftragten-9658500.html
[95] https://www.golem.de/news/standortdaten-aus-der-onlinewerbung-der-spion-aus-dem-werbebanner-2403-183217.html
[96] https://www.heise.de/hintergrund/USA-Per-Ueberwachung-von-vernetzten-Autos-zu-hoeheren-Kfz-Versicherungspraemien-9653169.html
[97] https://www.heise.de/news/Starshield-SpaceX-soll-milliardenschweres-Spionagenetz-aufbauen-9657265.html
[98] https://www.telepolis.de/features/Konjunktur-in-Deutschland-Steht-eine-Rezession-bevor-9657522.html
[99] https://www.welt.de/wirtschaft/article250594220/Stimmungsbild-Zwei-Drittel-der-Deutschen-haben-Zukunftsangst.html
[100] https://www.telepolis.de/features/Welche-Rolle-koennte-China-bei-Ukraine-Friedensverhandlungen-spielen-9657926.html
[101] https://www.telepolis.de/features/Spezielle-Wahlaktion-Wie-ich-an-Putins-Wiederwahl-teilnahm-9657825.html
[102] https://www.telepolis.de/features/Transnistrien-Zank-um-den-Hinterhof-9657098.html
[103] https://www.medico.de/blog/einfach-ueberleben-19431
[104] https://www.medico.de/blog/ein-zweites-afghanistan-19430
[105] https://www.telepolis.de/features/Chinas-Auslandsinvestitionen-Die-unsichtbare-Revolution-9657061.html
[106] https://www.telepolis.de/features/Von-Haiti-bis-Honduras-Die-Krise-westlicher-Hegemonie-9658373.html