3

Hardware- und Nachrichten-Links des 2./3. Juni 2020

In unserem Forum wird eine klare Lanze für HBM2-Speicher bei "Big Navi" gebrochen – und dafür aber auch eine Begründung samt weiterer Hintergrund-Informationen geliefert. Dabei liegt beim Navi-21-Chip mit kolportiert 80 Shader-Clustern die Problematik vor allem darin, das die Entscheidung zwischen GDDR6 oder HBM2 im Fall von GDDR6 regulärerweise auf ein 512bittiges GDDR6-Interface hinauslaufen würde – was heutzutage wiederum keiner mehr bauen will, da es (relativ) zu viel Platz auf dem Chip wegnimmt bzw. zu stark ins Power-Budget reinschlägt. Allein die dafür notwendige größere Chipfläche könnte zudem dafür sorgen, das sich die Mehrkosten von HBM wieder etwas reduzieren – und sinngemäß wird die Rechnung noch besser, wenn man das mit HBM erreichbare höhere Performance-Potential (mehr Power-Budget für die Recheneinheiten anstatt das Speicherinterface, größere Speicherbestückung als bei 384 Bit GDDR6 möglich) einbezieht, womit sich das Endprodukt letztlich besser und zu höheren Preisen verkaufen läßt. Gänzlich sicher kann man sich natürlich nicht sein, gerade die Variante mit 80 Shader-Clustern ist grenzwertig: Jene wäre auch noch mit 384 Bit GDDR6 realisierbar – im Gegensatz zu einer höheren Anzahl an Shader-Clustern, welche dann klar zugunsten von HBM2 tendiert.

Chipfläche Speicherinterface fixe Chipteile Recheneinheiten
Navi 10 251mm² 256 Bit GDDR6 = ca. 25% der Chipfläche ca. 40% 60% der Chipfläche = 40 SM
Navi 21 mit GDDR6 505mm² 384 Bit GDDR6 = ca. 18-20% der Chipfläche ca. 25% 75% der Chipfläche = 80 SM
Navi 21 mit HBM2 505mm² 2048 Bit HBM2 = ca. 10% der Chipfläche ca. 15% 85% der Chipfläche = 96 SM
Alles zu Navi 21 notierte stellt reine Annahmen dar.

Interessant sind zudem die Aussagen zum Flächenbedarf der Speicherinterfaces und anderer fixer Chipteile – welche somit den Platz reduzieren, in welchem "echte" Recheneinheiten liegen können. Beim Navi-10-Chip mit seinem 256bittigem GDDR6-Interface gehen somit immerhin ca. 25% der Chipfläche nur für jenes Speicherinterface drauf (wahrscheinlich inkl. des Speichercontrollers), zusammen mit anderen Interfaces und Display-Einheit liegt der Anteil fixer Einheiten bei immerhin ca. 40% der Chipfläche. Somit bleiben dann nur ca. 60% des 251mm² großen Chips für Raster-Engines samt Shader-Cluster übrig, sprich die eigentlichen Recheneinheiten. Bei größeren Chips wird die Rechnung leicht günstiger, so kann man einen Navi-21-Chip mit angenommen 384 Bit GDDR6-Interface auf einen Anteil fixer Einheiten von ca. 25% schätzen. Dies sind bei 505mm² Chipfläche aber auch noch satte 126mm² – und genau darin liegt der Clou von HBM: Das HBM2-Interface ist kleiner, verbraucht weniger Platz & Strom, spart in diesem Rechenbeispiel ca. 10% Chipfläche (Anteil fixer Einheiten ca. 15%) und gibt somit ca. 50mm² für Recheneinheiten frei. Da schließlich auch das Power-Budget durch HBM positiv beeinflußt wird, kann man auf diesem Platz dann zusätzliche Recheneinheiten verbauen – eine absolute Win-Win-Situation, abgesehen von der höheren Kostenlage. In einer Beispielrechnung könnte der Navi-21-Chip mit HBM2-Interface somit sogar bis zu 96 Shader-Cluster tragen – anstatt 80 Shader-Cluster mit GDDR6-Interface.

Golem haben den Test eines Zhaoxin-Prozessors aufgelegt und selbigen dann – im Gegensatz zum vorherigen Test seitens Tom's Hardware – gegen etwas passender Prozessoren verglichen. Zum Einsatz kam wieder das Achtkern-Modell "KX-U6780A" ohne SMT (in der Architektur generell nicht vorhanden) und auf 2.7 GHz Taktrate. Die Performance erreicht erneut nicht einfache PC-Prozessoren wie einen (nur zweikernigen) Pentium G4500 oder auch AMDs alten Achtkerner FX-8350, sondern liegt nur besser als die von typischen Atom-Prozessoren wie dem Pentium J5005. Gemessen an dem Punkt, das jener mit 10 Watt TDP ins Rennen steigt und der KX-U6780A eine ausgewachsene Desktop-CPU mit 70 Watt TDP darstellt, ist die Vorstellung von Zhaoxin vom technologischen Standpunkt her nicht wirklich konkurrenzfähig. Mittels der verstärkten Nachfrage nach Chip-Produkten aus heimischer (chinesischer) Fertigung dürfte Zhaoxin allerdings sicher seinen Weg weitergehen können, sprich seine Roadmap abarbeiten und sich Stück für Stück näher an die Performance westliche PC-Prozessoren heranrobben. Hinzu kommen einige Reserven bei der Fertigungstechnologie, denn die KX-6000 Generation wird nur unter der 16nm-Fertigung (von TSMC) hergestellt.

Technik Anwend.-Perf. ST-Perf.
AMD FX-8350 Piledriver, 8C/8T, 4.0/4.2 GHz 151,8% 175%
Intel Pentium G4500 Coffee Lake, 2C/4T, 3.7 GHz 136,9% 274%
Zhaoxin KX-U6780A Lujiazui, 8C/8T, 2.7 GHz 100% 100%
Intel Pentium J5005 Gemini Lake, 4C/4T, 1.5/2.8 GHz 79,8% 139%
VIA Eden C4650 Isaiah, 4C/4T, 2.0 GHz 42,1% ~65%
gemäß der Ausführungen von Golem unter 12 Anwendungs-Benchmarks

Die Spiele-Webseite gibt die offiziellen PC-Systemanforderungen für "Valorant" wieder, dem am 2. Juni aus dem Beta-Status entlassenen Free2Play-Shooter von Entwickler & Publisher Riot Games. Der reine Multiplayer-Titel strebt eine Konkurrenz zu anderen eSports-Größen an, hat auch bisher für einiges Aufsehen gesorgt und könnte durchaus dieser hohen Aufgabe gewachsen sein. eSports-typisch sind die Systemanforderungen sehr mager, womit faktisch jeder Rechner irgendwie noch mit im Spiel ist – besonders deutlich an den Minimim-Anforderungen, welche mit Core 2 Duo E8400 samt Intel HD Graphics 4000 einen jahrealten Office-Rechner mitkommen lassen (die HD Graphics 4000 gab es ab der Ivy-Bridge-Generation). Die weiteren Systemanforderungen sind dann auch nicht wirklich fordernd, High-fps-Gaming soll schon ab Core i5-4460 samt GeForce GTX 1050 Ti möglich sein, auf AMD umgerechnet wären dies wohl mit Ryzen 5 1400 samt Radeon R9 380 erreichbar. Benutzer besserer Hardware dürften ergo kaum Probleme haben, höhere Auflösungen als FullHD anzupeilen – und trotzdem noch jene superhohen Frameraten erreichen können.

offizielle PC-Systemanforderungen zu "Valorant"
Minimum (30 fps) Empfohlen (60 fps) HighEnd (144+ fps)
OS Windows 7 64-Bit, DirectX 11, 9 GB Festplatten-Platzbedarf
CPU Core 2 Duo 8400 Core i3-4150 Core i5-4460
Speicher 4 GB RAM & 1 GB VRAM 4 GB RAM & 1 GB VRAM 4 GB RAM & 1 GB VRAM
Gfx HD Graphics 4000 GeForce GT 730 GeForce GTX 1050 Ti
In unserem Forum wird eine klare Lanze für HBM2-Speicher bei "Big Navi" gebrochen - und dafür aber auch eine Begründung samt weiterer Hintergrund-Informationen geliefert. Dabei liegt beim Navi-21-Chip mit kolportiert 80 Shader-Clustern die Problematik vor allem darin, das die Entscheidung zwischen GDDR6 oder HBM2 im Fall von GDDR6 regulärerweise auf ein 512bittiges GDDR6-Interface hinauslaufen würde - was heutzutage wiederum keiner mehr bauen will, da es (relativ) zu viel Platz auf dem Chip wegnimmt bzw. zu stark ins Power-Budget reinschlägt. Allein die dafür notwendige größere Chipfläche könnte zudem dafür sorgen, das sich die Mehrkosten von HBM wieder etwas reduzieren - und sinngemäß wird die Rechnung noch besser, wenn man das mit HBM erreichbare höhere Performance-Potential (mehr Power-Budget für die Recheneinheiten anstatt das Speicherinterface, größere Speicherbestückung als bei 384 Bit GDDR6 möglich) einbezieht, womit sich das Endprodukt letztlich besser und zu höheren Preisen verkaufen läßt. Gänzlich sicher kann man sich natürlich nicht sein, gerade die Variante mit 80 Shader-Clustern ist grenzwertig: Jene wäre auch noch mit 384 Bit GDDR6 realisierbar - im Gegensatz zu einer höheren Anzahl an Shader-Clustern, welche dann klar zugunsten von HBM2 tendiert.





Chipfläche
Speicherinterface
fixe Chipteile
Recheneinheiten





Navi 10
251mm²
256 Bit GDDR6 = ca. 25% der Chipfläche
ca. 40%
60% der Chipfläche = 40 SM



Navi 21 mit GDDR6
505mm²
384 Bit GDDR6 = ca. 18-20% der Chipfläche
ca. 25%
75% der Chipfläche = 80 SM



Navi 21 mit HBM2
505mm²
2048 Bit HBM2 = ca. 10% der Chipfläche
ca. 15%
85% der Chipfläche = 96 SM



Alles zu Navi 21 notierte stellt reine Annahmen dar.