17

Hardware- und Nachrichten-Links des 16./17. Mai 2020

Laut Twitterer Kopite7kimi (wie bekannt mit hoher Trefferquote bei der Erstmeldung zum "SUPER"-Refresh sowie bei den Spezifikationen des GA100-Chips) wurde der Tape-Out des GA104-Chips absolviert – wobei natürlich nicht klar ist, wann konkret dies passiert ist, die Information selber könnte jederzeit erst einmal ein paar Wochen bis zu deren Aufdeckung gebraucht haben. Gleichfalls soll der GA103-Chip möglicherweise gestrichen sein – was aber Kopite7kimi höchstselbst unter jenen Möglichkeits-Vorbehalt gestellt hat. Denkbar ist an dieser Stelle, das sich Kopite7kimi nur wundert, wieso nach dem GA102 gleich der GA104 kommt und der GA103-Chips somit (erst einmal) ausgelassen wird. Die Tape-Out-Pläne bei nVidia müssen aber nicht wirklich in Reihenfolge der Chipnamen abgearbeitet werden, ergo ist das ganze keine wirklich sichere Information. Tatsächlich undenkbar ist die Streichung des GA103-Chips aber natürlich überhaupt nicht, denn zwischen GA104 & GA103 besteht nur eine vergleichsweise geringe Hardware-Differenz (+25% bei Shader-Clustern & Speicherinterface) – was man üblicherweise eher mittels Salvage-Lösungen überbrückt.

GA104 has been taped out. GA103 may be cancelled.
Quelle:  Kopite7kimi @ Twitter am 14. Mai 2020

16

USA versuchen Chip-Lieferungen an Huawei per neuer Export-Beschränkungen zu unterbinden

Golem und CNBC machen auf eine gewichtige Exkalation des US/China-Handelskriegs bzw. des US-Embargos gegenüber Huawei aufmerksam, welche an diesem Freitag in Kraft getreten ist. Danach hat das US-Handelsministerium nunmehr seine früheren Pläne in die Tat umgesetzt und (mit einer Karenzzeit von 120 Tagen für bereits in Fertigung befindliche Produkte) alle Chipfertigung sowie die Ausrüstung zur Chipfertigung unter Export-Beschränkungen gestellt. Somit benötigen Unternehmen, welche die herauskommenden Produkte (Chips) dann an Huawei oder ein Huawei-Tochterunternehmen liefern wollen, nach der Karenzzeit eine entsprechende Lizenz des US-Handelsministeriums. Mittels dieses Druckmittels sind primär den US-Chipfertigungsausrüstern Applied Materials und Lam Research sowie dem US-Halbleiterfertiger Intel zukünftig die Hände gebunden, wenn man an Huawei liefern wollte. Gleichfalls betrifft diese Anordnung aber auch weltweit alle Chipfertiger, welche Chipfertigungs-Anlagen von (jeglichen) US-Herstellern einsetzen – ist aber natürlich primär auf den taiwanesischen Auftragfertiger TSMC gemünzt, wo Huawei massiv fertigen läßt.

15

Hardware- und Nachrichten-Links des 14./15. Mai 2020

Bei Reddit wird derzeit ein seitens des bekannten Leakers 'Ice Universe' verbreitetes Gerücht zur Performance-Situation von Zen 3 bzw. Ryzen 4000 stark beachtet. Die originale Aussage kommt wohl aus einem chinesischen Chat und wurde möglicherweise auch nur maschinell übersetzt – darauf deutet die Verwendung des Begriffs "Ruilong" hin, was der direkten chinesischen Übersetzung von "Ryzen" entspricht. Nichtsdestotrotz läßt sich erkennen, das Zen 3 in den von AMD selber angestellten Tests wohl oberhalb der eigenen Erwartungen herauskommt und somit Intel sowohl bei Performance als auch Stromverbrauch schlagen können soll. Dies ist allerdings angesichts der von Intel aufgestellten Gegenangebote keine ganz besonders hohe Hürde, da derzeit eigentlich kaum jemand erwartet, das Intels neue Comet-Lake-Prozessoren sich überhaupt erfolgreich mit Zen 2 anlegen können (bezogen auf die Leistungsspitze) und vom nachfolgenden Rocket Lake wegen der Limitierung auf acht CPU-Kerne auch keine Wunderdinge zu erwarten sind.

Some gossip about the Zen 3 architecture Ruilong 4000 series.
 
Internal rumors from engineers of two well-known PC manufacturers indicate that the performance of the current Zen3 architecture samples has risen to an alarming degree.
 
Based on the Intel product information currently owned by the two companies, AMD's new Ryzen 4th generation will outperform Intel in terms of performance and power consumption.
 
It is said that in the test, the theorectical performance higher than that claimed by AMD can be felt. The IPC improvement of Zen 3 theory is about 15% – 17%. According to engineers, the actual performance of the sample may exceed this.

Quelle:  'Ice Universe', festgehalten bei Reddit am 14. Mai 2020

14

nVidia stellt den "GA100"-Chip der Ampere-Generation mit 8192 Shader-Einheiten an einem 6144 Bit HBM2-Interface vor

Mit einer Serie von 12 Videos hat nVidia seine für die abgesagte GTC im März angesetzte GTC-Keynote in Form der Vorstellung erster Ampere-basierter Produkte nachgeholt. Wie zu erwarten, hat sich nVidia dabei ausschließlich um professionelle Anwendungen, primär im HPC-Bereich gelegen, gekümmert – allerdings wird Ampere nachfolgend auch in den Gaming-Bereich gehen, spätere Ampere-Chips also auch GeForce-Grafikkarten befeuern, wie Videocardz auf Basis einer nVidia-Aussage notieren. Doch selbst aus reiner Architektur-Sicht war die Vorstellung ziemlich mager, denn nVidia hat faktisch nur konkrete Profi-Produkte vorgestellt, weder die Architektur wirklich ausgeblättert noch den ersten Ampere-Grafikchip "GA100" selber (innerhalb der Video-Serie) irgendwie betrachtet. Somit kann man derzeit nur von der HPC-Lösung "A100" sowie den offiziellen Blockdiagrammen auf die Daten des zugrundeliegenden GA100-Chips schlußfolgern – was zumindest einen ersten Überblick zum GA100-Chip erlaubt.

    nVidia "GA100"

  • 54 Mrd. Transistoren auf 826mm² in der 7nm-Fertigung von TSMC (N7)
  • nVidia Ampere-Architektur (mit Ausrichtung auf den HPC-Einsatz)
  • 8 Raster-Engines (Graphics Processing Cluster, GPC) mit jeweils 16 Shader-Clustern (Streaming Multiprocessor, SM), insgesamt also 128 Shader-Cluster
  • jeder Shader-Cluster enthält 64 Shader-Einheiten samt 4 Texturen-Einheiten (Texture Mapping Unit, TMU) und 4 Tensor-Cores
  • jene Tensor-Cores basieren auf der 3. Tensor-Generation, welche neue Datenformate beherrscht und drastisch leistungsstärker ist
  • ergibt insgesamt 8192 Shader-Einheiten, 512 Texturen-Einheiten und 512 Tensor-Cores in der Maximal-Konfiguration
  • es gibt weiterhin wohl keine expliziten RayTracing-Einheiten beim GA100-Chip, womit jener kaum zum Gaming-Einsatz taugt
  • 48 MB Level2-Cache
  • 6144 Bit HBM2-Speicherinterface, maximale Speicherbandbreite 1,9 TByte/sec (~1250 MHz Speichertakt)
  • PCI Express 4.0 & 12x NVLink (3. NVLink-Generation)
14

Modell-Spezifikationen von Desktop-"Renoir" (Ryzen 4000G) aufgetaucht

Von Igor's Lab kommt ein feiner Leak mit den Spezifikationen von Desktop-Renoir, der später mal als "Ryzen 4000G" verkauft werden dürfte. Hierbei gibt es noch keine konkreten Modellnamen, sondern nur AMDs OPN-Nummern, aber dafür sind die jeweiligen technischen Spezifikationen schon nahezu vollständig ausgebreitet. AMD legt demnach jeweils zwei Vierkerner, zwei Sechskerner und zwei Achtkerner auf, wobei sich selbige nicht nur bei den Taktraten, sondern auch bei den TDPs unterscheiden – im genauen übernehmen die bisherigen LowPower-Modelle mit 35 Watt TDP die Rolle der jeweils taktschwächeren Versionen. Jenes Unterscheidungsmerkmal macht wohl mehr Sinn als Taktraten-Differenzen, welche im Zeitalter automatisch hochtaktender Boostsysteme in der Praxis jene nominellen Differenzen sowieso mehr verwischen als betonen. Sobald sich die Mainboards an AMDs TDP-Vorgaben halten (was im Gegensatz zu Intel derzeit der Fall ist), wird der Performance-Unterschied zwischen jeweils kleinerem und größerem Modell dann durch das TDP-Limit erzeugt werden, welches bei den 35W-Modellen wesentlich harscher herangehen dürfte als bei den 65W-Modellen.

Ryzen 4000G OPNs Kerne Takt L2+L3 iGPU TDP möglicher Name
100-000000145 & 100-000000146 8C/16T 3.6/4.45 GHz 4+8 MB Vega 8 @ ≤ 2.1 GHz 65W "Ryzen 7 4700G"
100-000000149 & 100-000000152 8C/16T 3.1/4.35 GHz 4+8 MB Vega 8 @ ≤ 2.0 GHz 35W "Ryzen 7 4700GE"
100-000000143 & 100-000000147 6C/12T 3.7/4.3 GHz 3+8 MB Vega 7 @ ≤ 1.9 GHz 65W "Ryzen 5 4500G"
100-000000150 & 100-000000153 6C/12T 3.3/4.25 GHz 3+8 MB Vega 7 @ ≤ 1.9 GHz 35W "Ryzen 5 4500GE"
100-000000144 & 100-000000148 4C/8T 3.8/4.1 GHz 2+4 MB Vega 6 @ ≤ 1.7 GHz 65W "Ryzen 3 4300G"
100-000000151 & 100-000000154 4C/8T 3.5/4.1 GHz 2+4 MB Vega 6 @ ≤ 1.7 GHz 35W "Ryzen 3 4300GE"
wichtige Anmerkung: Die Angaben zum maximalen Boost-Takt sind derzeit noch unsicher.
Alle Renoir-basierten Desktop-Prozessoren kommen im Sockel AM4 daher und unterstützen (offiziell) maximal DDR4/3200-Speicher.
13

Hardware- und Nachrichten-Links des 13. Mai 2020

Leaker 'Sharkbay' hat im PC_Shopping-Board Details über PL1, PL2 & Tau von Rocket Lake-S (RKL-S) von sich gegeben. Dabei zeigen die bis zu drei offerierten Werte für PL2 wohl auf die jeweilige Kern-Anzahl in der ersten Spalte hin, wie dankenswerterweise unser Forum dem im Tiefschlaf befindlichen 3DC-Redakteur beibrachte. Diese Auslegung zeigt dann auf eine vergleichsweise sehr hohe Differenz zwischen PL1 (TDP) und PL2 bei der Rocket-Lake-Generation hin – trotz das es dort maximal 8 CPU-Kerne (auf Basis der neuen "Willow Cove" CPU-Kerne) geben wird. Aber darin liegt ja wahrscheinlich die ganze Crux von Intels derzeitigen Prozessoren-Anstrengungen: Die neuen CPU-Kerne der Cove-Linie kommen nicht gut auf Taktrate, was insbesondere für den Desktop-Bereich mit seinem faktischen Zwang zu hohen Taktraten ziemlich ungünstig ist. Um trotzdem die für den Desktop-Einsatz notwenigen Taktraten zu erreichen, muß dann augenscheinlich deutlich mehr Strom zugeführt werden, wenn es oberhalb den Basetakt gehen soll (PL1 bzw. die TDP bezieht sich bei Intel allein auf den Basetakt).

12

Hardware- und Nachrichten-Links des 12. Mai 2020

Videocardz haben einen Vorab-Test zum Core i5-10400 aus Intels Comet-Lake-Generation gesichert, welcher aus dem Chiphell-Forum stammt, dort aber inzwischen schon wieder entschwunden ist. Der Sechskerner mit HyperThreading wurde dabei zielgerecht gegen seinen direkten Vorgänger in Form des Core i5-9400F getestet, die Differenzen liegen demzufolge im hinzukommenden HyperThreading samt etwas mehr Level3-Cache und etwas mehr Taktrate. Leider hat man in dieser günstigen Vergleichs-Situation nur recht wenige wirklich voneinander abweichende Benchmarks angestellt – es bleiben letztlich nur zwei wertbare Messungen unter CPU-Z und Cinebench übrig, welche natürlich eher denn den Bestcase abbilden. Wie auch schon beim vorangegangenen Test des Core i5-10400 zeigt sich hierbei ein vergleichsweise hoher Performancegewinn im Bereich von grob +40%, welcher primär auf das Konto der Hinzunahme von HyperThreading gehen dürfte.

Core i5-9400F Core i5-10400
Technik Coffee Lake, 6C/6T, 2.9/4.1 GHz, 1.5+9 MB L2/L3, 65W TDP, 157$ Comet Lake, 6C/12T, 2.9/4.3 GHz, 1.5+12 MB L2/L3, 65W TDP, 182$ (F-Modell 157$)
CPU-Z 17.01.64 (ST/MT) 467,5   /   2627,1 488,0   /   3652,7     (+4,4%/+39,0%)
Cinebench R20 (ST/MT) 410   /   2246 438   /   3186     (+6,8%/+41,9%)
gemäß der Ausführungen auf Chiphell, gesichert durch Videocardz
11

Hardware- und Nachrichten-Links des 11. Mai 2020

Das neueste, viel beachtete YouTube-Video von 'Moore's Law Is Dead' verspricht einen "vollen Leak" zur (Ampere-basierten) GeForce RTX 3080 Ti, stellt aber im wesentlichen eine Ansammlung und Auswertung der vorhandenen Gerüchte dar – und damit eher keinen eigenständigen "Leak". Insbesondere bei den Hardware-Daten zu jener GeForce RTX 3080 Ti stützt man sich maßgeblich auf den (angeblichen) Leak von Twitterer 'CorgiKitty', welcherer allerdings wahrscheinlich auch nur das wiedergibt, was Twitterer 'Kopite7kimi' bereits vorher genannt hatte. Jene Daten geben derzeit allerdings "nur" die Spezifikationen der jeweils zugrundeliegenden Ampere-Grafikchips wieder – woraus man nur ungenau auf die darauf basierenden GeForce-30-Grafikkarten schließen kann, denn nVidia könnte aus Salvage-Gründen (oder auch zugunsten eines nachfolgenden Refreshs) anfänglich nicht mit der vollen Hardware der jeweiligen Grafikchips antreten. Zumindest bei den größten Grafikchips (wie dem GA102) erscheint dies als fast sicher, so dass eine GeForce RTX 3080 Ti kaum die vollen 84 Shader-Cluster des GA102-Chips tragen wird – denkbar sind beispielsweise 80 Shader-Cluster (5120 Shader-Einheiten).

Chip Chip-Technik (mögliche) Grafikkarten
GA102 84 Shader-Cluster @ 384 Bit GDDR6 GeForce RTX 3080 Ti oder GeForce RTX 3090
GA103 60 Shader-Cluster @ 320 Bit GDDR6 GeForce RTX 3080
GA104 48 Shader-Cluster @ 256 Bit GDDR6 GeForce RTX 3070
GA106 30 Shader-Cluster @ 192 Bit GDDR6 GeForce RTX 3060
GA107 20 Shader-Cluster @ 128 Bit GDDR6 GeForce RTX 3050
technische Angaben basierend auf den Ausführungen von Kopite7kimi @ Twitter vom 21. Mai 2019
die zugeordneten Grafikkarten stellen eine eigene Annahme dar
10

Hardware- und Nachrichten-Links des 9./10. Mai 2020

Gemäß Twitterer Komachi kommt Intels erste Grafiklösung "DG1" nicht für den Desktop – sondern nur ins Mobile-Segment und dort wohl nur direkt aufgelötet aufs Mainboard. Die derzeit herumschwirrenden Desktop-Lösungen sind schlicht Teil des SDV-Programms ("Software Development Vehicle") und dienen allein dazu, damit sich Softwareentwickler mit der neuen Hardware vertraut machen können. Jene Information stammt aus einer Präsentation (PDF, Seite 7) des Argonne National Laboratory zu deren Supercomputer "Aurora" und dürfte im Original (wie die anderen Intel-bezogenen PDF-Seiten) direkt von Intel stammen, ist ergo als vergleichsweis sicher anzusehen. Gänzlich überraschend kommt das ganze dann schließlich auch nicht, denn die DG1-Generation wird auf 768 Shader-Einheiten (96 EUs) limitiert sein – womit man im Desktop-Segment unterhalb heutiger Einsteiger-Lösungen unterwegs wäre, mit klar weniger Performance als bei GeForce GTX 1650 und Radeon RX 570. Mit einer solch schwachen Lösung den Einstieg in das (kritisch beäugte) Desktop-Segment zu wagen, erschien immer etwas seltsam, weil damit kaum etwas zu gewinnen ist – selbst eine erstklassige DG1-Karte im Desktop würde aufgrund ihrer arg niedrigen Performance-Ansetzung keinerlei Run auf Intel-Hardware auslösen.

8

Hardware- und Nachrichten-Links des 8. Mai 2020

Vor gut zwei Monaten gab es einen angeblichen/vermeintlichen Leak von Ampere-Spezifikationen, welcher die einzelnen Ampere-Chips von GA102 bis GA107 schon ganz gut umrissen hatte. Leider gab es seinerzeit keine Quellenangabe seitens Twitterer CorgiKitty und damit keine Gewähr auf die Korrektheit dieser Daten. Wie sich inzwischen herausstellt, könnten jene Ampere-Daten jedoch gut aus einem älteren Tweet seitens Twitterer Kopite7kimi stammen, welcher in der Vergangenheit mehrfach mittels korrekter Erst-Informationen aufgefallen ist und sein diesbezügliches Posting (was zwischenzeitlich immer mal wieder nur eingeloggten Twitter-Nutzern zugänglich war) bereits im Mai 2019 (!) abgesetzt hatte. Bis auf die Angaben zu Speichermengen (welche sich aus den genannten Bus-Breiten ergeben) sowie den wahrscheinlich eigenangestellten Performance-Abschätzungen stimmen die Ampere-Daten von CorgiKitty exakt mit jenen Angaben von Kopite7kimi aus dem vorjährigen Mai überein. Entweder liegt hiermit eine der seltenen unabhängigen Bestätigungen vor – ob aber die Ampere-Daten von CorgiKitty basierten schlicht auf jenem älteren Tweet seitens Kopite7kimi. Dabei spricht der Detailgrad der Daten von Kopite7kimi dafür, das es sich hierbei eher denn um einen Leak als denn um wohlfeile Annahmen handelt – weil spekulative Daten sich normalerweise nicht mit Details wie GPCs & TPCs beschäftigen, sondern nur die Anzahl der Shader-Cluster (SM) nennen:

Original-Aussage von Kopite7kimi spätere Anmerkung = Hardware-Konfiguration
GA100 TSMC 7EUV, 8GPC*8TPC*2SM 6144bit - 128 SM @ 6144 Bit HBM2
GA101 TSMC 7EUV, 4GPC*8TPC*2SM 3072bit Chip gestrichen 64 SM @ 3072 Bit HBM2
GA102 Samsung 8EUV, 7GPC*6TPC*2SM 384bit, NVLink realisiert in Samsung 10nm 84 SM @ 384 Bit GDDR6
GA103 Samsung 8EUV, 6GPC*5TPC*2SM 320bit - 60 SM @ 320 Bit GDDR6
GA104 Samsung 8EUV, 6GPC*4TPC*2SM 256bit - 48 SM @ 256 Bit GDDR6
GA106 Samsung 8EUV, 3GPC*5TPC*2SM 192bit - 30 SM @ 192 Bit GDDR6
GA107 Samsung 8EUV, 2GPC*5TPC*2SM 128bit - 20 SM @ 128 Bit GDDR6
GPC = Graphics Processing Clusters, TPC = Texture Processing Clusters, SM = Streaming Multiprocessors
basierend auf den Ausführungen von Kopite7kimi @ Twitter vom 21. Mai 2019 (samt späteren Anmerkungen)
Inhalt abgleichen