Top-News

4

Die (vermutlichen) Hardware-Spezifikationen der kompletten "Ampere"-Chipserie

Nachdem sich die früheren Vorhersagen zur Ampere-Hardware durch Twitterer Kopite7kimi nunmehr nach dem GA100-Chip auch beim GA102- sowie beim GA104-Chip bestätigt haben, kann man davon ausgehen, das jene bereits seit Mai 2019 vorliegende Vorhersage auf durchgehend echten Daten beruht. Schließlich stimmen auch die selten beachteten Details wie die 7 Graphics Processing Cluster (GPC) beim GA102-Chips, welche man wegen der ungerade Zahl kaum "freiwillig" vorhersagen würde. Zusammen mit der kürzlichen Klarstellung, wie sich die Shader-Cluster von Gaming-Ampere aufbauen (zuzüglich einer Detail-Infos zu den Ampere-ROPs sowie zu den Tensor-Cores von Ampere), kann man davon ausgehend bereits die komplette "Ampere"-Chipserie in ihren grundsätzlichen Hardware-Spezifikationen erkennen. Nachfolgende Aufstellung ist bezüglich der Ampere-Chips GA107 & GA106 natürlich noch nicht gefeit vor letztendlichen Fehlern, bezüglich GA104 & GA102 kann man sich hingegen nahezu sicher sein, fehlt zumeist nur noch eine hochoffizielle Bestätigung des allerdings bereits offensichtlichen:

GA107 GA106 GA104 GA102 GA100
Raster-Engines (GPC) 2 3 6 7 8
Shader-Cluster (SM) 20 30 48 84 128
FP32-Einh. (CUDA-Cores) 2560 3840 6144 10752 8192
INT32-Einheiten 1280 1920 3072 5376 8192
Textureneinh. (TMUs) 80 120 192 336 512
Tensor-Cores 80 120 192 336 512
RT-Cores möglw. 20 (?) möglw. 30 (?) 48 84
ROPs 32 48 96 112 whrschl. 128
Level2-Cache ? ? 4 MB 6 MB 48 MB
Speicherinterface 128 Bit GDDR6 192 Bit GDDR6 256 Bit GDDR6 384 Bit GDDR6X 6144 Bit HBM2
Grafikkarten GTX/RTX 3040 Serie (?) GTX/RTX 3050 Serie (?) RTX 3060, 3070 & 3070 Ti RTX 3080 & 3090 rein HPC
Release Q1/2021 Q1/2021 Oktober 2020 17. September 2020 14. Mai 2020
Basis: Ampere Hardware-Vorhersage von 'Kopite7kimi' & nVidia-Aussagen zur Ampere-Architektur
3

Wie Gaming-Ampere die verdoppelte Anzahl an Shader-Einheiten erreicht

Mit den Gaming-Lösungen der Ampere-Generation fuhr nVidia bei seinem "GeForce Special Event" schwere Geschütze auf: Mehr als verdoppelte Anzahl an CUDA-Cores (Shader-Einheiten), das 1,7fache an Shader-Rechenkraft samt einer Performance-Projektion von grob dem Doppelten gegenüber Turing. Die vorherigen Annahmen zu Gaming-Ampere lagen zwar bei der Anzahl der gebotenen Shader-Cluster richtig, haben jedoch – bis auf vereinzelte frühere Gerüchte – bis zuletzt jene (mehr als) Verdopplung der FP32-Performance nicht auf dem Plan gehabt. Dabei war es zuerst etwas unklar, wie nVidia dies konkret realisierte: Gerade weil die Tendenz der Grafikchip-Entwickler klar in Richtung kleinerer Shader-Cluster mit (relativ) weniger Recheneinheiten pro Shader-Cluster ging, erschien eine plötzliche Entwicklung in die andere Richtung hin schwer vorstellbar. Genau dies hat nVidia jedoch tatsächlich getan: Die Shader-Cluster (SM) von Ampere tragen laut einer offiziellen nVidia-Aussage auf Reddit nunmehr gleich 128 FP32-Einheiten – anstatt wie bei der vorhergehenden Turing-Generation nur 64 FP32-Einheiten.

The Ampere SM includes new datapath designs for FP32 and INT32 operations. One datapath in each partition consists of 16 FP32 CUDA Cores capable of executing 16 FP32 operations per clock. Another datapath consists of both 16 FP32 CUDA Cores and 16 INT32 Cores. As a result of this new design, each Ampere SM partition is capable of executing either 32 FP32 operations per clock, or 16 FP32 and 16 INT32 operations per clock.
Quelle:  nVidias Tony Tamasi auf Reddit am 2. September 2020

1

GeForce RTX 3060 mit 8 GB, RTX 3070 mit 8/16 GB und RTX 3080 mit 10/20 GB nahezu bestätigt

Twitterer 326powah weisst auf den hochinteressanten Umstand hin, dass sich aus den ganzen Palit-Eintragungen gemäß der gewählten Produktnummern sogar die benutzten Grafikchips sowie Differenzen in den Speichermengen herauslesen lassen. Relevant ist der benutzte Grafikchip speziell bei der GeForce RTX 3060, bei den anderen Ampere-Grafikkarten ist jener dato schon bekannt. Die Angaben erfolgt in der Produktnummer nach dem Bindestrich, beispielsweise zeigt "NE6306T019P2-1041A" auf die Verwendung des GA104-Chip für diese GeForce RTX 3060 hin. Wenn man die anderen Grafikkarten kontrolliert, passt dies auffallend, zur GeForce RTX 3070 wird (wie zu erwarten) ebenfalls der GA104-Chip notiert, zu GeForce RTX 3080 & 3090 (wie zu erwarten) der GA102-Chip. Teilweise finden sich auch andere Notierungen, aber jene zeigen wohl nicht auf andere Grafikchips hin, sondern geben die jeweiligen Grafikboards wieder: "PG132" bei GeForce RTX 3080 & 3090 sowie "PG190" bei der GeForce RTX 3060 – so, wie früher bereits vermeldet.

28

Erste Hardware-Daten von nVidias GeForce RTX 3070, 3080 & 3090 aufgetaucht

Videocardz haben (angebliche) erste Hardware-Daten zu den Ampere-basierten Grafikkarten GeForce RTX 3070, GeForce RTX 3080 und GeForce RTX 3090 aus leider nicht weiter ausgeführten Quellen erhalten. Da hierbei auch eine später allein bei nVidias Boardpartnern (nicht als FE) erscheinende "GeForce RTX 3080 20GB" erwähnt wird, könnten jene Quellen in den Kreisen der Grafikkarten-Hersteller liegen – was wichtig wäre bei der Beurteilung der Taktraten, falls nVidia wie bei der initialen GeForce-20-Serie wieder eine Taktraten-Differenz zwischen Herstellermodellen und seiner eigenen Founders Edition macht. Dies ist für die anstehende GeForce-30-Serie natürlich noch nicht gegeben, eventuell rückt nVidia auch wieder von diesem Modell ab, wie schon beim "SUPER"-Refresh zur GeForce-20-Serie. Zu beachten wäre zu den angebenen Taktraten von GeForce RTX 3080 & 3090 zudem der Punkt, dass nVidias Grafikkarten in der Praxis gewöhnlich klar oberhalb jener Referenzwerte takten, die offizielle Taktraten-Angabe inzwischen kaum noch wertbar und nur schwerlich vergleichbar ist.

GeForce RTX 3070 GeForce RTX 3080 GeForce RTX 3090
Chipbasis GA104 (GA104-300) GA102 (GA102-200) GA102 (GA102-300)
Referenzboard PG142-10 PG132-10 PG132-30
Technik ? SM, 256 Bit GDDR6-Interface 68 SM, 320 Bit GDDR6X-Interface 82 SM, 384 Bit GDDR6X-Interface
Speicher & Takt 8 GB, ?/? MHz, 16 Gbps, 220W TGP 10 oder 20 GB, ?/1710 MHz, 19 Gbps, 320W TGP 24 GB, ?/1695 MHz, 19.5 Gbps, 350W TGP
basierend auf den Ausführungen von Videocardz; Chip-Takt: 1. Base-Clock, 2. Boost-Clock
28

Zen 3 "Milan" kommt laut AMD-Folien mit +15% IPC-Gewinn und +20% insgesamter Mehrperformance

Hardwareluxx haben aus OEM-Kreisen einige AMD-Präsentationsfolien zu den kommenden "Epyc" Server-Prozessoren der Generationen "Zen 3" (Server-Codename "Milan") sowie "Zen 4" (Server-Codename "Genoa") erhalten und zitieren nunmehr daraus, wenngleich die Originale nicht veröffentlich werden können. Zum Teil werden dabei bereits länger bekannte technische Details (Wegfall des CCX, 32 MB Level3-Cache pro CCD) nochmals bestätigt, daneben werden aber auch (von AMD stammende) Performance-Aussagen zu Zen 3 ("Milan") offeriert. Interessanterweise entsprechen die hierbei getroffenenen Performance-Aussagen ziemlich gut einem früheren Leak seitens AdoredTV – welcher seinerzeit natürlich nicht belegt werden konnte, was hiermit also nachgeholt wird. Die neuen Angaben von Hardwareluxx sind dabei etwas detaillierter und es läßt sich anhand der Differenz zwischen IPC und insgesamter Mehrperformance auch herauslesen, wie hoch der Anteil höherer Taktraten (ca. +5%) am "Gesamtwerk" ist.

Zen 3 ("Milan") Performance-Angaben gegenüber Zen 2 ("Rome"):
+15% IPC bei Integer-Workloads
bis zu 32C: +20% Singlethread- sowie +20% Multithread-Mehrperformance
oberhalb von 32C: +10-15% Mehrperformance

Quelle:  bei Hardwareluxx vorliegende AMD-Präsentationsfolien zu Milan & Genoa

27

Gerüchteküche: Aktualisierte TimeSpy-Werte zeigen auf +60% Mehrperformance bei Gaming-Ampere hin

Von Twitterer Kopite7kimi (bislang mit einer exzellenten Trefferquote bezüglich Ampere-basierten Gerüchten aufwartend) kommen aktualisierte Benchmark-Werte zu GeForce RTX 3080 & 3090 unter dem 3DMark13 TimeSpy Extreme. Gemäß der vorherigen TimeSpy-Benchmarks handelt es sich um GPU-Werte, inzwischen wurde nunmehr auch präzisiert, dass die teilnehmenden Ampere-Grafikkarten beiderseits Founders-Edition-Ausführungen darstellen. An den Werten selber ändert sich kaum etwas: Die GeForce RTX 3090 FE wurde zuletzt mit "almost 10000" angegeben, nunmehr sollen es mit "100xx" leicht mehr sein, während die GeForce RTX 3080 FE mit bislang "almost 8600" und nunmehr "85xx" komplett auf Kurs liegt. Die nachfolgende Tabelle wurde zudem um neuere Vergleichswerte der GeForce RTX 2080 Super FE ergänzt – deren Werte gleichzeitig auch einen Hinweis darauf liefern, dass die älteren TimeSpy-Ergebnisse von GeForce RTX 2080 & 2080 Ti nach wie vor korrekt sind: Denn die GeForce RTX 2080 Super liegt im TimeSpy fast exakt dort, wo jene gemäß des 3DCenter UltraHD Performance-Index hingehört, ergo dürfte es hierbei keine beachtbare Performance-Entwicklung über neuere Treiberversionen gegeben haben und diese "alten" TimeSpy-Werte sind somit nach wie vor vergleichbar.

Hardware TimeSpy Extr. (GPU) Quellen 4K Perf.Index
GeForce RTX 3090 FE nVidia Ampere, whrschl. GA102, 82 SM @ 384 Bit GDDR6X 100xx Kopite7kimi ca. 370-380%
GeForce RTX 3080 FE nVidia Ampere, whrschl. GA102, 68 SM @ 320 Bit GDDR6X 85xx Kopite7kimi ca. 310-320%
GeForce RTX 2080 Ti FE nVidia Turing, TU102, 68 SM @ 352 Bit GDDR6 Ø 6333 HWLuxx & OC3D 236%
GeForce RTX 2080 Super FE nVidia Turing, TU104, 48 SM @ 256 Bit GDDR6 Ø 5311 HWLuxx & OC3D 198%
GeForce RTX 2080 FE nVidia Turing, TU104, 46 SM @ 256 Bit GDDR6 Ø 4912 HWLuxx & OC3D 186%
"4K Perf.Index" = 3DCenter UltraHD Performance-Index
26

TSMCs 3nm-Fertigung wird (erneut) keine Performance-Verdopplung ermöglichen

Der Planet 3DNow! und AnandTech berichten zu den technischen Spezifikationen von TSMCs 3nm-Fertigung, welche der derzeit weltweit führende Halbleiter-Fertiger immerhin schon im zweiten Halbjahr 2022 in die Massenfertigung überführen will. Jene soll gegenüber der standardmäßigen 5nm-Fertigung eine Flächenreduktion um -42%, eine Taktraten-Verbesserung um +10-15% sowie eine Stromverbrauchsersparnis von -25-30% bringen (bei Taktrate/Stromverbrauch gilt immer entweder/oder, nicht jedoch gleichzeitig in dieser Höhe). TSMC wird in der Presse dafür ziemlich gelobt, obwohl eigentlich beim Vergleich der Daten zur 5nm-Fertigung auffallen müsste, dass die 3nm-Fertigung einen nochmals kleineren Sprung daherbringt. Wie schon oftmals an dieser Stelle derart genannt, hat TSMC zugunsten der eigenen Roadmap-Durchführung die technischen Fortschritte der jeweiligen NextGen-Fertigungsstufen reduziert – von 3nm zu 5nm ist es eher denn ein "Dreiviertel-Nodesprung" als denn ein üblicher "Fullnode-Sprung".

Massenfertigung Vergleich Flächenbedarf Taktrate Stromverbr.
TSMC N7 laufend N7 vs. N10 > -37% ? < -40%
TSMC N7P laufend N7P vs. N7 ±0 +7% -10%
TSMC N7+ laufend N7+ vs. N7 -17% +10% -15%
TSMC N6 laufend N6 vs. N7 -18% ±0 ±0
TSMC N5 Q2/2020 N5 vs. N7 -45% +15% -30%
TSMC N5P 2021 N5P vs. N5 ±0 +5% -10%
TSMC N4 2021 N4 vs. N5 ? ? ?
TSMC N3 H2/2022 N3 vs. N5 -42% +10-15% -25-30%
26

Gerüchteküche: Ampere-Launch am 21. September mit angeblich +35% Mehrperformance

Von Twitterer Leakbench kommt ein neues Gerücht mit einer Terminangabe sowie einer ungefähren Performance-Richtung zu den kommenden Ampere-Grafikkarten. Danach soll die Founders-Edition-Ausführung am 21. September antreten, die Herstellerdesigns eine Woche später am 28. September kommen. Da es üblicherweise keine zwei Launch-Termine gibt, dürften dies dann Markteinführungs-Termine sein, wobei zum ersteren von beiden dann auch der offizielle Launch mit den Launchreviews der Hardwaretester stattfindet (nVidias GeForce-Event am 1. September wird wie bekannt nur eine Ankündigung-Show). Auf welche Karte sich diese Terminlage dann bezieht, wurde allerdings nicht genannt: Sicherlich ist hierbei die GeForce RTX 3080 dabei, eventuell zeitgleich mit der GeForce RTX 3090 – dies bleibt abzuwarten. Normalerweise versucht nVidia seine Launches etwas zu strecken, dabei nur eine Karte pro Launch zu bringen – aber es gibt auch Gegenbeispiele, wie den seinerzeitigen Launch von GeForce RTX 2080 & 2080 Ti am selben Tag.

Ampere latest
21/09/2020 – FE
28/09/2020 – AIB
35% perf increase
 

Quelle:  Leakbench @ Twitter am 25. August 2020

21

Gerüchteküche: GeForce RTX 3090 gezeigt, Preislagen der Ampere-Modelle von 3060 bis 3090 genannt

Vom (bislang allerdings noch nicht aufgefallenen) Twitterer GarnetSunset (via Videocardz) kommt das Bild einer angeblichen GeForce RTX 3090, samt auch dem Größenvergleich zur direkt danebengelegten GeForce RTX 2080. Dies war auch notwendig, denn ansonsten hätte man schwerer erfassen können, was für ein "Riesel-Eumel" jene GeForce RTX 3090 doch ist. Der Kartenname zeigt sich zwar nicht anhand der abgebildeten Karte, wurde jedoch vom Twitterer derart genannt und ergibt sich letztlich auch allein anhand der Kartengröße. Jene belegt in der Breite ca. 32cm, geht in der Höhe ca. 3cm über die Oberkante des Slotblechs hinaus (problematisch für Mini-Gehäuse) und ist augenscheinlich gleich drei Slots dick (die Größenwerte sind wegen der Perspektivenverzerrung des Bilds nicht besonders genau zu nehmen). Gegenüber jener wahrhaftigen "BFGPU" sieht die GeForce RTX 2080 dann schon fast wie eine "Baby-Grafikkarte" aus.

14

Micron bestätigt GDDR6X-Speicher mit bis zu 21 Gbps - samt dessen Einsatz bei der GeForce RTX 3090

Videocardz haben in einem erst auf diesen August datierten Micron-Dokument eine klare Bestätigung für die Existenz von GDDR6X-Speicher und deren Einsatz bei kommenden Ampere-basierten Grafikkarten gefunden. Selbiger Speichertyp geistert seit einigen Wochen durch die Gerüchteküche, konnte jedoch mangels JEDEC-Spezifikation bislang nie für gänzlich voll genommen werden – was sich nunmehr erledigt, da sowohl die Existenz als auch der konkrete Einsatz bestätigt wurde. Allerdings könnte es sich in der Tat um eine "Marketing-Norm" seitens Speicherchip-Hersteller Micron handeln, womit schlicht besonders hoch getakteter GDDR6-Speicher im Verkauf als "GDDR6X" gelabelt wird. Denn aus den vorliegenden Daten ist keinerlei technischer Unterschied zum normalen GDDR6 zu erkennen – außer wie gesagt den höheren Bandbreiten, welche allerdings für einen Generation-Sprung (üblicherweise Verdopplung) doch noch zu niedrig liegen.

Inhalt abgleichen