12

Gerüchteküche: Angeblich allererste technische Daten zu nVidias Ampere-Generation

Aus unserem Forum kommen augenscheinlich die ersten Technik-Informationen zu nVidias nachfolgender Ampere-Generation, für welche nVidia wie bekannt auf die Einsatzfähigkeit der 7nm-Fertigung mit EUV-Einsatz wartet. "Ampere" wurde zwar anno 2018 schon einmal gerüchteweise genannt, damals basierte diese Nennung jedoch auf einem Namens-Mißverständnis – die seinerzeit von nVidia geplante und dann im Spätsommer in den Markt entlassene Grafikkarten-Generation war dann letztlich "Turing". Jetzt steht nun wirklich die Ampere-Generation an – zu welcher man bislang aber fast noch gar nichts griffiges außer denn offensichtlichen Vermutungen wie eine gesteigerte RayTracing-Performance vorliegen hat. Die jetzt aufgetauchten Gerüchte geben hingegen erstmals gewisse technologische Ansätze her, wenngleich die Quelle natürlich vergleichsweise neu ist und das ganze komplett unbelegt daherkommt. Ausgangspunkt hierfür sind verschiedene Postings des Twitter-Users 'Kopite7Kimi' mit diversen Ausführungen zur Ampere-Generation, welche vor deren Löschung von unserem aufmerksamen Forum gesichert werden konnten:

nVidia Ampere HPC
sichere Infos:         GA100-Chip mit 6144 Bit HBM2-Interface, doppelte Anzahl Tensor-Cores per Shader-Cluster
sichere Infos:         GA101-Chip als halber GA100-Chip mit 3072 Bit HBM2-Interface (angeblich kürzlich gecancelt)
unsichere Infos:     GA100-Chip mit 8 GPC mit jeweils 8 TPC = 8192 Shader-Einheiten, beide HPC-Chips unter 7nm+ TSMC (mit EUV)
nVidia Ampere Gaming
unsichere Infos:     insgesamt 5 Chips, allesamt unter 7nm Samsung (mit EUV)
Quelle:  Twitter-User 'Kopite7Kimi', Original-Postings inzwischen gelöscht, sinngemäße Kopien im 3DCenter-Forum gesichert

Jener Twitter-User ist bislang nicht großartig in Erscheinung getreten, scheint aber tatsächlich echte Quellen zu besitzen – wie einige dort genannte sehr frühzeitige Informationen zu nVidias "SUPER"-Serie belegen. Damit hört es dann aber auch schon auf bei der Plusseite – das ganze ist und bleibt ein Gerücht aus ziemlich unsicherer Ecke, und verdient damit wahrscheinlich wie kaum ein Posting zuvor das im Meldungs-Titel mitgegebene Siegel "Gerüchteküche". Andererseits kann so etwas durchaus als Diskussionsanker dienen – falls es nicht korrekt ist, wird sich dies früher oder später herausstellen, falls doch, dann sind diese Daten hiermit zum ersten Mal dokumentiert und zur Diskussion gestellt. Zudem wird auch nichts wirklich abseitiges oder unmöglich erreichbares versprochen – im eigentlichen konnte man vieles von dem genannten spekulativ bereits erraten. Dazu gehört beispielsweise die aufgeteilte Fertigung zwischen TSMC (HPC-Chips) und Samsung (Gaming-Chips), welche sich aus diversen nVidia-Aussagen, bei der 7nm-Generation beide Chipfertiger zu bemühen, schon mehr oder weniger deutlich ergeben hatte.

Auch der größere HPC-Chip "GA100" mit 8192 Shader-Einheiten an einem 6144 Bit HBM2-Interface würde mit diesen Daten nicht wirklich unerwartet groß ausfallen – gegenüber dem bisherigen GV100-Chip der Volta-Generation (5376 Shader-Einheiten an einem 4096 Bit HBM2-Interface) ist dies nicht einmal eine glatte Verdopplung. Dies muß natürlich je nach Aufgabenstellung auch nicht sein, nVidia verbaut ja augenscheinlich (zumindest bei diesem HPC-Chip) dann die doppelte Anzahl an Tensor-Cores, ergo sind es wohl gleich satte 2048 Stück davon beim GA100-Chip – und damit glatt das Dreifache gegenüber dem GV100-Chip (672 Tensor-Cores im Vollausbau). Die 8192 Shader-Einheiten wurden möglicherweise im originalen Gerücht nicht direkt genannt (läßt sich nun nicht mehr rekonstruieren), jene Anzahl ergibt sich allerdings aus den genannten 8 GPC (Graphics Processing Cluster), welche jeweils 8 TPC (Texture Processing Cluster) tragen sollen – womit für den gesamten Chip ergo 512 Textureneinheiten zur Verfügung stehen dürften. Sofern nVidia das SE/TMU-Verhältnis von bisher 16:1 nicht verändert hat, ergeben jene 512 Textureneinheiten folgerichtig die genannten 8192 Shader-Einheiten.

    nVidia GA100

  • HPC/Profi-Lösung der Ampere-Generation
  • 8 Raster-Engines (Graphics Processing Cluster, GPC) mit jeweils 16 Shader-Cluster (Streaming Multiprocessor, SM) samt jeweils 8 Texturen-Cluster (Texture Processing Cluster, TPC)
  • jeder Shader-Cluster enthält höchstwahrscheinlich (wie bisher) 64 Shader-Einheiten (CUDA Cores, CU) samt 4 Texturen-Einheiten (Texture Mapping Unit, TMU), aber gleich 16 Tensor-Cores (verdoppelt gegenüber Ampere)
  • ergibt insgesamt 128 Shader-Cluster, welche insgesamt 8192 Shader-Einheiten, 512 Texturen-Einheiten und 2048 Tensor-Cores enthalten
  • PCI Express 4.0 (eigene Annahme, aber wahrscheinlich)
  • 7nm+ (EUV) Fertigung von TSMC
  • Release irgendwann im Jahr 2020

Jeglich andere Rechnungen (mit anderen Verhältnissen von TMU/TPC und SE/TMU) ergeben keinen Sinn, denn über das angegebene Verhältnis von GPCs zu TPCs sind nur gewisse Werte zu erreichen – was auf die einfache Entscheidung zwischen 4096, 8192 oder 16384 Shader-Einheiten hinausläuft. Mit 4096 Shader-Einheiten wäre dieser NextGen-Chip jedoch zu klein, mit 16384 Shader-Einheiten viel zu groß – ergo kann es auf Basis dieser Ausgangslage fast gar nichts anderes als 8192 Shader-Einheiten sein. Das dazu angegebene Speicherinterface mit 6 HBM-Stacks und somit 6144 Bit Interface-Breite (im Forums-Posting fälschlicherweise als "6072 Bit" genannt, aber dies funktioniert angesichts dem grundsätzlichen Aufbau von HBM-Speicherinterfaces auf der Basis von Vielfachen von 1024 Bit natürlich nicht) passt dazu sicherlich sehr gut, hier gibt es letztlich 52% mehr Shader-Einheiten samt ein um +50% breiteres Speicherinterface gegenüber dem GV100-Chip der Volta-Generation. Weitere Verbesserungen an Taktraten und internem Aufbau sind natürlich zu vermuten und könnten das insgesamte Performanceplus im HPC-Bereich durchaus auf grob das Doppelte hochhieven – im Idealfall und aus heutiger Sicht natürlich rein spekulativ.

Soweit zum GA100-Chip als für den HPC-Einsatz vorgesehenen Spitzen-Chip des Ampere-Portfolios. Jenem sollte wohl noch ein zweiter HPC-Chip in Form des GA101 folgen, welcher allerdings kürzlich angeblich gestrichen wurde. Als glatte Halbierung des GA100 dürfte der GA101 aber sowieso kaum großartig Beachtung finden – und wahrscheinlich selbst bei Erscheinen zu klein angelegt sein, um im Gaming-Segment eine neue Spitzen-Lösung zu ergeben. Dafür ist dann durchaus eine größere Hardware-Power als mit 4096 Shader-Einheiten erreichbar vonnöten, der aktuelle TU102-Chip der Turing-Generation bringt immerhin schon 4608 Shader-Einheiten daher. Gemessen an dem, wie nVidia die bisherigen Abstufungen zwischen HPC- und Gaming-Segment gehandbabt hat, könnte man den größten Gaming-Chip von Ampere ("GA102") somit auf 6000-7000 Shader-Einheiten schätzen. nVidia könnte sicherlich sogar dieselbe Anzahl an Shader-Einheiten wie beim GA100 ansetzen, aber dies dürfte wohl auf die Taktrate und damit die Effektivität schlagen – deswegen gab es zuletzt bei nVidia regelmäßig ein Modell mit etwas geringerer Anzahl an Shader-Einheiten und dafür höheren Taktraten beim größten Gaming-Chip zu sehen.

Segment mögliche Grafikkarten Technik Vorgänger-Chip
GA100  (alt. "AM100") HPC Tesla & Titan 8192 SE @ 6144 Bit HBM2 GV100: 5376 SE @ 4096 Bit HBM2
GA101  (alt. "AM101") HPC Tesla & Titan 4096 SE @ 3072 Bit HBM2 -
GA102  (alt. "AM102") Enthusiast GeForce RTX 3080 Ti ca. 6000-7000 Shader-Einheiten TU102: 4608 SE @ 384 Bit GDDR6
GA104  (alt. "AM104") HighEnd GeForce RTX 3070 & 3080 ca. 4000-5000 Shader-Einheiten TU104: 3072 SE @ 256 Bit GDDR6
GA106  (alt. "AM106") Midrange GeForce RTX 3060 ca. 2500-3000 Shader-Einheiten TU106: 2304 SE @ 256 Bit GDDR6  &  TU116: 1536 SE @ 192 Bit GDDR6
GA107  (alt. "AM107") Mainstream GeForce RTX/GTX 3050 ca. 1500-1800 Shader-Einheiten TU117: 1024 SE @ 128 Bit GDDR5
GA108  (alt. "AM108") LowCost GeForce RTX/GTX 3040 ca. 1000 Shader-Einheiten -
Die Angaben dieser Tabelle zu Ampere-Chips sind voll spekulativ.

Den Rest der Gilde an (angeblich 5) Gaming-Chips kann man darauf basierend schon grob einordnen – wobei Chip-Namen, Chip-Zuordnung und deren Hardware-Daten derzeit rein spekulativ sind, allenfalls einen Ansatzpunkt für weitere Denkansätze liefern können. Sollte nVidias Ampere-Portfolio halbwegs ähnlich (wie vorstehend skizziert) erscheinen, würde nVidia somit in jedem Marktsegment zwischen 30-70% mehr Shader-Einheiten aufbieten. Hinzu kommt noch eine grundsätzliche Steigerung der Tensor-Cores um das Doppelte, bei einem Grafikchip mit angenommen +50% mehr Shader-Einheiten gäbe es dann also gleich +200% mehr Tensor-Cores. Abzuwarten bleibt noch, wie dies bei den RayTracing-Einheiten unter Ampere läuft – aber man kann sicherlich spekulieren, das nVidia hierbei sicherlich mindestens den gleichen Entwicklungsfortschritt wie bei den Tensor-Cores vorlegen will. Damit würden RayTracing- wie auch Tensor-Cores unter der Ampere-Generation weiterhin an Gewicht gewinnen bzw. an relativ belegter Chipfläche zulegen – was ja letztlich aufgrund nVidias Zielsetzung der Vorantreibung der RayTracing-Idee nicht anders zu erwarten ist.

Treffen all diese Vorhersagen & Annahmen halbwegs zu, gibt es mit der Ampere-Generation voraussichtlich ein reguläres Performance-Plus von (im Schnitt) +50% bis +70%, bei der RayTracing-Performance allerdings eher +100% bis +150%. In letzterem Punkt könnte eventuell noch mehr drin sein – dies hängt an der Steigerung der RayTracing-Einheiten, welcher als wesentlicher Punkt der Hardware-Spezifikationen nicht genannt wurde. In jedem Fall läuft es allerdings darauf hinaus, das trotz vielleicht "nur" einem Plus von 30-70% bei den Shader-Einheiten aufgrund der stärker steigenden Aufwendungen für Tensor- und RayTracing-Cores trotzdem nahezu eine Verdopplung der Transistoren-Anzahl erwartet werden kann – was früheren großen Generations-Sprüngen entspricht. nVidia wird aber eben im RayTracing-Zeitalter nicht mehr das komplette Transistoren-Budget der Steigerung der regulären Performance zuweisen, sondern immer größere Teile davon dediziert nur für die Steigerung der RayTracing-Performance ansetzen. Und dies macht angesichts der zu Weihnachten 2020 anstehenden NextGen-Konsolen, von welchem man einen erheblichen Schub zugunsten von RayTracing erwarten darf, sicherlich Sinn. Leider weiterhin nicht neues kann man dagegen zur Terminlage von nVidias Ampere-Generation sagen – irgendwann im Jahr 2020 wird jene sicherlich starten, aber genauer ist dies immer noch nicht zu ermessen.

Aus unserem Forum kommen augenscheinlich die ersten Technik-Informationen zu nVidias nachfolgender Ampere-Generation, für welche nVidia wie bekannt auf die Einsatzfähigkeit der 7nm-Fertigung mit EUV-Einsatz wartet. "Ampere" wurde zwar anno 2018 schon einmal gerüchteweise genannt, damals basierte diese Nennung jedoch auf einem Namens-Mißverständnis - die seinerzeit von nVidia geplante und dann im Spätsommer in den Markt entlassene Grafikkarten-Generation war dann letztlich "Turing". Jetzt steht nun wirklich die Ampere-Generation an - zu welcher man bislang aber fast noch gar nichts griffiges außer denn offensichtlichen Vermutungen wie eine gesteigerte RayTracing-Performance vorliegen hat. Die jetzt aufgetauchten Gerüchte geben hingegen erstmals gewisse technologische Ansätze her, wenngleich die Quelle natürlich vergleichsweise neu ist und das ganze komplett unbelegt daherkommt. Ausgangspunkt hierfür sind verschiedene Postings des Twitter-Users 'Kopite7Kimi' mit diversen Ausführungen zur Ampere-Generation, welche vor deren Löschung von unserem aufmerksamen Forum gesichert werden konnten:


nVidia Ampere HPC
sichere Infos:         GA100-Chip mit 6144 Bit HBM2-Interface, doppelte Anzahl Tensor-Cores per Shader-Cluster
sichere Infos:         GA101-Chip als halber GA100-Chip mit 3072 Bit HBM2-Interface (angeblich kürzlich gecancelt)
unsichere Infos:     GA100-Chip mit 8 GPC mit jeweils 8 TPC = 8192 Shader-Einheiten, beide HPC-Chips unter 7nm+ TSMC (mit EUV)
nVidia Ampere Gaming
unsichere Infos:     insgesamt 5 Chips, allesamt unter 7nm Samsung (mit EUV)
Quelle:  Twitter-User 'Kopite7Kimi', Original-Postings inzwischen gelöscht, sinngemäße Kopien im 3DCenter-Forum gesichert