4

Gerüchteküche: nVidias GA102-Chip im Einsatz für neue Titan-Karte sowie GeForce RTX 3080 & 3090

Von Twitterer Kopite7kimi kommen neuerliche Gerüchte über mögliche Ampere-basierte Gamer-Grafikkarten – wobei es diesesmal weniger denn nach einem Leak, sondern eher nach gewissen Annahmen aussieht. Möglicherweise gibt es eine Basis an Info-Fetzen (eventuell die Chip-Codenamen mit Suffix "-200", "-300" und "-400"), aber schon die Grafikkarten-Namen werden klar mit Fragezeichen gekennzeichnet und das ganze auch unter den Vorbehalt "maybe" gestellt – auf die Goldwaage legbar ist das ganze also mitnichten. Das neue Gerücht geht augenscheinlich weiterhin davon aus, das der eigentlich geplante GA103-Chip tatsächlich gestrichen ist – womit nVidia damit auch die "GeForce RTX 3080" auf Basis des (größeren) GA102-Chips auflegen muß, welcher regulär sicherlich nur für Ti & Titan gedacht war. Machbar ist dies mit einer größeren Silizium-Deaktivierung sicherlich schon, allerdings reduziert sich dann auch die Differenz zwischen nVidias beiden Top-Modellen – welche ausgehend vom Hardware-Unterschied in der Ampere-Generation somit eher in Richtung +20% zu verorten wäre, nicht mehr bei ca. +35% wie aktuell in der Turing-Generation (zwischen GeForce RTX 2080 & 2080 Ti).

Maybe, the new
TITAN(?), 5376, GA102-400,
RTX3090(?), 5248, GA102-300, 21Gbps GDDR6X,
RTX3080(?), 4352, GA102-200.

Quelle:  Kopite7kimi @ Twitter am 31. Mai 2020

Möglicherweise deswegen reicht es auch nur zu einer "GeForce RTX 3090" als non-Titan-Spitzenmodell – was natürlich eine "GeForce RTX 3090 Ti" als späteren Nachzügler offenläßt. Augenscheinlich soll zudem das neue Titan-Modell ebenfalls GA102-basiert antreten – und damit nicht auf Basis des GA100-Chips, welcher dafür jedoch kaum passend ist. Selbiger könnte zwar mit bis zu 8192 Shader-Einheiten sehr viel mehr Rohpower aufbieten, ist aber funktioniell eingeschränkt und damit nicht wirklich gut für reguläre PC-Grafikkarten geeignet. Beachtenswert daneben ist noch die Nennung von GDDR6X-Speicher auf gleich 21 Gbps Datenrate, dies entspricht einer Taktrate von immerhin 5250 MHz (QDR). Dies ist deutlich mehr als bei GDDR5 (im DDR-Verfahren) jemals erreicht wurde und auch etwas oberhalb dessen, was die Speicherchip-Hersteller bisher aus ihren Laboren vermeldet haben (üblicherweise maximal 20 Gbps). Die Produktbezeichnung "GDDR6X" ist dabei bislang noch nicht aufgetaucht – insofern ist unklar, ob es sich hierbei wirklich um etwas neues handelt, oder einfach nur eine Marketing-"Verbesserung", um auf den besonders hohen Speichertakt hinzuweisen.

Jener hohe Speichertakt deutet in jedem Fall auf die Weiterverwendung eines 384-Bit-Interfaces auch für den GA102-Chip an (wie beim vorhergehenden TU102-Chip), denn für ein größeres Interface bräuchte man nicht einen derart hohen Speichertakt. Gleichzeitig darf eine eventuelle Verbesserung bei den Speichermengen doch erheblich in Frage gestellt werden, wenn man derart schnelle (wie teure) Speicherbausteine verwendet. Einzig die GeForce RTX 3080 könnte hierbei gegenüber der Turing-Generation bessergestellt sein, denn auf Basis des GA102-Chips muß es dann nicht wie beim Vorgänger (GeForce RTX 2080) ein 256-Bit-Interface mit 8 GB Speicher sein, es wäre auch eine Zwischenlösung mit 320-Bit-Interface und 10 GB Speicher denkbar. Im nachfolgenden Portfolio der kleineren Ampere-Chips dürften dann (leider) die Speicherinterfaces denen der Vorgänger-Generation entsprechen, womit wie gesagt eben auch nicht mehr Grafikkartenspeicher erwartet werden darf.

Chip Shader-Cl. Interface Speicher Vorgänger
Titan Ampere GA102 84 SM 384 Bit 24 GB Titan RTX: TU102, 72 SM @ 384 Bit, 24 GB
GeForce RTX 3090 GA102 82 SM 384 Bit 12 GB GeForce RTX 2080 Ti: TU102, 68 SM @ 352 Bit, 11 GB
GeForce RTX 3080 GA102 68 SM 320 Bit 10 GB GeForce RTX 2080 Super: TU104, 48 SM @ 256 Bit, 8 GB
GeForce RTX 3070 GA104 48 SM 256 Bit 8 GB GeForce RTX 2070 Super: TU104, 40 SM @ 256 Bit, 8 GB
GeForce RTX 3060 GA104 40-42 SM 256 Bit 8 GB GeForce RTX 2060 Super: TU106, 34 SM @ 256 Bit, 8 GB
GeForce RTX 3050 GA106 30 SM 192 Bit 6 GB GeForce GTX 1660 Ti: TU116, 24 SM @ 192 Bit, 6 GB
GeForce RTX 3040 GA107 20 SM 128 Bit 4 GB GeForce GTX 1650: TU117, 14 SM @ 128 Bit, 4 GB
Alle Angaben zu Ampere-Grafikkarten basierend auf Gerüchten & Annahmen!

Nachtrag vom 11. Juni 2020

Igor's Lab haben sich weiter mit nVidia GA102-Grafikkarten beschäftigt und dazu auch eine feine Auflistung aufgestellt, wie sich der maximale TDP-Wert von immerhin 350 Watt zusammensetzen könnte. Dabei schlägt der allgemein als 24 GB GDDR6X angenommene Speicher der GA102-Spitzenlösung (bei Igor eine "GeForce RTX 3090", bei anderen Quellen eine Ampere-Titan) mit allein 60 Watt durchaus kräftig herein, abzüglich des Stromverbrauchs von Lüftern und Spannungswandlerverlusten käme am Grafikchip selber dann "nur" noch 230 Watt an. Ob jene Rechnung gänzlich stimmt, wäre noch zu beweisen, da die hierfür angesetzten 2,5 Watt pro GDDR6X-Chip erstaunlich viel sind, GDDR5-Speicherchips bewegen sich nach realen Spiele-Stromverbrauchsmessungen bei unterhalb 1 Watt pro Chip (was natürlich noch keine exakte Aussage zu GDDR6X ergibt). Dies muß nVidias TDP-Rechnung allerdings keinen Abbruch tun, denn wenn die GDDR6X-Chips real wirklich weniger verbrauchen, bekommt der Grafikchip einfach mehr Strom unter dem alles regelnden Power-Limit zur Verfügung stellt. Daneben kommt dann noch eine neue Information zur Chipfläche des GA102-Chips, welche gemäß einer Zusammenmischung von Leaks und Hochrechnungen seitens Igor's Lab auf ca. 627mm² angegeben wird.

    nVidia GA102

  • Ampere-Generation, Zielrichtung Gaming-Einsatz
  • ca. 25-30 Mrd. Transistoren
  • ca. 627mm² Chipfläche (unter Samung 8nm oder TSMC 7nm)
  • 7 Raster-Engines (mit jeweils 6 TPC, welche ihrerseits jeweils 2 Shader-Cluster enthalten)
  • insgesamt 84 Shader-Cluster (5376 Shader-Einheiten)
  • 384 Bit GDDR6X Speicherinterface
  • SKU #1: Ampere-Titan oder GeForce RTX 3090 Ti, 84 SM, 384 Bit, 24 GB GDDR6X, 350W
  • SKU #2: GeForce RTX 3090 oder GeForce RTX 3080 Ti, 82 SM, 352-384 Bit, 11-12 GB GDDR6X, 320W
  • SKU #3: GeForce RTX 3080, 68 SM, 320 Bit, 10 GB GDDR6X, 320W
  • Release: vermutlich September/Oktober 2020
  • Alle Angaben basierend auf Gerüchten & Annahmen!

Damit würde nVidia wie gewünscht von den monströsen Chipflächen der Turing-Generation etwas herunterkommen, der TU102-Chip ist wie bekannt gleich 754mm² groß. Der ganz großen Flächeneffekt durch die (viel) bessere Fertigung ergibt sich damit aber auch noch nicht – möglicherweise ja auch ein Grund dafür, wieso nVidia nicht noch mehr Recheneinheiten aufbietet. Laut unserem Forum deutet jene Chipfläche im übrigen eher auf die Verwendung von TSMCs 7nm-Prozeß als denn Samsungs 8nm-Prozeß hin. Dies passt, sofern man die Packdichte von Navi 10 (41,0 Mio. xtors/mm²) ansetzt und gemäß des GA100-Chips davon ausgeht, das der GA102-Chip bei 65% von dessen Shader-Clustern ca. 25-30 Mrd. Transistoren wiegen dürfte. Die Packdichte des GA100-Chips von (66,6 Mio. xtors/mm²) darf man hierbei besser nicht beachten, da beim GA100-Chip zum einen der relative Anteil von Interfaces und anderen fixen Chipteilen geringer sein wird und es sich zum anderen um ein Chipdesign mit bewußt niedrigerem Takt und dafür dichter gepackten Transistoren handelt. Die Gaming-Chips sind hingegen üblicherweise explizite Hochtaktdesigns, wo man demzufolge die Transistoren nicht derart dicht packen kann. Als gänzlich sicher ist jene Flächenangabe allerdings noch nicht zu sehen, mit einem Teil der enormen GA100-Flächeneffizienz wären auch kleinere Chipflächen beim GA102-Chip im Bereich von 500-600mm² denkbar.