27

Gerüchteküche: GeForce RTX 4080 soll auf dem AD103-Chip basieren, GeForce RTX 4070 auf dem AD104-Chip

Twitterer & Leaker Kopite7kimi bringt interessante Neuigkeiten zur konkreten Produkt-Gestaltung innerhalb der GeForce RTX 40 Grafikkarten-Serie. Bislang waren hierzu nur die Daten der einzelnen Grafikchips aus der "Ada"-Architektur bekannt – was den groben Rahmen ergibt, aber noch überhaupt nichts über konkrete Grafikkarten aussagt. Schon seinerzeit konnte man zwar über den Portfolio-Aufbau der GeForce RTX 40 Serie spekulieren, aber letztlich ist dies alles eine Festlegung von nVidia anhand von deren Markt- und Marketing-Plan – welche von außen nicht einsehbar sind. So wie es nun der Twitterer beschreibt, scheint es ein sehr breit angelegtes Portfolio zu werden, wo die drei wichtigsten größeren Grafikkarten – 4070, 4080 & 4090 – allesamt auf extra Grafikchips basieren: GeForce RTX 4090 logischerweise auf dem AD102, GeForce RTX 4080 auf dem AD103 und GeForce RTX 4070 auf dem AD104.

RTX 4080 will use AD103 chips, build with 16G GDDR6X, have a similar TGP to GA102.
RTX 4070 will use AD104 chips, build with 12G GDDR6, 300W.
Both of them haven't started testing yet, but soon do them.

Quelle:  Kopite7kimi @ Twitter am 27. April 2022

Die dazu genannten technischen Daten passen jeweils auch: Der AD103-Chip kommt bekannterweise mit 256-Bit-Speicherinterface daher, somit passen die genannten 16 GB Grafikkartenspeicher. Die TGP bzw. TDP soll ähnlich zum GA102-Chip ausfallen, was zwischen 350 und 450 Watt einigen Spielraum läßt – und jedoch auf der höchstmöglichen Auslegung als ziemlich hoch erscheint für den letztlich nur zweitbesten Chip im Portfolio. Andererseits bedeutet das benutzte Wort "similar" (ähnlich) schließlich auch nicht, dass es wirklich gleich ist, sondern nur dass es in der Nähe dessen liegen soll. Damit ist jedoch in jedem Fall vom Tisch, dass der AD103-Chip ähnlich wie im Ampere-Portfolio der GA103-Chip ins Mobile-Segment abgeschoben wird oder aber speziell für diese Nutzungsart optimiert würde: Im Ada-Portfolio soll der AD103-Chip augenscheinlich richtig Leistung bringen, ist vollwertiger Bestandteil des kommenden Grafikkarten-Portfolios.

Ähnliches gilt für die GeForce RTX 4070 auf Basis des AD104-Chips: Zu jenem wurde bislang schon ein 192-Bit-Interface gemeldet, wozu die nun genannten 12 GB Grafikkartenspeicher passen. Auch hier wird jedoch mit 300 Watt ein recht hoher Stromverbrauchs-Wert für eine Midrange-Lösung angegeben – die derzeit erhältliche GeForce RTX 3070 (Basis: GA104-Chip) kommt schließlich mit "nur" 220 Watt aus. Sicherlich steigert nVidia die Anzahl der Shader-Cluster zwischen GA104 und AD104 von 48 auf 60 Stück (+25%), doch angesichts des deutlichen Fertigungssprungs von 8nm Samsung auf 5nm TSMC hätte man sich eigentlich wenigstens für diese kleineren Grafikchips einen nicht weiter steigenden Stromverbrauch gewünscht bzw. erwartet. Aber damit wird natürlich auch klar, woher die Meldungen à 600 Watt Leistungsaufnahme beim großen AD102-Chip kommen: Wenn schon der mittlere AD104-Chip bei 300 Watt steht, dann ist für den mehr als doppelt so großen AD102 (144 anstatt 60 Shader-Cluster, +140%) nichts anderes zu erwarten.

Damit lassen sich die drei genannten Grafikkarten – 4070, 4080 & 4090 – bereits grob skizzieren, wie auch die Differenzen zum jeweiligen Vorgänger ermitteln. Auffallend ist dabei, dass GeForce RTX 4070 & 4080 mit einer deutlich geringeren Steigerung der Einheiten-Anzahl leben müssen wie die GeForce RTX 4090: Die beiden kleineren Karten bieten jeweils grob +20% mehr Shader-Cluster gegenüber ihren Ampere-Vorgängern, die GeForce RTX 4090 hingegen mehr als +70%. Selbst wenn nVidia sich dafür entscheidet, die GeForce RTX 4090 nicht so nahe an den Vollausbau des AD102-Chip zu setzen – beispielsweise nur mit 130 freigeschalteten Shader-Clustern, dies ergäbe +59% – wäre dieser Sprung an Shader-Clustern bei der GeForce RTX 4090 immer noch gewaltig größer als bei GeForce RTX 4080 & 4070. Dies bedeutet, dass die kleineren Karten des Ada-Portfolios mehr auf Architektur- und Taktraten-Verbesserungen setzen müssen, den Effekt von gewaltig mehr Hardware-Einheiten erhalten hingegen nur AD102-basierte Grafikkarten.

Ampere / RTX 30 Ada / RTX 40 Differenz
GeForce RTX 3090
GA102-Chip
82 SM @ 384 Bit
24 GB GDDR6X
350W TDP
GeForce RTX 4090
AD102-Chip
~140-142 SM @ 384 Bit
24 GB GDDR6X
~600W TDP
 
+71-73% Shader-Cluster
gleiches Speicherinterface
gleiche Speichermenge
drastisch mehr TDP
GeForce RTX 3080
GA102-Chip
68 SM @ 320 Bit
10 GB GDDR6X
320W TDP
GeForce RTX 4080
AD103-Chip
~80-82 SM @ 256 Bit
16 GB GDDR6X
~400W TDP
 
+18-21% Shader-Cluster
etwas kleineres Speicherinterface
klar größere Speichermenge
deutlich mehr TDP
GeForce RTX 3070
GA104-Chip
46 SM @ 256 Bit
8 GB GDDR6
220W TDP
GeForce RTX 4070
AD104-Chip
~56-58 SM @ 192 Bit
12 GB GDDR6
~300W TDP
 
+22-26% Shader-Cluster
etwas kleineres Speicherinterface
klar größere Speichermenge
deutlich mehr TDP
Anmerkung: Angaben zu noch nicht vorgestellter Hardware basieren auf Gerüchten & Annahmen

Sofern die Angaben des Twitterers bei der Zuordnung Grafikkarte zu Grafikchip stimmen, ergibt sich letztlich auch der Rest des GeForce RTX 40 Portfolios ganz automatisch: Die GeForce RTX 4060 sollte auf dem AD106-Chip basieren, die GeForce RTX 4050 auf dem AD107-Chip (selbst wenn wie bei der GeForce RTX 3050 anfänglich der nächstgrößere Grafikchip herangezogen würde). Die Zugewinne an Hardware-Einheiten bei GeForce RTX 4050 & 4060 wären mit grob +20% ähnlich gelagert wie bei GeForce RTX 4070 & 4080, jedoch gibt es deutliche Differenzen bei der Speichermenge: Während jene bei GeForce RTX 4070 & 4080 jeweils größer ausfällt, sollte die GeForce RTX 4060 im Vergleich zur aktuellen GeForce RTX 3060 mit der kleineren Speichermenge antreten bzw. die GeForce RTX 4050 in dieser Frage nicht mehr Speicher als die aktuelle GeForce RTX 3050 aufbieten. Andererseits würde nVidia damit den Lapsus des aktuellen Ampere-Portfolios ausbügeln, wo die GeForce RTX 3060 mit mehr VRAM antritt als die schnelleren Karten GeForce RTX 3060 Ti, 3070 & 3070 Ti.

Ampere / RTX 30 Ada / RTX 40 Differenz
GeForce RTX 3060
GA106-Chip
28 SM @ 192 Bit
12 GB GDDR6
170W TDP
GeForce RTX 4060
AD106-Chip
~34 SM @ 128 Bit
whrschl. 8 GB GDDR6
 
+21% Shader-Cluster
kleineres Speicherinterface
whrschl. geringere Speichermenge
GeForce RTX 3050
GA106/GA107-Chip
20 SM @ 128 Bit
8 GB GDDR6
130W TDP
GeForce RTX 4050
AD106/AD107-Chip
~24 SM @ 128 Bit
8 GB GDDR6
 
+20% Shader-Cluster
gleiches Speicherinterface
gleiche Speichermenge
Anmerkung: Angaben zu noch nicht vorgestellter Hardware basieren auf Gerüchten & Annahmen

Das Ada-Portfolio erscheint in dieser Frage deutlich ausgewogener aufgestellt – womit nVidia auch allen Abwertungen wegen zu geringer Speichermenge im Vergleich zur Leistungsfähigkeit der jeweiligen Grafikkarte aus dem Weg geht. Abzuwarten bleibt natürlich, ob sich diese Ausgestaltung des GeForce RTX 40 Portfolios bestätigen läßt oder ob nVidia eventuell noch Änderungen daran vornimmt. Dies ist durchaus möglich, denn die AD103- & AD104- Grafikchips von GeForce RTX 4080 & 4070 sind laut 'Kopite7kimi' derzeit noch nicht nicht in ihre Test-Phase eingetreten – was jedoch zeitnah passieren soll. Nebenbei bedeutet diese Formulierung auch, dass AD103 & AD104 ihren Tape-Out sehr wohl schon erreicht haben. Nach der wie gesagt zeitnah zu erwartenden Rücksendung erster entsprechender Test-Chips wird sich deren Validierungs- und Produktgestaltungs-Phase anschließen, womit ein Release dieser Grafikkarten (weiterhin) noch vor Jahresende 2022 im Raum steht.

Nachtrag vom 27. April 2022

Eine völlig korrekte Leser-Anmerkung zum kürzlich ausgebreiteten GeForce RTX 40 Grafikkarten-Portfolio ist, dass dort natürlich jede Menge an Salvage-Lösungen fehlen. Die hierbei aufgelegten großen Grafikchips müssen jederzeit über diese Methode gegenüber den üblichen Schwächen der Chipfertigung abgefedert werden – und je größer die Chips werden, um so weniger kann dies über Mobile-Lösungen passieren (welche zudem sowieso gern den jeweiligen Vollausbau verwenden). Beim AD106-Chip kann sicherlich die "GeForce RTX 4050" diese Rolle als Salvage-Lösung übernehmen, gleiches hat man schließlich schon bei der GeForce RTX 3050 auf Basis des größeren GA106-Chips gesehen.

Bei den Grafikchips AD104, AD103 und AD102 fehlt hingegen jeweils noch eine klare Salvage-Lösung – welche nVidia dann womöglich über "Ti"-Lösungen zwischen den bekannten Grafikkarten realisiert. Über deren Hardware-Daten kann man derzeit nur spekulieren, es wird sicherlich irgendetwas zwischen größerem und kleinerem Chip. Unklar ist dabei jeweils, inwiefern das Speicherinterface und damit die Speichermenge des benutzten Grafikchips voll angesetzt werden – oder hingegen auch an dieser Stelle Abspeckungen erfolgen und man somit letztlich bei Speicherinterface und Speichermenge des jeweils darunterliegenden Chips landet. Mittels dreier Ti-Karten und einer GeForce RTX 4050 auf AD106-Basis würde nVidia in jedem Fall die Salvage-Problematik lösen, das herauskommende Portfolio wäre dennoch halbwegs gut überschaubar. Nur gibt es derzeit für diese Zwischenlösungen noch keinerlei belastbare Hinweise aus der Gerüchteküche, jene stellen dann tatsächlich eine reine Eigen-Interpretation dar.

Chip Funktion Hardware Interface Speicher
Quadro oder Titan AD102 Vollausbau 144 SM 384 Bit 48 GB GDDR6X
GeForce RTX 4090 AD102 nahe Vollausbau ~140-142 SM 384 Bit 24 GB GDDR6X
GeForce RTX 4080 Ti AD102 Salvage möglw. ~96-110 SM 256-320 Bit 16-20 GB GDDR6X
GeForce RTX 4080 AD103 nahe Vollausbau ~80-82 SM 256 Bit 16 GB GDDR6X
GeForce RTX 4070 Ti AD103 Salvage möglw. ~66-70 SM 192-256 Bit 12-16 GB GDDR6X
GeForce RTX 4070 AD104 nahe Vollausbau ~56-58 SM 192 Bit 12 GB GDDR6
GeForce RTX 4060 Ti AD104 Salvage möglw. ~44-50 SM 128-192 Bit 8-12 GB GDDR6
GeForce RTX 4060 AD106 nahe Vollausbau ~34 SM 128 Bit whrschl. 8 GB GDDR6
GeForce RTX 4050 AD106/AD107 AD106: Salvage, AD107: Vollausbau ~24 SM 128 Bit 8 GB GDDR6
Anmerkung: Angaben zu noch nicht vorgestellter Hardware basieren auf Gerüchten & Annahmen