9

Was kann nVidias Ampere-Generation mit der 12nm-, 10nm- oder 7nm-Fertigung von TSMC erreichen?

Die wichtigste Frage zur Einordnung der grundsätzlich erreichbaren Performance bei der kommenden Ampere-Generation von nVidia ist sicherlich diejenige nach dem Fertiungsverfahren der (voraussichtlich antretenden) Ampere-Grafikchips GA102 (Enthusiast), GA104 (HighEnd), GA106 (Midrange), GA107 (Mainstream) und GA108 (LowCost). Wir hatten in der letzten Meldung hierzu einfach einmal gewisse Performance-Zielsetzungen für die einzelnen Ampere-Grafikchips notiert – leider ohne explizit darauf hinzuweisen, das jene natürlich die Verwendung einer bestimmten Chipfertigung bedingen. Und je nachdem unter welcher Chipfertigung man Ampere derzeit einordnen, können da sehr weit abweichende Performance-Zielsetzungen und -Spielräume herauskommen – am Ende bestimmt die Wahl des Fertigungsverfahrens bei nVidias Hausfertiger TSMC ganz entscheidend darüber, was nVidia mit der Ampere-Generation letztlich erreichen kann.

TSMC 16nm vs. 12nm TSMC 16nm vs. 10nm TSMC 16nm vs. 7nm (TSMC 10nm vs. 7nm)
Chipfläche -20% > -50% -70% (> -37%)
Taktrate +10% +20% +30% (+10%)
Stromverbrauch -25% -40% -60% (-40%)
erreichbare Transistoren-Menge
(auf gleicher Chipfläche)
+25% +100% (+X) +233% (+60% +X)
erreichbare Performance
(bei gleicher Chipfläche & Stromverbrauch)
grob +20-30% grob +70-80% grob +180-200% (grob +60-70%)
Die Werte zu "Taktrate" und "Stromverbrauch" gelten immer als "entweder oder", niemals ist also beides gleichzeitig in dieser Höhe möglich. Allenfalls ist ein Mix aus höherer Taktrate und niedrigerem Stromverbrauch auf beiderseits niedrigeren Werten möglich.

Dabei sind die grundsätzlichen Rahmendaten der einzelnen Fertigungsverfahren von TSMC bekannt – und dürften in der Praxis auch grob derart eingehalten werden, schließlich ist selbst die 7nm-Fertigung bei TSMC nicht mehr all zu weit weg (erste Smartphone-SoCs unter 7nm werden dieses Jahr in Produktion gehen). Für große Grafikchips wird die 7nm-Fertigung dieses Jahr allerdings kaum zu realisieren sein, die diesbezüglichen Angaben in vorstehender Tabelle sind nur der Vollständigkeit halber notiert, auch um die Relationen der Fertigungsverfahren untereinander besser einschätzen zu können. Die hauptsächliche Fragestellung bezüglich nVidias Ampere-Generation liegt somit bei der 12nm- oder der 10nm-Fertigung – die 7nm-Fertigung hat nur eine Seitenchance für die womöglich erst im Jahr 2019 nachfolgenden Kleinchips GA107 und GA108 für Mainstream- und LowCost-Bedürfnisse.

Dabei haben sich derzeit viele Beobachter schon auf die 12nm-Fertigung eingeschossen, wird jene schließlich schon bei nVidias GV100-Chip erfolgreich verwendet. Zudem haftet der 10nm-Generation immer noch der Ruf einer "ungeliebten Zwischengeneration" an, welche möglichst schnell zugunsten der nachfolgenden 7nm-Fertigung übersprungen werden soll. Jener Ruf ist allerdings zum Teil ungerechtfertigt, da primär begründet aus der Erfahrung mit der 20nm-Fertigung, die zwar kleinere Chipflächen aber keinen niedrigeren Stromverbrauch ermöglichte – und damit für Grafikchips glatt ungeeignet war. Viele Beobachter irren allerdings in der Annahme, die 10nm-Fertigung wäre technologisch ähnlich gestrickt – obige Tabelle (mit Quellenlage AnandTech und SemiWiki) zeichnet ein ganz anderes Bild: Danach ist der Sprung von 16nm zu 10nm sogar noch etwas größer als jener zwischen 10nm und 7nm – und in jedem Fall ist 10nm ein echter Vollnode ohne irgendwelche technologischen Einschränkungen. Der Vergleich mit den teilweise schwachen technischen Daten der 20nm-Fertigung verbietet sich hiermit ganz klar.

Dies muß nichts daraufhingehend bedeuten, ob die 10nm-Fertigung nicht doch ein "short living node" werden könnte – GlobalFoundries läßt jenes Fertigungsverfahren gleich ganz aus, und auch bei TSMC kommt die 7nm-Fertigung schon wirklich schnell nach der 10nm-Fertigung. Bezüglich der Lebensdauer der 10nm-Fertigung könnte man also durchaus Recht behalten mit der Feststellung, das jenes Fertigungsverfahren keine große Bedeutung erlangen wird. Aber dies sagt natürlich nichts darüber aus, ob man die 10nm-Fertigung von TSMC nicht für bedeutsame Chipprojekte verwenden kann – selbstverständlich kann man dies tun. nVidia hat für den GV100-Chip faktisch sogar die vorher nicht bekannte 12nm-Fertigung bei TSMC begründet – angesichts dessen spricht nichts dagegen, das man auch auch die 10nm-Fertigung nutzt, zumindest sofern die technischen Vorgaben seitens TSMC erfüllt werden und der Kostenpunkt nicht zu hoch kommt.

Dabei muß es gar nicht einmal sein, das die 12nm-Fertigung nVidia so derart viel günstiger kommt: Denn nVidia bekommt unter der 12nm-Fertigung regulär nur eine Performance-Steigerung von +20-30% hin, sofern man Chipfläche und Stromverbrauch nicht erhöhen wollte. Da dies nun wirklich zu wenig (für eine neue Grafikchip-Generation) ist, wenigstens +40% einfach sein müssen, kann es durchaus sein, das nVidia in der 12nm-Fertigung ergo größere Grafikchips entwickeln muß, um seine Performance-Zielsetzung zu erfüllen. Dies steigert trotz 12nm-Fertigung dann aber auch wieder die Fertigungskosten – während mit der 10nm-Fertigung nVidia sogar die Möglichkeit an der Hand hat, die Chipfläche unter dem Verlust von etwas Performance nochmals zu verkleinern. Da die 10nm-Fertigung einen ausreichend hohen Performance-Boost mitbringt, könnte nVidia sich dies leisten, würde immer noch überzeugend an Mehrperformance aufbieten und trotzdem wie gesagt mit kleineren Chipflächen antreten können, somit die hohen Kosten der 10nm-Fertigung etwas abmildern können.

nVidia Ampere in 12nm nVidia Ampere in 10nm
Vorteile & Nachteile definitiv verfügbar, vergleichsweise kostengünstig, nur geringe Mehrperformance auf gleicher Chipfläche möglich Verfügbarkeit nicht gänzlich sicher, teuer (zukünftig abmildernd), sehr viel Mehrperformance auf gleicher Chipfläche möglich, guter Mix aus viel Mehrperformance auf etwas kleinerer Chipfläche möglich
Projektion GeForce GTX 2080 #1
(auf gleicher Chipfläche)
+20-30%
= knapp unterhalb GeForce GTX 1080 Ti
+70-80%
= massiv oberhalb GeForce GTX 1080 Ti
Projektion GeForce GTX 2080 #2
(auf abweichender Chipfläche)
+40%
= etwas oberhalb GeForce GTX 1080 Ti, erreichbar mit ca. +20% größerer Chipfläche ggü. GP104
+60-70%
= deutlich oberhalb GeForce GTX 1080 Ti, erreichbar mit ca. -10% geringerer Chipfläche ggü. GP104
Die Projektionen zur GeForce GTX 2080 sind reine Annahmen.

Im Endeffekt sind damit alle Performance-Projektionen von +20% bis +80% erreichbar – je nachdem welches Fertigungsverfahren nVidia auswählt und wie dann noch die Chip-Parameter angepasst werden. Gemäß der vorstehenden Ausgangslage vermuten wir für unseren Teil im übrigen die 10nm-Fertigung – welche, sofern wirklich verfügbar und nicht gerade massiv zu teuer, ganz klar die beste verfügbare Technologie aufbietet. Mit der 12nm-Fertigung ist der technologische Sprung zu klein und nVidia wird seine Grafikchips größer machen müssen – etwas, was man gern zu vermeiden versucht, gerade wenn man die aktuellen Rekordgewinne nochmals steigern will. Das die 10nm-Fertigung naturgemäß nochmals teuer ist, kann man dagegen abmildern durch kleinere Chipflächen sowie den Punkt, das die Kostenlage der 10nm-Fertigung sich im weiteren Verlauf natürlich verbessern dürfte (während bei der 12nm-Fertigung sichlich nicht mehr viel an Kostenreduktion passiert). Von außen betrachtet spricht also alles für die 10nm-Fertigung bei nVidias Ampere-Generation – was natürlich gar nichts über nVidias reale Wahl sagen muß, jene kann auf Basis uns unbekannter Fakten doch wieder gänzlich anders ausgegangen sein.

Die wichtigste Frage zur Einordnung der grundsätzlich erreichbaren Performance bei der kommenden Ampere-Generation von nVidia ist sicherlich diejenige nach dem Fertiungsverfahren der (voraussichtlich antretenden) Ampere-Grafikchips GA102 (Enthusiast), GA104 (HighEnd), GA106 (Midrange), GA107 (Mainstream) und GA108 (LowCost). Wir hatten in der letzten Meldung hierzu einfach einmal gewisse Performance-Zielsetzungen für die einzelnen Ampere-Grafikchips notiert - leider ohne explizit darauf hinzuweisen, das jene natürlich die Verwendung einer bestimmten Chipfertigung bedingen. Und je nachdem unter welcher Chipfertigung man Ampere derzeit einordnen, können da sehr weit abweichende Performance-Zielsetzungen und -Spielräume herauskommen - am Ende bestimmt die Wahl des Fertigungsverfahrens bei nVidias Hausfertiger TSMC ganz entscheidend darüber, was nVidia mit der Ampere-Generation letztlich erreichen kann.





TSMC 16nm vs. 12nm
TSMC 16nm vs. 10nm
TSMC 16nm vs. 7nm
(TSMC 10nm vs. 7nm)





Chipfläche
-20%
> -50%
-70%
(> -37%)



Taktrate
+10%
+20%
+30%
(+10%)



Stromverbrauch
-25%
-40%
-60%
(-40%)



erreichbare Transistoren-Menge
(auf gleicher Chipfläche)
+25%
+100% (+X)
+233%
(+60% +X)



erreichbare Performance
(bei gleicher Chipfläche & Stromverbrauch)
grob +20-30%
grob +70-80%
grob +180-200%
(grob +60-70%)



Die Werte zu "Taktrate" und "Stromverbrauch" gelten immer als "entweder oder", niemals ist also beides gleichzeitig in dieser Höhe möglich. Allenfalls ist ein Mix aus höherer Taktrate und niedrigerem Stromverbrauch auf beiderseits niedrigeren Werten möglich.