2

News des 1./2. Mai 2022

Neben den höher als erwartet ausfallenden Takraten von AD102 bzw. wohl auch den anderen Grafikchips der "Ada"-Generation hat Twitterer Kopite7kimi angedeutet, dass die Ada-Architektur generell leistungsfähiger ausfallen soll, als es ein simpler "Ampere-Refresh" (nach höheren Taktraten und mehr Hardware-Einheiten) sein würde. In dieser Frage soll sich im Zuge der Ada-Entwicklung konzeptionell etwas entscheidendes verschoben haben, nachdem diese nVidia-Generation anfänglich tatsächlich wie als "Ampere-Refresh" geplant gewesen war. Ausgangspunkt des ganzen dürfte wohl das Bekanntwerden von AMDs Plänen bei der RDNA3-Generation mit zwei MCM-Konstrukten an der Leistungsspitze gewesen sein – sprich, nVidia wusste, dass man nun mehr liefern mußte als eine gewöhnliche neue Grafikchip-Generation.

I must clarify that the current AD102 is NOT the original AD102. Ada Lovelace is no longer a simple Ampere refresh, although it was like this in the beginning.
Quelle:  Kopite7kimi @ Twitter am 29. April 2022

Hier hinein passt auch die kürzlich schon vermeldete Absage des GH202-Chips als eventuellen AD102-Refresh. Damit musste AD102 sowohl dessen Performance-Ziel übernehmen, hat offenbar aber auch ein paar Technologien von der "Hopper"-Architektur übernommen. Augenscheinlich handelt es sich bei diesen Änderungen an der Konzeption von AD102 nicht um schlicht mehr Hardware-Einheiten – die 144 Shader-Cluster stehen nach wie vor. Allerdings könnten sich die Shader-Cluster erneut verändert haben bzw. zusätzliche Hardware-Einheiten tragen. Ob es hierbei auch um mehr FP32-Einheiten geht, bleibt offen – wenn da plötzlich 192 FP32-Einheiten pro Shader-Cluster auftauchen, würde AD102 schließlich gleich bei 27'648 FP32-Einheiten herauskommen. Denkbar und vielleicht eher wahrscheinlich sind Verbesserungen bei den anderen Einheiten – FP16 für verringerte Rechengenauigkeit, INT32 für eine Stärkung der Integerleistung sowie ziemlich sicher (deutlich) mehr Tensor-Power (letzteres hat der GH100-Chip bereits vorgemacht).

Für einige Aufregung haben am Wochenende die Meldungen zu einer (vermeintlichen) "100-TFlops-Schlacht" von AMD und nVidia bei deren jeweiligen NextGen-Grafikkarten gesorgt. Auf nVidia-Seite stimmt die Zahl wohl sogar, aber auf AMD-Seite basierte dies auf einem schlichten Mißverständis: Die dafür notwendige (deutlich) höhere Taktraten-Angabe wurde mit der falschen Hardware-Spezifikation verrechnet, womit Navi 31 dann (vermeintlich) bei 92 TFlops landen würde. Dummerweise gehört die neue Taktraten-Angabe auch zu einer neuen Hardware-Spezifikation – und leider wurde letztere erst zwei Tage später bekannt. Insofern sind alle Meldungen über 92 TFlops bei Navi 31 glasklar falsch – konnten allerdings auch bis zum 2. Mai nicht als solche erkannt werden. Damit fällt auch die genannte "100-TFlops-Schlacht" aus, denn die NextGen-Chips von AMD & nVidia werden wiederum einen bedeutsamen Unterschied in der FP32-Rohleistung daherbringen bzw. ist Navi 31 noch um einiges von jener TFlops-Marke entfernt.

Genauso falsch ist es im übrigen, von einer tatsächlichen Hardware-Abspeckung bei Navi 31 & 32 zu reden. Nur die beiden Meldungen zu neuer Taktraten und neuen Hardware-Spezifikation zusammen ergeben Sinn – leider kamen beide Meldungen etwas zeitversetzt. Im Endeffekt hatte AMD wohl schlicht zwei Hardware-Entwürfe zur Auswahl bei seinem Design-Ziel von 75 TFlops für Navi 31: Einen mit 15'360 FP32-Einheiten auf ~2.4 GHz Takt und einen mit 12'288 FP32-Einheiten mit ~3.0 GHz Takt. Der erstgenannte Hardware-Entwurf leakte bereits letzten Sommer – und somit noch vor dem Tape-Out von Navi 31 zum dritten Quartal 2021. Der zweitgenannte Hardware-Entwurf ist jetzt erst geleakt, augenscheinlich im Rahmen des (erfolgreichen) Tape-Outs von Navi 31. Beide Hardware-Entwürfe wären sicherlich gangbar gewesen und erbringen vor allem die exakt selbe Rohleistung. Die genannte Hardware-Abspeckung existiert somit nur nominell – sinngemäß wurde hingegen nur ein anderer Weg zum (identischen) Ziel gewählt.

Navi 31 Hardware Zieltakt Ziel-TFlops Status
Entwurf I 60 WGP, 15'360 FP32 ~2.4 GHz ~75 TFlops reiner Entwurf, nicht realisiert
Entwurf II 48 WGP, 12'288 FP32 ~3.0 GHz ~75 TFlops im Q3/2021 zum Tape-Out gebracht
Anmerkung: logischerweise unbestätige Daten zu noch nicht releaster Hardware

Gegenüber CNBC hat Intels CEO Pat Gelsinger das Ende der Halbleiter-Knappheit weiter auf das Jahr 2024 verschoben. Die genaue Formulierung "drift into 2024" dürfte eher eine Terminlage im ersten Halbjahr 2024 vermuten lassen, sicherlich ist damit nicht das komplette Jahr 2024 gemeint. Als Grund wird die Verschiebung der verschiedenen Liefer- und Auslastungs-Schwierigkeiten hin zu den Ausrüstungs-Herstellern genannt. Und in der Tat hängt der weitere Ausbau der Fertigungsanlagen derzeit vornehmlich daran, genügend Chipfertigungs-Maschinen, andere Teile sowie entsprechende Verbrauchsgüter zu bekommen. Die Halbleiter-Ausrüster haben ihrerseits derzeit das Problem, ihre eigene Fertigung nicht schnell genug hochschieben zu können, da deren eigenen Zulieferer letztlich vor exakt denselber Problematik stehen.

That’s part of the reason that we believe the overall semiconductor shortage will now drift into 2024, from our earlier estimates in 2023, just because the shortages have now hit equipment and some of those factory ramps will be more challenged.
Quelle:  Intels CEO Pat Gelsinger gegenüber CNBC, veröffentlicht am 29. April 2022
 
We feel like we're better positioned than most. The combination of our internal capacity as well as our leverage of foundries — we're just better positioned, and that's part of the structural advantage that Intel has.
Quelle:  Intels CEO Pat Gelsinger gegenüber Bloomberg, veröffentlicht am 30. April 2022

Einschränkenderweise ist allerdings unklar, ob Intel hierbei von kleineren oder substantiellen Knappheiten spricht. Kleinere Knappheiten könnten durchaus noch länger anhalten – die Frage ist jedoch eher, ob es (weiterhin) zu substantiellen Knappheiten kommt. Dieser Punkt ist derzeit (durch die zurückgehende Nachfrage) stark auf dem Rückzug, insofern könnte das Ende der breiten Halbleiter-Knappheit eher früher als später kommen – und somit mit dieser Jahresnennung eher nur kleinere Knappheiten gemeint sein. Zudem darf die Vermutung in den Raum gestellt werden, dass jene Intel-Aussage auch nicht ganz uneigennützig geschah: Denn wie in einem Interview mit Bloomberg ausgedrückt, sieht sich Intel mitten in dieser Halbleiter-Knappheit über die eigenen Fertigungsanlagen deutlich besser positioniert als andere IT-Unternehmen. Am Ende könnte die ganze Rede nur deswegen angesetzt worden sein, damit Intel nach den vergleichsweise negativen Quartalszahlen irgendeinen positiven Spin zugunsten des Aktienkurses vorweisen kann.