10

Korrektur: AMDs Kaveri-APU bringt integrierte GCN-Grafiklösung mit gleich 512 (1D) Shader-Einheiten

Eine Meldung von letzter Woche beschäftigte sich mit der integrierten Grafiklösung von AMDs Trinity-Nachfolger "Kaveri" – und enthält leider einen gravierenden Fehler, so daß wir den Fall an dieser Stelle besser noch einmal komplett neu aufrollen. Zuerst zur Klarstellung: "Richland" ist wohl AMDs Name der kleineren Trinity-APUs und hat damit höchstwahrscheinlich absolut nichts mit dem Trinity-Nachfolger Kaveri zu tun. Alle früheren AMD-Roadmaps nennen sowieso immer nur Kaveri als Trinity-Nachfolger und an keiner Stelle "Richland".

Der eigentliche Fehler der früheren Meldung liegt aber darin, daß die seitens Fudzilla vermeldeten 384 (1D) Shader-Einheiten für den Trinity-Nachfolger Kaveri nicht stimmen können, da AMD in der Fußnote zu einer früheren Präsentation Kaveri schon eindeutig mit 4 CPU-Rechenkernen und 8 Shader-Clustern beschrieben hat. Und jene 8 Shader-Cluster ergeben innerhalb der bei Kaveri anliegenden GCN-Architektur eben 512 Shader-Einheiten – was im übrigen dann schon nahe dran am Cape-Verde-Chip von Radeon HD 7750 & 7770 mit 640 Shader-Einheiten ist, bei der Radeon HD 7750 sind davon sogar nur exakt 512 Shader-Einheiten aktiv (aber dort natürlich mit dediziertem Speicherinterface und schnellem GDDR5-Speicher). Die zu Kaveri bekannten Hardware-Daten lauten somit folgendermaßen:

Llano Trinity Kaveri/Richland
Fertigung 32nm GlobalFoundries 32nm GlobalFoundries 28nm GlobalFoundries
(später eventuell auch TSMC)
CPU-Unterbau 4 Husky-Rechenkerne der K10.5-Architektur 4 Piledriver-Rechenkerne der Bulldozer-Architektur 4 Steamroller-Rechenkerne der Bulldozer-Architektur
CPU-Takt maximal 3.0 GHz maximal 4.2 GHz (unter TurboCore) ?
Grafikeinheit 400 VLIW5 Shader-Einheiten mit maximal 600 MHz Takt 384 VLIW4 Shader-Einheiten mit maximal 800 MHz TurboCore-Takt 512 (1D) Shader-Einheiten (auf GCN-Basis) mit Richtung 900 MHz TurboCore-Takt
Speicherinterface 128 Bit DDR3, maximal DDR3/1866 128 Bit DDR3, maximal DDR3/1866 128 Bit DDR3, maximal DDR3/2133
APU-Rechenl. (Progn.) - 819 GFlops 1050 GFlops
APU-Rechenl. (real) 576 GFlops 748,8 GFlops ?
GPU-Rechenl. (Progn.) - ca. 707 GFlops ca. 922 GFlops
GPU-Rechenl. (real) 480 GFlops 614,4 GFlops ?
3D-Performance - ca. +25% gegenüber Llano ca. +25% gegenüber Trinity
Release Sommer 2011 Frühsommer 2012 erstes Halbjahr 2013

Mit diesen nun gleich 512 Shader-Einheiten erscheint AMDs frühere Prognose von 1050 GFlops Insgesamt-Rechenleistung für Kaveri (von welcher ca. 130 GFlops für den CPU-Teil weggehen) viel besser erreichbar, weil dies "nur" noch ca. 900 MHz Turbo-Takt für die integrierte Kaveri-Grafik verlangt. Natürlich gilt es hierbei immer noch einzurechnen, daß AMD die eigene Prognose bei Trinity bisher nicht erfüllt hat, sondern anstatt prognostiziert 707 GFlops für die integrierte Trinity-Grafik derzeit nur 614 GFlops bietet – eine Differenz von immerhin 15 Prozent. Auch dürfte die integrierte Kaveri-Grafik mit gleich 512 Shader-Einheiten viel stärker als die bisherige integrierte Grafik von AMD und Intel an der schwachen Speicherbandbreite über das CPU-Speicherinterface hängen – wenn eine integrierte Grafik auf DDR3/1866 gleich 80 Prozent des CPU-Speicherinterfaces in Beschlag nimmt, erreicht man damit trotzdem nur gerade ein Drittel der Speicherbandbreite einer Radeon HD 7750.

Dies dürfte die Performance der integrierten Kaveri-Grafik zum einen effektiv begrenzen – und zum anderen natürlich den Einsatz schnellerer DDR3-Speicher aus Performance-Sicht sinnvoll machen (ob auch aus Preissicht, wäre zu den Speicherpreisen des Jahres 2013 neu zu diskutieren). Trotzdem werden die gleich 512 Shader-Einheiten ihre Arbeit tun und Kaveri doch ganz gut in die Nähe einer (hypothetischen) Radeon HD 7750 mit DDR3-Speicher (um den Effekt des geringeren Bandbreite zu simulieren) führen – womit dann ernsthaft kein Anlaß für schwächere Desktop-Grafikkarten als eben die Radeon HD 7750 existiert. Bedenken müssen allerdings geäußert werden bezüglich der für die integrierte Grafik benötigten Die-Fläche, denn diese dürfte trotz des Wechsels auf die 28nm-Fertigung bei Kaveri erneut steigen – und schon Trinity belegt mehr Die-Fläche als Sandy Bridge und Ivy Bridge, bei allerdings klar niedrigerer Preislage.