Eine Meldung von letzter Woche beschäftigte sich mit der integrierten Grafiklösung von AMDs Trinity-Nachfolger "Kaveri" – und enthält leider einen gravierenden Fehler, so daß wir den Fall an dieser Stelle besser noch einmal komplett neu aufrollen. Zuerst zur Klarstellung: "Richland" ist wohl AMDs Name der kleineren Trinity-APUs und hat damit höchstwahrscheinlich absolut nichts mit dem Trinity-Nachfolger Kaveri zu tun. Alle früheren AMD-Roadmaps nennen sowieso immer nur Kaveri als Trinity-Nachfolger und an keiner Stelle "Richland".
Der eigentliche Fehler der früheren Meldung liegt aber darin, daß die seitens Fudzilla vermeldeten 384 (1D) Shader-Einheiten für den Trinity-Nachfolger Kaveri nicht stimmen können, da AMD in der Fußnote zu einer früheren Präsentation Kaveri schon eindeutig mit 4 CPU-Rechenkernen und 8 Shader-Clustern beschrieben hat. Und jene 8 Shader-Cluster ergeben innerhalb der bei Kaveri anliegenden GCN-Architektur eben 512 Shader-Einheiten – was im übrigen dann schon nahe dran am Cape-Verde-Chip von Radeon HD 7750 & 7770 mit 640 Shader-Einheiten ist, bei der Radeon HD 7750 sind davon sogar nur exakt 512 Shader-Einheiten aktiv (aber dort natürlich mit dediziertem Speicherinterface und schnellem GDDR5-Speicher). Die zu Kaveri bekannten Hardware-Daten lauten somit folgendermaßen:
Llano | Trinity | Kaveri/Richland | |
---|---|---|---|
Fertigung | 32nm GlobalFoundries | 32nm GlobalFoundries | 28nm GlobalFoundries (später eventuell auch TSMC) |
CPU-Unterbau | 4 Husky-Rechenkerne der K10.5-Architektur | 4 Piledriver-Rechenkerne der Bulldozer-Architektur | 4 Steamroller-Rechenkerne der Bulldozer-Architektur |
CPU-Takt | maximal 3.0 GHz | maximal 4.2 GHz (unter TurboCore) | ? |
Grafikeinheit | 400 VLIW5 Shader-Einheiten mit maximal 600 MHz Takt | 384 VLIW4 Shader-Einheiten mit maximal 800 MHz TurboCore-Takt | 512 (1D) Shader-Einheiten (auf GCN-Basis) mit Richtung 900 MHz TurboCore-Takt |
Speicherinterface | 128 Bit DDR3, maximal DDR3/1866 | 128 Bit DDR3, maximal DDR3/1866 | 128 Bit DDR3, maximal DDR3/2133 |
APU-Rechenl. (Progn.) | - | 819 GFlops | 1050 GFlops |
APU-Rechenl. (real) | 576 GFlops | 748,8 GFlops | ? |
GPU-Rechenl. (Progn.) | - | ca. 707 GFlops | ca. 922 GFlops |
GPU-Rechenl. (real) | 480 GFlops | 614,4 GFlops | ? |
3D-Performance | - | ca. +25% gegenüber Llano | ca. +25% gegenüber Trinity |
Release | Sommer 2011 | Frühsommer 2012 | erstes Halbjahr 2013 |
Mit diesen nun gleich 512 Shader-Einheiten erscheint AMDs frühere Prognose von 1050 GFlops Insgesamt-Rechenleistung für Kaveri (von welcher ca. 130 GFlops für den CPU-Teil weggehen) viel besser erreichbar, weil dies "nur" noch ca. 900 MHz Turbo-Takt für die integrierte Kaveri-Grafik verlangt. Natürlich gilt es hierbei immer noch einzurechnen, daß AMD die eigene Prognose bei Trinity bisher nicht erfüllt hat, sondern anstatt prognostiziert 707 GFlops für die integrierte Trinity-Grafik derzeit nur 614 GFlops bietet – eine Differenz von immerhin 15 Prozent. Auch dürfte die integrierte Kaveri-Grafik mit gleich 512 Shader-Einheiten viel stärker als die bisherige integrierte Grafik von AMD und Intel an der schwachen Speicherbandbreite über das CPU-Speicherinterface hängen – wenn eine integrierte Grafik auf DDR3/1866 gleich 80 Prozent des CPU-Speicherinterfaces in Beschlag nimmt, erreicht man damit trotzdem nur gerade ein Drittel der Speicherbandbreite einer Radeon HD 7750.
Dies dürfte die Performance der integrierten Kaveri-Grafik zum einen effektiv begrenzen – und zum anderen natürlich den Einsatz schnellerer DDR3-Speicher aus Performance-Sicht sinnvoll machen (ob auch aus Preissicht, wäre zu den Speicherpreisen des Jahres 2013 neu zu diskutieren). Trotzdem werden die gleich 512 Shader-Einheiten ihre Arbeit tun und Kaveri doch ganz gut in die Nähe einer (hypothetischen) Radeon HD 7750 mit DDR3-Speicher (um den Effekt des geringeren Bandbreite zu simulieren) führen – womit dann ernsthaft kein Anlaß für schwächere Desktop-Grafikkarten als eben die Radeon HD 7750 existiert. Bedenken müssen allerdings geäußert werden bezüglich der für die integrierte Grafik benötigten Die-Fläche, denn diese dürfte trotz des Wechsels auf die 28nm-Fertigung bei Kaveri erneut steigen – und schon Trinity belegt mehr Die-Fläche als Sandy Bridge und Ivy Bridge, bei allerdings klar niedrigerer Preislage.