26

AMD Kabini: Neue Informationen zu Chipfläche, Shader-Einheiten & Speicherinterface

Unsererseits bisher fehlerhafterweise noch nicht beachtet, existieren schon seit einigen Tagen neue technische Informationen zu AMDs Kabini-APU auf Basis der Jaguar-Architektur, welche bekannterweise auch die NextGen-Spielekonsolen Xbox 720 und Playstation 4 befeuern wird. Insbesondere hilft hierbei ein Posting aus dem SemiAccurate-Forum weiter, welches die Information zur exakten Größe der Kabini-Chipfläche von 114mm² sowie wahrscheinliche Annahmen zu weiteren Nebenpunkte wie dem Speicherinterface und der Speicherunterstützung dieser APU bietet. Zudem behauptet die PC Games Hardware in einem kürzlichen Newspostings, die Temash-APU auf Basis derselben Jaguar-Architektur würde über eine integrierte Grafik mit 128 Shader-Einheiten verfügen – womit sich folgendes aktualisiertes Bild zu Kabini/Temash auf Basis der Jaguar-Architektur ergibt:

Bobcat Jaguar
Ausführungen Zacate für Notebooks & Desktops
Ontario für LowPower-Notebooks
Hondo für Tablets
Kabini für Notebooks & Desktop
Temash für Tablets
Fertigung 40nm TSMC (Bulk) 28nm TSMC (Bulk)
Chipfläche 77mm²
(einzelner Rechenkern 4,9mm²)
114mm²
(einzelner Rechenkern 3,1mm²)
CPU-Teil 2 Bobcat-Rechenkerne, 512 kByte Level2-Cache pro Rechenkern, alle CPU-Befehlssatzerweiterungen bis SSE4A 4 Jaguar-Rechenkerne, 2 MB Level2-Cache insgesamt, alle CPU-Befehlssatzerweiterungen bis AVX1
GPU-Teil VLIW5-basierte Grafiklösung mit 80 VLIW5 Shader-Einheiten, DirectX 11.0 GCN1-basierte Grafiklösung mit 128 (1D) Shader-Einheiten (eventuell sogar 192 oder 256 Shader-Einheiten?), DirectX 11.1
Speicherinterface SingleChannel DDR3, offiziell bis DDR3/1333 (viele kleinere Modelle nur bis DDR3/1066) DualChannel DDR3, bis DDR3/1866
Pro-MHz-Verbesserung - +15% zwischen Bobcat und Jaguar
Topmodell E2-2000 mit 2 Rechenkernen, 1.75 GHz CPU-Takt und 538 MHz GPU-Takt (TurboCore @ 700 MHz), max. DDR3/1333
(gesamte Modell-Liste)
?
Release Launch im November 2010
Erweiterung "Brazos 2.0" im Juni 2012
weitere neue Modelle im Januar 2013
Ende Mai 2013

Noch ist allerdings nicht jede Angabe so sicher wie man sich dies eigentlich wünschen würde: Beispielsweise erscheinen die genannten 128 Shader-Einheiten als relativ wenig angesichts des sicheren Punkts der Chipfläche von 114mm² und des mittlerweile wahrscheinlichen DualChannel-Speicherinterfaces. Letzteres ist für nur 128 Shader-Einheiten vielleicht ein wenig groß ausgelegt – und in die genannte Chipfläche würden eventuell auch mehr Shader-Einheiten hineinpassen, wenn man bedenkt, daß der Cape-Verde-Chip der Radeon HD 7700 Serie seine 640 Shader-Einheiten samt 128 Bit DDR Speicherinterface auch auf nur 123mm² Chipfläche unterbringt.

Der bei Kabini/Temash hinzukommende CPU-Teil macht den Braten jedenfalls nicht fett: Trotz daß es nun gleich vier Rechenkerne sind, läßt sich das reine CPU-Modul samt Level2-Cache auf nur 26mm² Chipfäche unterbringen – was den Rest von immerhin 88mm² für die noch benötigte North/Southbridge sowie eben die integrierte Grafikeinheit freilassen würde. Daß AMD in seinen Trinity/Richland-Nachfolger "Kaveri" gleich 512 (1D) Shader-Einheiten der GCN-Architektur einpflanzen will, zeigt zudem an, daß AMD in dieser Frage keine Scheu vor großen Zahlen an den Tag legt. So gesehen würde es nicht überraschen, wenn die genannte Chipfläche von Kabini/Temash dann doch Platz für 192 oder sogar 256 (1D) Shader-Einheiten bieten würde.

Nachtrag vom 28. Februar 2013

Noch ein paar Worte zu verlieren wären zur Frage, wie groß die Grafikeinheit von AMDs Kabini-APU auf Basis der Jaguar-Architektur nun wirklich ist – weil sich hier die interessante Situation ergibt, daß alle offiziellen und halb-offiziellen Verlautbarungen klar in Richtung von nur 128 Shader-Einheiten gehen, die zur Verfügung stehende Chipfläche von gleich 114mm² jedoch deutlich mehr als jenes zuläßt. Der beste Vergleich hierzu geht wohl über den Oland/Mars-Chip der Radeon HD 8500M, 8600M & 8700M Mobile-Beschleuniger, welcher immerhin 384 Shader-Einheiten an einem 128 Bit DDR Speicherinterface bietet. Dies alles bringt AMD auf einer Chipfläche von nur 76mm² unter – und eingerechnet des bekannten Fakts, daß die vier Jaguar-Rechenkerne samt Level2-Cache nur 26mm² Chipfläche belegen werden, könnte man theoretisch sogar einen ganzen Oland/Mars-Chip in der Kabini-APU unterbringen (26mm² plus 76mm² ergeben gerade einmal 102mm²).

Einzurechnen sind hierbei noch zwei Punkte: Erstens eine North- und Southbridge, welche bei Kabini natürlich mit aufs Die kommt und auch noch etwas Chipfläche einnehmen wird. Und zweitens den Unterschied in den Fertigungsverfahren bei TSMC, wo die Grafikchips üblicherweise in einem HP-Verfahren und die Bobcat/Jaguar-APUs in einem Bulk-Verfahren hergestellt werden. Letzteres könnte bei der integrierten Jaguar-Grafikeinheit zu einer größeren Chipfläche als bei gleichwertigen Radeon-Grafikchips führen, sei es durch zusätzlich benötigte Massetransistoren oder aber notwendige Design-Anpassungen. Nichtsdestotrotz: Die für den Grafikchip zur Verfügung stehende Chipfläche von Kabini reicht in jedem Fall für mehr als nur für 128 Shader-Einheiten aus, rein theoretisch würden sogar 384 Shader-Einheiten hineinpassen. Limitiert dürfte das ganze eher von den TDP-Zielen von AMD mit Kabini werden, weniger von der zur Verfügung stehenden Chipfläche.

Dies ergibt dann genauso automatisch, daß ein DualChannel-Speicherinterface wie zuletzt schon angegeben durchaus sinnvoll für Kabini erscheint – man darf hier auch einrechnen, daß jenes Speicherinterface letztlich nur an DDR3-Speicher hängt und zudem eine Vierkern-CPU mitversorgen muß. Der Kabini-Vorgänger Bobcat hat jedenfalls teils deutlich an seinem SingleChannel-Speicherinterface gelitten, mittels der deutlichen CPU- und GPU-Verbesserungen von Kabini wäre der Schritt zu einem DualChannel-Speicherinterface nur logisch. Dies alles muß deswegen im übrigen keineswegs im Widerspruch zu den Meldungen über Temash-SoCs mit 128 Shader-Einheiten und SingleChannel-Speicherinterface stehen: Bei dieser Kabini-Abwandlung für den Tablet-Bereich kann AMD durchaus aus reinen TDP-Gründen Teile der Grafiklösung und des Speicherinterfaces deaktivieren – was schließlich keine Aussage bezüglich des zugrundeliegenden Chips darstellt.