21

AMD Carrizo kommt ohne große Hardware-Veränderungen gegenüber Kaveri

Noch nachzutragen von Ende letzter Woche ist die bei der chinesischen VR-Zone (maschinelle Übersetzung ins Deutsche) aufgetauchte AMD-Präsentationsfolie zur 2015er APU "Carrizo", welche die Kaveri-APU im Mainstream-Bereich ablösen soll. Zu Carrizo ist bislang noch erstaunlich wenig wirklich sicher bekannt gewesen, die vorliegenden Präsentationsfolie räumt nun mit einigen falschen Gerüchten und Vermutungen auf. So ist AMDs Idee bei Carrizo deutlich konservativer als bislang vermutet – keine Spur von DDR4-Support, eingebettetem Speicher oder aber großen Sprüngen bei CPU und iGPU. Es gibt ergo weiterhin vier Rechenkerne in Bulldozer-Modulbauweise samt einer GCN-basierten Grafiklösung mit 512 Shader-Einheiten an einem DualChannel DDR3/2133 Speicherinterface (wie von Kaveri bekannt).

Die Veränderungen sind somit eher im Detail zu suchen: So gibt es mit "Excavator" die dritte und letzte Bulldozer-Ausbaustufe. Folgt man der Erfahrung mit den bisherigen Bulldozer-Ausbaustufen, dann wird Excavator noch ein wenig mehr Pro/MHz-Performance bringen, aber bei weitem nichts am Performance-Gesamtbild ändern – wüsste AMD, wie man dies bei der Bulldozer-Architektur wirklich grundlegend verbessern könnte, hätte man dies schließlich schon längst getan. Eher steht zu vermuten, daß das Verbesserungs-Potential von Excavator begrenzt ist, wie dies bei letzten Ausbaustufen nun einmal üblicherweise so ist. Der von AMD angegebene 30%ige Performance-Sprung bei einer TDP von 15 Watt stellt letztlich auch keine Aussage zu den generellen CPU-Verbesserungen dar, sondern könnte auch über Verbesserungen in der Fertigung zugunsten einer geringeren Leistungsaufnahme oder/und Verbesserungen bei den Stromspar-Modi erzielt werden. Ob Kaveri in der Spitze – also bei 35 Watt TDP im Notebook oder 95 Watt TDP auf dem Desktop – bemerkbar mehr CPU-Performance bietet, ist damit also nicht gesagt.

Bei der integrierten Grafiklösung scheint es erstmals keinen Sprung in der Einheiten-Anzahl zu geben: Weiterhin werden 8 Shader-Cluster einer GCN-basierten Grafik angegeben, was – sofern AMD die Shader-Cluster nicht unerwarteterweise umgearbeitet hat – erneut 512 Shader-Einheiten am identischen DualChannel-Speicherinterface mit weiterhin dem offiziellen Speichersupport von maximal DDR3/2133 ergeben. Allerdings soll die Carrizo-iGPU nunmehr der "dritten GCN Generation" angehören, sprich dürfte entweder GCN 1.2 oder 2.0 sein. Zudem spricht AMD von einem "DirectX 12" Support – wobei angesichts der unsicheren Faktenlage zu möglichen Hardware-Veränderungen bei DirectX 12 dies auch nur bedeuten mag, daß damit rein die Software-Verbesserungen von DirectX 12 unterstützt werden. Ob Carrizo einen echten DirectX-12-Support bietet, ist damit nicht sicher – und dies bliebe auch den Punkt abzuwarten, ob DirectX 12 überhaupt neue Hardware-Anforderungen mit sich bringt.

Die ganz große Offenbarung ist gemäß dieser Daten somit nicht von Carrizo zu erwarten. Die beste Chance hat AMD noch, wenn man die 28nm-Fertigung von GlobalFoundries nochmals besser ausnutzt und mittels dieser den realen Stromverbrauch weiter herunterdrücken kann, auf daß innerhalb derselben TDP-Grenzen höhere Taktfrequenzen für CPU & iGPU von Carrizo möglich werden. Abseits höherer Taktraten sind von den internen Verbesserungen an CPU und iGPU kaum mehr als jeweils +5% (maximal +10%) Praxiseffekt zu erwarten. Eine kleine Wildcard stellt das "Full HSA" Feature dar, welches von der Idee her sicher potent ist, allerdings ohne Unterstützung der Software-Entwickler sicherlich kaum wirken kann. Da selbige Unterstützung der Softwarer-Entwickler eine eher langfristige Angelegenheit ist, steht kaum zu erwarten, daß "Full HSA" zur Carrizo-Vorstellung – vermutet wird Anfang 2015 – irgendetwas zur Performance beitragen kann.

Llano Trinity Richland Kaveri Carrizo
Fertigung 32nm SOI GlobalFoundries 32nm SOI GlobalFoundries 32nm SOI GlobalFoundries 28nm Bulk GlobalFoundries 28nm Bulk GlobalFoundries
Die-Daten 1,45 Mrd. Transistoren auf 228mm² Die-Fläche 1,3 Mrd. Transistoren auf 246mm² Die-Fläche 2,41 Mrd. Transistoren auf 245mm² Die-Fläche wahrscheinlich ähnlich wie Kaveri
CPU-Unterbau 4 Husky-Rechenkerne der K10.5-Architektur 4 Piledriver-Rechenkerne der Bulldozer-Architektur 4 Steamroller-Rechenkerne der Bulldozer-Architektur 4 Excavator-Rechenkerne der Bulldozer-Architektur
CPU-Takt maximal 3.0 GHz maximal 4.2 GHz (unter TurboCore) maximal 4.4 GHz (unter TurboCore) maximal 3.7 GHz (unter TurboCore) unbekannt
Grafikeinheit 400 VLIW5 Shader-Einheiten (20 TMUs, 8 ROPs) mit maximal 600 MHz Takt 384 VLIW4 Shader-Einheiten (24 TMUs, 8 ROPs) mit maximal 800 MHz TurboCore-Takt 384 VLIW4 Shader-Einheiten (24 TMUs, 8 ROPs) mit maximal 844 MHz TurboCore-Takt 512 (1D) Shader-Einheiten (32 TMUs, 8 ROPs) mit maximal 720 MHz TurboCore-Takt 512 (1D) Shader-Einheiten (32 TMUs, 8 ROPs) mit unbekanntem Takt
Speicherinterface 128 Bit DDR3, maximal DDR3/1866 128 Bit DDR3, maximal DDR3/1866 128 Bit DDR3, maximal DDR3/2133 128 Bit DDR3, maximal DDR3/2133 128 Bit DDR3, maximal DDR3/2133
Featureset SSE4a, DirectX 11.0 SSE4a, AVX 1.1, FMA3/4, DirectX 11.0 SSE4a, AVX 1.1, FMA3/4, GCN 1.1, DirectX 11.2b, HSA, Mantle, TrueAudio SSE4a, AVX2, FMA3/4, GCN 1.2/2.0, DirectX 11.2b (DirectX 12?), Full HSA, Mantle, TrueAudio
Sockel FM1 FM2 FM2 FM2+ FM2+
Launch 14. Juni 2011 Mobile: 15. Mai 2012
Desktop: 2. Oktober 2012
Mobile: 12. März 2013
Desktop: 5. Juni 2013
Desktop: 14. Januar 2014
Mobile: 4. Juni 2014
erwartet Anfang 2015

Nachtrag vom 25. Juli 2014

Bezüglich unserer Berichterstattung zu AMDs 2015er APU "Carrizo" kommt Protest aus unserem Forum, jene Meldung würde AMD zu scharf angehen, insbesondere bezogen auf die mit den Excavator-Rechenkernen zu erwartenden CPU-Verbesserungen. Und in der Tat kamen selbige in dieser Meldung wohl zu schlecht weg, denn immerhin wird AMD mit Carrizo erstmals AVX2 unterstützen, Intels neueste CPU-Befehlserweiterung, welche selbst bei Intel bislang nur von der Haswell-Architektur beherrscht wird. Allerdings haben neue CPU-Befehlssatzerweiterungen eher sehr selten zu einem sofortigen Performance-Gewinn geführt, müssen jene schließlich immer erst von den Anwendungs-Entwicklern eingesetzt werden (die Älteren werden sich an Intels verzweifelte Marketing-Bemühungen mit der MMX-Befehlssatzerweiterung erinnern). Carrizo hat hier immerhin den Vorteil, nicht mit einer glatten Neuheit anzutreten, sondern eben erst (mindestens) anderhalb Jahre nach der Einführung von AVX2. Trotzdem darf etwas bezweifelt werden, ob sich allein hieraus ein wirklich großer Performance-Boost zugunsten von Carrizo ergeben kann.

In einem anderen Punkt liegen wir hingegen offensichtlich falsch: Zwar mag AMD bei den Mobile-Modellen von Carrizo keinen DDR4-Support bieten, gemäß früherer AMD-Roadmaps ist jener jedoch zweifelsfrei für die (Desktop-nahen) Server-Ausführungen geplant. Da Carrizo wie auch die letzten AMD-APUs letztlich überall dasselbe Stück Silizium darstellen wird, werden die Mobile-Ausführungen wohl schlicht mit deaktiviertem DDR4-Speicherinterface ausgeliefert, während selbiges bei den Desktop-Lösungen hoffentlich freigeschaltet ist. In jedem Fall ist der Carrizo-APU aber auch von unserer, in diesem Fall wohl überkritischen Seite so viel Spielraum zuzugestehen, daß man das Erscheinen dieser APUs abwarten sollte, ehe man endgültige Urteile über jene fällt. Wenn AMD überraschen wollte, holt man beispielsweise viel mehr aus der 28nm-Fertigung von GlobalFoundries heraus als beim Vorgänger "Kaveri" und bringt "Carrizo" somit entscheidend voran.

Ein neues, seitens Fudzilla verbreitetes Gerücht zu AMDs Carrizo-APU behauptet, selbige würde nur im Mobile-Segment eingesetzt werden, keinen DDR4-Support bieten sowie in 20nm gefertigt sein. Wahrscheinlich stimmt hiervon gar nichts, aber der Reihe nach: Das Thema DDR3/DDR4-Support hatten wir vorstehend schon einmal. Sofern AMDs frühere Roadmaps korrekt sind, ist Carrizo zweifelsfrei mit Kombi-Speicherinterface geplant – und dies ebenfalls gemäß der Roadmap natürlich in der 28nm-Fertigung. Dies ergibt sich auch schon allein daraus, daß AMD diese Mainstream-APUs inzwischen bei GlobalFoundries herstellen läßt, wo derzeit keinerlei passende 20nm-Bulk-Fertigung in Planung ist. Ob AMD Carrizo letztlich auf das Mobile-Segment limitieren will, läßt sich derzeit natürlich weder dementieren noch bestätigen. Als sinnig erscheint es jedenfalls nicht: Produziert wird sowieso nur ein einziges Stück Silizium – und aus irgendwelchen Gründen nur für Mobile-Zwecke verwendbar ist dieses auch nicht, wie die Server-Planungen belegen. Eine technische Beschränkung gibt es also nicht – und eine künstliche Beschränkung erscheint unlogisch, weil auch AMD seinen OEMs möglichst jedes Jahr etwas neues bieten muß.