16

News des 16. Juni 2011

Von AMD selber kommt inzwischen eine gewisse Leistungseinordnung der nächsten APU-Generation in Form von Bulldozer Trinity im Jahr 2012: Die dort verbaute integrierte Radeon-Grafik soll ca. 700 GFlops theoretische Rechenleistung auf die Waage bringen (der von AMD angegebene Wert ist höchstwahrscheinlich inklusive der Rechenleistung der reinen CPU, abzuziehen sind dabei ca. 100-150 GFlops), dies ist deutlich mehr als bei Llano mit bestenfalls 480 GFlops (Radeon HD 6550D mit 400 Shader-Einheiten @ 600 MHz GPU-Takt). Dafür wird sich AMD allerdings deutlich strecken müssen, denn diese deutlich angehobene Rechenleistung in dieselbe 32nm-Fertigung unterzubringen, wird nicht einfach werden. Sicherlich kann man plump mehr Shader-Einheiten verbauen, dies macht den Trinity-Chip aber nochmals massiv größer – und auch schon Llano ist gemessen an seiner Preislage ziemlich groß geworden.

AMD APU-Roadmap 2005-2013

Der bessere Weg würde über mehr Taktrate gehen – eigentlich sollte das hochwertige Produktionsverfahren für schnell taktende CPUs dafür wie geschaffen sein. Bislang liegt AMD jedoch mit den Taktraten der in Llano integrierten Grafiklösungen noch durchgehend unter dem Niveau üblicher Desktop-Grafikkarten. Gemäß dem Heise Newsticker sollen die Shader-Einheiten der integrierten Trinity-Grafikeinheit dann im übrigen schon nach dem neueren VLIW4-Standard aufgebaut sein. Dies ist allerdings eine vermessene Aussage gemessen an der Ausgangslage, wonach AMD nur ausgesagt hat, daß Trinity nicht mehr auf der Evergreen-Architektur der Radeon HD 5000 Serie aufbaut. Die nachfolgende Northern-Islands-Architektur umfaßt vier Grafikchips, wovon nur einer VLIW4 Shader-Einheiten hat, die anderen drei weiterhin bei VLIW5 sind – diesbezüglich erscheint bei Trinity noch alles möglich.

Das eigentliche Problem aller weiteren APU-Designs von AMD dürfte jedoch bei der Versorgung mit Speicherbandbreite liegen: Schon jetzt hängt die integrierte Llano-Grafiklösung maßgeblich an der Speicherbandbreite, der Performance-Unterschied zwischen DDR3/1333 und DDR3/1866 liegt laut AnandTech-Messungen bei ca. 23 Prozent. Jede weitere Steigerung der APU-Rechenleistung sollte demzufolge eigentlich auch von einer Steigerung der Speicherbandbreite begleitet werden, um nicht ziemlich ineffektiv bis irgendwann gänzlich nutzlos zu sein. Da höhere Speichertaktraten (bis auf DDR3/2133) unter DDR3 kaum noch anstehen und DDR4 um einige Zeit verschoben wurde, wird sich AMD andere Lösungen für dieses Problem ausdenken müssen. Primär möglich sind hierbei eingebetteter Speicher oder eine aber eine Vergrößerung des Speicherinterfaces (TripleChannel, QuadChannel).

Perfekt ist jedoch keine von diesen Lösungen, der eingebettete Speicher würde den Chip nochmals deutlich größer machen, während die Vergrößerung des Speicherinterfaces höhere Mainboard- und Systemkosten nach sich zieht (höherer Verdrahtungsaufwand und mehr benötigte Speicherriegel), was Nachteile im OEM-Geschäft bedeutet. Da keine dieser Lösungen befriedigend ist, wird es AMD unter Umständen mit einem Mix aus mehreren Maßnahmen probieren: Sowohl größere Caches, als auch etwas mehr Speichertakt und Software-Maßnahmen, welche Speicherbandbreite sparen helfen. Perspektivisch kommt dieses Problem aber bei jeder neuen APU erneut hervor und hat sogar das Potential, die langfristige APU-Entwicklung maßgeblich auszubremsen – weil bei für den Massenmarkt ausgelegten CPUs die Speicherbandbreite einfach nicht schnell genug steigen kann, um den Anforderungen eines Mainstream-Grafikchips zu genügen.

Shortcuts: Wie WinFuture ausführen, wird Microsoft wohl im September 2011 die Beta-Phase für Windows 8 einläuten. Damit dürfte sich die Prognose erfüllen, daß Microsoft für das nächste Betriebssystem einen Start im Herbst 2012 anpeilt. HT4U zeigen ein paar Engineering Samples zu Intels 2012er CPU-Architektur Ivy Bridge – was allerdings nichts ungewöhnliches ist, im CPU-Bereich beträgt der Sample-Zeitraum üblicherweise mindestens ein halbes Jahr. Gemäß den X-bit Labs hat AMD seine Pläne bekräftigt, die nächste Grafikchip-Architektur in der 28nm-Fertigung noch dieses Jahr herauszubringen. Eine befriedigende Aussage ist dies allerdings nicht, denn AMD spricht logischerweise nur von "Grafikchips" und deren Vorstellung, nicht aber von der Massenverfügbarkeit entsprechender Grafikkarten. Von einem Launch im Herbst mit einer klaren Verfügbarkeit noch in diesem Jahr bis hin zu einem Paperlaunch kurz vor Jahresschluß und einer echter Verfügbarkeit erst im nächsten Jahr ist damit noch alles denkbar für die Southern Islands Grafikchip-Generation.

Von AMD selber kommt inzwischen eine gewisse Leistungseinordnung der nächsten APU-Generation in Form von Bulldozer Trinity im Jahr 2012: Die dort verbaute integrierte Radeon-Grafik soll ca. 700 GFlops theoretische Rechenleistung auf die Waage bringen (der von AMD angegebene Wert ist höchstwahrscheinlich inklusive der Rechenleistung der reinen CPU, abzuziehen sind dabei ca. 100-150 GFlops), dies ist deutlich mehr als bei Llano mit bestenfalls 480 GFlops (Radeon HD 6550D mit 400 Shader-Einheiten @ 600 MHz GPU-Takt). Dafür wird sich AMD allerdings deutlich strecken müssen, denn diese deutlich angehobene Rechenleistung in dieselbe 32nm-Fertigung unterzubringen, wird nicht einfach werden. Sicherlich kann man plump mehr Shader-Einheiten verbauen, dies macht den Trinity-Chip aber nochmals massiv größer - und auch schon Llano ist gemessen an seiner Preislage ziemlich groß geworden.



Der bessere Weg würde über mehr Taktrate gehen - eigentlich sollte das hochwertige Produktionsverfahren für schnell taktende CPUs dafür wie geschaffen sein. Bislang liegt AMD jedoch mit den Taktraten der in Llano integrierten Grafiklösungen noch durchgehend unter dem Niveau üblicher Desktop-Grafikkarten. Gemäß dem Heise Newsticker sollen die Shader-Einheiten der integrierten Trinity-Grafikeinheit dann im übrigen schon nach dem neueren VLIW4-Standard aufgebaut sein. Dies ist allerdings eine vermessene Aussage gemessen an der Ausgangslage, wonach AMD nur ausgesagt hat, daß Trinity nicht mehr auf der Evergreen-Architektur der Radeon HD 5000 Serie aufbaut. Die nachfolgende Northern-Islands-Architektur umfaßt vier Grafikchips, wovon nur einer VLIW4 Shader-Einheiten hat, die anderen drei weiterhin bei VLIW5 sind - diesbezüglich erscheint bei Trinity noch alles möglich.

Das eigentliche Problem aller weiteren APU-Designs von AMD dürfte jedoch bei der Versorgung mit Speicherbandbreite liegen: Schon jetzt hängt die integrierte Llano-Grafiklösung maßgeblich an der Speicherbandbreite, der Performance-Unterschied zwischen DDR3/1333 und DDR3/1866 liegt laut AnandTech-Messungen bei ca. 23 Prozent. Jede weitere Steigerung der APU-Rechenleistung sollte demzufolge eigentlich auch von einer Steigerung der Speicherbandbreite begleitet werden, um nicht ziemlich ineffektiv bis irgendwann gänzlich nutzlos zu sein. Da höhere Speichertaktraten (bis auf DDR3/2133) unter DDR3 kaum noch anstehen und DDR4 um einige Zeit verschoben wurde, wird sich AMD andere Lösungen für dieses Problem ausdenken müssen. Primär möglich sind hierbei eingebetteter Speicher oder eine aber eine Vergrößerung des Speicherinterfaces (TripleChannel, QuadChannel).

Perfekt ist jedoch keine von diesen Lösungen, der eingebettete Speicher würde den Chip nochmals deutlich größer machen, während die Vergrößerung des Speicherinterfaces höhere Mainboard- und Systemkosten nach sich zieht (höherer Verdrahtungsaufwand und mehr benötigte Speicherriegel), was Nachteile im OEM-Geschäft bedeutet. Da keine dieser Lösungen befriedigend ist, wird es AMD unter Umständen mit einem Mix aus mehreren Maßnahmen probieren: Sowohl größere Caches, als auch etwas mehr Speichertakt und Software-Maßnahmen, welche Speicherbandbreite sparen helfen. Perspektivisch kommt dieses Problem aber bei jeder neuen APU erneut hervor und hat sogar das Potential, die langfristige APU-Entwicklung maßgeblich auszubremsen - weil bei für den Massenmarkt ausgelegten CPUs die Speicherbandbreite einfach nicht schnell genug steigen kann, um den Anforderungen eines Mainstream-Grafikchips zu genügen.

Shortcuts: Wie WinFuture ausführen, wird Microsoft wohl im September 2011 die Beta-Phase für Windows 8 einläuten. Damit dürfte sich die Prognose erfüllen, daß Microsoft für das nächste Betriebssystem einen Start im Herbst 2012 anpeilt. HT4U zeigen ein paar Engineering Samples zu Intels 2012er CPU-Architektur Ivy Bridge - was allerdings nichts ungewöhnliches ist, im CPU-Bereich beträgt der Sample-Zeitraum üblicherweise mindestens ein halbes Jahr. Gemäß den X-bit Labs hat AMD seine Pläne bekräftigt, die nächste Grafikchip-Architektur in der 28nm-Fertigung noch dieses Jahr herauszubringen. Eine befriedigende Aussage ist dies allerdings nicht, denn AMD spricht logischerweise nur von "Grafikchips" und deren Vorstellung, nicht aber von der Massenverfügbarkeit entsprechender Grafikkarten. Von einem Launch im Herbst mit einer klaren Verfügbarkeit noch in diesem Jahr bis hin zu einem Paperlaunch kurz vor Jahresschluß und einer echter Verfügbarkeit erst im nächsten Jahr ist damit noch alles denkbar für die Southern Islands Grafikchip-Generation.