8

News des 8. November 2010

Fudzilla vermelden "einige" Cayman-Spezifikationen, wonach der Chip mit 1536 Shader-Einheiten, 96 TMUs und 32 ROPs an einem 256 Bit DDR Speicherinterface antreten soll. Dies widerspricht etwas früheren Informationen von 1920 Shader-Einheiten – zudem ist nicht klar, ob Fudzilla dafür eine belastbare Quelle hat oder einfach nur Spekulationen aus unserem Forum abschreibt. Die 1536 Shader-Einheiten sind keineswegs unmöglich und würden auch zu AMDs allgemeiner Strategie passen, die eigenen Grafikchips nicht zu groß zu werden lassen – allerdings wird es damit deutlich schwieriger, die geplanten 40 Prozent Performance auf den RV870/Cypress-Chip der Radeon HD 5800/5900 Serien oben drauf zu legen. Bei angenommen ähnlichen Chip-Taktraten ist die theoretische Shader-Leistung von Cayman gegenüber der Radeon HD 5870 sogar etwas niedriger, die Texturierleistung steigt um 20 Prozent, die ROP-Leistung bleibt gleich und die Speicherbandbreite ist durch den bekannt höheren Speichertakt um 21-25 Prozent höher.

Damit bleibt alles an den Effizienzverbesserungen durch die 4-D VLIW Shader-Einheiten von Cayman hängen, welche zwar nicht die theoretische Shader-Leistung steigern, allerdings die effektiv verfügbare. Doch selbst in einem Ideal-Modell, wo die 4-D-Einheiten so fix sind wie die 5-D-Einheiten, liegt die effektive Shader-Leistung von Cayman nur 20 Prozent oberhalb der Radeon HD 5870 – wenn man wirklich mehr als 30 Prozent Performanceaufschlag gegenüber der Radeon HD 5870 herausholen will, muß das Cayman-Design noch mehr Verbesserungen bieten als nur diese 4-D VLIW Shader-Einheiten. Zu 1536 Shader-Einheiten sieht Cayman jedenfalls nicht potent genug aus, um deutlich mehr als 20 Prozent Performance-Gewinn gegenüber der Radeon HD 5870 hinzulegen – was gerade einmal für eine direkte Konkurrenz zur GeForce GTX 480 reichen würde, aber keineswegs in die Nähe der GeForce GTX 580 kommt. Da letzteres aber das erklärte Ziel von AMD beim Cayman-Chip ist, kann man davon ausgehen, daß AMD irgendwo noch einen Trumpf im Ärmel hat – oder daß die 1536 Shader-Einheiten nicht stimmen, sondern daß es in der Tat 1920 Shader-Einheiten werden.

Thema gestern angesprochene mögliche nVidia Filter-"Optimierungen": Daß eine Umbenennung des 3DCenter Filter Tester irgendeinen Unterschied ausmacht, ist vollkommen falsch – wir bitten um Entschuldigung. Der 3DCenter Filter Tester (DirectX10) bringt derzeit mit nVidia-Grafikkarten in jeder Situation eine Filterqualität, welche wie das HighQuality-Settings aussieht, während die älteren Testprogramme D3D AF-Tester (DirectX9) und Texture Filter TestApp (OpenGL) die unterschiedlichen Filterqualitäten des nVidia-Treibers korrekt anzeigen. Es bleibt allerdings offen, ob dies nicht wirklich regulär ist – gut möglich, daß nVidia für DirectX-10/11-Anwendungen per default generell nur noch diese Filterqualität ansetzt, da DirectX 10/11 den Spieleprogrammierern ja viele Möglichkeiten geben, diverse bildqualitätsverbessernde Maßnahmen (wie auch das Anti-Aliasing) völlig frei an den Treiber-Einstellungen vorbei zu setzen. Daß unter DirectX-10/11-Anwendungen kein Performance-Unterschied zwischen dem regulär schnellen HighPerformance-Modus und dem regulär langsamen HighQuality-Modus gemessen wurde, deutet jedenfalls deutlich in diese Richtung. Trotzdem kann in dieser Frage vor einer endgültigen Klärung natürlich keine Entwarnung gegeben werden, ist nach wie vor eine irreguläre Filter-"Optimierung" möglich.

Die X-bit Labs berichten näheres zu den lange erwarteten Desktop-Modellen der Bulldozer-Architektur. Danach soll AMD im April die Massenfertigung starten, um dieselbe Zeit wird dann der Launch dieser Prozessoren erwartet. AMD will den Desktop-Prozessor "Zambezi" aus der Bulldozer-Architektur sowohl mit vier als auch sechs und acht Rechenkernen an den Start bringen, wobei jeweils zwei Rechenkerne in einem Bulldozer-Modul stecken. Anders formuliert: Ein QuadCore-Bulldozer tritt mit zwei Bulldozer-Modulen an (samt 4 MB Level3-Cache), ein HexaCore-Bulldozer mit drei Bulldozer-Modulen (samt 8 MB Level3-Cache) und ein OctoCore-Bulldozer mit vier Bulldozer-Modulen (samt 8 MB Level3-Cache). Da derzeit noch nicht klar ist, ob ein Bulldozer-Modul wirklich die Performance zweier gewöhnlicher Rechenkerne erbringt, wird AMD diesen potentiellen Nachteil scheinbar jederzeit durch die höhere Anzahl an Rechenkernen ausgleichen können – mit natürlich dem Problem, daß derzeitige Desktop-Software in aller Regel wenig von mehr als vier Rechenkernen profitiert.

Shortcuts: Die ComputerBase berichtet zur Termin-Verwirrung rund um AMDs verschiedene 32nm-CPUs – wie vorstehend zu Zambezi notiert, werden derzeit mal wieder frühere Terminlagen vermutet, als bislang von AMD genannt. Derzeit sollte man sich gerade von den eher optimistischen Termin-Prognosen besser nicht anstecken lassen – wenn dann dauert es eher länger als vorher vermutet. Als Ausnahme von dieser Regel könnte sich allerdings Intels 22nm Prozessoren-Generation erweisen, welche laut nochmals der ComputerBase unter Umständen ins vierte Quartal 2011 vorgezogen wird. Technisch ist dies problemlos lösbar, auch Sandy Bridge wäre jetzt sicherlich schon lieferbar, wenn Intel dies so wollte. Der Grund für die Termin-Vorverschiebung von Ivy Bridge soll aber in den als stark erwarteten AMD-Prozessoren in 32nm liegen, welchen Intel dann unter 22nm einheizen will. Und letztlich bringen Tech ARP noch die anscheinend finalen Spezifikationen zur GeForce GTX 580: Überraschend sind hier nur die 64 Textureneinheiten, nachdem bisher immer von 128 TMUs ausgegangen wurde. Allerdings lohnen derzeit alle Performance-Spekulationen zur GeForce GTX 580 nicht mehr, da die Karte am Dienstag um 15 Uhr offiziell vorgestellt wird.

Fudzilla vermelden "einige" Cayman-Spezifikationen, wonach der Chip mit 1536 Shader-Einheiten, 96 TMUs und 32 ROPs an einem 256 Bit DDR Speicherinterface antreten soll. Dies widerspricht etwas früheren Informationen von 1920 Shader-Einheiten - zudem ist nicht klar, ob Fudzilla dafür eine belastbare Quelle hat oder einfach nur Spekulationen aus unserem Forum abschreibt. Die 1536 Shader-Einheiten sind keineswegs unmöglich und würden auch zu AMDs allgemeiner Strategie passen, die eigenen Grafikchips nicht zu groß zu werden lassen - allerdings wird es damit deutlich schwieriger, die geplanten 40 Prozent Performance auf den RV870/Cypress-Chip der Radeon HD 5800/5900 Serien oben drauf zu legen. Bei angenommen ähnlichen Chip-Taktraten ist die theoretische Shader-Leistung von Cayman gegenüber der Radeon HD 5870 sogar etwas niedriger, die Texturierleistung steigt um 20 Prozent, die ROP-Leistung bleibt gleich und die Speicherbandbreite ist durch den bekannt höheren Speichertakt um 21-25 Prozent höher.

Damit bleibt alles an den Effizienzverbesserungen durch die 4-D VLIW Shader-Einheiten von Cayman hängen, welche zwar nicht die theoretische Shader-Leistung steigern, allerdings die effektiv verfügbare. Doch selbst in einem Ideal-Modell, wo die 4-D-Einheiten so fix sind wie die 5-D-Einheiten, liegt die effektive Shader-Leistung von Cayman nur 20 Prozent oberhalb der Radeon HD 5870 - wenn man wirklich mehr als 30 Prozent Performanceaufschlag gegenüber der Radeon HD 5870 herausholen will, muß das Cayman-Design noch mehr Verbesserungen bieten als nur diese 4-D VLIW Shader-Einheiten. Zu 1536 Shader-Einheiten sieht Cayman jedenfalls nicht potent genug aus, um deutlich mehr als 20 Prozent Performance-Gewinn gegenüber der Radeon HD 5870 hinzulegen - was gerade einmal für eine direkte Konkurrenz zur GeForce GTX 480 reichen würde, aber keineswegs in die Nähe der GeForce GTX 580 kommt. Da letzteres aber das erklärte Ziel von AMD beim Cayman-Chip ist, kann man davon ausgehen, daß AMD irgendwo noch einen Trumpf im Ärmel hat - oder daß die 1536 Shader-Einheiten nicht stimmen, sondern daß es in der Tat 1920 Shader-Einheiten werden.

Thema gestern angesprochene mögliche nVidia Filter-"Optimierungen": Daß eine Umbenennung des 3DCenter Filter Tester irgendeinen Unterschied ausmacht, ist vollkommen falsch - wir bitten um Entschuldigung. Der 3DCenter Filter Tester (DirectX10) bringt derzeit mit nVidia-Grafikkarten in jeder Situation eine Filterqualität, welche wie das HighQuality-Settings aussieht, während die älteren Testprogramme D3D AF-Tester (DirectX9) und Texture Filter TestApp (OpenGL) die unterschiedlichen Filterqualitäten des nVidia-Treibers korrekt anzeigen. Es bleibt allerdings offen, ob dies nicht wirklich regulär ist - gut möglich, daß nVidia für DirectX-10/11-Anwendungen per default generell nur noch diese Filterqualität ansetzt, da DirectX 10/11 den Spieleprogrammierern ja viele Möglichkeiten geben, diverse bildqualitätsverbessernde Maßnahmen (wie auch das Anti-Aliasing) völlig frei an den Treiber-Einstellungen vorbei zu setzen. Daß unter DirectX-10/11-Anwendungen kein Performance-Unterschied zwischen dem regulär schnellen HighPerformance-Modus und dem regulär langsamen HighQuality-Modus gemessen wurde, deutet jedenfalls deutlich in diese Richtung. Trotzdem kann in dieser Frage vor einer endgültigen Klärung natürlich keine Entwarnung gegeben werden, ist nach wie vor eine irreguläre Filter-"Optimierung" möglich.

Die X-bit Labs berichten näheres zu den lange erwarteten Desktop-Modellen der Bulldozer-Architektur. Danach soll AMD im April die Massenfertigung starten, um dieselbe Zeit wird dann der Launch dieser Prozessoren erwartet. AMD will den Desktop-Prozessor "Zambezi" aus der Bulldozer-Architektur sowohl mit vier als auch sechs und acht Rechenkernen an den Start bringen, wobei jeweils zwei Rechenkerne in einem Bulldozer-Modul stecken. Anders formuliert: Ein QuadCore-Bulldozer tritt mit zwei Bulldozer-Modulen an (samt 4 MB Level3-Cache), ein HexaCore-Bulldozer mit drei Bulldozer-Modulen (samt 8 MB Level3-Cache) und ein OctoCore-Bulldozer mit vier Bulldozer-Modulen (samt 8 MB Level3-Cache). Da derzeit noch nicht klar ist, ob ein Bulldozer-Modul wirklich die Performance zweier gewöhnlicher Rechenkerne erbringt, wird AMD diesen potentiellen Nachteil scheinbar jederzeit durch die höhere Anzahl an Rechenkernen ausgleichen können - mit natürlich dem Problem, daß derzeitige Desktop-Software in aller Regel wenig von mehr als vier Rechenkernen profitiert.

Shortcuts: Die ComputerBase berichtet zur Termin-Verwirrung rund um AMDs verschiedene 32nm-CPUs - wie vorstehend zu Zambezi notiert, werden derzeit mal wieder frühere Terminlagen vermutet, als bislang von AMD genannt. Derzeit sollte man sich gerade von den eher optimistischen Termin-Prognosen besser nicht anstecken lassen - wenn dann dauert es eher länger als vorher vermutet. Als Ausnahme von dieser Regel könnte sich allerdings Intels 22nm Prozessoren-Generation erweisen, welche laut nochmals der ComputerBase unter Umständen ins vierte Quartal 2011 vorgezogen wird. Technisch ist dies problemlos lösbar, auch Sandy Bridge wäre jetzt sicherlich schon lieferbar, wenn Intel dies so wollte. Der Grund für die Termin-Vorverschiebung von Ivy Bridge soll aber in den als stark erwarteten AMD-Prozessoren in 32nm liegen, welchen Intel dann unter 22nm einheizen will. Und letztlich bringen Tech ARP noch die anscheinend finalen Spezifikationen zur GeForce GTX 580: Überraschend sind hier nur die 64 Textureneinheiten, nachdem bisher immer von 128 TMUs ausgegangen wurde. Allerdings lohnen derzeit alle Performance-Spekulationen zur GeForce GTX 580 nicht mehr, da die Karte am Dienstag um 15 Uhr offiziell vorgestellt wird.