26

News des 26. August 2010

Im neuen Catalyst 10.8 tummeln sich schon reichlich Namensnennungen zu den einzelnen Southern-Islands-Grafiklösungen, welche einen guten Ausblick darauf ermöglichen, wie viele Grafikkarten-Varianten ATI insgesamt geplant hat. So werden zum HighEnd-Chip Cayman mit "Cayman LE", "Cayman Pro" und "Cayman XT" gleich drei Varianten genannt, möglicherweise umzusetzen in Radeon HD 6830, 6850 und 6870. Hinzu kommen auf Cayman-Basis dann auch noch die DualChip-Varianten "Antilles Pro" und "Antilles XT", ergo möglicherweise Radeon HD 6950 und 6970. Für den Performancechip Barts finden sich mit "Barts Pro" und "Barts XT" zwei Varianten, welche möglicherweise die Grafikkarten Radeon HD 6750 und 6770 ergeben. Der Mainstream-Chip Turks wird wieder mit zwei regulären Varianten "Turks Pro" und "Turks XT" genannt – hinzukommt kommt noch die bisher nicht einordenbare Sondervariante "Onega" auch auf Basis dieses Grafikchips.

Und letztlich wird der LowCost-Chip Caicos noch bei den Grafikkarten "Caicos Pro" und "Caspian Pro" genannt, wobei auch bei letzterer Variante wiederum nicht klar ist, wie diese angesichts des abweichenden Namens einzuordnen ist. Mit den verschiedenen Fusion-Produkten scheinen diese nichts zu tun zu haben, denn diese werden extra erwähnt. Daneben werden auch noch die Mobile-Abwandlungen der Southern-Islands-Generation genannt: Seymour als Mobile-Abwandlung von Caicos, Whistler als Mobile-Abwandlung von Turks und Blackcomb als Mobile-Abwandlung von Barts – wie früher schon an dieser Stelle notiert. Die Mobile-Codenamen ergeben natürlich keine anderen Chips – es sind die gleichen Chips wie im Desktop-Betrieb, ATI vergibt halt nur extra Codenamen.

Southern Islands Desktop Mobile Chip-Details
LowCost Caicos
zwei Varianten: Caicos Pro & Caspian Pro (Radeon HD 6400 Serie)
Seymour
zwei Varianten: Seymour LP & Seymour Pro/XT
geschätzt 64-192 Shader-Einheiten, wahrscheinlich 64 Bit DDR Speicherinterface
Mainstream Turks
drei Varianten: Turks Pro, Turks XT & Onega (Radeon HD 6600 Serie)
Whistler
zwei Varianten: Whistler LP & Whistler Pro/XT
geschätzt 384-640 Shader-Einheiten, 24-40 TMUs, wahrscheinlich 128 Bit DDR Speicherinterface
Performance Barts
zwei Varianten: Barts Pro & Barts XT (Radeon HD 6750 & 6770)
Blackcomb
zwei Varianten: Blackcomb LP & Blackcomb Pro/XT
geschätzt 800-1280 Shader-Einheiten, 50-80 TMUs, 128 oder 256 Bit DDR Speicherinterface mit 2500 MHz Speichertakt
HighEnd Cayman
drei Varianten: Cayman LE, Cayman Pro & Cayman XT (Radeon HD 6830, 6850 & 6870)
- angeblich 1920 Shader-Einheiten, 120 TMUs, 256 Bit DDR Speicherinterface mit 3000 MHz Speichertakt
DualChip Antilles (2x Cayman)
zwei Varianten: Antilles Pro & Antilles XT (Radeon HD 6950 & 6970)
- angeblich 3840 Shader-Einheiten, 240 TMUs, 2x 256 Bit DDR Speicherinterface

Zudem fehlt wie auch schon bei der Radeon HD 5000 Serie eine Abwandlung des HighEnd-Chips für das Mobile-Segment, hier hält ATI die Verlustleistung (nicht zu Unrecht) wohl zu groß für einen Mobile-Einsatz. Dies dürfte ATI natürlich wie schon bei der Mobility Radeon HD 5000 Serie nicht davon abhalten, mit "kreativen Bezeichnungen" zu arbeiten und daher dennoch eine "Mobility Radeon HD 6800" Serie zu erschaffen – nur eben mit dem Unterbau des Performance-Chips Barts/Blackcomb und nicht mit dem HighEnd-Chip Cayman. Wann diese mobilen Varianten kommen, läßt sich derzeit noch nicht ermessen, da nicht klar ist, wie weit ATI schon mit den einzelnen Chips der Southern-Islands-Generation ist. Auf jedes Erscheinungsdatum im Desktop-Bereich kann man im Mobile-Segment aber problemlos zwei bis drei Monate aufschlagen, die es dauert, um die neuen Chips seitens der Notebook-Hersteller sauber evaluieren zu lassen.

ATI & nVidia Produktportfolio & Roadmap – 26. August 2010

Wir müssen noch einmal auf das Thema der voraussichtlichen Performance von Bulldozer angesichts der neuen Informationen über den Aufbau dieser CPU-Architektur zurückkommen: AMDs Ansatz bei Bulldozer ist schließlich, die Performance von nahezu zwei Kernen mit möglichst geringem Silizium-Aufwand und auch nicht gerade der doppelten Verlustleistung hinzubekommen. Hinzu kommt noch der Punkt, daß ein Integer-Rechenkern von Bulldozer auf dem Papier nicht mehr so mächtig ist (zwei Ops pro Takt und Kern) wie die Integer-Kerne von K7, K8 und K10 oder die von Core 2 bzw. Nehalem (jeweils drei Ops pro Takt und Kern). Daß Teile der Pipeline nun zwei Integer-Kernen dienen müssen, dürfte zwar die Auslastung der Pipeline-Bausteine erhöhen, aber auch nicht unbedingt der Performance pro Rechenkern zuträglich sein.

So steht es wie gesagt auf dem Papier, allerdings gibt es gegenüber der These, daß Bulldozer damit eine niedrige Performance pro Rechenkern haben wird, gewichtige Einwände: Erstens einmal steht dem entgegen, daß die drei Integer-Einheiten der anderen genannten Prozessoren gewöhnlich sehr schlecht auszulasten sind – was auch illustriert wird durch den Punkt, daß in der Praxis die real erreichte Rechenleistung früherer Prozessoren irgendwo bei einem Ops pro Takt und Kern liegt. Der Verzicht auf die dritte Integer-Recheneinheit muß also nichts bedeuten, von der Performance pro Kern und Takt her kann Bulldozer problemlos auf der Höhe des K10-Prozessors und eventuell sogar über diesem liegen. Und zweitens bezieht sich die AMD-Aussage von der 80prozentigen Performance eines Bulldozer-Kerns gegenüber einem "regulär" aufgebauten Kern (mit denselben Einheiten, aber ohne gesharter Pipeline) explizit auf Multithread-Anwendungen.

Damit ist nicht gesagt, wie das ganze unter Singlethread-Anwendungen ausschaut – welche regulär gesehen weniger Probleme mit den gesharten Teilen der Pipeline haben sollten, weil bei Singlethread-Anwendungen schließlich der zweite Kern gar nicht (oder nur geringfügig für System-Threads) benötigt wird und alle gesharten Pipeline-Teile somit nur einem Kern zur Verfügung stehen. Beides zusammengefaßt ergibt: Derzeit läßt sich noch gar keine vernünftige Aussage zur Performance pro Kern und Takt treffen – selbst die momentan bekannten technischen Details reichen dafür nicht aus. Zudem hat das Bulldozer-Design gemäß verschiedenen Quellen das Potential zu hohen Taktraten und desweiteren gibt es noch den verbesserten TurboCore, womit sich also auch eine nicht so hohe Performance pro Kern und Takt ausgleichen lassen würde. Für den Augenblick muß einfach noch offenbleiben, wie hoch AMD mit Bulldozer hinauskommt.

Im neuen Catalyst 10.8 tummeln sich schon reichlich Namensnennungen zu den einzelnen Southern-Islands-Grafiklösungen, welche einen guten Ausblick darauf ermöglichen, wie viele Grafikkarten-Varianten ATI insgesamt geplant hat. So werden zum HighEnd-Chip Cayman mit "Cayman LE", "Cayman Pro" und "Cayman XT" gleich drei Varianten genannt, möglicherweise umzusetzen in Radeon HD 6830, 6850 und 6870. Hinzu kommen auf Cayman-Basis dann auch noch die DualChip-Varianten "Antilles Pro" und "Antilles XT", ergo möglicherweise Radeon HD 6950 und 6970. Für den Performancechip Barts finden sich mit "Barts Pro" und "Barts XT" zwei Varianten, welche möglicherweise die Grafikkarten Radeon HD 6750 und 6770 ergeben. Der Mainstream-Chip Turks wird wieder mit zwei regulären Varianten "Turks Pro" und "Turks XT" genannt - hinzukommt kommt noch die bisher nicht einordenbare Sondervariante "Onega" auch auf Basis dieses Grafikchips.

Und letztlich wird der LowCost-Chip Caicos noch bei den Grafikkarten "Caicos Pro" und "Caspian Pro" genannt, wobei auch bei letzterer Variante wiederum nicht klar ist, wie diese angesichts des abweichenden Namens einzuordnen ist. Mit den verschiedenen Fusion-Produkten scheinen diese nichts zu tun zu haben, denn diese werden extra erwähnt. Daneben werden auch noch die Mobile-Abwandlungen der Southern-Islands-Generation genannt: Seymour als Mobile-Abwandlung von Caicos, Whistler als Mobile-Abwandlung von Turks und Blackcomb als Mobile-Abwandlung von Barts - wie früher schon an dieser Stelle notiert. Die Mobile-Codenamen ergeben natürlich keine anderen Chips - es sind die gleichen Chips wie im Desktop-Betrieb, ATI vergibt halt nur extra Codenamen.




Southern Islands
Desktop
Mobile
Chip-Details





LowCost
Caicos
zwei Varianten: Caicos Pro & Caspian Pro (Radeon HD 6400 Serie)
Seymour
zwei Varianten: Seymour LP & Seymour Pro/XT
geschätzt 64-192 Shader-Einheiten, wahrscheinlich 64 Bit DDR Speicherinterface



Mainstream
Turks
drei Varianten: Turks Pro, Turks XT & Onega (Radeon HD 6600 Serie)
Whistler
zwei Varianten: Whistler LP & Whistler Pro/XT
geschätzt 384-640 Shader-Einheiten, 24-40 TMUs, wahrscheinlich 128 Bit DDR Speicherinterface



Performance
Barts
zwei Varianten: Barts Pro & Barts XT (Radeon HD 6750 & 6770)
Blackcomb
zwei Varianten: Blackcomb LP & Blackcomb Pro/XT
geschätzt 800-1280 Shader-Einheiten, 50-80 TMUs, 128 oder 256 Bit DDR Speicherinterface mit 2500 MHz Speichertakt



HighEnd
Cayman
drei Varianten: Cayman LE, Cayman Pro & Cayman XT (Radeon HD 6830, 6850 & 6870)
-
angeblich 1920 Shader-Einheiten, 120 TMUs, 256 Bit DDR Speicherinterface mit 3000 MHz Speichertakt



DualChip
Antilles (2x Cayman)
zwei Varianten: Antilles Pro & Antilles XT (Radeon HD 6950 & 6970)
-
angeblich 3840 Shader-Einheiten, 240 TMUs, 2x 256 Bit DDR Speicherinterface





Zudem fehlt wie auch schon bei der Radeon HD 5000 Serie eine Abwandlung des HighEnd-Chips für das Mobile-Segment, hier hält ATI die Verlustleistung (nicht zu Unrecht) wohl zu groß für einen Mobile-Einsatz. Dies dürfte ATI natürlich wie schon bei der Mobility Radeon HD 5000 Serie nicht davon abhalten, mit "kreativen Bezeichnungen" zu arbeiten und daher dennoch eine "Mobility Radeon HD 6800" Serie zu erschaffen - nur eben mit dem Unterbau des Performance-Chips Barts/Blackcomb und nicht mit dem HighEnd-Chip Cayman. Wann diese mobilen Varianten kommen, läßt sich derzeit noch nicht ermessen, da nicht klar ist, wie weit ATI schon mit den einzelnen Chips der Southern-Islands-Generation ist. Auf jedes Erscheinungsdatum im Desktop-Bereich kann man im Mobile-Segment aber problemlos zwei bis drei Monate aufschlagen, die es dauert, um die neuen Chips seitens der Notebook-Hersteller sauber evaluieren zu lassen.



Wir müssen noch einmal auf das Thema der voraussichtlichen Performance von Bulldozer angesichts der neuen Informationen über den Aufbau dieser CPU-Architektur zurückkommen: AMDs Ansatz bei Bulldozer ist schließlich, die Performance von nahezu zwei Kernen mit möglichst geringem Silizium-Aufwand und auch nicht gerade der doppelten Verlustleistung hinzubekommen. Hinzu kommt noch der Punkt, daß ein Integer-Rechenkern von Bulldozer auf dem Papier nicht mehr so mächtig ist (zwei Ops pro Takt und Kern) wie die Integer-Kerne von K7, K8 und K10 oder die von Core 2 bzw. Nehalem (jeweils drei Ops pro Takt und Kern). Daß Teile der Pipeline nun zwei Integer-Kernen dienen müssen, dürfte zwar die Auslastung der Pipeline-Bausteine erhöhen, aber auch nicht unbedingt der Performance pro Rechenkern zuträglich sein.

So steht es wie gesagt auf dem Papier, allerdings gibt es gegenüber der These, daß Bulldozer damit eine niedrige Performance pro Rechenkern haben wird, gewichtige Einwände: Erstens einmal steht dem entgegen, daß die drei Integer-Einheiten der anderen genannten Prozessoren gewöhnlich sehr schlecht auszulasten sind - was auch illustriert wird durch den Punkt, daß in der Praxis die real erreichte Rechenleistung früherer Prozessoren irgendwo bei einem Ops pro Takt und Kern liegt. Der Verzicht auf die dritte Integer-Recheneinheit muß also nichts bedeuten, von der Performance pro Kern und Takt her kann Bulldozer problemlos auf der Höhe des K10-Prozessors und eventuell sogar über diesem liegen. Und zweitens bezieht sich die AMD-Aussage von der 80prozentigen Performance eines Bulldozer-Kerns gegenüber einem "regulär" aufgebauten Kern (mit denselben Einheiten, aber ohne gesharter Pipeline) explizit auf Multithread-Anwendungen.

Damit ist nicht gesagt, wie das ganze unter Singlethread-Anwendungen ausschaut - welche regulär gesehen weniger Probleme mit den gesharten Teilen der Pipeline haben sollten, weil bei Singlethread-Anwendungen schließlich der zweite Kern gar nicht (oder nur geringfügig für System-Threads) benötigt wird und alle gesharten Pipeline-Teile somit nur einem Kern zur Verfügung stehen. Beides zusammengefaßt ergibt: Derzeit läßt sich noch gar keine vernünftige Aussage zur Performance pro Kern und Takt treffen - selbst die momentan bekannten technischen Details reichen dafür nicht aus. Zudem hat das Bulldozer-Design gemäß verschiedenen Quellen das Potential zu hohen Taktraten und desweiteren gibt es noch den verbesserten TurboCore, womit sich also auch eine nicht so hohe Performance pro Kern und Takt ausgleichen lassen würde. Für den Augenblick muß einfach noch offenbleiben, wie hoch AMD mit Bulldozer hinauskommt.