Eckdaten zu den AMD-Grafikchips Cayman und Barts

Donnerstag, 23. September 2010
 / von Leonidas
 

Aus unserem Forum ergeben sich von einer zuverlässigen und fachkundigen Quelle die Information darüber, mit welcher Anzahl an Shader-Einheiten die kommenden AMD-Grafikchips Cayman (HighEnd, Radeon HD 6800/6900 Serien) und Barts (Performance, Radeon HD 6700 Serie) nun wirklich antreten werden. Wir haben demzufolge die bekannten Eckpunkte zu diesen beiden Grafikchips zusammengetragen und werden nachfolgend auf Basis des bekannten – wenngleich natürlich weiterhin unvollständigen – Wissens eine Performance-Prognose zu diesen abgegeben.

Und damit zur bewußten Anzahl der Shader-Einheiten: Danach soll AMDs kommender HighEnd-Chip Cayman in der Tat mit 1920 Shader-Einheiten und der dazugehörige Performance-Chip Barts mit 960 Shader-Einheiten antreten – letzteres entspricht dann im übrigen auch der kürzlich gezeigten AMD-Präsentationsfolie. Die konkrete Information sagte dabei "Cayman = Cypress + 4 Cluster sowie Barts = Juniper + 2 Cluster" aus und nennt somit keine konkrete Anzahl an Shader-Einheiten, die von uns vorgenannten Zahlen ergeben sich somit nur dann, wenn AMD weiterhin 80 Shader-Einheiten pro Shader-Cluster verbaut.

Andererseits spricht die genannte AMD-Präsentationsfolie auch von weiterhin 80 Shader-Einheiten pro Shader-Cluster und zudem würde ein Modell mit nur 64 Shader-Einheiten pro Shader-Cluster letztlich eine sogar geringere Anzahl an Shader-Einheiten bei Cayman & Barts gegenüber den Vorgängerchips ergeben und ist somit arg unwahrscheinlich. Damit scheinen die Eckdaten dieser zwei Chips zu stehen: Cayman kommt mit 1920 Shader-Einheiten und 96 Textureneinheiten an einem 256 Bit DDR Speicherinterface mit (höchstwahrscheinlich) 32 ROPs daher (die Anzahl der Cayman-TMUs ergibt sich automatisch aus der Anzahl der Shader-Einheiten), während Barts mit 960 Shader-Einheiten und 48 Textureneinheiten am gleichen 256 Bit DDR Speicherinterface mit 32 ROPs antritt (wie schon in der AMD-Folie genannt).

Barts Cayman
Ausrichtung Performance-Segment, Kontrahent GeForce GTX 460 HighEnd-Segment, Kontrahent GeForce GTX 480
Technik 12 Shader-Cluster mit 960 Shader-Einheiten und 48 TMUs, 32 ROPs, 256 Bit DDR Speicherinterface (bis GDDR5) 24 Shader-Cluster mit 1920 Shader-Einheiten und 96 TMUs, 32 ROPs, 256 Bit DDR Speicherinterface (bis GDDR5)
Vergleich zum Vorgänger gegenüber RV840/Juniper:
960 vs. 800 Shader-Einheiten (+20%)
48 vs. 40 TMUs (+20%)
32 vs. 16 ROPs (+100%)
256 vs. 128 Bit DDR Speicherinterface (+100%)
gegenüber RV870/Cypress:
1920 vs. 1600 Shader-Einheiten (+20%)
96 vs. 80 TMUs (+20%)
32 vs. 32 ROPs (+0%)
256 vs. 256 Bit DDR Speicherinterface (+0%)
sonstige Veränderungen "Cypress Dual Engine Architecture", möglicherweise verbesserte Tesselations-Leistung veränderte Raster-Engine mit verbesserter Tesselations-Leistung
Performance-Prognose mit 5-D VLIW Shader-Einheiten: +25-40%
mit 4-D VLIW Shader-Einheiten: +40-60%
(gegenüber RV840/Juniper)
mit 5-D VLIW Shader-Einheiten: +20-30%
mit 4-D VLIW Shader-Einheiten: +30-45%
(gegenüber RV870/Cypress)
Varianten Radeon HD 6750 (800SE, 40TMU, 725/2000 MHz)
Radeon HD 6770 (850/2100 MHz)
Radeon HD 6800 Serie
Radeon HD 6900 Serie (DualChip)

Der Aufbau der Shader-Cluster mit jeweils 80 Shader-Einheiten und 4 TMUs bleibt dabei gleich – wenngleich es nach wie vor möglich ist, daß AMD trotzdem nicht mehr die bisherigen 5-D VLIW Shader-Einheiten, sondern die effizienteren 4-D VLIW Shader-Einheiten verbaut. Dafür müsste man – wie hier schon ausgeführt – die Wavefrontsize und damit einige wichtige Pipeline-Teile verändern, prinzipiell machbar ist dies aber schon. Zudem gibt es in den AMD-Treibern einen klaren Hinweis darauf, daß AMD den Schritt hin zu 4-D VLIW Shader-Einheiten bei der "Northern Islands" Generation definitiv getan hat – was wiederum die (derzeit nicht sicher zu beantwortende) Frage aufwirft, ob Cayman, Barts, Turks und Caicos nun wirklich "Southerns Islands" oder doch "Northerns Islands" sind.

Allerdings bedeutet die derzeitige Nichtbeantwortbarkeit der Frage, ob 4-D oder 5-D VLIW Shader-Einheiten bei AMDs kommenden Grafikchips verbaut sind, mitnichten, daß man diese Chips nicht doch einschätzen könnte. Der HighEnd-Chip Cayman geht schließlich mit 20 Prozent mehr Hardware-Einheiten ins Rennen, die Chip-Taktraten dürften aufgrund der Weiterbenutzung der 40nm-Fertigung nicht wesentlich ansteigen, während man beim Speichertakt mit rund 3000 MHz und damit rund 25 Prozent mehr Speicherbandbreite rechnen kann. Hinzu kommen noch derzeit nicht quantifizierbare Veränderungen an der Raster-Engine samt einer Steigerung der Tesselations-Leistung. Mit den herkömmlichen 5-D VLIW Shader-Einheiten dürfte dies für 20 bis 30 Prozent Mehrperformance gegenüber dem Vorgänger RV870/Cypress reichen, wenn schon die effizienteren 4-D VLIW Shader-Einheiten verbaut sind, liegt der Schätzbereich bei 30 bis 45 Prozent.

Der Barts-Chip sieht auf den ersten Blick ziemlich ähnlich aus: Auch wieder 20 Prozent mehr Hardware-Einheiten und wiederum Chip-Taktraten, die durch die aktuelle 40nm-Fertigung limitiert kaum wesentlich steigen können. Aber dann kann Barts gewichtige Vorteile in die Waagschale werfen: Durch das verdoppelte Speicherinterface steigt die Speicherbandbreite selbst bei nur mäßig getaktetem GDDR5-Speicher um zwischen 50 und 75 Prozent, hinzu kommt die bessere Performance unter Anti-Aliasing durch die glatte verdoppelte Anzahl der Raster Operation Units (ROPs). Zudem läßt sich bei Barts die Veränderung der Raster-Engine etwas besser quantifizieren: Barts soll die von RV870/Cypress her bekannte "Dual Engine" haben, was dem neuen Performance-Chip ebenfalls auf die Sprünge helfen sollte. Die Performance-Prognose für Barts lautet somit: Mit den herkömmlichen 5-D VLIW Shader-Einheiten vielleicht 25 bis 40 Prozent gegenüber dem Vorgänger RV840/Juniper, mit den effizienteren 4-D VLIW Shader-Einheiten dann vielleicht 40 bis 60 Prozent.

Rohleistungs-Vergleich Radeon HD 5770, 6750, 6770, 5830, 5850, 5870 & 6870

Damit kann AMD durchaus die primäre Ziele dieser Grafikchip-Generation erreichen, den aktuellen Fermi-Chips gleichschnelle bzw. etwas schnellere Lösungen entgegenzustellen. Wie genau dies dann passt, hängt an derzeit noch nicht sicheren Faktoren und letztlich auch an den finalen Taktraten – aber das Potential dafür ist zweifelsfrei vorhanden. Allerdings ist es eher unwahrscheinlich, daß AMD mit diesen Chips nVidia deutlich davonzieht – im besten Fall kann sich AMD mittels Barts einen gewissen Vorsprung vor der GeForce GTX 460 und mit Cayman einen gewissen Vorsprung vor der GeForce GTX 480 erarbeiten. Dieser Vorsprung dürfte aber nicht so hoch ausfallen, als daß nVidia nicht doch noch kontern könnte.

Demzufolge kann es sich AMD sicherlich nicht leisten, mit deutlich höheren Preisen für die einzelnen Barts- und Cayman-Lösungen anzutreten. Wir würden vermuten, daß AMD Barts in etwa zu den Preisen der GeForce GTX 460 ansetzt (Preislage 140 bis 200 Euro) und Cayman in etwa zu den Preisen der Radeon HD 5800 Serie zu derem Launch (Preislage 300 bis 450 Euro), also etwas höher als die aktuelle Preise der Radeon HD 5800 Serie. Dies würde AMD das etwas bessere Preis/Leistungsverhältnis gegenüber nVidia bescheren und es nVidia nahezu unmöglich machen, mit den bestehenden nVidia-Lösungen AMD allein über den Preis anzugreifen – nVidia würde dafür neue Hardware mit mehr Leistung benötigen.

Im Fall des Zweikampfs Barts vs. GeForce GTX 460 wäre dies für nVidia ziemlich einfach zu realisieren mittels einer GF104-basierten Karte im Vollausbau und mit mehr Taktrate – damit kann nVidia problemlos noch einmal 20 Prozent oben drauf legen, bei Bedarf sogar noch etwas mehr. Was nVidia im Fall des Zweikampfs Cayman vs. GeForce GTX 480 noch tun kann, bliebe abzuwarten – ein GF100-Chip im Vollausbau bringt nun nicht so viel mehr und ob der GF100-Chip noch über die Reserven für deutlich höhere Taktraten verfügt, wäre erst einmal zu bezweifeln. Andererseits scheint nVidia mit dem GF110-Chip ein neues heisses Eisen für das HighEnd-Segment in Vorbereitung zu haben, welches dann den Part des Cayman-Kontrahenten übernehmen könnte.

Der mögliche Konter von nVidia ist allerdings Zukunftsmusik, erst einmal wird AMD anscheinend Mitte/Ende Oktober die neue Grafikchip-Generation mit den Chips Cayman (HighEnd, Radeon HD 6800/6900 Serien), Barts (Performance, Radeon HD 6700 Serie), Turks (Mainstream) und Caicos (LowCost) vorstellen. Wie schnell die einzelnen Grafikkarten basierend auf diesen neuen Grafikchips dann kaufbar sein werden, ist derzeit noch nicht bekannt, die Schätzungen gehen von Oktober bis sogar Januar 2011. Die genauen Auslieferungstermine und alle derzeit noch fehlenden Daten dürften sich aber in nächster Zeit automatisch ergeben, notiert in unserem News-Bereich bzw. auf der Übersichtsseite zu den kommenden AMD-Grafikchips.

Nachtrag vom 24. September 2010

Als Nachtrag zu diesem Artikel wäre anzufügen, daß derzeit noch viele Möglichkeiten offen sind – wie beispielsweise diese, daß AMD die großen Veränderungen nur am HighEnd-Chip Cayman vornimmt und die kleineren Chips derselben Serie sich viel stärker an der aktuellen RV8xx/Evergreen-Architektur ausrichten. Dies trifft besonders für die Frage nach den 4-D oder 5-D VLIW Shader-Einheiten zu: Unter Umständen hat Cayman diese effizienteren Shader-Einheiten, Barts und die weiteren kleineren Chips der Serie aber nicht – wie gesagt ist in dieser Frage noch alles möglich, womit unserer Performance-Prognosen im Artikel ja auch zweifach ausgeführt wurden, für beide möglichen Fälle.

Und da natürlich an dieser Stelle die Frage nach einer genaueren Erklärung der 4-D und 5-D VLIW Shader-Einheiten auftaucht: AMD benutzt seit dem R600-Chip (Radeon HD 2900 Serie) ein Design, wo fünf Shader-Einheiten so zusammengeschlossen sind, daß diese mittels eines Befehlsblocks gleichzeitig angesprochen werden. Für ein solches Modell der zusammengefassten Shader-Einheiten ist eine gute Auslastung mit entsprechendem Code, der jeder Recheneinheit auch etwas zu tun gibt, natürlich elementar – und in der Praxis hat AMD festgestellt, daß man die fünfte Einheit der Chip-Designs von R600 bis RV870/Cypress (Radeon HD 5800/5900 Serien) eher selten auslastet (die sogenannte T-Einheit). Demzufolge will man zukünftig nur noch vier Shader-Einheiten so zusammenfassen, daß sie mit einem Befehlsblock gleichzeitig angesprochen werden.

Das ganze soll im besten Fall zu 98,5 Prozent so effizient wie ein Modell mit 5-D Einheiten sein – sprich, wenn man bei einem Chip wie dem RV870/Cypress mit seinen 1600 Shader-Einheiten in 5-D Anordnung die fünfte Shader-Einheit jeweils komplett weglassen würde, sollte trotz der Reduktion auf dann nur noch 1280 Shader-Einheiten die Rechenleistung nur 1,5 Prozent niedriger liegen. Wenn man dann diesen 4-D Chip wieder mit 1600 Shader-Einheiten (aber eben in 4-D Anordnung) ausrüstet, würde man mit nunmehr wieder der gleichen Anzahl an Recheneinheiten auf der einen Seite 1,5 Prozent verlieren, auf der anderen Seite 25 Prozent mehr effektive Recheneinheiten gewinnen. Ein 4-D Chip mit der gleichen Anzahl an Recheneinheiten wie ein 5-D Chip wäre also klar schneller, bei unveränderten Taktraten und keinen sonstigen Änderungen in der Praxis um 10 bis 15 Prozent.

Sollte AMD bei den kommenden Grafikchips also schon 4-D VLIW Shader-Einheiten verbauen, wären die für den Cayman-Chip genannten 1920 Shader-Einheiten also bedeutend höhergewichtig als wenn dies "nur" 5-D Einheiten wären. AMD müsste vergleichsweise rund 2360 5-D Shader-Einheiten ansetzen, um auf die gleiche praktische Rechenleistung wie mit 1920 4-D Shader-Einheiten zu kommen – und 2360 Shader-Einheiten gegen die 1600 Shader-Einheiten des RV870/Cypress-Chips hören sich dann schon ganz anders an als 1920 vs. 1600 Einheiten. Aber wie gesagt ist es derzeit ungewiß, ob AMD bei den kommenden Grafikchips schon die geplanten 4-D VLIW Shader-Einheiten verbaut. Genauere Erklärungen zu den einzelnen Anordnungen der Shader-Einheiten – 1-D, 4-D und 5-D – sind daneben auch einem älteren Thread unseres Forums zu entnehmen.