Zum Launch von Radeon HD 6950 & 6970

Mittwoch, 15. Dezember 2010
 / von Leonidas
 

Lange erwartet, stellt AMD heute mit den Radeon HD 6950 & 6970 Grafikkarten endlich die "richtigen" Northern-Islands-Lösungen vor, nachdem der RV940/Barts-Chips der Radeon HD 6800 Serie noch zu deutliche Anleihen an der vorhergehenden RV8xx/Evergreen-Generation genommen hatte. Dabei kann man eventuell annehmen, daß durch die Leaks der letzten Tage vielleicht schon das meiste zu den beiden neuen Grafikkarten Radeon HD 6950 und 6970 gesagt ist – doch dem ist nicht so, es gibt noch einiges wichtiges zum RV970/Cayman-Chip zu berichten.

AMD Radeon HD 6950 & 6970

Doch zuerst doch zu den (teilweise schon bekannten) "Basics": Der RV970/Cayman-Chip bringt im Vollausbau 1536 4-D VLIW Shader-Einheiten, 96 Textureneinheiten (TMUs) und 32 Raster Operation Units (ROPs) mit einem 256 Bit DDR Speicherinterface in 2640 Millionen Transistoren auf 389mm² Chip-Fläche unter. Dies ist auf den ersten Blick nicht so deutlich mehr als beim vorhergehenden RV870/Cypress-Chip (1600 Shader-Einheiten, 80 TMUs, 32 ROPs, 256 Bit DDR Interface, 2150 Mill. Transistoren, 334mm² Chip-Fläche) und auch der Taktraten-Sprung der jeweils schnellsten Variante ist von 850/2400 MHz auf 880/2750 MHz eher geringfügig.

Radeon HD 5870 Radeon HD 6950 Radeon HD 6970 GeForce GTX 570 GeForce GTX 580
Chipbasis AMD RV870/Cypress, 2150 Millionen Transistoren in 40nm auf 334mm² Chip-Fläche AMD RV970/Cayman, 2640 Millionen Transistoren in 40mn auf 389mm² Chip-Fläche nVidia GF110, ca. 3000 Millionen Transistoren in 40mn auf ca. 550mm² Chip-Fläche
Technik DirectX 11, 1 Raster Engine (mit verdoppeltem Triangle-Setup), 1600 5-D VLIW Shader-Einheiten, 80 TMUs, 32 ROPs, 256 Bit DDR Interface (bis GDDR5) DirectX 11, 2 Raster Engines, 1408 4-D VLIW Shader-Einheiten, 88 TMUs, 32 ROPs, 256 Bit DDR Interface (bis GDDR5) DirectX 11, 2 Raster Engines, 1536 4-D VLIW Shader-Einheiten, 96 TMUs, 32 ROPs, 256 Bit DDR Interface (bis GDDR5) DirectX 11, 4 Raster Engines, 480 1-D Shader-Einheiten, 60 TMUs, 40 ROPs, 320 Bit DDR Interface (bis GDDR5) DirectX 11, 4 Raster Engines, 512 1-D Shader-Einheiten, 64 TMUs, 48 ROPs, 384 Bit DDR Interface (bis GDDR5)
Taktraten 850/2400 MHz 800/2500 MHz 880/2750 MHz 732/1464/1900 MHz 772/1544/2004 MHz
Speicherausbau 1024 MB GDDR5 2048 MB GDDR5 2048 MB GDDR5 1280 MB GDDR5 1536 MB GDDR5
Layout DualSlot DualSlot DualSlot DualSlot DualSlot
Kartenlänge 282nm 275mm 275mm 267mm 267mm
Stromanschlüsse 2x 6pol. 2x 6pol. 1x 6pol. + 1x 8pol. 2x 6pol. 1x 6pol. + 1x 8pol.
Stromverbrauch 27/-/188W 20/140/200W 20/190/250W -/-/219W -/-/244W
Preislage 230-270 Euro ca. 260 Euro ca. 330 Euro 330-360 Euro 450-480 Euro
Stromverbrauch lt. offiziellen Herstellerangaben: Idle/TGP/TDP-Verbrauch, TGP = Typical Gaming Power, TDP = Thermal Design Power; AMD gibt für die Radeon HD 6950/6970 keine TDP mehr an, sondern nur noch ein "PowerTune Maximal Limit", was aber grob einer TDP gleichzusetzen ist

Allerdings ist viel mehr innerhalb der 40nm-Fertigung und dem offensichtlich von AMD ins Auge gefassten Ziel, auch bei diesem HighEnd-Chip wieder unter 400mm² Chip-Fläche zu bleiben, gar nicht machbar – und letztlich hat nVidia kürzlich mit dem GF110-Chip von GeForce GTX 570 & 580 auch nur einen ähnlich kleinen Sprung zur Vorgänger-Generation hingelegt. AMDs RV970/Cayman-Chip ist ganz klar der Versuch, ohne deutlich größeren Produktionsaufwand noch den letzten Rest aus der 40nm-Fertigung herauszupressen. Da demzufolge die Einheiten-Anzahl nur in geringem Maße steigerbar war, hat sich AMD beim RV970/Cayman-Chip in erster Linie auf Effizienzsteigerungen verlegt. Erwähnenswert sind hierbei insbesondere drei Punkte, welche das RV970/Cayman-Design vom RV870/Cypress-Design (und auch vom RV940/Barts-Design) unterscheiden:

4-D VLIW anstatt 5-D VLIW Shader-Einheiten

Ein Shader-Cluster von RV970/Cayman besteht nunmehr aus nur noch 64 Shader-Einheiten, die als 16 Shader-Prozessoren mit jeweils der Fähigkeit, 4 Befehle pro Takt zu bearbeiten, angeordnet sind. Bisher hatte AMD 5-D VLIW Shader-Einheiten verbaut (16 Shader-Prozessoren à 5 Befehle), was jedoch in gewissem Sinne uneffektiv war: Diese 5-D Einheiten konnten nicht immer gut ausgelastet werden, mit den 4-D Einheiten steigt nun die Auslastung der Shader-Einheiten. Im allerbesten Fall erreicht AMD mittels dieser Maßnahme bei gleicher Anzahl an insgesamten Shader-Einheiten 25 Prozent mehr Rechenleistung, in einem typischen Fall sollen es ca. 15 Prozent mehr Rechenleistung durch die Umstellung auf 4-D VLIW Shader-Einheiten sein.

Verdoppelte Raster-Engine

Beim RV970/Cayman-Chip geht AMD einen ähnlichen Weg wie nVidia und setzt die Raster-Engine gleich vollständig mehrfach an – im Fall des RV970/Cayman-Design ist es eine Verdopplung gegenüber dem RV870/Cypress-Design (nVidia GF100/GF110: 4fach). Damit wird die gesamte Vorbereitung des eigentliche Render-Prozesses beschleunigt und vor allem mögliche Flaschenhälse im Frontend des Grafikchips vorbeugend beseitigt. Damit geht AMD einen der Schwachpunkte des RV870/Cypress-Designs an, welcher seine übermäßige Rechenkraft teilweise nicht in Performance umwandeln konnte – wahrscheinlich eben deswegen, weil das nur einfach ausgelegte Frontend dann limitierte. Der Effekt dieser Maßnahme läßt sich leider nur schätzen, sollte aber eigentlich für 10 Prozent allgemeiner Performance gut sein. Daneben hat AMD die (nun ebenfalls doppelt ausgelegte) Tesselations-Einheit innerhalb der Raster-Engine nochmals überarbeitet und verspricht nun bis zum dreifachen der Tesselations-Performance wie beim RV870/Cypress-Design.

Verbesserte ROPs

Die Anzahl der Raster Operation Units (ROPs), welche vor allem für die Performance von Anti-Aliasing wichtig sind, hat sich beim RV970/Cayman-Chip zwar nicht verändert, allerdings hat AMD diese etwas umgearbeitet. So sollen die neuen ROPs unter bestimmten Bedingungen (INT16- und FP32-Datenformate) zwischen 2fach und 4fach so schnell wie die ROPs des RV870/Cypress-Designs sein. Da diese Bedingungen unter Spielen aber derzeit kaum gegeben sind (dort werden meist die Datenformate INT8 und FP16 verwendet), ist dies eher als Verbesserung für die Zukunft zu sehen, welche derzeit kaum beachtbare Performance-Auswirkungen haben sollte.

Damit ist AMD letztlich in der Lage, aus einer ähnlichen Anzahl an Hardware-Einheiten doch mehr Performance herauszuholen – unser an dieser Stelle üblicher Rohleistungvergleich ist in diesem Augenblick dann kaum noch zielführend, weil dieser die vorbeschriebenen Effizienzsteigerungen natürlich nicht abbilden kann:

Rohleistungs-Vergleich Radeon HD 5870, 6950 & 6970 sowie GeForce GTX 570 & 580

So liegt die Radeon HD 6950 von den Rohleistungen her klar hinter der Radeon HD 5870, in der Praxis liegt die neuere Karte durch ihre Effizienzsteigerungen von der Performance her aber knapp vor der älteren Karte. Der Vergleich der Rohleistungen ist immer nur innerhalb derselben Architektur sinnvoll – bei Radeon HD 6950 und 6970 beispielsweise zur Bestimmung der Rohleistungs-Differenz zwischen diesen Karten, welcher in etwa bei 15 Prozent liegt.