Testumgebung und -settings

Montag, 14. Mai 2007
 / von BlackBirdSR & robbitop
 

Mit diesem Test kam ein von unseren üblichem Testsystem abweichendes PC-System zum Einsatz, welches mit einem auf 3 GHz übertakteten Core 2 Duo Prozessor dennoch genügend Leistung für die nachfolgenden Tests zur Verfügung sollte:

  Testsystem
Prozessor Intel Core 2 Duo E6400, Allendale-Core mit zwei Kernen (DualCore), 2133 MHz, Sockel 775, 2 MB Level2 Cache (shared), FSB1066
benutzte Taktfrequenzen für die eigentlichen Grafikkarten-Tests: 3000 MHz (8x375), FSB1500, DDR2/750 (Niveau ca. "X6800")
Mainboard Asus P5B, Sockel 775, Intel P965 + ICH8
Speicher 4x 1 GB Aeneon DDR2/667, Ratings: 5-5-5-15 @ DDR2/750
Soundkarte Creative SoundBlaster Audigy4
Festplatte Samsung P120, 250 GB, SATA1
Laufwerke Phillips DVD-RW 16x
Netzteil beQuiet Straight Power 600W
Peripherie HP f2105 Widescreen TFT, maximale Auflösung: 1680x1050
BenQ 757 Röhrenmonitor, maximale Auflösung: 1280x1024
Logitech MX700 Maus + HP OEM Keyboard
Software Microsoft Windows XP Professional, Service Pack 2 (inklusive DirectX 9.0c)
Grafikkarten Club3D Radeon X1900 XT 512MB, 625/625 MHz (Catalyst 7.4, "A.I. low")
Club3D Radeon HD 2900 XT 512MB, 740/825 MHz (Beta-Treiber 8.3742, "A.I. low")
Club3D GeForce 8800 GTX 768MB, 575/1350/900 MHz (Forceware 158.19, "Quality")

Zu beachten wäre hier vor allem der Umstand, daß wir die Tests der Radeon HD 2900 XT bereits mit dem erst am Freitag seitens ATI herausgegebenen neuen Beta-Treiber 8.3742 angegangen sind.

Bei der Radeon X1900 XT und der Radeon HD 2900 XT wurde bezüglich der Filtersettings generell "A.I. low" (die default-Einstellung) gewählt, zusätzlich war bei der Radeon X1900 XT das bessere, weil weitestgehend winkelunabhängige Area-AF aktiv (was bei der Radeon HD 2900 XT sowieso Standard ist). Bei der GeForce 8800 GTX wurde hingegen das Filtersetting "Quality" gewählt, weil diesen den Filterqualitäten der Vergleichskarten am nähesten kommt.

Als Testsettings wurden folgende Settings gewählt, welche die benutzten Grafikkarten sowohl nach unten (Radeon X1900 XT) als auch nach oben (GeForce 8800 GTX & Radeon HD 2900 XT) möglichst gut auslasten sollten:

  • 1280x1024 (5:4), 8x Anti-Aliasing, 16x anisotroper Filter
  • 1280x1024 (5:4) , 8x Anti-Aliasing + Custom Filter Anti-Aliasing (24x) bzw. Coverage Sample Anti-Aliasing (16xQ), 16x anisotroper Filter
  • 1680x1050 (16:10) , 4x Anti-Aliasing, 16x anisotroper Filter

Hierbei sollte unbedingt erwähnt werden, dass bei ATI im zweiten Setting das 24xCFAA mit Edge Detection und bei nVidia das 16xQ zum Einsatz kam. Da die Radeon X1900 XT weder CFAA noch 8xMSAA beherrscht, kann sie lediglich in letztem Setting gegen die beiden Direct3D10-Boliden antreten.

Bezüglich des Sounds wurden die Creative-Soundkarte üblicherweise mit maximaler Qualität und wenn möglich auf EAX 5.1 betrieben. In den Benchmark-Spielen selber wurde ausschließlich die maximal mögliche Bildqualität gewählt:

  • Anno 1701
    Version: 1.01, Settings: alles auf maximum
  • Armed Assault
    Version: 1.05, Settings: alles auf maximum
  • Gothic 3
    Version: 1.12, alles auf maximum
  • Need for Speed: Carbon
    Version: 1.3, Settings: alles auf maximum
  • Test Drive Unlimited
    Version: 1.0, Settings: alles auf maximum
  • Stalker: Shadow of Chernobyl
    Version: 1.001, Settings: alles auf maximum
  • The Elder Scrolls IV: Oblivion
    Version: 1.5.11, Settings: alles auf maximum, mit HDR-Rendering

Zusätzlich kamen noch folgende synthetischen Benchmarks zum Einsatz:

  • 3DMark06
  • D3D Rightmark
  • Fablemark
  • Villagemark
  • Shadermark 2.1 (Build 130a)

Wie mittlerweile bei uns üblich, haben wir zur Performance-Ermittlung wieder auf Savegames anstatt auf Timedemos zurückgegriffen. Dies ermöglichte uns, auch aufgrund der Kürze der Savegames, speziell nur jene Szenen herauszusuchen, welche wir auch wirklich vermessen wollten – während bei einem Timedemo meistens mehrere Szenen (und viel Leerlauf) auf einmal vermessen werden, welche aber jeweils unterschiedliche Performance-Charakteristiken aufweisen können. Ein Timedemo-Durchlauf verwischt diese unterschiedlichen Szenen und deren unterschiedliche Performance-Charakteristik aber immer zu einer einzelnen Performance-Aussage, was die Aussagekraft einer solchen Messung dann doch erheblich einschränkt.

Anstatt Messungen des eher durchschnittlichen Gameflusses mittels Timedemos stellen unsere Messungen ausgewählter kurzer Szenen über den Weg der Savegames somit eher Worstcase-Benchmarks dar: Wir messen dann, wenn die Hardware wirklich unter Stress gerät – und eben auch nur die jeweilige Szene und nicht noch jede Menge Leerlauf oder gleich eine andere Szene mit hinzu. Konkret können wir sogar behaupten, daß die für die jeweiligen Test-Spiele von uns verwendeten Szenen mit zu den stressigsten des gesamten jeweiligen Spiels gehören und demzufolge sicherlich sehr realitätsnah sind.

Dies bezieht sich jedoch rein nur auf den Singleplayer-Part der jeweiligen Spiele. Denn der Multiplayer-Modus der meisten Spiele unterscheidet sich oft gravierend in Sachen Anzahl der im Einsatz befindlichen Einheiten und darzustellender Effekte, wodurch sich die CPU- und GPU-Last deutlich vom "üblichen" Singleplayer-Gameplay unterscheiden kann. Natürlich ist bekannt, daß im Multiplayer-Modus üblicherweise zuerst die CPU deutlich mehr belastet wird, dennoch wollen wir unsere Benchmark-Ergebnisse sicherheitshalber nur auf den Singleplayer-Modus der jeweiligen Spiele bezogen wissen.

Von den benutzten Savegames wurden jeweils immer die ersten drei bis fünf Sekunden zur Messung benutzt, welche dabei immer mittels Fraps durchgeführt wurden. Dabei wurde jedes Savegame mehrfach ausgeführt wie gemessen und dann der Durchschnitt dieser Messungen als Ergebnis genommen. Die einzelnen Savegames wurden im übrigen nicht bewußt nach einer Grafikkarten- oder CPU-Limitierung ausgesucht, sondern es wurde nach ausgiebigem Spielen des jeweiligen Titels diese Szenen ausgewählt, welche uns am allgemeingültigsten und Hardware-fordernsten erschienen. Aufgrund der Kürze der für diesen Artikel zur Verfügung stehenden Zeit haben wir allerdings nur zwei der ansonsten vier üblichen Savegames pro Spiel vermessen.