28

ComputeShader Raytracing Benchmarks verschiedener Grafikkarten

In unserem Forum startet gerade ein neuer Benchmark, welcher sich mit der Leistungsfähigkeit der mit DirectX 11 eingeführten ComputeShadern befasst. Der Benchmark selber besteht aus einer schlichten Raytracing-Animation, bedient sich aber eben nicht der üblichen DirectX-Renderingmechanismen, sondern greift allein auf die CompuShader-Funktionalität zu und bildet somit allein die GPGPU-Rechenleistung eines Grafikchips ab. Der Benchmark selber ist noch nicht perfekt, da verschiedene Seiteneffekte wie ein aktiver MSI Afterburner oder ein Framelimiter einen erheblichen Einfluß auf die Ergebnisse haben können und manches im Forum gepostetes Ergebnis daher (noch) etwas aus dem Rahmen fällt. Nachfolgend die geposteten sinnvollen Ergebnisse unter der zweiten, korrigierten Version des ComputeShader Raytracing Benchmarks:

(Archit.) (GFlops) (GB/sec) ComputeShader Raytracing
Radeon HD 6630M VLIW5 466 GFlops 25,6 GB/sec 47 fps
Radeon HD 6850M VLIW5 1080 GFlops 25,6 GB/sec 86 fps
Radeon HD 5770 VLIW5 1360 GFlops 76,8 GB/sec 128 fps
Radeon HD 5870 VLIW5 2720 GFlops 153,6 GB/sec 251 fps
Radeon HD 6870 VLIW5 2016 GFlops 134,4 GB/sec 212 fps
Radeon HD 6950 VLIW4 2253 GFlops 160 GB/sec 235 fps
Radeon HD 7970 OC GCN 5325 GFlops 307,2 GB/sec 584 fps
Radeon HD 7970 OC CrossFire GCN 10240 GFlops 614,4 GB/sec 1110 fps
GeForce GTX 460 Fermi 907 GFlops 115,2 GB/sec 158 fps
GeForce GTX 480 Fermi 1345 GFlops 177,4 GB/sec 232 fps
GeForce GTX 560 Ti Fermi 1263 GFlops 128 GB/sec 227 fps
GeForce GTX 570 Fermi 1405 GFlops 152 GB/sec 244 fps
GeForce GTX 580 Fermi 1581 GFlops 192 GB/sec 278 fps
GeForce GTX 680 Kepler 3090 GFlops 192 GB/sec 484 fps

Auffallend ist zum einen, daß sich die neueren Architekturen GCN (AMD) und Kepler (Fermi) überaus deutlich absetzen können – weit stärker als bei der Gaming-Performance dieser Grafikkarten sonst zu sehen. Zum anderen ist dagegen überraschend, daß der in Bezug auf GPGPU-Fähigkeiten doch arg gekürzte GK104-Chip der GeForce GTX 680 weiterhin so gut mithalten kann. Normalerweise hätte man in dieser Frage den GCN-Chip R1000/Tahiti der Radeon HD 7900 Serie klarer vorn erwartet – jener gewinnt diesen Benchmark zwar, allerdings nur unter einer extrem starken Übertaktung. Ohne Übertaktung dürften Radeon HD 7970 und GeForce GTX 680 unter diesem Benchmark wohl auf den ungefähr gleichen Wert kommen – wie gesagt überraschend angesichts der vielen GPGPU-Transistoren, die AMD in den R1000/Tahit-Chip verbaut hat und der vielen GPGPU-Kürzungen von nVidia beim GK104-Chip.