13

AMDs Vega 10 kommt mit 12,5 TFlops Rechenleistung und 512 GB/sec Speicherbandbreite

Von verschiedenen Quellen kommen Berichte über das herein, was AMD auf seinem kürzlichen "Tech Summit" zu seinem kommenden Vega-Grafikchip gesagt hat bzw. was sich aus der dort abgelaufenen Ankündigung des Vega-basierten GPGPU-Beschleunigers "Radeon Instinct MI25" ergibt. Jene neue Serie an GPGPU-Beschleunigern für DeepLearning-Aufgaben besteht derzeit aus drei Modellen, wobei jeweils die grobe FP16-Rechenpower im Modellnamen angegeben wird – sprich, die Radeon Instinct MI25 hat also (grob) satte 25 TFlops an FP16-Power. Da diese extrem hohe FP16-Rechenpower sicherlich nicht mit gewöhnlichen Rechenwerken darstellbar ist bzw. von der Playstation 4 Pro sowieso schon bekannt ist, das deren (Vega-naher) Grafikchip über eine doppelte FP16-Geschwindigkeit verfügt, dürfte auch die Radeon Instinct MI25 bzw. der zugrundeliegende Vega-Chip über genau dieses Feature verfügen – eine doppelte FP16-Geschwindigkeit. Die FP32-Rohleistung dieser Karte wird somit grob bei 12,5 TFlops liegen.

Als weiteres (wichtiges) Detail notiert die ComputerBase eine Speicherbandbreite von 512 GB/sec, welche ein AMD-Mitarbeiter allerdings eher ungewollt genannt hatte – diese Angabe wollte AMD somit derzeit eigentlich noch nicht in der Öffentlichkeit stehen sehen. Jene 512 GB/sec lassen sich unter HBM2 mit zwei Methoden erreichen: Erstens ein 4096 Bit Speicherinterface mit 4 HBM2-Stacks auf allerdings eher niedrigen 500 MHz Speichertakt – oder ein 2048 Bit Speicherinterface mit 2 HBM2-Stacks auf 1000 MHz Speichertakt, letzteres ist der höchste Takt, für welchen HBM2 geplant ist. Aller Wahrscheinlichkeit nach wird es letztere Lösung werden, da jene wirtschaftlich viel effizienter ist (nur 2 anstatt 4 HBM2-Stacks, damit ist ein kleinerer und günstigerer Interposer realisierbar). Mit zwei HBM2-Stacks sind dann Speichermengen von (insgesamt) 8 oder 16 GB realierbar – mehr wäre gemäß der HBM2-Spezifikation auch denkbar, allerdings werden HBM2-Stacks mit noch größeren Speichermengen seitens der HBM2-Hersteller Hynix und Samsung derzeit nicht angeboten.

Der exakte verwendete Vega-Grafikchip – Vega 10 oder Vega 11 – wurde von AMD im übrigen nicht genannt, allerdings deuten alle diese Daten (inklusive auch der TDP unterhalb von 300 Watt) klarestmöglich auf Vega 10 als benutzten Chip-Unterbau hin, sprich den größeren der beiden Vega-Chips. Bei Gaming-Lösungen basierend auf diesem könnte dann die Rechenleistung sogar noch etwas höher als die genannten 12,5 TFlops sein, da AMD seine Profi-Lösungen in aller Regel immer etwas niedriger ansetzt als die Gaming-Lösungen. Dies deutet dann im übrigen auf die Verwendung von mehr als 4096 Shader-Einheiten hin – denn angenommen nur 4096 Shader-Einheiten bräuchte man schon 1526 MHz Chiptakt, um jene 12,5 TFlops FP32-Rechenleistung zu erreichen.

AMDs Grafikchips sind aber generell nicht derart taktfreudig, selbst ein anderer Chipfertiger dürfte daran nichts ändern (wie nVidias GP106-Chip von Samsung beweist, der trotz der zu GlobalFoundries identischen 14nm-Fertigung nVidia-typisch hoch taktet). Eher vorstellbar wäre daher der Verbau von gleich 6144 Shader-Einheiten – welche auf den Profimodellen dann mit bis zu 1000 MHz Chiptakt betrieben werden, was grob 12,5 TFlops FP32-Rechenleistung ergibt. Auf den Gamer-Lösungen könnten dann auch noch höhere Boost-Taktraten in Richtung grob 1100 MHz existieren, je nachdem was Chipfertigung, Kühlung und realer Stromverbrauch dann noch hergeben. Diese mittlern Taktraten sind AMD viel eher zuzutrauen als gleich der Sprung auf 1500 MHz Chiptakt – aber in dieser Frage sind nach wie vor noch alle Möglichkeiten offen, auch "nur" 4096 Shader-Einheiten mit dementsprechend hohem Chiptakt (sowie alle Zwischenvarianten) denkbar.

Eine Vega-10-basierte Gaming-Lösung kann somit unter Einbeziehung von defensiver sowie offensiver Hochrechnung auf grob 12-14 TFlops FP32-Rechenleistung samt 512 GB/sec Speicherbandbreite angesetzt werden. Gegenüber dem Fiji-Chip der Radeon R9 Nano/Fury Serie wäre dies ein Zugewinn von 40-63% bei der Rechenleistung zu allerdings derselben Speicherbandbreite, gegenüber nVidias Titan X (Pascal) würde AMD hiermit 6-23% mehr Rechenleistung samt 7% mehr Speicherbandbreite aufbieten. Sofern nVidia den zugrundeliegenden GP102-Chip eines Tages noch einmal im Vollausbau ins Gaming-Segment bringt, würde der Vorteil bei der Rechenleistung sogar auf 0-15% schrumpfen. Grob gesehen geht der Vega-10-Chip somit von seiner Rohleistung her in dieselbe Kategorie wie nVidias GP102-Chip.

AMD nVidia
Vega 10
12-14 TFlops & 512 GB/sec
4K Perf.Index grob geschätzt ~125-140%
GP102
Titan X: 3584 SE @ 384 Bit GDDR5X
11,3 TFlops & 480 GB/sec
4K Perf.Index 173%
- GP104
GTX 1080: 2560 SE @ 256 Bit GDDR5X
8,7 TFlops & 320 GB/sec
4K Perf.Index 132%
Fiji
Fury X: 4096 SE @ 4096 Bit HBM1
8,6 TFlops & 512 GB/sec
4K Perf.Index 100%
GM200
980Ti: 2816 SE @ 384 Bit GDDR5
6,3 TFlops & 336 GB/sec
4K Perf.Index 100%

Ob AMD auch dieselbe Performance aus dieser vergleichbaren Rohleistung herausholt, bliebe allerdings die Praxis abzuwarten – bislang jedenfalls liegt nVidia in dieser Frage klar vorn und kann aus der gleichen Rohleistung üblicherweise mehr Performance generieren. Für AMD würde es allerding glatt schon reichen, die GeForce GTX 1080 (8,7 TFlops & 320 GB/sec) angreifen zu können, im nicht existierenden Gegenangebot zur GeForce GTX 1070 & 1080 drückt AMD derzeit am meisten der Schuh. Dies könnte Vega 10 aller Wahrscheinlichkeit nach sogar leisten, wie ein von Golem aufgefangener Benchmark-Wert mit einem frühen Grafikkarten-Sample unter Doom (2016) belegt: Unter UltraHD und der Ultra-Qualitätsstufe erreichte man unter der Vulkan-API erstklassige 68 fps (die benutzte Vega-Grafikkarte meldete sich im übrigen mit als 8 GB Speicher ausgerüstet an), laut der Einschätzung von Golem ist dies nahezu das Doppelte einer Radeon RX 480 sowie "etwas flotter" als eine GeForce GTX 1080.

Verglichen mit den früheren Doom-Benchmarks der PC Games Hardware fällt allerdings auf, das diese 68 fps auch nicht brutal schneller als eine Radeon R9 Fury X (54,5 fps) sind, sondern gerade einmal ~25% schneller als diese. Doom (2016) ist halt – speziell unter der Vulkan-API – eine Paradedisziplin der AMD-Beschleuniger und daher sollte man unter diesem Benchmark eher nur AMD-intern vergleichen und keine Quervergleiche zu nVidia anstellen, aus denen man dann Schlüsse auf eine allgemeine Performance hin zieht. Jene +25% auf die Performance der Radeon R9 Fury X (4K Perf.Index 100%) oben drauf gelegt würde nämlich ergeben, das eine solche Vega-basierte Grafikkarte nur eher knapp das Performance-Niveau der GeForce GTX 1080 (4K Perf.Index 132%) erreicht – zumindest im jetzigen klaren Vorserien-Status außerhalb finaler Taktraten sowie ohne auf die Vega-Architektur optimierter Treiber (das Vega-Sample lief unter Doom nur mit einem leicht angepassten Fiji-Treiber). Es wäre besser, daher nur von einem Performance-Ziel "GeForce GTX 1080" für Vega 10 auszugehen – wenn es mehr wird, soll dies nicht zum Nachteil der Grafikkarten-Käufer sein.

Nachtrag vom 13. Dezember 2016

Der seitens Golem gezeigte Benchmark-Wert einer Vega-10-Grafikkarte unter Doom (2016) gibt im übrigen für die dort benutzte Karte dieselbe Device-ID "687F:C1" aus, wie sie kürzlich zu einem AotS-Benchmarkwert genannt wurde. Zu diesem AotS-Benchmarkwert wurde noch über eine (angebliche) Radeon RX 490 oder gar eine DualChip-Lösung spekuliert (inzwischen hat AMD sogar bestätigt, das die Vega-10-basierte Radeon Instinct MI25 eine SingleChip-Lösung darstellt) – diese Spekulationen fallen nun in sich zusammen, als 2017er Produkt dürfte AMD wenn dann sowieso die "Radeon RX500" Serie begründen oder aber den Grafikkarten basierend auf dem Vega-10-Chip irgendwelche Sondernamen geben. Jener AotS-Benchmarkwert lag im übrigen zwischen GeForce GTX 1070 und 1080 – und zeigt somit genauso an, das eine finale Vega-10-Grafikkarte samt entsprechend optimierter Treiber wohl eher "nur" gegen die GeForce GTX 1080 in den Ring steigen wird, trotz das die reinen Rohleistungen deutlich mehr hergeben. Man sollte in dieser Frage eher die Kirche im Dorf lassen – und wenn AMD dann doch mehr mit Vega 10 bieten kann, wird sich sicherlich kaum jemand daran stören.

Vollkommen spekulativ ist derzeit zudem noch der Punkt, wann Vega-10-basierte Grafikkarten wirklich erscheinen werden. Die jetzt aufgenommenen Benchmark-Werte sollen in jedem Fall auf internen Testsamples mit nur wenige Wochen alten Chips basieren – was jetzt nicht unbedingt auf einen baldigen Launch schließen lassen sollte. Angenommen eines Tape-Outs des Vega-10-Chips erst in diesem Herbst ist weiterhin der Sommer 2017 ein realistischer Starttermin für diese neuen AMD-Grafikkarten – im besten Fall ist vielleicht noch das späte Frühjahr 2017 drin, aber das erste Quartal 2017 ist dann eher unrealistisch. AMD hatte schon bei Polaris eine gute Tendenz zu sehr frühen Teasern gezeigt, umgemünzt auf Vega heißt dies wohl, das Vega noch einige Monate vor sich hat, ehe es darauf basierende kaufbare Produkte gibt. Genauso noch offene Fragen sind, was dann mit Vega 11 passiert bzw. wie der kürzlich vermeldete Polaris 12 einzuordnen wäre – dies werden dann Themen des Jahresanfangs 2017 sein.