Ein wenig untergegangen in der letzten Woche ist AMDs Ankündigung der FirePro W9100 [1], dem neuen GPGPU-Beschleuniger von AMD auf Basis des Hawaii-Chips. Der spannender Punkt an der FirePro W9100 ist dabei vor allem die wirklich gute SP/DP-Rate von nur 2:1, womit unter DoublePrecision-Berechnungen immerhin (grob) die Hälfte der nominellen Rechenkraft zur Verfügung steht (die Taktrate unter DP ist wohl TDP-bedingt etwas niedriger als unter SP). Bei nVidias Tesla-Beschleunigern liegt die SP/DP-Rate nach wie vor bei bestenfalls 3:1, jene liegen ergo bei der DoublePrecision-Rechenkraft nunmehr deutlich zurück. Intels Xeon Phi GPGPU-Beschleuniger bieten zwar ebenfalls ein SP/DP-Verhältnis von 2:1, sind jedoch allgemein noch nicht auf dem Niveau der GPGPU-Angebote von AMD und nVidia angelangt.
AMD FirePro W9100 | Intel Xeon Phi 7120 | nVidia Tesla K40 | |
---|---|---|---|
Chipbasis | AMD Hawaii, 6,2 Mrd. Transistoren in 28nm auf 438mm² Chip-Fläche | Intel Knights Corner, ~5 Mrd. Transistoren in 22nm auf ~650-700mm² Chip-Fläche | nVidia GK110, 7,1 Mrd. Transistoren in 28nm auf 561mm² Chipfläche |
Technik | 2816 Shader-Einheiten an einem 512 Bit DDR Speicherinterface, 2 FMA pro Takt & Shader-Einheit, SP/DP-Verhältnis von 2:1 | 61 x86-Rechenkerne an einem 512 Bit DDR Speicherinterface, 32 FMA pro Takt & Rechenkern, SP/DP-Verhältnis von 2:1 | 2880 Shader-Einheiten an einem 384 Bit DDR Speicherinterface, 2 FMA pro Takt & Shader-Einheit, SP/DP-Verhältnis von 3:1 |
Taktraten | ≤1000/≤950/? MHz | 1238/1333/2750 MHz | 745-875/3000 MHz |
Speicher | 16 GB GDDR5 | 16 GB GDDR5 | 12 GB GDDR5 |
SinglePrecision | ≤5,63 TFlops | 2,41-2,60 TFlops | 4,29-5,04 TFlops |
DoublePrecision | ≤2,67 TFlops | 1,20-1,30 TFlops | 1,43-1,68 TFlops |
Bandbreite | >300 GB/sec | 352 GB/sec | 288 GB/sec |
TDP | ? | 235W | 300W |
Mit der FirePro W9100 stellt AMD nunmehr jene SingleChip-Lösung mit der klar höchsten SinglePrecision- wie auch DoublePrecision-Rechenleistung vor, nVidias langjährige Vormachtstellung in diesem Segment scheint somit (nominell) gebrochen zu sein. Hierbei spielt insbesondere die Veränderung des SP/DP-Verhältnisses von 4:1 beim R1000/Tahiti-Chip zu nunmehr 2:1 beim Hawaii-Chip hinein, damit kann AMD nun auch bei der im professionellen Bereich eher interessanten DoublePrecision-Rechenleistung (deutlich) punkten. Erstaunlich ist dabei, wie AMD dieses geringe SP/DP-Verhältnis in die nun auch nicht gerade übermäßig große Chipfläche des Hawaii-Chips integrieren konnte – immerhin ist der Hawaii-Chip von den drei konkurrierenden Angebote die flächenmäßig klar kleinste Lösung.
Verweise:
[1] http://www.planet3dnow.de/cms/9163-hawaii-basierte-amd-firepro-w9100-angekuendigt/