4

Weitere Informationen zu Intels Xeon Phi

Die VR-Zone berichtet über das Erreichen der B0-Revision von Intels Xeon Phi, der im Juni vorgestellten Co-Prozessorkarte auf (grober) Basis des früheren Larrabee-Projekts. Mit dem B0-Stepping kann Intel nunmehr bis zu 61 aktive Rechenkerne bieten – vermutlich hat Xeon Phi hardwaretechnisch insgesamt 64 Rechenkerne, wovon zwei immer der reinen Verwaltung dienen und üblicherweise nicht mit gezählt werden, ergo also maximal 62 Rechenkerne für Rechenaufgaben zur Verfügung stehen. Hinzu kommen (aktuell) 1.9 MB Level1- und 30.5 MB Level2-Cache sowie Speichermengen von 2, 4 oder 8 GB GDDR5-Speicher am 512bittigen DDR-Speicherinterface.

Bei den Taktraten werden inzwischen 1.05 bis 1.1 GHz erreicht, hinzu kommt ein TurboModus, dessen Taktfrequenz allerdings noch nicht veröffentlicht wurde und dessen Praxiswirkung sicherlich auch stark an der benutzten Kühllösung abhängt – gut für große Rechenzentren, wo sowieso mit durchgehender Wasserkühlung operiert wird (für diesen Zweck wird Xeon Phi auch in einer "nackten" Variante ohne jeden Kühlkörper erscheinen). Die TDP für das alles schwankt je nach freigeschalteten Rechenkernen, benutzter Speichermenge und vorhandener Kühlkonstruktion zwischen 245 und 300 Watt. Wenn man von früheren Performance-Veröffentlichungen interpoliert, könnte eine Xeon-Phi-Variante mit 62 Rechenkernen und 1.1 GHz Takt auf eine DoublePrecision-Rechenleistung von schon 1,1 TFlops kommen – den (derzeit kaum kalkulierbaren) TurboMode noch nicht eingerechnet.

Intel Xeon Phi nVidia Kepler GK110
Chipbasis Intel "Knights Corner", 22nm-Fertigung von Intel nVidia GK110, 7,1 Mrd. Transistoren auf ~550mm² Die-Fläche in der 28nm-Fertigung von TSMC
Technik reine Co-Prozessorkarte, (bis zu) 64 x86-Rechenkerne (anscheinend zwei fest eingeteilt für Verwaltungsaufgaben), SP/DP-Verhältnis von 1:2, 2 MB Level1-Cache, 31 MB Level2-Cache, 512 Bit DDR Speicherinterface (bis GDDR5) DualUse-Produkt als Gamer-Grafikkarte und als GPGPU-Beschleuniger, (bis zu) 2880 (1D) Shader-Einheiten, SP/DP-Verhältnis von 1:3, 2 MB Level2-Cache, 384 Bit DDR Speicherinterface (bis GDDR5)
Chip-Taktrate 1.05 bis 1.1 GHz (+ TurboMode) schätzungsweise 850 MHz
SP-Rechenleistung max. 2,2 TFlops (+ TurboMode) schätzungsweise max. 4,9 TFlops
DP-Rechenleistung max. 1,1 TFlops (+ TurboMode) schätzungsweise max. 1,6 TFlops
Speicher-Taktrate max. 2500 bis 2740 MHz schätzungsweise 3000 MHz
Speicherbandbreite 350,7 GB/sec schätzungsweise 288 GB/sec
Speichermengen 2, 4 oder 8 GB GDDR5 3 oder 6 GB GDDR5
TDP 245-300W schätzungsweise 300W
Release Q4/2012 Q4/2012
(im Gamer-Bereich erst im Jahr 2013)

Dies hängt allerdings immer noch etwas gegenüber der aktuellen Projektion zu nVidias GK110 zurück, welche auf 850 MHz Takt und mit den vollen 2880 Shader-Einheiten 1,6 TFlops DoublePrecision-Rechenleistung erreichen wird und zusätzlich eine überlegene SinglePrecision-Rechenleistung bietet. Allerdings muß nVidia den GK110-Chip auch erst einmal auf dieser Taktfrequenz finalisieren und dann auch noch die volle Anzahl an Shader-Einheiten bieten – während Intel immer noch die Zeit hat, mittels weiteren Steppings von Xeon Phi noch mehr Takt aus dem Design herauszuholen. Zudem wäre wirklich interessant, was der TurboMode von Xeon Phi zu leisten imstande ist – gut möglich, daß hier bei guter Kühlung auch deutlich höhere Taktfrequenzen erreicht werden können.