GPGPU

6

OpenCL-Benchmarks sehen AMDs 28nm-Grafikchips gleichauf mit nVidias 16nm-Grafikchips

Im Benchmarking-Teil unseres Forums wird neben vielen anderen Programmen und aktuellen Spielen auch weiterhin MrH's OpenCL-Mark in dessen aktueller Version 1.11 durchgetestet. Hierbei handelt es sich um einen Test der puren Rechenkraft von reinen Grafikchips unter OpenCL – was unter einigen Anwendungen schon verwendet wird und auch im Spielebereich für die Zukunft wichtig werden sollte. Heutige Grafikchips eigenen sich nun einmal sehr gut als Parallelbeschleuniger, was mittels OpenCL ausgenutzt wird, um die verschiedensten Probleme möglichst recheneffizient zu lösen – meistens allerdings welche aus dem professionellen Bereich. Die Adaption in normale Anwendungssoftware ist eher schwierig, da nur Teilaufgaben mittels OpenCL zu beschleunigen sind. Im Spielebereich ist dagegen aufgrund der komplexen Spielwelts-Berechnungen heutiger Titel samt schwer zu jeder Sekunde vollständig auslastbarer Grafikbeschleuniger (theoretisch) ein größerer Ansatzpunkt für die Nutzung von OpenCL zu finden – auch wenn die praktische Nutzung unter Spielen derzeit eher homöopathischer Natur ist. Nichtsdestotrotz ist OpenCL sicherlich eine wichtige Disziplin in der Zukunft, welche heutzutage schon teilweise genutzt wird – die unter OpenCL zu erwartende Performance mißt dann der MrH OpenCL-Mark aus:

22

Spezifikations-Vergleich Intel Xeon Phi 7200 vs. nVidia Tesla P100

Mit der Vorstellung von Intels neuem Xeon Phi Prozessor auf Knights-Landing-Basis in Konkurrenz zu nVidias GP100-Chip lohnt nunmehr wieder einmal ein Vergleich der verschiedenen HPC-Ansätze der entsprechenden Hersteller – derzeit noch ohne AMD, denn deren entsprechendes Vega-11-Projekt dürfte erst im nächsten Jahr spruchreif werden. Intel hat mit "Knights Landing" mal wieder einen echten Monsterchip mit einer Chipfläche von ~700mm² unter der 14nm-Fertigung hingelegt – und in diese bis zu 76 physikalische Rechenkerne einer hochgeschraubten Silvermont-Architektur gesteckt, womit diese eigentlich für LowPower-Prozessoren gedachte Atom-Architektur einen interessanten Zweitnutzen erfährt. Wie bei nVidias Tesla P100 können die aktuellen Xeon Phi 7200 Lösungen die vorhandene Hardware aus Ausbeutegründen jedoch nicht komplett ausnutzen – die Tesla P100 kommt mit nur 3584 freigeschalteten von 3840 physikalisch vorhandenen Shader-Einheiten daher, Xeon Phi hingegen mit (je nach Modell) zwischen 64 und 72 freigeschalteten von 76 physikalisch vorhandenen x86-Rechenkernen:

11

nVidia erklärt "Mixed Precision"

Auf der Supercomputer-Konferenz SC15 ist nVidia in seinem Vortrag auch auf die ab der Pascal-Architektur geplante "Mixed Precison" eingegangen. Hierbei handelt es sich schlicht um den Ansatz, nur so viel an Rechengenauigkeit zu verwenden, wie für die konkrete Aufgabe (oder Teilaufgabe) wirklich notwendig ist – und damit dann erheblich an Rechenleistung und damit Berechnungszeit zu sparen. Zu diesem Zweck wird die Pascal-Architektur auch eine HalfPrecison-Rechengenauigkeit unterstützen, welche dann also mit nur 16 Bit Genauigkeit operiert (SinglePrecision = 32 Bit, DoublePrecision = 64 Bit).

1

nVidia verspricht 4 TFlops DP für Pascal, 7 TFlops DP für Volta

WCCF Tech zeigen einiges nVidia-Präsentationsmaterial von der Supercomputer-Konferenz SC15 – darunter auch eine Performance-Projektion zu den kommenden Grafikchip-Architekturen Pascal und Volta, betreffend jeweils deren Top-Modelle natürlich. Entsprechend des Präsentationsorts ging es dabei um die primär nur im GPGPU-Bereich interessante DoublePrecision-Performance (sowie die Speicherbandbreite) – wobei aus ersterer unter Umständen auch gewisse Rückschlüsse über die SinglePrecision-Performance zu ziehen sind.

16

AMDs Boltzmann-Initiative geht direkt gegen nVidias CUDA

Grafikchip-Entwickler AMD will sich besser im professionellen Segment positionieren – und greift daher mittels der "Boltzmann Initiative" (benannt nach dem österreicher Physiker & Mathematiker Ludwig Boltzmann) nVidias CUDA-Standard als den vielleicht wichtigsten Punkt an, welcher AMD hierbei ausbremst. Die Boltzmann-Initiative besteht dabei maßgeblich aus drei neuen Software-Produkten, welche AMD auf der Supercomputer-Konferenz SC15 derzeit vorstellt und welche im Early-Access-Verfahren ab ersten Quartal 2016 für Software-Entwickler verfügbar gemacht werden sollen:

4

Weitere AMD-Roadmap zeigt langfristige Grafik-Entwicklung bis zum Jahr 2020

Aus dem Forum der PC Games Hardware kommt eine weitere (angebliche) AMD-Roadmap für den Bereich Grafikchips & APUs. Jene Roadmap reicht immerhin vom Jahr 2013 bis zum Jahr 2020, geht deswegen auch weniger ins Detail, sondern zeigt nur die eher großen Entwicklungssprünge an. Interessanterweise soll die Roadmap angeblich von WCCF Tech kommen, im PCGH-Forumseintrag sind die AMD-Folien jedoch in viel besserer Qualität verlinkt als bei dieser Quelle.

11

nVidias "Big Chips" GK210, GM200 & GP100 bestätigt

In unserem Forum wurde in einer wissenschaftlichen Ausarbeitung der Cornell University eine Tabelle entdeckt, welche die Existenz der Enthusiasten- & Profi-Chips GK210 (Kepler-Architektur), GM200 (Maxwell-Architektur) und GP100 (Pascal-Architektur) sogar mit einem gewissen Erscheinungs-Zeitrahmen garniert bestätigt.

1

Spezifikations-Vergleich AMD FirePro W9100, Intel Xeon Phi 7120 & nVidia Tesla K40

Ein wenig untergegangen in der letzten Woche ist AMDs Ankündigung der FirePro W9100, dem neuen GPGPU-Beschleuniger von AMD auf Basis des Hawaii-Chips. Der spannender Punkt an der FirePro W9100 ist dabei vor allem die wirklich gute SP/DP-Rate von nur 2:1, womit unter DoublePrecision-Berechnungen immerhin (grob) die Hälfte der nominellen Rechenkraft zur Verfügung steht (die Taktrate unter DP ist wohl TDP-bedingt etwas niedriger als unter SP). Bei nVidias Tesla-Beschleunigern liegt die SP/DP-Rate nach wie vor bei bestenfalls 3:1, jene liegen ergo bei der DoublePrecision-Rechenkraft nunmehr deutlich zurück.

19

Intel stellt weitere Xeon Phi GPGPU-Beschleuniger vor

Der Heise Newsticker berichtet über ein neue Xeon Phi Modelle, welche Intel im Rahmen der Supercomputer-Konferenz ISC'13 vorgestellt hat. Besonders spannendes gibt es hier nicht – Intel steigert mit dem neuen Spitzenmodell Xeon Phi 7120 die DP-Rechenleistung auf nunmehr 1,21 TFlops, ausgehend von den 1,07 TFlops des bisherigen Spitzenmodells Xeon Phi SE10.

6

Radeon GPU-Cluster: 14stellige Passwörter in sechs Minuten geknackt

Heise Security bringen erhellende Informationen zu dem kürzlich vorgestellten Passwort-Knacker mit Radeon-Grafikkarten: Danach werden damit nicht die Passwörter selber, sondern "nur" deren Hashes geknackt – was bei eigentlich veralteten Hash-Methoden sehr gut funktioniert. Ein direkter Angriff auf ein Passwort ohne jeden Hashwert ist damit ebenso wenig möglich wie ein Angriff auf einen Webserver, da dort üblicherweise die Anzahl der Passwort-Versuche limitiert sind.

Inhalt abgleichen