2

Hardware- und Nachrichten-Links des 2. Juni 2016

Die PC Games Hardware hat erste GP100-Benchmarks ausgegraben – leider nur im Profi-Benchmark AmberGPU, welcher eher nur Aussagen zur Workstation-Performance (und natürlich nicht zur Spiele-Performance) liefert. Dafür waren aber auch reihenweise früherer Tesla-Lösungen sowie sogar GeForce GTX Titan X und 1080 mit im Testfeld, ergibt sich also ein guter Überblick zur RealWorld-Rechenleistung dieser Karten. Die FP64-Einheiten wurden hierbei augenscheinlich kaum bis gar nicht benutzt, ansonsten könnten GeForce GTX Titan X und 1080 nicht so gut mithalten. Bis auf die GeForce GTX 1080 erzielen alle Grafikkarten dabei ein über alle 11 Einzeltests gemitteltes Ergebnis, welches gut zu ihrer FP32-Rechenleistung passt – nur die GeForce GTX 1080 läuft bemerkbar darunter. Grund hierfür könnte zu einem die vergleichsweise geringe Speicherbandbreite der GeForce GTX 1080 sein (die Farbkompression dürfte unter Profi-Anwendungen kaum weiterhelfen), zum anderen könnte diee Karte unter der hohen Auslastung dieses Benchmarks durchaus zum stärkeren Drosseln des Chiptakts neigen. Da die GeForce GTX 1080 natürlich nicht dafür gebaut ist, um unter Profi-Benchmarks zu glänzen, ist dies jedoch nicht als Problempunkt anzusehen. Die GP100-basierte Tesla P100 macht ihren Job dagegen wie geplant: Für ~61% mehr SP32-Rechenleistung gegenüber der vorhergehenden Tesla M40 gibt es unter diesem Profi-Benchmark gute ~55% Mehrperformance.

Technik FP32-Rechenl. AmberGPU
Tesla P100 Pascal, GP100, 16nm, 300W 10,6 TFlops 100%
GeForce GTX 1080 Pascal, GP104, 16nm, 180W 8,67 TFlops 72,9%
GeForce GTX Titan X Maxwell, GM200, 28nm, 250W 6,55 TFlops 64,4%
Tesla M40 Maxwell, GM200, 28nm, 250W 6,84 TFlops 61,0%
Tesla K40 Kepler, GK110B, 28nm, 235W 5,04 TFlops 44,3%
Tesla K20 Kepler, GK110, 28nm, 235W 3,52 TFlops 32,3%

Derweil gibt es eine gewisse Kontroverse zwischen AMD und nVidia, nachdem einige Beobachter die nicht gleich aussehende Bildqualität im von AMD für die Demonstration der Radeon RX480 benutzten "Ashes of the Singularity" Benchmarks angemängelt hatten. AMD erklärte auf Reddit dies allerdings mit einer korrekten Darstellung seitens der AMD-Hardware sowie einer inkorrekten und sogar weniger Rechenleistung benutzenden Darstellung seitens der nVidia-Hardware. AMD versucht dies dann mit einem Screenshot-Set zu belegen, welche aber nicht unbedingt genau genug ausfallen, um hier gleich eindeutige Schlüsse draus ziehen zu können. Auf den ersten Blick hat AMDs Argumentation aber tatsächlich etwas für sich: nVidias Bild mag erst einmal plastischer aussehen – für Schnee ist dies jedoch eher unpassend, weil selbiger im gewöhnlichen keine derart starren Formen annimmt. Mal schauen, ob sich nVidia hierzu noch äußert, für den Augenblick erscheint AMD mit seiner Argumentation in dieser Kontroverse durchaus vorn zu liegen.

Zur Berichterstattung über AMDs Stoney Ridge APU wäre noch nachzutragen, das jener kleinere Carrizo-Abkömmling mit einer Chipfläche von 125mm² antritt, glatt also die Hälfte der 250mm² von Carrizo und Bristol Ridge. Die Anzahl der Transistoren verringt sich sogar von 3,1 auf nur 1,2 Milliarden – begünstigt wohl dadurch, das bei der Grafikeinheit mehr als die Hälfte gegenüber Bristol Ridge abgespeckt wurde: Anstatt maximal 512 Shader-Einheiten (8 CUs) bei Bristol Ridge gibt es bei Stoney Ridge nur maximal 192 Shader-Einheiten (3 CUs). Die geringere Chipfläche (inklusive komplettem Chipsatz) bringt Stoney Ridge in die Nähe von AMDs früheren LowPower-APUs – das originale Bobcat-Design kam auf 75mm² (ganz ohne integrierten Chipsatz), Jaguar & Puma lagen bei ~107mm² (mit integrierter Northbridge). So klein wie Intels CherryTrail-Die der Airmont-Architektur (~87mm², ebenfalls inklusive komplettem Chipsatz) ist man damit zwar nicht, aber es geht durchaus in dieselbe Richtung – und begründet damit nochmals, wieso sich für AMD die Weiterführung einer extra LowPower-Architektur (in Fortführung von Bobcat, Jaguar & Puma) letztlich nicht lohnt. Selbst wenn für zukünftige Konsolen-Projekte wieder die Aufgabe ansteht, mit sehr vielen CPU-Rechenkernen anzutreten (Xbox One & PS4 bekannterweise mit jeweils 8 Jaguar-basierten CPU-Rechenkernen), wird dies letztlich über die Zen-Architektur in der 14nm-Fertigung zu lösen sein, wo die einzelnen Rechenkerne dann auch schon kleiner als 10mm² pro Kern sind.

Im Sinne von Bristol Ridge wäre hingegen nachzutragen, das dessen Desktop-Modelle im Sockel AM4 nachweislich fertig sind und teilweise sogar schon in Komplett-PCs zum baldigen Kauf zur Verfügung stehen. Wie Heise berichten, trifft dies beispielsweise auf einen auf der Computex ausgestellten Komplett-PC von HP zu – unwahrscheinlich, das HP nun mehrere Monate bis zum Jahresende warten muß, ehe diese PCs dann ausgeliefert werden dürfen. Aller Vermutung nach wird es den Retail-Launch der Desktop-Modelle trotzdem erst zum Jahresende 2016 geben – aber die OEM-Hersteller werden wohl schon ab Sommer entsprechend ausgerüstete PCs ausliefern. Dies könnte man als abgestuften Launch begreifen, wo AMD erst dann ins Retail-Geschäft geht, wenn die Produktionsmengen ausreichend stabil sind – oder auch als bewußte Verschleierungstaktik, bei welcher man Bristol Ridge im zu erwartenden Glanz des Zen-Launches irgendwie unterzubringen gedenkt und damit eventuell negativ ausgehenden Vergleichstests zum jetzigen Zeitpunkt aus dem Weg geht. Damit der Käufer eines Bristol-Ridge-PCs derzeit jedoch ziemlich blind, da für die Desktop-Ausführungen weder Modellnamen noch deren Spezifikationen offiziell bekanntgemacht sind – eigentlich keine Art, ein neues Produkt in den Handel zu bringen.