Erneut über unser Forum erspäht, gibt es auf YouTube ein längeres Video zum Thema HBM-1/2-Speicher zu sehen, in welchem diverse Zulieferfirmen hierzu Stellung nehmen. Hochinteressant sind dabei die Ausführungen von eSilicon, einem Entwickler von Speicherinterfaces, welcher seinerseits schon mehrere HBM-1/2-Designs in Arbeit hatte bzw. noch hat. Die Namen der hiermit belieferten Chipentwickler bzw. Chipdesigns wurden zwar nicht erwähnt, aber all zu viele HBM-Chipdesigns gibt es schließlich nicht. Ergo sieht es fast danach aus, als wäre eSilicon auch schon an der Entwicklung des Fiji-Chips und dessen HBM1-Speicherinterface samt vier HBM1-Speicherstacks beteiligt gewesen:
Als DDR4-Speicher seinerzeit im August 2014 in den Handel kam, bezahlte man noch Preisaufschläge von 30% gegenüber DDR3-Speicher (auf gleicher Taktrate). Ein gutes Jahr später wurde im Oktober 2015 die Preisparität erreicht – und heuer nun ist DDR4-Speicher bemerkbar günstiger als DDR3-Speicher geworden. Zu jeder einzelnen Taktrate kostet DDR4 weniger als DDR3, bei den besonders hohen Taktraten teilweise mit sehr deutlichem Preisvorteil zugunsten von DDR4-Speicher. Jene Übertakter-Module sind auf dem Gebiet von DDR4-Speicher inzwischen erschwinglich geworden, während die Preisaufschläge für besonders schnell getaktete DDR3-Module nach wie vor astronomisch wie auch eindeutig abschreckend ausfallen:
Unsere bisherige Berichterstattung zum GDDR5X-Speicher in Konkurrenz zum HBM-Speicher hat (leider) noch einen Fehler aufzuweisen. Wie bekannt, steigt bei GDDR5X als hauptsächliche Änderung zum regulären GDDR5 der sogenannte Prefetch von 8 auf 16 – was bedeutet, das pro Takt der reinen Speicherzellen entsprechend viele Datenpakete über das Interface nach außen übertragen werden. Dabei gibt es zwei grundsätzlich Wege, diese leistungsfähigere Datenübertragung nach außen zu realisieren: Höhere Taktraten oder aber Datenprotokolle, welche mehr Daten pro Takt übertragen. Üblich ist an dieser Stelle das Double Data Rate (DDR) Protokoll, welches schon dem Namen nach zwei Datenpakete pro Takt überträgt.
Das Speicherstandardisierungs-Gremium JEDEC vermeldet nunmehr auch die offizielle Standardisierung von GDDR5X, dem direkten Nachfolger von GDDR5. Wie auch bei der kürzlichen Meldung zu HBM2 handelt es sich hierbei nur um eine offizielle Meldung, die entsprechende Spezifikation befindet sich schon seit November 2015 auf den Webseiten der JEDEC. Aber natürlich ist eine solche offizielle Bekanntmachung auch immer eine gute Gelegenheit, auf diesen neuen Speicherstandard für Grafikkarten einzugehen, welcher teilweise durchaus mit HBM2 konkurrieren kann. Springender Punkt von GDDR5X sind die durch einen verdoppelten Prefetch (der Takt der reinen Speicherzellen bleibt gleich, während der Takt des Interfaces innerhalb des Speicherchips verdoppelt wird) höheren nominellen Interface-Taktraten, was im Idealfall einer verdoppelten Bandbreite entspricht.
Das Speicherstandardisierungs-Gremium JEDEC vermeldet die offizielle Standardisierung einer neuen Ausbaustufe des HBM-Standards – sprich, daß, was bisher unter "HBM2" bekannt ist, wurde nunmehr offiziell standardisiert. Konkret geht es bei HBM2 (inoffizielle Bezeichnung) zum einen um eine höhere Flexibilität bei der Anzahl der Speicherstacks – anstatt 4 oder 8 Speicherstacks können nun auch nur 1 oder 2 Speicherstacks genutzt werden, was HBM2-Speicher zukünftig auch für kleinere und mittlere Grafiklösungen (mit dementsprechend niedrigeren Bandbreite-Anforderungen) nutzvoll macht. Zudem geht der maximale Speichertakt auf bis zu 1000 MHz DDR hinauf – damit bietet die von der Nano/Fury-Karten bekannte Anordung mit 4 Speicherstacks und 4096 Bit DDR HBM-Speicherinterface nunmehr nicht mehr maximal 512 GB/sec Bandbreite, sondern gleich maximal 1024 GB/sec Bandbreite. Gleichzeitig werden damit auch die "kleineren" HBM-Ausführungen leistungsfähiger, die kleinste HBM2-Ausführung mit nur einem Speicherstack und 1024 Bit DDR HBM2-Speicherinterface käme somit auf immerhin 256 GB/sec Speicherbandbreite.
BenchLife zeigen Teile einer AMD-Präsentation zum Carrizo-Refresh "Bristol Ridge", welcher wie bekannt im Sommer 2016 diesesmal sowohl im Mobile- als auch im Desktop-Segment antreten soll. Hauptunterscheidungsmerkmal zur diesjährigen Carrizo-APU ist die Freischaltung des (auf dem Prozessoren-Die aber schon immer vorhandenen) DDR4-Speicherinterfaces.
Auf der Supercomputer-Konferenz SC15 hat nVidia neben genauen Angaben zur Rechenleistung von Pascal & Volta auch über zukünftig drohende Probleme mit der gerade erst in den Mark gekommenen Speichertechnologie "High Bandwith Memory" aka HBM geredet. Dies betrifft nicht den aktuellen HBM1-Standard oder den kommenden HBM2-Standard, aber dafür die danach folgenden weiteren HBM-Ausbaustufen. Denn bei jenen soll laut nVidia deren Strombedarf sehr schnell durch die Decke gehen, was HBM in kürzerer Zeit sehr ineffektiv werden lassen würde.
Der Teaser eines Reports der Chipanalysten von Chipworks beinhaltet einen ersten Die-Shot zu AMDs Fiji-Grafikchip der Radeon R9 Nano/Fury Serie. Die wirklich hochauflösenden, aufbearbeiteten und dann entsprechend markierten Die-Shots wird es sicherlich nur im vollständigen aka kostenpflichtigen Report geben, so daß wir derzeit vorerst mit diesem einen Die-Shot leben müssen. Einige Chip-Bestandteile sind dabei schon halbwegs identifizierbar – insbesondere wenn man es mit dem (markierten) Die-Shot zum Tahiti-Chip von Radeon HD 7900 und R9 280 Serien vergleicht:
Der TechSpot hat einen feinen Artikel aufgelegt, welcher sich mit der Frage beschäftigt, was eine größe Menge an Arbeitsspeicher bringt. Hierfür wurden unter Windows 10 verschiedene Tests mit 4 GB, 8 GB und 16 GB Speicherbestückung durchgeführt – mit durchaus interessanten Ergebnissen: Bei den Anwendungs-Benchmarks ist die Sache recht klar, 4 GB sind da schon rein von den Benchmarks her zu wenig. Nicht jedes Programm profitiert von 8 GB, aber dennoch ist eine ausreichende Anzahl, um 8 GB klar vorn zu sehen. Allerdings muß man sich auch darüber im klaren sein, daß einen wirklichen Vorteil (außer einer 0,2sec schnellerer Öffnungszeit von Excel) nur unter professioneller und semi-professioneller Software zu finden ist, meist Software aus dem Videobereich. Wer einfach nur eine Surfmaschine betreibt, kommt dagegen kaum an den Punkt, wo 8 GB einen meßbaren Vorteil gegenüber 4 GB bieten.
Letzten Herbst zum Launch von Haswell-E musste man noch mit klar höheren Preisen für DDR4-Speicher leben – 30% mehr für gleich getakteten Speicher waren seinerzeit normal. Aber mit dem Launch von Skylake und damit dem Eindringen von DDR4-Speicher in den Massenmarkt hat sich dies nunmehr gravierend verbessert: Gut einen Monat nach Skylake-Launch kosten (gleich getaktete) DDR4-Module faktisch nicht mehr als DDR3-Module – bei den hoch getakteten Modulen ist DDR4-Speicher sogar erheblich günstiger, da es dort bei DDR3 in Grenzbereiche geht, welche DDR4 viel besser schultern kann: