10

Gerüchte und Spekulationen zu nVidias GK104-Chip aus der Kepler-Generation

Auf der ersten großen Messe des Jahres, der CES in Las Vegas, hat nVidia in seiner offiziellen Keynote in erster Linie über seine Tegra-Chips und damit das Tablet-Segment gesprochen, aber kein Wort zu "echten" Grafikchips und damit der GeForce-Reihe verloren. Dies ist aus Gamer-Sicht natürlich enttäuschend – andererseits ist eine Keynote auch kein guter Anlaß, um etwas über noch nicht releaste Produkte zu sagen, gerade wenn diese nicht unmittelbar vor ihrem Launch stehen (was auf die Kepler-Grafikchipgeneration offensichtlich noch zutrifft). Da auch unter der Hand nichts neues über Kepler seitens nVidia oder der Grafikkarten-Hersteller zu hören war, bedeutet dies wohl, daß diese neue Grafikchip-Generation nicht direkt in den nächsten Wochen zu erwarten ist, wenngleich das Launchziel von Februar/März für den GK104-Chip immer noch als haltbar erscheint.

Derweil kommen von der absolut solidesten Quelle im Internet neue (gut als Wahrheit getarnte) Spekulationen über das Aussehen des GK104 Performance-Chips der Kepler-Generation. Die dort genannten Daten selber sehen zwar gut aus (wer gut rät, landet sicherlich ganz automatisch ein paar Treffer), sind aber aller Wahrscheinlichkeit reine Spekulation ohne echte Grundlage – und angesichts der Quelle sowieso normalerweise Makulatur. Dabei bringt man allerdings eine interessante neue Variante zum Auslegung der Shader-Einheiten der Kepler-Generation ins Spiel, über welche man sicherlich reden sollte: Unter der Voraussetzung, daß bei Kepler die bisher bekannten Hotclocks der Shader-Einheiten wegfallen, musste man bisher annehmen, daß damit nur eine (extrem) deutliche Steigerung der Anzahl der Shader-Einheiten verbunden sein kann.

Eine andere mögliche Auflösung ist dagegen, daß nVidia das bisherige Modell der Shader-Einheiten, welche bei AMD und nVidia unabhängig von VLIW4-, VLIW5- und 1D-Auslegung immer zwei MADD-Operationen pro Takt und einzelner Shader-Einheit errechnen konnten, schlicht abändert bzw. eher revolutioniert. Wenn nVidia beispielsweise Shader-Einheiten auflegt, die pro Takt und Einheit gleich vier MADD-Operationen berechnen können, dann entspricht dies dem Effekt des Hotclocks und man benötigt nicht mehr Shader-Einheiten als bisher, um auf weiterhin hohe theoretische Rechenleistungen zu kommen. Dies ist natürlich derzeit reine Spekulation – wie Kepler wirklich ausfällt, wissen wir einfach noch nicht. Man kann aber trefflich drei Modelle beschreiben, wie es weitergehen kann – und was sich jeweils aus diesen drei Modellen heraus ergibt, wenn man angenommen die jeweils doppelte Rechenleistung gegenüber Fermi erreichen wollte:

technische Lösung daraus resultierender Chip
(Fermi) (1D Shader-Einheiten mit zwei MADD/Takt/Einheit und Hotclock) (GF110: 512 1D Shader-Einheiten, max. 1544 MHz Shadertakt = 1,58 TFlops Rechenleistung)
Kepler Modell 1 selbes Modell wie Fermi, nur einfach eine Verdopplung der Einheiten-Anzahl 1024 1D Shader-Einheiten mit demselben Shadertakt oder etwas weniger als 1024 Shader-Einheiten mit etwas höherem Shadertakt = ~3,2 TFlops Rechenleistung
Kepler Modell 2 1D Shader-Einheiten mit zwei MADD/Takt/Einheit, kein Hotclock mehr, dafür dann eine Vervierfachung der Einheiten-Anzahl 2048 1D Shader-Einheiten mit nur noch dem Chiptakt (772 MHz) oder etwas weniger als 2048 Shader-Einheiten mit etwas höherem Chiptakt = ~3,2 TFlops Rechenleistung
Kepler Modell 3 1D-Shader-Einheiten mit dann sogar vier MADD/Takt/Einheit, dafür kein Hotclock mehr, und dann wieder eine einfache Verdopplung der Einheiten-Anzahl 1024 1D Shader-Einheiten mit demselben Shadertakt oder etwas weniger als 1024 Shader-Einheiten mit etwas höherem Shadertakt – aber alle Shader-Einheiten doppelt so leistungsfähig wie bisher bekannt = ~3,2 TFlops Rechenleistung

Alle drei Modelle führen wie gesagt zum Ziel und sind damit letztlich möglich. Nur daß hier jeweils eine Verdopplung der Rechnungleistung angenommen wurde, ist natürlich eine reine Annahme: nVidia kann bei der ersten Kepler-Generation auch mit einem deutlich geringerem Plus bei der theoretischen Rechenleistung daherkommen, bei der Radeon HD 7970 sind es ja auch nur 40 Prozent mehr theoretische Rechenleistung gegenüber der Radeon HD 6970. Alle Modelle funktionieren natürlich auch mit einer nur 50prozentigen Steigerung der theoretischen Rechenleistung, dafür benötigt es in den Modellen 1 & 3 schlicht "nur" ~768 1D Shader-Einheiten und im Modell 2 dann ~1536 1D Shader-Einheiten. Was sich genau nVidia bei Kepler ausgedacht ist – d.h. welchem der drei vorstehenden Modelle man nachgeht und vor allem wie stark die Steigerung gegenüber der vorgehenden Fermi-Generation sein soll – ist damit natürlich weiterhin unbekannt und im Reich der Spekulationen. Die von OBR dargebrachten Zahlen helfen hier leider auch nicht weiter, da die Quelle einfach zu unseriös ist.