Details zu nVidias Performance-Chip GF104

Donnerstag, 25. März 2010
 / von Leonidas
 

Bei nVidia biegt derzeit gerade der HighEnd-Chip GF100 der Fermi-Grafikchiparchitektur auf die Zielgerade, da gibt es endlich einmal handfeste Details zu einem der nachfolgenden Grafikchips aus der Fermi-Architektur. Schließlich wird nVidia mit dem GF100-Chip und zu dessen Grafikkarten-Preisen von 300 bis 600 Euro (eingerechnet die noch folgende DualChip-Variante) von den Stückzahl her einen eher überschaubaren Teil des Marktes abdecken, das größere Geschäft wird zweifellos mit den darunter angesiedelten Lösungen gemacht.

Und hier drängt es genauso wie beim GF100-Chip, denn ATI ist nunmehr seit einigen Wochen mit einem vollständigen DirectX11-Produktprogramm unterwegs, welche die von nVidia derzeit weiterhin angebotenen DirectX10-Beschleuniger langsam aber sicher etwas alt ausschauen lassen. nVidia hatte schon verlauten lassen, daß der dem GF100-Chip untergeordnete Performance-Chip nicht all zu spät kommen soll, man peilt einen Launch noch im zweiten Quartal des Jahres an. Die Fermi-basierten Grafikchips für Mainstream- und LowCost-Segmente sollen dann im Spätsommer bzw. frühen Herbst nachfolgen.

Vorab kurz etwas zu Sicherheit der nachfolgend genannten Daten: Diese wurden von einer vertrauenswürdigen und technisch versierten Quelle aus verschiedenen Informationen aus Hersteller-nahen Kreisen zusammengetragen. Es handelt es sich also nicht um Spekulationen oder Vermutungen, sondern reale Informationen. Trotzdem kann man natürlich nicht ausschließen, daß es bei der Informationsübermittelung zu Fehlern kommt oder daß etwas mißverstanden wird. Zudem sind gerade Taktfrequenzen eine Sache, wo derzeit eher nur Zielvorgaben existieren, deren Erreichung sich erst kurz vor Launch ergibt. Nachfolgende Daten stellen somit das derzeit bekannte Wissen auf Basis einer soliden Information dar, sind jedoch unter dem Vorbehalt der möglichen Fehlerhaftigkeit zu sehen.

nVidias Performance-Chip wird dabei nun doch auf den Chipnamen "GF104" hören, womit nVidia die Fermi-Generation erst einmal mit nur vier Grafikchips starten wird (GF100, GF104, GF106 und GF108). Wir waren bis zuletzt eigentlich von einer 5-Chip-Strategie ausgegangen, wenngleich wir uns die Möglichkeit einer 4-Chip-Strategie natürlich offengelassen hatten. Nun kommt es offenbar zu dieser 4-Chip-Strategie, bei welcher der GF104-Chip in den Performance-Bereich (130 bis 230 Euro) geht, der GF106-Chip den Mainstream-Bereich (60-100 Euro) für sich allein hat und der GF108-Chip wie gehabt den LowCost-Part (30-40 Euro) bildet.

Andererseits sind Namen Schall und Rauch – viel wichtiger ist natürlich, was der Fermi-basierte Performance-Chip GF104 von nVidia zu bieten haben wird. Dazu sei kurz in Erinnerung gerufen, was der HighEnd-Chip GF100 an Hardware auffährt: Dieser bietet vier (vollständige) Raster Engines und dann 512 Shader-Einheiten samt 64 Textureneinheiten (TMUs) mit 48 Raster Operation Units (ROPs) an einem 384 Bit DDR Speicherinterface. Für den GF104-Chip wird abseits des Speicherinterfaces dieses weitestgehend halbiert: Es gibt beim GF104 also zwei (vollständige) Raster Engines und dann 256 Shader-Einheiten samt allerdings wieder 64 Textureneinheiten (TMUs) mit 32 Raster Operation Units (ROPs) an einem 256 Bit DDR Speicherinterface.

ATI RV870/Cypress nVidia GF100 nVidia GF104
Chipbasis ATI RV870, 2150 Millionen Transistoren in 40nm auf 334mm² Die-Fläche nVidia GF100, ca. 3000 Millionen Transistoren in 40nm auf ca. 529mm² Die-Fläche nVidia GF104, 40nm
Technik DirectX 11, 1 Raster Engine (mit verdoppeltem Triangle-Setup), 1600 Shader-Einheiten, 80 TMUs, 32 ROPs, 256 Bit DDR Interface (bis GDDR5) DirectX 11, 4 Raster Engines, 512 Shader-Einheiten, 64 TMUs, 48 ROPs, 384 Bit DDR Interface (bis GDDR5) DirectX 11, 2 Raster Engines, 256 Shader-Einheiten, 64 TMUs, 32 ROPs, 256 Bit DDR Interface (bis GDDR5)
Shader-Leistung 4/5 der Shader-Einheiten: 1x FMA, restliche 1/5 der Shader-Einheiten: 1x MADD oder 1x FMA (jeweils 2 Flop/Takt/Einheit) 1x FMA (2 Flop/Takt/Einheit) 1x FMA (2 Flop/Takt/Einheit)
Spezial-Einheiten 1/5 der Shader-Einheiten können dynamisch als SFU verwendet werden (womit diese Einheiten dann aber nicht mehr als reguläre Shader-Einheiten zur Verfügung stehen) 256 Load/Store-Einheiten + 64 SFUs wahrscheinlich 128 Load/Store-Einheiten + 32 SFUs
max. Taktraten 850/2400 MHz 700/1401/1848 MHz bis zu 725/1500/1800 MHz
Besonderheiten - hohe DoublePrecision-Power durch dedizierte Hardware DoublePrecision-Einheiten angeblich gestrichen

Dies ergibt eine sehr interessante Konstruktion: Bei der reinen Anzahl der Shader-Einheiten mag der GF104-Chip klar hinter dem GF100-Chip zurückliegen, aber in anderen Punkten ist der Abstand weitaus geringer, so daß sich der GF104-Chip in der Praxis der Spielebenchmarks dem GF100-Chip bzw. dessen kleinster Variante GeForce GTX 470 möglicherweise viel stärker annähern kann als man vorab annehmen würde. So bietet der GF104-Chip laut diesen Werten sogar die etwas bessere Texturierpower (bei GeForce GTX 470 & 480 fehlen einige der TMUs des GF100-Chips, zudem sind die Taktraten des GF104-Chips tendenziell höher) und auch das Speicherinterface ist maximal nur ein Drittel kleiner als daß des GF100-Chips.

Spezifikations-Vergleich GeForce GTX 285, GF104, GeForce GTX 470, Radeon HD 5870 & GeForce GTX 480

Beachtenswert ist vor allem, daß nVidia dem GF104-Chip wieder die vollen 64 TMUs des GF100-Chip spendiert hat und in diesem Punkt den kleineren Chip nicht abspeckte. Damit kehrt man wieder auf den bislang eingeschlagenen Weg (mit den früheren nVidia-Chips) zurück, eher mehr als weniger Texturierpower zu bieten – so gesehen ist der GF100-Chip mit seinen "nur" 64 TMUs hier die Ausnahme von der Regel und nicht der GF104-Chip. Weshalb nVidia dem GF100-Chip nur 64 TMUs mit auf den Weg gegeben hat, wird derzeit noch intensiv diskutiert – die momentan wahrscheinlichste Erklärung ist, daß 128 TMUs für den GF100-Chip durchaus ursprünglich den nVidia-Plänen entsprachen, diese aber letztlich geopfert wurden, um den Chip nicht noch größer werden zu lassen.

Der GF104-Chip kommt laut diesen Voraussagen jedenfalls in die Nähe einer GeForce GTX 470 – wird diese wahrscheinlich nicht überflügeln, aber möglicherweise den besseren Mix aus Performance, Verlustleistung und Preis bieten. Auch gegenüber den ATI-Karten stehen die Chancen nicht schlecht: Die oben aufgeführte Radeon HD 5870 ist natürlich kein Gegner für den GF104-Chip, dieser geht eher in die preislichen und leistungsmäßigen Regionen von Radeon HD 5770 und 5830. Hierbei ist dann wiederum ein ziemlich typisches Verhältnis zwischen ATI- und nVidia-Chips zu sehen: Die ATI-Chips mit der klar höheren (theoretischen) Rechenleistung, der nVidia-Chip dagegen mit der höheren Texturierleistung und klar mehr ROP-Leistung:

Spezifikations-Vergleich Radeon HD 5770, GF104 & Radeon HD 5830

Wie schon im Vergleich zwischen der letzten Chipgeneration (GeForce GTX 200 vs. Radeon HD 4800) sind diese Rohdaten natürlich immer unter dem Vorbehalt der Effizienz und der grundsätzlichen Idee hinter den einzelnen Architekturen zu sehen. Dies trifft besonders auf die (theoretische) Rechenleistung zu, welche bei nVidia grundsätzlich klar niedriger liegt, obwohl dies die nVidia-Chips der letzten Generation nicht daran gehindert hat, Spitzenplätze in Performancevergleichen zu belegen. ATI setzt halt gerade in der Frage der Shader-Architektur auf eine möglichst hohe Anzahl an Shader-Einheiten und relativ wenige Spezialeinheiten – hier sollen die normalen Shader-Einheiten möglichst viel Arbeit übernehmen und damit fehlende Spezialeinheiten ausgleichen.

nVidia hingegen setzt auf eine eher geringe Anzahl an Shader-Einheiten (mit dafür hohem Takt) und zugleich eine größere Anzahl an Spezial-Einheiten, gerade beim Fermi-Design. Insofern braucht ATI mit dem aktuellen Ansatz einfach eine hohe Überlegenheit bei der theoretischen Rechenleistung, um die bei nVidia vorhandenen Spezialeinheiten ausgleichen zu können. Zudem ist es letztlich erst der Mix aus allen Punkten, welcher die Chipperformance ergibt, ein einzelner Wert sagt nicht wirklich viel aus.

Die entscheidende Frage im Vergleich zu Radeon HD 5830 und 5770 wird dann natürlich sein, wie nVidia den GF104-Chip preismäßig einordnet. Allerdings kann man von der Preisfestsetzung der GF100-Varianten und der bekannten "Sweetspots" (dort, wo bei einem bestimmten Preispunkt der größte Umsatz gemacht) durchaus gewisse Schlußfolgerungen ziehen: So würden wir die größte GF104-Variante (wahrscheinlich GeForce GTS 450 genannt) bei 200 bis 230 Euro sehen. Diese Karte tritt in direkte Konkurrenz zur Radeon HD 5830 – und hat da gute Chancen, da die Radeon HD 5830 keinen guten Mix aus Preis und Performance anbietet (nur wenig schneller als Radeon HD 5770, aber deutlich teurer). Vermutlich dürfte die größte GF104-Variante die Radeon HD 5830 schlagen – und dies zu einem nicht höheren Preis.

Etwas darunter dürfte die mittlere GF104-Variante folgen (wahrscheinlich GeForce GTS 440 genannt). Die Änderungen dieser Karte dürften sich vermutlich auf deutlich niedrigere Taktfrequenzen beschränken, womit ein leistungsmäßiger Abstand von ca. 20 Prozent zur größten GF104-Variante entstehen sollte. Dafür kann nVidia vielleicht 160 bis 180 Euro verlangen, die Karte würde somit preislich etwas überhalb der Radeon HD 5770 angesiedelt werden, welche sie aber von der Performance her ebenso schlagen können sollte. Die Radeon HD 5770 dürfte jedoch sicherlich weiterhin ihr Geschäft machen können, da sie vom Kostenpunkt her klar niedriger angesetzt ist und daher preislich immer besser angeboten werden kann als die mittlere GF104-Variante.

Und letztlich dürfte es noch eine kleine GF104-Variante geben (möglicherweise GeForce GTS 430 genannt). Diese kleinste GF104-Variante dürfte dann diverse Hardware-Abspeckungen haben, diskutiert wird derzeit ein Modell mit 192 Shader-Einheiten, 48 TMUs und 24 ROPs an einem 192 Bit DDR breiten Speicherinterface. Diese Abspeckungen um jeweils ein Drittel kommen zum einen der Produktionsausbeute des GF104-Chips zugute, zum anderen wird damit ein klar niedrigeres Preissegment erschlossen als es der GF104-Chip regulär erreichen kann. So dürfte diese kleinste GF104-Variante runde 30 Prozent langsamer sein als die mittlere GF104-Variante und dann schon runde 45 Prozent langsamer als die größte GF104-Variante. Damit erscheint ein Preispunkt von 130 bis 150 Euro machbar, diese Karte geht somit in direkte Konkurrenz zur Radeon HD 5770. Ob sie diese von der Performance her schlagen kann, ist derzeit aufgrund der Unsicherheit der Abspeckungen und Taktfrequenzen kaum vorhersagbar.

GeForce GTS 430 (?) GeForce GTS 440 GeForce GTS 450
Chipbasis nVidia GF104, 40nm
Technik DirectX 11, 2 Raster Engines, 192 Shader-Einheiten, 48 TMUs, 24 ROPs, 192 Bit DDR Interface (bis GDDR5) DirectX 11, 2 Raster Engines, 256 Shader-Einheiten, 64 TMUs, 32 ROPs, 256 Bit DDR Interface (bis GDDR5) DirectX 11, 2 Raster Engines, 256 Shader-Einheiten, 64 TMUs, 32 ROPs, 256 Bit DDR Interface (bis GDDR5)
Taktraten ca. 20 Prozent weniger als GeForce GTS 450 ca. 20 Prozent weniger als GeForce GTS 450 bis zu 725/1500/1800 MHz
Performance (geschätzt) ~ Radeon HD 5770 besser als Radeon HD 5770 besser als Radeon HD 5830
Preispunkt (geschätzt) 130-150 Euro 160-180 Euro 200-230 Euro

Die Aussichten für den GF104-Chip und die daraus resultierenden Grafikkarten-Varianten sind somit als ziemlich gut zu bezeichnen, da nVidia mit diesem Chip scheinbar sehr gute Angebote für den Preisbereich von 130 bis 230 Euro bieten wird – ein Preisbereich, in welchem klar mehr verkauft wird als bei den HighEnd-Karten mit Preisen von 300 Euro und mehr. Vor allem überhalb von 150 Euro dürfte nVidia stark mit dem GF104-Chip punkten können, da ATI hier nur die arg mittelmäßige (und zudem preislich klar überzogene) Radeon HD 5830 im Angebot hat. Gut möglich, daß ATI mit dem Auftauchen des GF104-Chips etwas grundlegendes an der Preisgestaltung der Radeon HD 5830 ändert oder sogar eine weitere neue Variante für diesen Preisbereich bringt.

Die größte Umgewissheit beim GF104-Chip liegt derzeit noch darin, unter welcher Verlustleistung dieser operiert. Der GF100-Chip stellt diesbezüglich schließlich die Rekorde in die falsche Richtung hin auf – und auch der GF104-Chip dürfte in dieser Frage kein Leisetreter werden, da dessen Die-Fläche größer noch als beim G92-Chip unter 65nm liegen soll, welcher seinseits auf 324mm² kommt. Dies würde für den GF104 in etwa auf eine Die-Fläche ähnlich wie beim RV870/Cypress-Chip (334mm²) hinauslaufen, was bei guten Taktfrequenzen schnell in Richtung von bis zu 150 Watt Stromverbrauch bei der größten GF104-Variante gehen kann.

Doch auch wenn es etwas weniger wird, so scheint der GF104-Chip nicht darauf angelegt zu sein, gerade die Radeon HD 5750 & 5770 auf Basis des RV840/Juniper-Chips (166mm² Die-Fläche) beim Stromverbrauch zu erreichen, dafür ist der Größenunterschied in der Chipfläche einfach zu hoch. Mit etwas mehr Stromverbrauch beim GF104-Chip als bei Radeon HD 5750 (64W) und 5770 (86W) wird man aber wahrscheinlich leben können, sofern der Unterschied eben nicht all zu groß ausfällt. Gegenüber der Radeon HD 5830 dürfte es diesbezüglich dagegen kaum Probleme geben, denn diese verbraucht mit 120 Watt unter Spielen auch nicht gerade schlecht.

In der Summe scheint nVidia mit dem GF104 einen sehr interessanten Chip in der Hand zu halten, welcher womöglich aus Spielersicht sogar viel interessanter als der GF100-Chip selber ist, welcher seinerseits doch klar auf die Zweitverwertung als GPGPU-Beschleuniger ausgerichtet wurde und dafür auch nicht gerade geringe Mengen an (für Spieler unnütze) Transistoren verbrät. Wenn es nVidia richtig anpackt, sich die vorgenannten Hardware-Daten bewahrheiten und Chipfertiger TSMC zudem die Zieltaktfreqenzen halbwegs erreichen kann, deutet sich hier ein Grafikchip an, welcher wirkliche gute Spieler-Grafikkarten zu nachvollziehbaren Preispunkten ermöglicht.