13

News des 13. Dezember 2011

Nach den Informationen zum R1000/Tahiti-Chip kommen aus unserem Forum nun erste Informationsfetzen zum nVidia GK104 Performance-Chip der 28nm-Generation. Die erste Information hierzu lautet, daß nVidia diesen Chip noch vor dem HighEnd-Chip GK100 vorstellen will – dies erhöht die Wahrscheinlichkeit, daß der GK104 noch auf der Fermi-Architektur basiert oder aber nur gewisse Anleihen von der Kepler-Architektur nimmt. Dafür peilt nVidia mit dem GK104 allerdings auch eine Performance überhalb der GeForce GTX 580 an, was durchaus in den Leistungsbereich des R1000/Tahiti-Chips hineingehen könnte – je nachdem, wie stark dieser in der Praxis ausfällt. Zur Leistungseinschätzung des GK104 gibt es zudem eine konkrete Information: Diese lautet auf eine Rechenleistung von "weit über 2 TFLOPs". Da eine GeForce GTX 560 Ti als aktuelle Performance-Lösung von nVidia auf 1,26 TFlops kommt, eine GeForce GTX 580 dagegen auf 1,58 TFlops, wäre dies schon eine deutliche Steigerung der Rechenleistung beim GK104-Chip.

Sofern nVidia das System der "Hotclocks" (die Shader-Einheiten takten wesentlich höher als der Rest des Chips) beibehält und die Taktfrequenzen unter der 28nm-Fertigung nicht wesentlich anders ausfallen als bisher (eher unwahrscheinlich), ist dieser hohe Anspruch fast nur mit einer nahezu Verdopplung der Anzahl der Shader-Einheiten erreichbar. Bei 768 (1D) Shader-Einheiten und einem Shader-Takt von 1600 MHz würde somit eine Rechenleistung von 2,46 TFlops erreicht, dies wäre im Rahmen dieser Vorhersage. Denkbar sind natürlich auch noch andere Modelle, wie 640 Shader-Einheiten mit etwas höheren Taktraten oder 704 Shader-Einheiten mit 1600 MHz Shader-Takt – in beiden Fällen kann man klar über 2 TFlops Rechenleistung erzielen. Wahrscheinlich benutzt nVidia für den GK104-Chip dann zudem das grundsätzliche Modell der Shader-Cluster des GF100/GF110-Chips: Dies ermöglicht, daß man nur 80 bis 96 Textureneinheiten bei diesem Performance-Chip verbaut – und nicht gleich 112 bis 128 wie bei den Shader-Clustern des GF104/GF114-Chips.

In der Leistungsklasse des GK104 benötigt man nicht so eine hohe Texturierpower, zudem spart dies natürlich auch Transistoren. Die eigentliche sich aus den 2 TFlops und mehr ergebende Frage ist allerdings, ob hierfür nicht ein größeres Speicherinterface benötigt wird als das bisher bei nVidia im Performance-Bereich aufgebotene 256 Bit DDR Interface. Bei einer Rechenleistung klar überhalb der GeForce GTX 580 würden wir dies eigentlich bejahen – andererseits braucht nVidia auch einen gewissen Abstand zum HighEnd-Chip GK100 und will zudem das GK104-Die nicht zu groß werden lassen. Demzufolge ist es vakant, ob nVidia beim GK104 nun ein 256 oder 384 Bit DDR Speicherinterface verbaut – beide Strategien sind möglich. Das grundsätzliche Ziel einer Performance knapp überhalb der GeForce GTX 580 wäre im übrigen auch mit "nur" 640 Shader-Einheiten, 80 TMUs und 256 Bit DDR Speicherinterface erreichbar, weil in diesem Modell genügend mehr Rechenleistung und Texturierpower zur Verfügung steht, um trotz nur geringfügig mehr Speicherbandbreite (allein erzielt durch einen höheren Speichertakt) die GeForce GTX 580 zu schlagen.

Fermi-Refresh (GeForce 500 Serie) Kepler (GeForce 600 Serie)
GF110 (GeForce GTX 570/580/590)
3 Milliarden Transistoren auf 530mm² Die-Fläche in 40nm
Fermi-Architektur mit 4 Raster Engines
16 Polymorph Engines mit 16 Tesselations-Einheiten
512 (1D) Shader-Einheiten
64 Textureneinheiten (TMUs)
48 Raster Operation Units (ROPs)
384 Bit DDR Speicherinterface (bis GDDR5)
maximaler Takt: Chip 772 MHz, Shader 1544 MHz, Speicher 2000 MHz
maximale Rechenleistung: 1,58 TFlops (SP)
maximale Speicherbandbreite: 192 GB/sec
GK100
Kepler-Architektur
geschätzt 1024 (1D) Shader-Einheiten
geschätzt 128 Textureneinheiten (TMUs)
geschätzt 64 Raster Operation Units (ROPs)
geschätzt 512 Bit DDR Speicherinterface (bis GDDR5)
Performance: noch zu unsicher für eine Prognose, aber sicherlich überhalb des Niveaus der GeForce GTX 590
Launch: zweites Quartal 2012
GF114 (GeForce GTX 560/Ti)
1,95 Milliarden Transistoren auf 358mm² Die-Fläche in 40nm
Fermi-Architektur mit 2 Raster Engines
8 Polymorph Engines mit 8 Tesselations-Einheiten
384 (1D) Shader-Einheiten
64 Textureneinheiten (TMUs)
32 Raster Operation Units (ROPs)
256 Bit DDR Speicherinterface (bis GDDR5)
maximaler Takt: Chip 822 MHz, Shader 1644 MHz, Speicher 2000 MHz
maximale Rechenleistung: 1,26 TFlops (SP)
maximale Speicherbandbreite: 128 GB/sec
GK104
angeblich etwas geringere Die-Size als beim GF114
Architektur unbekannt, ob Kepler, Fermi oder Kepler/Fermi-Mix
angenommen 640 bis 768 (1D) Shader-Einheiten
angenommen 80 bis 96 Textureneinheiten (TMUs)
Speicherinterface unklar, 256 bis 384 Bit DDR sind möglich
maximale Rechenleistung: gerüchteweiser "weit über 2 TFLOPs"
Performance: angeblich etwas schneller als die GeForce GTX 580
Launch: Anfang/Mitte erstes Quartal 2012

Schließlich reicht es ausgehend von der GeForce GTX 560 Ti aus, runde 35 Prozent Performance oben drauf zu legen, um das Niveau der GeForce GTX 580 zu erreichen – so viel stärker muß der GK104-Chip gegenüber dem GF114-Chip also gar nicht ausfallen. Angeblich will nVidia zudem die Die-Fläche seines Performance-Chips reduzieren, welche beim GF114 mit 358mm² doch schon ziemlich fett ausgefallen ist – AMDs RV970/Cayman HighEnd-Chip ist schließlich mit 389mm² kaum größer. Diesbezüglich sind 640 Shader-Einheiten, 80 TMUs und ein 256 Bit DDR Speicherinterface schon ziemlich viel, denn dies sind immerhin 67% mehr Shader-Einheiten und 25% mehr Textureinheiten als beim GF114-Chip. Auf 768 Shader-Einheiten und 96 TMUs wären es dagegen schon 100% mehr Shader-Einheiten und 50% mehr Textureneinheiten – dies würde knapp werden, noch in die 70 Prozent Flächenvorteil der 28nm-Fertigung bei der gleichzeitig angestrebten geringeren Die-Fläche hineinzukommen.

Rein terminlich soll der GK104-Chip irgendwann Anfang bis Mitte des ersten Quartals 2012 antreten – während der GK100-Chip ziemlich sicher nicht vor dem zweiten Quartal 2012 erscheint. Damit dürfte AMD mit dem R1000/Tahiti-Chip wohl erst einmal die Performance-Führerschaft übernehmen, da dieser als etwas potenter als der GK104-Chip einzuschätzen ist. nVidia muß dies aber nicht weiter stören, denn wenn man das eigene Ziel einer kleineren Die-Fläche beim GK104 einhält, kann der GK104 eine Performance in der Nähe zum R1000/Tahiti zu aber einer geringeren Verlustleistung anbieten – und ab dem zweiten Quartal dürfte der GK100-Chip die Performance im HighEnd-Segment dann komplett neu definieren. Der GK100 dürfte dafür jedoch sicherlich auch wieder eine voluminöse Die-Fläche mitbringen und damit nicht nur bei der Performance, sondern auch bei den Fertigungskosten und dem finalen Kartenpreis in seiner eigenen Liga spielen.

Daneben gibt es bei Hardware Computer noch einen etwas seltsamen Bericht zu möglichen Kepler-Chips: Der Text bezieht sich auf die von 4Gamer erstellte Kepler-Roadmap, die abgebildete Tabelle stimmt jedoch damit überhaupt nicht überein und bietet eine ganz andere Auslegung. Wie jedoch die 4Gamer-Roadmap dürfte es sich bei der Tabelle von Hardware Computer rein um Annahmen des Verfassers handeln, die jedoch keinerlei reale Datengrundlage hat. Die Tabelle von Hardware Computer hat zudem sowieso keine Glaubwürdigkeit, da nVidia derzeit sicherlich noch nicht für das komplette Kepler-Programm schon Grafikkarten-Namen, Taktraten und Preise festgelegt hat – einige der genannten Grafikchips dürften schließlich noch nicht einmal das frühe Sample-Stadium verlassen haben. Natürlich kann es trotzdem passieren, daß sich diverse Online-Publikationen wie wild auf diese Tabelle stürzen – schon die (offensichtlich selbsterstellte) 4Gamers-Roadmap wurde teilweise ähnlich einer päpstlichen Offenbarung behandelt und herumgereicht.

Nach den Informationen zum R1000/Tahiti-Chip kommen aus unserem Forum nun erste Informationsfetzen zum nVidia GK104 Performance-Chip der 28nm-Generation. Die erste Information hierzu lautet, daß nVidia diesen Chip noch vor dem HighEnd-Chip GK100 vorstellen will - dies erhöht die Wahrscheinlichkeit, daß der GK104 noch auf der Fermi-Architektur basiert oder aber nur gewisse Anleihen von der Kepler-Architektur nimmt. Dafür peilt nVidia mit dem GK104 allerdings auch eine Performance überhalb der GeForce GTX 580 an, was durchaus in den Leistungsbereich des R1000/Tahiti-Chips hineingehen könnte - je nachdem, wie stark dieser in der Praxis ausfällt. Zur Leistungseinschätzung des GK104 gibt es zudem eine konkrete Information: Diese lautet auf eine Rechenleistung von "weit über 2 TFLOPs". Da eine GeForce GTX 560 Ti als aktuelle Performance-Lösung von nVidia auf 1,26 TFlops kommt, eine GeForce GTX 580 dagegen auf 1,58 TFlops, wäre dies schon eine deutliche Steigerung der Rechenleistung beim GK104-Chip.

Sofern nVidia das System der "Hotclocks" (die Shader-Einheiten takten wesentlich höher als der Rest des Chips) beibehält und die Taktfrequenzen unter der 28nm-Fertigung nicht wesentlich anders ausfallen als bisher (eher unwahrscheinlich), ist dieser hohe Anspruch fast nur mit einer nahezu Verdopplung der Anzahl der Shader-Einheiten erreichbar. Bei 768 (1D) Shader-Einheiten und einem Shader-Takt von 1600 MHz würde somit eine Rechenleistung von 2,46 TFlops erreicht, dies wäre im Rahmen dieser Vorhersage. Denkbar sind natürlich auch noch andere Modelle, wie 640 Shader-Einheiten mit etwas höheren Taktraten oder 704 Shader-Einheiten mit 1600 MHz Shader-Takt - in beiden Fällen kann man klar über 2 TFlops Rechenleistung erzielen. Wahrscheinlich benutzt nVidia für den GK104-Chip dann zudem das grundsätzliche Modell der Shader-Cluster des GF100/GF110-Chips: Dies ermöglicht, daß man nur 80 bis 96 Textureneinheiten bei diesem Performance-Chip verbaut - und nicht gleich 112 bis 128 wie bei den Shader-Clustern des GF104/GF114-Chips.

In der Leistungsklasse des GK104 benötigt man nicht so eine hohe Texturierpower, zudem spart dies natürlich auch Transistoren. Die eigentliche sich aus den 2 TFlops und mehr ergebende Frage ist allerdings, ob hierfür nicht ein größeres Speicherinterface benötigt wird als das bisher bei nVidia im Performance-Bereich aufgebotene 256 Bit DDR Interface. Bei einer Rechenleistung klar überhalb der GeForce GTX 580 würden wir dies eigentlich bejahen - andererseits braucht nVidia auch einen gewissen Abstand zum HighEnd-Chip GK100 und will zudem das GK104-Die nicht zu groß werden lassen. Demzufolge ist es vakant, ob nVidia beim GK104 nun ein 256 oder 384 Bit DDR Speicherinterface verbaut - beide Strategien sind möglich. Das grundsätzliche Ziel einer Performance knapp überhalb der GeForce GTX 580 wäre im übrigen auch mit "nur" 640 Shader-Einheiten, 80 TMUs und 256 Bit DDR Speicherinterface erreichbar, weil in diesem Modell genügend mehr Rechenleistung und Texturierpower zur Verfügung steht, um trotz nur geringfügig mehr Speicherbandbreite (allein erzielt durch einen höheren Speichertakt) die GeForce GTX 580 zu schlagen.




Fermi-Refresh (GeForce 500 Serie)
Kepler (GeForce 600 Serie)





GF110 (GeForce GTX 570/580/590)
3 Milliarden Transistoren auf 530mm² Die-Fläche in 40nm
Fermi-Architektur mit 4 Raster Engines
16 Polymorph Engines mit 16 Tesselations-Einheiten
512 (1D) Shader-Einheiten
64 Textureneinheiten (TMUs)
48 Raster Operation Units (ROPs)
384 Bit DDR Speicherinterface (bis GDDR5)
maximaler Takt: Chip 772 MHz, Shader 1544 MHz, Speicher 2000 MHz
maximale Rechenleistung: 1,58 TFlops (SP)
maximale Speicherbandbreite: 192 GB/sec
GK100
Kepler-Architektur
geschätzt 1024 (1D) Shader-Einheiten
geschätzt 128 Textureneinheiten (TMUs)
geschätzt 64 Raster Operation Units (ROPs)
geschätzt 512 Bit DDR Speicherinterface (bis GDDR5)
Performance: noch zu unsicher für eine Prognose, aber sicherlich überhalb des Niveaus der GeForce GTX 590
Launch: zweites Quartal 2012



GF114 (GeForce GTX 560/Ti)
1,95 Milliarden Transistoren auf 358mm² Die-Fläche in 40nm
Fermi-Architektur mit 2 Raster Engines
8 Polymorph Engines mit 8 Tesselations-Einheiten
384 (1D) Shader-Einheiten
64 Textureneinheiten (TMUs)
32 Raster Operation Units (ROPs)
256 Bit DDR Speicherinterface (bis GDDR5)
maximaler Takt: Chip 822 MHz, Shader 1644 MHz, Speicher 2000 MHz
maximale Rechenleistung: 1,26 TFlops (SP)
maximale Speicherbandbreite: 128 GB/sec
GK104
angeblich etwas geringere Die-Size als beim GF114
Architektur unbekannt, ob Kepler, Fermi oder Kepler/Fermi-Mix
angenommen 640 bis 768 (1D) Shader-Einheiten
angenommen 80 bis 96 Textureneinheiten (TMUs)
Speicherinterface unklar, 256 bis 384 Bit DDR sind möglich
maximale Rechenleistung: gerüchteweiser "weit über 2 TFLOPs"
Performance: angeblich etwas schneller als die GeForce GTX 580
Launch: Anfang/Mitte erstes Quartal 2012





Schließlich reicht es ausgehend von der GeForce GTX 560 Ti aus, runde 35 Prozent Performance oben drauf zu legen, um das Niveau der GeForce GTX 580 zu erreichen - so viel stärker muß der GK104-Chip gegenüber dem GF114-Chip also gar nicht ausfallen. Angeblich will nVidia zudem die Die-Fläche seines Performance-Chips reduzieren, welche beim GF114 mit 358mm² doch schon ziemlich fett ausgefallen ist - AMDs RV970/Cayman HighEnd-Chip ist schließlich mit 389mm² kaum größer. Diesbezüglich sind 640 Shader-Einheiten, 80 TMUs und ein 256 Bit DDR Speicherinterface schon ziemlich viel, denn dies sind immerhin 67% mehr Shader-Einheiten und 25% mehr Textureinheiten als beim GF114-Chip. Auf 768 Shader-Einheiten und 96 TMUs wären es dagegen schon 100% mehr Shader-Einheiten und 50% mehr Textureneinheiten - dies würde knapp werden, noch in die 70 Prozent Flächenvorteil der 28nm-Fertigung bei der gleichzeitig angestrebten geringeren Die-Fläche hineinzukommen.

Rein terminlich soll der GK104-Chip irgendwann Anfang bis Mitte des ersten Quartals 2012 antreten - während der GK100-Chip ziemlich sicher nicht vor dem zweiten Quartal 2012 erscheint. Damit dürfte AMD mit dem R1000/Tahiti-Chip wohl erst einmal die Performance-Führerschaft übernehmen, da dieser als etwas potenter als der GK104-Chip einzuschätzen ist. nVidia muß dies aber nicht weiter stören, denn wenn man das eigene Ziel einer kleineren Die-Fläche beim GK104 einhält, kann der GK104 eine Performance in der Nähe zum R1000/Tahiti zu aber einer geringeren Verlustleistung anbieten - und ab dem zweiten Quartal dürfte der GK100-Chip die Performance im HighEnd-Segment dann komplett neu definieren. Der GK100 dürfte dafür jedoch sicherlich auch wieder eine voluminöse Die-Fläche mitbringen und damit nicht nur bei der Performance, sondern auch bei den Fertigungskosten und dem finalen Kartenpreis in seiner eigenen Liga spielen.

Daneben gibt es bei Hardware Computer noch einen etwas seltsamen Bericht zu möglichen Kepler-Chips: Der Text bezieht sich auf die von 4Gamer erstellte Kepler-Roadmap, die abgebildete Tabelle stimmt jedoch damit überhaupt nicht überein und bietet eine ganz andere Auslegung. Wie jedoch die 4Gamer-Roadmap dürfte es sich bei der Tabelle von Hardware Computer rein um Annahmen des Verfassers handeln, die jedoch keinerlei reale Datengrundlage hat. Die Tabelle von Hardware Computer hat zudem sowieso keine Glaubwürdigkeit, da nVidia derzeit sicherlich noch nicht für das komplette Kepler-Programm schon Grafikkarten-Namen, Taktraten und Preise festgelegt hat - einige der genannten Grafikchips dürften schließlich noch nicht einmal das frühe Sample-Stadium verlassen haben. Natürlich kann es trotzdem passieren, daß sich diverse Online-Publikationen wie wild auf diese Tabelle stürzen - schon die (offensichtlich selbsterstellte) 4Gamers-Roadmap wurde teilweise ähnlich einer päpstlichen Offenbarung behandelt und herumgereicht.