Wir kommen noch einmal zurück auf die Spezifikationen zur GeForce GTX 460 [1] und die sich daraus ergebenden Erkenntnisse zum GF104-Chip von nVidia: Die zugrundeliegende Quelle in Form des Heise Newstickers [2] hat die Anzahl der Textureneinheiten der GeForce GTX 460 zwar nicht explizit erwähnt, aus der angegebenen Texturierleistung von 37,8 GPix/sec ergibt sich auf dem Chiptakt von 675 MHz jedoch eindeutig die Anzahl von 56 aktiven TMUs bei der GeForce GTX 460 – und damit klar mehr als bei der GF100-basierten GeForce GTX 465 mit deren 44 TMUs. Sofern man davon ausgeht, daß der GF104-Chip im Vollausbau über 384 Shader-Einheiten verfügt, würde dieser dann auch 64 Textureneinheiten im Vollausbau haben – genausoviel im übrigen wie der GF100-Chip im Vollausbau.
nVidia hat damit an den Shader-Clustern des GF100-Chip herumgewerkelt – mit dem Resultat, daß einer dieser Shader-Cluster nicht mehr 32 Shader-Einheiten und 4 TMUs wie noch beim GF100-Chip trägt, sondern beim GF104-Chip ein Shader-Cluster wahrscheinlich 24 Shader-Einheiten und 4 TMUs umfaßt. Ganz sicher ist dies nicht, es könnte auch ein Modell mit 48 Shader-Einheiten und 8 TMUs sein – dies würde allerdings eine etwas größere Anpassungsarbeit erfordern und zudem die Tesselations-Leistung bei den kommenden kleineren Fermi-Chips minimieren. Denn schließlich verfügt jeder der Shader-Cluster über seine eigene Tesselationseinheit, was die starke Tesselations-Leistung der GF100-basierten Grafikkarten erklärt. Mit dem GF104-Chip und dem Modell von 24 Shader-Einheiten samt 4 TMUs in einem Shader-Cluster würde nVidia die Tesselations-Leistung relativ gesehen sogar steigern, da bei diesem Modell die Anzahl der Shader-Cluster und damit der Tesselationseinheiten zwischen GF100- und GF104-Chip mit 16 identisch wäre.

Der GF104-Chip hätte in diesem Modell (taktnormiert) keine höhere Tesselationsleistung als der GF100-Chip, aber immerhin die gleiche – was angesichts der geringeren Anzahl an Shader-Einheiten und des niedrigeren Preispunkte entsprechender Grafikkarten auch beachtbar ist. Wie gesagt gibt es hier auch einen Gegenentwurf, wo ein GF104 Shader-Cluster aus 48 Shader-Einheiten und 8 TMUs besteht, in diesem hätte der GF104-Chip dann nur 8 Shader-Cluster sowie 8 Tesselationseinheiten, ergo die Hälfte des GF100-Chips. Dies ist eine denkbare Variante, weil sie Transistoren spart, allerdings untergräbt sie die mittel- und langfristigen Aussichten von DirectX11-Tesselation etwas: Denn bei den kleineren Fermi-Abwandlungen GF106 und GF108 werden natürlich entsprechend weniger Shader-Cluster verbaut werden, je nach Denkmodell beim GF108-Chip um den Faktor 3 oder 4 weniger.
Bei einer gegenüber dem GF100-Chip abgesenkten Tesselationsleistung des GF104-Chips würde der GF108-Chip dann bei einer Tesselationsleistung von nur noch 1/6 oder 1/8 zum GF100-Chip landen – und damit nominell auf dem Niveau von ATIs RV870/Cypress-Chip, der in dieser Frage bekannterweise als unmodern gilt, was ATI auch mit der nachfolgenden Southern-Islands-Generation [3] entscheidend ändern will. Dies aber würde nVidias Ansinnen konterkarieren, mit der Fermi-Generation eine durchgehend überzeugende Tesselationsleistung zu bieten – vor allem, weil Tesselation ein Feature ist, welches sich schlecht zwischen Grafikchips verschiedener Preissegmente skalieren läßt. Denn während die bei LowCost-Grafikchips üblicherweise benutzte kleinere Auflösung oder/und der Verzicht auf Anti-Aliasing die Leistungsanforderungen an diesen Chip derart absenken, daß auch dieser kleinere Chip noch moderne Spiele ableisten kann, lassen sich mit diesen Maßnahmen die Anforderungen an die Tesselation kaum senken.
| GF104 | GF100 |
|---|---|
| Shader-Cluster mit 24 Shader-Einheiten, 4 Textureneinheiten und einer Tesselationseinheit pro Shader-Cluster | Shader-Cluster mit 32 Shader-Einheiten, 4 Textureneinheiten und einer Tesselationseinheit pro Shader-Cluster |
| Verhältnis SM zu TMU 6:1 | Verhältnis SM zu TMU 8:1 |
| taktnormiert 33 Prozent höhere Texturier- und Tesselations-Leistung des GF104-Chips gegenüber dem GF100-Chip pro Shader-Einheit | taktnormiert 33 Prozent höhere Shader-Leistung des GF100-Chips gegenüber dem GF104-Chip pro Shader-Cluster |
Sprich: Ob LowCost-Grafikkarte auf niedriger Auflösung oder HighEnd-Grafikkarte auf hoher Auflösung mit Anti-Aliasing, die Anforderungen an beide Grafikkarten bezüglich der Tesselationsleistung sind immer dieselben (sofern man nicht den Tesselationsgrad heruntersetzt, was aber den Sinn von Tesselation untergräbt). Wenn man DirectX11-Tesselation als durch die Spieleentwickler breit genutztes Feature durchsetzen will, müssen demzufolge auch die LowCost- und Mainstream-Grafikkarten über eine ausreichende Tesselationsleistung verfügen. Daß diese bei LowCost-Grafikkarten nie ganz so hoch sein kann wie bei HighEnd-Grafikkarten, ist klar, aber das vorhin genannte Verhältnis von 1/6 bis 1/8 der Tesselationsleistung des GF100-Chips beim GF108-Chip erscheint als zu niedrig für diese Anforderung.
Sofern nVidia es also Ernst meint mit der hohen Tesselationsleistung bei der Fermi-Generation, sollten der Abschlag der LowCost- und Mainstream-Modelle bei der Tesselationsleistung nicht zu hoch ausfallen, was letztlich dem Modell mit 24 Shader-Einheiten und 4 TMUs in einem Shader-Cluster bei GF104, GF106 und GF108 in die Hände spielt – dann hätte der GF108-Chip immerhin noch 1/3 oder 1/4 der Tesselationsleistung des GF100-Chips. Letztlich entspricht dies auch dem Grundgedanken des GF104-Chips, welcher bei diesem Modell der Shader-Cluster mehr Texturierleistung und mehr Tesselationsleistung pro Shaderleistung gegenüber dem GF100-Chip auf die Waage bringt – alles vorteilhaft für die noch folgenden kleineren Grafikchips der Fermi-Generation. Was gleich auch das Stichwort für die nächste offene Frage ist: Mit welcher Anzahl an Shader-Einheiten die Chips GF106 und GF108 antreten werden.
Hierzu sind wir bisher von glatten Halbierungen des GF104-Chips ausgegangen, den wir wie gesagt auf 384 Shader-Einheiten im Vollausbau einschätzen: Beim GF106 wären dies dann 192 Shader-Einheiten und beim GF108 ergo 96 Shader-Einheiten. Es gibt hierzu aber auch andere denkbare Modelle – wenngleich das hier und da genannte Modell mit 256 Shader-Einheiten für den GF106 und 128 Shader-Einheiten beim GF108 zwar auf den ersten Blick rund aussieht, aber technisch nahezu unmöglich ist: Alle Rechen-Einheiten im GF104-Chip müssten hierfür um den Faktor 1,5 (GF106) bzw. 3 (GF108) geteilt werden, was schon allein bei den Textureneinheiten scheitert: 64 TMUs lassen sich nunmal schlecht durch 1,5 oder 3 teilen. Allerdings ist die zugrundeliegende Idee einer näheren Zusammenrückung der Chips GF104, GF106 und GF108 nicht so abwegig und auch die Stückelungen 1/1,5 und 1/3 sind doch machbar.
| Modell 1 Stückelung 1/2/4 |
Modell 2 Stückelung 1/1,5/3 |
|
|---|---|---|
| GF104 | 4 Raster Engines, 384 Shader-Einheiten, 64 TMUs, 32 ROPs, 256 Bit DDR Interface (bis GDDR5) | 3 Raster Engines, 360 Shader-Einheiten, 60 TMUs, 32 ROPs, 256 Bit DDR Interface (bis GDDR5) |
| GF106 | 2 Raster Engines, 192 Shader-Einheiten, 32 TMUs, 24 ROPs, 192 Bit DDR Interface (bis GDDR5) | 2 Raster Engines, 240 Shader-Einheiten, 30 TMUs, 24 ROPs, 192 Bit DDR Interface (bis GDDR5) |
| GF108 | 1 Raster Engine, 96 Shader-Einheiten, 16 TMUs, 16 ROPs, 128 Bit DDR Interface (bis GDDR5) | 1 Raster Engine, 120 Shader-Einheiten, 20 TMUs, 16 ROPs, 128 Bit DDR Interface (bis GDDR5) |
Dafür müsste der GF104-Chip im Vollausbau nicht mit 384 Shader-Einheiten und 64 TMUs antreten, sondern schlicht "nur" mit 360 Shader-Einheiten und 60 TMUs. Die beiden letztgenanten Werte lassen sich perfekt durch 1,5 oder 3 teilen, so daß der GF106-Chip dann mit 240 Shader-Einheiten und 40 TMUs sowie der GF108 mit 120 Shader-Einheiten und 20 TMUs antreten könnte. Alle diese genannten Werte würden im übrigen perfekt zu Shader-Clustern mit jeweils 24 Shader-Einheiten und 4 TMUs passen (bei 360 Shader-Einheiten für den GF104-Chip ist gar nur noch dieses Modell möglich), alle entsprechenden Verhältnisse der Einheiten untereinander ergeben ganze Zahlen, sind also technisch machbar. Es bleibt natürlich abzuwarten, welche Anzahl an Hardware-Einheiten nVidia diesen Chips wirklich mit auf den Weg gegeben hat, denkbar sind derzeit wie gesagt die Varianten 384-192-92 oder 360-240-120, nicht aber 384-256-128 (Anzahl der Shader-Einheiten, jeweils in der Reihenfolge GF104-GF106-GF108).
Verweise:
[1] http://www.3dcenter.org/artikel/erste-details-zur-gf100-architektur
[2] http://www.heise.de/newsticker/meldung/Endgueltige-Spezifikationen-der-GeForce-GTX-460-enthuellt-1026888.html
[3] http://www.3dcenter.org/news/2010-05-31
[4] http://www.golem.de/1006/75978.html
[5] http://www.tweaktown.com/reviews/3361/axle_radeon_hd_5670_1gb_video_card/index.html
[6] http://www.overclock3d.net/reviews/gpu_displays/asus_eah5870_v2_review/1
[7] http://www.hardocp.com/article/2010/06/22/msi_r5870_lightning_video_card_review
[8] http://www.lostcircuits.com/mambo/index.php?option=com_content&task=view&id=85&Itemid=1
[9] http://www.hardwarecanucks.com/forum/hardware-canucks-reviews/33499-evga-geforce-gtx-470-superclocked-review.html
[10] http://www.guru3d.com/article/palit-geforce-gtx-470-dual-fan-review/
[11] http://www.bjorn3d.com/read.php?cID=1864
[12] http://www.heise.de/newsticker/meldung/10-000-Prozessorkerne-in-einem-Server-Rack-1027899.html
[13] http://www.ocinside.de/html/workshop/intel_unlock_overclock_d.html
[14] http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?id=1277276808
[15] http://www.pureoverclock.com/article1006.html
[16] http://www.hardwaresecrets.com/article/Gigabyte-890FXA-UD7-Motherboard/1032
[17] http://www.overclock3d.net/reviews/cpu_mainboard/asrock_890gx_extreme3/1
[18] http://ixbtlabs.com/articles3/mainboard/asus-p7h57d-v-evo-i57h-p1.html
[19] http://benchmarkreviews.com/index.php?option=com_content&task=view&id=542&Itemid=58
[20] http://techgage.com/article/corsair_survivor_gtr_32gb_flash_drive/
[21] http://www.legitreviews.com/article/1340/1/
[22] http://www.testfreaks.com/blog/review/review-of-thecus-n4200-zero-crash-with-dual-power-nas/
[23] http://www.silicon.de/mobile/tkomm/0,39039016,41533784,00/jede+fuenfte+android_app+ein+sicherheitsrisiko.htm
[24] http://www.virenschutz.info/beitrag-Kriminelle-attackieren-Facebook-und-Twitter-Nutzer-im-Doppelpack--3465.html
[25] http://www.golem.de/1006/75967.html
[26] http://www.heise.de/security/meldung/DNSSEC-fuer-org-Domains-1028024.html
[27] http://www.heise.de/security/meldung/Firefox-Weiterbrowsen-trotz-Plug-in-Absturz-2-Update-1027530.html
[28] http://www.tweakpc.de/news/18887/windows-7-service-pack-1-wichtige-aenderungen/
[29] http://winfuture.de/news,56340.html
[30] http://winfuture.de/news,56364.html
[31] http://www.gulli.com/news/suchmaschine-bing-goes-entertainment-online-gaming-2010-06-23
[32] http://www.gulli.com/news/n-chsten-samstag-ist-adactaday-2010-06-23
[33] http://www.gulli.com/news/thomas-rasset-mediation-soll-filesharing-fall-l-sen-2010-06-23
[34] http://www.gulli.com/news/fakeabmahnungen-der-kanzlei-n-mann-lang-aufgetaucht-2010-06-23
[35] http://www.golem.de/1006/75977.html
[36] http://www.golem.de/1006/75956.html
[37] http://www.golem.de/1006/75959.html
[38] http://www.golem.de/1006/75952.html
[39] http://www.golem.de/1006/75973.html
[40] http://www.golem.de/1006/75961.html
[41] http://www.heise.de/newsticker/meldung/Online-Sprachkurs-mit-Echtzeitanalyse-1028014.html
[42] http://www.heise.de/newsticker/meldung/Investoren-retten-Mandriva-1028100.html
[43] http://de.wikipedia.org/wiki/23._Juni
[44] http://de.wikipedia.org/wiki/24._Juni
[45] http://www.astronews.com/news/artikel/2010/06/1006-033.shtml
[46] http://www.astronews.com/news/artikel/2010/06/1006-034.shtml
[47] http://www.scinexx.de/wissen-aktuell-11842-2010-06-23.html
[48] http://www.scinexx.de/wissen-aktuell-11843-2010-06-23.html
[49] http://www.scinexx.de/wissen-aktuell-11844-2010-06-23.html
[50] http://www.spiegel.de/wissenschaft/mensch/0,1518,702328,00.html
[51] http://www.spiegel.de/wissenschaft/mensch/0,1518,702232,00.html
[52] http://www.faz.net/s/RubCEB3712D41B64C3094E31BDC1446D18E/Doc~EC79B7C9C1AD7422C9E37964D1F51D4BA~ATpl~Ecommon~Scontent.html
[53] http://winfuture.de/news,56353.html
[54] http://www.heise.de/newsticker/meldung/Datenschuetzer-kritisieren-Swift-Abkommen-1027640.html
[55] http://www.nachdenkseiten.de/?p=5970
[56] http://www.nachdenkseiten.de/?p=5967
[57] http://www.dradio.de/dlf/sendungen/interview_dlf/1208260/
[58] http://business-panorama.de/news.php?newsid=63144
[59] http://www.be24.at/blog/entry/642428/staatsverschuldung-auch-deutschland-wackelt
[60] http://bazonline.ch/wirtschaft/konjunktur/Die-Europaeer-sind-die-duemmeren-Chinesen/story/26422179
[61] http://www.finanzen.net/nachricht/aktien/Soros-Deutsche-Politik-treibt-Eurozone-In-Deflation-Zeit-815629
[62] http://www.heise.de/tp/r4/artikel/32/32838/1.html
[63] http://www.heise.de/tp/r4/artikel/32/32841/1.html
[64] http://www.nrhz.de/flyer/beitrag.php?id=15294
[65] http://www.heise.de/tp/blogs/2/147879