16

Erste wahrscheinlich authentische Spezifikationen zur GeForce 20 Serie sehen unveränderte Speichermengen

Ausgehend vom chinesischen Baidu-Forum (via Videocardz) macht derzeit eine Spezifikations-Tabelle zu den Gaming-Lösungen der kommenden Turing-Generation die Runde, welche wahrscheinlich authentisch ist und wohl von einem der Grafikkarten-Hersteller stammt. Alternativ verbreitete Karten-Spezifikationen, welche auf den Einträgen in der TechPowerUp-Datenbank basieren, sind dagegen unserer Meinung nach nicht ernst zu nehmen, da vor Release üblicherweise mit Platzhalter-Daten bzw. bestenfalls reinen Annahmen erstellt, nicht jedoch auf Basis von irgendwie bekanntem Wissen. Bei Baidu gibt es hingegen noch keine kompletten Hardware-Spezifikationen, dagegen sind dort andere wichtige Daten abzulesen. Die Grundlage stellt zwar "nur" die Fotographie einer Excel-Auflistung dar, aber jene listet an anderer Stelle genannte Device-Nummern, die korrekte Art an Monitor-Anschlüssen, die korrekte nVidia-Bezeichnung für Stromverbrauchswerte (TGP anstatt TDP) und letztlich "NVLink" als die bei der Turing-Generation eingesetzte Verbindungs-Technologie auf, scheint damit also ziemlich wahrscheinlich "echt" zu sein.

15

Hardware- und Nachrichten-Links des 15. August 2018

Da die Frage aufkam, woher die Angabe von "ein Drittel der Chipfläche für RayTracing-Funktionalität" bei den beiden Turing-Chips GV102 & GV106 herkommt, sei hiermit folgende Modellrechnung kredenzt: Sehr gut vergleichen lassen sich hierzu GP102 (Pascal, 471mm², 16nm) und GV102 (Turing, 754mm², 12nm), da zu diesen in der selben Enthusiasten-Klasse liegenden Grafikchips alle benötigten Daten vorliegen. nVidia hat Gaming-seitig dem GV102 schlicht 20% mehr Shader-Einheiten sowie ein GDDR6- anstatt eines GDDR5X-Speicherinterfaces gegenüber dem GP102 spendiert. Wollte man einen hypothetischen "GP101"-Chip auflegen, der wie der GV102-Chip dann 4608 anstatt 3840 Shader-Einheiten sowie ein GDDR6- anstatt eines GDDR5X-Speicherinterface trägt, aber eben ohne RayTracing-Funktionalität daherkommt, passiert folgendes: Rein die Shader-Einheiten machen üblicherweise ca. nur die Hälfte des Grafikchip-Dies aus, dies wäre also eine Chipflächen-Steigerung von nur +10%. Der Maximalfall liegt dagegen logischerweise bei +20%, das andere Speicherinterface und diverse Architektur-Verbesserungen eingerechnet. Der Realwert dürfte dann ziemlich in der Mitte dessen liegen, ergo bei +15% Chipflächen-Steigerung. Die Differenz zwischen 16nm- und 12nm-Fertigung spielt bei diesen Grafikchips augenscheinlich keine beachtbare Rolle, da die Menge an Transistoren pro mm² zwischen GP102 und GV102 ungefähr gleich ausfällt (ca. 25 Mill. Tr./mm²) – würde aber in jedem Fall sowieso nur eine noch etwas kleinere Chipfläche beim GV102-Chip ergeben.

Hardware-Einheiten Chipfläche Fertigung Packdichte
Pascal GP102 3840 SE @ 256 Bit GDDR5X 471mm² 16nm 25,1 Mio Tr./mm²
(hypothetischer) "GP101" 4608 SE @ 256 Bit GDDR6 ~542mm² rein hypothetisches Modell
Turing GV102 4608 SE @ 256 Bit GDDR6 + Tensor + RT 754mm² 12nm 24,7 Mio Tr./mm²
15

Umfrage-Auswertung: Wieviel Mehrperformance muß nVidias Turing-Generation mindestens mitbringen?

Bei einer Umfrage vom Monatsanfang ging es darum, herauszufinden, mit wieviel Mehrperformance samt eventuellem Mehrspeicher nVidia bei der sich nun inzwischen entblätternden Turing-Generation mindestens ankommen muß, um für die Grafikkarten-Käufer ausreichend interessant zu sein. Teilweise gibt es nunmehr inzwischen eine gewisse Vorstellung zu diesen Fragen, aber zum Umfrage-Zeitpunkt war dies noch komplett offen, konnte frei von der Leber weg abgestimmt werden. Dabei bekam jede der Antwortoptionen ihre Stimmen – aber sicherlich die Antwortoption mit einer nur 25%igen Mehrperformance den geringsten Stimmenanteil mit nur 15,3%, während die Antwortoption einer 40%igen Mehrperformance mit 54,4% Stimmenanteil die absolute Mehrheit holte und selbst die Antwortoption einer 60%igen Mehrperformance mit einem Stimmenanteil von 30,3% noch bedeutsam groß ausfiel.

14

Hardware- und Nachrichten-Links des 13./14. August 2018

Passend zu nVidias Turing-Vorstellung hat Speicherchip-Hersteller Samsung die Verfügbarkeit der ersten GDDR6-Speicherchips mit 2 GByte pro Chip (aka 16 Gbit pro Chip) bekanntgegeben. Anders sind die 48 GByte Speicher einer Quadro RTX 8000 auch nicht realisierbar – wollte man hierfür 1-GByte-Speicherchips ansetzen, bräuchte man ganze 48 Stück davon, was die Platine zu sehr überfrachten würde. Selbst die nun mit den 2-GByte-Speicherchips benötigten 24 Plätze für Speicherchips sind relativ viel, für die Zukunft mit noch größeren Speichermengen wird man sicherlich schon in Richtung von 4-GByte-Speicherchips denken müssen. In jedem Fall ermöglichen diese verfügbaren 2-GByte-Speicherchips nVidia nunmehr die Option, auch auf Gaming-Grafikkarten die doppelte Speichermenge ins Feld zu führen: Wenn beispielsweise eine GeForce RTX 2080 mit regulär 8 GByte Speicher und demzufolge 8 Speicherplätzen geplant ist, dann kann man durch einfach Umbestückung auf 2-GByte-Speicherchips anstatt der gewöhnlichen 1-GByte-Speicherchips ganz schnell eine (hypothetische!) "GeForce RTX 2085" mit 16 GByte Speicher herausbringen – ohne dafür eine neue Platine auflegen zu müssen. nVidia erreicht hiermit also eine ganz gute Flexibilität bei der Speicherbestückung – ob man jene im Rahmen der kommenden Gaming-Lösungen dann auch ausnutzt, steht allerdings noch auf einem ganz anderen Blatt.

GDDR5 GDDR5X GDDR6
verfügbare Taktraten bis 9 Gbps bis 12 Gbps bis 14 Gbps
Speicherbandbreite (256-Bit-SI) max. 288 GB/sec max. 384 GB/sec max. 448 GB/sec
Speicherbandbreite (384-Bit-SI) max. 432 GB/sec max. 576 GB/sec max. 672 GB/sec
Speicherchip-Größen 4 & 8 Gbit 8 Gbit 8 & 16 Gbit
14

nVidia teasert die Turing-basierte "GeForce RTX 2080" für eine Vorstellung zur Gamescom an

Mittels eines Videos hinterläßt nVidia reihenweise Anspielungen auf die kommenden Turing-basierten Gaming-Lösungen. Videocardz haben alle zu sehenden Teaser zusammengetragen, wonach sich klar der Verkaufsname der nächsten Gaming-Grafikkarte als "GeForce RTX 2080" ergibt – und zudem ein Datum wie eine Location, welches auf die Gamescom in Köln am 20. August 2018 hinausläuft. Zu diesem Zeitpunkt dürfte nVidia die Turing-basierten Gaming-Lösungen also vorstellen oder wenigstens offiziell ankündigen, ab 18 Uhr an diesem Tag wird nVidia den Livestream zu einer "GeForce Gaming Celebration" senden. Ob es zu diesem Zeitpunkt bereits Launchreviews und nachfolgend eine Marktverfügbarkeit gibt, bleibt noch abzuwarten, ist aber nicht unbedingt wahrscheinlich – üblicherweise teilt man dies heutzutage etwas auf, auf eine Ankündigung folgt wenig später der echte Launch, und auch der eigentliche Markteintritt könnte dann noch um ein paar Tage zeitversetzt erfolgen. Das ganze dürfte somit eine Angelegenheit von Ende August bis Anfang September werden.

Chip Hardware 4K Perf. Release
Titan XT Turing GV102 vermtl. 4608 Shader-Einheiten @ 384 Bit Interface geschätzt ~230-260% Herbst 2018
GeForce RTX 2080 Ti Turing GV102 vermtl. 4352-4480 Shader-Einheiten @ 352-384 Bit Interface geschätzt ~210-240% Herbst 2018 (?)
GeForce RTX 2080 Turing GV104 vermtl. 3072 Shader-Einheiten @ 256 Bit Interface geschätzt ~160-180% August/Sept. 2018
GeForce RTX 2070 Turing GV104 vermtl. 2432-2560 Shader-Einheiten @ 256 Bit Interface geschätzt ~130-150% Herbst 2018
Die Angaben dieser Tabelle stellen primär ungesicherte Annahmen dar, Performance-Werte gemäß des 4K Performance-Index.
14

nVidia stellt mit Quadro RTX 5000, 6000 & 8000 die ersten Teile der Turing-Generation vor

Der nVidia-Event auf der Siggraph 2018 letzte Nacht (Replay) brachte die Vorstellung neuer Quadro-Karten mit sich – welche ganz offiziell auf der Turing-Architektur basieren und damit deren Startschuß geben. Konkret wurden Quadro RTX 5000, 6000 & 8000 mit einige technischen Daten für eine Auslieferung in diesem Herbst vorgestellt, woraus sich auch schon gute Rückschlüsse auf die zugrundeliegenden Grafikchips und sowie die späteren darauf basierenden Gaming-Lösungen ziehen lassen. Zwar nannte nVidia keine Grafikchip-Codenamen, aber in jedem Fall basieren Quadro RTX 6000 & 8000 auf dem größeren Turing-Chip, welcher immerhin 18,6 Mrd. Transistoren in einer Chipfläche von satten 754mm² unterbringt – während die Quadro RTX 5000 auf dem kleineren Turing-Chip basiert, zu welchem noch keine derartig detaillierten Informationen vorliegen. Da aber die Speicherinterfaces der beiden Turing-Chips mit 384 bzw. 256 Bit GDDR6 bekannt sind, dürfte klar sein, das sich hierunter jenes verbirgt, was man bisher als GV102/GT102 bzw. GV104/GT104 bezeichnet hatte.

GV104 GV102 GV100
Chip geschätzt ~11,5 Mrd. Transistoren auf ~500mm² Chipfläche in der 12nm-Fertigung von TSMC 18,6 Mrd. Transistoren auf 754mm² Chipfläche in der 12nm-Fertigung von TSMC 21,1 Mrd. Transistoren auf 815mm² Chipfläche in der 12nm-Fertigung von TSMC
Raster-Engines whrschl. 4 whrschl. 6 6
Shader-Einheiten 3072 Shader-Einheiten 4608 Shader-Einheiten 5376 Shader-Einheiten
FP32-Rechenleistung geschätzt ~11 TFlops 16 TFlops 14,8 TFlops
TMUs whrschl. 192 whrschl. 288 336
ROPs whrschl. 64 whrschl. 96 128
Tensor-Cores 384 576 640
RT-Core 6 GigaRays/sec 10 GigaRays/sec -
Speicherinterface 256 Bit GDDR6 384 Bit GDDR6 4096 Bit HBM2
Speicherausbau 8/16/32 GB GDDR6 12/24/48 GB GDDR6 16/32 GB HBM2
Grafikkarten Quadro RTX 5000 Quadro RTX 6000 & 8000 Titan XV, Quadro GV100 & Tesla V100
Release Herbst 2018 Herbst 2018 Q3/2017
Pascal-Vorgänger GP104: 2560 Shader-Einheiten @ 256 Bit GDDR5X, 8.9 TFlops GP102: 3840 Shader-Einheiten @ 384 Bit GDDR5X, 12.1 TFlops GP100: 3840 Shader-Einheiten @ 4096 Bit HBM2, 10.9 TFlops
13

Launch von Threadripper 2000: Erste Testberichte gehen online

Nach Ryzen 2000 geht heute die HEDT-Schiene "Threadripper 2000" mit den beiden Prozessoren-Modellen "Ryzen Threadripper 2990WX" sowie "Ryzen Threadripper 2950X" an den Start. Der Ryzen Threadripper 2990WX bildet dabei AMDs neue HEDT-Speerspitze – und mit seinen 32 CPU-Kernen auch das dickste Stück Hardware, was jemals im Consumer-Segment angeboten wurde, kostet dafür aber auch erstmals bei AMD gleich vierstellig. Der Ryzen Threadripper 2950X ist hingegen der 16-Kern-Ersatz des bisherigen Threadripper-Spitzenmodells 1950X und geht mit seinem Preispunkt unterhalb des vierstelligen Bereichs noch eher dort hin, wo wenigstens eine gewisse Anzahl CPU-Käufer wartet, ist also das eher interessante CPU-Modell. Gegenüber der ersten Threadripper-Generation gibt es die bekannten kleineren Verbesserungen von Zen+, etwas mehr Taktrate und vor allem die Features "Precision Boost 2" und "XFR2" oben drauf, grob kann man dabei mit einer 10%igen Mehrperformance auf gleicher Kern-Basis rechnen.

Der Ryzen Threadripper 2990WX ist mit seinen gleich 32 CPU-Kernen natürlich ein gewisser Sonderfall, weil viel breiter als frühere Threadripper-Prozessoren – was dann eine sehr gute Mehrkern-Ausnutzung durch die angesetzte Desktop-Software bedingt. Hierbei wird es interessant werden zu sehen, inwiefern dies derzeit schon der Fall ist bzw. ob der Ryzen Threadripper 2990WX die rohe Kraft seiner 32 CPU-Kerne wirklich auf die Straße bringen kann. Der 16-Kerner Ryzen Threadripper 2950X soll hingegen regulär erst am 31. August in den Handel gehen, wurde aber von AMD schon vorzeitig an die Hardwaretester herausgegeben, was diesen Launch etwas weg von einer primären Theorie-Veranstaltung bringt. Wieviel Performance mit dem 32-Kerner Ryzen Threadripper 2990WX sowie dem 16-Kerner Ryzen Threadripper 2950X erreichbar ist, versuchen die verschiedenen Launchreviews derzeit zu ermitteln, während unsere übliche Launch-Analyse in Vorbeitung ist und später diesen Prozessoren-Launch abschließen wird.

12

Hardware- und Nachrichten-Links des 11./12. August 2018

Aus Fernost stammende Intel-Unterlagen belegen, das die vor gut drei Wochen gemeldeten Turbo-Taktraten zu Core i7-9700K & Core i9-9900K korrekt waren. Sofern Intel hieran in letzter Minute nichts mehr ändert, gehen beide Prozessoren mit einem Vorsprung von 200-400 MHz vor dem Core i7-8700K ins Rennen – was bedeutsam besser ist als beim Core i7-8086K, welcher bei den ganzen mittleren Turbo-Taktraten gar keinen Vorteil gegenüber dem Core i7-8700K hat und demzufolge auch nur eine (sehr) unterdurchschnittliche Mehrperformance auf die Waage bringt. Den Spitzenmodellen der 9. Core-Generation wird dieser Fauxpas nicht passieren – hier wurden alle Taktraten durch die Bank weg angehoben, und die Verlötung zwischen Prozessoren-Die und Heatspreader dürfte die CPU-Temperaturen so weit im Zaum halten, auf das man jene höheren Taktraten dann auch real ausnutzen kann. Mit einem AllCore-Turbo von 4.7 GHz wird der Core i9-9900K natürlich wiederum die Performance-Führerschaft unter den regulären Consumer-Modellen übernehmen – welcher Preis hierzu veranschlagt wird, ist allerdings noch offen.

Basetakt Turbo 7C-8C Turbo 5C-6C Turbo 3C-4C Turbo 2C Turbo 1C
Core i9-9900K 3.6 GHz 4.7 GHz 4.7 GHz 4.8 GHz 5.0 GHz 5.0 GHz
Core i7-9700K 3.6 GHz 4.6 GHz 4.6 GHz 4.7 GHz 4.8 GHz 4.9 GHz
Core i5-9600K 3.7 GHz - 4.3 GHz 4.4 GHz 4.5 GHz 4.6 GHz
Core i7-8086K 4.0 GHz - 4.3 GHz 4.4 GHz 4.6 GHz 5.0 GHz
Core i7-8700K 3.7 GHz - 4.3 GHz 4.4 GHz 4.6 GHz 4.7 GHz
Die Angaben dieser Tabelle sind durch belastbare Gerüchte ganz gut abgedeckt, müssen aber dennoch nicht den finalen Daten entsprechen.
12 12

Wie häufig wird Downsampling Anti-Aliasing derzeit noch genutzt?

Nachdem die verschiedenen Möglichkeiten von Downsampling Anti-Aliasing (DSAA) in den Jahren 2014-2016 ein beachtbar großes Thema waren, haben sich neue Wortmeldungen hierzu in letzter Zeit ziemlich rar gemacht – gibt es auch kaum noch Hardware-Tests, welche diese Thematik erneut beleuchten. Entweder sind hierfür die erzielten Frameraten (ohne Downsampling) nicht mehr ausreichend, oder aber ist die Mehrheit der interessierten Nutzer längst auf UltraHD-Monitore gewechselt, für deren Auflösung zumeist noch zu wenig Rohleistung existiert, um Downsampling Anti-Aliasing wirklich in Betracht zu ziehen. Diese Umfrage soll damit der Frage nachgehen, wie verbreitet Downsampling Anti-Aliasing noch ist bzw. warum das Interesse an Downsampling Anti-Aliasing (DSAA) derzeit nicht mehr so hoch ist wie einstmals noch.

10

Hardware- und Nachrichten-Links des 10. August 2018

Videocardz vermelden die Registrierung verschiedener interessanter Markennamen durch nVidia: Beim U.S. Patent and Trademark Office wurden hierbei "Turing", "Quadro RTX" und "GeForce RTX" angemeldet. Letzteres deutet auf nVidias eigene RayTracing-Technologie hin, welche zukünftig Teil von DirectX 12 werden soll. Unklar ist noch, ob mit den beiden Markennamen "nur" nVidias eigene RayTracing-Technologie "nVidia RTX" gemeint ist – oder aber hiermit die Verkaufsnamen zukünftiger nVidia-Beschleuniger gemeint sind, nVidia also regelrecht von "GeForce GTX" auf "GeForce RTX" wechseln würde – so, wie es AdoredTV behaupten. In jedem Fall dürfte der Einstieg in RayTracing ein größeres Marketing-Thema bei den kommenden nVidia-Grafikkarten sein, selbst wenn der Weg zu echtem RayTracing ohne Rasterizer-Hilfe noch lang und steinig wird. Die Vorstellung von DirectX 12 RayTracing sowie nVidias Adaptive Temporal Antialiasing (unter RayTracing-Einsatz) sind sicherlich nicht umsonst im Vorfeld der kommenden nächsten Grafikkarten-Serie von nVidia an die Öffentlichkeit gelangt, sondern sollen vielmenhr den Boden für diese neue Rendering-Technologie ebnen.

Inhalt abgleichen