Neuigkeiten der letzten 7 Tage

16

Hardware- und Nachrichten-Links des 15./16. Mai 2021

Bei Linus Tech Tips hat man einen RayTracing-Blindtest durchgeführt – indem man schlicht ein paar Gamer ein paar Minuten lang vor Tomb Raider, Minecraft und Wolfenstein gesetzt hat, mit zwei identischen PCs, einmal mit RayTracing-Grafik und einmal mit normaler (maximierter) Rasterizer-Grafik. Augenscheinlich wurde dabei der Performance-Effekt bedacht, so dass man nicht anhand des Flüssigkeitsgefühls erkennen sollte, ob vielleicht die (leistungsfressendere) RayTracing-Grafik zum Einsatz kommt. Das Ergebnis des Blindtests ist dann, dass nur zu etwas oberhalb der Hälfte der Fälle die RayTracing-Grafik korrekt erkannt wurde. Selbiges Ergebnis ist mittelprächtig, denn normalerweise sollte die Erkennungsrate doch viel höher sein. Dies zeigt darauf hin, dass unter den gewählten Spieletiteln der RayTracing-Effekt in der allgemeinen Grafikpracht untergeht bzw. die RayTracing-Alternativlösung (sei es bei Beleuchtung, Schatten, Spiegelungen, sonstiges) zumindest ähnlich überzeugend rüberkommt.

14

Hardware- und Nachrichten-Links des 14. Mai 2021

Das Programm der am 22.-24. August laufenden Entwickler-Konferenz Hot Chips 33 enthält neben erwartbaren Punkten interessanterweise auch einen Vortrag zu einem "AMD Next Generation Zen 3 Core". Jener wird zudem eingerahmt von Vorträgen über Intels "Alder Lake", IBMs nächstem Prozessor sowie Intels "Sapphire Rapids" Server-Prozessoren – allesamt gewichtigen NextGen-Architekturen, was Zen 3 nun einmal nicht mehr ist. Das AMD die Redezeit für eine Wiederholung von bekanntem Wissen verwendet, ist arg unwahrscheinlich, ergo kann es sich nur um etwas neues handeln – sprich neue Prozessoren auf Zen-3-Basis, eventuell "Zen 3+" genannt. Ein Kandidat hierzu wäre "Rembrandt" – was aber als APU mit demzufolge begrenztem Performance-Spektrum wenig zur Riege der sonstigen CPU-Vorträge auf der Hot Chips passt. Dies steigert somit die Chancen darauf, an dieser Stelle etwas zu "Warhol" zu erfahren – und somit natürlich auch die Chance darauf, dass jener Prozessor tatsächlich realisiert wird.

AMD Intel nVidia
vermutlich Herbst/Ende 2021:
Zen 3+ (Ryzen 6000)
angeblich November 2021:
Alder Lake (Core i-12000)
angeblich Frühling/Sommer 2022:
RDNA3 (Radeon RX 7000)
vermutlich Sommer/Herbst 2022:
Raptor Lake (Core i-13000)
angeblich Herbst 2022:
Zen 4 (Ryzen 7000)
angeblich Herbst 2022 bis irgendwann 2023:
Lovelace (GeForce RTX 40)
vermutlich irgendwann 2023:
Meteor Lake (Core i-14000)
Anmerkung: basierend auf den letzten (unsicheren) Gerüchten, damit definitiv fehlbar
13

Hardware- und Nachrichten-Links des 13. Mai 2021

Mit den Nachrichten der letzten Tage hat sich dann auch das Bild zu den Spezifikationen aller RDNA2- und Ampere-Grafikchips bis hinunter zu Navi 24 sowie GA107 vervollständigt. Im Fall der RDNA2-Chips haben sich dabei diverse Linux/MacOS-Treiber als exzellente Quelle erwiesen, bei den Ampere-Chips geht letztlich alles zurück auf einen Leak seitens Kopite7kimi @ Twitter von immerhin schon dem Mai 2019. Die kompletten Hardware-Daten der Ampere-Generation wurden somit bereits vor zwei Jahren (vollkommen korrekt) vorhergesagt – ein gerade in der Gerüchteküche selten so anzutreffender Umstand. Beachtenswert daneben ist, dass von AMD seit längerer Zeit mal wieder eine vollständige Chip-Generation basierend auf derselben Architektur aufgelegt wird. In der Vergangenheit hatte AMD oftmals einen Mix aus verschiedenen Architektur-Stufen angesetzt, dabei waren zumeist nur die Chips an der Leistungsspitze technologisch wirklich neu.

AMD RDNA2 nVidia Ampere
  GA102
84 SM @ 384-bit, FHD Perf-Index 1900-2030%
Navi 21
80 CU @ 256-bit, 128 MB IF$, FHD Perf-Index 1650-1950%
GA104
48 SM @ 256-bit, FHD Perf-Index 1420-1590%
Navi 22
40 CU @ 192-bit, 96 MB IF$, FHD Perf-Index ~1300-1490%
 
Navi 23
32 CU @ 128-bit, 32 MB IF$, FHD Perf-Index ~900-1150%
GA106
30 SM @ 192-bit, FHD Perf-Index ~900-1110%
  GA107
20 SM @ 128-bit, FHD Perf-Index ~600-750%
Navi 24
16 CU @ 64-bit, 16 MB IF$, FHD Perf-Index ~400-600%
 
Anmerkung: Performance-Angaben für noch nicht veröffentlichte Grafikchips natürlich nur geschätzt
13

Externe Grafikkarten: Hoher Performancesprung zur iGPU, aber keineswegs so schnell wie im Desktop-PC

Es sind eine Reihe neuer Artikel seitens Igor's Lab, Notebookcheck, KitGuru und TechSpot zum Thema "eGPU" erschienen – sprich externen Grafikkarten, mittels welchen man sein Notebook bei der Grafikleistung entsprechend aufrüsten kann. Hierfür werden externe Grafikkarten-Gehäuse verwendet, in welche dann gewöhnliche Desktop-Grafikkarten eingebaut werden. Die Anbindung erfolgt üblicherweise per Thunderbolt, was derzeit unter vielen Notebooks gut verbreitet ist. Hierbei sollte man allerdings generell auf Thunderbolt 3 mit 40 Gbit/s nomineller Datenrate achten, da in der Praxis bei der Grafikkarte maximal 32 Gbit/s ankommen. Dies ergibt ein Bandbreiten-Niveau von PCI Express 3.0 mit 4 Lanes – darunter sollte man dann wirklich nicht gehen. Wegen der Signalumwandlung und der niedigeren PCI-Express-Bandbreite verliert man in jedem Fall Performance, nachfolgende TechSpot-Grafik zeigt dies ganz anschaulich für die Spieletitel "GTA V" sowie "Civilization VI" unter einer extern wie intern verwendeten GeForce RTX 3080:

12

Hardware- und Nachrichten-Links des 12. Mai 2021

Von Locuza @ Twitter kommt der Hinweis auf die Spezifikationen zu "Navi 24", welcher sich kürzlich in einem Linux-Treiber mit dem zusätzlichen Codenamen "Beige Goby" zeigte. Danach kommt Navi 24 am untersten Ende der zuletzt schon nach unten geschraubten Erwartungen heraus: Es gibt gerade einmal 16 Shader-Cluster (= 1024 FP32-Einheiten) an einem 64-Bit-Speicherinterface. Damit ist Navi 24 nominell deutlich kleiner als der Navi-14-Chip der Radeon RX 5500 Serie (24 CU @ 128-bit), selbst wenn Navi 24 dies teilweise über höhere Taktraten sowie die Hinzunahme eines Infinity Caches ausgleichen kann. Letztgenannter ist tatsächlich auch bei Navi 24 vorhanden, allerdings ist dessen Größe mit nur 16 MB ziemlich mickrig – der Zusammenhang mit dem jeweiligen Speicherinterface ergibt sich aus einem weiteren Tweet seitens Locuza.

RDNA1 RDNA2
HighEnd - Navi 21
80 CU @ 256-bit, 128MB IF$, 16 GB
Midrange Navi 10
40 CU @ 256-bit, 6-8 GB
Navi 22
40 CU @ 192-bit, 96MB IF$, 12 GB
Mainstream Navi 14
24 CU @ 128-bit, 3-8 GB
Navi 23
32 CU @ 128-bit, 32MB IF$, 8 GB
Entry - Navi 24
16 CU @ 64-bit, 16MB IF$, 4 GB
Anmerkung: Hardware-Daten zu noch nicht veröffentlichten Chips basieren weitgehend auf Gerüchten & Annahmen
12

nVidia stellt GeForce RTX 3050 & 3050 Ti Laptop vor, erste Performance-Abschätzung anhand unabhängiger Benchmarks

Zusammen mit Intels Tiger Lake-H45 hat nVidia auch zwei neue Mobile-Lösungen innerhalb der Ampere-Generation vorgestellt – GeForce RTX 3050 Laptop sowie GeForce RTX 3050 Ti Laptop. Beide neuen Mobile-Lösungen basieren auf dem GA107-Chip, welcher somit sein Debüt feiert – und augenscheinlich vorerst rein im Mobile-Segment verwendet wird. Die GeForce RTX 3050 Ti Laptop tritt dabei im Vollausbau jenes Grafikchips an, die GeForce RTX 3050 Ti Laptop geht dagegen mit nur 16 aktivierten von 20 physikalisch vorhandenen Shader-Clustern ins Rennen. Beiden GA107-Lösungen gemeinsam ist das nur 128 Bit breite Speicherinterface, an welches nVidia selbst im Mobile-Segment nur 4 GB GDDR6-Speicher klemmt. Das ganze hat also klares Einsteiger-Niveau, ist weder von der Grundperformance noch der Speichermenge her für höhere Spiel-Auflösungen als FullHD geeignet. Wie bei den bisherigen Ampere-Mobile-Lösungen üblich, ist zudem die real herauskommende Performance anhand der beim jeweiligen Notebook angesetzten TGP extrem wandelbar: nVidia nennt für beide neuen Mobile-Lösungen eine TGP-Spannbreite von 35-80 Watt.

Hardware MaxQ Standard 4K Perf-Index
GeForce RTX 3080 Laptop GA104, 48 SM @ 256 Bit, 8/16 GB GDDR6 80-145W Basis-TGP,
plus dynamisch 0-20W, 12 Gbps
115-150W Basis-TGP,
plus dynamisch 0-15W, 14 Gbps
~160-220%
GeForce RTX 3070 Laptop GA104, 40 SM @ 256 Bit, 8 GB GDDR6 80-120W Basis-TGP,
plus dynamisch 0-20W, 12 Gbps
115-125W Basis-TGP,
plus dynamisch 0-15W, 14 Gbps
~145-190%
GeForce RTX 3060 Laptop GA106, 30 SM @ 192 Bit, 6 GB GDDR6 60-110W Basis-TGP,
plus dynamisch 0-20W, 12 Gbps
80-115W Basis-TGP,
plus dynamisch 0-15W, 14 Gbps
~105-150%
GeForce RTX 3050 Ti Laptop GA107, 20 SM @ 128 Bit, 4 GB GDDR6 35-50W Basis-TGP,
plus dynamisch 0-20W, 12 Gbps
?-80W Basis-TGP,
plus dynamisch 0-15W, 12 Gbps
geschätzt
~60-110%
GeForce RTX 3050 Laptop GA107, 16 SM @ 128 Bit, 4 GB GDDR6 35-50W Basis-TGP,
plus dynamisch 0-20W, 12 Gbps
?-80W Basis-TGP,
plus dynamisch 0-15W, 12 Gbps
geschätzt
~50-90%
Performance-Angaben gemäß dem 3DCenter 4K Performance-Index, bezogen auf die Spanne von niedrigster zu höchster TGP
11

Hardware- und Nachrichten-Links des 11. Mai 2021

Twitterer 'Kopite7kimi' hat in zwei Tweets – No.1 & No.2 – allen mitlesenden Rätselfreunden eine kleine Aufgabe gestellt, deren Entschlüsselung üblicherweise den Hinweis auf die Hardware-Daten eines NextGen-Chips von nVidia geben sollte. Beim letzten Mal war dies deutlich einfacher gehalten, nunmehr kommt jedoch eine zusätzliche Schwierigkeitsstufe hinzu, welche durch eine neue (interne) Hardware-Unterteilung namens "CPC" erzeugt wird. Eine spekulative Erklärung hierzu kommt aus unserem Forum, so oder so läuft die insgesamte Rechnung auf 2x 144 Shader-Cluster hinaus. Jene 144 Shader-Cluster (pro Einzelchip) wären genauso viel wie beim kolportierten AD102-Chip für den Gaming-Bereich, jener soll jedoch mit 12 Raster-Engines einen anderen Grundaufbau haben – während hier erneut die 8 Raster-Engines des aktuellen HPC-Chips GA100 bemüht werden.

2*(8*3*3*2?)
 
Maybe the right order is GPC-CPC-TPC-SM.

Quelle:  Kopite7kimi mit Tweet No.1 & Tweet No.2 am 11. Mai 2021

10

Hardware- und Nachrichten-Links des 10. Mai 2021

VideoCardz berichten über erste neue Grafikkarten-Varianten mit nVidias Cryptomining-Bremse. Wie bekannt, soll noch im Laufe des Monats Mai das komplette Ampere-Portfolio auf Kartenausführungen mit Miningbremse umgestellt werden, wobei nur die (erst Anfang Juni antretenden) GeForce RTX 3070 Ti & 3080 Ti wirklich neue Karten darstellen werden. Bei GeForce RTX 3060 Ti, 3070 und 3080 wird nVidia zwar neue Grafikchip-Versionen ausliefern, deren technischen Daten bleiben hingegen gleich, es kommt nur die Miningbremse (sowie der rBAR-Suport ab Werk) mit hinzu. Hiermit verändert sich also nur der Chip-Unterbau, nicht hingegen die eigentlichen Grafikkarten. Die Grafikkarten-Hersteller sind allerdings dazu verpflichtet, dem Grafikkarten-Käufer diesen neuen technischen Unterbau kundzutun – was dann automatisch zumindest neue Produktnummern ergibt, wenngleich sicherlich in den meisten Fällen nur mit einem Namenszusatz gelöst.

bisher zukünftig Veränderung ETH mit/ohne Bremse
GeForce RTX 3090 GA102-300 GA102-302 rBAR und Cryptomining-Bremse (?) 121 MH/s  →  ca. 63 MH/s
GeForce RTX 3080 Ti - GA102-225 alle Retailkarten haben rBAR + Cryptomining-Bremse 119 MH/s  →  ca. 62 MH/s
GeForce RTX 3080 GA102-200 GA102-202 rBAR und Cryptomining-Bremse 98 MH/s  →  ca. 51 MH/s
GeForce RTX 3070 Ti - GA104-400 alle Retailkarten haben rBAR + Cryptomining-Bremse unbekannt
GeForce RTX 3070 GA104-300 GA104-302 rBAR und Cryptomining-Bremse 62 MH/s  →  ca. 32 MH/s
GeForce RTX 3060 Ti GA104-200 GA104-202 rBAR und Cryptomining-Bremse 60 MH/s  →  ca. 31 MH/s
GeForce RTX 3060 GA106-300 GA106-302 Cryptomining-Bremse aktualisiert/ausgebessert 48 MH/s  →  25 MH/s
Angaben zur aktuellen Mining-Performance von Minerstat (ETH-optimiert), Angaben zur Mining-Performance nach Miningbremse stellen reine Hochrechnungen dar!
Inhalt abgleichen