Twitterer Greymon55 gibt mal wieder eine Wasserstandsmeldung zu den Spezifikationen von Navi 3X ab – wobei leider echte Informationen und Annahmen etwas vermischt sind. Zumindest gibt ein nachfolgender Tweet den Hinweis darauf, dass die hierbei getroffenen Angaben zum Infinity Cache sowie zum VRAM-Ausbau eigene Annahmen seitens des Twitterers darstellen. Dies läßt also noch etwas Spielraum – welcher insbesondere für Navi 33 als notwendig erscheint. Denn während Navi 31 & 32 zu den bereits seit einigen Monaten bekannten Hardware-Daten vermeldet werden, wird zu Navi 33 eine vergleichsweise schwache Hardware mit nur 4096 FP32-Einheiten an einem 128-Bit-Speicherinterface samt 64 MB Infinity Cache mit nur 8 GB Grafikkartenspeicher notiert.
Navi 31 | Navi 32 | Navi 33 | |
---|---|---|---|
MCM/monolithisch | MCM | MCM | monolithisch |
Angaben von Greymon55 | ~60WGP ~16GB 256bit GDDR6 ~256M 3D IFC ~2.5GHz |
~40WGP ~12GB 192bit GDDR6 ~192M 3D IFC ~2.6~2.8GHz |
~16WGP ~8GB 128bit GDDR6 ~64M IFC ~2.8~3.0GHz |
resultierende FP32-Power | 15'360 FP32-Einheiten 77 TFlops |
10'240 FP32-Einheiten 53-57 TFlops |
4'096 FP32-Einheiten 23-25 TFlops |
effektives Interface | ? | ? | FullHD: ~328 Bit WQHD: ~305 Bit 4K: ~215 Bit |
bisherige Perf-Prognose | 2,5-2,7fach von Navi 21 | ? | Navi 21 und etwas mehr |
Angaben zu noch nicht veröffentlicher Hardware basieren auf Gerüchten & Annahmen |
Und dies kann man durchaus diskutieren, denn Navi 33 soll laut übereinstimmenden Informationen die Performance-Klasse von Navi 21 erreichen – was mit diesen Hardware-Daten zumindest schwierig erscheint. Zwar kann die geringere Anzahl an FP32-Einheiten über den Mehrtakt gut ausgeglichen werden (FP32-Power der Radeon RX 6900 XT auf "Boost Clock" = 23 TFlops), doch bei der Speicherbandbreite hängt Navi 33 weit zurück, da Navi 33 in dieser Frage gegenüber Navi 21 sowohl bezüglich Interface-Breite als auch dem Infinity Cache glatt halbiert wurde. Bei der effektiven Bandbreite (auf angenommen gleicher Speichertaktung) liegt Navi 33 (FullHD ~328 Bit, WQHD ~305 Bit) somit weit unterhalb des Niveaus von Navi 22 (FullHD ~872 Bit, WQHD ~619 Bit), sprich selbst bei Konzentration auf kleinere Auflösungen wird dies ein schwieriges Unterfangen. Dennoch ist dies vielleicht nicht gänzlich unmöglich, immerhin sind die eigentlichen Architektur-Verbesserungen der RDNA3-Generation derzeit kaum bekannt.
Nur an der Grafikkartenspeicher-Menge muß AMD noch arbeiten, denn mit nur 8 GB VRAM erscheint eine neue Grafikkarte im Leistungspotential der Radeon RX 6900 XT für das Jahr 2023 als arg unpassend. Mag sein, dass die ursprüngliche Planung vielleicht derart aussah, aber wegen der jüngsten Entwicklungen beim VRAM-Bedarf – siehe den Fall von Halo Infinite – muß AMD an dieser Stelle aufstocken. Sofern man keine 1,5GByte-Speicherchips heranorganisieren kann, bliebe dann nur die glatte Verdopplung auf 16 GB Speicher – was dann allerdings auch Speicherverdopplungen bei Navi 32 & 31 nach sich ziehen würde. Zum Glück ist dieser Punkt der Speichermenge wie gesagt zum einen nicht feststehend und zudem generell auch kurzfristig noch änderbar. Insofern kann man durchaus darauf setzen, dass AMD im Sommer 2022 – wenn die reale Produktgestaltung zu Navi-33-Grafikkarten ansteht – die gleichen Gedankengänge hat und nachfolgend auf eine sinnvolle wie verkaufbare Speichermenge setzt.
Beim chinesischen Zhihu (maschinelle Übersetzung ins Deutsche) gibt es klarere Hardware-Daten zu den drei neuen Einsteiger-Mobilelösungen von nVidia samt auch ersten TimeSpy-Werten. Danach unterscheiden sich GeForce RTX 2050 Laptop und GeForce MX570 allein bei der Speichermenge, ansonsten gibt es dieselben 16 Ampere-basierten Shader-Cluster an einem 64bittigen Speicherinterface. Wegen der identischen Rohpower soll dann auch das TimeSpy-Ergebnis identisch ausfallen – was im realen Spieleeinsatz natürlich anders aussehen wird. Die GeForce MX550 verfügt hingegen über 16 Turing-basierte Shader-Clustern an einem 64bittigen Speicherinterface – womit sich gegenüber der MX570 der interessante Vergleich zwischen Turing und Ampere auf selber Anzahl an Shader-Clustern sowie selbem Speicherinterface ergibt.
Hardware | TGP-Spielraum | TimeSpy (GPU) | |
---|---|---|---|
GeForce RTX 2050 Laptop | Ampere GA107, 16 SM (2048 FP32) @ 64 Bit, 4 GB GDDR6 | 20-45W | 3369 @ 35W TGP |
GeForce MX570 | Ampere GA107, 16 SM (2048 FP32) @ 64 Bit, 2 GB GDDR6 | 20-45W | |
GeForce MX550 | Turing TU117, 16 SM (1024 FP32) @ 64 Bit, 2 GB GDDR6 | 20-45W | 2510 @ 35W TGP |
TimeSpy-Werte gemäß Zhihu |
Jenen Vergleich entscheidet die Ampere-Lösung mit +34% für sich – was eine weitere Bestätigung des Shader-Cluster-normierten Performance-Sprungs zwischen Turing und Ampere darstellt, frühere Vergleiche hatten bereits Werte zwischen 30-35% erbracht. Im Fall von GeForce MX550 zu MX570 wurde jener Vergleich zudem sogar auf derselben TGP von 35 Watt erbracht, sprich auch noch Stromverbrauchs-neutral. Wie üblich im Mobile-Feld, können diese Mobile-Lösungen jedoch mit sehr unterschiedlichen Verbrauchswerten antreten, von 20 Watt bis 45 Watt soll alles zulässig sein und liegt dann in der Entscheidung des Notebook-Herstellers. Da diese Mobile-Lösungen auf niedrigen Watt-Bereichen üblicherweise sehr gut skalieren, lassen sich somit mit derselben Mobile-Lösung deutlich voneinander abweichende Performance-Punkte besetzen. Bei sehr niedriger TGP kann dies auch in die Leistungsklasse von guter integrierter Grafik gehen: Eine Iris Xe mit 96 EU und viel Prozessoren-TDP kann immerhin schon 1700-2000 Punkte im TimeSpy erreichen.
WCCF Tech berichten über fernöstliche Benchmark-Werte unter CPU-Z und Cinebench zu Core i3-12100 & -12300, den kommenden Vierkern-Modellen von Alder Lake. Der zugrundliegende chinesischsprachige Test bei Bilibili (maschinelle Übersetzung ins Deutsche) zeigt noch mehr Benchmarks, jene allerdings vorwiegend aus dem Spiele-Bereich unter schwer zu wertenden Bedingungen. Bei den gut vergleichbaren theoretischen Testern zur Anwendungs-Performance ergeben sich für Alder Lake (wieder einmal) exzellente Singlethread-Werte zu durchaus ansprechenden Multithread-Werten. Allerdings reicht der Performance-Boost durch die Alder-Lake-Architektur nicht aus, um im Multithread-Bereich mit diesen Vierkernern die bisher aktuellen Sechskerner zu schlagen: Der Core i5-11400 wird zwar im Cinebench erreicht, unter CPU-Z liegt jener jedoch weiterhin vorn – genauso wie der Ryzen 5 5600X durchgehend vorn liegt.
Hardware | CPU-Z/ST | CPU-Z/MT | CB20/ST | CB20/MT | |
---|---|---|---|---|---|
Core i3-12300 | ADL, 4C+0c/8T, ?/4.4 GHz | 702,5 | 3482,4 | 665 | 3318 |
Core i3-12100 | ADL, 4C+0c/8T, 3.3/4.3 GHz | 687,5 | 3407,9 | 649 | 3248 |
Core i5-11400 | RKL, 6C/12T, 2.6/4.4 GHz | 566 | 4249 | 535 | 3227 |
Core i3-10100 | CML, 4C/8T, 3.6/4.3 GHz | 461 | 2414 | 400 | 1887 |
Ryzen 5 5600X | Zen 3, 6C/12T, 3.7/4.6 GHz | 624 | 4811 | 601 | 4390 |
Ryzen 3 3300X | Zen 2, 4C/8T, 3.8/4.3 GHz | 508 | 2788 | 493 | 2486 |
Quellen: Core i3-12100/12300 von WCCF Tech, Vergleichswerte von CPU-Z, Guru3D (CB20) & Hardwareluxx (CB20 Core i3-10100) |
Ältere Sechskerner dürften natürlich kein Problem für diese Alder-Lake-Vierkerner sein, aber dies ist keine Frage bzw. bei neueren Architekturen vergleichsweise normal. Als echter Ersatz für moderne Sechskerner scheinen sich diese Alder-Lake-Vierkerner allerdings nicht aufzudrängen – und so lange dies nicht passiert, sind heutzutage aus Langfristsicht doch lieber Sechskern-Prozessoren für ein Gaming- oder Allzweck-System vorzuziehen, verbleiben Vierkerner in der Ecke der reinen Office-Systeme. Dort dürfte Alder Lake sicherlich einigen Umsatz machen, denn AMD beackert diesen Bereich derzeit fast gar nicht – neuere Vierkerner sind nicht in Sicht, und das ältere Produkt-Programm von AMD ist entweder nicht mehr erhältlich oder kostet nahezu so viel wie ein Ryzen 5 5600X.