Launch-Analyse GeForce RTX 4060 Ti & Radeon RX 7600

Montag, 29. Mai 2023
 / von Leonidas
 

Mittels Radeon RX 7600 und GeForce RTX 4060 Ti dehnen AMD & nVidia die aktuelle Ada/RDNA3-Generation erstmals auf das Mainstream-Segment aus. Die jeweiligen Ansätze sind hierbei grundverschieden: Die GeForce RTX 4060 Ti will fast ins Midrange-Segment hineingehen, ist zumindest die klar schnellste Mainstream-Lösung mit dementsprechend hohen Preispunkt. Die Radeon RX 7600 stellt eher den absoluten Gegenentwurf dar, hierbei ging es zuerst um einen günstigstmöglichen Preispunkt, welcher dann auch deutlich niedriger als bei der nVidia-Karte ausfällt. Trotzdem werden nachfolgend beide Grafikkarten zusammen betrachtet: Zum einen kamen jene nur einen Tag voneinander getrennt heraus, herrscht somit zwischen den entsprechenden Testberichten durchgehend Benchmark-Kontinuität. Zum anderen sind es eben beiderseits "nur" 8-GB-Grafikkarten, und demzufolge (heutzutage) in ihren Wirkmöglichkeiten beschränkt. Was beide neuen Mainstream-Grafikkarten eint wie trennt und wie sich jene im großen Performance-Bild einordnen lassen, soll die nachfolgende Launch-Analyse beleuchten.

Mittels der GeForce RTX 4060 Ti bringt nVidia erstmals den "AD106"-Chip ins Desktop-Segment, nachdem jener bereits zur CES für das Mobile-Segment vorgestellt wurde. In früheren Grafikkarten-Portfolios wurde jener Grafikchip nie für etwas höheres als eine "xx60" Lösung verwendet, auch nicht für eine "xx60 Ti". Dies ist innerhalb der Ada-Lovelace-Generation anders – die Grafikchips rücken zumeist um eine Stufe nach unten, die Grafikkarten-Namen in jedem Fall um mindestens eine Stufe nach oben. Damit gibt es letztlich auch eine vergleichsweise kleine Hardware für die neue GeForce RTX 4060 Ti: Nur 34 Shader-Cluster an einem 128-Bit-Speicherinterface – was gegenüber den 38 Shader-Clustern an einem 256-Bit-Speicherinterface der vorhergehenden GeForce RTX 3060 Ti nicht besonders prall aussieht. Dass beide genannten Grafikkarten auch noch zum exakt selben US-Listenpreis von 399 Dollar antreten, kommt hier verschärfend hinzu.

Natürlich hat die neue GeForce RTX 4060 Ti ihre Vorteile: Der (viel) größere Level2-Cache, welcher nun auch bei nVidia die Rolle von AMDs "Infinity Cache" übernimmt, soll den Bandbreiten-Nachteil abmindern. Und die bekannt deutlich höheren Ada-Lovelace-Taktraten reichen trotz des kleinen Hardware-Rückstands letztlich zu einem gewissem Fortschritt (von +9%) an nomineller FP32-Rechenleistung. Kleinere Architekturverbesserungen kommen hier noch oben drauf und somit ist die GeForce RTX 4060 Ti keineswegs langsamer als die GeForce RTX 3060 Ti. Nur sind aufgrund der Hardware-Ansetzung eben auch keine größeren Performance-Sprünge zu erwarten. Zugleich führt diese Hardware-Ansetzung, welche nVidia sicherlich schon vor gut zwei Jahren derart konzipiert hat, in eine VRAM-Problematik: An das kleine 128-Bit-Interface passen halt nur 8 oder 16 GB Grafikkartenspeicher – zumindest so lange 3-Gbyte-Speicherchips reine Spezifikations-Theorie sind und somit die sinnvolle Zwischengröße "12 GB" verhindern.

GeForce RTX 3060 Ti GeForce RTX 3070 GeForce RTX 4060 Ti 8GB GeForce RTX 4060 Ti 16GB
Chipbasis nVidia GA104-200 nVidia GA104-300 nVidia AD106-350 nVidia AD106-351
Fertigung 17,4 Mrd. Transistoren auf 392mm² in der 8nm-Fertigung von Samsung 22,9 Mrd. Transistoren auf 188mm² in der 5nm-Fertigung von TSMC
Architektur nVidia Ampere, DirectX 12 Feature-Level 12_2 nVidia Ada Lovelace, DirectX 12 Feature-Level 12_2
Features DirectX 12, OpenGL, Vulkan, RayTracing, DSR, DLDSR, DLSS 2, PhysX, G-Sync, FreeSync, rBAR DirectX 12, OpenGL, Vulkan, RayTracing, DSR, DLDSR, DLSS 2/3, PhysX, G-Sync, FreeSync, rBAR
Technik 5 Raster-Engines, 38 Shader-Cluster, 4864 FP32-Einheiten, 152 TMUs, 38 RT-Cores v2, 152 Tensor-Cores v3, 80 ROPs, 4 MB Level2-Cache, 256 Bit GDDR6-Interface (Salvage) 6 Raster-Engines, 46 Shader-Cluster, 5888 FP32-Einheiten, 184 TMUs, 46 RT-Cores v2, 184 Tensor-Cores v3, 96 ROPs, 4 MB Level2-Cache, 256 Bit GDDR6-Interface (Salvage) 3 Raster-Engines, 34 Shader-Cluster, 4352 FP32-Einheiten, 136 TMUs, 34 RT-Cores v3, 136 Tensor-Cores v4, 48 ROPs, 32 MB Level2-Cache, 128 Bit GDDR6-Interface (Salvage)
Taktraten 1410/1665 MHz & 14 Gbps 1500/1725 MHz & 14 Gbps 2310/2535 MHz & 18 Gbps
Rohleistungen 16,2 TFlops & 448 GB/sec 20,3 TFlops & 448 GB/sec 22,1 TFlops & 288 GB/sec
Speicherausbau 8 GB GDDR6 8 GB GDDR6 8 GB GDDR6 16 GB GDDR6
Anbindung PCI Express 4.0 x16 PCI Express 4.0 x16 PCI Express 4.0 x8
Ref./Herst./OC / / / / / / / /
Layout Dual/TripleSlot Dual/Triple/QuadSlot Dual/TripleSlot ?
Kartenlänge FE: 24,5cm
AIBs: 17,2-32,3cm
FE: 24,5cm
AIBs: 21,6-33,7cm
FE: 24,5cm
AIBs: 17,0-33,8cm
?
Stromstecker FE: 1x 12pol.
AIBs: 2x 8pol.
FE: 1x 12pol.
AIBs: 2x 8pol.
FE: 1x 16pol.
AIBs: 1x 8pol.
?
off. Verbrauch 200W 220W 160W 165W
realer Verbr. 202W 220W 151W ?
Ausgänge HDMI 2.1, 3x DisplayPort 1.4a HDMI 2.1, 3x DisplayPort 1.4a HDMI 2.1a, 3x DisplayPort 1.4a ?
Listenpreis $399 / 439€ $499 / 549€ $399 / 439€ $499 / 549€
Release 2. Dezember 2020 29. Oktober 2020 24. Mai 2023 Ende Juli 2023

nVidia hatte die GeForce RTX 4060 Ti augenscheinlich lange Zeit mit allein einer Speicherbestückung von 8 GB VRAM geplant. Inzwischen soll nun auch noch eine 16-GB-Ausführung im Juli nachfolgen, welche genauso augenscheinlich sehr kurzfristig aus der Taufe gehoben wurde. Damit erfüllt nVidia sicherlich aktuelle Anforderungen nach mehr als nur 8 GB VRAM, dies ist dann allerdings auch mit einem nochmals höherem Preispunkt verbunden (499 Dollar Listenpreis, +100$). Damit läßt sich jetzt schon sagen, dass die GeForce RTX 4060 Ti 16GB kaum ein vernünftiges Performance/Preis-Verhältnis erlangen kann, denn der Mehrspeicher führt (derzeit) nicht direkt zu Mehrperformance, zudem kommt jene 16-GB-Ausführung damit viel zu nahe an den Preispunkt der GeForce RTX 4070 ($599) heran. Man kann nur hoffen, dass die Grafikkarten-Hersteller im Juli die nVidia-Preisvorgabe unterbieten und die GeForce RTX 4060 Ti 16GB mit maßvollem Mehrpreis zur regulären 8-GB-Ausführung anbieten werden.

AMDs Radeon RX 7600 basiert mit "Navi 33" ebenfalls auf einem (im Desktop) neuen Grafikchip, welcher genauso bereits zur CES für das Mobile-Segment vorgestellt wurde. Navi 33 ist abweichend von Navi 31/32 weder im Chiplet-Design aufgesetzt noch aus der 5nm-Fertigung kommend, sondern weiterhin monolithisch und hergestellt im 6nm-Verfahren. Bei den wichtigen Grundeinheiten handelt es sich um eine 1:1-Kopie von Navi 23 und somit der Grundlage der Radeon RX 6600 Serie: Es gibt dieselben 32 Shader-Cluster an einem 128-Bit-Interface mit 32 MB Infinity Cache. Die Differenzen liegen somit allein im Wechsel der Grafikchip-Architektur von RDNA2 zu RDNA3 sowie im Wechsel der Fertigungstechnologie von TSMC N7 auf N6 (ein Derivat der 7nm-Fertigung). Beides sind keine wirklich großen Sprünge, nachdem sich die FP32-Verdopplung der RDNA3-Architektur als noch weniger wirkmächtig erwiesen hat als seinerzeit nVidias FP32-Verdopplung der Ampere-Architektur.

Offenbar sich diesem Umstand bewußt, hat AMD den Navi-33-Vollausbau dann jedoch nicht "Radeon RX 7600 XT" genannt, sondern nur "Radeon RX 7600". Ob dies noch einmal eine spätere XT-Variante andeutet, ist unklar, für jene wäre aber zumindest keine zusätzliche Hardware aktivierbar. Die Namenswahl soll sicherlich die Vermarktung der Karte vereinfachen, denn mit diesen Hardware-Daten wird es schwer, gegenüber den vorhandenen Navi-23-Lösungen zu glänzen. Ergo misst sich AMD lieber mit der kleineren Radeon RX 6600 non-XT, gegenüber jener sind beachtbare Performance-Sprünge eher darstellbar. Dies wird erleichtert durch die Preisfestsetzung auf 269 Dollar Listenpreis – was gegenüber der Radeon RX 6600 auf seinerzeit 329 Dollar sogar einen Preisvorteil bedeutet. Aber natürlich war jener Listenpreis der Radeon RX 6600 seinerzeit mitten im Crytomining-Boom auch aufgebläht, hier sollte man dann eher den Vergleich zum Straßenpreis antreten.

Radeon RX 6600 XT Radeon RX 6650 XT Radeon RX 6700 XT Radeon RX 7600
Chipbasis AMD Navi 23 XT AMD Navi 23 KXT Navi 22 XT Navi 33 XL
Fertigung 11,1 Mrd. Transistoren auf 236mm² in der 7nm-Fertigung von TSMC 17,2 Mrd. Transistoren auf 335mm² in der 7nm-Fertigung von TSMC 13,3 Mrd. Transistoren auf 204mm² in der 6nm-Fertigung von TSMC
Architektur AMD RDNA2, DirectX 12 Feature-Level 12_2 AMD RDNA3, DirectX 12 Feature-Level 12_2
Features DirectX 12, OpenGL, Vulkan, Asynchronous Compute, RayTracing, VSR, FSR 1/2, FreeSync, TrueAudio Next, XConnect, SAM DirectX 12, OpenGL, Vulkan, RayTracing, VSR, FSR 1/2/3, FreeSync, TrueAudio Next, XConnect, rBAR
Technik 2 Raster-Engines, 32 Shader-Cluster, 2048 FP32-Einheiten, 128 TMUs, 32 RA-Einheiten, 64 ROPs, 2 MB Level2-Cache, 32 MB "Infinity Cache", 128 Bit GDDR6-Interface (Vollausbau) 2 Raster-Engines, 32 Shader-Cluster, 2048 FP32-Einheiten, 128 TMUs, 32 RA-Einheiten, 64 ROPs, 2 MB Level2-Cache, 32 MB "Infinity Cache", 128 Bit GDDR6-Interface (Vollausbau) 2 Raster-Engines, 40 Shader-Cluster, 2560 FP32-Einheiten, 160 TMUs, 40 RA-Einheiten, 64 ROPs, 3 MB Level2-Cache, 96 MB "Infinity Cache", 192 Bit GDDR6-Interface (Vollausbau) 2 Raster-Engines, 32 Shader-Cluster, 4096 FP32-Einheiten, 128 TMUs, 32 RA-Einheiten v2, 64 KI-Kerne, 64 ROPs, 2 MB Level2-Cache, 32 MB "Infinity Cache", 128 Bit GDDR6-Interface (Vollausbau)
Taktraten 1968/2359/2589 MHz & 16 Gbps 2055/2410/2635 MHz & 17,5 Gbps 2321/2424/2581 MHz & 16 Gbps 1720/2250/2625 MHz & 18 Gbps
Rohleistungen 10,6 TFlops & 256 GB/sec 10,8 TFlops & 280 GB/sec 13,2 TFlops & 384 GB/sec 21,5 TFlops & 288 GB/sec
Speicherausbau 8 GB GDDR6 8 GB GDDR6 12 GB GDDR6 8 GB GDDR6
Anbindung PCI Express 4.0 x8 PCI Express 4.0 x8 PCI Express 4.0 x16 PCI Express 4.0 x8
Ref./Herst./OC / / / / / / / /
Layout Dual/TripleSlot Dual/TripleSlot Dual/TripleSlot Dual/TripleSlot
Kartenlänge AIBs: 17,9-30,5cm AIBs: 20,0-30,6cm Ref: 27,0cm
AIBs: 22,8-32,6cm
AIBs: 20,0-30,5cm
Stromstecker 1x 8pol. 1x 8pol. 1x 6-pin + 1x 8-pin 1x 8pol.
off. Verbrauch 160W 180W 230W 165W
realer Verbr. 156W 177W 219W 160W
Ausgänge HDMI 2.1, 3x DisplayPort 1.4a HDMI 2.1, 3x DisplayPort 1.4a HDMI 2.1, 3x DisplayPort 1.4a HDMI 2.1a, 3x DisplayPort 2.1
Listenpreis $379 / 380€ $399 / 449€ $479 / 479€ $269 / 299€
Release 11. August 2021 10. Mai 2022 18. März 2021 25. Mai 2023

Dennoch kann man erst einmal sagen, dass AMDs Ansatz auf den ersten Blick besser zum Problem beider neuen Mainstream-Grafikkarten passt: Beide sind mit nur 8 GB Grafikkartenspeicher ausgerüstet, logischerweise beim identischen 128-Bit-Interface. Dafür einen möglichst niedrigen Preis ansetzen, erscheint erst einmal sinnig: Schließlich ist das Wirkspektrum dieser neuen Grafikkarten somit eher denn auf die FullHD-Auflösung begrenzt, befindet man sich somit zweifelsfrei in reinen Mainstream-Gefilden. Die GeForce RTX 4060 Ti wird es da mit ihrem viel höheren Preispunkt ($269 gegen $399) viel schwerer haben, muß dafür erst einmal die passende Mehrperformance aufzeigen. Natürlich ist der niedrigere Preispunkt für die Radeon RX 7600 dann auch kein Selbstläufer: Auch die AMD-Karte muß beweisen, irgendetwas besser als die bereits in diesem Performance- und Preissegment existierenden Lösungen machen zu können.

Taktraten-technisch ergeben sich keine Überraschungen: Die GeForce RTX 4060 Ti taktet real zwischen 2.7-2.75 GHz und damit vollkommen im Rahmen der bisherigen Ada-Lovelace-Beschleuniger. Für die Radeon RX 7600 ergaben die realen Taktratenmessungen hingegen zwischen 2.6-2.65 GHz und damit genauso grob im Rahmen der bisherigen (wenigen) RDNA3-Beschleuniger. nVidia behält damit seinen kleinen Taktraten-Vorteil gegenüber AMD in dieser Generation – und vor allem legt nVidia gegenüber der eigenen Vorgänger-Generation massiv beim Takt zu, während jener Vorteil bei AMD eher denn klein ausfällt. Bei der Radeon RX 7600 ist es dann nochmals weniger, die Radeon RX 6600 Serie taktete in der Spitze auch schon bei 2.55-2.65 GHz, also kaum niedriger. Natürlich war die Radeon RX 6650 XT als Refresh-Lösung auch klar auf Taktrate geprügelt, aber auch im Vergleich zur Radeon RX 6600 XT bleibt der Taktraten-Gewinn auf AMD-Seite gering.

Basis Durchschnitt Max gemessener Realtakt
AMD-Bezeichnung: "Base Clock" "Game Clock" "Boost Clock" "Max Clock" CB TPU PCGH
Radeon RX 7900 XTX 1900 MHz 2300 MHz 2500 MHz ? 2556 MHz 2612 MHz 2.60 GHz
Radeon RX 7900 XT 1500 MHz 2000 MHz 2400 MHz ? 2566 MHz 2687 MHz 2.40 GHz
Radeon RX 7600 1720 MHz 2250 MHz 2625 MHz ? 2645 MHz 2613 MHz 2.61 GHz
Radeon RX 6950 XT 1890 MHz 2100 MHz 2310 MHz ? 2392 MHz 2405 MHz 2.42 GHz
Radeon RX 6900 XT 1825 MHz 2015 MHz 2250 MHz ? 2265 MHz 2233 MHz 2.30 GHz
Radeon RX 6800 XT 1825 MHz 2015 MHz 2250 MHz ? 2216 MHz 2257 MHz 2.34 GHz
Radeon RX 6800 1700 MHz 1815 MHz 2105 MHz ? 2177 MHz 2205 MHz 2.20 GHz
Radeon RX 6750 XT 2150 MHz 2495 MHz 2600 MHz ? 2683 MHz - 2.63 GHz
Radeon RX 6700 XT 2321 MHz 2424 MHz 2581 MHz ? 2531 MHz 2491 MHz 2.54 GHz
Radeon RX 6650 XT 2055 MHz 2410 MHz 2635 MHz ? 2601 MHz - 2.68 GHz
Radeon RX 6600 XT 1968 MHz 2359 MHz 2589 MHz ? 2562 MHz - 2.58 GHz
Radeon RX 6600 1626 MHz 2044 MHz 2491 MHz ? 2509 MHz 2444 MHz 2.51 GHz
Radeon RX 6500 XT 2310 MHz 2610 MHz 2815 MHz ? 2753 MHz - 2.82 GHz
nVidia-Bezeichnung: "Base Clock" "Boost Clock" "Max Clock" CB TPU PCGH
GeForce RTX 4090 2235 MHz 2520 MHz ? 2744 MHz 2701 MHz 2.74 GHz
GeForce RTX 4080 2205 MHz 2505 MHz ? 2725 MHz 2737 MHz 2.78 GHz
GeForce RTX 4070 Ti 2310 MHz 2610 MHz ? 2802 MHz - 2737 MHz
GeForce RTX 4070 1920 MHz 2475 MHz ? 2758 MHz 2762 MHz 2769 MHz
GeForce RTX 4060 Ti 2310 MHz 2535 MHz ? 2714 MHz 2767 MHz 2.74 GHz
GeForce RTX 3090 Ti 1560 MHz 1860 MHz ? 1936 MHz 1979 MHz 2.00 GHz
GeForce RTX 3090 1400 MHz 1700 MHz ? 1754 MHz - 1.88 GHz
GeForce RTX 3080 Ti 1365 MHz 1665 MHz ? 1784 MHz 1780 MHz 1.80 GHz
GeForce RTX 3080 12GB 1260 MHz 1710 MHz ? - - 1.80 GHz
GeForce RTX 3080 10GB 1450 MHz 1710 MHz ? 1827 MHz 1931 MHz 1.90 GHz
GeForce RTX 3070 Ti 1575 MHz 1770 MHz ? 1878 MHz 1861 MHz 1.88 GHz
GeForce RTX 3070 1500 MHz 1725 MHz ? 1920 MHz 1882 MHz 1.86 GHz
GeForce RTX 3060 Ti 1410 MHz 1665 MHz ? 1900 MHz 1877 MHz 1.83 GHz
GeForce RTX 3060 1320 MHz 1777 MHz ? - - 1.87 GHz
GeForce RTX 3050 1552 MHz 1777 MHz ? 1891 MHz 1906 MHz 1.89 GHz
Intel-Bezeichnung: - "Graphics Clock" "Max Clock" CB TPU PCGH
Arc A770 "LE" - 2100 MHz 2400 MHz - 2386 MHz 2.33 GHz
Arc A750 - 2050 MHz 2400 MHz - 2394 MHz 2.39 GHz
Realtakt-Angaben gemäß den Ausarbeitungen der ComputerBase (Ø 11-20 Spiele) und von TechPowerUp (Ø 22-25 Spiele) sowie den Praxis-Angaben der PC Games Hardware (neuere, MHz-genaue Werte: Ø 20 Spiele) von jeweils Referenz-Varianten (oder auf Referenz-Taktung/TDP laufend)