15

Ryzen 9000: Viel stärkere Linux-Performance könnte fehlerhafte Windows-Performance andeuten

Zwei Merkwürdigkeiten bei der Performance von Ryzen 9000 wurden kürzlich bereits genannt, eine weitere soll hiermit breiter betrachtet werden: Der Performance-Gewinn unter Linux ist bemerkbar stärker als unter Windows. Dies läßt sich leicht anhand der (sehr umfangreichen) Linux-Benchmarks von Phoronix erkennen, welche dem Ryzen 9 9950X einen Performance-Gewinn zum eigenen Vorgänger von immerhin +17,8% mitgeben – was von keinem der anderen Testberichte unter Windows auch nur annähernd erreicht wird. Allerdings könnte dies natürlich auch an der Wahl der Benchmarks bei Phoronix liegen, welche stark Workstation- und Server-lastig ist. Ein besser belastbarer Hinweis ergibt sich mit dem Vergleich der Performancegewinne von Zen 3 zu Zen 4 sowie von Zen 4 zu Zen 5. Hierbei sollten selbst Reviews, welche weniger stark skalierende Benchmarks verwendet haben, doch zumindest in der Relation zwischen den Zen-Generation eine ähnliche Steigerung hinlegen:

5800X→7700X 7700X→9700X Z3/Z4 zu Z4/Z5 Relation 5950X→7950X 7950X→9950X Z3/Z4 zu Z4/Z5 Relation
Phoronix +42,8% +15,0% +58,9% +17,8%
TechPowerUp +32,8% +3,7% 32% des Phoronix-Gewinns +35,3% +3,5% 33% des Phoronix-Gewinns
Hardware & Co +34,1% +4,8% 40% des Phoronix-Gewinns +49,0% +9,3% 63% des Phoronix-Gewinns
Tom's Hardware ? +7,2% +45,5% +12,3% 89% des Phoronix-Gewinns

Wie den vorstehenden Ergebnissen zu entnehmen, trifft dies jedoch zumeist überhaupt nicht zu: Auch der relative Performance-Gewinn, welcher also die unterschiedlich hohe Benchmark-Skalierung als Effekt herausnimmt, ist zumeist deutlich niedriger bei den Windows-Tests gegenüber dem Linux-Test von Phoronix. Teilweise fallen diese Unterschiede sehr deutlich aus, wie beispielsweise bei TechPowerUp: Gewinnt bei Phoronix im Vergleich der 16-Kerner Zen 5 gegenüber Zen 4 immerhin noch um 30% so viel hinzu, wie Zen 4 gegenüber Zen 3, fällt dies bei TechPowerUp auf nur noch 10% zurück. Der relative Performance-Gewinn der Paarungen Zen3/4 zu Zen4/5 liegt bei TechPowerup somit nur auf einem Drittel wie bei Phoronix. Gewisse Abweichungen dürften normal sein, aber nur ein Drittel des relativen Performance-Sprungs (sowie gar nur ein Fünftel des absoluten Performance-Sprungs) zu messen, fällt ziemlich sicher nicht darunter.

Ganz 100%ig sicher kann man sich dieser Auslegung aber auch nicht sein, denn zumindest die relativen Ergebnisse von Tom's Hardware (erzielt unter reinen Rendering-Benchmarks) kommen jenen von Phoronix dann schon ziemlich nahe. Aber zumindest der Verdacht, dass hier etwas nicht korrekt ist, wäre somit erst einmal da. Selbst der Punkt von AVX512, welches unter den Workstation/Server-Benchmarks von Phoronix eventuell stärker präsent ist, kann die stark unterdurchschnittlichen relativen Performance-Zuwächse unter Windows bei TechPowerUp und Hardware & Co nur schwer erklären. Weiter in die Linux-Kerbe schlägt dann ein direkter Linux/Windows-Vergleich der PC Games Hardware mit dem Ryzen 7 9700X. Hierbei wurden gutklassige und vor allem für Betriebssystem-Vergleiche ungewöhnlich hohe Performance-Differenzen von 6-8% ausgemessen, welche allesamt zugunsten von Linux ausfallen (mit der Ausnahme von World of WarCraft, ohne dies könnten die Spiele-Benchmarks noch etwas besser für Linux aussehen).

Ryzen 7 9700X ST-Perf Anwendungen Spiele (avg) Spiele (P1)
Windows 11 24H2 → Nobara Linux 40 +3,9% +7,8% +6,6% +6,1%
gemäß der Benchmarks der PC Games Hardware

Die hierbei dahinterstehende Menge an Einzeltests ist leider ziemlich gering (5 Spiele-Tests, 5 Anwendungs-Benchmarks, 1 ST-Test), die Tendenz jedoch eindeutig und vor allem in der Höhe faktisch zu hoch. Normalerweise ergeben Betriebssystem-Tests nicht derartige Unterschiede, welche sich zudem nicht gerade derart eindeutig zugunsten von Linux bewegen. Um hier den Verursacher genauer zuzuordnen, müsste man dieselben Tests wohl auch noch mit einem Ryzen 7 7700X antreten. Gleichzeitig wäre es sinnvoll, die Windows-Benchmarks noch einmal zusätzlich im Admin-Modus anzugehen – denn hierin liegt laut einem brandneuen Test von Hardware Unboxed @ YouTube genauso noch eine Performance-Bremse bei den AMD-Prozessoren im Spiele-Bereich. Laufend im Admin-Modus, konnte man dort über ein mittelbreites Testfeld einen gemittelten Spiele-Performancegewinn des Ryzen 7 9700X von +4% gegenüber dem default-Zustand erzielen:

Spiele (avg) Spiele (1%min)
Ryzen 7 7700X – Windows-default vs @Admin +3% +3%
Ryzen 7 9700X – Windows-default vs @Admin +4% +4%
gemäß der Benchmarks von Hardware Unboxed @ YouTube

Allerdings trifft dies genauso auch auf den Ryzen 7 7700X zu, wenngleich mit einem minimal niedrigeren Performancegewinn von +3%. Durch diese Maßnahme gewinnt der Ryzen 7 9700X gegenüber dem Ryzen 7 7700X also auch nur einen Prozentpunkt Spiele-Performance hinzu, dies ist somit nicht die Lösung der Performance-Probleme von Ryzen 9000. Zudem konnten Hardware Unboxed im Admin-Modus auch keinen Performance-Gewinn bei Anwendungs-Benchmarks feststellen, was somit der Idee widerspricht, hiermit die Ursache für den vorstehend festgestellten großen Unterschied zwischen Windows- und Linux-Performance von Ryzen 9000 gefunden zu haben. Derzeit gibt es diesbezüglich noch keinen rauchenden Colt – und womöglich gibt es auch keine einzelne große Ursache, sondern durch das Zusammenspiel von mehreren Ursachen kommt eine ingesamt erhebliche Leistungs-Differenz zusammen.

AMD sollte somit nunmehr prüfen, ob die von den Hardwaretestern gemessene Windows-Performance von Ryzen 9000 dem entspricht, als was man intern für korrekt hält. Allein über den "Admin-Trick" oder über die "Core Provisioning" Problematik ergeben sich bereits Anhaltspunkt, dass die Hardwaretester die Performance von Ryzen 9000 nicht vollständig dargestellt haben bzw. dies mangels wirklich funktionierender Treiber gar nicht tun konnten (auch der Admin-Trick ist eigentlich ein Problem von AMD, welches bei gut funktionierenden Treibern nicht auftauchen sollte). Eventuell liegt sogar noch mehr darunter, die Diskrepanz bei den Benchmark-Ergebnissen zwischen Windows und Linux läßt derzeit noch jede Deutung zu. Aber selbst "nur" mehrere kleinere Performance-Verbesserungen könnten zusammengezählt durchaus eine beachtbare Wirkung entfallen und Ryzen 9000 vom derzeitigen Meme "Zen 5%" wegbringen. Sofern an dieser Sache wirklich etwas dran ist, sollte AMD dem jetzt wirklich umgehend nachgehen.

Nachtrag vom 15. August 2024

Bei Phoronix hat man sich den Effekt der AVX512-Benchmarks auf das eigene Performance-Ergebnis zu Zen 5 angesehen, welches wie bekannt deutlich besser liegt als bei üblichen Windows-Benchmarks. Hierbei ergaben 90 ausgewählte AVX512-Benchmarks einen (stark überdurchschnittlichen) Performance-Sprung zwischen Ryzen 9 7950X und 9950X von +27,4%, welcher hingegen nach Abschaltung von AVX512 auf +15,3% zurückging. Letzteres Ergebnis liegt zwar nicht weit weg vom insgesamten Performance-Durchschnitt aller fast 400 Linux-Benchmarks bei Phoronix, wo dieselbe Prozessoren-Paarung ein Ergebnis von +17,8% erreichte. Dennoch reicht es mathematisch gut aus, um letzteres zu erklären: Um mit +27,4% bei grob einem Viertel aller Benchmarks im insgesamten Durchschnitt auf +17,8% zu kommen, müssen die restlichen drei Viertel der Benchmarks dann einen Performance-Sprung von ca. +11,5% 14,7% hingelegt haben.

Linux-Benchmarks 7950X→9950X Benchmark-Hintergrund
allgemeiner Test +17,8% nahezu 400 Benchmarks, primär Workstation/Server-Anwendungen
reiner AVX512-Test +27,4% 90 Benchmarks, allesamt unter Verwendung von AVX512
AVX512-Test mit AVX512=off +15,3% selbes Benchmark-Set wie vorstehend, AVX512 deaktiviert
gemäß der Benchmarks von Phoronix

Und dies ist zwar immer noch überdurchschnittlich, liegt aber dennoch in der Nähe der besten Windows-Ergebnisse zu Zen 5. Demzufolge reicht der Effekt von AVX512 aus, um zumindest den größeren Teil des Performance-Unterschieds zwischen Linux- und Windows-Benchmarks zu Zen 5 zu erklären. Gänzlich perfekt nachgewiesen ist dies hiermit allerdings nicht, denn eigentlich geht es nur um die Performance-Verbesserungen unter AVX512 zwischen Zen 4 und Zen 5, nicht jedoch um die gänzliche Deaktivierung des Features (welches schließlich auch schon bei Zen 4 existiert). Benchmark-technisch läßt sich dies natürlich nicht anders lösen, (ohne größere Treiber-Eingriffe) kann man Zen 5 schlecht auf dem AVX512-Technikniveau von Zen 4 testen. Offen bleiben aus Sicht der zurückhängenden Windows-Performance von Zen 5 weiterhin die Punkte, wieso Linux auch absolut schneller ist als Windows bzw. wieso es einen Admin-Account benötigt, damit die Spiele-Performance von Zen 5 ein erträgliches Maß erreicht.