20

Hardware- und Nachrichten-Links des 20. Dezember 2019

Die PC Games Hardware hat sich mit der PCI-Express-Performance der Radeon RX 5500 XT beschäftigt – welche aus zweierlei Gründen interessant ist: Zum einen geht der 4-GB-Ausführung der Karte wie bekannt unter einigen Spieletiteln deutlich der Speicher aus (wo dann über PCI Express nachgeladen werden muß), zum anderen verfügt der zugrundeliegende Navi-14-Chip über ein PCI Express 4.0 Interface mit nur 8 Lanes – sprich, nicht über die üblichen 16 Lanes. Im PCIe-4.0-Modus macht dies keinen Unterschied, dann entspricht diese Konstruktion der nominellen PCI-Express-Bandbreite von PCI Express 3.0 mit 16 Lanes. Jener PCIe-4.0-Modus ist aber nur auf Zen 2 verfügbar, sprich nur bei einer Minderheit der Anwender- und Test-Systeme. Dennoch ist die Ausgangslage für diese PCGH-Messungen, das hierbei eigentlich kein größerer Unterschied herauskommen sollte, so wie frühere Messungen zur PCI-Express-Performance dies (immer wieder) konstatiert hatten.

PCI Express 4.0 x8 PCI Express 3.0 x8 PCIe-Differenz
Radeon RX 5500 XT 8GB 100% 95,5% -4,5%
Radeon RX 5500 XT 4GB 87,1% 65,6% -24,7%
gemäß den Messungen der PC Games Hardware unter vier besonders Speicher-fressenden Benchmarks (ohne Wolfenstein II)

Bei der Radeon RX 5500 XT 8GB trifft dies auch halbwegs zu: Es gibt zwar eine Abweichung um -4,5%, allerdings hatte sich die PCGH für diese Messungen aus ihrem Benchmark-Portfolio auch speziell jene vier Spieletitel herausgesucht, wo es größere Performance-Differenzen zwischen den beiden Speicherbestückungen der Radeon RX 5500 XT gab. Rechnet man da mal hoch auf ein Benchmark-Feld mit angenommen 12 Tests, wo acht keine Differenz und vier eine durchschnittliche Abweichung von -4,5% aufzeigen, kommt man auch bei der Radeon RX 5500 XT 8GB wieder auf eine typische Abweichung von 1-2% Prozentpunkten. Anders sieht dies bei der Radeon RX 5500 XT 4GB aus, welche unter diesen besonders Speicher-fressenden Spieletiteln mit -24,7% heftig abschmiert, sobald man jener kein Zen-2-System zur Verfügung stellt. Im Extremfall läßt sich unter Wolfenstein II sogar ein Performanceverlust von -46% (!) erzwingen, allerdings darf Wolfenstein II bezüglich Speicher-intensiver Benchmarks sicherlich als (klarer) Sonderfall angesehen werden.

Eine klare Gegenanzeige gegenüber der Radeon RX 5500 XT 4GB ergibt dies allerdings noch nicht – denn dazu fehlt der Nachweis, das sich auch unter den nicht Speicher-fressenden Spieletiteln etwas bewegt. Denn letztlich dürfte der Anwender in der Praxis bei jenen Spielen, wo der Grafikkartenspeicher der Radeon RX 5500 XT 4GB zu knapp ist, diesem Effekt mit der schlichten Reduzierung der Texturenqualität entgegenwirken – in aller Regel dürfte allein das Zurückschalten auf die zweithöchste Texturen-Stufe schon ausreichend sein, um das Problem aus der Welt zu schaffen. Und sobald die zu ladende Texturenmenge geringer wird bzw. in den Speicher der Radeon RX 5500 XT 4 GB passt, dürfte dann auch die PCI-Express-Bandbreite keine Rolle mehr spielen. Jene Problematik ergibt sich in diesem Fall nur deswegen so deutlich, weil eben die Radeon RX 5500 XT 4GB mit ihrer Grafikkartenspeicher-Menge ungewöhnlicherweise nicht gut zurechtkommt. Das man anderswo mit 4 GB zumindest unter FullHD und abseits solcher Sonderfälle wie Wolfenstein II (derzeit) noch ganz gut leben kann, beweisen zum einen GeForce GTX 1650 Super wie aber auch AMDs eigene Radeon RX 570.

Die ComputerBase hat sich den 32-Kerner Ryzen Threadripper 3970X unter der TDP von nur 180 Watt angesehen – sprich auf das TDP-Niveau der allerersten Threadripper-Generation limitiert, welche allerdings bei 16 CPU-Kernen endete. Dabei kommt der Threadripper 3970X erstaunlich gut weg und verliert im Schnitt nur -10% Performance – was auch zu der unter Blender ermittelten Taktrate passt, welche um ca. -10,5% niedriger liegt. Ergo läuft Threadripper 3970X im default-Zustand schon deutlich außerhalb seines Energieeffizienz-Sweetspots, was allerdings für Consumer-Prozessoren ziemlich normal ist. Im Server-Bereich spart man sich dann üblicherweise jene ganz hohen Taktraten und verbaut dann lieber Systeme mit mehr Prozessoren-Kernen – ob im selben Sockel oder als Mehrsockel-System. Damit erreicht man eine höhere Energieeffizienz, was für ein Rechenzentrum mit hoher Anzahl an Servern wesentlich wichtiger ist als ein 10prozentiger Performance-Aufschlag. Der Threadripper 3970X, limitiert auf 180 Watt TDP, kann dieses Prinzip mit einer um satte 40% höheren Energieeffizienz eindrucksvoll demonstrieren.

CPU-Kerne TDP Anwend.-Perf. Perf./Realverbr.
Ryzen Threadripper 3970X 32 280W 100% 100%
Ryzen Threadripper 3970X 32 @ 180W 90% 140%
Ryzen Threadripper 2990WX 32 250W 64% 72%
Core i9-10980XE 18 165W (real: ca. 200W) 57% 80%
gemäß den Ausführungen der ComputerBase, zuzüglich einer früheren Aufstellung zu Realverbrauchs-Werten

Dieses Ergebnis deutet zugleich auch an, wo sich der irgendwann Anfang 2020 zu erwartende 64-Kerner Ryzen Threadripper 3990X einordnen dürfte: Mittels ca. 10% niedriger Taktraten bekommt jener massig Platz unter der TDP frei, um seine doppelte Anzahl an CPU-Kernen vernünftig zu versorgen. Wahrscheinlich muß die Real-Taktrate noch etwas weiter herunter, vielleicht auf -15% bis -20%. Danach kann man aber die volle Power der 64 CPU-Kerne nutzen, so dass (rein) unter entsprechend skalierenden Benchmarks durchaus ein BestCase-Ergebnis gemäß der Milchmädchen-Rechnung "doppelte CPU-Kerne -20%" herauskommen kann, sprich irgendetwas mit +60% Performance-Gewinn. In der Praxis bzw. unter einem breiteren Benchmark-Feld dürfte es dann entsprechend weniger sein, da reihenweise Benchmarks mit so vielen CPU-Kernen kaum noch vernünftig skalieren. Derzeit gibt es ja auch schon zwischen 24-Kerner Threadripper 3960X und 32-Kerner Threadripper 3970X nur gut +16% Performance-Gewinn für allerdings gleich +33% mehr CPU-Kerne. Eine eher defensive Schätzung spricht dem 64-Kerner Threadripper 3990X ergo eine Mehrperformance von +40-45% gegenüber dem 32-Kerner Threadripper 3970X zu.

Davon abgesehen weist die ComputerBase noch auf den interessanten Umstand hin, das bei festgesetztem TDP-Limit eine höhere Speichertaktung auch einen gegenteiligen Effekt auf die Performance dieser Ryzen- und Threadripper-Prozessoren haben kann: Denn da das Speicherinterface gerade bei Threadripper reichlich Saft zieht, kann ein zu hoher Speichertakt zu große Teile des TDP-Limits zum Speichercontroller leiten – womit dann weniger des TDP-Limits für die CPU-Recheneinheiten zur Verfügung steht. Eine besonders ungünstige Konfiguration kann durchaus ein paar Prozente an Performance kosten, wobei dieser Effekt nur bei Threadripper wirklich beachtbar ausfiel (5% Differenz unter Blender). Beim regulären Ryzen dürfte dies (wegen des kleineren Speicherinterfaces) nicht mehr so bedeutend sein und in einem großen Benchmark-Feld dann auch durch auf den höheren Speichertakt gut reagierende Benchmarks wieder ausgeglichen werden. Dabei ergab sich im übrigen keinerlei Effekt bei einer rein veränderten Speicherspannung: Zum einen ziehen Speicherchips sowieso nicht so viel Strom, als dass dies etwas ausmachen könnte (nur die Speicherinterfaces selber sind wirklich Strom-fressend), zum anderen regelt das TDP-Limit natürlich nur den Stromfluß im Prozessor selber, wozu die Speicherchips dann nicht mehr hinzugehören.