27

News des 27. August 2024

WCCF Tech haben ein Statement seitens AMD vorliegen, wonach die Performance-Verbesserungen von Windows 11 24H2 bezüglich der Sprungvorhersage (Branch Prediction) nunmehr auch unter Windows 11 23H2 verfügbar sind. Hierzu hat Microsoft das optionale Update "KB5041587" aufgelegt, welches sich jeder Nutzer dieser Betriebssystem-Version installieren kann. AMD erwartet dabei denselben Performance-Gewinn auch bei 23H2 wie schon bei 24H2. Dies ermöglicht somit nunmehr einfachere Tests dieser Performance-Optimierung seitens AMD, da man hierfür nicht mehr unbedingt auf Windows 11 24H2 updaten muß. Die eigentlich offenen Frage zu dieser Thematik berührt dieses Update natürlich nicht: Wie sehen andere Tester die diesbezügliche Performance-Differenz zwischen Zen 4 und Zen 5 sowie zwischen Zen 5 und Intel? Wann fließt der Performance-Gewinn des "Admin-Tricks" in einen Windows-Patch ein, welcher dies auch ohne erweitere Rechte ermöglicht? Und sind hier noch andere Fixes und Patches zu erwarten, welche Zen 5 in irgendeiner Form voranbringen?

We wanted to let you know that the branch prediction optimization found in Windows 11 24H2 has now been backported to Windows 11 23H2. Users will need to look for KB5041587 under Windows update > Advanced options > Optional updates. We expect the performance uplift to be very similar between 24H2 and 23H2 with KB5041587 installed.
Quelle:  AMD-Statement gegenüber WCCF Tech, veröffentlich am 27. August 2024

Weitere Benchmarks zu Windows 11 24H2 bzw. somit im genauen der Sprungvorhersage-Verbesserung unter Windows 11 kommen von Hardwareluxx. Die Einzelwerte bieten dabei ein sehr buntes Bild von Zugewinnen und Verlusten, darunter reagierten 2 der getesteten 8 Spiele-Titel sogar stark negativ. Dies ergibt erneut den Hinweis darauf, hierzu besser mit großen Benchmark-Feldern zu arbeiten, denn ansonsten beeinflußt die zufällige Menge der Spiele-Titel mit negativem Effekt das Gesamtergebnis zu deutlich. Hardwareluxx haben möglicherweise auch deshalb wieder etwas abweichende Performance-Differenzen zu vermelden: Hier kamen Ryzen 7 9700X und Ryzen 5 9600X am besten weg, der Ryzen 7 7800X3D lief gar ins (marginal) Minus und der Ryzen 9 9950X gewann nur unterdurchschnittlich hinzu. Zumindest gab es wieder eine beachtbare Differenz zwischen Zen 4 und Zen 5, der Ryzen 5 9600X konnte sich relativ gesehen über diesen Effekt um +3% gegenüber dem Ryzen 5 7600X verbessern.

Spiele-Performance W11 23H2 → 24H2 Anmerkung
Ryzen 9 9950X +3,5% 720p +DLSS/FSR avg fps, Durchschnitt 8 Spiele-Tests
Ryzen 7 9700X +5,8% 720p +DLSS/FSR avg fps, Durchschnitt 8 Spiele-Tests
Ryzen 5 9600X +6,8% 720p +DLSS/FSR avg fps, Durchschnitt 8 Spiele-Tests
Ryzen 7 7800X3D –0,2% 720p +DLSS/FSR avg fps, Durchschnitt 8 Spiele-Tests
Ryzen 5 7600X +3,7% 720p +DLSS/FSR avg fps, Durchschnitt 7 Spiele-Tests
gemäß der Spiele-Benchmarks von Hardwareluxx

Die gestern gezeigte Auswertung des KitGuru-Tests zu Windows 11 24H2 wurde wegen eines unsererseitigen Verrechnungs-Fehlers nachträglich korrigiert und wird nachfolgend nochmals in korrekter Form abgebildet. Leider waren beim letzten Benchmark-Ergebnis die Werte der einzelnen Prozessoren verrutscht und somit den falschen CPUs zugeordnet worden, was in der korrigierten Form leicht veränderte Insgesamt-Resultate ergibt. Am stärksten gewinnt hierbei der Ryzen 9 9950X, welcher sich nun deutlicher vom Ryzen 9 7950X absetzt – viel deutlicher somit, als dies im vielbeachteten Test von Hardare Unboxed dargelegt wurde. Dies ist nochmals der Hinweis darauf, dass der ganze Fall unbedingt mit großen Benchmark-Feldern und allen wichtigen Prozessoren neu getestet werden muß, da diese wenigen Benchmarks zwar beachtbare Ausschläge zeigen können, hierbei jedoch immer das Risiko existiert, dass sich dies in einem großen Benchmark-Feld noch relativieren könnte. Mit Bitte um Entschuldigung für diesen Fehler und mit Dank an den Foren-Gast, der wirklich nachgerechnet und dies dann angemängelt hat.

Spiele-Performance W11 23H2 → 24H2 Anmerkung
Ryzen 9 9950X +8% 1080p avg fps, Durchschnitt 3 Spiele-Tests
Ryzen 7 9700X +6% 1080p avg fps, Durchschnitt 2 Spiele-Tests
Ryzen 7 7800X3D +5% 1080p avg fps, Durchschnitt 3 Spiele-Tests
Ryzen 9 7950X +3% 1080p avg fps, Durchschnitt 3 Spiele-Tests
gemäß der Spiele-Benchmarks von KitGuru

VideoCardz berichten in zwei Fällen über neue HEDT-Prozessoren von AMD & Intel: Zum einen zeigte sich die nächste Threadripper-Generation in einer Ladeliste. Unter dem Codenamen "Shimada Peak" entwickelt, handelt es sich hierbei um Zen5-basierten Prozessoren, welche im Verkauf möglicherweise als "Ryzen Threadripper 9000" laufen werden. Und zum anderen hat Intel den Sapphire Rapids Refresh unter den Verkaufsnamen Xeon W-2500 & W-3500 Serien veröffentlicht, welcher auf Basis derselben CPU-Architektur etwas mehr CPU-Kerne und etwas höhere Taktraten mit sich bringt. Den HEDT-Aktivitäten beider CPU-Entwickler ist gemeinsam, dass jene damit inzwischen eher nur noch den Workstation-Markt bedienen, HEDT hingegen in aller Regel mit den besten Consumer-Prozessoren besser fährt. Der Unterschied zu früher liegt in der unterdurchschnittlichen Spiele-Eignung der neueren HEDT- bzw. Workstation-Prozessoren mangels dafür konkurrenzfähiger Taktraten (sowie teils viel höherer Core-to-Core-Latenzen).

VideoCardz berichten über eine teilweise Stromverbrauchs-Reduzierung bei der GeForce RTX 50 Mobile-Serie auch "Blackwell"-Basis, belegt durch eine Aussage bei Weibo und vor allem aber eine interne Unterlage von ODM-Hersteller Clevo (baut sehr viel Notebooks für bekannte Markenhersteller). Danach reduziert nVidia teilweise die normale TGP und teilweise auch den dynamischen Spielraum, primär bei den kleineren Mobile-Varianten. Die drei kleineren Boards, im Ada-Lovelace-Portfolio genutzt für GeForce RTX 4050 Laptop, 4060 Laptop & 4070 Laptop gehen bei RTX50 Mobile von maximal 140W TGP auf nunmehr nur noch 115W herunter, wobei sowohl reguläre TGP als auch der dynamische Spielraum gekürzt wurden. Dies sind natürlich nur die jeweiligen Maximal-Werte, die Notebook-Hersteller können dies auch niedriger (und auf eigene Verantwortung auch höher) ansetzen.

Board Verkaufsname reguläre TGP dynamischer Spielraum maximale TGP
GN21-X11 → GN22-X11 GeForce RTX 4090 Laptop? 150W → 150W 15-25W → 15-25W 175W → 175W
GN21-X9 → GN22-X9 GeForce RTX 4080 Laptop? 150W → 150W 15-25W → 15-25W 175W → 175W
     n/a    → GN22-X7 n/a → ?    n/a → 115W      n/a → 15-25W    n/a → 140W
GN21-X6 → GN22-X6 GeForce RTX 4070 Laptop? 115W → 100W 10-25W → 10-15W 140W → 115W
GN21-X4 → GN22-X4 GeForce RTX 4060 Laptop? 115W → 100W 10-25W → 10-15W 140W → 115W
GN21-X2 → GN22-X2 GeForce RTX 4050 Laptop? 115W → 100W 10-25W → 10-15W 140W → 115W
gemäß Angaben von Clevo, gezeigt von VideoCardz (n/a = not available, Variante nicht vorhanden)

Der Hintergrund dieser Absenkung dürfte wohl sein, dass bei den kleineren Blackwell-Chips keine besonderen Leistungssprünge zu erwarten sind, da 2 von den 3 kleineren Blackwell-Chips mit sogar weniger Hardware-Einheiten antreten als ihre jeweiligen Ada-Lovelace-Vorgänger. Im Mobile-Feld kommt hinzu, dass nVidia dort mehr oder weniger automatisch seine Aufträge bekommt, da in diesem Segment von AMD & Intel keine ernstzunehmende Konkurrenz droht und die Notebook-Hersteller am Ende sowieso danach gehen, was deren Konsumenten schließlich wollen – und dies ist ein nVidia-Sticker auf dem Notebook. Sicherlich wird nVidia versuchen, bei den häufiger getesteten großen Mobile-Lösungen irgendein gutaussehendes Leistungsplus hinzuzaubern, aber diese Bedingung existiert für die kleineren & mittleren Mobile-Lösungen eher weniger – jene werden nach Namen gekauft, nicht nach dem Studium von Performance-Tests.

Chip Raster-Engines Shader-Cluster Speicherinterface max. Speicher Ada-Vorgänger SM vs Vorg.
GB202 angeblich 12 angeblich 192 angeblich 512 Bit GDDR7 32 GB AD102: 12 GPC, 144 SM, 384 Bit, 24 GB GDDR6X +33%
GB203 angeblich 7 angeblich 84 256 Bit GDDR7 16 GB AD103: 7 GPC, 80 SM, 256 Bit, 16 GB GDDR6X +5%
GB205 angeblich 5 angeblich 50 192 Bit GDDR7 12 GB AD104: 5 GPC, 60 SM, 192 Bit, 12 GB GDDR6X –17%
GB206 angeblich 3 angeblich 36 128 Bit GDDR7 8/16 GB AD106: 3 GPC, 36 SM, 128 Bit, 8 GB GDDR6 ±0
GB207 angeblich 2 angeblich 20 128 Bit GDDR7 8/16 GB AD107: 3 GPC, 24 SM, 128 Bit, 8 GB GDDR6 –17%
Hinweis: Angaben zu noch nicht offiziell vorgestellter Hardware basieren auf Gerüchten & Annahmen ... "max. Speicher" bezogen auf 2GByte-Chips

Daher kann es sich nVidia leisten, jene kleineren Lösungen der GeForce RTX 50 Mobile-Serie wohl nicht gänzlich auszufahren und nimmt lieber Energieeffizienz-Verbesserungen über die kleineren TGPs mit – was bei den Notebook-Herstellern auch nicht unbeliebt ist, dies spart für jene an Aufwand für Kühllösung sowie Stromversorgung & -wandlung. Im übrigen bestätigt die Clevo-Übersicht bei VideoCardz nochmals, dass auch der kleinste Blackwell-Chip "GB207" letztlich über ein GDDR7-Speicherinterface verfügen muß, auch wenn die Desktop-Ausführungen hiervon zuerst mit GDDR6-Speicher ausgerüstet vermeldet wurden. Dies ist dann aber wohl eine reine Produkt-seitige Entscheidung, der GB207-Grafikchip ist augenscheinlich vorbereitet auf beide Speichersorten. Unbekannt ist derzeit, wieso die unterschiedlichen Speichersorten beim gleichen Grafikchip angesetzt werden sollen: Denkbar wäre eine reine Marketing-Entscheidung (GDDR7 klingt besser), möglich aber auch, dass man bei einem (eventuell) auf 96 Bit abgespeckten Speicherinterface die höhere Bandbreite von GDDR7 tatsächlich benötigt.