Eine Neubetrachtung der "Arrow Lake" Performance

Sonntag, 30. März 2025
 / von Leonidas
 

Die zwei großen Prozessoren-Architekturen des letzten Jahres hatten es zu ihrem Start wirklich nicht einfach: Sowohl AMDs Zen 5 als auch Intels Arrow Lake wurden zu ihren Launches eher mißmutig empfangen, basierend auf einem mageren (AMD) bis nicht vorhandenem (Intel) Performance-Gewinn gegenüber den jeweiligen Vorgängern. In beiden Fällen versprachen die Hersteller schnelle Abhilfe mittels BIOS-Updates und Windows-Patches, was zumindest AMD bei Ryzen 9000 laut dessen Performance-Neubewertung vom letzten November auch durchaus vernünftig gelungen ist. Bei Intel hat der Fall etwas länger gedauert, zudem musste auf einen passenden Launch einer anderen CPU gewartet werden, weil ansonsten (leider) nicht die benötigte Benchmark-Menge für eine Neubetrachtung zusammenkommt. Dies ist nunmehr mit dem Launch des Ryzen 9 9950X3D passiert, womit nachfolgend ermittelt werden soll, wie sich die Performance von "Arrow Lake" im Laufe des halben Jahres seit dem Arrow-Lake-Launch entwickelt hat.

Ursprünglich wollte Intel mit den entsprechenden Patches zur Performance-Steigerung von "Arrow Lake" eigentlich schon bis Anfang Dezember 2024 spruchreif sein, wobei bis Ende 2024 eigentlich nur erreicht wurde, dass Arrow Lake nun auch unter Windows 11 24H2 das Performance-Ergebnis von Windows 11 23H2 erreicht hatte. Dies kann durchaus ein kräftiger Sprung sein, wenn man gegenüber dem Launch-Zustand vergleicht, bügelt damit aber eigentlich nur einen unnötigen Fehler aus und erzielt vor allem gegenüber der Konkurrenz nichts mehr an Performance. Weitere Nachtests ergaben dann ein recht uneinheitliches Bild: Einmal unterdurchschittlich, noch einmal unterdurchschittlich und (aus eher jüngerer Zeit) einmal herausragend waren die Ergebnisse. Intel nahm währenddessen den Mund ziemlich voll mit (wenigen) Benchmarks, welche im Schnitt immerhin +17,5% mehr Spiele-Performance zeigen, lieferte die finalen Updates & Patches im Monat Februar dann jedoch auffällig still aus.

So oder so konnte der Fall nur über umfangreiche Benchmarks wirklich geklärt werden – welche sich üblicherweise erst mittels der Launch-Reviews zu einem neuen Prozessor ergeben. Die Gelegenheit hierfür bot dann der Launch des Ryzen 9 9950X3D von Mitte dieses Monats, zu welchem die Hardwaretester auch wieder umfangreiche Benchmarks aufgelegt haben, darunter natürlich auch zu den Intel-Modellen der Serien "Arrow Lake" und "Raptor Lake Refresh". Leider hat nicht jeder Hardwaretester seine Benchmarks der Intel-Prozessoren zu diesem AMD-Launch wirklich aktualisiert, so dass eine Reihe von Testberichten hierzu nicht ausgewertet werden konnten. Für diesen Intel-internen Vergleich sind aber natürlich aktualisierte Intel-Benchmarks unerläßlich – wenngleich dies auch nur mittels Stichproben überprüft werden konnte (sofern die Hardwaretester hierzu nichts eindeutiges notiert hatten) und somit nicht garantiert werden kann, dass wirklich jenes Einzelergebnis auch tatsächlich neu erstellt wurde.

Die gewählte Methode des Vergleichs kompletter Benchmark-Serien hat zudem natürlich den Nachteil, dass hiermit einige Details nicht eingefangen werden, manche kleinere Verbesserung im großen Bild eher untergeht und gleichzeitig zusätzliche Nebeneffekte in die Ergebnisse hineinspielen. Immerhin ändern sich im Laufe der Monate auch mal die Benchmark-Felder oder Teile der weiteren Benchmark-Plattform werden aktualisiert (beispielsweise Mainboard, Speicher & Grafikkarte) – was dann auch alles mit in diese (neueren) Benchmark-Werte einfließt, obwohl diese Punkte nichts mit einer Performance-Verbesserung von Arrow Lake zu tun haben. Korrekter wäre für die vorliegenden Aufgabenstellung sicherlich ein Vergleich rein der Arrow-Lake-Performance, mit Stand vom Oktober 2024 gegen den Stand vom März 2025 auf exakt denselben Benchmarks samt einer unveränderten Test-Plattform.

Leider läßt sich nur dies zum Vergleichen benutzen, was die Hardwaretester zur Verfügung stellen – und da werden solcherart zielgerichtete Vergleiche der Performance-Entwicklung einzelner Prozessoren ziemlich selten (und vor allem nicht zeitgleich) aufgelegt. Hiermit lassen sich leider nur einige Indizien erkennen und Meß-Anekdoten aufstellen, für ein solides Performance-Bild fehlt jedoch vor allem die benötigte (größere) Test- & Benchmark-Anzahl. Der Vergleich kompletter Benchmark-Serien mag somit nur die zweitbeste Lösung sein, aber es ist auch die einzige praktikable Lösung. Natürlich könnten AMD & Intel auch bei den Hardwaretestern auf zielgerichte Nachtests insistieren – aber so lange dies ein Wunschtraum bleibt, muß man damit arbeiten, was praktisch an Testberichten vorhanden ist. Der Vergleich kompletter Benchmark-Serien hat immerhin den Vorteil, dass man am Ende wieder ein solides, aktuell bestehendes Performance-Bild aufzeigen kann.

Verglichen wurde somit nachfolgend der Stand zum Launch von Arrow Lake vom Oktober 2024 mit dem Stand zum Launch von Ryzen 7 9800X3D von November 2024 mit dem Stand zum Launch von Ryzen 9 9950X3D vom März 2025. Die ersten beiden Werte nehmen sich wegen der geringen Zeitdifferenz natürlich nur wenig, teilweise kommen die Intel-Prozessoren einen Monat später sogar noch minimal schlechter weg. Dies hängt mit dem Effekt zusammen, dass erst mit dem Launch des Ryzen 7 9800X3D die letzten AMD-Patches zur Performance von Zen 5 dann bei allen Hardwaretestern im Einsatz waren und daher zum Arrow-Lake-Launch einen Monat vorher selbst Zen 5 noch nicht sein vollen Performance-Potential zeigte. Deswegen wurden auch die nachfolgenden Benchmarks auf den Ryzen 7 7800X3D normiert, da für diesen Zen4-Prozessor die größte Chance auf eine (seinerseits) unveränderte Performance und damit einen guten Vergleichs-Anker besteht.

Anwendungen 14600K 14700K 14900K 245K 265K 285K 9700X 9900X 9950X 7800X3D
6P+8E RPL 8P+12E RPL 8P+16E RPL 6P+8E ARL 8P+12E ARL 8P+16E ARL 8C Zen5 12C Zen5 16C Zen5 8C Zen4
Launch Arrow Lake (Okt. 2024) 111,6% 139,4% 152,3% 116,0% 145,8% 162,9% 112,1% 145,3% 168,0% 100%
Launch 9800X3D  (Nov. 2024) 111,5% 139,5% 152,3% 115,0% 145,6% 162,2% 111,7% 146,9% 169,9% 100%
Launch 9950X3D  (März 2025) 109,6% 136,9% 149,2% 117,1% 145,4% 162,0% 112,4% 145,0% 166,8% 100%
Differenz Okt. '24 → März '25 –1,8% –1,8% –2,1% +0,9% –0,3% –0,5% +0,3% –0,2% –0,7%

Bei der Anwendungs-Performance bewegt sich im Rahmen der Meßtolaranz eigentlich nichts, dies wurde seitens Intel auch nicht versprochen und somit nur pro forma nachgeprüft. Eine kleine Ausnahme stellt der Vergleich gegenüber dem Raptor Lake Refresh dar, da diese Prozessoren gegenüber allen anderen Testobjekten durchgehend um ca. –2% verloren. Denkbarerweise haben die Hardware-Tester hier nun endlich geschafft, die letzten BIOS-Patches zur Stabilisierung der degenerierenden Raptor-Lake-Prozessoren einzusetzen (womit auch Intels TDP-Werte endlich wieder forciert werden). Alternativ könnten aber auch die neuesten Microcode-Patches zugunsten der Arrow-Lake-Performance hierbei eine Rolle spielen, zu welchen hier und da Auswirkungen auch auf Raptor-Lake-Prozessoren beschrieben wurden. Bis auf diese kleine (und in der Höhe unbedeutende) Anomalie bewegt sich somit nichts mit der Arrow-Lake-Performance unter Anwendungen.

Anwendungen ALT (Okt. '24)   NEU (März '25) Differenz
Core i5-14600KCore Ultra 5 245K +3,9% +6,9% +2,8%
Core i7-14700KCore Ultra 7 245K +4,6% +6,3% +1,6%
Core i9-14900KCore Ultra 9 285K +6,9% +8,6% +1,5%
Durchschnitt RPL-RARL +5,1% +7,2% +2,0%
Ryzen 7 9700XCore Ultra 5 245K +3,5% +4,2% +0,7%
Ryzen 9 9900XCore Ultra 7 265K +0,4% +0,3% –0,1%
Ryzen 9 9950XCore Ultra 9 285K –3,0% –2,8% +0,2%
Durchschnitt Zen 5ARL +0,3% +0,5% +0,3%
Hinweis: Durchschnitts-Werte bezogen auf das Mittel der drei K-Modelle von Arrow Lake gegenüber den drei K-Modellen vom Raptor Lake Refresh sowie den drei größeren X-Modellen von AMD (keine X3Ds)

Der eigentlich interessante Punkt liegt dann natürlich nur bei der Spiele-Performance, wo Intel wie gesagt klar zweistellige Performance-Gewinne im Durchschnitt versprochen hatte – und AMD hingegen bei seiner Neubetrachtung der Ryzen 9000 Performance immerhin +8,9% im Durchschnitt der vier X-Modelle erzielen konnte. Gemäß der vorliegenden Benchmarks bewegt sich bei Intel tatsächlich einiges, allerdings werden damit keine wirklich großen Zugewinne erzielt. Vielmehr legen die drei K-Modelle von Arrow Lake mit +3,3%, +4,5% und +5,0% gegenüber dem Stand vom letzten Oktober recht mittelprächtig zu. Dies ist sicherlich nicht schlecht, weil bis zu +5% rein über BIOS-Updates und Betriebssystem-Patches sind nicht einfach zu erreichen – aber eben auch zu wenig, um am allgemeinen Performance-Bild nachhaltig etwas zu verändern.

Spiele @ CPU-Limit 14600K 14700K 14900K 245K 265K 285K 9700X 9900X 9950X 7800X3D
6P+8E RPL 8P+12E RPL 8P+16E RPL 6P+8E ARL 8P+12E ARL 8P+16E ARL 8C Zen5 12C Zen5 16C Zen5 8C Zen4
Launch Arrow Lake (Okt. 2024) 83,3% 90,3% 91,6% 80,0% 83,9% 86,5% 88,9% 86,7% 90,3% 100%
Launch 9800X3D  (Nov. 2024) 82,1% 89,1% 90,8% 78,5% 82,5% 85,5% 88,6% 87,3% 90,3% 100%
Launch 9950X3D  (März 2025) 85,9% 92,4% 94,1% 82,6% 87,7% 90,8% 88,6% 86,3% 90,5% 100%
Differenz Okt. '24 → März '25 +3,1% +2,4% +2,7% +3,3% +4,5% +5,0% –0,4% –0,5% +0,3%

Dass die hiermit aufgestellten Werte halbwegs solide sind, ergibt sich am Quervergleich zu Ryzen 9000: Die Spieleperformance dieser Modelle schwankt im Vergleich alter zu neuer Benchmarks um einen halben Prozentpunkt Differenz herum, gemittelt ergibt sich ein Fehlbetrag von –0,2%, was sicherlich innerhalb der Meß- und Auswertungstoleranz liegt. Beachtbarerweise bewegen sich hingegen wiederum die Prozessoren des Raptor Lake Refresh – doch diesesmal (nicht einmal geringfügig) in den Plusbereich hinein. Damit ergibt sich die etwas kuriose Situation, dass Arrow Lake im Schnitt aller K-Modelle mit diesen neuen Benchmarks zwar um +4,5% bei der Spiele-Performance gegenüber den (drei größten) X-Modellen von Ryzen 9000 zulegt, aber nur um +1,5% gegenüber den K-Modellen des Raptor Lake Refreshs.

Spiele @ CPU-Limit ALT (Okt. '24)   NEU (März '25) Differenz
Core i5-14600KCore Ultra 5 245K –3,9% –3,8% +0,1%
Core i7-14700KCore Ultra 7 245K –7,1% –5,1% +2,1%
Core i9-14900KCore Ultra 9 285K –5,6% –3,5% +2,2%
Durchschnitt RPL-RARL –5,5% –4,1% +1,5%
Ryzen 7 9700XCore Ultra 5 245K –10,0% –6,7% +3,6%
Ryzen 9 9900XCore Ultra 7 265K –3,3% +1,6% +5,1%
Ryzen 9 9950XCore Ultra 9 285K –4,2% +0,3% +4,7%
Durchschnitt Zen 5ARL –5,8% –1,6% +4,5%
Hinweis: Durchschnitts-Werte bezogen auf das Mittel der drei K-Modelle von Arrow Lake gegenüber den drei K-Modellen vom Raptor Lake Refresh sowie den drei größeren X-Modellen von AMD (keine X3Ds)

Dies ist dann der kleine Vorteil der Betrachtung kompletter Benchmark-Serien, dass man auch solche unerwarteten Performance-Veränderungen erspähen kann. Nicht perfekt ist hingegen natürlich die Darstellung der reinen Performance-Verbesserung seitens Arrow Lake: Zum einen hat Intel rein ARL-intern augenscheinlich etwas besser zugelegt, wenn man sich die Werte vom November 2024 (zum Launch des Ryzen 7 9800X3D) im Vergleich mit März 2025 ansieht. Dort stehen ARL-intern durchschnittlich +5,9% an Verbesserung an – resultierend aus dem Punkt, dass im letzten November dann die Update-Arbeit an Ryzen 9000 vorbei war und dies wohl auch leicht den hier als Anker benutzten Ryzen 7 7800X3D beeinflusst hat. Zum anderen kann wie gesagt nicht dafür garantiert werden, dass schon jedes der für diese Auswertung benutzten Benchmark-Resultate von diesem März bereits mit den neuesten Arrow-Lake-Patches erstellt wurde. Gewisse kleinere Reserven zugunsten von Arrow Lake könnten hier somit durchaus noch vorhanden sein.

Andererseits gelten auch wieder zwei andere Punkte: Erstens ist das hier gezeichnete Performance-Bild absolut jenes, was die Hardwaretester derzeit ausgeben und somit die Artikel-Leser vorgesetzt bekommen. Real ist schließlich das, was tatsächlich aufgezeigt wird – nicht das, was man sich hypothetisch als Verbesserung dazu vorstellen könnte. Und zweitens hat Intel nun wirklich genügend Zeit bekommen, um die Arrow-Lake-Performance zu verbessern und dies auch den Hardwaretestern alles entsprechend vorzukauen. AMD hat denselben Job "seinerzeit" bei Ryzen 9000 innerhalb von drei Monaten (und damit grob der Hälfte der Zeit) gelöst. Irgendwann muß dann auch mal der Punkt sein, wo man Verbesserungen von nach dem Launch abgeschlossen hat. Was später noch dazukommen mag, ist dann eben auch ein Thema für "später" bzw. sollte man sich aufgrund des derzeit erreichten Performance-Stands eher keine großen Hoffnungen auf weitere berichtenswerte Performance-Sprünge machen.

In der Summe der Dinge reicht es zum derzeitigen Stand eben nur für eine mittelprächtige Performance-Verbesserung bei Intels Arrow Lake, rein auf die Spiele-Performance bezogen, mit im Mittel der drei K-Modellen um +4,5% Zugewinn. Dies ist grob die Hälfte von dem, was AMD seinerzeit an Nachlaunch-Verbesserung für Ryzen 9000X hingelegt hatte – was auch das Problem dieser Intel-Verbesserung offenbart: Die von AMD erzielte Performance-Steigerung ist eben schon "beachtbar", gerade im Bereich der Spiele-Performance sind +8,9% schwer zu erringen, sind dies grob die Hälfte eines (guten) Generations-Gewinns. Mit +4,5% kommt Intel deutlich niedriger heraus, sowohl gegenüber dem was Intel an Performance zum Arrow-Lake-Launch eigentlich gefehlt hat, als auch gegenüber Intels eigenen vollmundigen Ankündigungen.

Gänzlich bedeutungslos ist diese Performance-Verbesserung aber natürlich auch nicht, zudem ehrt es Intel, dass man sich hier wirklich drangesetzt und optimiert hat. Besser wäre es natürlich gewesen, wenn diese Optimierungsarbeit bereits vor dem Launch von Arrow Lake stattgefunden hätte – und somit zum Launch-Zeitpunkt bereits zur Verfügung gewesen hätte. Ein gänzlich anderes Performance-Bild hätte sich damit zwar nicht ergeben, aber mancher Malus auf Intel-Seite wäre besser zu ertragen gewesen: So würde der Performance-Rückstand von Arrow Lake unter Spielen gegenüber dem Raptor Lake Refresh nicht bei gemittelt –5,5%, sondern bei –4,1% gelegen haben. Gegenüber Ryzen 9000 wäre dies sogar noch deutlicher: Anstatt gemittelt –7,8% nunmehr nur noch –1,6%. Zugleich wäre zumindest im Duell der beiden Spitzen-Prozessoren ein Gleichstand bei der Spiele-Performance herausgekommen, anstatt wie zum Arrow-Lake-Launch ermittelt ein Malus von –4,2% des Core Ultra 9 285K gegenüber dem Ryzen 9950X.

    Was Intel an Performance zum Arrow-Lake-Launch liegengelassen hat:

  • Hinweis: alle Vergleichswerte bezogen auf den Schnitt der drei K-Modelle von Arrow Lake gegenüber den drei K-Modellen vom Raptor Lake Refresh sowie den drei größeren X-Modellen von AMD (keine X3Ds)
  • +2,0% mehr Anwendungs-Performance von Core Ultra 200K gegenüber Core i-14000K
  • +0,3% mehr Anwendungs-Performance von Core Ultra 200K gegenüber Ryzen 9000X (= innerhalb Meßtoleranz)
  • +1,5% mehr Spiele-Performance von Core Ultra 200K gegenüber Core i-14000K
  • +4,5% mehr Spiele-Performance von Core Ultra 200K gegenüber Ryzen 9000X
  • gemittelt nunmehr 95,9% des Spieleperformance-Niveaus von Core Ultra 200K gegenüber Core i-14000K (gegenüber vorher 94,5%)
  • gemittelt nunmehr 98,4% des Spieleperformance-Niveaus von Core Ultra 200K gegenüber Ryzen 9000X (gegenüber vorher 94,2%)
  • Core Ultra 9 285 erreicht die Spiele-Performance des Ryzen 9 9950X (mit nunmehr +0,3% gegenüber vorher –4,2%)
  • Quellen: gemittelte Ergebnisse der Launch-Reviews zu Arrow Lake (vom Oktober 2024) sowie zu Ryzen 9 9950X3D (vom März 2025)

Wie schon bei AMDs Ryzen 9000 gilt: Arrow Lake kam zu früh und nicht ausoptimiert in den Markt. Die vielen Launch-Reviews geben somit nicht die volle Performance von Arrow Lake wieder, wenngleich die Differenz zum Jetzt-Zustand beachtbar kleiner ausfällt als bei Rzyen 9000. Das Performance-Bild ist jedoch üblicherweise bei den allermeisten Anwendern bereits mit den seinerzeitigen Launch-Reviews gesetzt, nur ein Bruchteil dürfte die Geschichte weiterverfolgen und nur ein Bruchteil dieses Bruchteils zu dieser Performance-Neubetrachtung finden. Nachträge, Korrekturen und Updates werden halt immer nur noch von deutlich weniger Leuten gelesen als die originale Nachricht. Eventuell können AMD & Intel ja aus diesem Doppel-Fail lernen, dass man seine Launches nicht derart übers Knie brechen darf, dass dann spätere Neubetrachtung-Artikel beim 3DCenter notwendig sind, um die (annähernd) wahre Performance des neuen Produkts (Monate nach dessen Launch) offenzulegen.