27

Intel bestätigt (indirekt): Raptor-Lake-Prozessoren degradieren und sind per Microcode-Patch nicht zu retten

Gegenüber The Verge hat Intel sinngemäß das bestätigt, was Tom's Hardware schon zum Wochenanfang zu berichten hatten und was demzufolge auch in unsere eigene Berichterstattung zu den Stabilitäts-Problemen von "Raptor Lake" eingefloßen ist: Die hiervon betroffenen Prozessoren sind nicht einfach nur "instabil", sondern hingegen regelrecht beschädigt – und diese Beschädigung wird auch durch den kommenden Microcode-Patch nicht mehr verbessert werden. Die betroffenen Prozessoren müssen demzufolge ausgetauscht werden, wozu Intel auch mehrfach auffordert. Während Intel in diesem Punkt (gut) seine Pflicht tut, fällt im gesamten Verge-Artikel mit angeschlossenem Intel-Interview auf, wie umständlich Intel jegliche genauen Informationen aus der Nase zu ziehen sind.

Citing unnamed sources, Tom’s Hardware reports that any degradation of the processor is irreversible, and an Intel spokesperson did not deny that when we asked. Intel is “confident” the patch will keep it from happening in the first place. But if your defective CPU has been damaged, your best option is to replace it instead of tweaking BIOS settings to try and alleviate the problems.
Quelle:  The Verge am 26. Juli 2024

Die vorgestehend zitierte Zusammenfassung von "The Verge" hat Intel nämlich nie in dieser klaren Form gesagt, dies ergibt sich immer nur über das sehr genaue Lesen der Intel-Aussagen, verbunden mit einer (eigenen) Aufstellung der sich hieraus ergebenden logischen Ableitungen. Wenn Intel also davon spricht, dass es möglich sein könnte, dass der kommende Microcode-Patch ein paar Verbesserungen bei den auftretenden Instabilitäten erbringt, bedeutet dies somit, dass der Patch im Normalfall gar nichts diesbezüglich macht. Und dies ist seitens Intel auch nicht derart geplant, Intels Absicht mit dem Patch liegt vielmehr darin, das reine Zunehmen dieser Instabilitäten zu verhindern, sprich dass auch bislang noch nicht betroffene Prozessoren-Modelle in diese Problematik mit hineinrutschen.

Intel is confident that the microcode patch will be an effective preventative solution for processors already in service, though validation continues to ensure that scenarios of instability reported to Intel regarding its Core 13th/14th Gen desktop processors are addressed. Intel is investigating options to easily identify affected or at-risk processors on end user systems. It is possible the patch will provide some instability improvements to currently impacted processors; however customers experiencing instability on their 13th or 14th Generation desktop processor-based systems should contact Intel customer support for further assistance.
Quelle:  Intels Thomas Hannaford gegenüber The Verge, veröffentlicht am 26. Juli 2024

Auch dies ist natürlich löblich und wichtig, stellt aber eben nur die halbe Miete dar. Gegenüber den bereits betroffenen Modellen hat Intel auch weiterhin nur das Mittel des Produkt-Austauschs, was wie gesagt bedeutet, dass es kein per Patch oder BIOS-Setting fixbares Problem sein dürfte. Der bereits vorliegende Verdacht, dass die (von Intel bereits zugegebenen) zu hohen Spannungen die betroffenen Prozessoren dauerhaft beschädigen, wird damit indirekt bestätigt. Alle Anzeichen aus der Praxis deuten zudem darauf hin, dass die Nutzungsdauer hierbei gegen die Prozessoren wirkt – was erklärt, dass inzwischen tendentiell mehr Prozessoren der 13. als der 14. Core-Generation betroffen sind. Zur generellen Abgrenzung der möglicherweise betroffenen Modelle gibt es von Intel inzwischen eine klarere Aussage, welche auch die non-K-Modelle mit einschließt:

Intel Core 13th and 14th Generation desktop processors with 65W or higher base power – including K/KF/KS and 65W non-K variants – could be affected by the elevated voltages issue. However, this does not mean that all processors listed are (or will be) impacted by the elevated voltages issue.
Quelle:  Intels Thomas Hannaford gegenüber The Verge, veröffentlicht am 26. Juli 2024

Üblicherweise haben die kleineren Prozessoren-Modelle eine geringere Chance auf diese Fehler bzw. Instabilitäten, jene liegen aber dennoch im Kreis der nunmehr unter Verdacht stehenden Modelle. Selbst seine Raptor-Lake-basierenden Mobile-Prozessoren nimmt Intel noch nicht gänzlich aus dem Spiel: Hierzu prüft man immer noch ab, ob jene tatsächlich nicht betroffen sind. Die Chance auf Instabilitäten wird bei diesen Mobile-Prozessoren (wegen ihrer geringeren TDP-Werte und damit Taktraten) nochmals kleiner sein, ergo dürfte sich dies gerade aus praktischer Sicht vielleicht gar nicht so einfach überprüfen lassen. Wirklich heraus sind die Mobile-Modelle von Raptor Lake aber sowieso erst dann, wenn Intel die technische Grundlage dafür offenlegt, wieso jene (trotz demselbem Stück Silizium) nicht in die Überspannungs-Problematik der Desktop-Modelle hineinlaufen sollen.

Intel is continuing its investigation to ensure that reported instability scenarios on Intel Core 13th/14th Gen processors are properly addressed. This includes ongoing analysis to confirm the primary factors preventing 13th / 14th Gen mobile processor exposure to the same instability issue as the 13th/14th Gen desktop processors.
Quelle:  Intels Thomas Hannaford gegenüber The Verge, veröffentlicht am 26. Juli 2024

Dem neuen Bericht von The Verge hat man somit ein paar weitere Hintergründe und Original-Aussage von Intel zu verdanken, inhaltlich hatten Toms' Hardware selbiges jedoch schon am Wochenanfang gesagt: Dass Intel hier ein nicht fixbares Problem hat, dessen eigentliche "Lösung" im Prozessoren-Tausch per RMA besteht. Wenigstens wurde nunmehr mit drastischen Schlagzeilen der Finger direkt in die Wunde gelegt, was diese Problematik endlich außerhalb der Enthusiasten-Bubble bekannt macht. Da es inzwischen schon leicht unübersichtlich wird bezüglich der zu dieser "Raptor Lake Degradation Issue" vorhandenen Informationen, soll nachfolgende FAQ als Anhaltspunkt des derzeit bekannten Wissens dienen. Wie gesagt musste dabei oft bei Intel zwischen den Zeilen gelesen werden, um zu möglichst klaren Aussagen zu kommen:

    Raptor Lake Degradation Issue (RPLDIE): FAQ 1.03

  • potentiell betroffen sind ausschließlich Prozessoren der 13. und 14. Core-Generation mit tatsächlichem Raptor-Lake-Die
  • nicht betroffen sein können Prozessoren der 13. und 14. Core-Generation, welche noch auf das Alder-Lake-Die setzen
  • Raptor-Lake-Dies im Desktop haben alle K/KF/KS-Modelle, alle Core i7 & i9, der Core i5-14600 /T, sowie bei den kleineren Modellen diejenigen im B0-Stepping (selten)
  • Raptor-Lake-Dies im Notebook haben alle HX-Modelle, unterhalb dessen wird es unklar und man muß auf das Vorhandensein des B0-Steppings prüfen
  • geprüft werden kann mittels CPU-Z: ein Alder-Lake-Die wird als "Revision C0" angezeigt (kleinere Mobile-SKUs als "Revision J0"), ein Raptor-Lake-Die als "Revision B0"
  • schnellere Prozessoren haben eine höhere Chance, tatsächlich betroffen zu sein (Core i7/i9 K/KF/KS-Modelle)
  • Mobile-Prozessoren sollen laut Intel nicht betroffen sein, dies bleibt allerdings vor dem Vorliegen einer technischen Begründung eine offene Frage
  • Ausgangspunkt aller Probleme sind wahrscheinlich zu hohe CPU-Spannungen, welche die CPU selber fälschlicherweise anlegt
  • die betroffenen Prozessoren degradieren über zu hohe Spannungen und im Laufe der Zeit
  • betroffen hiervon sind grundsätzlich alle Prozessoren mit Raptor-Lake-Die, nur der Grad der Degradierung ist von CPU zu CPU unterschiedlich
  • je länger der Prozessor in diesem Zustand läuft, um so mehr verschlechtert sich jener, bis dann eines Tages Instabilitäten auftreten
  • die Chance auf Instabilitäten mit potentiell betroffenen Prozessoren ist niedrig bis mittelmäßig, die Mehrheit der Nutzer hat stabile Raptor-Lake-Prozessoren
  • die Instabilitäten zeigen sich vornehmlich unter Spielen beim Shader-Kompilieren, besonders gern unter Unreal-Engine-Titeln
  • eine häufig auftretende Fehlermeldung hierzu ist "Out of video memory trying to allocate a rendering resource"
  • auf dieses Problem kann somit unter allen UE-Titeln (beim Shader-Kompilieren) getestet werden, wobei es derzeit noch keinen perfekten Test gibt
  • als Abhilfe empfiehlt Intel seine "Intel Default Settings", den Fix für den eTVB-Bug und den kommenden Microcode-Patch gegen zu hohe CPU-Spannungen
  • alle diese Fixes sind Teil neuerer BIOS-Updates der Mainboard-Hersteller, der kommende Microcode-Patch wird ab Mitte August hierin einfließen
  • jegliche Degradierung des Prozessors ist nicht mehr zurückzudrehen, die Intel-Fixes verhindern nur eine weitere Degradierung
  • bereits instabile Prozessoren sind demzufolge RMA-Fälle
  • noch nicht instabile Prozessoren können dennoch bereits zum gewissen Grad eine Degradierung erlitten haben, welche deren Lebensdauer senkt
  • Intel will ein Tool zur Verfügung stellen, mit welchem sich solcherart bereits betroffene Prozessoren erkennen lassen können
  • ein Rückruf durch Intel ist nicht geplant, man will wohl sehen, wie gut der kommende Microcode-Patch wirkt und wird ansonsten die betroffenen Prozessoren per RMA ersetzen
  • unklar bleibt, wie Intel langfristig die Frage von bereits degradierten, aber derzeit noch stabilen Prozessoren behandeln will
  • ein Fertigungs-Problem von Intel ("Oxidation Issue") von März-Juli 2023 hat hiermit (inhaltlich) nichts zu tun und wurde auch schon im Jahr 2023 gelöst
  • Quellen: primär Intel-Aussagen, allerdings mit viel zwischen den Zeilen lesen
     
    Was Raptor-Lake-Nutzer nunmehr tun sollten:
  • 1.   prüfen, ob tatsächlich ein Raptor-Lake-Die vorliegt
  • 2.   im Fall eines Raptor-Lake-Dies mit bereits vorhandenen Instabilitäten = RMA-Fall
  • 3.   im Fall eines Raptor-Lake-Dies ohne bereits vorhandene Instabilitäten:
  • 3.1. letzte BIOS-Updates einspielen, welche die "Intel Default Settings" forcieren und den eTBV-Bug beheben
  • 3.2. warten auf das nächste BIOS-Update ab Mitte August, mittels Intel die zu hohen Spannungen korrigieren will
  • 3.3. ab diesem Zeitpunkt sollte der Prozessor nicht weiter degradieren
  • 3.4. warten auf ein Prüf-Tool von Intel, mittels welchem der konkret vorhandene Degradierungs-Grad festgestellt werden kann

Leider sind etliche Dinge derzeit noch nicht gänzlich sicher, ergo ist diese FAQ keineswegs unfehlbar. Gerade alles, was die eigentliche Ursache der Probleme betrifft, ist immer noch in der Schwebe – auch bei Intel. Selbst die hierzu idenifizierten zu hohen CPU-Spannungen könnten demzufolge nur ein Teil-Aspekt sein, dies prüft Intel derzeit gerade intern. Aber auch so ist die ganze Sache natürlich unschön, weil somit die derzeit angesetzten Fixes keine der bereits von Instabilitäten betroffenen Prozessoren mehr retten können. Dies ergibt einigen Elektronik-Schrott für Intel, verbunden wohl mit dem Verschwinden des bisherigen Nimbus "Intel = stabil". Wahrscheinlich deswegen versucht Intel das Thema derzeit auf kleinstmöglicher Flamme zu kochen, damit die medialen Auswirkungen nicht noch die wirtschaftlichen in den Schatten stellen.

Nun sind Fehler Sachen, die einfach passieren. Und wenn nicht gerade dauernd irgendwelche Fehler passieren, sollte sich die Beurteilung eines Fehler wohl eher daran ermessen, wie der Verursacher mit jenem Fehler umgegangen ist. Diesbezüglich bekleckert sich Intel derzeit noch nicht mit Ruhm, der eigentliche Lackmustest kommt allerdings später: Erstens ob Intel im Fall des Falles zugeben kann, dass auch mobile Raptor-Lake-Prozessoren betroffen sind – was dann relevant werden würde, wenn man keinen technischen Unterschied präsentieren kann, welcher jene Mobile-Modelle nachvollziehbar ausschließt. Und zweitens wie man die bereits degradierten, aber noch nicht instabilen Prozessoren behandelt bzw. ob man für jene entweder Garantieverlängerung oder freiwilligen RMA anbietet. An dieser Stelle könnte man derzeit verlorengehendes Vertrauen mittel- und langfristig vielleicht sogar wieder zurückgewinnen.

Nachtrag vom 29. Juli 2024

Zum Fall der Stabilitäts-Probleme von "Raptor Lake" muß hiermit noch auf ein potentieller Fehler in unserer eigenen Berichterstattung hingewiesen werden, welcher die Bandbreite der betroffenen Prozessoren-Modelle betrifft. Denn die bislang an dieser Stelle getätigte Aussage, dass allein das "Raptor Lake-Die" jene Probleme aufweist, könnte unter Umständen inkorrekt sein. Dies stellt eigentlich nur eine gut gemeinte Annahme auf Basis der vorliegenden Indizien dar, dass laut Intel weder die 12. Core-Generation (mit "Alder-Lake-Die") betroffen ist, noch von Prozessoren der 13. und 14. Core-Generation mit Weiterverwendung des Alder-Lake-Dies (Core i5-13500/13600, Core i5-14500, teilweise Core i5-13400/F & Core i5-1400F, zuzüglich die meisten Mobile-Modelle) irgendwelche beachtbaren Probleme berichtet wurden. Zudem besteht der hinreichende Verdacht, dass die Ursache des Problems im Raptor-Lake-Die selber liegt – in diesem Fall wäre alle bisherigen Aussagen zur Bandbreite der betroffenen Prozessoren-Modelle korrekt.

Aber: Rein technisch könnte das Problem auch nicht im Silizium selber liegen, sondern im Microcode bzw. den damit hergestellten Betriebsbedingungen bezüglich der Spannungsversorgung. Und hier ergibt sich die Restchance darauf, dass Intel bei den Prozessoren der 13. und 14. Core-Generation mit Alder-Lake-Unterbau unter Umständen den RPL-Microcode verwendet. Diese These hat nur eine kleine Chance, denn normalerweise würde man nicht die Betriebsbedingungen dies einen Prozessoren-Dies (Raptor Lake) ohne Not bei einem anderen Prozessoren-Die (Alder Lake) ansetzen. Dies betrifft schließlich nur die kleineren Prozessoren-Modelle, welche kaum jemals getestet werden und wo sich im Endeffekt auch niemand daran gestört hat, dass hierbei ein glattes Alder-Lake-Rebranding mit zumeist nur marginalem Performance-Sprung stattfand. Dass Intel in dieser Situation – wie gesagt ohne Not – den RPL-Microcode über diese Prozessoren mit ADL-Rebranding ausgeschüttet hat, ist wie gesagt unwahrscheinlich.

Leider ist es nicht unmöglich, was demzufolge alle bisher eigentlich als "sicher" gegenüber dem Degradierungs-Problem von Raptor Lake betrachteten Alder-Lake-basierten Modelle der 13. und 14. Core-Generation zumindest unter Beobachtung stellt. Selbst die Intel-Aussagen schließen diese Modelle wie gesagt nicht aus, für Intel ist derzeit alles von 13. und 14. Core-Generation potentiell betroffen. Besser wäre es natürlich, wenn Intel sich hierzu genauer erklären würde und beispielsweise alle Alder-Lake-basierten Prozessoren – egal von welcher Core-Generation – zweifelsfrei ausschließen kann. Bis dies so weit ist, wäre dieser Fall im Auge zu behalten. Benutzer der entsprechenden Prozessoren (13. & 14. Core-Generation mit ADL-Unterbau) sollen hiermit nicht in Panik versetzt werden, es handelt sich wie gesagt um eine Restchance und bislang waren diese Prozessoren bezüglich jener Problemlage wirklich nicht auffällig. Aber um der Korrektheit willen muß auf diese mögliche Fehleinschätzung zu den betroffenen Prozessoren hingewiesen werden.