30

News des 30. Mai 2024

Laut dem bekannten Leaker 'Panzerlied' im Chiphell-Forum (via VideoCardz) tritt die GeForce RTX 5090 nicht mit dem vollen 512-Bit-Speicherinterfaces des zugrundeliegenden GB202-Chips an – sondern "nur" mit einem 448 Bit breiten Speicherinterface. Jenes ist somit aber dennoch breiter als bei GeForce RTX 3090, 3090 Ti & 4090 zuvor und ergibt auch automatisch eine etwas höhere Speicherbestückung von 28 GB GDDR7-Speicher. Inwiefern dies die Möglichkeit zu einer späteren GeForce RTX 5090 Ti/Super oder auch "Titan Blackwell" offenläßt, kann man spekulieren, ist allerdings auch nicht wirklich von der Breite des Speicherinterfaces abhängig. Auch bei der GeForce RTX 4090 hatte und hat nVidia diese Möglichkeit, auch ohne dass dort ein teildeaktiviertes Speicherinterface existieren würde.

Es ist 512 Bit, aber 5090 ist 448 Bit.
Quelle:  Panzerlied @ Chiphell-Forum am 30. Mai 2024, maschinell übersetzt ins Deutsche

Vielmehr reicht es, einfach einen Teil der Shader-Einheiten für das Erstlingswerk zu deaktivieren – was man aus Gründen der Produktionsausbeute sowieso machen würde. Ergo ändert sich durch diesen Umstand nichts an der Chance auf schnellere GB202-basierte Grafikkarten als eben die GeForce RTX 5090, diese Chance bleibt identisch hoch (bzw. niedrig). Denkbarerweise plant nVidia viel eher die Nutzung des vollen GB202-Speicherinterfaces bei seinen kommenden Profi-Modellen der früher als "Quadro" titulieren Serien. Dabei geht es sogar weniger um die Interface-Breite, als vielmehr um die damit möglichen, noch höheren Speichergrößen – welche im Profi-Bereich heutzutage gern (auch zugunsten der Arbeit mit LLMs) entgegengenommen werden. Mittels der bisherigen 384-Bit-Interfaces ist nVidia derzeit üblicherweise auf 48 GB Speicher limitiert, mit einem 512-Bit-Interface könnten die kommenden Profi-Karten dann gleich auf 64 GB gehen.

Zu beachten wäre, dass zu "Gaming-Blackwell" zwar recht solide Chip-Daten vorliegen – aber bislang kaum Karten-Daten, das (angebliche) Speicherinterface der GeForce RTX 5090 ist faktisch die erste griffige Information hierzu. Die konkreten Karten werden zwar aus den vorliegenden Chips geformt, dabei aber zumeist gewisse Abspeckungen angesetzt: Die größte nVidia-Karte erhält in aller Regel ein gutes Stück Luft nach oben, wie bei der GeForce RTX 4090 mit 128 freigeschalteten von 144 physikalisch vorhandenen Shader-Clustern. Aber auch bei den kleineren Chips wird inzwischen selten umgehend der Vollausbau angesetzt, auch hier gelten wiederum Fertigungsausbeute-Gründe. Aus den Chips kann man daher nur sehr ungenau auf die Hardware von konkreten Karten kalkulieren, dies bleibt deren exakte Gestaltung abzuwarten. Selbige kann durchaus bis wenige Wochen vor Release andauern (und sich somit jederzeit verändern), während die Chip-Daten mit dem Tape-Out feststehend sind. Dieser Punkt geht in der webweiten Berichterstattung oftmals unter, da werden Chip- und Kartendaten gern wild miteinander vermischt.

Raster-Engines Shader-Cluster Speicherinterface max. Speicher Ada-Vorgänger SM vs Vorg.
GB202 angbl. 12 angbl. 192 angbl. 512 Bit 32 GB AD102: 12 GPC, 144 SM, 384 Bit, 24 GB GDDR6X +33%
GB203 angbl. 6 angbl. 96 angbl. 256 Bit 16 GB AD103: 7 GPC, 80 SM, 256 Bit, 16 GB GDDR6X +20%
GB205 whrschl. 4 whrschl. 64 angbl. 192 Bit 12 GB AD104: 5 GPC, 60 SM, 192 Bit, 12 GB GDDR6X +7%
GB206 whrschl. 3 möglw. 42 oder 48 whrschl. 128 Bit 8/16 GB AD106: 3 GPC, 36 SM, 128 Bit, 8 GB GDDR6 +17/33%
GB207 whrschl. 2 möglw. 28 oder 32 96 oder 128 Bit 6-16 GB AD107: 3 GPC, 24 SM, 128 Bit, 8 GB GDDR6 +17/33%
Hinweis: Angaben zu noch nicht offiziell vorgestellter Hardware basieren auf Gerüchten & Annahmen ... "max. Speicher" bezogen auf 2GByte-Chips

Twitterer Coreteks beschäftigt sich mit einer angeblichen AMD-Präsentationsfolie zur "Radeon RX 8800 XTX" – und weist jene als (höchstwahrscheinlich) "gefälscht" zurück. Dies läßt sich wohl schon aus handwerklichen Fehlern der Fälscher erkennen – am deutlichsten beim fehlenden "TM" für alle Markennamen. Aber auch inhaltlich kann es sich fast nur um eine Fälschung handeln, denn unter Raster-Rendering sollte das RDNA4-Topmodell nicht gleich eine Radeon RX 7900 XTX überflügeln können, selbst nicht "nur" um +20% unter einem einzelnen Benchmark. Dafür steckt einfach zu wenig Hardware im Navi-48-Chip. Genauso sind unter RayTracing nicht gleich +70-90% auf die Radeon RX 7900 XTX zu erwarten: RDNA4 wird eine relativ bessere RayTracing-Performance bieten, muß diese jedoch auch nutzen, um den absoluten Nachteil gegenüber Navi 31 erst einmal wettzumachen. Selbst inhaltlich versprich diese gefälschte Folie also viel mehr als realistisch zu erwarten wäre, die angezeigte RayTracing-Performance ergäbe (mit der Radeon RX 8800 XTX) ca. 90% des Niveaus der GeForce RTX 4090.

Twitterer 'HXL' zeigt in zwei Tweets – No.1 & No.2 – eine Reihe von Intel-Folien zur Architektur von "Skymont", sprich der Effizienz-Kerne von "Lunar Lake" &"Arrow Lake". Jene stammen wohl aus einem (eigentlich unter NDA stattfindenden) Vorab-Briefing seitens Intel, sind leider derzeit nur per schlechten Screenshots verfügbar, da das ursprüngliche Postings bei Weibo inzwischen gelöscht wurde. Dennoch haben sich gewisse Informationen identifizieren lassen, welche seitens Chips and Cheese umgehend aufgearbeitet und vor allem mit vorherigen E-Kernen von Intel verglichen wurden. In der Summe macht Intel seine E-Kerne mit "Skymont" mittels verdoppelter ALU- und FP-Einheiten sowie breiteren Dekodern deutlich stärker, dies soll in einem IPC-Gewinn von immerhin 38-68% resultieren. Intels E-Kerne würden somit stärker Performance-wirksam werden – was aus energetischer Sicht erklärt, wieso Intel zumindest für dieses Jahr nicht mit mehr CPU-Kernen plant.

Fertigung CPU-Architekturen max. Kerne iGPU Sockel Ausrichtung Release
Alder Lake Intel 7 Golden Cove + Gracemont 8P+8E/24T Xe LGA1700 Desktop & Mobile 4. Nov. 2021
Raptor Lake Intel 7 Raptor Cove + Gracemont 8P+16E/32T Xe LGA1700 Desktop & Mobile (tlw. mit ADL-Dies) 20. Okt. 2022
Raptor Lake Refresh Intel 7 Raptor Cove + Gracemont 8P+16E/32T Xe LGA1700 Desktop & HX-Mobile (tlw. mit ADL-Dies) 17. Okt. 2023
Meteor Lake Intel 4 Redwood Cove + Crestmont 6P+8E+2LP/22T Xe LGA1851 rein Mobile (kein HX) 14. Dez. 2023
Lunar Lake TSMC N3B Lion Cove + Skymont 4P+4E/8T Xe2 rein UltraMobile Q3/2024
Arrow Lake 20A + N3B Lion Cove + Skymont 8P+16E/24T Xe LGA1851 Desktop & Mobile Ende 2024
Arrow Lake Refresh 20A + N3B Lion Cove + Skymont 8P+32E/40T ? LGA1851 Desktop & Mobile H2/2025
Panther Lake Intel 18A Cougar Cove + Darkmont 4P+8E+4LP Xe3 ? rein Mobile (kein HX) Q4/25-Q1/26
Nova Lake 14/16A + N2P ? + Arctic Wolf 16P+32E+4LP ? ? Desktop & Mobile Q4/26-Q1/27
Hinweis: Angaben zu noch nicht offiziell vorgestellter Hardware basieren auf Gerüchten & Annahmen: Fertigung bezogen jeweils nur auf die CPU- & GPU-Tiles

Bei einem Erfolg dieses Vorhabens könnte Intel eine neue Chance bekommen, seine E-Kerne besser gegenüber den Anwendern zu positionieren – welche derzeit in der Mehrzahl eher wenig Nutzen hierin sehen und sich lieber mehr (oder exklusiv) P-Kerne wünschen. Andererseits werden diese E-Kerne von "Skymont" somit zwangsläufig auch wieder dicker werden – und gleichzeitig muß seitens Intel wieder viel Arbeit in diese doppelte Architektur-Entwicklung gesteckt werden. AMDs Ansatz mit den Dense-Kernen erscheint da doch eleganter, denn der Vorteil des Flächengewinns wird hier genauso erzielt, dies aber im Rahmen derselben CPU-Architektur und somit ohne die Nachteile von zwei unterschiedlichen x86-Kernen im selben Prozessor. Zudem darf etwas in Frage gestellt werden, inwiefern Intel so etwas wie E-Kerne in mittelfristiger Zukunft noch benötigt, wenn einiges Tages das Projekt der "Rentable Units" verwirklicht wäre und jenes tatsächlich eine Möglichkeit zum flexiblen Zusammenfassen/Auftrennen mehrerer CPU-Kerne mit sich bringen würde.

Heise berichten von Aussagen der Marktforscher von Gartner, welche den (schnellen) Durchbruch des KI-PCs prophezeien. So sollen jene Geräte dieses Jahr schon ein Fünftel aller PC-Absätze ausmachen, und Ende 2026 die Marke von 100% bei betrieblich gekauften PCs erreichen. Ob dies so kommt und ob dies überhaupt etwas zum KI-PC aussagt, darf allerdings bezweifelt werden. Denn erstens einmal sagt der reine Geräte-Kauf nichts zur Nutzung aus: In absehbarer Zukunft wird ein Großteil aller verkauften PCs eine entsprechende NPU mitbringen und darf sich damit KI-PC nennen – was nicht bedeutet, dass die PC-Käufer dies wünschen oder nutzen würden. Die meisten NPUs werden halt nur als (kleiner) Teil eines SoCs kreiert, sind also technisch immer mit dabei und natürlich wird der PC-Hersteller nicht durch bewußte NPU-Deaktivierung auf den Werbewert dieses Features verzichten wollen.

Doch wenn das gesamte PC-Angebot nur noch aus KI-PCs besteht, besteht auch der Absatz nur noch daraus – was wie gesagt nicht bedeutet, dass diese Funktion tatsächlich genutzt würde. Hierzu gibt es beachtbar klare Aussagen der Anwender: Nur eine Minderheit will sich die "Recall"-Funktion überhaupt ansehen, die große Mehrheit sucht nach Auswegen, davon wegzukommen. Die Stimmenverhältnisse sind dabei derart eindeutig, dass Microsoft hier wenigstens eine verlängerte Anlaufphase einplanen muß, um die Feature-Nutzung durchzusetzen. Denkbarerweise kann dies auf dem Massenmarkt einfacher sein, wenn Otto Normalsufer den neuen PC mit aktivem Copilot+ kauft und dann einfach loslegt. Doch das passive Anlegen von Snapshots ist nicht wirklich eine aktive Nutzung von Recall, selbst wenn Microsoft natürlich lieber mit ersterer Zahl prahlen sollte.

Gänzlich daneben liegen könnten die Analysten beim Thema betrieblich genutzter PCs: Sicherlich gibt es einige Aufgaben für KIs im betrieblichen Umfeld, allerdings auch die große ungeklärte Frage, wie man die Erfassung geheimzuhaltender Daten durch die Snapshot-Funktion von Recall verhindern kann. Normalerweise würde so etwas Jahre der Evaluierung bedingen, der direkte Sprung ins kalte Wasser könnte hingegen Existenz-gefährdent sein, wenn sich Hacker an diesen aufgezeichneten Daten zu schaffen machen oder aber die Datenschutzbehörden mal drüber schauen. Gerade bei Firmen und Behörden ist daher eher zu erwarten, dass jene die KI-PCs nur kaufen, um nachfolgend diese Funktionalität direkt auszuschalten. Und so kann es locker und leicht passieren, dass schon im Jahr 2026 der KI-PC eine Marktdurchdringung von 70-90% hat – und dennoch nur eine Minderheit diese Funktionalität tatsächlich nutzt.