21

News des 21. März 2024

WCCF Tech berichten über einen "AI PC Summit" in Peking, auf welchem AMD die "Strix Point" APU als nächste APU-Generation von AMD erstmals offiziell erwähnt hat. Auch der technische Unterbau wurde mit CPU-seitig "Zen 5" sowie GPU-seitig "RDNA3+" (was auf "RDNA3.5" hinausläuft) entsprechend genannt, beides passend zu den vorherigen Gerüchten. Interessant sind kleine Differenzen bei der Termingebung: Eine AMD-Folie spricht zu "Strix Point" von "Shipping 2024", eine andere hingegen nur von "Launching 2024". Letztgenannte Formulierung läßt immer die Möglichkeit offen, dass die eigentliche Auslieferungen dann erst später erfolgt, in diesem Fall im Jahr 2025. Der bisher vermutete "Sommer/Herbst"-Termin war somit wohl zu optimistisch, bestenfalls gibt es für "Strix Point" einen Jahresendstart. Zudem wird AMDs nachfolgende Big-APU "Strix Halo" somit sicher erst ein Thema des Jahres 2025 werden.

Laut einer der Industriequellen von Moore's Law Is Dead ist die "Blackwell" nachfolgende nächste nVidia-Generation "Rubin" zum einen ziemlich zeitig bereits zur Jahresmitte 2025 zu erwarten – und soll zudem wohl HPC/AI-only sein, ähnlich der "Hopper"-Generation. Der zeitige Termin würde zu nVidia-Planungen passen, die eigene Roadmap zu straffen – wobei allerdings weiterhin nicht sicher ist, ob damit wirklich eine neue Chip-Generation pro Jahr gemeint ist, oder ob nicht auch eine neue Produkt-Generation pro Jahr dazu passt (was nVidia derzeit realisiert). Angesichts der von nVidia genannten Blackwell-Entwicklungskosten in Höhe von 10 Mrd. Dollar erscheint es als nicht besonders wahrscheinlich, dass man diese Entwicklung so einfach beschleunigen kann. Zumindest möglich ist dies dennoch, der aktuelle KI-Hype kann alle Vorbehalte hinwegwischen, gerade wenn nVidia derzeit so gut im Schaufel-Geschäft verdient.

Vera Rubin is launching by mid-2025, and were even hopping to get it out earlier than that if possible. However, do note that Rubin looks like a generation that is analogous to Hopper. It's not meant for gaming, its meant to bury the competition so deep that they don't have any oxygen left to compete in Al for years...
Quelle:  Industrie-Quelle gegenüber Moore's Law Is Dead @ YouTube, veröffentlicht am 21. März 2024

Unabhängig des tatsächlichen Termins für die "Rubin"-Architektur dürfte die Nebenaussage wohl zutreffen, dass "Rubin" nichts für Consumer-Hardware bieten wird. Es ist sowieso unklar, wieso nVidia nach der einmal erfolgten Auftrennung zwischen HPC- und Consumer-Architektur bei "Hopper" und "Ada Lovelace" nachfolgend mit der "Blackwell"-Generation wieder einen gleichen Codenamen für wahrscheinlich sehr unterschiedliche Chip-Architekturen (mit zudem gänzlich abweichender Aufgabenlage) benutzen musste. Die "Gaming-Blackwell" nachfolgende Consumer-Architektur dürfte somit anzunehmenderweise auf einen anderen Codenamen als "Rubin" hören und aller Wahrscheinlichkeit auch wieder grob zwei Jahre später antreten. Im Consumer-Segment hetzt nVidia niemand bzw. ergeben sich die großen Verbesserungen regelmäßig erst dann, wenn (im 2-Jahres-Abstand) ein neuer Fullnode in der Chipfertigung zur Verfügung steht.

Laut Twitterer MEGAsizeGPU wird es GeForce RTX 4060, 4060 Ti & 4070 zukünftig auch noch mit einem weiteren Chip-Unterbau auf Basis des jeweils nächstgrößeren Ada-Lovelace-Chips geben. Die GeForce RTX 4060 wird somit auch den AD106-Chip benutzen, die GeForce RTX 4060 Ti auch den AD104-Chip sowie die GeForce RTX 4070 auch den AD103-Chip. An den jeweils freigeschalteten Hardware-Einheiten und der angesetzten TDP soll sich gar nichts ändern, demzufolge dürfte auch die Performance 1:1 gleich zu den originalen Varianten dieser Grafikkarten sein. Mittels der größeren Chips werden natürlich dann auch jeweils mehr Silizium-Fläche bzw. Ausführungseinheiten deaktiviert. Zweckmäßig ist dies dafür, um nur teilfunktionierende Chips doch noch absetzen zu können, anstatt jene als Abfall abschreiben zu müssen.

bisheriger Chip zukünftiger (weiterer) Chip
GeForce RTX 4070 AD104-250 AD103-175
GeForce RTX 4060 Ti 16GB AD106-351 AD104-150
GeForce RTX 4060 Ti 8GB AD106-350 unsicher
GeForce RTX 4060 AD107-400 AD106-255
basierend auf den Augaben von MEGAsizeGPU @ Twitter

Ein gutes Beispiel hierfür gibt der AD103-Chip bei der GeForce RTX 4070 ab: Jener Grafikchip liefert maximal 80 Shader-Cluster an einem 256-Bit-Speicherinterface samt 64 MB Level2-Cache. Für die GeForce RTX 4070 werden davon nur 46 Shader-Cluster samt eines 192-Bit-Speicherinterfaces sowie 36 MB Level2-Cache benötigt, womit für diese Grafikkarte immerhin grob ein Drittel des Chips deaktiviert werden. Mittels der Benutzung des AD103-Chips für die GeForce RTX 4070 können sicherlich so einige gefertigte AD103-Exemplare vor der Halde gerettet werden, welche beispielsweise zu viele Fertigungsfehler in den Ausführungseinheiten oder im Speicherinterface aufweisen. Die fehlerhaften Chip-Stellen werden dabei deaktiviert, die freigeschaltete Hardware ist dann natürlich komplett fehlerfrei. Letztlich handelt es sich um eine Maßnahme, um die Ausbeute in der Chipfertigung (weiter) zu steigern. Ein Nachteil für den Konsumenten ergibt sich üblicherweise nicht.