12

News des 11./12. Mai 2024

Gemäß YouTuber Moore's Law Is Dead soll die GeForce RTX 5080 bewußt als erstes RTX50-Modell und bewußt mit GB203-Unterbau kommen, damit jene in jedem Fall unter der nominellen Rechenleistungs-Spezifikation der GeForce RTX 4090D liegt – und somit in China weiterhin verkaufbar ist. Die Release-Reihenfolge hat damit zwar weniger etwas zu tun, aber der Punkt der bewußt (vergleichsweise) niedrig gehaltenen Rechenleistung hat in der Tat etwas für sich. Sofern sich das US-Sanktionsregime gegenüber China nicht gerade mit der Zeit vorwärts bewegt (respektive die Rechenleistungsschranken in Zukunft höher ansetzt), muß nVidia zwar irgendwann sowieso in den faulen Apfel beißen, und kann in China nur noch Mainstream- und Midrange-Ware ausliefern. Aber zumindest für die kommende "Blackwell"-Generation läßt sich dies durchaus noch verhindern, indem man einfach die GeForce RTX 5080 nicht besonders stark ansetzt.

"Gaming-Blackwell" Portfolio These #1 Portfolio These #2
(denkbare)
Gfx-Gestaltungen
GeForce RTX 5090
GB202, ~150-170 SM @ 384-bit, 24GB
 
GeForce RTX 5080
GB203, 92 SM @ 256-bit, 16GB
 
GeForce RTX 5070 Ti
GB203, 72-80 SM @ 256-bit, 16GB
 
GeForce RTX 5070
GB205, 60 SM @ 192-bit, 12GB
GeForce RTX 5090
GB202, ~170-180 SM @ 384-bit, 24GB
 
GeForce RTX 5080
GB202, ~110-130 SM @ 320-bit, 20GB
 
GeForce RTX 5070 Ti
GB203, 88-92 SM @ 256-bit, 16GB
 
GeForce RTX 5070
GB203, 72-76 SM @ 192/256-bit, 12/16GB
Vor- & Nachteile GB202 wird nicht ganz ausgefahren, (zu) großer Abstand zwischen 5090 & 5080, keine Entwicklung der VRAM-Menge, günstiger für nVidia GB202 kann ausgefahren werden, sinnvoller Abstand zwischen 5090 & 5080, Vorwärts-Entwicklung bei der VRAM-Menge, teurer für nVidia
Anmerkung: reine Spekulationen zum Aufbau des GeForce RTX 50 Portfolio

In der Praxis bedeutet dies den Verzicht auf den GB202-Chip für die GeForce RTX 5080, da man für diese Karte kaum auf über 100 Shader-Cluster gehen kann – schließlich muß man auch noch einen gewissen Taktraten-Boost bei "Blackwell" einrechnen. Damit wäre von den vorstehend skizzierten Portfolio-Thesen die #2 somit mehr oder weniger aus dem Rennen. Eine Zwischenlösung zwischen GeForce RTX 5080 & 5090 wäre aber dennoch in Form einer späteren "GeForce RTX 5080 Ti" oder "GeForce RTX 5080 Super" realisierbar, jene könnte dann eine starke Abspeckung des GB202-Chips bieten und in den großen Zwischenraum zwischen GeForce RTX 5080 & 5090 gehen. Natürlich muß diese Auslegung (samt Herleitung durch MLID) dennoch nicht korrekt sein: Schließlich könnte man in China auch eine "GeForce RTX 5070 Ti" anbieten, welche gemäß These #2 ebenfalls nahe dem GB203-Vollausbau liegt. Die Differenz besteht weniger in der maximal lieferbaren Technik (wird durch die Sanktionen gedeckelt), sondern eigentlich nur im Verkaufsnamen: Ein HighEnd-Verkaufsname für China – oder nur ein besserer Midrange-Verkaufsname?

Viel zitiert werden derzeit die Aussagen des bekannten Leaker 'wjm47196' im Chiphell-Forum. Jener schätzt die Performance der kommenden RDNA4-Generation als im besten Fall auf dem Niveau der Radeon RX 7900 XT liegend ein. Zuzüglich soll allerdings die RayTracing-Performance von RDNA4 verbessert worden sein, ergo sollte es auf diesem Teilsegment auch über das Niveau der Radeon RX 7900 XT hinausgehen. Grundsätzlich soll RDNA4 eher denn ein Bugfix für RDNA3 sein, sprich keine große Entwicklungs-Stufe der Grafikchip-Architekturen. Dies soll dann der nachfolgenden RDNA5-Architektur vorbehalten sein, für welche nichts geringeres als ein von Grund auf neues Design, ähnlich wie "Zen" im CPU-Bereich, versprochen wird. Denkbarerweise ist diese Aussage leicht übertrieben, denn der große Wurf wird nun regelmäßig versprochen, gerade bei AMDs Grafikchip-Architekturen.

RDNA5 wird ein von Grund auf neues Design sein, welches der Zen-Serie ähnelt (eventuell sogar mit neuem Namen? – nicht wirklich sicher). Daher war es notwendig, RDNA4 loszulassen, um Fallstudien sowie Forschung und Entwicklung vollständig durchführen zu können. Bei RDNA4 handelt es sich nur um eine Fehlerbehebung für RDNA3. Daher ist die Performance weiterhin wie zu erwarten, im besten Fall wird die 7900XT erreicht. Allerdings gibt es dennoch Verbesserungen beim Ray-Tracing.
Quelle:  wjm47196 @ Chiphell-Forum am 8. Mai 2024, maschinell übersetzt ins Deutsche (mit eigenen Ausbesserungen)

Aber natürlich ist da durchaus etwas dran, wenn es AMD endlich gelingt, den mit RDNA4 eigentlich geplanten MultiChip-Ansatz bei RDNA5 tatsächlich zu realisieren. Das "von Grund auf neue Design" würde dann allerdings nur die Chiplet-Konstruktion selber betreffen, nicht zwingend die eigentliche Grafikchip-Architektur. Doch auch in der Frage der reinen (internen) Grafikchip-Architektur kann (und sollte) AMD durchaus nachlegen – was RDNA5 möglicherweise bietet, aber sicher ist dies nicht. Normalerweise versucht man auch nicht, alle denkbaren Entwicklungsschritte gleichzeitig zu gehen, sondern realisiert dies eher denn scheibchenweise. Somit ist gemäß dieser Aussage überhaupt nicht sicher, ob RDNA5 nunmehr einen wirklich großen Architektur-Sprung bringt. Gerade der hierbei angesprochene "Zen-Moment" könnte sich auch schlicht nur auf die Aufteilung in einzelne Chiplets beziehen, so wie es bei AMD im Prozessoren-Bereich seit Zen 2 usus ist.

Twitterer Michael hat in der Programmierschnittstelle "oneAPI" Einträge zum Battlemage-Chip "BMG-G21" entdeckt – welche somit, da entsprechende Einträge zu "BMG-G10" bislang fehlen, auf einen früheren Start von "G21" hindeuten würden. Wirklich sicher ist diese Auslegung natürlich nicht, aber letztlich sah auch bei den Alchemist-Chips ACM-G10 & ACM-G12 die Release-Reihenfolge den kleineren Chip vor dem größeren Chip herauskommend. Im Fall der Battlemage-Generation war zwar zweifelos der größere G10-Chip vor dem kleineren G21-Chip geplant, allerdings ist von eben jenem größeren Chip "BMG-G10" zuletzt auch nichts mehr zu hören gewesen. Da dessen Validierungs-Phase bereits seit mindestens August 2023 läuft, deutet dies somit eher auf Probleme mit "BMG-G10" hin – in deren Folge "BMG-G21" terminlich so weit aufgeholt haben könnte, dass der kleinere Chip nunmehr sogar vor dem größeren Chip durchs Ziel laufen würde.

Intel added G21 Battlemage to oneAPI, it might suggest they will release G21 first
Quelle:  Michael @ Twitter am 12. Mai 2024