News des 15. Juni 2022

Laut Twitterer Greymon55 soll AMD noch eine Navi-3X-basierte Lösung mit gleich 16'384 FP32-Einheiten in der Hinterhand haben – im übrigen exakt die (neue) Konfiguration der GeForce RTX 4090 als auch nahe der früheren Spezifikation des Navi-31-Chips vor der Navi-3X-Spezifikationsänderung (dort allerdings mit "nur" 15'360 FP32-Einheiten). Dabei soll es sich nicht um "Navi 31" handeln, welcher wie bekannt bei maximal 12'288 FP32-Einheiten endet, gleichfalls jedoch zweifelsfrei zur Navi-3X-Familie gehören – und damit nicht irgendwie um eine HPC-Abwandlung handeln. Ob diese große Navi-3X-Lösung derzeit überhaupt für Gaming-Bedürfnisse gedacht ist, bleibt offen – aber jene soll sich problemlos in eine Gaming-Lösung umwandeln lassen, was erneut auf einen Gaming-Grafikchip als Unterbau hinzeigt.

There seems to be 16384SP 8SE navi3x, but I don't know if it really exists or if it's a gaming card?
Quelle: Greymon55 @ Twitter am 15. Juni 2022

Note that it is not Navi31.
Quelle: Greymon55 @ Twitter am 15. Juni 2022

In fact, if the competition is fierce, it can be turned into a gaming card at any time.
Quelle: Greymon55 @ Twitter am 15. Juni 2022

maybe navi30?
Quelle: Greymon55 @ Twitter am 15. Juni 2022

Dieses Gerücht korrekt zu deuten, ist derzeit gar nicht so einfach, denn gemäß bekanntem Wissen hat AMD keinen Navi-3X-Grafikchip, welcher diesen Hardware-Ausbau ermöglichen würde. Denkbar sind daher nur zwei Auflösungen: Entweder ein weiterer, bislang unbekannter Grafikchip – vom Twitterer wurde hierzu ein hypothetischer "Navi 30" ins Spiel gebracht. Oder aber AMD aktiviert wieder das eigentlich geplante MCM-Konzept und fügt zwei GCDs zu einem Grafikchip zusammen. Denkbarerweise könnte man hierfür zwei Navi-32-GCDs mit jeweils 8192 FP32-Einheiten benutzen – zusammengefügt ergibt dies die genannten 16'384 FP32-Einheiten. Dies könnte sogar AMDs Königsweg sein, um nVidia in jedem Fall zu schlagen: Die MCM-Konstruktion ist schließlich lange vorher angedacht gewesen, die Grundlagen-Arbeit daran wurde sicherlich erledigt. Sofern Navi 31 mit 12'288 FP32-Einheiten also nicht ausreicht, könnte AMD doch noch MCM bringen und damit beliebig große Grafikchips bauen: 2x Navi 32 ergeben 16'384 FP32-Einheiten, 2x Navi 31 sogar 24'576 FP32-Einheiten.

Limitiert wird das ganze primär nur durch den dabei herauskommenden Stromverbrauch. Aber so lange AMD diesbezüglich weiterhin den prognostizierten Kurs hält, dass Navi 31 unterhalb von 400 Watt herauskommt, dürfte dies eine für das Enthusiasten-Segment handelbare Sache sein. Sicherlich kommt der Stromverbrauch von 2x Navi 32 dann oberhalb von 400 Watt heraus, aber die auf dieser Performance-Höhe stehenden nVidia-Lösungen dürften sogar klar mehr als das verbrauchen. Natürlich wird es sich so oder so um Prestige-Objekte handeln, die man nur auflegt, um nVidia vom Performance-Thron zu stoßen – aber auch das kann für AMD wichtig sein, um den Ruf als ewiger Zweitplazierter im Grafikkarten-Segment zu zerstören (was schließlich im CPU-Segment mit der Zen-Architektur gut funktioniert hat). Vor dieser hochfliegenden These steht jedoch sicherlich erst einmal eine Bestätigung dieses Gerüchts an.

	Navi 32	Navi 31	These: "Navi 30"
Hardware	4 SE, 32 WGP, 64 CU, 8192 FP32	6 SE, 48 WGP, 96 CU, 12'288 FP32	Gerücht: 8 SE, 64 WGP, 128 CU, 16'384 FP32
realisiert über	1x N32 GCD + multiple MCD	1x N31 GCD + multiple MCD	a) 1x N30 GCD + multiple MCD b) 2x N32 GCDs + multiple MCD
Perf.-Richtung	grob AD103 (84 SM)	knapp AD102 (144 SM)	oberhalb AD102
Anmerkung: alle Angaben zu noch nicht vorgestellter Hardware basieren auf Gerüchten & Annahmen

BenchLeaks @ Twitter weist auf ein paar Eintragungen des Apple M2 in der Geekbench-Datenbank hin: Die dabei aufgestellten Werte schwanken etwas zwischen 1874-1919 Singlethread-Punkten sowie 8791-8928 Multithread-Punkten, was im Vergleich zum M1-SoC dann folgende Vorteile ergibt: +9-12% mehr Singlethread-Performance sowie +18-19% mehr Multithread-Performance. Dies trifft Apple eigene Performance-Angabe von +18% mehr CPU-Power ziemlich gut. Bei der GPU-Leistung scheint der M2-SoC sogar besser wegzukommen als nach Apples Vorgabe (+35%): Die entsprechenden Geekbench-Werte von M1 gegenüber M2 ergeben sogar eine Differenz von +46%. Allerdings könnte Apple für seine eigene Performance-Angabe im GPU-Feld auch andere, für das GPU-Feld verlässlichere Benchmarks angesetzt haben. So oder so ist das ganze für einen Refresh ohne neue Fertigungstechnologie eine beachtbare Leistung, da hat man im PC-Feld bereits deutlich schwächere Refresh-Lösungen gesehen.

	Apple M1	Apple M2	Apple M1 Pro	Apple M1 Max	Apple M1 Ulltra
Chipfertigung	5nm TSMC	5nm TSMC	5nm TSMC	5nm TSMC	5nm TSMC
Chipgröße	120,5mm²	~145mm²	~245mm²	~429mm²	2x ~429mm²
Transistoren	16 Milliarden	20 Milliarden	33,7 Milliarden	57 Milliarden	114 Milliarden
CPU-Kerne	4 Performance + 4 Effizienz	4 Performance + 4 Effizienz	8 Performance + 2 Effizienz	8 Performance + 2 Effizienz	16 Performance + 4 Effizienz
GPU-Kerne	8 (2,6 TFlops)	10 (3,6 TFlops)	16 (5,2 TFlops)	32 (10,4 TFlops)	64 (20,8 TFlops)
Interface	128 Bit LPDDR4X/4266 (68 GB/s)	128 Bit LPDDR5/6400 (102 GB/s)	256 Bit LPDDR5/6400 (205 GB/s)	512 Bit LPDDR5/6400 (410 GB/s)	1024 Bit LPDDR5/6400 (820 GB/s)
Geekbench 5	1720 / 7474	1919 / 8928	1742 / 12145	1755 / 12332	1755 / 23366
Anmerkungen: Angaben zur Chipfläche von M1 Pro/Max/Ultra gemäß Locuza @ Twitter, M1 Geekbench-Werte von Geekbench, M2 Geekbench-Werte von Geekbench