19

Hardware- und Nachrichten-Links des 18./19. Dezember 2021

Twitterer Greymon55 gibt mal wieder eine Wasserstandsmeldung zu den Spezifikationen von Navi 3X ab – wobei leider echte Informationen und Annahmen etwas vermischt sind. Zumindest gibt ein nachfolgender Tweet den Hinweis darauf, dass die hierbei getroffenen Angaben zum Infinity Cache sowie zum VRAM-Ausbau eigene Annahmen seitens des Twitterers darstellen. Dies läßt also noch etwas Spielraum – welcher insbesondere für Navi 33 als notwendig erscheint. Denn während Navi 31 & 32 zu den bereits seit einigen Monaten bekannten Hardware-Daten vermeldet werden, wird zu Navi 33 eine vergleichsweise schwache Hardware mit nur 4096 FP32-Einheiten an einem 128-Bit-Speicherinterface samt 64 MB Infinity Cache mit nur 8 GB Grafikkartenspeicher notiert.

Navi 31 Navi 32 Navi 33
MCM/monolithisch MCM MCM monolithisch
Angaben von Greymon55 ~60WGP
~16GB 256bit GDDR6
~256M 3D IFC
~2.5GHz
~40WGP
~12GB 192bit GDDR6
~192M 3D IFC
~2.6~2.8GHz
~16WGP
~8GB 128bit GDDR6
~64M IFC
~2.8~3.0GHz
resultierende FP32-Power 15'360 FP32-Einheiten
77 TFlops
10'240 FP32-Einheiten
53-57 TFlops
4'096 FP32-Einheiten
23-25 TFlops
effektives Interface ? ? FullHD:  ~328 Bit
WQHD:  ~305 Bit
4K:  ~215 Bit
bisherige Perf-Prognose 2,5-2,7fach von Navi 21 ? Navi 21 und etwas mehr
Angaben zu noch nicht veröffentlicher Hardware basieren auf Gerüchten & Annahmen

Und dies kann man durchaus diskutieren, denn Navi 33 soll laut übereinstimmenden Informationen die Performance-Klasse von Navi 21 erreichen – was mit diesen Hardware-Daten zumindest schwierig erscheint. Zwar kann die geringere Anzahl an FP32-Einheiten über den Mehrtakt gut ausgeglichen werden (FP32-Power der Radeon RX 6900 XT auf "Boost Clock" = 23 TFlops), doch bei der Speicherbandbreite hängt Navi 33 weit zurück, da Navi 33 in dieser Frage gegenüber Navi 21 sowohl bezüglich Interface-Breite als auch dem Infinity Cache glatt halbiert wurde. Bei der effektiven Bandbreite (auf angenommen gleicher Speichertaktung) liegt Navi 33 (FullHD ~328 Bit, WQHD ~305 Bit) somit weit unterhalb des Niveaus von Navi 22 (FullHD ~872 Bit, WQHD ~619 Bit), sprich selbst bei Konzentration auf kleinere Auflösungen wird dies ein schwieriges Unterfangen. Dennoch ist dies vielleicht nicht gänzlich unmöglich, immerhin sind die eigentlichen Architektur-Verbesserungen der RDNA3-Generation derzeit kaum bekannt.

Nur an der Grafikkartenspeicher-Menge muß AMD noch arbeiten, denn mit nur 8 GB VRAM erscheint eine neue Grafikkarte im Leistungspotential der Radeon RX 6900 XT für das Jahr 2023 als arg unpassend. Mag sein, dass die ursprüngliche Planung vielleicht derart aussah, aber wegen der jüngsten Entwicklungen beim VRAM-Bedarf – siehe den Fall von Halo Infinite – muß AMD an dieser Stelle aufstocken. Sofern man keine 1,5GByte-Speicherchips heranorganisieren kann, bliebe dann nur die glatte Verdopplung auf 16 GB Speicher – was dann allerdings auch Speicherverdopplungen bei Navi 32 & 31 nach sich ziehen würde. Zum Glück ist dieser Punkt der Speichermenge wie gesagt zum einen nicht feststehend und zudem generell auch kurzfristig noch änderbar. Insofern kann man durchaus darauf setzen, dass AMD im Sommer 2022 – wenn die reale Produktgestaltung zu Navi-33-Grafikkarten ansteht – die gleichen Gedankengänge hat und nachfolgend auf eine sinnvolle wie verkaufbare Speichermenge setzt.

Beim chinesischen Zhihu (maschinelle Übersetzung ins Deutsche) gibt es klarere Hardware-Daten zu den drei neuen Einsteiger-Mobilelösungen von nVidia samt auch ersten TimeSpy-Werten. Danach unterscheiden sich GeForce RTX 2050 Laptop und GeForce MX570 allein bei der Speichermenge, ansonsten gibt es dieselben 16 Ampere-basierten Shader-Cluster an einem 64bittigen Speicherinterface. Wegen der identischen Rohpower soll dann auch das TimeSpy-Ergebnis identisch ausfallen – was im realen Spieleeinsatz natürlich anders aussehen wird. Die GeForce MX550 verfügt hingegen über 16 Turing-basierte Shader-Clustern an einem 64bittigen Speicherinterface – womit sich gegenüber der MX570 der interessante Vergleich zwischen Turing und Ampere auf selber Anzahl an Shader-Clustern sowie selbem Speicherinterface ergibt.

Hardware TGP-Spielraum TimeSpy (GPU)
GeForce RTX 2050 Laptop Ampere GA107, 16 SM (2048 FP32) @ 64 Bit, 4 GB GDDR6 20-45W 3369 @ 35W TGP
GeForce MX570 Ampere GA107, 16 SM (2048 FP32) @ 64 Bit, 2 GB GDDR6 20-45W
GeForce MX550 Turing TU117, 16 SM (1024 FP32) @ 64 Bit, 2 GB GDDR6 20-45W 2510 @ 35W TGP
TimeSpy-Werte gemäß Zhihu

Jenen Vergleich entscheidet die Ampere-Lösung mit +34% für sich – was eine weitere Bestätigung des Shader-Cluster-normierten Performance-Sprungs zwischen Turing und Ampere darstellt, frühere Vergleiche hatten bereits Werte zwischen 30-35% erbracht. Im Fall von GeForce MX550 zu MX570 wurde jener Vergleich zudem sogar auf derselben TGP von 35 Watt erbracht, sprich auch noch Stromverbrauchs-neutral. Wie üblich im Mobile-Feld, können diese Mobile-Lösungen jedoch mit sehr unterschiedlichen Verbrauchswerten antreten, von 20 Watt bis 45 Watt soll alles zulässig sein und liegt dann in der Entscheidung des Notebook-Herstellers. Da diese Mobile-Lösungen auf niedrigen Watt-Bereichen üblicherweise sehr gut skalieren, lassen sich somit mit derselben Mobile-Lösung deutlich voneinander abweichende Performance-Punkte besetzen. Bei sehr niedriger TGP kann dies auch in die Leistungsklasse von guter integrierter Grafik gehen: Eine Iris Xe mit 96 EU und viel Prozessoren-TDP kann immerhin schon 1700-2000 Punkte im TimeSpy erreichen.

WCCF Tech berichten über fernöstliche Benchmark-Werte unter CPU-Z und Cinebench zu Core i3-12100 & -12300, den kommenden Vierkern-Modellen von Alder Lake. Der zugrundliegende chinesischsprachige Test bei Bilibili (maschinelle Übersetzung ins Deutsche) zeigt noch mehr Benchmarks, jene allerdings vorwiegend aus dem Spiele-Bereich unter schwer zu wertenden Bedingungen. Bei den gut vergleichbaren theoretischen Testern zur Anwendungs-Performance ergeben sich für Alder Lake (wieder einmal) exzellente Singlethread-Werte zu durchaus ansprechenden Multithread-Werten. Allerdings reicht der Performance-Boost durch die Alder-Lake-Architektur nicht aus, um im Multithread-Bereich mit diesen Vierkernern die bisher aktuellen Sechskerner zu schlagen: Der Core i5-11400 wird zwar im Cinebench erreicht, unter CPU-Z liegt jener jedoch weiterhin vorn – genauso wie der Ryzen 5 5600X durchgehend vorn liegt.

Hardware CPU-Z/ST CPU-Z/MT CB20/ST CB20/MT
Core i3-12300 ADL, 4C+0c/8T, ?/4.4 GHz 702,5 3482,4 665 3318
Core i3-12100 ADL, 4C+0c/8T, 3.3/4.3 GHz 687,5 3407,9 649 3248
Core i5-11400 RKL, 6C/12T, 2.6/4.4 GHz 566 4249 535 3227
Core i3-10100 CML, 4C/8T, 3.6/4.3 GHz 461 2414 400 1887
Ryzen 5 5600X Zen 3, 6C/12T, 3.7/4.6 GHz 624 4811 601 4390
Ryzen 3 3300X Zen 2, 4C/8T, 3.8/4.3 GHz 508 2788 493 2486
Quellen: Core i3-12100/12300 von WCCF Tech, Vergleichswerte von CPU-Z, Guru3D (CB20) & Hardwareluxx (CB20 Core i3-10100)

Ältere Sechskerner dürften natürlich kein Problem für diese Alder-Lake-Vierkerner sein, aber dies ist keine Frage bzw. bei neueren Architekturen vergleichsweise normal. Als echter Ersatz für moderne Sechskerner scheinen sich diese Alder-Lake-Vierkerner allerdings nicht aufzudrängen – und so lange dies nicht passiert, sind heutzutage aus Langfristsicht doch lieber Sechskern-Prozessoren für ein Gaming- oder Allzweck-System vorzuziehen, verbleiben Vierkerner in der Ecke der reinen Office-Systeme. Dort dürfte Alder Lake sicherlich einigen Umsatz machen, denn AMD beackert diesen Bereich derzeit fast gar nicht – neuere Vierkerner sind nicht in Sicht, und das ältere Produkt-Programm von AMD ist entweder nicht mehr erhältlich oder kostet nahezu so viel wie ein Ryzen 5 5600X.