19

Hardware- und Nachrichten-Links des 19. Juni 2020

Videocardz machen auf neue Ampere-Spezifikationen seitens Twitterer CatCorgi aufmerksam – welche grundsätzlich dem entsprechen, was Twitterer Kopite7kimi bereits vor drei Wochen vermeldet hatte, allerdings etwas andere Detail-Informationen mit sich bringen. In der grundsätzlichen Aussage sind sich beide Twitterer sehr einig: Der GA102-Chip kommt in drei Verkaufs-Ausführungen mit 68, 82 und 84 Shader-Clustern daher. Leider ist nach wie vor unklar, welche eigenen Quellen 'CatCorgi' hierfür ansetzen kann, denn 'Kopite7kimi' liefert bislang grob dieselben Informationen (bezüglich Ampere-Spezifikationen) regelmäßig ein paar Wochen früher. Im Idealfall läge hier schließlich die aus journalistischer Sicht anzustrebende Bestätigung aus zweiter (unabhängiger) Quelle vor – was aufgrund der ungewissen Herkunft dieser Leaks jedoch weiterhin in der Schwebe bleiben muß. Hinzu wurden nachfolgend noch die Ampere-Spezifikationen von Igor's Lab notiert, welche leicht abweichen, sich mit der Darstellung der beiden Twitterer jedoch nicht grundsätzlich beißt:

Daten lt. Kopite7kimi Daten lt. Igor's Lab Daten lt. CatCorgi
SKU #1 TITAN (?)
GA102-400, 5376 SP
RTX 3090 Ti/Super
GA102, 384 Bit, 24GB GDDR6X, 350W
2nd Gen TITAN
GA102-400-A1, 5376 SP, 24GB 17Gbps
SKU #2 RTX 3090 (?)
GA102-300, 5248 SP, 21Gbps GDDR6X
RTX 3080 Ti/Super
GA102, 352 Bit (?), 11GB GDDR6X (?), 350W
RTX 3090
GA102-300-A1, 5248 SP, 12GB 21Gbps
SKU #3 RTX 3080 (?)
GA102-200, 4352 SP, 10GB
RTX 3080
GA102, 320 Bit, 10GB GDDR6X, 320W
RTX 3080
GA102-200-Kx-A1, 4352 SP, 10GB 19Gbps
Quellen Kopite7kimi @ Twitter (+Nachtrag) Igor's Lab CatCorgi @ Twitter

Die Differenzen bestehen derzeit in erster Linie in der exakten Namenswahl der einzelnen Grafikkarten sowie ob die mittlere GA102-basierte Grafikkarte mit 11 oder 12 GB Grafikkartenspeicher (und demzufolge einem 352 oder 384 breitem Speicherinterface) antreten wird. 'CatCorgi' liefert zudem noch genauere Bezeichungen zu den einzelnen Chip-Varianten sowie Speichertaktraten für alle drei Grafikkarten nach: Dabei werden erneut die (hohen) 21 Gbps bei der mittlere GA102-Grafikkarte genannt, dies ergibt einen Speichertakt von immerhin 5250 MHz QDR – was man bislang selbst vom lange benutzten GDDR5-Speicher nicht gesehen hat. Überraschenderweise soll das größte GA102-Modell dann jedoch wieder nur mit 17 Gbps (4250 MHz QDR) antreten – was arg unwahrscheinlich klingt, denn das Speicherinterface ist zwischen erster und zweiter GA102-Grafikkarte gleich breit (384 Bit), ergo würde die größte GA102-Grafikkarte somit mit deutlich weniger Speicherbandbreite antreten. Diese Diskrepanz darf man wohl als Hinweis darauf verstehen, das noch nicht alles an diesen Leaks korrekt sein muß – sowohl an dieser Stelle, wo es offentlich ist, als natürlich auch an anderer Stelle, wo möglicherweise im verborgenen noch ein Fehler lauert.

Mittels eines zuletzt weithin beachteten Blogpostings bricht AMD eine Lanze zugunsten von Grafikkarten mit mehr als 4 GB Speicher – hat sich hierbei als Beispiel mit der Radeon RX 5500 XT aber eher denn Eigentor ausgesucht. Denn die zwei Speicher-Varianten dieser Grafikkarte (4GB & 8GB) unterscheiden sich bei der herauskommenden Performance nicht zwingend wegen der Speichermenge, sondern wohl eher wegen anderen Effekten – beispielsweise den nur 8 PCI Express Lanes des zugrundeliegenden Navi-14-Chips. Bei anderen Grafikkarten mit den gleichen Speicher-Verhältnissen wurden jedenfalls nie derart krasse Performance-Unterschiede zwischen 4 und 8 GB Speicher vermessen – selbst zum Zeitpunkt des Launches der Radeon RX 5500 XT lieferten Radeon RX 570 4GB und GeForce GTX 1650 4GB mit diesen "geringen" Speichermenge klaglos die zu erwartende Performance ab. Dabei hat AMD sinngemäß natürlich Recht: 4 GB Speicher gehen zumindest für einen Neukauf in Richtung "grenzwertig", da sollte man zugunsten einer besseren Zukunftauglichkeit eher mehr kaufen. Die Grafikkarten-Käufer zumindest des Retail-Segments tun dies jedoch bereits, denn bei der Mindfactory lag im Mai 2020 das Verkaufsverhältnis bei der Radeon RX 5500 XT bei satten 14:1 zugunsten der 8GB-Ausführung (820 vs. 60 Stück).

Beim Guru3D hat man sich mit dem Effekt der Speicherperformance bei Ryzen 3000 im Spiele-Einsatz beschäftigt. Hierzu wurden diverse Takraten und Timings herangezogen, aber auch "Neben"-Punkte wie 1T/2T, DualRank und 2:1-IF-Teiler betrachtet. Leider wurden zuerst nur durchschnittliche Frameraten ausgewertet, erst auf den letzten Artikel-Seiten finden sich dann auch Angaben zu erzielten Minimum-fps. Selbige sind augenscheinlich nur "normale" Minimal-Werte und damit nicht derart aussagekräftig wie 99th Percentiles – aber sinngemäß funktioniert es natürlich trotzdem, wenngleich die erzielten Differenzen nicht gerade groß ausfallen. Für einen möglichst großen Performance-Effekt führen dann einige Wege nach Rom: Eine simple Speicherübertaktung kann es bei hohen Taktraten durchaus auch bringen – wobei regulärerweise ab DDR4/3733 der IF-Teiler automatisch auf 2:1 umspringt und somit der Uncore-Takt (erheblich) leidet. Dies ist gut an den aufgestellten Meßwerten zu sehen, wo DDR4/4000 beachtbar langsamer als das (manuell auf 1:1 korrigierte) DDR4/3733 läuft.

Timings IF DR Module Performance
DDR4/4000 18-20-20-40 2:1 2x 8GB 104,4%
DDR4/3733 16-18-18-38 1:1 2x 8GB 108,1%
DDR4/3600 14-16-16-36 1:1 2x 8GB 107,2%
DDR4/3200 14-14-14-34 1:1 4x 16GB 109,7%
DDR4/3200 14-14-14-34 1:1 2x 16GB 106,5%
DDR4/3200 14-14-14-34 1:1 4x 8GB 107,0%
DDR4/3200 14-14-14-34 1T 1:1 2x 8GB 102,9%
DDR4/3200 14-14-14-34 2T 1:1 2x 8GB 98,8%
DDR4/3200 16-18-18-38 1:1 2x 8GB 100%
gemäß den Messungen von Guru3D unter 10 Spiele-Benchmarks (minimum fps)

Elegantere Methoden sind die schlichte Benutzung von 4 Speichermodulen oder aber die Nutzung von DualRank-Speicher – dafür muß man dann gar nicht oberhalb von DDR4/3200 gehen. In Kombination von beiden ist die höchste Performance zu erreichen – im konkreten Beispiel sind es knapp +10% Mehrperformance, welche allerdings auch schon von DDR4/3200 CL16 ausgehen. Der Performance-Effekt gegenüber DDR4/2666 oder DDR4/2933 dürfte dementsprechend etwas größer sein – wobei Ryzen 3000 selber schon einen offiziellen Speichersupport von DDR4/3200 mitbringt und sich damit langsamerer Speicher ziemlich automatisch verbietet. Hardware-Tüftler werden natürlich noch leicht bessere Ergebnisses durch manuelles Feintuning erzielen können, während die allermeisten CPU-Käufer erst einmal an das Thema der Speicherübertaktung herangeführt werden müssen. Dabei liegen unter den derzeit zumeist CPU-seitig nur noch schlecht übertaktbaren Prozessoren bei der Speicherübertaktung sicherlich die größten Reserven verborgen, noch aber ist dies ein Feld mit vergleichsweise wenig Aufmerksamkeit des Massenmarktes.