30

Hardware- und Nachrichten-Links des 30. September 2020

Nach der Vorstellung von Ampere und den Launches von GeForce RTX 3080 sowie GeForce RTX 3090 allesamt im Rahmen des Septembers wird die Schlagzahl der Hardware-Launches in den kommenden Wochen unverändert hoch bleiben – denn eigentlich stehen nunmehr sogar noch mehr Projekte an: nVidia wird das Ampere-Portfolio mittels GeForce RTX 3060 Ti & 3070 weiter ausbauen, AMD zum Gegenschlag mittels RDNA2 bzw. der Radeon RX 6000 Serie ansetzen sowie seine Zen 3 bzw. Ryzen 5000 CPU-Generation herausbringen – und dann werden natürlich noch die NextGen-Konsolen PlayStation 5 sowie Xbox Series S/X in den Verkauf gehen. Zur Terminfrage der beiden AMD-Projekte kommt dabei von Yuri Bubliy @ Twitter eine erhellende Aussage: Danach hat AMD den Launch von Zen 3 am 20. Oktober sowie den Launch erster RDNA2-basierter Grafikkarten zwischen 15.-20. November angesetzt, welche damit den offiziellen Vorstellungen jeweils um ca. zwei Wochen folgen werden. Diese Termin entsprechen wohl früheren AMD-Planungen, wurden allerdings bis dato nicht verändert und dürften somit weiterhin aktuell sein.

    anstehende Hardware-Vorstellungen/Launches/Verkaufsstarts

  • 8. Oktober 2020               offizielle Vorstellung von AMDs Zen 3
  • 15. Oktober 2020             Launch & Verkaufsstart von nVidias GeForce RTX 3070
  • 20. Oktober 2020             Launch und Verkaufsstart AMDs Zen 3 (Gerücht)
  • 28. Oktober 2020             offizielle Vorstellung von AMDs RDNA2
  • Ende Oktober 2020          Launch & Verkaufsstart von nVidias GeForce RTX 3060 Ti (Gerücht)
  • 10. November 2020          Verkaufsstart von Microsofts Xbox Series S & X
  • 12. November 2020          Verkaufsstart von Sonys Playstation 5
  • 15.-20. November 2020     Launch & Verkaufsstart von AMDs RDNA2 (Gerücht)

Laut jener Twitter-Information scheint AMD den Zen-3-Launch zudem vergleichsweise sparsam mit nur den beiden Modellen "Ryzen 5800X" sowie "Ryzen 5900X" zu begehen – höchstwahrscheinlich ein Acht- und ein 12-Kerner, da es mit der Zen-3-Generation keine Veränderung bei der Anzahl der CPU-Kerne geben wird. Anderseits macht ein ganz breiter Launch auch aus Tester-Perspektive kaum einen Sinn, denn gewöhnlich werden anfänglich nur die Spitzen-Modelle breit getestet und sind die kleineren Modelle sinnvoller mit einem extra Launch zu betrachten, wo man sich ganz allein auf jene konzentrieren kann. Allerdings deutet sich in der Gerüchte-Küche auch an, dass AMD das ganze Ryzen 5000 Portfolio diesesmal eher langsamer ausbreiten wird – nicht wie bei den bisherigen Ryzen-Generationen, wo zumindest die Desktop-Modelle nahezu allesamt in einem Rutsch in den Markt gekommen sind. Für diesen Herbst ist daher erst einmal nur mit vier Zen-3-Modellen zu rechnen, der Rest des Portfolios dürfte nachfolgen – und dies wahrscheinlich nicht mehr im Rahmen des Jahres 2020.

4C 6C 8C 12C 16C
initaler Zen-3-Launch - - 5800X 5900X -
später im Jahr 2020 - 5600X - - 5950X
wahrscheinlich erst im Jahr 2021 5100 & 5300X 5600 5700(X) 5900 -
basierend auf Annahmen & Gerüchten!

Zur Frage, wie AMD seine RDNA2-Grafikchips mit den angezeigten vergleichsweise kleinen Speicherinterfaces auf Touren bekommt, ist immer noch nichts wirklich griffiges bekannt – dies wird wohl bis zur offiziellen RDNA2-Vorstellung das Geheimnis von AMD bleiben. Aus unserem Forum kommt hierzu eine interessante These über ein Kombi-Speicherinterfaces, welches GDDR6 und HBM2 beherrscht und auch beides zusammen (auf den größeren RDNA2-Karten) nutzen soll. Was sich erst einmal "leicht" irrational anhört, wird zum einen durch diverse Treiber-Einträge gedeckt, welche speziell zum Navi-21-Chip sowohl Hinweise auf GDDR6- als auch HBM2-Speicher liefern – und zum anderen auch gut begründet, gerade in Bezug auf die übliche Sollbruchstellen von solcherart Thesen. Lesenswert hierzu sind die Foren-Postings No.1, No.2 und No.3, im groben soll es danach auf ein 256 Bit GDDR6-Interface sowie ein 1024 Bit HBM2e-Interface hinauslaufen, an welchem beiderseits 8 GB Speicher hängen. Beide Interface werden somit kombiniert und erreichen (auf hohem HBM2e-Takt) die doppelte Speicherbandbreite wie bei einem einfachen 256 Bit GDDR6-Interface – faktisch würde AMD sinngemäß wie mit einem 512 Bit GDDR6-Interface agieren, nur ohne dessen Platzbedarf.

Die zwei Speicherinterfaces und zwei Speichersorten hätten dann den Vorteil, dass man bei kleineren Lösungen variabel vorgehen kann: Im Mobile-Segment könnte man zugunsten des Stromverbrauchs nur das HBM2e-Interface nutzen, für Salvage-Lösungen im Desktop-Segment zugunsten des Preispunkts nur das GDDR6-Interface. Da beide Interfaces vergleichsweise klein bis maximal mittelgroß sind, spielt es dann auch keine Rolle, ob man das jeweils andere Interface bei diesen weiteren Verwendungsmöglichkeiten deaktiviert – vielmehr steigert dies sogar die Chip-Ausbeute, wenn man auch Chips mit Produktionsfehlern im Speicherinterface selber noch weiterverwenden kann. Der Mehraufwand würde somit primär im technologischen Bereich liegen, der Mehraufwand auf Trasnsitoren-Seite bleibt gering, da ja zumindest bei der Top-Ausführung beide Speicherinterfaces auch zusammen genutzt werden. So zumindest diese These, welche reichlich gewagt klingt, aber zumindest von der Technik-Seite her doch recht gut begründet wurde. Nichtsdestotrotz handelt es sich um eine These – ein reines Gedankenspiel, welches nur eine mögliche Auflösung darstellt, jedoch keineswegs durch irgendeinen Leak oder Gerücht substantiell fundiert wurde.

Bei WCCF Tech hat man sich mit der Frage beschäftigt, wieso nVidias Ampere-Architektur mit dem bekannt hohen Hardware-Einsatz der verdoppelten FP32-Power (bei Gaming-Ampere) nur einen vergleichsweise mittelprächtigen Performance-Sprung hinlegt bzw. ob sich daran eventuell im Laufe der Zeit noch etwas ändern läßt. Generell war es allerdings klar, dass die (mehr als) verdoppelte Rohleistung für sich allein Ampere keineswegs so weit voranschieben kann wie ein generell verdoppeltes Grafikchip-Design. nVidia hat schlicht die reinen FP32-Recheneinheiten verdoppelt, währenddessen die Kontrolllogik in den Shader-Clustern sowieso alles drumherum (u.a. die Raster-Engines) grob im selben Maßstab verbliebt. Dass dies erhebliche Skalierungs-Verluste nach sich ziehen musste, war von vornherin klar – noch dazu, wo auch ein glatt verdoppelter Grafikchip selbst ohne TDP-Sorgen niemals eine Performance-Verdopplung mitbringen kann (sofern die Architektur die gleiche IPC aufweist), sondern in diesem Fall üblicherweise von einem Performance-Plus bei ca. +85-90% ausgegangen wird.

Dass bei einem technologisch weit weniger aufwendigen Ansatz mit rein verdoppelten Recheneinheiten ein noch schlechteres Verhältnis herauskommt, ist dann eigentlich selbstverständlich. Die theoretischen +100% kann sowieso niemand erwarten, die derzeit erreichten +31% zwischen Turing und Ampere (Shader-Cluster normierte Performance am Beispiel der GeForce RTX 3080) liegen für den gewählten Ansatz in einem erwartbaren Rahmen. Natürlich kann man (wie WCCF Tech) die Erwartung aufstellen, dass sich angesichts dieser größeren Architektur-Änderung im Laufe der Zeit noch gewisse Performance-Verbesserungen zugunsten der Ampere-Generation ergeben sollten. Die GeForce RTX 2080 Ti wird derzeit schließlich auch um ca. +5% gegenüber dem Stand zu deren Launch anno 2018 bewertet. Allerdings sollte man sich hierzu auch nicht von Benchmarks mit Rendering-Software täuschen lassen, wo die FP32-Verdopplung extrem viel stärker durchschlägt. Denn jene Rendering-Software nutzt weite Teile der Grafik-Pipeline nicht, umgehend somit ganz automatisch die Schwachstellen der Ampere-Architektur – was im Spiele-Einsatz logischerweise nicht möglich ist. Ampere also vorab zu prophezeien, die Architektur dürfte noch in einem wirklich erheblichen Maßstab reifen können (englisch "fine wine"), ist aus heutiger Sicht eine etwas vermessene Prognose – die man einfach nicht abgeben sollte, weil niemand die Zukunft so genau einschätzen kann.

Dabei besteht durchaus eine gute Chance auf das Szenario einer zukünftig maßvoll besseren Ampere-Performance, da mit den NextGen-Konsolen dann auch NextGen-Spiele antanzen werden – und genauso wie die Turing-Architektur am meisten über neue, leistungsfordernde Spiele profitierte, dürfte dies auch auch bei der Ampere-Architektur der wichtigste Punkt zugunsten von Performance-Zuwächsen sein. Aber ob dies alles noch innerhalb absehbarer Zeit passiert, bevor also Ampere nicht schon durch die Nachfolge-Architektur "Hopper" abgelöst wird, kann derzeit kaum ermessen werden. Vor allem aber sollte man sich über die Grenzen von solcherart Szenarien im klaren sein: Bei heutigen Grafikkarten, welche automatisch an Temperatur und Power-Limit geregelt werden, sind ganz große Performance-Sprünge sowieso nicht mehr drin – weil Mehrleistung muß ja von irgendwo herkommen und ein Mehrverbrauch schließlich nicht erlaubt ist. Allein über eine bessere Eignung der Anwendungs-Software auf die jeweilige Grafikchip-Architektur sind jedoch nur gewisse Effizienzgewinne möglich – nichts, was den ganz großen Performance-Sprung erwarten läßt. Die Mehrperformance, welche Turing im Laufe der letzten zwei Jahre hingelegt hat (wie gesagt hochgerundet +5%), stellt ein machbares Level dar – und viel mehr sollte man von Ampere derzeit besser nicht erwarten.