18

JEDEC bohrt die HBM2-Spezifikation auf: Bis zu 1200 MHz Takt, bis zu 24 GB Speicher pro Stack

Das Speicherstandardisierungs-Gremium JEDEC hat die offizielle Speicherspezifikation für HBM-Speicher aktualisiert, welche in der Folge nunmehr deutlich mehr Möglichkeiten für den aktuellen HBM2-Speicher bietet – ohne das dies allerdings als wirklich neuer Standard tituliert werden würde ("HBM1" und "HBM2" scheinen sowieso keine offiziellen Bezeichnungen zu sein, haben sich allerdings derart eingebürgert). Dabei sind die Änderungen durch die Aufbohrung des HBM-Standards durchaus beachtbar: Die Speichertakt geht von 1000 MHz DDR auf 1200 MHz hinauf, zudem steigt die mögliche Speichermenge pro HBM-Stack von 8 GB auf satte 24 GB an. Damit könnte der Stappelspeicher in seiner maximal üblichen Fassung (bei 4 Speicherstacks) eine Speichermenge von 96 GB liefern – was man in jedem Fall als ausreichend zukunftssicher angesehen kann, gerade gegenüber dem Anfang von HBM, wo man seinerzeit auf maximal 4 GB (bei den Fiji-basierten Grafikkarten) festhing. Mangels einer besseren Bezeichnung und zur besseren Abgrenzung lassen wir die neue Spezifikation derzeit einfach mal unter "HBM2.5" laufen, eventuell gibt es hierzu in Zukunft noch eine bessere Benennung.

HBM1 HBM2 HBM2.5
HBM-Stacks üblicherweise 4 üblicherweise 2/4 üblicherweise 2/4
GPU-Interface pro Stack 1024 Bit pro Stack 1024 Bit pro Stack 1024 Bit
üblicher Speichertakt bis zu 500 MHz DDR bis zu 1000 MHz DDR bis zu 1200 MHz DDR
maximale Speicherbandbreite (4 Stacks) 512 GB/sec
(512 MHz DDR @ 4096 Bit)
1024 GB/sec
(1000 MHz DDR @ 4096 Bit)
1228 GB/sec
(1200 MHz DDR @ 4096 Bit)
realisierbare Speichermengen pro Stack 1 GB pro Stack 1/2/4/8 GB pro Stack 1/2/4/8/12/16/24 GB
maximale Speichermenge (4 Stacks) 4 GB 32 GB 96 GB
maximale 2-Stack-Konfiguration 2 GB @ 256 GB/sec 16 GB @ 512 GB/sec 48 GB @ 614 GB/sec
maximale 4-Stack-Konfiguration 4 GB @ 512 GB/sec 32 GB @ 1024 GB/sec 96 GB @ 1228 GB/sec
Verfügbarkeit voll verfügbar voll verfügbar unbekannt

Die in der ersten Fassung dieser Meldung noch genannte Erhöhung der Anzahl der maximal möglichen Speicherstacks basiert dagegen auf einem bedauerlichen Zuordnungsfehler: Real gesehen macht die HBM-Spezifikation in dieser Frage überhaupt keine Vorschriften – die Anzahl der verbauten Speicherstacks ist faktisch unlimitiert und liegt allein im Verantwortungsbereich der CPU/GPU-Hersteller. Mit HBM3 scheint diese Spezifikations-Aufbohrung auch noch nichts zu tun haben, jenes soll vor allem bei der Bandbreite pro Stack eigentlich noch für einen größeren Schub als "nur" von 256 GB/sec auf nunmehr 307 GB/sec sorgen (HBM3 ist geplant mit 512 GB/sec pro Stack für das Jahr 2020). In den anderen Disziplinen nimmt HBM2.5 dann allerdings HBM3 glatt vorweg, mit teilweise bereits sogar besseren Spezifikationen. Insofern könnten sich mit dieser Spezifikations-Aufbohrung auch die Plänen für HBM3 grundlegend geändert haben, eventuell kommt jenes nunmehr nur noch in Form eines Taktraten-Upgrades, basierend auf einer neuen Fertigungstechnologie. Wie gesagt sind diese HBM-Unterteilungen augenscheinlich auch nicht offiziell, insofern könnte die JEDEC jenes zukünftige Taktratenupgrade auch einfach in Form einer weiteren Aktualisierung der HBM-Spezifikationen bringen – womit dann zusammengefasst mit der jetzt bereits vorliegenden Aktualisierung die frühere Vorausschau zu HBM3 bereits erfüllt wäre.

Viel mehr als bei anderen Speicherformen geht es bei HBM vor allem aber darum, was dann wirklich real gebaut wird. Varianten mit mehr als vier HBM-Stacks sind bis auf exotischen Server- und Superrechner-Produkte noch lange nicht im Masseneinsatz zu sehen, dafür muß erst einmal die zugrundeliegende Imposer-Technologie entsprechend (viel) günstiger und besser handelbarer werden. Zudem sind hohe Speichermengen pro Stack nicht nur teurer, sondern auch technologisch entsprechend aufwendiger – womit derzeit nur 4 GB pro HBM-Stack üblich sind, 8 GB pro HBM-Stack gibt es dann nur von einem Hersteller. Hier kann sich natürlich noch viel eher etwas mittelfristig verbessern, eventuell kommen zukünftig diese 8-GB-Stacks eher in Mode und wird damit auf gleicher Stack-Anzahl eine praktische Speichermengen-Verdopplung erreicht. Abseits dessen ist der einzige sofort greifbare Vorteil von HBM2.5 die Erhöhung des Speichertakts von 1000 MHz DDR auf 1200 MHz DDR. Grundlage hierfür dürfte vermutlich ein besseres (kleineres) Fertigungsverfahren der HBM-Speicherchips sein, welches dann diese höhere Taktrate zuläßt. Wann dieses zur Verfügung steht und wann daher überhaupt erst mit HBM2.5 zu rechnen ist, wurde nicht gesagt – ist aber natürlich auch nicht Aufgabe der JEDEC, sondern der Speicherchip-Hersteller.

In deren Katalogen wird man dann die Verfügbarkeits-Ankündigungen von Speicherstacks mit mehr Speicher und höheren Taktraten lesen können – sicherlich irgendwann im Jahr 2019, ansonsten hätte es jetzt nicht dieses Spezifikations-Update gegeben. Im Jahr 2019 wird sich HBM2.5 dann mit einem voll entwickelten GDDR6-Speicher herumschlagen müssen, welcher ebenfalls auf höherem Takt verfügbar sein wird – mit 4000 MHz QDR (16 Gbps) kann man diesbezüglich sicher rechnen. Zwar dürfte HBM2.5 mit seinem Taktratensprung weiterhin etwas vorn (oder schlimmstenfalls auf gleicher Höhe liegen), die Differenz reicht jedoch so oder nicht aus, um HBM2.5 in der Insgesamt-Rechnung vor GDDR6 zu schieben: Fast alle Nebenpunkte wie Preislage, Marktverfügbarkeit & notwendige Infrastruktur sprechen eher für GDDR6 – womit die Chance hoch ist, das jenes in näherer Zukunft auch bei AMDs Gaming-Lösungen den Vorzug vor HBM-Derivaten bekommt. Einzig allein bei dedizierten HPC-Lösungen hat HBM seine Vorteile, da man hiermit enorme Speicherbandbreiten erreichen kann, welche bei GDDR6 nur mit sehr breiten und damit stromfressenden Interfaces realisierbar sind – was jetzt gerade im HPC-Bereich, wo das nicht mehr erhöhbare Power-Budget dem Grafikchip selber und dessen Rechenleistung zufließen soll, eher ungünstig für GDDR6 ist.

Taktrate Bandbreite (insgesamte) Speichermenge Zielsegment
256 Bit GDDR6 4000 MHz QDR 512 GB/sec 8/16/32 GB (voll variabel) HighEnd
2Stack HBM2.5 1200 MHz DDR 614 GB/sec 8/16 GB (praktisch wenig variabel) HighEnd
384 Bit GDDR6 4000 MHz QDR 768 GB/sec 12/24/48 GB (voll variabel) Enthusiast
4Stack HBM2.5 1200 MHz DDR 1228 GB/sec 16/32 GB (praktisch wenig variabel) Enthusiast & HPC

Interessanterweise arbeitet die Zeit dennoch für HBM-Speicher, denn trotz des wirklich gut laufenden GDDR6-Speichers ist nicht klar, wie weit man diese Technologie noch treiben kann. Der Grund hierfür liegt an den ans Ende geratenen Taktraten – schon seit GDDR5 geht es kaum noch oberhalb der Marke von 4000 MHz. GDDR5X und GDDR6 sind schlicht darauf hin ausgerichtet, durch Gang in die Breite mehr Daten auf gleicher Taktraten zu übertragen – ob über größere interne Interfaces oder das QDR-Protokoll. Doch diese Versuche sind natürlich limitiert, der dabei betriebene technologische Aufwand steigt, während die einfache Methode der (erheblichen) Taktratensteigerung nur noch bei HBM zur Verfügung steht. Der HBM-Ansatz mit den vorsätzlich sehr breiten Interfaces, welche die dafür notwendige teure Infrastruktur durch ihre Nähe zum Grafikchip nur für einen vergleichsweise (sehr) kurzen Weg benötigt, hatte seinen primären Vorteil darin, auf vergleichsweise niedrigen Taktraten starten zu können – die man dann noch lange ausbauen kann, ehe man erst in langfristiger Zukunft an die eigene Taktraten-Mauer stößt. Gut möglich also, das es nach GDDR6 nicht mehr weitergeht mit der GDDR-Technologie – obwohl uns jene bisher immer noch damit überrascht hat, irgendwie doch weiterhin lebensfähig zu sein.