2

GDDR6 und HBM3 als Grafikkartenspeicher der Zukunft

Noch nachzutragen von der kürzlichen HotChips-Konferenz sind die dortigen Aussagen zu diversen kommenden Speichertechnologien. Bezüglich des für PC-Systeme als Hauptspeicher verwendeten DDR5 hatten wir dies bereits getan – interessant hierzu noch der Nachtrag, das DDR5 nunmehr einen Prefetch von 16 benutzen soll, was die Marketing-Umschreibung eines 16fachen Datentransfers pro Takt der eigentlichen Speicherzellen darstellt. Üblicherweise wurde dies in der DDR-Entwicklung derart gelöst, das der Takt des Speicherinterfaces deutlich höher als derjenige der reinen Speicherzellen wurde – bei DDR4 mit einem Prefetch von 8 handelt es sich um ein Verhältnis von 4:1, das zusätzliche DDR-Verfahren zur Datenübertragung ergibt dann den Prefetch von 8. Bei DDR5 sieht es derzeit ganz danach aus, als würde man exakt dieses Methode nochmals nutzen – die Differenz der Taktraten zwischen Speicherinterface und reinen Speicherzellen also auf 8:1 steigen und unter Hinzunahme des DDR-Datenübertragungsprotokolls dann jener Prefetch von 16 erreicht werden. In jedem Fall wird es hierbei eine deutlich andere zugrundeliegende Technologie geben, womit sich die lange Wartezeit auf DDR5 erklärt.

Im Grafikkartenspeicher-Bereich soll es dagegen mit GDDR6 und HBM3 weitergehen. GDDR6 erscheint dabei auf den ersten Blick wie die Graphics-Abwandlung von DDR5 – darauf deuten ähnliche Terminlage und diverse technische Einzelheiten hin, sicher ist diese Auslegung derzeit aber noch mitnichten. Zumindest wäre jene logisch, denn bisher hat noch jede neue Hauptvariante von DDR-Speicher zu einer entsprechenden GDDR-Abwandlung geführt. Insofern kann man auch von GDDR6 einen auf ähnliche Weise wie bei DDR5 erreichten Prefetch von 16 erwarten. Der Problempunkt von GDDR6 liegt dabei eher darin, das jener Speicher nur mit Datenübertaktungsraten von 14-16 Gbps (Gigabit pro Sekunde pro Pin) geplant wird – dies wäre zwar eine Verdopplung gegenüber GDDR5, aber nur wenig mehr als was für GDDR5X prognostiziert wird, welcher ebenfalls schon 12-14 Gbps erreichen können soll. GDDR5X hat zudem den Vorteil der QDR-Datenübertragung, was die Taktraten des Speicherinterfaces (relativ gesehen) niedrig und somit den Strombedarf des Speichersubsystems auf Spitzengrafikkarte im Zaum hält.

GDDR5 GDDR5X GDDR6 HBM2
HBM-Stacks - - - bis zu 4
GPU-Interface flexibel, üblich bis zu 512 Bit flexibel, üblich bis zu 384 Bit flexibel, wahrscheinlich bis zu 256-384 Bit pro Stack 1024 Bit
üblicher Speichertakt bis zu 4000 MHz derzeit bis zu 2500 MHz
(bis zu 3500 MHz geplant)
bis zu 8000 MHz geplant derzeit bis zu 700 MHz
(bis zu 1000 MHz geplant)
Datenübertragung DDR QDR DDR DDR
Speicherbandbreite eines Spitzenprodukts 384 GB/sec
(Radeon R9 390X)
480 GB/sec
(Titan X Pascal)
- 717 GB/sec
(Tesla P100)
maximale Speicherbandbreite 512 GB/sec
(4000 MHz DDR @ 512 Bit SI)
896 GB/sec
(3500 MHz QDR @ 512 Bit SI)
1024 GB/sec
(8000 MHz DDR @ 512 Bit SI)
1024 GB/sec
(1000 MHz DDR @ 4096 Bit SI)
realisierbare Speichermengen flexibel bis zu 16 GB
(Vielfache von 64 MB)
flexibel bis zu 32 GB
(Vielfache von 512 oder 768 MB)
noch unklar pro Stack 4 oder 8 GB
Verfügbarkeit voll verfügbar beginnend verfügbar Jahr 2018 beginnend verfügbar

GDDR6 wäre somit die natürliche Ablösung von GDDR5, wenn GDDR5X nicht dazwischengekommen wäre – und die Sache am Ende erstaunlich gut macht. Noch fehlen die hohen Taktraten von GDDR5X, aber sollten jene eines Tages erscheinen, liegen die Vorteile eher bei GDDR5X. GDDR6 wäre dann eventuell aus Preis/Leistungssicht für die Grafikkarten des Mainstream- und Midrange-Segments die langfristig bessere Wahl, da sicherlich breiter hergestellt als GDDR5X. Viel interessanter wäre natürlich, wenn man das "X" aus GDDR5X auf GDDR6 transferieren könnte, damit ließe sich eine (theoretische) Vervierfachung der Speicherbandbreite gegenüber GDDR5 erreichen. Denn das Problem von GDDR-Speicher bei heutigen Grafikkarten liegt in den hohen Interface-Taktraten, welches zum einen stromdurstige Interfaces ergibt und ab einem gewissen Maß auch nicht gerade einfach zu beherrschen sind. Bei GDDR6 würde schließlich in der höchsten Ausbaustufe ein Speichertakt von gleich 8000 MHz DDR anliegen – sprich ein echter Datentakt von 8000 MHz, über welchem im DDR-Verfahren Daten geschaufelt werden.

Immer schon als die bessere Lösung gegenüber GDDR-Speicher genannt wurde natürlich HBM-Speicher – wo derzeit die zweite Variante mit den GP100-basierten Tesla-Lösungen gerade einmal antritt, zu welchem aber schon über die dritte Variante in Form von HBM3 geredet wurde. Allerdings liegt selbige mit einer Planung in Richtung der Jahre 2019 und 2020 noch einigermaßen weit entfernt, somit gab es zur Technik von HBM3 auch eher nur Projektionen und keinerlei exakte Angaben. Man will sowohl die Stack-Kapazität erhöhen als auch mehr Stacks ermöglichen, was eine sehr deutliche Erhöhung der insgesamten Speicherkapazität auf maximal wohl 128 GB ermöglichen würde. Die Speicherbandbreite (pro Stack) sollte ebenfalls erhöht (mindestens verdoppelt) werden, wobei man sich über die hierzu eingesetzte Technik komplett ausschwieg. Prinzpiell erscheint HBM3 trotz der größeren Änderungen eher denn als Evolution – man wird primär die Speicherkapazität dem dann benötigen Stand anpassen und nimmt wohl einfach eine gewisse Taktratenerhöhungen samt verdoppelter Stack-Anzahl herbei, um eine höhere Bandbreite zur Verfügung zu stellen. Insbesondere die höhere Stack-Anzahl wird natürlich wieder auf die Kostenseite schlagen, so daß nicht dafür garantiert werden kann, ob jemand diese technischen Möglichkeiten letztlich überhaupt ausnutzen wird.

HBM1 HBM2 HBM3 LowCost-HBM
HBM-Stacks 4 bis zu 4 bis zu 8 1
GPU-Interface 4096 Bit pro Stack 1024 Bit pro Stack 1024 Bit 512 Bit
üblicher Speichertakt bis zu 500 MHz derzeit bis zu 700 MHz
(bis zu 1000 MHz geplant)
unbekannt bis zu 1500 MHz geplant
Datenübertragung DDR DDR DDR DDR
Speicherbandbreite eines Spitzenprodukts 512 GB/sec
(Radeon R9 Fury X)
717 GB/sec
(Tesla P100)
- -
maximale Speicherbandbreite 512 GB/sec
(512 MHz DDR @ 4096 Bit SI)
1024 GB/sec
(1000 MHz DDR @ 4096 Bit SI)
angenommen: 3072 GB/sec
(1500 MHz DDR @ 8192 Bit SI)
192 GB/sec
(1500 MHz DDR @ 512 Bit SI)
realisierbare Speichermengen 4 GB pro Stack 4 oder 8 GB pro Stack bis zu 16 GB unbekannt
Verfügbarkeit voll verfügbar beginnend verfügbar Jahre 2019/2020 unbekannt

In die gänzlich umgekehrte Richtung soll dann eine LowCost-Variante von HBM gehen, womit man einen eher breiteren Markt für diese nach wie vor arg teure Speichersorte ansprechen will. Hierfür wird der bisher feste HBM-Stack von 1024 auf 512 Pins beschnitten, zudem gibt es wohl auch nur diesen einen Stack. Zusammen mit einem höheren Speichertakt von 1500 MHz DDR (HBM2 ist mit maximal 1000 MHz DDR geplant) würde dieser LowCost-HBM-Stack dann eine Speicherbandbreite von 192 GB/sec erreichen. Dies wäre für Mainstream- und Midrange-Grafikkarten sowie gerade auch für APUs und Spielekonsolen-SoCs ein durchaus interessantes Angebot – ob jenes auch von der Kostenlage her passend ist, läßt sich natürlich anhand der technischen Beschreibung schwerlich erkennen. Aber man kann anhand der Adaptionsrate von HBM derzeit schließlich schon sehen, daß das ganze noch weit davon entfernt ist, im Massenmarkt aufzutauchen – ergo ist jene LowCost-Variante von HBM ebenfalls eher Zukunftsmusik für eine Zeit, wo HBM-Speicher wesentlich breiter im Geschäft steht.