11

GDDR5X: Nicht mit höheren Taktraten, sondern mit QDR-Datenübertragung

Unsere bisherige Berichterstattung zum GDDR5X-Speicher in Konkurrenz zum HBM-Speicher hat (leider) noch einen Fehler aufzuweisen. Wie bekannt, steigt bei GDDR5X als hauptsächliche Änderung zum regulären GDDR5 der sogenannte Prefetch von 8 auf 16 – was bedeutet, das pro Takt der reinen Speicherzellen entsprechend viele Datenpakete über das Interface nach außen übertragen werden. Dabei gibt es zwei grundsätzlich Wege, diese leistungsfähigere Datenübertragung nach außen zu realisieren: Höhere Taktraten oder aber Datenprotokolle, welche mehr Daten pro Takt übertragen. Üblich ist an dieser Stelle das Double Data Rate (DDR) Protokoll, welches schon dem Namen nach zwei Datenpakete pro Takt überträgt.

Bei GDDR5X mit seinem verdoppeltem Prefetch und damit theoretisch bis zu doppelter Speicherbandbreite wurde anfänglich unsererseits ein höherer Speicherinterface-Takt vermutet – irgendwie müssen die mehr ausgelesenen Daten schließlich auch ankommen. Dem ist allerdings nicht so, wie u.a. auch ein hervorragender Detail-Artikel zu GDDR5X bei Monitor Insider herausarbeitet: GDDR5X arbeitet vielmehr am Speicherinterface selber nicht mehr mit dem bekannten und faktisch für die letzten 15 Jahre genutzten DDR-Protokoll (man erinnere sich an die allererste GeForce, welches es mit SDR- und seinerzeit erstmals DDR-Speicher gab), sondern man benutzt für GDDR5X das "Quad Data Rate" (QDR) Übertragungsprotokoll.

Mittels jenes QDR-Protokolls ist man in der Lage, die faktisch verdoppelte Speicherbandbreite ohne eine Erhöhung des offiziellen Speichertakts (welcher im eigentlichen nur den Takt der Interfaces auf Grafikchip & Speicherchip darstellt) zu erreichen. Dies räumt ein erhebliches und vorher unsererseits (fälschlicherweise) kommuniziertes Problem mit GDDR5X aus dem Weg: Weil der Speichertakt mit GDDR5X nicht ansteigt, geht auch der Strombedarf für das Speicher-Subsystem nicht durch die Decke – jener Strombedarf hängt bei GDDR5 & GDDR5X bekannterweise maßgeblich vom Speichertakt ab, wobei das Speicherinterface im Grafikchip selber hierbei der Hauptverbraucher ist. Das verwendete QDR-Datenprotokoll wird zwar auch etwas Mehrverbrauch kosten, schließlich kommen im Idealfall doppelt so viele Daten an, aber dies dürfte keineswegs so dramatisch ausfallen wie ein verdoppelter Speichertakt.

GDDR5 GDDR5X HBM1 HBM2
HBM-Stacks - - üblich: 4 üblich: 1, 2 oder 4
GPU-Interface flexibel, üblich bis zu 512 Bit flexibel, vermutlich bis zu 256-384 Bit 4096 Bit 1 Stack: 1024 Bit
2 Stacks: 2048 Bit
4 Stacks: 4096 Bit
üblicher Speichertakt bis zu 3500 MHz
(bis zu 4000 MHz lieferbar)
vermutlich bis zu 3500 MHz
(bis zu 4000 MHz geplant)
500 MHz 1000 MHz
Datenübertragung DDR QDR DDR DDR
Speicherbandbreite eines Spitzenprodukts 384 GB/sec
(Radeon R9 390X)
vermutlich bis zu ~500 GB/sec 512 GB/sec
(Radeon R9 Fury X)
bis zu 1024 GB/sec
(256 GB/sec pro Stack)
realisierbare Speichermengen flexibel bis zu 16 GB
(Vielfache von 64 MB)
flexibel bis zu 32 GB
(Vielfache von 512 oder 768 MB)
4 GB 1 Stack: 4/8 GB
2 Stacks: 8/16 GB
4 Stacks: 16/32 GB
Vorteile recht günstig, sehr flexibel bei den Speichermengen mittelmäßig günstig, hohe Speicherbandbreiten erreichbar, extrem flexibel bei den Speichermengen hohe Speicherbandbreite, niedriger Strombedarf, wenig Chipfläche für das GPU-Interface extrem hohe Speicherbandbreite, niedriger Strombedarf, sehr wenig Chipfläche für das GPU-Interface
Nachteile maximale Speicherbandbreite praktisch begrenzt, hoher Strombedarf bei großen Interfaces samt hohen Taktraten, viel Chipfläche für das GPU-Interface hoher Strombedarf bei großen Interfaces samt hohen Taktraten, viel Chipfläche für das GPU-Interface sehr teuer, extrem unflexibel bei den Speichermengen sehr teuer, nur passabel flexibel bei den Speichermengen

Der nicht wesentlich höhere Stromverbrauch von GDDR5X führt dazu, daß man jenen neuen Speicherstandard viel besser als HBM-Kontrahenten sehen kann – mit noch höherem Strombedarf als vom regulären GDDR5 her bekannt hätte man sich dafür glatt disqualifiziert. Trotzdem dürften echte Enthusiasten-Lösungen eher auf HBM2 als denn auf GDDR5X setzen, weil bei den wirklich großen Chips jedes Stück Stromersparnis und jedes Stück freiwerdende Chipfläche (beides große Vorteile von HBM) enorm wichtig sind – noch dazu, wo HBM1 mindestens die gleiche Speicherbandbreite wie GDDR5X bietet und mit HBM2 dann auch deutlich mehr Speicherbandbreite liefern kann. GDDR5X positioniert sich allerdings als gute Zwischenlösung für Fälle, wo HBM derzeit einfach noch zu teuer ist oder aber wo der HBM-Vorteil beim Stromverbrauch und geringerer Chipfläche nicht wirklich zieht.

Dies betrifft Performance- bis HighEnd-Chips, welche durchaus gewisse Reserven bei Strombudget und Chipfläche haben, die aber andererseits auch auf ihre Kostenlage achten müssen – und wo HBM2 für eine gewisse Zeit wohl noch zu teuer sein wird. Bei jenen Performance- und HighEnd-Chips will man vor allem die Speicherinterfaces nicht noch weiter verbreitern, weil dies die gesamte Grafiklösung teurer macht – und viel mehr Speichertakt ist mit GDDR5 auch nicht zu erreichen. GDDR5X ist hierfür eine exzellente Lösung, um ohne größere Speicherinterfaces und zu vergleichsweise geringen Kosten die Speicherbandbreite erheblich zu erhöhen. Demzufolge könnte (sofern gut verfügbar) GDDR5X bei der nächsten Grafikchip-Generation womöglich schon breit eingesetzt werden – neben weiterhin GDDR5 für LowCost- und Mainstream-Lösungen sowie HBM2 für Enthusiasten-Lösungen.

Im übrigen könnte nVidia schon beim kommenden GP104-Chip der Pascal-Generation auf GDDR5X zu setzen. Beim Vorgänger-Chip GM204 hat man mit 3500 MHz Speichertakt das Potential von regulärem GDDR5 schon nahezu vollständig ausgenutzt – und angesichts der 14/16nm-Fertigung sind vom GP104-Chip natürlich deutlich mehr Recheneinheiten zu erwarten, welche dann mit ordentlich mehr Speicherbandbreite gefüttert werden wollen. Eine Lösung hierfür wäre ein breiteres Speicherinterface – eine bessere Lösung wäre GDDR5X. Die beim GP104 zum GM204 um 23% steigende Pin-Anzahl deutet eher auf letzteres: Ein breiteres Speicherinterface passt hier eher weniger hinein (maximal 320 Bit, was aber nur einen Schub von +25% bringen würde), GDDR5X jedoch sehr wohl (welches laut der PCGH 12% mehr Pins benötigt). Mittels GDDR5X beim GP104-Chip könnte man selbst bei einer mittelprächtigen Speichertaktung von 3000 MHz auf satte 71% mehr Speicherbandbreite gegenüber dem GM204-Chip kommt – ohne Erhöhung der Interface-Breite wohlgemerkt.

Nachtrag vom 11. Februar 2016

Die PC Games Hardware weist auf Produktionserfolge von Speicherhersteller Micron bei GDDR5X-Speicher hin: Die aktuellen Vorab-Muster würden 3250 MHz Takt erreichen können, 3500 MHz ist dann das Ziel – dies ist derselbe Speichertakt, welcher beim regulären GDDR5 derzeit maximal verwendet wird (wobei bis zu 4000 MHz lieferbar wären). Ob die Grafikchip-Entwickler dies bei ersten Grafikkarten mit GDDR5X-Nutzung voll ausreizen werden, bleibt offen, da üblicherweise die allerhöchsten verfügbaren Speichertaktungen entsprechend hohe Mehrpreise nach sich ziehen. Zudem steht GDDR5X allein für sich bereits für eine Verdopplung der Speicherbandbreite (auf gleichem Takt), da muß man nicht bei den Speichertaktungen in die Vollen gehen. Allgemein werden daher von GDDR5X anfänglich Speichertaktraten von 2500 bis 3000 MHz erwartet, der Bandbreitengewinn gegenüber regulärem GDDR5 mit 3500 MHz Takt läge dann bei +42% bis +71%. Für die damit voraussichtlich zu bestückenden Performance- und HighEnd-Grafikkarten der 14/16nm-Generation ist dies vollkommen ausreichend. In Bezug auf die kürzliche Klarstellung zur Technik von GDDR5X gibt es in unserem Forum zudem interessante Anmerkungen: Zum einen stimmt natürlich der Einwand, daß aufgrund der Verwendung des QDR-Protokolls der gewählte Name "GDDR5X" eigentlich falsch ist: Korrekt wäre "GQDR5" oder auch schlicht "GQDR" – das "DDR" im Namen ist in jedem Fall nicht mehr zutreffend.

Gleichfalls wurde aber auch angemerkt, daß HBM-Speicher in der dargebotenen Tabelle bei der Speichermengen-Flexibilität deutlich zu schlecht wegkommt. Dies ist richtig und falsch zugleich: Richtig ist, das schon HBM1 laut dessen Spezifikation alle Möglichkeiten von HBM2 (und mehr) offenstehen, hierbei also auch andere Interfaces und andere Speichermengen pro Speicherstack realisierbar wären. In der Praxis sind jene bei HBM1 allerdings nicht zu kaufen – es gibt nur das, was AMD für die Fiji-basierten Grafikkarten benutzt. Und dies ist dann extrem unflexibel, in der Praxis ist HBM1 damit auf ein 4096 Bit DDR Speicherinterface und 4 GB Speicher festgenagelt. HBM2 definiert zwar nichts neues (außer einem höheren Speichertakt), aber in der Praxis werden hiermit verschiedene Speichermengen pro Stack angeboten und verschieden große Interfaces nutzbar sein. In der dargebotenen Tabelle wurde hierzu bewußt versucht, nicht die theoretischen Möglichkeiten laut Spezifikation aufzuzählen, sondern nur das, was rein praktisch auch in den Markt kommt. Ansonsten wäre dies ein unfairer Vergleich gegenüber GDDR5, wo alles das, was die Tabelle aufzählt, auch rein praktisch schon längst vorhanden und benutzt wird.

Nachtrag vom 11. Mai 2016

Speicherchip-Hersteller Micron vermeldet die bereits laufenden GDDR5X-Massenfertigung. Derzeit kann man wohl nur bis 2500 MHz Speichertakt gut liefern, 3000 MHz Speichertakt ist in der Erprobung und auf bis 4000 MHz Speichertakt (allesamt im QDR-Verfahren) soll die GDDR5-Entwicklung getrieben werden. Damit sollte es kein Problem darstellen, den entsprechenden Bedarf für die GeForce GTX 1080 zu decken – eventuell in den allerersten Wochen mit gewissen Lieferschwierigkeiten, aber nachfolgend sicherlich eher problemlos. Gleichzeitig macht diese Ankündigung natürlich auch den Weg frei für weitere Grafikkarten mit GDDR5X-Speicher, beispielsweise die größte GP106-Variante, sofern jene ein kleines Speicherinterface nutzt. Ob kurzfristig noch weitere neue Grafikkarten GDDR5X nutzen werden, wird sich zeigen, ist aber eher zu bezweifeln – wenn, dann muß der GDDR5X-Support beim Design des Grafikchips bereits bedacht worden sein. Die große Zeit von GDDR5X wird wohl erst in der nächsten Chip-Generation kommen, wenn alle kleineren Grafikchips (die nicht HBM nutzen) ganz automatisch auf GDDR5X gehen werden, weil dann die Herstellungskosten von GDDR5X nur noch minimal oberhalb der Herstellungskosten von GDDR5 liegen sollten und damit dramatisch mehr Speicherbandbreite zu einem geringen Aufwand erzielbar ist.