14

nVidias Pascal-Chip "GP104" kommt wohl mit einer Chipfläche von 314mm² daher

Videocardz zeigen den GPU-Z-Screenshot einer GeForce GTX 1080 in der aktuellen Programmversion 0.8.8, welche bereits den offiziellen Support für diese Karte mitbringt. Interessant sind hierbei die Differenzen zum allerersten GPU-Z-Screenshot der GeForce GTX 1080 seitens Hardwareluxx, welcher noch in einer Programmversion ohne expliziten Support dieser Grafikkarte aufgenommen wurde: Schon die alte Programmversion wies für diese Grafikkarte 160 TMUs und 64 ROPs aus – was bedeutet, das hierbei auf einen (bekannt fehlbaren) Erkennungsmechanismus zurückgegriffen wurde, nicht auf eine Datenbank gefüllt mit bestätigten Werten. Da die neue Programmversion in dieser Frage wie gesagt keine Abweichung aufzeigt, ist unklar, ob hierzu nunmehr schon bestätigte Daten vorliegen – oder ob weiterhin der (fehlbare) Erkennungsmechanismus am Wirken ist. Nichtsdestotrotz dürfte diese Werte dennoch stimmen – die 160 TMUs ergeben sich aus dem grundsätzlichen Aufbau der Pascal-Shader-Cluster mit jeweils 64 Shader- und 4 Textureneinheiten pro Shader-Cluster, die 64 ROPs hatte nVidia schon beim Vorgänger-Chip GM204 an einem 256bittigem Speicherinterface verbaut.

Klarer ist die Situation bezüglich der Chipfläche des zugrundeliegenden GP104-Chips: Die alte Programmversion gibt hierzu keinen Hinweis, die neue Programversion nennt hierzu nun eine Chipfläche von 314mm². Inwiefern diese Angabe wirklich offiziell ist, bleibt einer weiteren Bestätigung seitens nVidia vorbehalten – allerdings haben TechPowerUp durchaus Zugang zu internen nVidia-Informationen und könnten daher diesen Wert durchaus direkt von nVidia erhalten haben. Jener Wert passt zudem zu den bisherigen Schätzungen, welche von 298mm² bis ~330mm² gingen – mit 314mm² für den GP104-Chip liegt man genau in der Mitte selbiger Schätzungen. Im Vergleich zu früheren HighEnd-Chips von nVidia ist der GP104 damit zwar deutlich kleiner als der direkt vorhergehende GM204, liegt aber verglichen mit weiter zurückreichenden HighEnd-Chips absolut auf deren Niveau – der GF104 aus der Fermi-Generation kam auf 334mm², der GK104 aus der Kepler-Generation auf 294mm²:

Fermi Kepler Maxwell Pascal
Fertigung 40nm 28nm 28nm 16nm
(rein) HPC - - - GP100
610mm², 15,3 Mrd. Transist., 3840 SE @ 4096 Bit HBM2
Enthusiast GF100
526mm², 3,04 Mrd. Transist., 512 SE @ 384 Bit GDDR5
GK110
551mm², 7,08 Mrd. Transist., 2880 SE @ 384 Bit GDDR5
GM200
601mm², 8 Mrd. Transist., 3072 SE @ 384 Bit GDDR5
GP102
spekulativ: ~550mm², ~12 Mrd. Transist., ~4500 SE @ 384 Bit GDDR5X
HighEnd GF104
332mm², 1,95 Mrd. Transist., 384 SE @ 256 Bit GDDR5
GK104
294mm², 3,54 Mrd. Transist., 1536 SE @ 256 Bit GDDR5
GM204
398mm², 5,2 Mrd. Transist., 2048 SE @ 256 Bit GDDR5
GP104
314mm², 7,2 Mrd. Transist., 2560 SE @ 256 Bit GDDR5X
Performance GF106
238mm², 1,17 Mrd. Transist., 192 SE @ 192 Bit GDDR5
GK106
214mm², 2,54 Mrd. Transist., 960 SE @ 192 Bit GDDR5
GM206
227mm², 2,94 Mrd. Transist., 1024 SE @ 128 Bit GDDR5
GP106
angeblich: ~205mm², spekulativ: ~4,5 Mrd. Transist., ~1400 SE @ 128 Bit GDDR5X
Mainstream GF108
114mm², 0,58 Mrd. Transist., 96 SE @ 128 Bit GDDR5
GK107
118mm², 1,3 Mrd. Transist., 384 SE @ 128 Bit GDDR5
GM107
148mm², 1,87 Mrd. Transist., 640 SE @ 128 Bit GDDR5
GP107
spekulativ: ~120mm², ~2,5 Mrd. Transist., ~800 SE @ 128 Bit GDDR5
LowCost GF119
79mm², 0,29 Mrd. Transist., 48 SE @ 64 Bit DDR3
GK208
87mm², ~1 Mrd. Transist., 384 SE @ 64 Bit GDDR5
GM108
~85mm², ~1 Mrd. Transist., 384 SE @ 64 Bit DDR3
GP108
spekulativ: ~80mm², ~1,5 Mrd. Transist., ~500 SE @ 64 Bit GDDR5

Damit wird auch die Situation zu den weiteren Pascal-Chips klarer. Man kann anhand der vorhergehenden nVidia-Generationen ganz gut hin- und herrechnen, welche Chipflächen mit welchem Shader-Count möglich sind bzw. welche Hardware auf welche Chipfläche hinauslaufen sollte. Gewisse Abweichungen sind immer möglich, dürfen aber nicht zu groß ausfallen – letztlich müssen überall nachvollziehbare, begründbare Zahlen herauskommen. Gegenüber der letzten diesbezüglichen Aufstellung ergeben sich mit der nun bekannten GP104-Chipgröße von 314mm² einige Abweichungen bzw. Änderungen, da für den GP104-Chip zuletzt mit einer Chipfläche von nur 298mm² gerechnet wurde:

  • Wenn der GP102-Chip wirklich ~4500 Shader-Einheiten tragen soll, dann reichen hierfür zwar die vorher schon angegebenen 12 Mrd. Transistoren aus, aber es braucht eher eine Chipfläche von ~550mm² (und nicht nur ~500mm²).
  • Kommt der GP106-Chip wirklich mit einer Chipfläche von ~205mm², passen hier eher nur 4,5 Mrd. Transistoren hinein (und nicht 5 Mrd.), womit die Anzahl der Shader-Einheiten eher bei ~1400 liegen sollte (und nicht bei ~1500).
  • Kommt der GP107-Chip mit einer Chipfläche von ~120mm², passen hier eher nur 2,5 Mrd. Transistoren hinein (und nicht 3 Mrd.), die vorher schon so angegebene Anzahl der Shader-Einheiten von ~800 passt hierzu auch besser.
  • Die Spekulation zum GP108-Chip wurde komplett überarbeitet: Aus den vorher so genannten ~2 Mrd. Transistoren auf ~85mm² Chipfläche mit ~600 Shader-Einheiten wurden nunmehr ~1,5 Mrd. Transistoren auf ~80mm² Chipfläche mit ~500 Shader-Einheiten. Dies passt besser zu den (veränderten) Annahmen bei den anderen Pascal-Chips.

Abzüglich etwaiger Überraschungen kann man sich auf ein so oder recht ähnlich aussehendes Pascal-Portfolio einrichten. Richtiggehend vakant ist allein der GP102-Chip, da es zu diesem keinerlei Vorgaben aus früheren nVidia-Generationen gibt und es damit derzeit rein spekulativ ist, was nVidia mit diesem bieten will. Der derzeit plausibelste Gedankengang hierzu lautet darauf, das jener Chip regelrecht mehr Performance als der GP100-Chip bieten soll, weil man ansonsten schließlich auch einfach den GP100-Chip für das Gaming-Segment adaptieren könnte. Dies wäre erreichbar mit höheren Taktraten (wobei ausgehend vom hohen Stand des GP100-Chips und angesichts der Chipgrößen dieser Grafikchips hierbei nicht mehr viel zu erwarten ist) oder/und mit mehr Shader-Einheiten. Geht nVidia letzteren Weg, dürfen es kaum unterhalb ~4500 Shader-Einheiten bei GP102-Chip sein – alles, was in Richtung ~4000 Shader-Einheiten geht, läßt sich schließlich auch mit dem GP100-Chip und dessen 3840 Shader-Einheiten beackern.

Auf rund 4500 Shader-Einheiten (möglicherweise konkret 4608) samt etwas höheren Taktraten dürfte der GP102-Chip ein gewisses Performanceplus gegenüber dem GP100-Chip von ~25-30% mehr Rohleistung und ~20-25% mehr Performance herausarbeiten können – knapp ausreichend, damit sich die Auflage dieses extra Chips überhaupt lohnt. Viel Spielraum hat nVidia hierbei allerdings nicht, denn die ~4500 Shader-Einheiten werden wie gesagt für eine Chipfläche von schon ~550mm² sorgen – und viel weiter nach oben geht es nicht bzw. lohnt sich die Sache dann nicht mehr zu treiben. Allerdings werden wir noch eine ziemliche Zeit auf den GP102-Chip warten müssen – bis auf den einen früheren Treibereintrag ist hierzu nichts weiter passiert, gibt es nicht einmal eine minimale Wortmeldung aus der Gerüchteküche. Die Anzeichen dafür, das der GP102-Chip eher ein Projekt des Frühlings bis zur Jahresmitte 2017 ist, mehren sich damit.