25

nVidias GM204-Chip kommt hochgerechnet mit 1920 bis 2560 Shader-Einheiten

In unserem Forum (Posting No.1 & Posting No.2) wird derzeit herzlich darüber spekuliert, wie nVidias GM204-Chip aussehen könnte – welcher wohl den Anfang der zum Jahresende zu erwartenden Reihe von GM2xx-Grafikchips machen wird. Die kürzlich seitens PCTuning offerierten "Daten" dürften kaum stimmen, da sich jene explizit auf die Möglichkeiten der 20nm-Fertigung beziehen – welche der GM204-Chip nun aber ziemlich sicher noch nicht benutzen wird, trotz des späten Erscheinungstermins. Demzufolge benötigt es neuer Ansätze zur ungefähren Bestimmung der beim GM204-Chip vermutlich zum Einsatz kommenden Hardware-Einheiten.

Ausgangspunkte hierfür sind zum einen das ziemlich sichere 256 Bit DDR Speicherinterface sowie die Package-Größe von 40x40, welche einen Grafikchip im Rahmen von ~350mm² Chipfläche ermöglicht. Genauso kann man von den bekannten Daten des GM107-Chips ausgehen, welche seine vergleichsweise hohe Performance mit einer vergleichsweise geringen Chipfläche von nur 148mm² erbringt. Wenn man nun von der Kepler-Generation ausgehend hochrechnet, daß der Mainstream-Chip GK107 auf 118mm² Chipfläche 384 Shader-Einheiten samt einem 128 Bit DDR Speicherinterface unterbrachte, während der HighEnd-Chip GK104 auf nur 294mm² Chipfläche immerhin 1536 Shader-Einheiten (das Vierfache) samt einem 256 Bit DDR Speicherinterface (das Doppelte) bietet – dann kann man trefflich schlußfolgern, daß unter der Maxwell-Architektur der GM204 auf angenommen ~370mm² Chipfläche durchaus auch die vierfache Anzahl an Shader-Einheiten am doppelt so großen Speicherinterface aufbieten kann.

Dies würde auf immerhin 2560 Shader-Einheiten an einem 256 Bit DDR Speicherinterface beim GM204-Chip hinauslaufen, stellt aber sicherlich das Maximum dessen dar, was nVidia in diesen Grafikchip hineinpacken könnte. Eine andere Hochrechnung, welche auf der Aufschlüsselung des flächenmäßigen Anteils der einzelnen Hardware-Einheiten des AMD R1000/Tahiti-Chips basiert, kommt im übrigen "nur" auf 1920 Shader-Einheiten bei einer Chipfläche von ~350mm² – ist aber wegen der Verwendung der Innereien-Daten eines AMD-Chips für einen nVidia-Fall die wesentlich unsichere Spekulation. Nichtsdestotrotz kann man festhalten, daß sich der GM204-Chip ziemlich sicher innerhalb dieses Feldes von 1920 bis 2560 Shader-Einheiten bewegen wird, wahrscheinlich eher am oberen Ende dieser Skala. Dies hört sich natürlich immer noch weniger an als bei den angebliche GM204-Spezifikationen mit gleich 3200 Shader-Einheiten, aber die genannte Anzahl von 1920 bis 2560 Shader-Einheiten ist dafür nicht einfach herbeigezaubert, sondern basiert streng auf Hochrechnungen gemäß der zur Verfügung stehenden Informationen.

Chips Chipfläche Hardware-Einheiten Performance
nVidia Kepler GK107 zu GK104 1:2,5
118mm² zu 294mm²
1:4 bzw. 1:2
384 Shader-Einheiten an einem 128 Bit DDR Speicherinterface zu 1536 Shader-Einheiten an einem 256 Bit DDR Speicherinterface
1:3,3
GeForce GTX 650 (115%) zu GeForce GTX 770 (380%)
nVidia Maxwell GM107 zu GM204 angenommen 1:2,5
148mm² zu hochgerechnet ~370mm²
angenommen 1:4 bzw. 1:2
640 Shader-Einheiten an einem 128 Bit DDR Speicherinterface zu hochgerechnet 2560 Shader-Einheiten an einem 256 Bit DDR Speicherinterface
angenommen 1:3,3
GeForce GTX 750 Ti (210%) zu GeForce GTX 880 (hochgerechnet ~690%)
Alle kursiv notierten Werte sind reine Annahmen & Hochrechnungen unsererseits.

Damit läßt sich trotzdem etwas reißen, wie Modell-Rechnungen zur erwartbaren Performance aufzeigen. Innerhalb der Kepler-Generation lagen zwischen dem Mainstream-Chip GK107 und dem HighEnd-Chip GK104 die glatt vierfache Anzahl der Shader-Einheiten und dann die rund 3,3fache Performance (GeForce GTX 650 zu GeForce GTX 770). Übernommen auf die Maxwell-Generation und ausgegangen vom GM107-Chip würde man in dieser Rechnung schnell die GeForce GTX 780 Ti in den Boden rammen, es käme bei der vierfachen Shader-Anzahl (2560) eine Performance ca. 30% oberhalb dieser Karte heraus. Rechnet man dagegen nicht mit der vierfachen Shader-Anzahl zwischen diesen beiden Grafikchips, sondern nur der dreifachen (1920), dürfte sich die Performance-Differenz in etwa auf den Faktor 2,5 reduzieren. Dies wäre dann exakt das Leistungsniveau der GeForce GTX 780 Ti (Perf.Index 530%) – mit den richtigen Taktraten ist natürlich auch etwas mehr erreichbar.

So oder so wäre das Ziel erreichbar, mit zwischen 1920 und 2560 Shader-Einheiten die Performance des GK110-Chips aufzubieten bzw. zu überrunden – wie weit zu überrunden, hängt dann an der konkreten Anzahl verbauter Shader-Einheiten sowie der konkreten Taktraten beim GM204-Chip ab. Bei der Weiterverwendung der 28nm-Fertigung sind keinerlei Taktraten-Problemen zu erwarten, vielmehr könnte nVidia eventuell die Taktraten sogar nochmals steigern. Daß das nur 256bittige Speicherinterface Probleme machen sollte, die damit vorhandene Rohperformance auch auf die Schiene zu bringen, ist wegen der Veränderungen der Maxwell-Architektur – beispielsweise die wirklich großen Caches – glücklicherweise nicht zu befürchten. Damit läßt sich der GM204-Chip derzeit folgendermaßen beschreiben:

    nVidia GM204

  • bestätigt:  Maxwell-Architektur
  • sicher:  geplant für das HighEnd-Segment (Nachfolger des GK104-Chips)
  • ziemlich sicher:  28nm-Fertigung von TSMC, Tape-Out im April 2014
  • ziemlich sicher:  Package-Größe 40x40, damit ~350mm² Chipfläche möglich
  • ziemlich sicher:  Pin-kompatibel zum GK104, damit dasselbe 256 Bit DDR Speicherinterface
  • spekulativ:  DirectX 12 in Hardware
  • vermutlich:  Standard-Speicherbestückung 4 GB GDDR5
  • hochgerechnet:  1920 bis 2560 Shader-Einheiten (samt 120 bis 160 TMUs)
  • hochgerechnet:  Performance-Index auf 1920 Shader-Einheiten ~530% (Niveau GeForce GTX 780 Ti)
  • hochgerechnet:  Performance-Index auf 2560 Shader-Einheiten ~690% (Niveau GeForce GTX 780 Ti +30%)
  • angenommen:  Verkaufsname "GeForce GTX 880 "
  • vermutlich:  Release im Dezember 2014
  • Quellen: 3DCenter Forum, Zauba, eigene Hochrechnungen & Annahmen

Sofern der GM204-Chip wirklich in der 28nm-Fertigung kommt und die Angaben zur Package-Größe sowie zur Pin-Kompatibilität mit dem GK104-Chip passen, wird sich der echte GM204-Chip irgendwo in diesen Daten wiederfinden lassen – sehr viel Platz für Abweichungen sehen wir da nicht mehr, einmal abgesehen von der sowieso schon angegebenen Spannbreite zwischen 1920 und 2560 Shader-Einheiten. Wenn man mal frei spekulieren darf, dürfte nVidia ein GM204-Chip mit einer etwas besseren Performance (+15-20%), als die GeForce GTX 780 Ti (Perf.Index 530%) derzeit bietet, wohl am besten in den Kram passen. Damit könnte man den teureren GK110-Chip im Consumer-Segment ablösen, würde mittels neuer Architektur sowie den Effizienz-Verbesserungen (eventuell auch DirectX 12 in Hardware) den HighEnd-Käufern einen guten Anreiz zum Wechsel bieten und hätte dann sogar noch ein paar Reserven für eine etwas schnellere Variante zu einem späteren Zeitpunkt.

Auch nur im Fall, daß die angenommene "GeForce GTX 880" auf GM204-Basis wirklich schneller ist als die derzeitige GeForce GTX 780 Ti, könnte nVidia höhere Preispunkte realisieren. Niedrigere Preispunkte als derzeit kann man sich – selbst wenn der GM204-Chip kleiner und damit günstiger herzustellen ist – sicherlich abschminken. nVidia wird die "GeForce GTX 880" vielmehr streng nach der damit erreichbaren Performance einpreisen, ergo beim Preis der GeForce GTX 780 Ti plus einen gewissen Aufschlag – konkret könnten es damit 600 Euro oder etwas mehr werden. Nachfolgende, abgespeckte GM204-Modelle dürften dann den Platz von GeForce GTX 770 & 780 besetzen und damit die GK104- und GK110-Chips im Consumer-Segment weitgehend aufs Altenteil schicken. Dies dürfte dann aber erst Anfang 2015 passieren, zuerst einmal steht die "GeForce GTX 880" an – und selbst jene ist mit Releasetermin "Dezember 2014" noch weit genug weg, als daß derzeit wirklich niemand auf diese Karte warten muß.

Nachtrag vom 27. April 2014

Anzuschließen an unsere Hochrechnungen zum GM204-Chip, welche jene mit 1920 bis 2560 Shader-Einheiten sehen, wäre noch der Punkt, daß im Idealfall mit 2560 Shader-Einheiten jene wahrscheinlich nicht gleich in der ersten GM204-basierten Grafikkarten-Variante zu sehen sein werden. Wie der Hochrechnung auch zu entnehmen, ist mit 2560 Shader-Einheiten aufgrund der höheren Effizienz der Maxwell-Architektur problemlos eine Performance in Richtung 30% mehr bei der GeForce GTX 780 Ti möglich. nVidia dürfte jenes Potential anfänglich aber wahrscheinlich nicht voll ausfahren wollen – erstens einmal weil dies maximale Taktraten benötigt, welche anfänglich mit viel Fertigungsausschuß verbunden sind, zum anderen weil man einfach gar nicht so viel Vorsprung gegenüber der GeForce GTX 780 Ti benötigt, um mit dem GM204-Chip eine neue HighEnd-Generation einzuläuten.

So reicht es wohl aus, wenn die sich vermutlich "GeForce GTX 880" nennende erste GM204-Grafikkarte ca. 15% schneller als die GeForce GTX 780 Ti herauskommt – höherere Speicherausstattung, neuere Architektur und möglicherweise auch gleich DirectX 12 in Hardware werden völlig ausreichend sein als Wechselanreiz (vielleicht nicht für die 780Ti-Nutzer, aber für die Nutzer von GeForce GTX 680, 770 und 780 Karten). Erreichbar wäre eine GM204-Grafikkarte mit +15% Performance gegenüber der GeForce GTX 780 Ti schlicht durch maßvolle Taktraten und eine kleine Hardware-Abspeckung mittels der Deaktivierung von ein oder zwei Shader-Clustern. Dies hilft dann gleichzeitig auch, die Fertigungsausbeute hoch zu halten, was bei neu aufgelegten Grafikchips immer ein relevanter Punkt ist. Damit könnte nVidia eine die GeForce GTX 780 Ti gut schlagende "GeForce GTX 880" bringen, hätte aber noch Reserven für eine spätere "GeForce GTX 880 Ti". Diese These funktioniert natürlich nur, wenn der GM204-Chip wirklich gleich 2560 Shader-Einheiten mitbringt – sind es weniger, muß nVidia den GM204 wohl gleich von Anfang an voll ausfahren, um gegenüber der GeForce GTX 780 Ti bestehen zu können.