Was ist von GM206, GM204 & GM200 zu erwarten?

Donnerstag, 24. Juli 2014
 / von Leonidas
 

Wir haben früher an dieser Stelle schon einmal spekuliert, wie die noch kommenden Maxwell-Chips GM206, GM204 und GM200 speziell unter der 28nm-Fertigung aussehen könnten – seinerzeit allerdings noch nicht basierend auf der sicheren Information, daß für dieses Jahr tatsächlich keine 20nm-Fertigung kommt und natürlich noch ohne die Information über die größere Chipfläche des GM204-Chips von immerhin 430mm². Die früheren Spekulationen lauteten auf ~350mm², während nVidia mit der größeren Chipfläche nun anscheinend eher klotzt als kleckert – mit Auswirkungen natürlich auch auf die anderen Maxwell-Chips.

Chipfläche Technik Perf.-Index
GM107 148mm² 1 Raster-Engine, 640 Shader-Einheiten, 40 TMUs, 16 ROPs, 128 Bit DDR Interface, 1/2 GB Speicher max. 210%
GM206 ? ? ?
GM204 ~430mm² ?, 256 Bit DDR Interface, 4 GB Speicher ?
GM200 ? ? ?
Diese Tabelle enthält ausschließlich bestätigte oder zumindest halbwegs sichere Angaben.

Klar werden mit der größeren Chipfläche des GM204-Chips zwei Dinge: Erstens einmal dürfte der GM200-Chip bei der Chipfläche ebenfalls sehr groß werden, wahrscheinlich sogar den größten jemals gefertigten nVidia-Chip ergeben. 600mm² Chipfläche kann man beim GM200-Chip durchaus annehmen, eventuell wird es auch leicht mehr (wie groß Grafikchips derzeit werden können). Hier kommen einfach die beiden (für die Chipfläche) ungünstigen Punkte zusammen, daß nVidia beim GM200 viele beim GM204-Chip noch fehlende Transistoren für professionelle Zwecke einbauen muß, sowie daß natürlich trotzdem ein gewisses Leistungsplus (auch im Gaming-Bereich) gegenüber dem GM204-Chip erzielt werden muß.

Und zweitens dürfte der GM206-Chip wohl etwas größer werden als bislang vermutet (~230mm²). Ausgehend von den 148mm² des GM107-Chips sowie den ~430mm² des GM204-Chips kann man den GM206-Chip beim Mittel des doppelten GM107-Chips sowie der Hälfte des GM204-Chips neu einordnen, sprich bei ~250mm² Chipfläche. Diese Rechnung trifft natürlich nur zu, sofern nVidia den GM206-Chip auch wirklich Performance-mäßig genau zwischen GM107 und GM204 setzen will – dies darf man sicherlich annehmen, in trockenen Tüchern ist dies aber natürlich noch lange nicht. In jedem Fall würde der GM206-Chip auf immerhin ~250m² Chipfläche die klare Aufgabe zukommen, den GK104-Chip (294mm²) von der Performance her weitestgehend einzuholen, ansonsten würde sich dieser hohe Silizium-Aufwand kaum lohnen.

Ausgehend von den bekannten und angenommen Chipflächen lassen sich dann verschiedene Prognosen zu den verbauten Hardware-Einheiten aufstellen. Einzurechnen wäre hierbei immer, daß Maxwell-Shader nicht mit Kepler-Shadern gleichzusetzen sind, da Aufbau und Leistungsfähigkeit der Shader-Cluster zwischen beiden Architekturen erheblich differieren. nVidia gibt immerhin einen taktnormierten Vorteil von +35% pro Shader-Einheit zwischen Kepler und Maxwell an, welcher sich u.a. schon in der sehr überzeugenden Performance der GeForce GTX 750 Serie gezeigt hat. Selbst wenn die Zahl von +35% vielleicht idealisiert ist, kann man grob sagen, daß Maxwell-Chips weniger Shader-Einheiten benötigen, um auf die gleiche Performance wie Kepler-Grafikchips zu kommen. Nachfolgende Hochrechnung zu den bei GM206, GM204 und GM200 möglichen Hardware-Daten basiert auf einer Ausarbeitung in unserem Forum, ergänzt noch um einige weitere Angaben:

GM206 GM204 GM200
Chipfläche ~250mm² ~430mm² ~600mm²
Speicherinterface 192 Bit DDR
(Annahme)
256 Bit DDR
(sicher)
384 Bit DDR
(Annahme)
Shader-Einheiten: konservative Schätzung 1152
(9 SMM)
2304
(18 SMM)
3072-3200
(24-25 SMM)
Shader-Einheiten: mittlere Schätzung 1280
(10 SMM)
2560
(20 SMM)
3328-3584
(26-28 SMM)
Shader-Einheiten: maximale Schätzung 1536
(12 SMM)
3072
(24 SMM)
3840-4096
(30-32 SMM)

Wie man sieht, überschneiden sich die Schätzungen zur Anzahl der Shader-Einheiten teilweise sogar: Die minimale Schätzung zum GM200-Chip von 3072 Shader-Einheiten entspricht der maximalen Schätzung zum GM204-Chip (von ebenfalls 3072 Shader-Einheiten). Allerdings sind minimale und maximale Schätzungen auch eher nur der Form halber angegeben, um die maximal mögliche Streubreite dieser Schätzungen besser eingrenzen zu können. Wir denken, die mittlere Schätzung dürfte wohl ziemlich nahe an dem dran sein, was letztlich von GM206, GM204 und GM200 kommen wird.

Interessanterweise haben die unterschiedlichen Schätzungen über die Anzahl der Shader-Einheiten keine so große Auswirkung auf das Performance-Ziel der jeweiligen Grafikchips, wie man vielleicht vermuten würde. Hier kommt der Effekt hinzu, daß vergleichsweise große Grafikchips immer etwas niedriger getaktet werden müssen, während man vergleichsweise kleine Grafikchips beim Takt einfach etwas weiter treiben kann. Speziell durch den Punkt, daß auch die Maxwell-Architektur nun noch in der 28nm-Fertigung antreten muß, ergibt sich somit automatisch das Ziel, effektiver als die vorhergehenden Kepler-Chips zu werden, sprich eine vergleichbare Performance mit einer kleineren Chipfläche liefern zu können.

Beim GM107-Chip ist dies schon weitgehend hervorragend gelungen: Die GeForce GTX 750 Serie ersetzt die GeForce GTX 650 Ti & 650 Ti "Boost" auf einem viel kleinerem Chip (148mm² des GM107 gegenüber den 221mm² des GK106). Die größte GK106-Ausführung in Form der GeForce GTX 660 kann der GM107-Chip allerdings nicht ersetzen, dafür ist der Ansatz des GM107-Chips dann doch zu klein. Dies ist allerdings nur ein Schönheitsfehler, schließlich hat die größte GK106-Ausführung auch den höchsten Preispunkt und ist damit noch am ehesten dafür geeignet, in der Nachfolge-Generation durch einen flächenmäßig größeren Chip ersetzt zu werden. Wichtig aus kalkulatorischer Sicht ist für nVidia zuerst, daß die kleinen, preisgünstigeren Lösungen durch neue Grafikchips mit kleinerer Chipfläche und damit geringeren Kosten ersetzt werden – beispielsweise wie folgendermaßen skizziert:

Kepler Maxwell
GeForce GTX 650 Ti  (Perf.Index: 170%)
Chipbasis: GK106, 221mm²
GeForce GTX 750  (Perf.Index 185%)
Chipbasis: GM107, 148mm²
GeForce GTX 650 Ti "Boost"  (Perf.Index: 220%)
Chipbasis: GK106, 221mm²
GeForce GTX 750 Ti  (Perf.Index 210%)
Chipbasis: GM107, 148mm²
GeForce GTX 660  (Perf.Index: 250%)
Chipbasis: GK106, 221mm²
GeForce GTX 860
Chipbasis: GM206, ~260mm²
GeForce GTX 660 Ti  (Perf.Index: 280%)
Chipbasis: GK104, 294mm²
GeForce GTX 760  (Perf.Index: 310%)
Chipbasis: GK104, 294mm²
GeForce GTX 860 Ti
Chipbasis: GM206, ~260mm²
GeForce GTX 770  (Perf.Index: 380%)
Chipbasis: GK104, 294mm²
GeForce GTX 780  (Perf.Index: 440%)
Chipbasis: GK110, 561mm²
GeForce GTX 870
Chipbasis: GM204, ~430mm²
GeForce GTX 780 Ti  (Perf.Index: 530%)
Chipbasis: GK110, 561mm²
GeForce GTX 880
Chipbasis: GM204, ~430mm²
- GeForce GTX Titan II
Chipbasis: GM200, ~600mm²

Der GM206-Chip muß dann mit einer Chipfläche von ~250mm² sowohl die GeForce GTX 660 als auch weite Teile des GK104-Portfolio abdecken, sprich wenigstens in die Nähe der GK104-Performance kommen. Wir erwarten, egal wieviel Hardware-Einheiten der GM206 letztlich trägt, eine Performance irgendwo in Richtung der GeForce GTX 680 (Perf.Index 360%). Damit kann nVidia das gesamte GK104-Portfolio außerhalb der GeForce GTX 770 (Perf.Index 380%) durch einen kleineren und damit kostengünstigeren Chip in Form des GM206 ersetzen. Die derzeit herunterbrechenden Preispunkte in diesem Marktsegment empfehlen sowieso in jedem Fall die Benutzung eines kleineren Grafikchips für diese Zwecke. Sofern nVidia wirklich beim GM206 auf ein 192 Bit DDR Speicherinterface setzt, kann man damit auch endlich einmal die default-Speicherbestückung auf 3 GB hochheben und in dieser Frage einen durchaus bedeutsamen Nachteil gegenüber den AMD-Konkurrenzangeboten beseitigen.

Der nächstgrößere GM204-Chip wird mit einer Chipfläche von 430mm² ziemlich "dick" für einen reinen HighEnd-Chip unterhalb des "Topdogs" GM200 ausfallen – und muß damit deutlich höhere Aufgaben erfüllen. Aller Vermutung nach kann nVidia den GM204 benutzen, um sich mit der GeForce GTX 780 Ti anzulegen bzw. jene leicht zu schlagen. Erreicht nVidia diese Zielsetzung, kann der für Gamer-Zwecke sowieso nicht wirklich effektive (weil große und damit teure) GK110-Chip (561mm²) durch den viel kleineren und damit für nVidia kostengünstigeren GM204-Chip (~430mm²) komplett ersetzt werden. Angesichts der heutigen Anforderungen (und des bestätigten 256 Bit DDR Speicherinterface) dürfte nVidia den Generations-Wechsel zudem dazu benutzt, um im HighEnd-Segment zukünftig eine default-Speicherbestückung von 4 GB anzubieten, um in dieser Frage ebenfalls mit AMD gleichzuziehen.

Für den übrigbleibenden GM200-Chip als nVidias neuen Spitzenchip sind die Aufgaben noch einfach zu definieren: Sowohl soll die Eignung für professionelle Zwecke sichergestellt werden, als auch im Gamer-Segment ein ausreichender Performance-Abstand zum GM204-Chip gefunden werden, damit der GM200-Chip klarer Performance-Leader wird. Aufgrund des eher geringen Sprungs bei der Chipfläche von ~430mm² auf ~600mm² (bei der Kepler-Generation lautete dieser Sprung immerhin von 294mm² auf 561mm²) sind hier keinesfalls Wunderdinge zu erwarten, die Performance der beiden Maxwell-Grafikchips wird deutlich näher aneinanderrücken als dies unter der Kepler-Generation der Fall war: Bei der Kepler-Architektur hatten die beiden Spitzenchips einen Performance-Abstand von auch nur 40% (GeForce GTX 770 zu 780 Ti), bei Maxwell sind demzufolge aufgrund der Hardware-Ansetzungen bestenfalls ~25% Performance-Differenz zwischen GM204 und GM200 zu erwarten.

Damit ist dem GM200-Chip eine Performance möglich, welche auf die GeForce GTX 780 Ti ungefähr 30% oben drauf setzt – nicht viel, aber durchaus ausreichend für einen neuen Grafikchip und immer noch ziemlich viel angesichts derselben verwendeten 28nm-Fertigung. Von einer Verbreiterung des Speicherinterfaces beim GM200-Chip gehen wir im übrigen nicht mehr aus: Die Limitationen bei der maximal möglichen Chipfläche sind einfach so hoch, genauso aber auch zeigt nVidias Maxwell-Architektur mit der GeForce GTX 750 Serie eindrucksvoll, wie man auch mit wenig nomineller Speicherbandbreite sehr gut zurechtzukommt. Das angenommene 384 Bit DDR Speicherinterface beim GM200-Chip sollte demzufolge zu einer default-Speicherbestückung von 6 GB führen. Aber vermutlich wird nVidia den GM200-Chip aufgrund seiner Größe und seiner Kosten im Gaming-Bereich sowieso nur für Titan-Grafikkarten einsetzen, hierfür sind die genannten 6 GB Speicher absolut passend.

Chipfläche Technik Perf.-Index
GM107 148mm² 1 Raster-Engine, 640 Shader-Einheiten, 40 TMUs, 16 ROPs, 128 Bit DDR Interface, 1/2 GB Speicher max. 210%
GM206 ~250mm² 2 Raster-Engines, 1280 Shader-Einheiten, 80 TMUs, 24 ROPs, 192 Bit Interface, 3 GB Speicher Richtung ~350%
(Niveau GeForce GTX 680)
GM204 ~430mm² 3 Raster-Engines, 2560 Shader-Einheiten, 160 TMUs, 32 ROPs, 256 Bit Interface, 4 GB Speicher Richtung ~550%
(Niveau GeForce GTX 780 Ti)
GM200 ~600mm² 4 Raster-Engines, 3584 Shader-Einheiten, 224 TMUs, 48 ROPs, 384 Bit Interface, 6 GB Speicher Richtung ~700%
(Niveau GeForce GTX 780 Ti +30%)
Diese Tabelle enthält sowohl sichere Angaben (Normalschrift) als auch vermutete Angaben (Kursivschrift).

Viel mehr sollte man nicht erwarten: nVidia könnte uns natürlich mit besonders viel Shader-Einheiten oder/und einem 512 Bit DDR Speicherinterface überraschen, besonders wahrscheinlich ist dies aufgrund des damit explodierenden Flächenbedarfs allerdings nicht. Vorstehende Schätzungen zu Hardware-Daten und Performance-Aussichten von GM206, GM204 und GM200 sind vielmehr gute mittlere Schätzungen, welche damit eine deutlich höhere Chance auf Wahrheitsgehalt haben, als aus der Luft gegriffene Phantasiezahlen, die unter der zur Verfügung stehenden 28nm-Fertigung technisch kaum realisierbar sein dürften.

Trotzdem können wir uns natürlich auch mit diesem Artikel maßgeblich irren – nVidia könnte völlig andere Absichten und Zielsetzungen verfolgen. Wieviel hier noch auf Annahmen basiert, läßt sich gut am Vergleich von oberster und unterster Tabelle dieses Artikels ablesen: Die unterste ist mit Annahmen gefüllt, die oberste dagegen fast leer, da in jener obersten Tabelle nur sichere Daten notiert wurden. Die Zeit wird letztlich zeigen, wie weit diese unsere Annahmen von der tatsächlich eintreffenden Wahrheit entfernt liegen.

Grafikchip-Gerüchteküche 14. April:  Bringt AMD mit "Fiji" einen Monsterchip mit ca. 600mm² Chipfläche?
18. April:  nVidias Maxwell-Chips GM204 & GM206 legen Tape-Out für die 28nm-Fertigung hin
25. April:  nVidias GM204-Chip kommt hochgerechnet mit 1920 bis 2560 Shader-Einheiten
27. Mai:  Zwei neue AMD-Grafikchips indirekt bestätigt: Iceland & Tonga
8. Juni:  Erscheint AMDs Tonga-Grafikchip im September als Ablösung des Tahiti-Chips?
8. Juni:  Überblick über die kommenden Grafikchips von AMD und nVidia
16. Juni:  nVidias GM200-Chip hat offenbar seinen Tape-Out hinter sich gebracht
1. Juli:  Kommt AMDs Tonga-Grafikchip bereits im August?
2. Juli:  nVidia GM204-Chip: Chipfläche von ~430mm² ermöglicht bis zu 3072 Shader-Einheiten
10. Juli:  nVidias GM200-Chip erstmals gesichtet
15. Juli:  AMD hat zwei neue HighEnd-Grafikchips in Vorbereitung: "Bermuda" & "Fiji"