20

Was vom nVidia GK110-Chip zu erwarten ist

Nachdem nVidia den GK104-Chip in Form der GeForce GTX 680 am Donnerstag (vermutlich nVidia-typisch 15 Uhr deutscher Zeit) vorstellen wird, geht der Blick der Hardware-Enthusiasten schon wieder in Richtung des eigentlichen HighEnd-Chips der Kepler-Serie, dem GK110-Chip. Dieser soll deutlich später erst im Spätsommer antreten, weswegen nVidia den GK104-Chip mit den passenden Taktraten eher kurzfristig noch auf HighEnd-Niveau gehievt hat – somit kann sich dieser mit der Radeon HD 7970 messen und nVidia ist nicht in Zugzwang, den GK110 so schnell herausbringen zu müssen. Und nachdem zum GK104-Chip nunmehr nahezu alles bekannt ist, schießen natürlich die Spekulationen über den GK110 ins Kraut – wobei gewisse Eckdaten mit einer gewissen Sicherheit bekannt sind:

    nVidia GK110

  • Chipfläche ~550mm² (in 28nm-Fertigung bei TSMC)
  • runde 6 Milliarden Transistoren
  • DirectX 11.1 Kepler-Architektur
  • höchstwahrscheinlich (gegenüber dem GK104) anderer Aufbau der Shader-Cluster (SMX)
  • klar mehr als 2000 (1D) Shader-Einheiten (Richtung 2500 Shader-Einheiten)
  • 2+ TeraFlops DoublePrecision-Rechenleistung, dementsprechend wohl 4+ TeraFlops SinglePrecision-Rechenleistung
  • 512 Bit DDR Speicherinterface
  • Spiele-Stromverbrauch 250 bis 300 Watt
  • Tape-Out erst nach Januar 2012, Launch nicht vor August 2012

Nachdem der Gamer-Bereich mit der GeForce GTX 680 gut abgedeckt scheint, dürfte das Augenmerk von nVidia beim GK110-Chip noch viel stärker auf die professionellen Anwender gehen als bei den letzten HighEnd-Chips. Dafür wird man zuerst einmal so viel Chipfläche in Anspruch nehmen, wie überhaupt noch sinnvoll zu fertigen sind – ergo runde 550mm², was sich als größtmögliche sinnvoll zu fertigende Chipfläche über die Jahre herauskristallisiert hat. Darin kann nVidia ungefähr 6 Milliarden Transistoren packen, legt man die Transistoren-Packdichte des GK104-Chips zugrunde. Damit zeigt der GK110-Chip auch gleich an, wohin man sich im Vergleich zu AMDs Topchip R1000/Tahiti stellt: Dieser holt seine Leistung aus "nur" 4,3 Milliarden Transistoren heraus und ist mit dieser weit kleineren Transistorenmenge natürlich kein Gegner für den GK110-Chip.

Da die DoublePrecision-Rechenleistung des GK110 bei 2+ TeraFlops liegen soll, ergeben sich schon gewisse Hinweise auf die Anzahl der verbauten Hardware-Einheiten: Gesetzt den Fall eines (wahrscheinlichen) 1:2-Verhältnisses zwischen SinglePrecision und DoublePrecision beim GK110-Chip, dürften 2+ TeraFlops DoublePrecision-Rechenleistung demzufolge wohl 4+ TeraFlops SinglePrecision-Rechenleistung ergeben. Angenommen eines Chiptaktes von ~800 MHz (die 1006 MHz Chiptakt wie beim GK104-Chip erscheinen bei einem so voluminösen Design kaum erreichbar) benötigt man dafür mindestens 2500 Shader-Einheiten. Je nachdem wieviel es über die 4 TeraFlops SinglePrecision-Rechenleistung hinaus geht, könnte es auch mehr Shader-Einheiten (oder mehr Taktrate) sein.

Gleich 3000 Shader-Einheiten sind allerdings eher nicht zu erwarten, da dies eine glatte Verdopplung gegenüber dem GK104-Chip darstellt und nVidia beim GK110-Chip nur runde 87 Prozent mehr Chipfläche zur Verfügung steht – in welche schließlich auch noch die ganzen für GPGPU relevanten Transistoren gequetscht werden müssen. Gewisse Einsparungen kann nVidia nur bei der Organisation der Shader-Cluster (SMX) machen, welche wahrscheinlich komplett anders aussehen werden als beim GK104-Chip und den kleineren Kepler-Chips: Vermutlich kommt man mit weniger Textureneinheiten pro Shader-Einheit aus, so daß wie beim GK104-Chip für den gesamten Chip wahrscheinlich wieder 128 Textureneinheiten erreicht werden – mehr muß aus heutiger Sicht nicht wirklich sein.

Dies ist dann aber schon fast die einzige Einsparung des GK110-Designs gegenüber dem GK104-Design, ansonsten kommen nur mehr Funktionen und Transistoren hinzu: Größere Caches, mehr Register, DoublePrecision-Einheiten – alles zugunsten von GPGPU, was den GK110-Chip "fett" macht und daher die Anzahl der verbaubaren Shader-Einheiten limitiert. Hierzu zählt auch das (ziemlich sicher) auf 512 Bit DDR verbreitere Speicherinterface, welches für Gamer-Belange sicherlich kaum mehr als 384 Bit DDR betragen müsste. Im GPGPU-Bereich schätzt man allerdings noch mehr Speicherbandbreite und nVidia will natürlich mit dem GK110 den bestmöglichen GPGPU-Chip vorstellen, nachdem AMD spätestens mit dem GCN-Design der Southern-Islands-Reihe beginnt, auch in diesem Segment zu wildern. Trotz der klaren GPGPU-Ausrichtung des GK110-Chips soll am Ende jedoch ein größerer Performanceunterschied zwischen GK110 und GK104 herauskommen als von zwischen GF110 (GeForce GTX 580) und GF114 (GeForce GTX 560 Ti) bekannt.

Dies kann man auch einfach an der jeweils zur Verfügung stehenden Chipfläche ermessen: Zwischen GF110 und GF114 hatte nVidia nur 45 Prozent mehr Chipfläche zur Verfügung, da der GF114-Chip recht groß ausgefallen war. Zwischen GK110 und GK104 stehen nun anscheinend sogar runde 87 Prozent mehr Chipfläche zur Verfügung, was wesentlich mehr Platz für eine höhere Performance läßt. Wenn nVidia aus den genannten 45 Prozent mehr Chipfläche zwischen GF110 und GF114 also runde 35% mehr Spiele-Performance zwischen GeForce GTX 580 und GeForce GTX 560 Ti herausgeholt hat, sollte man theoretisch zwischen GK110 und GK104 in Richtung 70 Prozent mehr Spiele-Performance herausholen können. Diese Milchmädchenrechnung wird allerdings gemindert durch den Umstand, daß nVidia sich entschließen könnte (und wahrscheinlich wird), noch mehr von der zur Verfügung stehenden Chipfläche für GPGPU-Zwecke zu opfern. Eine seriöse Performanceschätzung zum GK110-Chip lautet somit auf ca. 50% mehr Spiele-Performance gegenüber dem GK104-Chip der GeForce GTX 680.

AMD R1000/Tahiti nVidia GK104 nVidia GK110
Chipfläche 365mm² 294mm² ca. 550mm² (+87%)
Transistoren 4,3 Milliarden 3,54 Milliarden ca. 6 Milliarden (+69%)
SP-Rechenleistung 3,79 TFlops 3,09 TFlops 4+ TFlops (>= +29%)
Speicherinterface 384 Bit DDR 256 Bit DDR 512 Bit DDR (+100%)
Spiele-Performance 330%
(Radeon HD 7970)
~330%
(GeForce GTX 680)
ca. 495% (+50%)
Spiele-Stromverbrauch 211 Watt ~185 Watt 250-300 Watt
Listenpreis 549 Dollar 549 Dollar $$$
Launch 22. Dezember 2011 22. März 2012 August 2012

Sofern diese 50 Prozent auch nur annähernd erreicht werden, kann man schon zufrieden sein, denn dies wäre wie gesagt deutlich mehr als zwischen GeForce GTX 560 Ti und GeForce GTX 580 zu beobachten – und am Ende legt man diese Performance schließlich auf die GeForce GTX 680 oben drauf, welche sich augenscheinlich nun doch schon mit der Radeon HD 7970 messen kann. Sollten diese Vorhersagen so zutreffen, würde die Top-SingleChip-Lösung der Kepler-Generation um 50 Prozent vor der Top-Singlechip-Lösung von Southern Islands liegen – dies wäre deutlich mehr als zwischen dem Fermi-Refresh und Northern Islands (GeForce GTX 580 zu Radeon HD 6970, ca. 15-20% Performance-Differenz). Zwei klare Nachteile dürften mit dieser hohen GK110-Performance allerdings einhergehen: Erstens einmal wird der Stromverbrauch neue Höhen erreichen, diesesmal sollte es klarer über die 250-Watt-Marke gehen als noch zuletzt. Da nVidia aber mit dem GK110-Chip augenscheinlich keine DualChip-Lösung plant (sondern diese wohl auf Basis des GK104-Chips kommen wird), muß dies nVidia produkttechnisch nicht wirklich stören.

Und zweitens dürften Grafikkarten auf Basis des GK110-Chips natürlich einen gesalzenen Preispunkt haben. Geht man nur einmal von den aktuellen Preisen der Radeon HD 7970 knapp unter 500 Euro aus und legt dort nur 50 Prozent oben drauf, kommt man sofort auf über 700 Euro – und da ist der übliche Preisaufschlag für das schnellste Modell am Markt noch gar nicht einkalkuliert. Allerdings muß es nicht unbedingt zu solchen Extrempreisen (für eine SingleChip-Lösung) kommen, denn der Preis für GK110-Grafikkarten wird nicht jetzt im März festgesetzt – sondern erst im August auf Basis der dann (hoffentlich) veränderten Preislagen von Radeon HD 7970 und GeForce GTX 680. Wenn man darauf spekuliert, daß Radeon HD 7970 und GeForce GTX 680 im August vielleicht "nur" noch 400 Euro kosten, könnte eine GK110-Grafikkarte dann vielleicht für 600 Euro starten. Wirklich billig wird der Spaß aber ganz sicher nicht, dafür scheint nVidia in dieser ersten 28nm-Generation zumindest mit dem GK110-Chip (aufgrund des deutlich höheren Silizium-Einsatzes) viel zu weit vorn zu liegen.