Der GF100-Chip

Donnerstag, 10. Juni 2010
 / von Leonidas & Mr. Lolman
 

Nur kurz wollen wir an dieser Stelle den GF100-Chip skizzieren, da zu diesem im eigentlichen bereits alles gesagt wurde und sich dieser Artikel sowieso eher auf die praktischen Ergebnisse der entsprechenden GF100-Grafikkarten konzentrieren will. Der GF100-Chip stellt im Gegensatz zur eher evolutionären Entwicklung bei ATIs RV870/Cypress-Chip mal wieder eine gehörige Neuentwicklung dar, da doch einiges im Vergleich zum GT200-Chip der GeForce GTX 200 Serie geändert wurde. So wurde das Verhältnis zwischen der Anzahl von Shader-Einheiten und Textureneinheiten neu gestaltet, gleichzeitig entfällt die zusätzliche MUL-Funktion der Shader-Einheiten und wurde kräftig an den Special Function Units (SFU) herumgeschraubt.

Als elementare Änderung verfügt der GF100-Chip zudem gleich über vier komplette Raster-Engines, was den Dreiecksdurchsatz erheblich in die Höhe treibt – nebenbei steigt auch die Tesselation-Leistung erheblich, da die Tesselations-Einheit Teil der Raster-Engine und bei nVidias GF100-Design somit mehrfach vorhanden ist. Diese Änderung soll den Chip zum einen besser für die Zukunft rüsten – was praktisch abzuwarten bliebe – und zum anderen die Skalierbarkeit der grundsätzlichen Architektur verbessern. Alles in allem liegt hier wohl der wichtigste Punkt des GF100-Chips vor, auch wenn derzeit noch nicht ganz klar ist, ob dieser wirklich einmal so durchschlagenden Nutzen bringen wird.

Radeon HD 5870 GeForce GTX 470 GeForce GTX 480
Chipbasis ATI RV870/Cypress, 2150 Millionen Transistoren in 40nm auf 334mm² Die-Fläche nVidia GF100, ca. 3000 Millionen Transistoren in 40nm auf ca. 529mm² Die-Fläche
Technik DirectX 11, 1 Raster Engine (mit verdoppeltem Triangle-Setup), 1600 Shader-Einheiten, 80 TMUs, 32 ROPs, 256 Bit DDR Interface (bis GDDR5) DirectX 11, 4 Raster Engines, 448 Shader-Einheiten, 56 TMUs, 40 ROPs, 320 Bit DDR Interface (bis GDDR5) DirectX 11, 4 Raster Engines, 480 Shader-Einheiten, 60 TMUs, 48 ROPs, 384 Bit DDR Interface (bis GDDR5)
Shader-Leistung 4/5 der Shader-Einheiten: 1x FMA, restliche 1/5 der Shader-Einheiten: 1x MADD oder 1x FMA (jeweils 2 Flop/Takt/Einheit) 1x FMA (2 Flop/Takt/Einheit)
Spezial-Einheiten 1/5 der Shader-Einheiten (320) können dynamisch als SFU verwendet werden (womit diese Einheiten dann aber nicht mehr als reguläre Shader-Einheiten zur Verfügung stehen) 224 Load/Store-Einheiten + 56 SFUs 240 Load/Store-Einheiten + 60 SFUs
Taktraten 850/2400 MHz 607/1215/1674 MHz 700/1401/1848 MHz
Speichergrößen 1024 oder 2048 MB GDDR5 1280 MB GDDR5 1536 MB GDDR5
Layout DualSlot DualSlot DualSlot
Kartenlänge 282mm 243mm 267mm
Stromanschlüsse 2x 6pol. 2x 6pol. 1x 6pol. + 1x 8pol.
TDP (Idle/Last) 27W/188W 45W/215W 50W/250W
Preislage 370-400 Euro 310-330 Euro 450-480 Euro

Die angegebenen Hardware-Spezifikationen lassen es schon vermuten: Rein auf Basis der theoretischen Werte zur Rechenleistung, Texturierleistung und Speicherbandbreite lassen sich die aktuellen Designs von ATI und nVidia inzwischen unmöglich vergleichen. Nicht einmal zwischen verschiedenen nVidia-Designs ist dieser Vergleich noch zulässig, denn rein von den theoretischen Werten her kommt eine GeForce GTX 285 einer GeForce GTX 470 doch deutlich nahe bzw. überflügelt diese in Teildisziplinen sogar erheblich:

Spezifikations-Vergleich GeForce GTX 285, Radeon HD 5850, GeForce GTX 470, Radeon HD 5870 & GeForce GTX 480

Aus der Praxis ist aber schon bekannt, daß die GeForce GTX 285 natürlich kein Gegner für eine GeForce GTX 470 ist. Dies gilt genauso auch für die Radeon HD 5850, deren theoretischen Werte ebenfalls auf einen Vorteil gegenüber der GeForce GTX 470 hindeuten – und damit wie bekannt falsch liegen. Es kommt heutzutage eben maßgeblich auf die Effizienz und auch auf die kleinen Eigenheiten eines Grafikchip-Designs an – die theoretischen Werte sind demzufolge nicht mehr wie früher noch ein maßgeblicher Indikator für eine zu erwartende Performance, sondern können nur noch als Vergleich zwischen Lösungen auf Basis desselben Grafikchips dienen.

Ein markanter Punkt des neuen nVidia-Designs ist bekannterweise der hohe Stromhunger der GF100-basierten Grafikkarten, welcher mit teilweise über 200 Watt die bisherigen Grenzen für SingleChip-Grafikkarten weit sprengen. Dies ist umso bemerkenswerter, als daß ATI mit dem RV870/Cypress-Chip gegenüber den vorhergehenden RV770/RV790-Chips den Stromhunger der eigenen Boliden wieder etwas zügeln konnte – ATI ist also in dieser Generation beim Punkto Last-Strombedarf im klaren Vorteil. Im Punkto Idle-Strombedarf ist der GF100-Chip angesichts seiner Größe verhältnismäßig gut aufgestellt, verbraucht aber auch hier deutlich mehr als die aktuellen ATI-Beschleuniger (Messungen seitens HT4U):

Idle MultiMonitor Spiele FurMark TDP
GeForce GTX 285 29W ? 186W 214W 204W
GeForce GTX 295 71W 81W 300W 317W 289W
GeForce GTX 470 31W 86W 191W 236W 45/215W
GeForce GTX 480 49W 113W 230W 318W 50/250W
Radeon HD 4870 53W 54W 140W 187W 157W
Radeon HD 4890 58W 58W 154W 211W 190W
Radeon HD 4870 X2 75W ? 303W 373W 286W
Radeon HD 5850 20W 42W 111W 150W 27W/170W
Radeon HD 5870 20W 52W 149W 200W 27W/188W
Radeon HD 5970 43W 44W 216W 291W 42W/294W

Wirklich stromsparend ist das, was nVidia da mit den GF100-basierten Grafikkarten präsentiert hat, also nicht – aber andererseits gehen diese Grafikkarten auch in den einzigen Preisbereich hinein, wo genügend Käufer vorhanden sind, denen der Strombedarf einer Lösung schlicht egal ist. Zwar wird es den einen oder anderen potentiellen Käufer abschrecken, doch in der Mehrheit ist der Käufer im absoluten HighEnd-Segment inzwischen gewohnt, daß man regelmäßig an der Spitze der Stromverbrauchs-Tabelle steht – und dies dürfte somit in der Praxis der Käuferentscheidungen nicht so der ganz große Punkt wie in anderen Preissegmenten sein. Glück für nVidia: Wäre es nicht so, hätte nVidia an dieser Stelle schon verloren, denn dem erheblichen Mehrverbrauch steht kein so deutlicher Vorsprung bei der Performance entgegen.

In der Frage einer besseren Bildqualität hat nVidia leider mit dem GF100-Chip zumindest vom Launch weg kaum neues zu bieten: Es ist nur ein 32x Coverage Sampling Anti-Aliasing hinzugekommen – was angesichts dessen, daß ab DirectX10 die Spiele ihr Anti-Aliasing selber anfordern müssen und viele Spieleentwickler schon damit überfordert sind, wenigstens normales 8x Anti-Aliasing mit in ihre Optionsmenüs einzubauen, eigentlich überhaupt keine große Auswirkung haben wird. Natürlich musste erst einmal ATI mit dem RV870/Cypress-Chip der Radeon HD 5800/5900 Grafikkarten-Serien in der Frage der Bildqualitätsfeatures nachziehen und nVidia ist diesbezüglich nach wie vor mit an der Spitze des derzeit gebotenen.

ATI RV870/Cypress nVidia GF100
standardmäßiger anisotroper Filter winkelunabhängig, brillinearer bis trilinearer Filter, kleinere mitlaufende Optimierungen winkelunabhängig, brilinearer Filter, kleinere mitlaufende Optimierungen
Verbesserungsmöglichkeiten anisotroper Filter keine alle Optimierungen einzeln abschaltbar, zudem ein extra "HighQuality"-Modus: vollkommen winkelunabhängig, volltrilinearer Filter, keine mitlaufenden Optimierungen
Flimmerneigung gering Standard-Modus: gering, "HighQuality"-Modus: kaum noch vorhanden
Multisampling Anti-Aliasing 2x, 4x, 8x sparse grid 2x, 4x, 8x sparse grid
Multisampling Zusatzmodi CustomFilter: 12x, 16x, 24x CoverageSampling: 8x, 16x, 32x
Transparenz Anti-Aliasing Multisampling Multisampling & Supersampling
Supersampling Anti-Aliasing (offiziell) DirectX 9: 2x, 4x, 8x sparse grid -
Supersampling Anti-Aliasing (inoffiziell) DirectX 10/11: 2x, 4x, 8x ordered grid + SS/MS-Mischmodi mittels Downsampling durch das SSAA Tool DirectX 9: 2x, 4x, 8x über Tweak-Tools wie den nHancer
DirectX 10/11: 2x, 4x, 8x ordered grid + SS/MS-Mischmodi mittels Downsampling durch das SSAA Tool
DirectX 9/10/11: 2x, 4x, 8x sparse grid + SS/MS-Mischmodi über das von nVidia gestellte, halboffizielle GeForce SSAA Tool
spielbezogene (automatische) Einstellungsoptionen im Treiber nein, dafür allerdings eine Profilfunktion, welche manuell aktiviert werden muß ja
schneller Profilwechsel über Systray oder Desktop ja nein

Ein Fortschritt sieht jedenfalls anders aus – dabei ist dieser unserer Meinung nach gerade unter DirectX 10/11 inzwischen vonnöten, denn unter diesen APIs liegt die Kontrolle über die grundsätzlichen Anti-Aliasing Einstellungen (welche AA-Art und welche AA-Stufe) beim Spiel und darf vom Treiber her nicht mehr überschrieben werden. Allenfalls Modifikationen in Form der Spezial-Modi "CustomFilter" (ATI) bzw. "CoverageSampling" (nVidia) oder aber eine Zumischung von Transparenz Anti-Aliasing sind – auf Basis der Einstellungen im Spiel selber – noch erlaubt. In der Praxis hat dies eher zu einem etwas geringerem Einsatz von Anti-Aliasing geführt, was kaum im Sinne des Erfinders sein kann.

Vor allem aber behindert diese Vorschrift von DirectX 10/11 nunmehr die weitere Entwicklung von Anti-Aliasing – sofern das Spiel alles selber anfordern muß, ergibt sich hier nämlich ein klassisches Henne-Ei-Problem. Demzufolge ist es auch wenig verwunderlich, daß das Downsampling Supersampling Anti-Aliasing, welches seit DirectX10 jeder Grafikchip beherrschen muß, bislang kaum bekannt und genutzt wurde. Erst kürzlich ergab sich hierzu ein praktikabler Ansatz – aber inzwischen schlummerte diese Funktionalität auch schon vier Jahre ungenutzt in den ATI- und nVidia-Treibern und erst jetzt gibt es mit Serious Sam HD ein allererstes Spiel, welches offiziellen Gebrauch von dieser Möglichkeit der DirectX 10/11 APIs nimmt.

Mit dem neuen 256er Treiber hat nunmehr eine halboffizielle Möglichkeit geschaffen, Supersampling Anti-Aliasing durchgehend nutzen zu können – positiverweise gleich für alle nVidia-Grafikkarten ab der GeForce8-Serie und auch API-übergreifend für DirectX 9, 10 und 11. Damit hat sich nVidia in der Frage der Bildqualitäts-Optionen in letzter Sekunde noch entscheidend nach vorn arbeiten können, ansonsten wäre der Fortschritt in dieser Frage als eher mangelhaft bewertet worden. Jetzt aber kann man durchaus ATI als am Zuge ansehen, denn die Beschränkung des ATI-Supersamplings auf DirectX-9-Titel und nur die Radeon HD 5000 Serie hält natürlich die Konkurrenz mit den neuen nVidia-Möglichkeiten nicht aus.