Nur kurz wollen wir an dieser Stelle den GF100-Chip skizzieren, da zu diesem im eigentlichen bereits alles gesagt wurde und sich dieser Artikel sowieso eher auf die praktischen Ergebnisse der entsprechenden GF100-Grafikkarten konzentrieren will. Der GF100-Chip stellt im Gegensatz zur eher evolutionären Entwicklung bei ATIs RV870/Cypress-Chip mal wieder eine gehörige Neuentwicklung dar, da doch einiges im Vergleich zum GT200-Chip der GeForce GTX 200 Serie geändert wurde. So wurde das Verhältnis zwischen der Anzahl von Shader-Einheiten und Textureneinheiten neu gestaltet, gleichzeitig entfällt die zusätzliche MUL-Funktion der Shader-Einheiten und wurde kräftig an den Special Function Units (SFU) herumgeschraubt.
Als elementare Änderung verfügt der GF100-Chip zudem gleich über vier komplette Raster-Engines, was den Dreiecksdurchsatz erheblich in die Höhe treibt – nebenbei steigt auch die Tesselation-Leistung erheblich, da die Tesselations-Einheit Teil der Raster-Engine und bei nVidias GF100-Design somit mehrfach vorhanden ist. Diese Änderung soll den Chip zum einen besser für die Zukunft rüsten – was praktisch abzuwarten bliebe – und zum anderen die Skalierbarkeit der grundsätzlichen Architektur verbessern. Alles in allem liegt hier wohl der wichtigste Punkt des GF100-Chips vor, auch wenn derzeit noch nicht ganz klar ist, ob dieser wirklich einmal so durchschlagenden Nutzen bringen wird.
Radeon HD 5870 | GeForce GTX 470 | GeForce GTX 480 | |
---|---|---|---|
Chipbasis | ATI RV870/Cypress, 2150 Millionen Transistoren in 40nm auf 334mm² Die-Fläche | nVidia GF100, ca. 3000 Millionen Transistoren in 40nm auf ca. 529mm² Die-Fläche | |
Technik | DirectX 11, 1 Raster Engine (mit verdoppeltem Triangle-Setup), 1600 Shader-Einheiten, 80 TMUs, 32 ROPs, 256 Bit DDR Interface (bis GDDR5) | DirectX 11, 4 Raster Engines, 448 Shader-Einheiten, 56 TMUs, 40 ROPs, 320 Bit DDR Interface (bis GDDR5) | DirectX 11, 4 Raster Engines, 480 Shader-Einheiten, 60 TMUs, 48 ROPs, 384 Bit DDR Interface (bis GDDR5) |
Shader-Leistung | 4/5 der Shader-Einheiten: 1x FMA, restliche 1/5 der Shader-Einheiten: 1x MADD oder 1x FMA (jeweils 2 Flop/Takt/Einheit) | 1x FMA (2 Flop/Takt/Einheit) | |
Spezial-Einheiten | 1/5 der Shader-Einheiten (320) können dynamisch als SFU verwendet werden (womit diese Einheiten dann aber nicht mehr als reguläre Shader-Einheiten zur Verfügung stehen) | 224 Load/Store-Einheiten + 56 SFUs | 240 Load/Store-Einheiten + 60 SFUs |
Taktraten | 850/2400 MHz | 607/1215/1674 MHz | 700/1401/1848 MHz |
Speichergrößen | 1024 oder 2048 MB GDDR5 | 1280 MB GDDR5 | 1536 MB GDDR5 |
Layout | DualSlot | DualSlot | DualSlot |
Kartenlänge | 282mm | 243mm | 267mm |
Stromanschlüsse | 2x 6pol. | 2x 6pol. | 1x 6pol. + 1x 8pol. |
TDP (Idle/Last) | 27W/188W | 45W/215W | 50W/250W |
Preislage | 370-400 Euro [3] | 310-330 Euro [4] | 450-480 Euro [5] |
Die angegebenen Hardware-Spezifikationen lassen es schon vermuten: Rein auf Basis der theoretischen Werte zur Rechenleistung, Texturierleistung und Speicherbandbreite lassen sich die aktuellen Designs von ATI und nVidia inzwischen unmöglich vergleichen. Nicht einmal zwischen verschiedenen nVidia-Designs ist dieser Vergleich noch zulässig, denn rein von den theoretischen Werten her kommt eine GeForce GTX 285 einer GeForce GTX 470 doch deutlich nahe bzw. überflügelt diese in Teildisziplinen sogar erheblich:
Aus der Praxis ist aber schon bekannt, daß die GeForce GTX 285 natürlich kein Gegner für eine GeForce GTX 470 ist. Dies gilt genauso auch für die Radeon HD 5850, deren theoretischen Werte ebenfalls auf einen Vorteil gegenüber der GeForce GTX 470 hindeuten – und damit wie bekannt falsch liegen. Es kommt heutzutage eben maßgeblich auf die Effizienz und auch auf die kleinen Eigenheiten eines Grafikchip-Designs an – die theoretischen Werte sind demzufolge nicht mehr wie früher noch ein maßgeblicher Indikator für eine zu erwartende Performance, sondern können nur noch als Vergleich zwischen Lösungen auf Basis desselben Grafikchips dienen.
Ein markanter Punkt des neuen nVidia-Designs ist bekannterweise der hohe Stromhunger der GF100-basierten Grafikkarten, welcher mit teilweise über 200 Watt die bisherigen Grenzen für SingleChip-Grafikkarten weit sprengen. Dies ist umso bemerkenswerter, als daß ATI mit dem RV870/Cypress-Chip gegenüber den vorhergehenden RV770/RV790-Chips den Stromhunger der eigenen Boliden wieder etwas zügeln konnte – ATI ist also in dieser Generation beim Punkto Last-Strombedarf im klaren Vorteil. Im Punkto Idle-Strombedarf ist der GF100-Chip angesichts seiner Größe verhältnismäßig gut aufgestellt, verbraucht aber auch hier deutlich mehr als die aktuellen ATI-Beschleuniger (Messungen seitens HT4U [6]):
Idle | MultiMonitor | Spiele | FurMark | TDP | |
---|---|---|---|---|---|
GeForce GTX 285 | 29W | ? | 186W | 214W | 204W |
GeForce GTX 295 | 71W | 81W | 300W | 317W | 289W |
GeForce GTX 470 | 31W | 86W | 191W | 236W | 45/215W |
GeForce GTX 480 | 49W | 113W | 230W | 318W | 50/250W |
Radeon HD 4870 | 53W | 54W | 140W | 187W | 157W |
Radeon HD 4890 | 58W | 58W | 154W | 211W | 190W |
Radeon HD 4870 X2 | 75W | ? | 303W | 373W | 286W |
Radeon HD 5850 | 20W | 42W | 111W | 150W | 27W/170W |
Radeon HD 5870 | 20W | 52W | 149W | 200W | 27W/188W |
Radeon HD 5970 | 43W | 44W | 216W | 291W | 42W/294W |
Wirklich stromsparend ist das, was nVidia da mit den GF100-basierten Grafikkarten präsentiert hat, also nicht – aber andererseits gehen diese Grafikkarten auch in den einzigen Preisbereich hinein, wo genügend Käufer vorhanden sind, denen der Strombedarf einer Lösung schlicht egal ist. Zwar wird es den einen oder anderen potentiellen Käufer abschrecken, doch in der Mehrheit ist der Käufer im absoluten HighEnd-Segment inzwischen gewohnt, daß man regelmäßig an der Spitze der Stromverbrauchs-Tabelle steht – und dies dürfte somit in der Praxis der Käuferentscheidungen nicht so der ganz große Punkt wie in anderen Preissegmenten sein. Glück für nVidia: Wäre es nicht so, hätte nVidia an dieser Stelle schon verloren, denn dem erheblichen Mehrverbrauch steht kein so deutlicher Vorsprung bei der Performance entgegen.
In der Frage einer besseren Bildqualität hat nVidia leider mit dem GF100-Chip zumindest vom Launch weg kaum neues zu bieten: Es ist nur ein 32x Coverage Sampling Anti-Aliasing hinzugekommen – was angesichts dessen, daß ab DirectX10 die Spiele ihr Anti-Aliasing selber anfordern müssen und viele Spieleentwickler schon damit überfordert sind, wenigstens normales 8x Anti-Aliasing mit in ihre Optionsmenüs einzubauen, eigentlich überhaupt keine große Auswirkung haben wird. Natürlich musste erst einmal ATI mit dem RV870/Cypress-Chip der Radeon HD 5800/5900 Grafikkarten-Serien in der Frage der Bildqualitätsfeatures nachziehen und nVidia ist diesbezüglich nach wie vor mit an der Spitze des derzeit gebotenen.
ATI RV870/Cypress | nVidia GF100 | |
---|---|---|
standardmäßiger anisotroper Filter | winkelunabhängig, brillinearer bis trilinearer Filter, kleinere mitlaufende Optimierungen | winkelunabhängig, brilinearer Filter, kleinere mitlaufende Optimierungen |
Verbesserungsmöglichkeiten anisotroper Filter | keine | alle Optimierungen einzeln abschaltbar, zudem ein extra "HighQuality"-Modus: vollkommen winkelunabhängig, volltrilinearer Filter, keine mitlaufenden Optimierungen |
Flimmerneigung | gering | Standard-Modus: gering, "HighQuality"-Modus: kaum noch vorhanden |
Multisampling Anti-Aliasing | 2x, 4x, 8x sparse grid | 2x, 4x, 8x sparse grid |
Multisampling Zusatzmodi | CustomFilter: 12x, 16x, 24x | CoverageSampling: 8x, 16x, 32x |
Transparenz Anti-Aliasing | Multisampling | Multisampling & Supersampling |
Supersampling Anti-Aliasing (offiziell) | DirectX 9: 2x, 4x, 8x sparse grid | - |
Supersampling Anti-Aliasing (inoffiziell) | DirectX 10/11: 2x, 4x, 8x ordered grid + SS/MS-Mischmodi mittels Downsampling durch das SSAA Tool [7] | DirectX 9: 2x, 4x, 8x über Tweak-Tools wie den nHancer [8] DirectX 10/11: 2x, 4x, 8x ordered grid + SS/MS-Mischmodi mittels Downsampling durch das SSAA Tool [7] DirectX 9/10/11: 2x, 4x, 8x sparse grid + SS/MS-Mischmodi über das von nVidia gestellte, halboffizielle GeForce SSAA Tool [9] |
spielbezogene (automatische) Einstellungsoptionen im Treiber | nein, dafür allerdings eine Profilfunktion, welche manuell aktiviert werden muß | ja |
schneller Profilwechsel über Systray oder Desktop | ja | nein |
Ein Fortschritt sieht jedenfalls anders aus – dabei ist dieser unserer Meinung nach gerade unter DirectX 10/11 inzwischen vonnöten, denn unter diesen APIs liegt die Kontrolle über die grundsätzlichen Anti-Aliasing Einstellungen (welche AA-Art und welche AA-Stufe) beim Spiel und darf vom Treiber her nicht mehr überschrieben werden. Allenfalls Modifikationen in Form der Spezial-Modi "CustomFilter" (ATI) bzw. "CoverageSampling" (nVidia) oder aber eine Zumischung von Transparenz Anti-Aliasing sind – auf Basis der Einstellungen im Spiel selber – noch erlaubt. In der Praxis hat dies eher zu einem etwas geringerem Einsatz von Anti-Aliasing geführt, was kaum im Sinne des Erfinders sein kann.
Vor allem aber behindert diese Vorschrift von DirectX 10/11 nunmehr die weitere Entwicklung von Anti-Aliasing – sofern das Spiel alles selber anfordern muß, ergibt sich hier nämlich ein klassisches Henne-Ei-Problem. Demzufolge ist es auch wenig verwunderlich, daß das Downsampling Supersampling Anti-Aliasing, welches seit DirectX10 jeder Grafikchip beherrschen muß, bislang kaum bekannt und genutzt wurde. Erst kürzlich ergab sich hierzu ein praktikabler Ansatz [7] – aber inzwischen schlummerte diese Funktionalität auch schon vier Jahre ungenutzt in den ATI- und nVidia-Treibern und erst jetzt gibt es mit Serious Sam HD ein allererstes Spiel, welches offiziellen Gebrauch von dieser Möglichkeit der DirectX 10/11 APIs nimmt.
Mit dem neuen 256er Treiber [10] hat nunmehr eine halboffizielle Möglichkeit geschaffen, Supersampling Anti-Aliasing durchgehend nutzen zu können – positiverweise gleich für alle nVidia-Grafikkarten ab der GeForce8-Serie und auch API-übergreifend für DirectX 9, 10 und 11. Damit hat sich nVidia in der Frage der Bildqualitäts-Optionen in letzter Sekunde noch entscheidend nach vorn arbeiten können, ansonsten wäre der Fortschritt in dieser Frage als eher mangelhaft bewertet worden. Jetzt aber kann man durchaus ATI als am Zuge ansehen, denn die Beschränkung des ATI-Supersamplings auf DirectX-9-Titel und nur die Radeon HD 5000 Serie hält natürlich die Konkurrenz mit den neuen nVidia-Möglichkeiten nicht aus.
Verweise:
[1] http://www.3dcenter.org/users/leonidas
[2] http://www.3dcenter.org/users/mr-lolman
[3] http://www.ciao.de/search.php?SearchString=Radeon+HD+5870
[4] http://www.ciao.de/search.php?SearchString=GeForce+GTX+470
[5] http://www.ciao.de/search.php?SearchString=GeForce+GTX+480
[6] http://ht4u.net/reviews/2010/msi_n470gtx_nvidia_geforce_gtx_470/index19.php
[7] http://www.3dcenter.org/artikel/supersampling-anti-aliasing-auf-ati-nvidia-unter-directx-1011
[8] http://www.3dcenter.org/3dtools/nhancer
[9] http://nvidia.custhelp.com/cgi-bin/nvidia.cfg/php/enduser/std_adp.php?p_faqid=2624
[10] http://www.3dcenter.org/news/2010-05-26
[11] http://www.forum-3dcenter.org/vbulletin/showthread.php?t=485336
[12] http://www.3dcenter.org/artikel/zotac-geforce-gtx-470-480-review/der-gf100-chip