16

News des 16. November 2009

Der Heise Newsticker vermeldet die Ankündigung erster professioneller Grafikkarten auf Fermi-Basis, welche ganz nebenbei auch eine gewisse Idee über die bei nVidias Fermi-Chip möglichen Taktfrequenzen geben. So soll eine Tesla C2050 eine DoublePrecision-Rechenleistung von 520 GFlops erreichen, eine Tesla C2070 kommt auf 630 GFlops. Angesichts dessen, daß die 512 Shader-Einheiten des Fermi-Chips bekannt sind, ergibt dies Shader-Taktfrequenzen von 1015 MHz (Tesla C2050) bzw. 1230 MHz (Tesla C2070) – was erstaunlich niedrig erscheint angesichts der derzeit bei nVidia üblichen Shader-Taktfrequenzen zwischen 1262 und 1836 MHz. Deutlicher wird dies, wenn man sich die für Spiele interessantere SinglePrecision-Rechenleistung ansieht: Da erreichen diese Fermi-Karten gerade einmal 1,04 GFlops (Tesla C2050) bzw. 1,26 GFlops (Tesla C2070).

Nun lag ATI bei seinen jüngeren Grafikkarten-Designs schon immer mit der reinen Rechenleistung vorn, ohne daß dies in der Praxis ein so großer Vorteil gewesen wäre – aber diese Zahlen erscheinen trotzdem sehr niedrig. ATI überbietet dies schon mit einer Radeon HD 5770 (1,36 GFlops), und selbst die GT200/b-basierten Karten erreichen fast so viel (GeForce GTX 285 bei 1,06 GFlops). nVidia muß da schon wirklich enorm an der Effizienz geschraubt haben, um mit diesen Zahlen mithalten zu können. Und daß nVidia bei den Tesla-Beschleunigern einen deutlich niedrigeren Takt ansetzen sollte als bei den Spieler-Grafikkarten, ist ebenfalls unwahrscheinlich, da gerade die reine Rechenleistung für die Tesla-Karten die wichtigste Kenngröße ist und zudem das Problem der Verlustleistung bei diesen nicht so eng gesehen wird wie im Consumermarkt.

ATI RV870 nVidia GT200b nVidia GF100 (Fermi)
Chipbasis ATI RV870, 2150 Millionen Transistoren in 40nm auf 334mm² Die-Fläche nVidia GT200b, 1400 Millionen Transistoren in 55nm auf 470mm² Die-Fläche nVidia GF100, ca. 3000 Millionen Transistoren in 40nm auf ca. 500mm² Die-Fläche
Technik DirectX 11, 1600 Shader-Einheiten, 80 TMUs, 32 ROPs, 256 Bit DDR Interface (bis GDDR5) DirectX 10, 240 Shader-Einheiten, 80 TMUs, 32 ROPs, 512 Bit DDR Interface (bis GDDR3) DirectX 11, 512 Shader-Einheiten, 128 TMUs, 384 Bit DDR Interface (bis GDDR5)
Shader-Einheiten 1x MADD pro Takt (2 Flop/Takt/Einheit) 1x MADD + 1x MUL pro Takt (2 +1 Flop/Takt/Einheit) 1x FMA pro Takt (2 Flop/Takt/Einheit)
Rechenleistung 2720 GFlops
(Radeon HD 5870)
1063 GFlops
(GeForce GTX 285)
Schätzung:
1200-1500 GFlops
Texturierleistung 68 MT/sec
(Radeon HD 5870)
52 MT/sec
(GeForce GTX 285)
Schätzung:
75-100 MT/sec
Bandbreite 154 GB/sec
(Radeon HD 5870)
159 GB/sec
(GeForce GTX 285)
Schätzung:
150-230 GB/sec

Letztere liegt laut nVidia mit 190 Watt durchschnittlicher Verbrauch für diese Tesla-Karten (die TDP dürfte sogar höher liegen) in jedem Fall im oberen Bereich dessen, was man auf dem Consumer-Markt anbieten kann. Hier bleibt kaum noch Platz für höhere Taktfrequenzen bei den Spieler-Grafikkarten auf Fermi-Basis, so daß man sagen kann, daß diese Werte zur Rechenleistung und zur Leistungsaufnahme von den professionellen Tesla-Grafikkarten auch grob auf die kommenden GeForce-Spielergrafikkarten umgelegt werden können. Und damit wird die wirklich spannnende Frage aufgeworfen, wie sich nVidia mit dieser im Vergleich doch sehr mittelprächtigen Rechenleistung gegenüber den aktuell schon verfügbaren ATI-Karten mit glatt doppelter Rechenleistung durchsetzen will.

Neues Ungemach droht nVidia bei der wahrscheinlichen Fermi-Verfügbarkeit im ersten Quartal 2010 von einer weiteren ATI-Karte, von welcher Alien Babel Tech kurz berichten. Nach deren Informationen soll just zum Zeitpunkt der Fermi-Verfügbarkeit eine "Radeon HD 5870 XTX" in den Markt gehen, welche auf handverlesenen RV870-Chip basieren soll. Mehr Informationen zu dieser Karte gibt es derzeit noch nicht, aber aus dem "handverlesene Chips" kann man trefflich darauf schlußfolgern, daß es sich hierbei wohl um eine Karte mit etwas mehr Takt als die Radeon HD 5870 handeln wird. Damit könnte es ATI möglich sein, mit dem RV870-Chip – welcher bislang immer etwas niedriger als der GF100/Fermi eingeschätzt wurde – nVidias Fermi-Design selbst an der absoluten Leistungsspitze anzugreifen.

Hier zahlt sich der deutlich frühere Marktstart von ATI auch in anderer Form aus: Denn bis zum ersten Quartal 2010 läuft die RV870-Produktion dann schon ein paar Monate, womit sich auch inzwischen diverse Produktionsverbesserungen ergeben, welche höhere Taktraten zulassen. nVidia steht dagegen zu diesem Zeitpunkt erst ganz am Anfang und muß erst einmal sehen, den eigenen Chip überhaupt in den Markt zu bringen. Dies könnte wie gesagt dazu ausreichen, daß ATI nVidia selbst mit dem kleineren Design gehörig auf die Pelle rückt – was auch noch dadurch begünstigt würde, daß der Fermi-Chip laut obigen Daten doch nicht ganz so leistungsstark zu werden scheint wie bislang angenommen. PS: Der Name "Radeon HD 5870 XTX" scheint eher eine Eigenkreation seitens Alien Babel Tech zu sein – wenn ATI der aktuellen Namenskonvention folgt, dann kommt eher so etwas wie eine "Radeon HD 5890" heraus.