22

News des 22. Dezember 2009

Laut einem vom Heise Newsticker auf den nVidia-Servern entdeckten PDF-File hat nVidia die Spezifikationen der Fermi-basierten Tesla C2050/C2070 Karten erheblich verändert. Sollten beide Karten ursprünglich mit jeweils 512 Shader-Einheiten und eher gemächlichen Shadertaktraten von 1015 bzw. 1230 MHz antreten, so lautet die neue Spezifikation: Jeweils nur 448 Shader-Einheiten und dafür Shadertaktraten von 1250 bzw. 1400 MHz. Bezüglich der Rechenleistung dieser Profi-Beschleuniger ist dies sogar leicht vorteilhaft, die Tesla C2050 gewinnt so 7,8 Prozent an Rechenleistung, während die Tesla C2070 nur höchst minimale 0,4 Prozent Rechenleistung einbüßt. Für diese Tesla-Beschleuniger ändert sich also eigentlich nichts – viel interessanter ist natürlich, was diese Änderung allgemein zu bedeuten hat.

Erstens einmal scheint nVidia den GF100-Chip nun wirklich auf 1400 MHz Chiptakt hochgebracht zu haben, was doch etwas mehr ist als nach den anfänglichen Taktproblemen des GF100-Chips zu erwarten war. Gleichzeitig darf man aber darüber rätseln, was nVidia dazu getrieben haben mag, bei den Tesla-Karten die Anzahl der nutzbaren Shadereinheiten von 512 auf 448 zu reduzieren: Entweder ist es eine Sache der Verlustleistung, wo man nicht über die veranschlagten 225 Watt TDP bei diesen Telsa-Beschleunigern hinausgehen will – oder eine Sache der Ausbeute in der Chipfertigung, wo nVidia möglicherweise massenweise GF100-Chips mit einzelnen Fehlern von TSMC zurückbekommt und daher diese irgendwie absetzen will. So richtig schlagend ist derzeit aber keine der beiden Erklärungen, so daß es an dieser Stelle nicht lohnt, großartig weiterzuspekulieren.

Mitzunehmen gilt wie gesagt der Punkt, daß nVidias GF100-Chip durchaus auch auf 1400 MHz Chiptakt läuft – zusammen mit den vollen 512 Shader-Einheiten ergibt dies eine nominelle MADD-Rechenleistung von 1,4 GFlops. Dies erscheint zwar immer noch erheblich hinter den 2,7 GFlops einer Radeon HD 5870 zurückzuliegen – vergleicht man es aber einmal mit der MADD-Rechenleistung einer GeForce GTX 285 von 0,7 GFlops, dann wird das hohe Potential des GF100-Chips eher augenscheinlich. Und auch mit der Verlustleistung sollte nVidia bei einer Spielergrafikkarte auf 512 Shader-Einheiten und 1400 MHz Shadertakt weniger die Probleme als bei den Tesla-Beschleunigern haben: Denn Spiele nutzen eine Grafikkarte einfach nicht so gut aus, als daß es einer grenzwertigen Leistungsaufnahme kommt, während dagegen der Praxis-Stromverbrauch von Tesla-Beschleunigern durchaus in die Nähe der hohen Werte des FurMark-Benchmarks gehen kann.

ATI RV870 nVidia GT200b nVidia GF100 (Fermi)
Chipbasis ATI RV870, 2150 Millionen Transistoren in 40nm auf 334mm² Die-Fläche nVidia GT200b, 1400 Millionen Transistoren in 55nm auf 470mm² Die-Fläche nVidia GF100, ca. 3000 Millionen Transistoren in 40nm auf ca. 500mm² Die-Fläche
Technik DirectX 11, 1600 Shader-Einheiten, 80 TMUs, 32 ROPs, 256 Bit DDR Interface (bis GDDR5) DirectX 10, 240 Shader-Einheiten, 80 TMUs, 32 ROPs, 512 Bit DDR Interface (bis GDDR3) DirectX 11, 512 Shader-Einheiten, 128 TMUs, 384 Bit DDR Interface (bis GDDR5)
Shader-Einheiten 1x MADD pro Takt (2 Flop/Takt/Einheit) 1x MADD + 1x MUL pro Takt (2+1 Flop/Takt/Einheit) 1x FMA pro Takt (2 Flop/Takt/Einheit)
Rechenleistung 2720 GFlops
(Radeon HD 5870)
1063 GFlops
(GeForce GTX 285)
Schätzung:
1400-1450 GFlops
Texturierleistung 68 MT/sec
(Radeon HD 5870)
52 MT/sec
(GeForce GTX 285)
Schätzung:
75-100 MT/sec
Bandbreite 154 GB/sec
(Radeon HD 5870)
159 GB/sec
(GeForce GTX 285)
Schätzung:
190-230 GB/sec

Die zu den Tesla-Beschleunigern genannten Speichertaktraten zwischen 1800 und 2000 MHz (auf Basis von GDDR5-Speicher) sind im übrigen bezüglich der Spieler-Grafikkarten auf GF100-Basis nicht besonders ernst zu nehmen: Tesla-Beschleuniger sind nicht auf besonders viel Speicherbandbreite angewiesen und treten daher gewöhnlich mit klar niedrigeren Speichertaktraten an (die GT200/b-basierte Tesla C1070 hat einen Speichertakt von nur 800 MHz im Gegensatz zu den 1000 bis 1242 MHz bei den entsprechenden GeForce-Karten). Dies muß nicht bedeutet, daß es hier genauso passiert – aber es kann eben auch sein, daß nVidia bei den Spieler-Grafikkarten auf GF100-Basis mit klar höheren Speichertaktraten antritt. Für eine Erhöhung der Speicherbandbreite reicht es im übrigen auch so, selbst bei 2000 MHz Speichertakt würde man bei 192 GB/sec liegen – und damit runde 21 Prozent überhalb einer GeForce GTX 285.

Silicon.de vermelden einen weiteren Fall eines Gerichtsentscheid zu den PC-Rundfunkgebühren. Mittlerweile gibt es hierzu reichlich Urteile, welche mal in die eine und mal in die andere Richtung gehen, besonders an diesem (gegen die Rundfunkgebühr gefallenem Urteil) ist die Begründung: So führte das Verwaltungsgericht Braunschweig aus, daß der klagende Sender NDR derzeit im Internet gar keinen "gebührenrechtlich relevanten Rundfunk zur Verfügung" stellen würde, womit sich auch keine Gebührenpflicht ergeben könne. Damit wird endlich einmal auch auf das Problem hingewiesen, daß die öffentlich-rechtlichen Sender bislang nur Teile ihres Angebots auch wirklich im Internet anbieten – und daß man bei einer Gebührenpflichtigkeit von Internetgerätschaften selbstverständlich erwarten kann, daß man auch das vollständige Angebot zur Verfügung hat.