Neue Infos zu nVidias GT218, GT216 & GT214 Chips

Donnerstag, 11. Juni 2009
 / von Leonidas
 

Bei den holländischen Tweakers gibt es eine interessante Meldung, welche neue Daten zu den 40nm nVidia-Chips GT218 & GT216 bringt. Allerdings weichen die dort genannten Spezifikationen von den bisherigen Annahmen ab – und zwar nach unten hin, was um so mehr verwundert. So soll der GT218-Chip mit nun nur noch mit 24 Shader-Einheiten an einem 64 Bit DDR Speicherinterface antreten, der GT216-Chip mit 48 Shader-Einheiten an einem 128 Bit DDR Speicherinterface. Gegenüber den bisherigen Annahmen (GT218 mit 32 Shader-Einheiten & 64 Bit DDR Speicherinterface und GT216 mit 64 Shader-Einheiten & 128 Bit DDR Speicherinterface) ist dies noch einmal eine Stufe nach unten, vor allem da die zu den neuen Grafikchips genannten Taktfrequenzen auch keinen Ausgleich durch einen höheren Takt anbieten.

Damit würden sich die Grafikchips GT218 & GT216 aber auch nicht mehr zur Ablösung von G96 (GeForce 9500 GT) bzw. G94 (GeForce 9600 GT) eignen, sondern alles wäre eine Stufe tiefer angesiedelt: Der GT218-Chip wäre dann die Ablösung des G98-Chips der GeForce 8400 GS (16 Shader-Einheiten & 64 Bit DDR Speicherinterface) und der GT216-Chip die Ablösung des G96-Chips (32 Shader-Einheiten & 128 Bit DDR Speicherinterface). Von der Nummeristik her würde das sogar besser passen: G98 -> GT218 und G96 -> GT216. Den auch noch anstehenden GT214-Chip kann man dann wohl als Ablösung des G94-Chips (64 Shader-Einheiten & 256 Bit DDR Speicherinterface) ansehen, wahrscheinlich gibt es hardwaretechnisch hier irgendwas im Rahmen von 96 Shader-Einheiten (darauf deutet eine News-Meldung von Fudzilla hin) samt einem (schon vorher kolportierten) 192 Bit DDR Speicherinterface.

GT218 (D10M1) GT216 (D10M2) GT214
Fertigung 40nm 40nm 40nm
Shader-Einheiten 24 48 96
(Annahme)
Interface 64 Bit 128 Bit 192 Bit
(Annahme)
Chiptakt ~600 MHz 600-650 MHz unbekannt
Shadertakt 1300-1400 MHz 1300-1400 MHz unbekannt
Speichertakt 500 MHz (DDR2) 800 MHz (GDDR3) unbekannt (GDDR5)
Rechenleistung 94-101 GFlops 187-202 GFlops ca. 400 GFlops
(Annahme)
Bandbreite 8 GB/sec 26 GB/sec ca. 70 GB/sec
(Annahme)
Ablösung von G98
(GeForce 8400 GS – 16 Shader-Einheiten und 64 Bit Interface, 43 GFlops + 6 GB/sec)
G96
(GeForce 9500 GT – 32 Shader-Einheiten und 128 Bit Interface, 134 GFlops + 26 GB/sec)
G94
(GeForce 9600 GT – 64 Shader-Einheiten und 192 Bit Interface, 312 GFlops + 58 GB/sec)

Einziges Problem an dieser Auflösung wäre allerdings, daß nVidia dann unter 40nm im Performance-Bereich gar nichts hätte – dort, wo derzeit der G92-Chip von der GeForce 9800 GT bis zur GeForce GTS 250 verwendet wird. Hierfür war wohl der GT212-Chip geplant, welcher aber inzwischen gestrichen wurde – ergo müsste nVidia mit dem inzwischen nun recht lange laufenden G92-Chip ohne 40nm-Ersatz durchhalten, bis es Performance-Abwandlungen der kommenden DirectX11-Klasse gibt, was (bei einer generell neuen Architektur) üblicherweise erst mit einigen Monaten Zeitverzug nach dem Release des Spitzenprodukts passiert. Andererseits ergibt somit die Namensänderung der GeForce 9800 GTX+ hin zu "GeForce GTS 250" nachträglich noch einmal ihren Sinn, wenn nVidia seinerzeit bereits klar war, daß diese Karte noch eine lange Lebensdauer haben würde.

Der GT214-Chip, welcher wahrscheinlich mit 96 Shader-Einheiten an einem 192 Bit DDR Speicherinterface (samt GDDR5-Speicher) antreten wird, reicht da auch nicht hin, da mit diesem die Shader-Power einer GeForce GTS 250 nur auf sehr hohen Taktraten erreichbar, aber kaum überbietbar wäre. Eher wahrscheinlich für den GT214 ist eine Auflösung, welche diesen Chip in den Zwischenraum von G94 (GeForce 9600 GT) und G92 (GeForce GTS 250) positioniert und dort dann in erster Linie in Konkurrenz zur Radeon HD 4770 gehen läßt. Ob es reicht, um dieser ATI-Lösung gefährlich werden zu können, ist natürlich derzeit mangels sicherer Angaben zum GT214 noch nicht zu sagen. Denn gerade bei den Taktraten dieser 40nm-Chips scheint der Vorteil der 40nm-Fertigung kaum ausgenutzt zu werden, die bekannten Taktraten liegen in etwa auf dem Niveau der genannten Vorgängerchips.

Die Mehrleistung kann somit allein über die höhere Anzahl an Shader-Einheiten kommen, welche mit 50 Prozent Zugewinn bei GT218, GT216 und GT214 zwar nicht schlecht ist, aber doch weit hinter den Marken zurückbleibt, welche ATI zuletzt in diesem Segment gesetzt hat (RV730 zu RV740 – Verdopplung der Shader-Einheiten). Zudem gehen GT218 und GT216 mit diesen Daten – und obwohl seitens nVidia als "Mainstream" bezeichnet – klar ins LowCost-Segment mit Preisen unterhalb von 50 Euro. Einzig allein GT214-basierte Karten haben eine gewisse Chance darauf, im Gamer-Markt als Einsteigerangebote wahrgenommen zu werden – allerdings scheint ausgerechnet der GT214-Chip weit ins dritte Quartal verschoben zu sein und somit kommen zuerst einmal nur die aus Gamer-Sicht herzlich uninteressanten LowCost-Angebote GT218 und GT216.

Für nVidia sind die neuen Grafikchips in erster Linie aus wirtschaftlicher Sicht interessant (eine gut funktioniertende 40nm-Fertigung vorausgesetzt) und hier liegt wohl auch der Grund dafür, daß man bei der Performance wohl keine Berge zu versetzen gedenkt: Gerade in der jetzigen Zeit heißt es erst einmal "mit dem Rücken zur Wand" – sprich die Fertigungskosten müssen dem entsprechen, was man während der Wirtschaftskrise an Einnahmen generiert. Und eigentlich sollten die 40nm-Chips ja auch schon längst releast sein, nur die Probleme von Chipfertiger TSMC mit der Ausbeute in der 40nm-Fertigung verhinderte dies bisher.

Bleibt noch ein Punkt zu erwähnen: Fudzilla hatten kürzlich die 40nm Mobile-Chips von nVidia als "DirectX 10.1" vermeldet – was insofern Bedeutung hat, als daß nVidia (wie ATI) keine extra Mobile-Chips auflegt, sondern diese Chips der normalen Desktop-Produktion entnimmt. Ergo würde diese Meldung bedeuten, daß die GT21x-Chips wider aller Erwartungen doch noch DirectX 10.1 unterstützen würden (was im übrigen inzwischen von anderer Seite bestätigt wurde). Für den anvisierten LowCost-Markt mag dieses Checklisten-Feature nicht verkehrt sein – ob sich allerdings der Aufwand lohnt, dieses Update von DirectX10 wirklich noch umzusetzen, wenn schon in kurzer Zeit DirectX11 ansteht, bleibt das Geheimnis von nVidia.

In jedem Fall reißt nVidia keine Bäume aus mit diesen 40nm-Chips: Sicherlich gibt es mehr Performance, allerdings liegt nVidia im LowCost-Markt in vielen Segmenten teilweise so deutlich zurück, daß man sich da hätte deutlich mehr vorstellen können. Zum anderen geht es selbst mit der schnellsten 40nm-Lösung GT214 wahrscheinlich bestenfalls in den Leistungsbereich einer GeForce 9800 GT hinein – auch nicht gerade spannend. Für den Gamer scheint nVidia hier erst einmal nichts entscheidendes im Köcher zu haben, da hift nur das Warten auf den GT300-Chip.

Nachtrag vom 16. Juni 2009

nVidia hat nun endlich einmal etwas handfestes zum Thema 40nm-Grafikchips gesagt und neue Mobile-Grafikchips in eben jenem Fertigungsverfahren vorgestellt. Dabei handelt es sich bei der GeForce G210M, GT 230M, GT 240M, GTS 250M und GTS 260M um die lange erwarteten ersten Abkömmlinge der GT21x-Grafikchips, welche nun offenbar erst einmal ins Mobile-Segment gehen und vorerst nicht im Desktop-Segment eingesetzt werden. Dies könnte mit den berichteten 40nm-Problemen bei TSMC zusammenhängen – erst wenn TSMC diese nachhaltig im Griff hat, dürfte es wohl GT21x-basierte Grafikkarten auch im Desktop-Segment geben. Erst dann wird nVidia im übrigen auch im Desktop-Segment DirectX 10.1 liefern können, was die neuen 40nm-Grafikchips nun offiziell beherrschen.

GeForce G210M GeForce GT 230M GeForce GT 240M GeForce GTS 250M GeForce GTS 260M
Chipbasis nVidia GT218, 40nm nVidia GT216, 40nm nVidia GT214, 40nm
Technik DirectX 10.1, 16 Shader, 64 Bit DDR Interface DirectX 10.1, 48 Shader, 128 Bit DDR Interface DirectX 10.1, 96 Shader, 128 Bit DDR Interface
Taktraten 625/1500/800 MHz (GDDR3, bei DDR2-Speichern nur 500 MHz Speichertakt) 500/1100/800 MHz (GDDR3, bei DDR2-Speichern nur 600 MHz Speichertakt) 550/1210/800 MHz (GDDR3, bei DDR2-Speichern nur 600 MHz Speichertakt) 500/1250/1600 MHz (GDDR5) 550/1375/1800 MHz (GDDR5)
Rechenleistung 72 GFlops 158 GFlops 174 GFlops 360 GFlops 396 GFlops
Bandbreite 13 GB/sec (GDDR3) bzw. 8 GB/sec (DDR2) 26 GB/sec (GDDR3) bzw. 19 GB/sec (DDR2) 26 GB/sec (GDDR3) bzw. 19 GB/sec (DDR2) 51 GB/sec 58 GB/sec
TDP 14W 23W 23W 28W 38W

Gemäß nVidia-Aussagen erreichen diese neuen Mobile-Beschleuniger in etwa die doppelte Leistung bei niedrigerem Stromverbrauch gegenüber der Vorgänger-Generation – was aber maßgeblich darauf basiert, daß nVidia in der Vorgängergeneration oftmals die zugrundeliegenden Grafikchips deutlich um einige Ausführungseinheiten beschneiden musste, um den Stromhunger der zuerst noch in 65nm gefertigten Chips zu bändigen. Der große Performancesprung bezieht sich also allein auf den Vergleich zu nVidias bisherigen Mobile-Lösungen – nicht eingeschlossen die HighEnd-Klasse, wo nVidia weiterhin die G92-basierten GeForce GTX 260M/280M Lösungen hat, welche von den Spezifikationen her etwas überhalb der GeForce GTS 260M angesiedelt sind.

Insofern sind die neuen Mobile-Lösungen von nVidia zumeist keine Performance-Offenbarungen: Die GT218-basierte GeForce G210M wäre wohl besser gleich ein integrierter Grafikchip geworden, mit diesen technischen Daten ist nichts zu reißen. Die GT216-basierten GeForce GT 230M und 240M entsprechen in etwa der Performanceklasse einer GeForce 9500 GT des Desktop-Segments – besser bei der Rechenleistung, aber schwächer bei der Speicherbandbreite. Wirklich viel Freude dürfte da im Spieleeinsatz auch nicht aufkommen, jedenfalls nicht bei modernen Titeln. Annehmbar ist allein der GT214-Chip der GeForce GTS 250M/260M, deren Leistung dürfte etwas über das Niveau einer GeForce 9600 GT des Desktop-Segments gehen – besser bei der Rechenleistung und in etwa gleiche Speicherbandbreite.

Ganz ähnlich sieht es auch aus, wenn man sich die neuen 40nm-Grafikchips GT218, GT216 und GT214 dann eines Tages für den Desktop-Einsatz vorstellt: Bei GT218 und GT216 kommen nur LowCost-Lösungen heraus, allein der GT214 könnte eine halbwegs potente Mainstream-Lösung abgeben. Wenn man davon ausgeht, daß der Chip im Desktop-Einsatz auch mit 25 Prozent Mehrtakt antreten kann, dann wären hierbei um die 500 GFlops Rechenleistung drin, was einer GeForce 9800 GT entsprechen würde. Viel mehr wird es aber auch nicht werden, im besten Fall könnte nVidia hier also ein gleichwertiger Radeon HD 4770 Kontrahent gelingen – allerdings erst Monate nach dieser Karte und mit nur geringen Chancen, die ATI-Karte auch noch zu überflügeln.

Nachtrag vom 30. Juni 2009

Die VR-Zone zeigt GPU-Z Screenshots zweier neuer 40nm-Grafikkarten von nVidia, die auf den Grafikchips GT218 (D10M1) und GT216 (D10M2) basieren, welche kürzlich schon für das Mobile-Segment offiziell vorgestellt wurden. Die Daten zumindest des GT218-Chips sind allerdings minimal abweichend von denjenigen im Mobile-Segment: Dort treten GT218-basierte Lösungen nur mit 16 Shader-Einheiten an, im Desktop-Bereich sollen es 24 Shader-Einheiten sein. Dies passt jedoch deutlich besser zu der These, daß die neuen GT21x-Chips von nVidia sich in der Shadercluster-Struktur am GT200-Chip und nicht mehr an den G9x-Chips anlehnen – nVidia dürfte im Mobile-Segment schlicht ein paar Shader-Einheiten deaktiviert haben, weil bei der dort existierenden extremen LowCost-Lösung kein echter Performancebedarf vorliegt und man damit zudem etwas Strom sparen kann.

GeForce G210 GeForce GT 220
Chipbasis nVidia GT218, 40nm nVidia GT216, 40nm
Technik DirectX 10.1, 24 Shader, 64 Bit DDR Interface DirectX 10.1, 48 Shader, 128 Bit DDR Interface
Taktraten DDR2: 600/1425/500 MHz
DDR3: 600/1425/800 MHz
DDR2: 625/1375/500 MHz
DDR3/GDDR3: 625/1375/800 MHz
Speicher 512 MB DDR2 (500 MHz)
512 MB DDR3 (800 MHz)
500/1024 MB DDR2 (500 MHz)
500/1024 MHz DDR3 (800 MHz)
500/1024 MHz GDDR3 (800 MHz)
Rechenleistung 103 GFlops 198 GFlops
Bandbreite 13 GB/sec (DDR3) bzw. 8 GB/sec (DDR2) 26 GB/sec (DDR3/GDDR3) bzw. 16 GB/sec (DDR2)
Preisbereich 30-35 Dollar 55-60 Dollar
Vergleich Mobile GeForce G210M: 72 GFlops & 13 GB/sec (DDR3) GeForce GT 240M: 174 GFlops & 26 GB/sec (DDR3/GDDR3)
Vergleich GeForce9 Desktop GeForce 9400 GT: 67 GFlops & 13 GB/sec GeForce 9500 GT: 134 GFlops & 16 GB/sec

Im Desktop werden die Grafikchips GT218 (GeForce G210) und GT216 (GeForce GT 220) dagegen voll ausgefahren, dies bedeutet 24 Shader-Einheiten an einem 64 Bit DDR Speicherinterface beim GT218-Chip sowie 48 Shader-Einheiten an einem 128 Bit DDR Speicherinterface beim GT216-Chips. Zudem geht man mit der Taktfrequenz gegenüber den Mobile-Lösungen etwas nach oben, so das die vergleichbaren Mobile-Lösungen jeweils geschlagen werden. Wie allerdings sowohl dem veranschlagten Preisbereich als auch dem Vergleich mit den durch die neuen Karten zu ersetzenden GeForce9-Lösungen zu entnehmen ist, handelt es sich hierbei weniger denn um Gamer-Grafikkarten, sondern eher typische OEM-Produkte.

Von der kommenden 40nm-Riege seitens nVidia erscheint für Gamer einzig und allein der GT214-Chip (im Mobile-Bereich schon bei der GeForce GTS 250M/260M verwendet) mit 96 Shader-Einheiten an einem 128 Bit DDR Speicherinterface (samt schnell getaktetem GDDR5-Speicher) interessant, da dieser die Performance einer GeForce 9800 GT erreichen bzw. überbieten und damit in Konkurrenz zur Radeon HD 4770 gehen sollte. Dies ist allerdings immer noch der Spieler-Einstiegsbereich mit Preisen knapp unter 100 Euro, wirklich rasante Spielerkarten auf Basis des GT2xx-Designs in 40nm hat nVidia nicht mehr in der Hinterhand, hier verläßt man sich offenbar voll und ganz auf das kommende GT300-Design in 40nm.