GeForce 9600 GT: 256 Bit in der Mittelklasse

Samstag, 23. Februar 2008
 / von Leonidas
 

Nun hat auch Nvidia eine 9600 – der Name erinnert an die Mittelklasse-Version von ATIs Radeon 9700, welche in halbierter Version unter dem Namen "Radeon 9600" über längere Zeit ein ausgezeichnetes Preisleistungs-Verhältnis bot. Die damalige Highend-Karte Radeon 9700 bot schon ein 256-Bit-Interface, wie zuvor bereits Matrox' Parhelia. Allerdings zeigt sich, dass die Zahl der Bits beim Interface nicht allein entscheidend sind: Die Leistung der Matrox Parhelia war unterhalb der GeForce4 Ti, obwohl jene nur ein 128-Bit-Interface hat.

ATIs Radeon 9600 war trotz 128-Bit-Interface in allen DirectX9-Spielen der GeForceFX 5900 überlegen, obwohl letztere 256 Bit Interfacebreite bot. Der Nachfolger, GeForce 6800 Ultra, kam ebenfalls mit 256 Bit und die Mittelklassenversion GeForce 6600 wieder nur mit 128 Bit. Dennoch bietet die GeForce 6600 GT zumindest in aktuelleren Spielen mehr Leistung als die Radeon 9700/9800.

Die in der Mitteklasse nachfolgende GeForce 7600 GT konnte dann von der Performance her ungefähr mit einer GeForce 6800 GT mithalten, obwohl die 7600-er wieder nur ein 128-Bit-Interface hat. Die GeForce 8600 GTS ist schneller als eine GeForce 7800 GTX, obwohl es wieder 128 Bit vs. 256 steht. In Spielen, die HDR-Rendering nutzen, kann eine GeForce 8600 GTS sogar mit einer GeForce 7900 GT mithalten, obwohl HDR-Rendering auch die Bandbreite stark belastet. Bislang wurde im Mittelklasse-Bereich also versucht, irgendwie noch mit 128 Bit auszukommen – mit Erfolg.

Mit der GeForce 9600 GT wird die Bitbreite nun im gleichen Segment glatt verdoppelt – während man mit dem G80-Chip im HighEnd-Bereich einen Zwischenschritt zum 512-Bit-Interface eingelege. Bekanntermaßen ist eine GeForce 8800 GTX mit ihrem 384-Bit-Interface schneller als eine Radeon HD 2900XT mit 512-Bit-Interface. Es kommt also primär darauf an, die zur Verfügung stehende Bandbreite möglichst gut auszunutzen.

Die Balance halten

Aus unserer Sicht wäre ein 3:2-Verhältnis von Shader-Clustern á 16 MAD und 64-Bit-Speicherpartitionen bei der G80- und G92-Architektur optimal. Daraus abgeleitet könnte man sich eine schöne Produktpalette konstruieren, welche auch keine so großen Performance-Lücken aufweist wie sie es in der Vergangenheit gab und heute eigentlich noch immer gibt: Der Abstand zwischen GeForce 8600 GTS und GeForce 9600 GT (oder auch noch zur GeForce 8800 GS) ist ziemlich groß.

Echtes neues HighEnd lässt daneben noch immer auf sich warten. Die Performance der Anfang März erwarteten GeForce 9800 GX2 wird bei dem genutzten SLI-Verfahren wieder unter stärkeren Frameraten-Schwankungen leiden als Single-GPU-Karten. Eine GeForce 8800 Ultra mag hierbei zwar nominell deutlich überboten werden, von der gefühlten Framerate her sind jedoch keine großen Vorteile zu erwarten. Eine bessere Verteilung der Framerate wäre allerdings mit einem Sinken der durchschnittlichen Leistung verbunden.

Irgendwann ist ohnehin zu erwarten, dass bei SLI nicht mehr getrennte Frames gerendert, sondern die Threads auf einzelne GPUs aufgeteilt werden. Selbst wenn man dafür ein Frame Latenz inkauf nehmen muss, fährt man besser als beim Alternate Frame Rendering – vor allem wenn mehr als zwei GPUs zum Einsatz kommen.

Im Einsteiger-Bereich hat man bei Nvidia bisher die GeForce 8500 GT oder GeForce 8600 GT mit DDR2-Speicher und 400 MHz Speichertakt. Hier ist aufzupassen, dass man auch wirklich die gewünschte Speicherkonfiguration erhält – so gibt es die GeForce 7300 GT, eigentlich mit 128-Bit-Interface, auch in einer 64-Bit-Version, obwohl man ohnehin drei 64-Bit-Versionen der GeForce 7300 hat (nämlich GS, LE und SE).

"NVIDIA GeForce 7300 NVIDIA® GeForce® 7300 graphics processing units (GPUs) allow you to experience the latest gaming effects without compromising performance." ist die offizielle Werbung für die GeForce 7300. Bei der GeForce 9600 liest sich das so: "The NVIDIA® GeForce® 9600 GT GPU offers a powerfully immersive entertainment experience designed for extreme high-definition gaming and video playback." Seltsamerweise steht die Spieleeignung bei der GeForce 9600 im Nvidia-Marketing nicht an erster Stelle.

Neue Features

Die GeForce 9600 GT kommt mit Videofeatures auf VP2-Niveau (Video Processor 2, auch in GeForce 8400, 8500 und 8600 sowie G92-basierenden 8800-Produkten). Jedoch gibt es jetzt über die Shader zusätzliche Features, zum Beispiel zur dynamischen Kontrastanpassung. Die GeForce 9600 GT wird auch mit Picture-in-Picture-Fähigkeit beworben, da zwei Videostreams gleichzeitig dekodiert werden können. Erfahrungsgemäß beschreibt das Marketing bei den Nvidia-Videofeatures eher die theoretischen Möglichen, während sich ein Praxisnutzen erst später einstellen wird.

Eine Videobeschleunigerkarte sollte sich nach unserem Verständnis passiv kühlen lassen. Die GeForce 9600 GT kommt jedoch mit einem Lüfter, der an den revidierten Lüfter der GeForce 8800 GT erinnert. Je nach Boardlayout gibt es noch Audio-Anschlüsse.

Wenig gesprächig zeigte sich Nvidia, was die neue Komprimierungstechnologie angeht, welche das 3D-Rendering beschleunigen soll. Dieses neue Feature dürfte schon beim G92-Chip der GeForce 8800 GS/GT/GTS enthalten sein und genutzt werden, wurde dort jedoch nicht vermarktet. Was konkret gemacht wird, bleibt allerdings Spekulation.

Hier unsere Theorie: Nvidia versucht, die Komprimierungsrate zu verbessern, indem parallel mit verschiedenen Verfahren komprimiert wird. Sofern eines davon die Zielbitrate ohne Qualitätsverlust erreicht, muss man nicht mehr die unkomprimierten Daten schreiben. Hierbei könnte ausgenutzt werden, dass es in 3D-Spielen oft Bereiche gibt, wo sich die Farbwerte zum Nachbarpixel nur wenig ändern. Vielleicht ist das Verfahren sogar ausgefuchst genug, dass es durchaus einige Pixel mit starken Änderungen geben darf, solange der Rest komprimierbar genug ist.

Die neue alte GTS

Obwohl nur 64 skalare Stream-Rechenwerke (SP aka Shader Processors) bei der GeForce 9600 GT zum Einsatz kommen, kann die Karte mit einer alten, G80-basierten GeForce 8800 GTS (96 SP) mithalten – wobei die alte GeForce 8800 GTS auch noch ein 320-Bit-Speicherinterface anzubieten hat. Die Performancegleichheit der GeForce 9600 GT kommt primär durch die Taktsteigerung und einige Detailverbesserungen in der Architektur.

Alle 8800-er Karten basieren auf einem Chip, in dem 128 SP verbaut sind. Zum Einsatz kommen davon 96 (GS und alte GTS), 112 (GT oder neue G80-basierende GTS) oder alle 128 (GTX, Ultra). Es ist klar, dass Nvidias Rechnung auf Dauer nicht aufgeht, hier immer schön Resteverwertung zu betreiben: Um G80 und G92 wirtschaftlich zu produzieren, muss der Yield an voll funktionsfähigen Chips hoch genug sein. So fallen nicht genügend Chips ab, welche man nur noch für die kleineren Performance-Modelle nutzen könnte – im Performance-Bereich werden schließlich klar mehr Chips verkauft als im HighEnd-Bereich.

Damit müssen entweder voll funktionsfähige, aber nicht voll freigeschaltete, oder zumindest sehr gut taktbare Chips für die kleineren Performance-Grafikkarten verbaut werden (wie beim G80 auf der alten GeForce 8800 GTS). Oder bei den Performance-Karten grassiert dann die Lieferschwierigkeit (GeForce 8800 GT mit G92-Chip). Selbst wenn der "Ausschuss-Yield" hoch genug wäre, ist die Chipausbeute pro Waver relativ gering, weil die Chips so groß sind.

Also fuhr man bisher zweigleisig: G80 (und G92) für Performance und HighEnd, G84 für die Mittelklasse. Obwohl die 8600-Reihe auch 48 SP hätte vertragen können, ohne dass das 128-Bit-Speicherinterface gleich limitiert, war die Chipgröße bei dieser Mittelklasse-Lösung so wichtig, dass man sich auf 32 SP beschränkte. Mit einer selbst für heutige Verhältnisse hohen Chip-Taktrate von 675 MHz für die GPU und satten 1008 MHz beim Speicher brachte man die GeForce 8600 GTS mit Ach und Krach halbwegs auf das Niveau der GeForce 7900 GT.

Der Spieler hätte sicherlich lieber 48 SP bei 600 MHz gesehen – leider brachte auch AMD/ATI in jener Generation keine "vollwertige" Mittelklasse (also 50 Prozent Architekturbreite vom Flaggschiff). Nun haben wir bei der GeForce 9600 GT jetzt immerhin 64 SP. Das einzige, was uns bei der GeForce "9" fehlt, ist noch die Unterstützung von DirectX 10.1. Zwar hat man mit DirectX 10.0 in der heutigen Spielepraxis absolut keine Unterschiede zu einer 10.1-er Karte, doch ohne Hardware-Verbreitung gibt es natürlich auch keine passende Software.

Warum 256 Bit?

Die Tradition der Chip-Halbierungen, welche mit der GeForce2 MX und der erwähnten Radeon 9600 große Erfolge hatte, scheint aufgebrochen: Die GeForce 9600 GT wäre von der Architektur her zwar eine halbe hypothetische GeForce 9800 (die es noch nicht gibt, aber die man erwarten kann) – doch sofern die bisherigen Leaks zutreffend sind, bleibt es auch bei dieser kommenden Karte bei einem Speicherinterface von ebenfalls 256 Bit. Obwohl damit 128 SP versorgt werden müssen, immerhin doppelt so viel wie bei der GeForce 9600 GT.

Wie eingangs gezeigt, zierte sich Nvidia lange, ein größere Speicherinterfaces zu verbauen als unbedingt notwendig. Warum der Sinnungswandel? Bei den heute üblichen Chipgrößen verschieben sich die Gewichte: Es wird preiswerter, ein Boardlayout mit aufwändiger Verdrahtung zu haben (um die notwendige Leiterbahnenanzahl für das Speicherinterface zu realisieren), als wie früher mit vergleichsweise fetten Chips anzukommen. So ist die GeForce 8800 GS trotz 96 SP etwas langsamer als die GeForce 9600 GT: Denn bei der GeForce 8800 GS limitiert das Speicherinterface, bei der GeForce 9600 GT die GPU.

Man nimmt also deshalb ein eigentlich zu großes Speicherinterface für die GeForce 9600 GT, weil man somit die Performance noch etwas anheben kann, ohne gleich größere GPUs verbauen zu müssen. Dieser Trend zu verschwenderischer Speicherbandbreite dürfte sich aber wieder umkehren, denn 512 Bit stellen eine große Herausforderung dar, während bei der Chip-Entwicklung weitere Shrinks bereits absehbar sind.

Dass die GeForce 9600 GT nun als "GeForce 9" vermarktet wird, ist eine weitere Spitzenidee des Nvidia-Marketings, welches dafür wahrscheinlich Überstunden geschoben hat. Doch lassen wir die Namensgebung mal beiseite: Die Hardware der GeForce 9600 GT ist bezogen auf den Preis sehr gut. Man bekommt eine durchweg verdoppelte GeForce 8600 GTS (doppelt so viele SP, ein doppelt so großes Interface, doppelt so viel Speicher) bei anständigen Taktraten.

  GeForce 8600 GTS
(alt)
GeForce 9600 GT
(neu)
GeForce 8800 GS(kurzfristig) Radeon HD 2600 XT GDDR3
(alt)
Radeon HD 3850
(neu)
Chip nVidia G84, 289 Millionen Transistoren in 80nm bei TSMC (169 mm²) nVidia G94, 505 Millionen Transistoren in 65nm bei TSMC (240 mm²) nVidia G92, 754 Millionen Transistoren in 65nm bei TSMC (289 mm²) ATI RV630, 390 Millionen Transistoren in 65nm bei TSMC (153 mm²) ATI RV670, 666 Millionen Transistoren in 55nm bei TSMC (192 mm²)
Technologie Direct3D 10.0 Direct3D 10.0 Direct3D 10.0 Direct3D 10.0 Direct3D 10.1
Aufbau 32 SP, 16 TMUs, 8 ROPs, 128 Bit DDR SI 64 SP, 32 TMUs, 16 ROPs, 256 Bit DDR SI 96 SP, 40 TMUs, 12 ROPs, 196 Bit DDR SI 120 SP, 8 TMUs, 4 ROPs, 128 Bit DDR SI 320 SP, 16 TMUs, 8 ROPs, 256 Bit DDR SI
Taktraten 675/1450/1000 MHz 650/1625/900 MHz 575/1438/750 MHz 800/700 MHz 670/830 MHz
Rechenpower MADD/MADD+MUL 93/139 GFlops 208/312 GFlops 276/414 GFlops 192 GFlops 429 GFlops
Bandbreite 29,8 GiB/sec 53,6 GiB/sec 34,2 GiB/sec 20,9 GiB/sec 49,5 GiB/sec
Bauform SingleSlot, 256 oder 512MB, PCI Express 1.x SingleSlot, 256 oder 512MB, PCI Express 1.x/2.0 SingleSlot, 384 MB, PCI Express 1.x/2.0 SingleSlot, 256 oder 512MB, PCI Express 1.x SingleSlot, 256 oder 512MB, PCI Express 1.x/2.0
Verbrauch 47 Watt geschätzt 60 Watt ca. 65 Watt ca. 45 Watt ca. 70 Watt
aktuelle Preislage 256MB: 100-120 Euro
512MB: 110-130 Euro
512MB: 140-160 Euro 384MB: 130-150 Euro 256MB: 60-80 Euro
512MB: 70-90 Euro
256MB: 120-140 Euro
512MB: 150-170 Euro
Preisvergleich Ciao
PreisRoboter
Geizhals
Ciao
PreisRoboter
Geizhals
Ciao
PreisRoboter
Geizhals
Ciao
PreisRoboter
Geizhals
Ciao
PreisRoboter
Geizhals