Erste Benchmarks zu Lucids Hydra-Chip

Dienstag, 13. Oktober 2009
 / von Leonidas
 

Über Lucids Hydra-Chip zur Zusammenschaltung unterschiedlicher Grafikkarten auch differender Grafikchips und Hersteller wurde seit Sommer letzten Jahres diskutiert – einfach, weil der Ansatz als "zu gut" angesehen wurde und es eine breite Skepsis gab (und noch gibt), ob Lucid das versprochene realisieren kann. Daß der Erscheinungstermin des Hydra-Chip zwischenzeitlich von Anfang 2009 auf Ende 2009 und nunmehr auf das erste Quartal 2010 verschoben wurde, half diesbezüglich auch nicht weiter. Nun aber hat Lucid drei amerikanische Webseiten einmal schauen lassen und es liegen somit erste semi-unabhängige Betrachtungen & Benchmarks zum Hydra-Chip vor.

Die entsprechenden Berichte kann man sich im Original bei Hot Hardware, PC Perspective und dem Tech Report zu Gemüte führen, wir werden nachfolgend die relevante Punkte daraus aufzeigen. Allem Anschein nach fanden die Betrachtungen und Benchmarks in den Räumen von Lucid mit einem von Lucid gestelltem Testsystem statt – eine wirklich unabhängige Berichterstattung sieht natürlich anders aus. Aber für den Augenblick reicht es wohl, um einen ersten Eindruck zu gewinnen.

Erstens einmal gilt es natürlich festzustellen, daß es sich beim Hydra-Chip in der Tat nicht um Vaporware handelt – das Teil funktioniert wirklich, auch wenn es vielerorts heftige und teils auch durch handfeste technologische Argumente untermauerte Bedenken diesbezüglich gab. In den vorverlinkten Previews gab es zwar nichts wesentliches zu Wirkungsweise des Hydra-Chips zu lesen, hierzu kann man aber auch auf frühere Meldungen zum Thema zurückgreifen. Danach setzt Lucid nicht auf das seitens ATI und nVidia bei CrossFire bzw. SLI meisten präferierte AFR ("Alternate Frame Rendering"), bei welchem die im Verbund stehenden Chips immer abwechselnd ein Bild für sich alleine berechnen. Dieser Modus ist sehr einfach zu implementieren und daher sowohl bei ATI als auch nVidia entsprechend beliebt, hat aber auch seine Nachteile: Erstens einmal gibt es keinerlei dynamische Lastverteilung je nach Szenenkomplexität, da die zu berechnenden Bilder ohne jede Lastprüfung stur auf den jeweils nächsten freien Grafikchip verteilt werden.

Und zweitens ist AFR prädestiniert für Mikroruckler, was den CrossFire/SLI-Spaß erheblich trüben kann. Lucid setzt beim Hydra-Chip hingegen auf eine gemeinsame Arbeit aller Grafikchip am selben Bild, wobei aber nicht wie bei SFR ("Split Frame Rendering") eine flächengebundene Aufteilung des Bildes zwischen den Grafikchips erfolgt, sondern eine aufgabengebunden Aufteilung. Hierbei rendert der eine Grafikchip beispielsweise die Hintergründe und die Böden und der andere die Vordergründe und die Beleuchtung. Die Einzelbilder sehen dementspechend kurios unvollständig aus, erst in der Zusammensetzung beider Bilder wird es dann wieder "normal". Am besten wird dies wohl mittels zweier Screenshots aus einem früheren Artikel seitens PC Perspective wiedergegeben:

Hydra-Rendering, Halbframe 1 Hydra-Rendering, Halbframe 2
Hydra-Rendering Screenshots @ PC Perspective

Diese von Lucid angesetzte Methode ist deutlich aufwendiger, ermöglicht aber angeblich eine bessere Lastverteilung und damit eine höhere Performance gegenüber CrossFire und SLI. Allerdings ergeben sich natürlich Fragen ob der Spielekompatibilität und speziell die Frage, ob denn mit dieser Methode auch wirklich alles so dargestellt wird, wie vom Spieledesigner gewünscht. Diesbezüglich können aber alle drei vorverlinkten Previews Entwarnung geben: Es waren bislang keinerlei Bildfehler zu beobachten, weder in der Kombination von Grafikchips desselben Entwicklers als auch im Mix von ATI- und nVidia-Grafikchips.

Allerdings konnten bislang noch nicht all zu viele Anwendungen getestet werden – und Lucid wird sich natürlich anfänglich darauf konzentriert haben, die bekanntesten Anwendungen zu unterstützen. Ganz ohne Treiberunterstützung des speziellen Lucid-Treibers funktioniert jedoch offenbar auch deren Hydra-Technologie nicht, da ähnlich wie bei CrossFire und SLI im Lucid-Treiber Profile für diverse Spiele zu finden waren. Deren Anzahl ist mit derzeit ca. 120 Stück schon ganz gut – mit ein wenig mehr Treiberarbeit könnte man durchaus alle relevanten Spiele erfassen. Trotzdem ist man damit natürlich für neu erscheinende Spiele immer vom Lucid-Treiberteam abhängig – und bei einer so kleinen Firma kann selbstverständlich niemand für deren ewiges Weiterbestehen und damit fortlaufenden Treibersupport garantieren.

Bezüglich der Performance gab es hingegen einige Überraschungen: So gibt es bekannterweise mit dem Hydra-Chip die Möglichkeit, Grafikkarten unterschiedlicher Baureihen und Leistungsfähigkeit miteinander zu koppelt – und aufgrund der dynamischen Lastverteilung sollte dies normalerweise dann auch zu einem entsprechenden Performancegewinn führen. Die Benchmarks der vorgenannten drei Webseiten weisen allerdings in eine andere Richtung:

PC Perspective GTX260 + GTX285 vs. 2x GTX260 GTX285 + GTS250 vs. GTX285
Call of Juarez, 1920x1200, 4xAA ±0 -8,8%
Far Cry 2, 1920x1200, 4xAA -2,0% +40,0%
The Tech Report 4890 + 4770 vs. 4890
Call of Juarez, 1920x1200, 4xAA -16,2%
F.E.A.R. 2, 1920x1200 -37,6%
Operation Flashpoint 2, 1920x1200, 4xAA +27,1%
Stormrise, 1920x1200 -19,5%

Wie zu sehen, funktioniert die Paaarung von langsamer mit schneller Grafikkarte derzeit noch überhaupt nicht – nur zwei von zwölf Test zeigten einen Performancegewinn, die restlichen teils erhebliche Performanceverluste. Dies ist umso mehr erstaunlich, als daß die Paarung von unterschiedlich schnellen Grafikkarten unterschiedlicher Chipentwickler im Gegensatz dazu überall zu Leistungsgewinnen führt (wie nachher noch zu sehen). Die Paarung von unterschiedlichen Grafikkarten, welche allerdings in der Performance nicht gerade sehr deutlich auseinanderliegen, bringt dann aber trotzdem noch einige Performancegewinne:

PC Perspective GTX260 + GTX285 vs. GTX285
Call of Juarez, 1920x1200, 4xAA +23,9%
Far Cry 2, 1920x1200, 4xAA +56,8%

Insofern kann hieraus wohl mitgenommen werden, daß sich derzeit die Paarung von bezüglich der Performance ziemlich unterschiedlichen Karten nicht lohnt – derart nicht lohnt, daß es sogar zu Performanceverlusten kommt. Je näher die Performance der Karten aneinander liegt, desto geringer wird dieses Risiko. Ergo sind Kombinationen aus derselben Grafikkartenserie (nur mit unterschiedlichen Taktraten) klar vorzuziehen, diese bringen dann anscheinend ein anständiges Performanceplus.

Ziemlich gegensätzlich ist hingegen das Bild, wenn man Grafikkarten unterschiedlicher Chip-Entwickler (ATI und nVidia) miteinander mischt. Hierbei kommen immer interessante Performancegewinne heraus – selbst in der vorher noch ungünstigen Kombination zwischen zwei in der Performance sehr unterschiedlicher Karten:

Hot Hardware GTX260 + 4890 vs. 4890 GTX260 + 4890 vs. GTX260
Call of Juarez, 1920x1200, 4xAA +37,9% +102,0%
Stormrise, 1920x1200 +21,2% +118,0%
Operation Flashpoint 2, 1920x1200, 4xAA +110,8% +31,5%
PC Perspective GTX260 + 4890 vs. 4890 GTX260 + 4890 vs. GTX260
Call of Juarez, 1920x1200, 4xAA +101,9% +38,0%
Operation Flashpoint 2, 1920x1200, 4xAA +32,0% +111,7
The Tech Report GTX260 + 4890 vs. 4890 GTX260 + 4890 vs. GTX260 GTX260 + 4770 vs. GTX260
Call of Juarez, 1920x1200, 4xAA +27,0% +95,8% +70,8%
F.E.A.R. 2, 1920x1200 +77,8% +92,6% +28,7%
Operation Flashpoint 2, 1920x1200, 4xAA +40,7% +45,6% +43,9%
Stormrise, 1920x1200 +7,3% +91,3% +78,3%

Wie man sieht, läuft die eigentliche Königsdisziplin bei Lucid ziemlich gut an: Überall gibt es Performancegewinne und auch die Paarung in der Performance ziemlich unterschiedlicher Karten (GeForce GTX 260 und Radeon HD 4770) macht keine Probleme. Sehr erstaunlich, daß hier etwas funktioniert, was bei Karten des gleichen Chipentwicklers sogar zu Performanceverlusten führt. Der eigentliche Clou von Lucids Hydra-Chip entfaltet sich aber dann, wenn man beispielsweise die Paarung einer Radeon HD 4890 mit einer GeForce GTX 260 jeweils gegenüber regulären CrossFire/SLI-Paarungen aus zwei Radeon HD 4890 bzw. zwei GeForce GTX 260 Karten vergleicht:

Hot Hardware Call of Juarez, 1920x1200, 4xAA Operation Flashpoint 2, 1920x1200, 4xAA
2x Radeon HD 4890 41,0 fps (1.) 38,6 fps (3.)
2x GeForce GTX 260 28,3 fps (3.) 57,0 fps (1.)
4890 + GTX260 30,9 fps (2.) 43,0 fps (2.)

Zwar erreicht die ungleiche Paarung aus Radeon HD 4890 und GeForce GTX 260 nirgendwo den ersten Platz, holt aber in diesen (ausgewählten) Vergleichen immer den zweiten Platz. Dies ist jetzt kein spezieller Verdienst der Lucid-Technologie, sondern die "natürliche" Auswirkung dieser entwicklerübergreifenden Paarung: Wenn man diese in ihrer technologischen Herangehensweise doch sehr unterschiedlichen Grafikkarten miteinander paart, dann überspielt man halt alle Fälle, wo mal die eine oder andere Grafikkarte besonders schwach ist. Das Endergebnis ist dann ein besonders ausgeglichenes Performancebild.

Ob dies Lucid so im Sinne hatte mit seinem Hydra-Chip, sei dahingestellt, in der Praxis dürfte diese Ausgeglichenheit aber wahrscheinlich einen höheren Nutzen haben als ein paar Prozent mehr Rohperformance. Dabei vermuten wir, daß sich der größte Nutzen dann ergibt, wenn man (in der Summe der Benchmarks) möglichst leistungsgleiche Grafikkarten paart – also beispielsweise Radeon HD 4850 & GeForce GTS 250, Radeon HD 4870 & GeForce GTX 260 und Radeon HD 4890 & GeForce GTX 275. Wie es mit dem gemeinsamen Verbund von DirectX10- und DirectX11-Grafikkarten aussieht, bliebe abzuwarten – vermutlich können diese zusammenarbeiten, dann aber eben nur im DirectX10-Modus.

Doch bevor man jetzt überall in Jubel ob der Möglichkeiten des Hydra-Chips ausbricht, sei darauf hingewiesen, daß es bislang nirgendwo vergleichende Benchmarks direkt gegenüber CrossFire und SLI gibt. Auch die vorstehend besprochenen Messungen mit zwei gleichen Grafikkarten wurden unserem Wissen nach im Hydra-Mode durchgeführt. Es wäre also noch herauszufinden, ob SLI und CrossFire nicht höhere (oder niedrigere) Performance bei der Paarung zweier gleicher Grafikkarten bieten, dies könnte die vorstehenden Ergebnisse noch maßgeblich durcheinanderwürfeln. Allerdings zeigen die Vorzeichen eher dahin, daß in einem gewöhnlichen Setup mit zwei gleichen Karten Hydra eine zu CrossFire und SLI in etwa vergleichbare Skalierung erbringt:

Skalierung 2x Radeon HD 4890 Skalierung 2x GeForce GTX 260
Hot Hardware +72% +81%
PC Perspective - +65%
The Tech Report - +64%

Die gemessenen Skalierungen liegen zwischen 64 und 81 Prozent und damit im normalen Rahmen wie bei CrossFire und SLI – der Hydra-Chip scheint also im gängigen Setup zweier gleicher Karten nicht schneller zu sein. Es wäre allerdings trotzdem ratsam, dies wenigstens einmal ganz exakt auszumessen – sprich ein explizites CrossFire-System gegen ein explizites SLI-System gegen das Hydra-System. Erst mit Zahlen von wirklich vonneinander unabhängigen Testplattformen könnte man sicher sagen, wie gut Lucids Hydra in diesem "Normalmodus" skaliert.

Damit scheint sich allerdings zumindest ein Versprechen von Lucid nicht zu erfüllen: Mehr Performance als CrossFire oder SLI im Normalmodus (mit zwei gleichen Karten) gibt es augenscheinlich nicht. Und da auch die Hydra-Engine letztlich mit Spieleprofilen arbeitet, kann man auch nicht darauf hoffen, daß es außerhalb der typischen Benchmark-Titel eventuell besser wird. Der Hydra-Chip eröffnet nach diesen ersten Benchmarks allerdings den Weg, zwei Grafikkarten unterschiedlicher Chipentwickler zu benutzen – und zwar nicht als Notnagel, sondern voll bewußt, weil man somit die Schwächen der einzelnen Chips unter diversen Spielen überspielen und somit zu einer deutlich ausgeglicheneren Gesamtperformance kommen kann. Dies erscheint uns als der Ansatz, welchen Lucid zukünftig stärker betonen sollte – denn hierbei kommt am meisten für den Nutzer heraus und können zudem ATI und nVidia naturgemäß nicht mit Lucid konkurrieren.

Leider keine Erwähnung in den drei vorverlinkten Artikel hat das Thema der Mikroruckler gefunden, mit welchem sich Besitzer von MultiGPU-Systemen üblicherweise herumärgern müssen. Normalerweise müsste die Art und Weise, wie Lucids Hydra-Chip die Arbeit zwischen den einzelnen Grafikchips verteilt, vollkommen Mikroruckler-resistent sein – leider hat dies allerdings keiner der Tester bestätigt. Sollte dies aber so zutreffen, liegt hierin natürlich ein zweiter großer Pluspunkt der Lucid-Technologie.

Nachtrag vom 22. November 2009

Laut HT4U enthält der aktuelle Lucid-Treiber für den Hydra-Chip gerade einmal fünf Spiele, in welchen der Mix-Modus funktioniert, wo man also Grafikkarten mit ATI- und nVidia-Chips mixen kann. Auch ansonsten teilt sich die Supportliste von ca. 120 Titeln ziemlich stark auf in Titel, die nur mit ATI- oder nur mit nVidia-Grafikkarten funktionieren. Dies könnte den Spaß an diesem technologisch doch hochinteressanten Produkt nachhaltig verderben, denn bislang ergibt sich die beste Verwendung des Hydra-Chips eigentlich im Mix-Modus, da dort die beste Durchschnitts-Performance erzielt wird. Die Nutzung von Hydra im reinen ATI- oder reinen nVidia-Modus erscheint dagegen erst dann sinnvoll, wenn sicher geklärt ist, daß hierbei keine Mikroruckler auftreten – dies sollte technologisch mit der Lucid-Lösung möglich sein, wurde aber erstaunlicherweise seitens Lucid bislang noch nicht zum Thema gemacht. So oder so aber haben HT4U mit ihrer Einschätzung recht, daß der Hydra-Chip mit diesem Treiber noch nicht releasefähig ist, da muß doch noch wesentlich mehr getan werden.