20

nVidia wiederbelebt MultiGPU-Rendering mittels neuem CFR-Modus

Aus unserem Forum (Dank an 'Blaire') kommt die hochinteressante Kunde über einen neuen, derzeit noch inoffiziellen wie auch undokumentierten MultiGPU-Modus in den aktuellen nVidia-Treibern – welcher allerdings durchaus das Potential hat, dem Thema "MultiGPU-Rendering" wieder neues Leben einzuhauchen. Hierbei handelt es sich augenscheinlich um ein Checkerboard-basiertes Verfahren, wo also nicht abwechselnd ein Bild von beiden Grafikkarten gerendert wird (AFR-Modus) oder das Bild platt in der Mitte zwischen zwei Grafikkarten aufgeteilt wird (SFR-Modus), sondern vielmehr das Bild in eine größere Menge an Tiles zerteilt wird und an jedem Tile dann immer nur eine der Grafikkarten arbeitet. Im Prinzip ergibt dies eine höherwertige, wahrscheinlich schlicht viel effizientere Version des SFR-Modus – interessanterweise ist der neue CFR-Modus im nVidia-Treiber unter dem alten SFR-Modus verborgen, welcher seinerseits zuletzt von nVidia überhaupt nicht mehr gepflegt wurde.

    nVidia CFR

  • "Checkered Frame Rendering" oder "Checkboard Frame Rendering", da basierend auf einem Checkerboard-Ansatz
  • verfügbar für DirectX 10/11/12 (nicht aber OpenGL & Vulkan)
  • setzt NVLink zwingend voraus
  • derzeit nur verfügbar für Turing-basierte nVidia-Grafikkarten (mit NVLink)
  • derzeit aktivierbar nur mittels Tools wie dem nvidiaProfileInspector
  • derzeit noch reichlich Kompatibilitäts-Probleme
  • wegen des Checkerboard-Ansatzes jedoch keine Mikroruckler-Probleme wie beim AFR-Modus
  • Beschreibung, Aktivierung & Spielekompatibilitäts-Liste im 3DCenter-Forum

nVidia hat zwar zuletzt immer noch SLI-Profile für diverse neue Spiele in seine Treiber eingebunden, diese basierten jedoch ausschließlich auf dem AFR-Modus und gehen damit immer mit dem Problem der (unbeliebten) Mikrorucker einher. Eine große Begeisterung bezüglich MultiGPU wollte aber zuletzt trotzdem nicht mehr aufkommen, bei vielen Spielen ist AFR auch Engine-bedingt nicht möglich oder führt nicht zu beachtbaren Performance-Gewinnen. Augenscheinlich hat nVidia aber die MultiGPU-Flinte doch noch nicht ganz ins Korn geworfen und intern unter dem Namen "CFR" an einer Verbesserung von "SFR" gearbeitet – welches bei Funktionieren zum einen gutklassige Performance-Gewinne und zum anderen Mikroruckler-Verhinderung miteinander verbinden kann. Augenscheinlich ist nVidia in dieser Frage aber noch mitten in der Arbeit, denn die Spiele-Kompatibilität ist derzeit noch nicht besonders hoch (siehe die Kompatibilitäts-Liste in unserem Forum).

Da CFR derzeit nur über extra Tools aktivierbar ist bzw. sogar hier und da etwas Handarbeit beim Tweaken erfordert, ist das ganze zum jetzigen Stand sowieso nur etwas für absolute Enthusiasten, welche jede Möglichkeit mitnehmen – und dann mittels CFR hier und da auf Spiele-Titel stoßen, wo MultiGPU bisher nicht aktivierbar war und CFR dies dann tatsächlich ermöglicht. nVidia dürfte sicherlich noch einige Zeit an diesem Modus arbeiten, ehe dieser dann offiziell gemacht werden wird – womöglich ist CFR auch schlicht erst zum Vorstellung der kommenden Ampere-Generation geplant. Eventuell kann man auch darüber spekulieren, das nVidia hierbei Grundlagen-Arbeit für zukünftige MultiChip-Designs tätigt, welche schließlich der Ampere nachfolgenden Hopper-Generation nachgesagt werden. In jedem Fall werden die absoluten Enthusiasten, welche trotz der allgemeinen mauen Lage bei MultiGPU-Rendering weiterhin zu gleich zwei nVidia-Grafikkarten gegriffen haben, diese neuerliche Arbeit am MultiGPU-Rendering durchaus zu goutieren wissen.

Nachtrag vom 24. November 2019

Aus unserem Forum kommen erneut von 'Blaire' erste Benchmarks zu nVidias CFR, aufgenommen auf zwei GeForce RTX 2080 Ti (unter Undervolting, damit nicht direkt vergleichbar mit anderen Ergebnissen) und im Vergleich mit dem AFR-Verfahren. Herausgesucht wurden dabei natürlich Spieletitel, wo CFR überhaupt funktionierte, jene Messungen sollten also nicht als genereller Vergleich zwischen AFR und CFR verstanden werden. Nominell erreicht CFR sowieso nur knapp die Performance von AFR, wobei diesbezüglich auch der eine Titel ohne jede AFR-Kompatibilität im Performance-Schnitt erheblich weitergeholfen hat. Andererseits ist dies schon einmal ein passables Ergebnis, denn der Hauptgrund für die seinerzeitige Nichtnutzung des CFR-Vorgängers "SFR" bestand in dessen deutlich geringerer Skalierung bzw. Performance gegenüber AFR. Sprich: Sobald CFR nur das Performance-Level von AFR erreicht, hat es schon gewonnen – immerhin existiert unter CFR die Mikroruckler-Problematik nicht, was es schließlich so interessant macht. Zu einer gleichen Performance ist es noch ein gewisse Weg, zu einer hohen Spiele-Kompabilität dagegen wohl noch ein wirklich langer – derzeit ist CFR ganz augenscheinlich in einer frühen Erprobungsphase und im Ansatz noch nicht marktreif.

2080Ti 2x 2080Ti @ AFR 2x 2080Ti @ CFR
Crysis 3 (4K @ Very High) 43,4 fps 82,0 fps  (+89%) 64,5 fps  (+49%)
Chernobylite  (4K @ Ultra) 55,2 fps 72,3 fps  (AFR2, +31%) 76,0 fps  (+38%)
A Plague Tale: Innocence  (4K @ Ultra) 60 fps - 87 fps  (+45%)
Neon Noir  (4K @ Ultra) 4271 6499  (AFR2, +52%) 6411  (+50%)
Performance-Schnitt 100% 143,0% 145,4%
gemäß den Benchmarks von 'Blaire' im 3DCenter Forum mit zwei GeForce RTX 2080 Ti @ Undervolting