Von Sinn und Unsinn bei AMDs "DualGraphics"

Samstag, 14. April 2012
 / von Leonidas
 

"DualGraphics" ist AMDs Marketingbezeichnung für diesen Anwendungsfall, wenn zusätzlich zu einem AMD Llano-Prozessor mit integrierter Grafikeinheit noch eine extra AMD-Grafiklösung verbaut wird, die dann zusammen mit der integrierten AMD-Grafiklösung arbeitet. Konkret bedeutet dies, daß sich die extra Grafiklösung außerhalb des 3D-Betriebs abschaltet, im 3D-Betrieb arbeiten dann beide Grafiklösung im CrossFire-Verbund zusammen. Und hiermit ergibt sich auch schon das eigentliche Problem dieser Technologie: CrossFire im LowCost-Bereich, denn nichts anderes ist dies ja schließlich.

Normalerweise setzt man CrossFire heutzutage nur noch dann an, wenn Frameraten ab 50 fps angepeilt werden, um zumindest den Mikroruckler-Effekt weitestgehend auszuschalten. Mit HighEnd-Grafikkarten ist dies in der Regel erreichbar – aber ganz gewiß nicht dann, wenn man die integrierten LowCost-Grafiklösungen von AMD-Prozessoren mit Grafikkarten des LowCost- oder unteren Mainstream-Segments paart. Sicherlich wird es mit "DualGraphics" einen beachtbaren Performance-Gewinn geben – aber auch im besten Fall 80% Performancegewinn auf eine integrierte Grafiklösung gerechnet ergeben keine Frameraten, mittels welchen unter FullHD selbst ohne Anti-Aliasing jene 50 fps zu erreichen sind. Für die höhere Performance handelt man sich also in jedem Fall die Mikroruckler-Problematik ein – und da ein CrossFire-System im LowCost-Bereich die tendentiell niedrigeren Frameraten erzeugt, ist in dieser Konstellation sogar von einem klar stärkeren Mikroruckler-Auftreten auszugehen.

Hinzu kommt der Punkt, daß die PC-Hersteller leider jede Menge an extra Grafiklösungen mit den integrierten AMD-Grafiklösungen paaren können. Die Spielbreite ist dabei enorm hoch, so daß beispielsweise an eine Radeon HD 6550D mit 400 Shader-Einheiten auf 600 MHz Takt von Radeon HD 6450 mit 160 Shader-Einheiten auf 750 MHz Takt (deutlich langsamer als die integrierte Lösung) bis Radeon HD 6670 mit 480 Shader-Einheiten auf 800 MHz Takt (deutlich schneller als die integrierte Lösung) alles angeflanscht werden darf. Da asymetrisches CrossFire in den wenigsten Fällen (im Sinne von mehr Performance) funktioniert, ist die Performance dieser CrossFire-Kombinationen in diesem Fall immer auf das maximal Doppelte der jeweils kleinsten der beiden Grafiklösungen oder halt die alleinige Performance der jeweils größeren Grafiklösung limitiert (Ausnahmen bestätigen die Regel).

In diesem Sinne ist es besonders unverständlich, wenn die PC-Hersteller dann auch noch reihenweise solcherart Geräte mit asymetrischem CrossFire auch in den Markt bringen. Eine sinnvolle Paarung für "DualGraphics" ist immer eine extra Grafiklösung mit nahezu derselben Performance wie die integrierte Grafiklösung. Um unter den ganzen Marketingbezeichnungen für jede einzelne "DualGraphics"-Paarung diejenige zu erkennen, welche sinnvoll und gangbar im Sinne etwa gleichstarker Beschleuniger sind, sollen folgenden Tabellen weiterhelfen:

(Desktop) integriert extra Vergleich
Radeon HD 6430 D2 Radeon HD 6410D
160 Shader-Einheiten, 8 TMUs und 4 ROPs @ 600 MHz, shared 128 Bit DDR Speicherinterface @ 667-800 MHz
Radeon HD 6350
160 Shader-Einheiten, 8 TMUs und 4 ROPs @ 650 MHz, 64 Bit DDR Speicherinterface @ 800 MHz

(eine nahezu ideale Kombination)
Radeon HD 6510 D2 Radeon HD 6410D
160 Shader-Einheiten, 8 TMUs und 4 ROPs @ 600 MHz, shared 128 Bit DDR Speicherinterface @ 667-800 MHz
Radeon HD 6450
160 Shader-Einheiten, 8 TMUs und 4 ROPs @ 800 MHz, 64 Bit DDR Speicherinterface @ 800 MHz

die Radeon HD 6450 ist etwas zu stark, aber notfalls geht das schon)
Radeon HD 6550 D2 Radeon HD 6530D
320 Shader-Einheiten, 16 TMUs und 8 ROPs @ 443 MHz, shared 128 Bit DDR Speicherinterface @ 667-800 MHz
Radeon HD 6450
160 Shader-Einheiten, 8 TMUs und 4 ROPs @ 800 MHz, 64 Bit DDR Speicherinterface @ 800 MHz

(passt ungefähr, denn trotz vermeintlich abweichender Spezifikationen sind die Rohleistungen nahezu gleich)
Radeon HD 6550 D2 Radeon HD 6550D
400 Shader-Einheiten, 20 TMUs und 8 ROPs @ 600 MHz, shared 128 Bit DDR Speicherinterface @ 667-800 MHz
Radeon HD 6450
160 Shader-Einheiten, 8 TMUs und 4 ROPs @ 800 MHz, 64 Bit DDR Speicherinterface @ 800 MHz

(die Radeon HD 6450 ist klar zu schwach für diese Aufgabe)
Radeon HD 6610 D2 Radeon HD 6530D
320 Shader-Einheiten, 16 TMUs und 8 ROPs @ 443 MHz, shared 128 Bit DDR Speicherinterface @ 667-800 MHz
Radeon HD 6570
480 Shader-Einheiten, 24 TMUs und 8 ROPs @ 650 MHz, 128 Bit DDR Speicherinterface @ 900-2000 MHz

(die Radeon HD 6570 hat geradezu dramatisch mehr Performance)
Radeon HD 6630 D2 Radeon HD 6550D
400 Shader-Einheiten, 20 TMUs und 8 ROPs @ 600 MHz, shared 128 Bit DDR Speicherinterface @ 667-800 MHz
Radeon HD 6570
480 Shader-Einheiten, 24 TMUs und 8 ROPs @ 650 MHz, 128 Bit DDR Speicherinterface @ 900-2000 MHz

(die Radeon HD 6570 ist klar schneller, notfalls durch das breitere Speicherinterface)
Radeon HD 6690 D2 Radeon HD 6530D
320 Shader-Einheiten, 16 TMUs und 8 ROPs @ 443 MHz, shared 128 Bit DDR Speicherinterface @ 667-800 MHz
Radeon HD 6670
480 Shader-Einheiten, 24 TMUs und 8 ROPs @ 800 MHz, 128 Bit DDR Speicherinterface @ 900-2000 MHz

(die Radeon HD 6670 hat geradezu dramatisch mehr Performance)
Radeon HD 6690 D2 Radeon HD 6550D
400 Shader-Einheiten, 20 TMUs und 8 ROPs @ 600 MHz, shared 128 Bit DDR Speicherinterface @ 667-800 MHz
Radeon HD 6670
480 Shader-Einheiten, 24 TMUs und 8 ROPs @ 800 MHz, 128 Bit DDR Speicherinterface @ 900-2000 MHz

(die Radeon HD 6670 hat geradezu dramatisch mehr Performance)

AMD hat leider – obwohl nun genügend Nummern-Spielraum vorhanden ist – gleich zweimal einer unterschiedlichen Hardware-Kombination denselben "DualGraphics"-Marketingnamen gegeben und sorgt damit nur für eine zusätzliche Kundenverwirrung in diesem sowieso nur eher selten dokumentierten Feld. In Bezug auf die angestrebte Gleichheit von integrierter und extra Grafiklösung gibt es einige Erfolge zu verzeichnen – dafür aber auch deutliche Mißerfolge von absolut nicht zueinanderpassenden Grafiklösungen. Darunter fallen auch alle DualGraphics-Kombinationen mit der stärksten integrierten Lösung Radeon HD 6550D, für welche es schlicht kein gutes gleichwertiges Pendant unter den extra Grafiklösungen gibt.

(Mobile) integriert extra Vergleich
Radeon HD 6510 G2 Radeon HD 6480G
160 Shader-Einheiten, 8 TMUs und 4 ROPs @ 444 MHz, shared 128 Bit DDR Speicherinterface @ 667 MHz
Radeon HD 6430M
160 Shader-Einheiten, 8 TMUs und 4 ROPs @ 480 MHz, 64 Bit DDR Speicherinterface @ 800 MHz

(eine nahezu ideale Kombination)
Radeon HD 6510 G2 Radeon HD 6480G
160 Shader-Einheiten, 8 TMUs und 4 ROPs @ 444 MHz, shared 128 Bit DDR Speicherinterface @ 667 MHz
Radeon HD 6450M
160 Shader-Einheiten, 8 TMUs und 4 ROPs @ 600 MHz, 64 Bit DDR Speicherinterface @ 800 MHz

(die Radeon HD 6450M ist etwas zu stark, aber notfalls geht das schon)
Radeon HD 6510 G2 Radeon HD 6480G
160 Shader-Einheiten, 8 TMUs und 4 ROPs @ 444 MHz, shared 128 Bit DDR Speicherinterface @ 667 MHz
Radeon HD 6470M
160 Shader-Einheiten, 8 TMUs und 4 ROPs @ 750 MHz, 64 Bit DDR Speicherinterface @ 900 MHz

(die Radeon HD 6470M ist doch zu stark für diese Kombination)
Radeon HD 6515 G2 Radeon HD 6480G
160 Shader-Einheiten, 8 TMUs und 4 ROPs @ 444 MHz, shared 128 Bit DDR Speicherinterface @ 667 MHz
Radeon HD 6490M
160 Shader-Einheiten, 8 TMUs und 4 ROPs @ 750 MHz, 64 Bit DDR Speicherinterface @ 900-1600 MHz

(die Radeon HD 6490M ist doch zu stark für diese Kombination)
Radeon HD 6540 G2 Radeon HD 6520G
320 Shader-Einheiten, 16 TMUs und 8 ROPs @ 400 MHz, shared 128 Bit DDR Speicherinterface @ 667 MHz
Radeon HD 6450M
160 Shader-Einheiten, 8 TMUs und 4 ROPs @ 600 MHz, 64 Bit DDR Speicherinterface @ 800 MHz

(die Radeon HD 6450M ist doch zu schwach für diese Kombination)
Radeon HD 6540 G2 Radeon HD 6520G
320 Shader-Einheiten, 16 TMUs und 8 ROPs @ 400 MHz, shared 128 Bit DDR Speicherinterface @ 667 MHz
Radeon HD 6470M
160 Shader-Einheiten, 8 TMUs und 4 ROPs @ 750 MHz, 64 Bit DDR Speicherinterface @ 900 MHz

(passt ungefähr, denn trotz vermeintlich abweichender Spezifikationen sind die Rohleistungen nahezu gleich)
Radeon HD 6545 G2 Radeon HD 6520G
320 Shader-Einheiten, 16 TMUs und 8 ROPs @ 400 MHz, shared 128 Bit DDR Speicherinterface @ 667 MHz
Radeon HD 6490M
160 Shader-Einheiten, 8 TMUs und 4 ROPs @ 750 MHz, 64 Bit DDR Speicherinterface @ 900-1600 MHz

(passt ungefähr, denn trotz vermeintlich abweichender Spezifikationen sind die Rohleistungen nahezu gleich)
Radeon HD 6640 G2 Radeon HD 6620G
400 Shader-Einheiten, 20 TMUs und 8 ROPs @ 444 MHz, shared 128 Bit DDR Speicherinterface @ 667 MHz
Radeon HD 6450M
160 Shader-Einheiten, 8 TMUs und 4 ROPs @ 600 MHz, 64 Bit DDR Speicherinterface @ 800 MHz

(die Radeon HD 6450M ist doch zu schwach für diese Kombination)
Radeon HD 6640 G2 Radeon HD 6620G
400 Shader-Einheiten, 20 TMUs und 8 ROPs @ 444 MHz, shared 128 Bit DDR Speicherinterface @ 667 MHz
Radeon HD 6470M
160 Shader-Einheiten, 8 TMUs und 4 ROPs @ 750 MHz, 64 Bit DDR Speicherinterface @ 900 MHz

(die Radeon HD 6470M ist doch zu schwach für diese Kombination)
Radeon HD 6645 G2 Radeon HD 6620G
400 Shader-Einheiten, 20 TMUs und 8 ROPs @ 444 MHz, shared 128 Bit DDR Speicherinterface @ 667 MHz
Radeon HD 6490M
160 Shader-Einheiten, 8 TMUs und 4 ROPs @ 750 MHz, 64 Bit DDR Speicherinterface @ 900-1600 MHz

(die Radeon HD 6490M ist doch zu schwach für diese Kombination)
Radeon HD 6680 G2 Radeon HD 6520G
320 Shader-Einheiten, 16 TMUs und 8 ROPs @ 400 MHz, shared 128 Bit DDR Speicherinterface @ 667 MHz
Radeon HD 6630M
480 Shader-Einheiten, 24 TMUs und 8 ROPs @ 485 MHz, 128 Bit DDR Speicherinterface @ 800 MHz

(die Radeon HD 6630M hat geradezu dramatisch mehr Performance)
Radeon HD 6690 G2 Radeon HD 6620G
400 Shader-Einheiten, 20 TMUs und 8 ROPs @ 444 MHz, shared 128 Bit DDR Speicherinterface @ 667 MHz
Radeon HD 6630M
480 Shader-Einheiten, 24 TMUs und 8 ROPs @ 485 MHz, 128 Bit DDR Speicherinterface @ 800 MHz

(die Radeon HD 6630M ist etwas zu stark, aber notfalls geht das schon)
Radeon HD 6720 G2 Radeon HD 6520G
320 Shader-Einheiten, 16 TMUs und 8 ROPs @ 400 MHz, shared 128 Bit DDR Speicherinterface @ 667 MHz
Radeon HD 6650M
480 Shader-Einheiten, 24 TMUs und 8 ROPs @ 600 MHz, 128 Bit DDR Speicherinterface @ 900 MHz

(die Radeon HD 6650M hat geradezu dramatisch mehr Performance)
Radeon HD 6740 G2 Radeon HD 6520G
320 Shader-Einheiten, 16 TMUs und 8 ROPs @ 400 MHz, shared 128 Bit DDR Speicherinterface @ 667 MHz
Radeon HD 6730M
480 Shader-Einheiten, 24 TMUs und 8 ROPs @ 725 MHz, 128 Bit DDR Speicherinterface @ 900 MHz

(die Radeon HD 6730M hat geradezu dramatisch mehr Performance)
Radeon HD 6740 G2 Radeon HD 6620G
400 Shader-Einheiten, 20 TMUs und 8 ROPs @ 444 MHz, shared 128 Bit DDR Speicherinterface @ 667 MHz
Radeon HD 6650M
480 Shader-Einheiten, 24 TMUs und 8 ROPs @ 600 MHz, 128 Bit DDR Speicherinterface @ 900 MHz

(die Radeon HD 6650M ist doch zu stark für diese Kombination)
Radeon HD 6755 G2 Radeon HD 6520G
320 Shader-Einheiten, 16 TMUs und 8 ROPs @ 400 MHz, shared 128 Bit DDR Speicherinterface @ 667 MHz
Radeon HD 6750M
480 Shader-Einheiten, 24 TMUs und 8 ROPs @ 600 MHz, 128 Bit DDR Speicherinterface @ 1600 MHz

(die Radeon HD 6750M hat geradezu dramatisch mehr Performance)
Radeon HD 6755 G2 Radeon HD 6620G
400 Shader-Einheiten, 20 TMUs und 8 ROPs @ 444 MHz, shared 128 Bit DDR Speicherinterface @ 667 MHz
Radeon HD 6750M
480 Shader-Einheiten, 24 TMUs und 8 ROPs @ 600 MHz, 128 Bit DDR Speicherinterface @ 1600 MHz

(die Radeon HD 6750M hat geradezu dramatisch mehr Performance)
Radeon HD 6760 G2 Radeon HD 6620G
400 Shader-Einheiten, 20 TMUs und 8 ROPs @ 444 MHz, shared 128 Bit DDR Speicherinterface @ 667 MHz
Radeon HD 6730M
480 Shader-Einheiten, 24 TMUs und 8 ROPs @ 725 MHz, 128 Bit DDR Speicherinterface @ 900 MHz

(die Radeon HD 6730M hat geradezu dramatisch mehr Performance)
Radeon HD 6775 G2 Radeon HD 6520G
320 Shader-Einheiten, 16 TMUs und 8 ROPs @ 400 MHz, shared 128 Bit DDR Speicherinterface @ 667 MHz
Radeon HD 6770M
480 Shader-Einheiten, 24 TMUs und 8 ROPs @ 725 MHz, 128 Bit DDR Speicherinterface @ 1800 MHz

(die Radeon HD 6770M hat geradezu dramatisch mehr Performance)
Radeon HD 6775 G2 Radeon HD 6620G
400 Shader-Einheiten, 20 TMUs und 8 ROPs @ 444 MHz, shared 128 Bit DDR Speicherinterface @ 667 MHz
Radeon HD 6770M
480 Shader-Einheiten, 24 TMUs und 8 ROPs @ 725 MHz, 128 Bit DDR Speicherinterface @ 1800 MHz

(die Radeon HD 6770M hat geradezu dramatisch mehr Performance)

Das Mobile-Feld bietet wie üblich noch verworrenere Bezeichnungen und ist damit noch schwieriger für den potentiellen Notebook-Käufer zu durchschauen: AMD setzt hierbei gleich mehrfach die gleiche DualGraphics-Bezeichnung für verschiedene Kombinationen an integrierter und extra Grafiklösungen ein – wieso man nicht bei einer vierstelligen Nummer für jede Kombination eine extra Bezeichnung finden konnte, darf AMD den Notebook-Käufern gern einmal schlüssig erklären. Wenigstens gibt es auch hier wieder einige halbwegs passende DualGraphics-Kombinationen – allerdings auch reihenweise völlig unpassender DualGraphics-Kombinationen. Und erneut läßt sich für die schnellste integrierte Lösung in Form der Radeon HD 6620G kein sinnvolles Pendant unter den extra Grafiklösungen finden.

In der Summe finden sich die sinnvollen DualGraphics-Kombinationen sowohl im Desktop- als auch im Mobile-Bereich ausschließlich am unteren Ende der Skala – zumeist reicht es aus, die kleinste oder zweitkleinste extra Grafiklösung mit einer integrierten Grafiklösung zu paaren, um eine halbwegs vergleichbare Performance beider Grafikbeschleuniger zu erzielen und somit eine sinnvolle DualGraphics-Kombination in den Händen zu halten. Je höher man mit den extra Grafiklösungen geht, um so sinnloser werden dagegen die DualGraphics-Kombinationen – bis hin in die Richtung, daß die extra Grafiklösung gleich die doppelte Performance der integrierten Garfiklösung bietet, was im CrossFire-Einsatz verlorene Liebesmüh (bzw. in diesem Fall Silizium- und Stromverschwendung) ist.

Gerade in solchen Fällen mit besonders starker extra Grafiklösung wäre es sinnvoller seitens der Notebook-Hersteller, die beiden Grafiklösungen nicht in einen CrossFire-Betrieb zu setzen, sondern vielmehr den "Dynamic Switchable Graphics" Modus zu aktivieren, wo die eine Grafiklösung also exklusiv die 2D-Arbeit macht und die andere, leistungstärkere Grafiklösung exklusiv die 3D-Arbeit übernimmt (und ansonsten abgeschalten bleibt). Natürlich sind die integrierte Grafiklösungen von Llano etwas Overkill für diesen Fall – noch besser wäre es, in einem solchen Fall ganz auf die integrierte Llano-Grafik zu verzichten und ausschließlich auf die extra Grafiklösung zu setzen.

Was bleibt am Ende also bei DualGraphics stehen? Viele unsinnige Kombinationen, wo die gänzliche Abschaltung der integrierten Grafiklösung die bessere Wahl wäre und wenige halbwegs sinnvolle Kombinationen, die aber allesamt im LowCost- und unterem Mainstream-Bereich angesiedelt sind und daher wegen des verstärkten Auftretens von Mikrorucklern unter niedrigen Frameraten nicht wirklich empfehlenswert sind. Die ganze Idee von DualGraphics erscheint uns daher etwas obskur – da hat AMD nun einmal die guten integrierten Grafiklösungen bei Llano (und nachfolgend bei Trinity), dann sollte man diese auch nutzen. Besonders bei Notebooks, wo jede zusätzliche Komponente doch Akkulaufzeit frisst, erstaunt der häufig zu sehende Einsatz von DualGraphics. Wir würden jedenfalls lieber gern mehr Geräte mit integrierter Llano-Grafik ohne DualGraphics sehen, wo man sich ganz auf die Vorteile der doch vergleichsweise starken integrierten Llano-Grafik konzentriert.

Nachtrag vom 15. April 2012

Bei der Diskussion zu diesem Artikel kam auch der seinerzeitige Test der ComputerBase zur Sprache, welcher die Mikroruckler-Problematik von CrossFire-Kombinationen bei DualGraphics eindrucksvoll untermauert: Die dort verwendete Kombination von integrierter Radeon HD 6550D und extra Radeon HD 6670 ist derart ungleich, daß unter CrossFire die extra Grafikkarte schnell zwei Bilder erzeugt und zum Monitor schickt – um dann auf die viel langsamere integrierte Grafik zu warten, bis diese mal ein Bild erzeugt hat. In der Folge dessen kamen den Testern selbst Frameraten von 40 fps mit DualGraphics noch ruckeliger vor als eine Framerate von 20 fps ohne DualGraphics – was zumindest der Idee der Paarung von derart ungleichen Grafiklösungen eine deutliche Absage aus der reinen Praxis erteilt.