5

AMDs "Rapid Packed Math" Vega-Feature ermöglicht FP16-Berechnungen mit doppelter Performance

Ein Thread unseres Forums beschäftigt sich mit der Frage, was AMDs Vega-Feature "Rapid Packed Math" genau bedeutet, was es bewirkt, wieviel es bringt und ob andere Grafikbeschleuniger ähnliches aufbieten können. Prinzipell verbirgt sich hinter "Rapid Packed Math" schlicht die Fähigkeit, FP16- und INT16-Berechnung doppelt so schnell ausführen zu können wie die ansonsten üblichen FP32-Berechnungen – sprich in der Zeit einer FP32-Berechnung alternativ auch zwei FP16- oder INT16-Berechnungen erledigen zu können. Eine reine FP16/INT16-Fähigkeit ist dagegen etwas anderes, dies bedeutet nur den grundsätzlichen Support dieser Rechenoperation – ohne aber einen größeren Performancegewinn (anstatt einer FP32-Berechnung kann eine FP16/INT16-Berechnung in exakt derselben Zeit durchgeführt werden). Mittels "Rapid Packed Math" kann man also rein theoretisch doppelt so viele Shader-Operationen durchführen wie gewöhnlich, die nominelle Rechenleistung also glatt verdoppeln. In der Praxis von PC-Spielen kommt es natürlich nirgendwo auch nur annähern zu einer Verdopplung – denn erstens kann FP16/INT16 ohne sichtbare Bildqualitätsverluste immer nur für gewisse Bildteile verwendet werden.

Und zweitens bedeutet selbst eine doppelt so schnelle Shader-Ausführung natürlich keine doppelten fps – da gibt es vorher und nachher schließlich noch andere Rechenschritte zu bewältigen, welche auch mit "Rapid Packed Math" nur genauso schnell laufen wie ohne. In einem positiven Szenario wäre mittels "Rapid Packed Math" ein insgesamter Performancegewinn von vielleicht +10% zu erreichen – nichts gänzlich weltbewegendes also, aber immer noch ausreichend, um in einem harten Wettbewerb einen Benchmark-technisch beachbaren Vorteil zu verbuchen. Allerdings erfordert "Rapid Packed Math" immer auch den Support des Spieleentwicklers – nur jener kann letztlich entscheiden, welche Bildteile von deren Optikqualität her derart unkritisch sind, auf das man vom gewöhnlichen FP32 auf FP16/INT16-Genauigkeit herunterschalten kann. Wie der Guru3D notiert, wird "Rapid Packed Math" (bisher bekannt) zukünftig von Far Cry 5, Wolfenstein II sowie der "Serra"-Benchmarksequenz von Futuremark unterstützt werden.

In letztgenannter Grafikdemo bringt "Rapid Packed Math" der Radeon RX Vega 64 derzeit einen Performancegewinn von +14%, aufgrund des theoretischen Charakters dieser Futuremark-Grafikdemo dürfte dieser Wert allerdings am obersten Rand des Erreichbaren liegen. Wie schnell sich "Rapid Packed Math" bei anderen Spieletiteln durchsetzt, bleibt natürlich abzuwarten – andererseits scheint der Aufwand für den Spieleentwickler nicht all zu groß zu sein, dieses Feature könnte sich also sogar eher früher als später durchsetzen. Hinzu kommt, das nVidia etwas ähnliches unter dem Stichwort "HalfPrecision" bereits mit dem HPC-Chip GP100 realisiert hatte – was sicherlich über kurz oder lang dann auch bei den Gaming-Grafikchips von nVidia wieder auftauchen dürfte. Außerhalb des reinen PC-Bereichs gibt es (doppelte) FP16-Power auch bei der Playstation 4 Pro (nicht aber bei der Xbox One X) sowie bei nVidias jüngsten Tegra-Chips. "Rapid Packed Math" bzw. "HalfPrecision" haben damit sicherlich gute Chancen, in einigen Jahren zu einem allgemeinen Standardfeature sowohl bei Grafikchips als auch den dann aktuellen Spielen zu werden.