11

nVidia erklärt "Mixed Precision"

Auf der Supercomputer-Konferenz SC15 ist nVidia in seinem Vortrag auch auf die ab der Pascal-Architektur geplante "Mixed Precison" eingegangen. Hierbei handelt es sich schlicht um den Ansatz, nur so viel an Rechengenauigkeit zu verwenden, wie für die konkrete Aufgabe (oder Teilaufgabe) wirklich notwendig ist – und damit dann erheblich an Rechenleistung und damit Berechnungszeit zu sparen. Zu diesem Zweck wird die Pascal-Architektur auch eine HalfPrecison-Rechengenauigkeit unterstützen, welche dann also mit nur 16 Bit Genauigkeit operiert (SinglePrecision = 32 Bit, DoublePrecision = 64 Bit). Interessanterweise will nVidia diesen Modus derart implementieren, daß HalfPrecision exakt den vierfachen Durchsatz ergibt wie DoublePrecision (sprich 4x schneller läuft):

Dies ist ein überdeutlicher Hinweis darauf, daß nVidia zwischen Single- und DoublePrecision bei der Pascal-Architektur ein Verhältnis von 2:1 vorgesehen hat – ansonsten würde sich das klar zu sehende Verhältnis von 4:1 zwischen Half- und DoublePrecision nicht realisieren lassen. Dies gilt natürlich primär nur für den GP100-Chip der Pascal-Architektur, alle anderen Chips dürften in diesen Fragen abgespeckt sein, da jene weiteren Chips für das professionelle Segment nicht so bedeutsam sind. Gegenüber den bisherigen nVidia-Architekturen mit einem maximalen SP/DP-Verhältnis von 3:1 wäre dies ein enormer Sprung, gewinnt man allein durch die Umänderung der Recheneinheiten nominell 50% mehr DoublePrecision-Rechenleistung.

Andererseits macht dieser Schritt es für nVidia nochmals sinnvoller, eine klare Trennlinie zwischen professionellen Beschleunigern und Gaming-Grafikkarten zu ziehen – da für letztere diese hohe DoublePrecision-Rechenleistung vollkommen nutzlos ist und faktisch nur Transistoren kostet, die man wo anders sinnvoller (für den Gaming-Einsatz) verwenden könnten. Insofern wird es immer wahrscheinlicher, daß der GP100-Chip rein ins professionelle Segment geht und der GP102-Chip dann den (alleinigen) Gaming-Nachfolger des GM200 stellen soll. Dabei könnten beide Top-Chips der Pascal-Architektur durchaus ähnlich groß ausfallen – es ist keinesfalls gesagt, daß der GP102 seitens nVidia als (flächenmäßig) bedeutsam kleiner gegenüber dem GP100 geplant wird.

Jener GP102-Chip dürfte dann allerdings bewußt um die professionellen Features des GP100 erleichtert sein (NVLink & hohe DoublePrecision-Leistung) – offen bleibt noch, ob auch die vorgenannte HalfPrecision bei diesem gestrichen wird. Denn es ist vorstellbar, daß es hierfür auch im Gaming-Bereich Einsatzmöglichkeiten gibt. Bei vielen Zwischenrechnungs-Schritten auch in der Grafikberechnung könnte eine abgesenkte Rechengenauigkeit ohne Bildqualitätsverluste nutzvoll sein und damit auch dort Rechenleistung sparen. Natürlich würde es Jahre dauern, dieses Feature bei den Spieleentwicklern durchzusetzen, welche dann für nVidia-Beschleuniger (ab der Pascal-Generation) eine Extrawurst braten müsste – unmöglich ist dieser Weg allerdings nicht.