1

Spezifikations-Vergleich AMD FirePro W9100, Intel Xeon Phi 7120 & nVidia Tesla K40

Ein wenig untergegangen in der letzten Woche ist AMDs Ankündigung der FirePro W9100, dem neuen GPGPU-Beschleuniger von AMD auf Basis des Hawaii-Chips. Der spannender Punkt an der FirePro W9100 ist dabei vor allem die wirklich gute SP/DP-Rate von nur 2:1, womit unter DoublePrecision-Berechnungen immerhin (grob) die Hälfte der nominellen Rechenkraft zur Verfügung steht (die Taktrate unter DP ist wohl TDP-bedingt etwas niedriger als unter SP). Bei nVidias Tesla-Beschleunigern liegt die SP/DP-Rate nach wie vor bei bestenfalls 3:1, jene liegen ergo bei der DoublePrecision-Rechenkraft nunmehr deutlich zurück. Intels Xeon Phi GPGPU-Beschleuniger bieten zwar ebenfalls ein SP/DP-Verhältnis von 2:1, sind jedoch allgemein noch nicht auf dem Niveau der GPGPU-Angebote von AMD und nVidia angelangt.

AMD FirePro W9100 Intel Xeon Phi 7120 nVidia Tesla K40
Chipbasis AMD Hawaii, 6,2 Mrd. Transistoren in 28nm auf 438mm² Chip-Fläche Intel Knights Corner, ~5 Mrd. Transistoren in 22nm auf ~650-700mm² Chip-Fläche nVidia GK110, 7,1 Mrd. Transistoren in 28nm auf 561mm² Chipfläche
Technik 2816 Shader-Einheiten an einem 512 Bit DDR Speicherinterface, 2 FMA pro Takt & Shader-Einheit, SP/DP-Verhältnis von 2:1 61 x86-Rechenkerne an einem 512 Bit DDR Speicherinterface, 32 FMA pro Takt & Rechenkern, SP/DP-Verhältnis von 2:1 2880 Shader-Einheiten an einem 384 Bit DDR Speicherinterface, 2 FMA pro Takt & Shader-Einheit, SP/DP-Verhältnis von 3:1
Taktraten ≤1000/≤950/? MHz 1238/1333/2750 MHz 745-875/3000 MHz
Speicher 16 GB GDDR5 16 GB GDDR5 12 GB GDDR5
SinglePrecision ≤5,63 TFlops 2,41-2,60 TFlops 4,29-5,04 TFlops
DoublePrecision ≤2,67 TFlops 1,20-1,30 TFlops 1,43-1,68 TFlops
Bandbreite >300 GB/sec 352 GB/sec 288 GB/sec
TDP ? 235W 300W

Mit der FirePro W9100 stellt AMD nunmehr jene SingleChip-Lösung mit der klar höchsten SinglePrecision- wie auch DoublePrecision-Rechenleistung vor, nVidias langjährige Vormachtstellung in diesem Segment scheint somit (nominell) gebrochen zu sein. Hierbei spielt insbesondere die Veränderung des SP/DP-Verhältnisses von 4:1 beim R1000/Tahiti-Chip zu nunmehr 2:1 beim Hawaii-Chip hinein, damit kann AMD nun auch bei der im professionellen Bereich eher interessanten DoublePrecision-Rechenleistung (deutlich) punkten. Erstaunlich ist dabei, wie AMD dieses geringe SP/DP-Verhältnis in die nun auch nicht gerade übermäßig große Chipfläche des Hawaii-Chips integrieren konnte – immerhin ist der Hawaii-Chip von den drei konkurrierenden Angebote die flächenmäßig klar kleinste Lösung.