4

Zen-Details: Vier Integer-Einheiten und vier 128-Bit Fließkomma-Einheiten pro CPU-Kern

Aus dem neuen Blog des AMD-Insiders "Dresdenboy" aka Matthias Waldhauer, dem The New Citavia Blog, kommen Detail-Informationen zu den CPU-Rechenkernen von AMDs Zen-Architektur. Bislang liegt hierzu wenig handfestes vor – die einzigen (angeblichen) AMD-Folien zum Thema wurden von AMD auf der dafür bestimmten Veranstaltung FAD'15 nicht gezeigt und sind daher wahrscheinlich auch nur (gut) gefälscht. Das Citavia-Blog hat hingegen in einem Software-Patch Detail-Informationen über die Zen-Architektur gefunden und daraufhin ein eigenkreiertes und natürlich vorläufiges Blockschaltbild zu den Zen-Rechenkernen entworfen:

Das meiste liegt noch im unklaren oder aber wird nur CPU-Experten etwas sagen – klar ist nunmehr jedoch die grundsätzliche Einheiten-Anzahl, bei welcher AMD die Zahl "4" zu bevorzugen scheint: 4 Befehlsdekoder, 4 Integer-Einheiten (ALUs), 2 Adresseinheiten (AGUs) und 4 Fließkomma-Einheiten (FP) mit je 128 Bit Breite, welche sich aber auch auf eine Befehlsbreite von 256 Bit koppeln lassen. Die im Blockschaltbild angegebenen Cache-Größen (32 kB Level1-Cache & 512 kB Level2-Cache) sind dagegen eher nur Spekulation, welche derzeit (noch) nicht durch handfeste Hinweise gedeckt sind. Gegenüber einem Bulldozer/Steamroller-Rechenkern bedeutet dies erst einmal eine glatte Verdopplung der Ausführungseinheiten, die Fließkomma-Einheiten wurden nominell sogar vervierfacht:

Dekoder ALU AGU FP SMT
Intel Sandy & Ivy Bridge 4 3 2 2x 256 Bit
Intel Haswell & Broadwell 4 4 2 2x 256 Bit
AMD Bulldozer & Steamroller für zwei Kerne: 4 2 2 für zwei Kerne: 2x 128 Bit  (koppelbar auf 1x 256 Bit)
AMD Zen 4 4 2 4x 128 Bit  (koppelbar auf 2x 256 Bit)

Dafür nähert sich das Zen-Design stark den Prozessoren-Designs von Intel an – Zen sieht fast genauso aus wie Haswell & Broadwell (zu Skylake liegen leider immer noch keine erhellenden Tiefeninformationen zur Architektur vor, vermutlich hat Skylake aber keine bedeutsamen Veränderungen). Zen ist also dafür gedacht, möglichst viel zur selben Zeit zu tun, insbesondere die Pipeline möglichst stark auszulasten (deswegen die vielen Ausführungseinheiten). Dafür sind dann allerdings auch keine spektakulären Taktraten zu erwarten – Dresdenboy geht von 3.5 bis 4.0 GHz aus, was unter der 14/16nm-Fertigung keineswegs beeindruckend wäre. An dieser Stelle spekuliert unser Forum schon des längeren darüber, daß AMDs Zen-Designs keineswegs im ersten Versuch dieselbe Performance wie Intels neueste Prozessoren erreichen wird, sondern etwas dahinter herauskommen dürfte.

Der Clou von AMDs Zen-Prozessoren dürfte aber sowieso darin liegen, daß Intel bei den Consumer-Modellen nach wie vor die Flanke der bezahlbaren 6- und 8-Kerner offenläßt. Genau hier dürfte sich AMD mit Zen einklinken – wahrscheinlich wird es Zen-Achtkerner (und diesesmal eben echte bzw. potente Achtkerner) in demselben Preisbereich geben, wo Intel seine Vierkerner ansetzt. Damit könnte AMD problemlos kleinere Nachteile bei der Pro/MHz-Performance und den Taktraten überspielen – und die 14/16nm-Fertigung dürfte dann dabei helfen, daß die Verlustleistung trotz 8 CPU-Kernen im normalen Rahmen bleibt. Mit späteren Zen-Ausbaustufen könnte sich AMD dann näher an die Pro/MHz-Performance von Intel heranrobben – welche ihrerseits derzeit augenscheinlich schon Schwierigkeiten haben, selbige noch bedeutsam zu steigern (was es der Aufholjagd von AMD etwas einfacher macht). Für einen guten Einstieg im Consumer-Markt dürfte dies problemlos reichen. Beim Server-Markt wird man exakte Performance und Stromverbrauch abwarten müssen – hier geht es um hohe Performance mit allerdings erstklassiger Energieeffizienz, da dürfte Intel anfänglich schwer zu schlagen sein.