Intels Präsentation zur 2013er Haswell-Prozessorenarchitektur

Mittwoch, 12. September 2012
 / von Leonidas
 

Auf dem Intel Developer Forum 2012 hat Intel nun auch offiziell viele Details zu seiner ab April 2013 zu erwartenden neuen Prozessorenarchitektur "Haswell" bekanntgegeben. Dabei ging es in den gezeigten Präsentationen noch nicht um die konkreten Modelle, sondern vielmehr erst einmal um die Prozessoren-Architektur samt Grafikchip-Architektur und deren Änderungen und Neuerungen an sich. Nachfolgend sind dabei die interessantesten Folien aus dem sehr umfangreichen seitens Intel zur Verfügung stehenden Material zur Haswell-Prozessorenarchitektur abgebildet.

Interessant an den Folie zum CPU-Teil von Haswell ist besonders der Punkt der neu hinzugekommenen vierten Integer-Einheit pro Rechenkern. Seit über zehn Jahren treten (nahezu) alle AMD- und Intel-Prozessoren mit drei Integer-Einheiten an, dies hat sich in dieser Zeit als guter Kompromiß zwischen höchstmöglicher Auslastung und zusätzlicher Chipfläche bewährt (erst AMDs Bulldozer brach wieder mit dieser Tradition und brachte nur zwei Integer-Einheiten pro Rechenkern). Nun bricht Intel mit dieser Tradition – wahrscheinlich, weil die anderen Optimierungsansätze langsam an ihr Ende gekommen sind und es jetzt nur noch mittels brachialer Gewalt in Form eben einer weiteren Recheneinheit geht.

Die weitere Recheneinheit bedeutet natürlich nicht, daß Haswell nun plötzlich ein Drittel mehr Integer-Power bietet – auch nicht unter idealen Bedingungen. In einem heutigen Prozessor können so viele Einzelpunkte limitieren, daß allein die nominelle Rechenkraft keinerlei Aussage über das letztlich herauskommende Ergebnis zuläßt. Wahrscheinlich bringt die vierte Integer-Einheit nur einen Performancezuwachs im Rahmen weniger Prozentpunkte. Dies hört sich wenig effektiv an, aber in einer heutigen CPU dürften die reinen Recheneinheiten so wenig Chipfläche belegen, daß dies durchaus ein gangbarer Weg zur Performancesteigerung sein kann.

Neben den (mehrheitlich erst in der Zukunft aktiven) neuen CPU-Befehlssatzerweiterungen AVX2 und TSX (Transactional Synchronization Extentions) bietet Haswell dann noch verschiedene kleinere Verbesserungen am Frontend, der Sprungvorhersage sowie den Cache-Latenzen und -Bandbreiten an, welche in der Summe mit der vierten Integer-Einheit zu den schon genannten >10 Prozent mehr Pro-MHz-Leistung führen sollen. Zusammen mit einem kleinem Mehrtakt gegenüber Ivy Bridge sollen Haswell-Systeme somit von der CPU-Seite her eine Mehrperformance von ca. 15 Prozent bieten.

Sandy Bridge Ivy Bridge Haswell
Fertigung 32nm Intel 22nm Intel 22nm Intel
Chipfläche 4C+GT2: 1160 Mill. Transistoren auf 216mm²
2C+GT2: 624 Mill. Transistoren auf 149mm²
2C+GT1: 504 Mill. Transistoren auf 131mm²
4C+GT2: 1400 Mill. Transistoren auf 160mm²
4C+GT1: 133mm²
2C+GT2: 118mm²
2C+GT1: 94mm²
?
Sockel 1155 1155
(kompatibel zu Sandy Bridge)
1150
(nicht kompatibel zu Ivy Bridge)
CPU-Teil 2-4 Sandy-Bridge-Rechenkerne + HyperThreading, 256 kByte Level2-Cache pro Rechenkern, bis zu 8 MB Level3-Cache insgesamt, CPU-Befehlssatzerw. bis AVX1 2-4 Ivy-Bridge-Rechenkerne + HyperThreading, 256 kByte Level2-Cache pro Rechenkern, bis zu 8 MB Level3-Cache insgesamt, CPU-Befehlssatzerw. bis AVX1 2-4 Haswell-Rechenkerne + HyperThreading, CPU-Befehlssatzerw. bis AVX2
GPU-Teil Intel-Grafik mit DirectX10.1-Fähigkeit, 6 oder 12 Recheneinheiten (HD Graphics 2000 & 3000) Intel-Grafik mit DirectX11-Fähigkeit, 6 oder 16 Recheneinheiten (HD Graphics 2500 & 4000) Intel-Grafik mit DirectX11.1-Fähigkeit, 10, 20 oder 40 Recheneinheiten samt dediziertem Speicher (nur bei GT3)
Verbesserungen - kleiner Pro-MHz-Gewinn, besser wirkender TurboMode, abgesenkte TDP, offizieller Speichersupport für DDR3/1600, PCI Express 3.0 Interface, höherer Overclocking-Multiplikator, deutlich verbesserte integrierte Grafik mittlerer Pro-MHz-Gewinn, CPU-Befehlssatzerweiterung AVX2, verbesserte Overclocking-Eigenschaften, extrem verbesserte integrierte Grafik
Speicherinterface DualChannel DDR, offiziell bis DDR3/1333 DualChannel DDR, offiziell bis DDR3/1600 DualChannel DDR, offiziell bis DDR3/1600
PCI Express Interface 16 Lanes 2.0 16 Lanes 3.0 16 Lanes 3.0
TDPs DualCore 35W & 65W 35W & 55W 35W & 65W
TDPs QuadCore 45W, 65W & 95W 45W, 65W & 77W 45W, 65W & 95W
Chipsätze 6er Serie 7er Serie 8er Serie (Codename "Lynx Point")
Pro-MHz-Gewinn - +6% > +10%
Top-Modell Core i7-2700K mit vier Rechenkernen + HyperThreading @ 3.5 GHz (TurboMode max. 3.9 GHz) & HD Graphics 3000 Grafiklösung @ 850 MHz (TurboMode max. 1350 MHz)
(gesamte Modell-Liste)
Core i7-3770K mit vier Rechenkernen + HyperThreading @ 3.5 GHz (TurboMode max. 3.9 GHz) & HD Graphics 4000 Grafiklösung @ 650 MHz (TurboMode max. 1150 MHz)
(gesamte Modell-Liste)
?
gesamter Performance-Gewinn - +6% +15%
Release Januar 2011 April 2012 zweites Quartal 2013

Der GPU-Teil von Haswell weisst dann die deutlich größeren Veränderungen auf: Zum einen wird Haswell bis zu 40 Recheneinheiten tragen (nicht mit den Shader-Einheiten von AMD & nVidia vergleichbar), nachdem Ivy Bridge auf maximal 16 hiervon kam – zum anderen wird die größte Haswell-Grafik auch noch von einem sehr breitbandig angebundenem dedizierten Speicher unterstützt werden. Hier ist der größte Fortschritt bei Haswell zu erwarten, die schnellste Haswell-Grafiklösung könnte durchaus die Performance gegenüber der schnellsten Ivy-Bridge-Grafiklösung mehr als verdoppeln und damit in den Leistungsbereich der schnellsten integrierten Grafiklösungen von AMD vorstossen.

Interessant ist, daß nun auch Intel seine Grafik-Recheneinheiten in Clustern anordnet – ähnlich den Shader-Clustern der Grafikchips von AMD und nVidia. Bei Intels Haswell bilden jeweils 20 Recheneinheiten einen solchen Cluster, womit die Haswell GT2-Grafiklösung einen Cluster trägt und die Haswell GT3-Grafiklösung dann zwei dieser Cluster. Dies nährt nebenbei die Vermutung, daß die Haswell GT1-Grafiklösung mit nur 10 Recheneinheiten nicht als extra Die gefertigt wird (da dies ja nur ein halber Cluster wäre), sondern aus der Fertigung der Haswell-Prozessoren mit GT2-Grafiklösung gewonnen wird.

Intel Haswell-Präsentation (Slide 04)
Intel Haswell-Präsentation (Slide 04)
Intel Haswell-Präsentation (Slide 05)
Intel Haswell-Präsentation (Slide 05)
Intel Haswell-Präsentation (Slide 10)
Intel Haswell-Präsentation (Slide 10)
Intel Haswell-Präsentation (Slide 11)
Intel Haswell-Präsentation (Slide 11)
Intel Haswell-Präsentation (Slide 12)
Intel Haswell-Präsentation (Slide 12)
Intel Haswell-Präsentation (Slide 13)
Intel Haswell-Präsentation (Slide 13)
Intel Haswell-Präsentation (Slide 14)
Intel Haswell-Präsentation (Slide 14)
Intel Haswell-Präsentation (Slide 15)
Intel Haswell-Präsentation (Slide 15)
Intel Haswell-Präsentation (Slide 16)
Intel Haswell-Präsentation (Slide 16)
Intel Haswell-Präsentation (Slide 17)
Intel Haswell-Präsentation (Slide 17)
Intel Haswell-Präsentation (Slide 18)
Intel Haswell-Präsentation (Slide 18)
Intel Haswell-Präsentation (Slide 19)
Intel Haswell-Präsentation (Slide 19)
Intel Haswell-Präsentation (Slide 20)
Intel Haswell-Präsentation (Slide 20)
Intel Haswell-Präsentation (Slide 21)
Intel Haswell-Präsentation (Slide 21)
Intel Haswell-Präsentation (Slide 22)
Intel Haswell-Präsentation (Slide 22)
Intel Haswell-Präsentation (Slide 24)
Intel Haswell-Präsentation (Slide 24)
Intel Haswell-Präsentation (Slide 25)
Intel Haswell-Präsentation (Slide 25)
Intel Haswell-Präsentation (Slide 27)
Intel Haswell-Präsentation (Slide 27)
Intel Haswell-Präsentation (Slide 28)
Intel Haswell-Präsentation (Slide 28)
Intel Haswell-Präsentation (Slide 30)
Intel Haswell-Präsentation (Slide 30)