Auf dem Intel Developer Forum 2012 hat Intel nun auch offiziell viele Details zu seiner ab April 2013 zu erwartenden neuen Prozessorenarchitektur "Haswell" bekanntgegeben. Dabei ging es in den gezeigten Präsentationen noch nicht um die konkreten Modelle, sondern vielmehr erst einmal um die Prozessoren-Architektur samt Grafikchip-Architektur und deren Änderungen und Neuerungen an sich. Nachfolgend sind dabei die interessantesten Folien aus dem sehr umfangreichen seitens Intel zur Verfügung stehenden Material zur Haswell-Prozessorenarchitektur abgebildet.
Interessant an den Folie zum CPU-Teil von Haswell ist besonders der Punkt der neu hinzugekommenen vierten Integer-Einheit pro Rechenkern. Seit über zehn Jahren treten (nahezu) alle AMD- und Intel-Prozessoren mit drei Integer-Einheiten an, dies hat sich in dieser Zeit als guter Kompromiß zwischen höchstmöglicher Auslastung und zusätzlicher Chipfläche bewährt (erst AMDs Bulldozer brach wieder mit dieser Tradition und brachte nur zwei Integer-Einheiten pro Rechenkern). Nun bricht Intel mit dieser Tradition – wahrscheinlich, weil die anderen Optimierungsansätze langsam an ihr Ende gekommen sind und es jetzt nur noch mittels brachialer Gewalt in Form eben einer weiteren Recheneinheit geht.
Die weitere Recheneinheit bedeutet natürlich nicht, daß Haswell nun plötzlich ein Drittel mehr Integer-Power bietet – auch nicht unter idealen Bedingungen. In einem heutigen Prozessor können so viele Einzelpunkte limitieren, daß allein die nominelle Rechenkraft keinerlei Aussage über das letztlich herauskommende Ergebnis zuläßt. Wahrscheinlich bringt die vierte Integer-Einheit nur einen Performancezuwachs im Rahmen weniger Prozentpunkte. Dies hört sich wenig effektiv an, aber in einer heutigen CPU dürften die reinen Recheneinheiten so wenig Chipfläche belegen, daß dies durchaus ein gangbarer Weg zur Performancesteigerung sein kann.
Neben den (mehrheitlich erst in der Zukunft aktiven) neuen CPU-Befehlssatzerweiterungen AVX2 und TSX (Transactional Synchronization Extentions) bietet Haswell dann noch verschiedene kleinere Verbesserungen am Frontend, der Sprungvorhersage sowie den Cache-Latenzen und -Bandbreiten an, welche in der Summe mit der vierten Integer-Einheit zu den schon genannten >10 Prozent mehr Pro-MHz-Leistung führen sollen. Zusammen mit einem kleinem Mehrtakt gegenüber Ivy Bridge sollen Haswell-Systeme somit von der CPU-Seite her eine Mehrperformance von ca. 15 Prozent bieten.
Sandy Bridge | Ivy Bridge | Haswell | |
---|---|---|---|
Fertigung | 32nm Intel | 22nm Intel | 22nm Intel |
Chipfläche | 4C+GT2: 1160 Mill. Transistoren auf 216mm² 2C+GT2: 624 Mill. Transistoren auf 149mm² 2C+GT1: 504 Mill. Transistoren auf 131mm² |
4C+GT2: 1400 Mill. Transistoren auf 160mm² 4C+GT1: 133mm² 2C+GT2: 118mm² 2C+GT1: 94mm² |
? |
Sockel | 1155 | 1155 (kompatibel zu Sandy Bridge) |
1150 (nicht kompatibel zu Ivy Bridge) |
CPU-Teil | 2-4 Sandy-Bridge-Rechenkerne + HyperThreading, 256 kByte Level2-Cache pro Rechenkern, bis zu 8 MB Level3-Cache insgesamt, CPU-Befehlssatzerw. bis AVX1 | 2-4 Ivy-Bridge-Rechenkerne + HyperThreading, 256 kByte Level2-Cache pro Rechenkern, bis zu 8 MB Level3-Cache insgesamt, CPU-Befehlssatzerw. bis AVX1 | 2-4 Haswell-Rechenkerne + HyperThreading, CPU-Befehlssatzerw. bis AVX2 |
GPU-Teil | Intel-Grafik mit DirectX10.1-Fähigkeit, 6 oder 12 Recheneinheiten (HD Graphics 2000 & 3000) | Intel-Grafik mit DirectX11-Fähigkeit, 6 oder 16 Recheneinheiten (HD Graphics 2500 & 4000) | Intel-Grafik mit DirectX11.1-Fähigkeit, 10, 20 oder 40 Recheneinheiten samt dediziertem Speicher (nur bei GT3) |
Verbesserungen | - | kleiner Pro-MHz-Gewinn, besser wirkender TurboMode, abgesenkte TDP, offizieller Speichersupport für DDR3/1600, PCI Express 3.0 Interface, höherer Overclocking-Multiplikator, deutlich verbesserte integrierte Grafik | mittlerer Pro-MHz-Gewinn, CPU-Befehlssatzerweiterung AVX2, verbesserte Overclocking-Eigenschaften, extrem verbesserte integrierte Grafik |
Speicherinterface | DualChannel DDR, offiziell bis DDR3/1333 | DualChannel DDR, offiziell bis DDR3/1600 | DualChannel DDR, offiziell bis DDR3/1600 |
PCI Express Interface | 16 Lanes 2.0 | 16 Lanes 3.0 | 16 Lanes 3.0 |
TDPs DualCore | 35W & 65W | 35W & 55W | 35W & 65W |
TDPs QuadCore | 45W, 65W & 95W | 45W, 65W & 77W | 45W, 65W & 95W |
Chipsätze | 6er Serie | 7er Serie | 8er Serie (Codename "Lynx Point") |
Pro-MHz-Gewinn | - | +6% | > +10% |
Top-Modell | Core i7-2700K mit vier Rechenkernen + HyperThreading @ 3.5 GHz (TurboMode max. 3.9 GHz) & HD Graphics 3000 Grafiklösung @ 850 MHz (TurboMode max. 1350 MHz) (gesamte Modell-Liste) |
Core i7-3770K mit vier Rechenkernen + HyperThreading @ 3.5 GHz (TurboMode max. 3.9 GHz) & HD Graphics 4000 Grafiklösung @ 650 MHz (TurboMode max. 1150 MHz) (gesamte Modell-Liste) |
? |
gesamter Performance-Gewinn | - | +6% | +15% |
Release | Januar 2011 | April 2012 | zweites Quartal 2013 |
Der GPU-Teil von Haswell weisst dann die deutlich größeren Veränderungen auf: Zum einen wird Haswell bis zu 40 Recheneinheiten tragen (nicht mit den Shader-Einheiten von AMD & nVidia vergleichbar), nachdem Ivy Bridge auf maximal 16 hiervon kam – zum anderen wird die größte Haswell-Grafik auch noch von einem sehr breitbandig angebundenem dedizierten Speicher unterstützt werden. Hier ist der größte Fortschritt bei Haswell zu erwarten, die schnellste Haswell-Grafiklösung könnte durchaus die Performance gegenüber der schnellsten Ivy-Bridge-Grafiklösung mehr als verdoppeln und damit in den Leistungsbereich der schnellsten integrierten Grafiklösungen von AMD vorstossen.
Interessant ist, daß nun auch Intel seine Grafik-Recheneinheiten in Clustern anordnet – ähnlich den Shader-Clustern der Grafikchips von AMD und nVidia. Bei Intels Haswell bilden jeweils 20 Recheneinheiten einen solchen Cluster, womit die Haswell GT2-Grafiklösung einen Cluster trägt und die Haswell GT3-Grafiklösung dann zwei dieser Cluster. Dies nährt nebenbei die Vermutung, daß die Haswell GT1-Grafiklösung mit nur 10 Recheneinheiten nicht als extra Die gefertigt wird (da dies ja nur ein halber Cluster wäre), sondern aus der Fertigung der Haswell-Prozessoren mit GT2-Grafiklösung gewonnen wird.