18

IPC-Gewinne zwischen den verschiedenen Intel-Architekturen

Eine in unserem Forum aufgetauchte Intel-Präsentationsfolie zeigt offizielle Intel-Angaben zu den IPC-Gewinnen zwischen den einzelnen Intel-Architekturen seit dem für den legendären Pentium M verwendeten Dothan-Kern (IPC = Instructions per clock = Instruktionen pro Takt = Pro-MHz-Leistung). Jene Angaben beziehen sich allerdings "nur" auf die "Single Thread IPC Performance", sprich sind für einen einzelnen Rechenkern gedacht (ohne HyperThreading, da eben nur ein Thread genutzt wird) – was das Bild etwas unschärfer macht, wenn man die reale Prozessoren-Performance vergleichen will, aber zum Vergleich der reinen Prozessorenkern-Leistungsfähigkeit sogar genauer ist:

Die violetten Balken geben dabei die IPC-Steigerungen pro Generation wieder, die hierfür passende Werteachse ist die linke Y-Achse des Diagramms. Die rechte X-Achse gilt dagegen als Generations-übergreifende Werteachte für die blau eingezeichnete Kurve – und sagt damit unter anderem aus, das ein Broadwell-Rechenkern inzwischen bei fast der doppelten IPC-Leistung wie ein seinerzeitiger Pentium-M-Rechenkern angelangt ist. Da die Angaben dieses Schaubilds durch reinen Sichtvergleich nicht gänzlich exakt zu erfassen sind, haben wir jene Angaben nachfolgend noch in eine Tabelle übertragen:

Technik ST-IPC-Gewinn ST-IPC vs. Dothan
Dothan Pentium M (Refresh), 2C ohne HT/TM, 90nm (2004) - 100%
Merom Core 2 Duo, 2C ohne HT/TM, 65nm (2007) +15% 115%
Penryn Core 2 Duo (Refresh), 2C ohne HT/TM, 45nm (2008) +2% 117,5%
Nehalem Core 9xx, 4C +HT +TM, 45nm (2008) +12% 131,5%
Sandy Bridge Core 2xxx, 4C +HT +TM, 32nm (2011) +10% 144,5%
Ivy Bridge Core 3xxx, 4C +HT +TM, 22nm (2012) +5% 152%
Haswell Core 4xxx, 4C +HT +TM, 22nm (2013) +10,5% 167,5%
Broadwell Core 5xxx, 4C +HT +TM, 14nm (2015) +5,5% 177%

Natürlich handelt es sich um Intel-Angaben, jene müssen also nicht gänzlich deckungsgleich zu unabhängigen Benchmarks sein. Als Dokumentation dessen, was Intel offiziell vorgibt, sind jene dennoch nützlich – wenn auch schwer vergleichbar mit der RealWorld-Performance von mehrkernigen Prozessoren, da eben allein auf die SingleThread-Performance bezogen. Gerade in den Anfangstagen der Core-Architektur gab es noch erhebliche Verbesserungen bei der MultiThreading-Ausnutzung, d.h. neue Prozessoren-Generationen verstanden viel besser mit mehreren Rechenkernen umzugehen. Hinzu kommt der Effekt von HyperThreading bei den Intel-Architekturen ab Nehalem. Demzufolge sind in der Praxis auch einige deutlich andere Performance-Ergebnisse zu sehen – gerade die seinerzeitige Nehalem-Architektur wurde mit einem viel größerem Sprung bei der (MultiThreading) Pro-MHz-Leistung ausgemessen als es Intels Zahlen wiedergeben:

Pro-MHz-Gewinn höchste Taktrate üblicher OC-Takt
Core 2   (2007, 65nm) - 2.66 GHz ~3.2 GHz
Core 2 Refresh   (2008, 45nm) +9% 3.0 GHz ~4.0 GHz
Nehalem   (2008, 45nm) +31% 3.2 GHz (+TM) ~3.8 GHz
Sandy Bridge   (2011, 32nm) +15% 3.5 GHz (+TM) ~4.5 GHz
Ivy Bridge   (2012, 22nm) +6% 3.5 GHz (+TM) ~4.5 GHz
Haswell   (2013, 22nm) +8% 3.5 GHz (+TM) ~4.3 GHz
Haswell-Refresh   (2014, 22nm) - 4.0 GHz (+TM) ~4.7 GHz
Broadwell   (2015, 14nm) vorauss. 5% 3.3 GHz (+TM) ?
Skylake   (2015, 14nm) ? 4.0 GHz (+TM) ?
Um einen fairen Vergleich mit der heutigen Situation zu gewährleisten, wo die Enthusiasten-Modelle in die "E-Architekturen" ausgegliedert sind, wurden bei der Angabe zur höchsten Taktrate bei Core 2 und Nehalem nur Prozessoren-Modelle des Mainstream-Bereichs mit Preispunkten bis maximal 500 Euro berücksichtigt. Zudem wurden überall natürlich allein auf die Werte von Vierkern-Modellen gesetzt (auch beim Pro-MHz-Gewinn, welcher für MultiThreading gedacht ist).

Unsere eigene vorstehende Tabelle gibt dagegen die Gewinne an Pro-MHz-Performance für den gesamten Prozessor unter MultiThreading und auch TurboMode wieder, zudem wurden diese Werte in Praxis-Benchmarks ermittelt. Bei den neueren Architekturen gleichen sich die Werte dann aber wieder weitgehend, hier sind die Sprünge dann auch weiteraus geringer als früher – wobei anzumerken ist, daß es Intel bei derzeit nahezu der doppelten IPC-Performance eines Pentium M immer schwieriger fallen dürfte, noch weitere IPC-Steigerungen (ohne maßlosen Silizim-Einsatz) zu erzielen. Das erreichte Niveau ist bereits sehr hoch und es ist eher unwahrscheinlich, daß die von Intel einstmals an dieser Stelle gedachte, wesentlich IPC-schwächere Pentium-4-Architektur selbst auf Taktraten von 10 GHz dieselbe Performance bieten könnte.