Prozessoren & Speicher

Zum Launch der Nehalem-Architektur

Montag, 3. November 2008
 / von Leonidas
 

Mit dem heutigen Tag geht die Nehalem-Prozessorenarchitektur von Intel (etwas vorfristig) an den Start: Der eigentliche Launch samt Verfügbarbeit bei den Händlern liegt weiterhin auf dem 17. November, aber heute fällt das NDA für die Berichterstattung zu den neuen Prozessoren, so daß in der Folge jede Menge an entsprechenden Berichten im Web zu erwarten sind. Diesen Artikeln sind natürlich die eigentlichen Tiefeninformationen zu entnehmen, unser Artikel soll Nehalem nur grob skizzieren und vor allem für einen Überblick angesichts der Informationsmasse sorgen.

DDR3-Speicher aus Intel- und AMD-Sicht

Donnerstag, 28. Juni 2007
 / von Leonidas
 

Mit dem Marktstart von Intels 3er Chipsatz-Familie sind nun seit kurzem erste Mainboard-Chipsätze von Intel mit dem Support von DDR3-Speicher im Handel zu finden, die anderen Chipsatz-Hersteller werden hier wohl über kurz oder lang nachziehen. Zudem sind inzwischen auch erste DDR3-Speicher erhältlich, wenngleich weitestgehend noch zu astronomischen Preisen – aber immerhin. Zudem geht man (durchaus zu Recht) davon aus, daß DDR3-Speicher im Laufe der nächsten Monate noch erheblich im Preis sinken wird, perspektivisch sollte DDR3-Speicher irgendwann nicht mehr als DDR2-Speicher kosten.

Gerade weil diese Preisentwicklung vorausschaubar ist, wird DDR3-Speicher vom Großteil der Presse noch recht wohlwollend behandelt – vom Marketingtrommelwirbel seitens der Hersteller ganz zu schweigen. Und zumindestens wenn sich allein nur den Speicher ansieht, spricht nichts dagegen, diesen nicht als prinzipiellen Fortschritt anzuerkennen. Leider werden hierbei oftmals die technischen Grundlagen mißachtet, auf welchen DDR3-Speicher derzeit operieren muß und welche diesen Speicher maßgeblich limitiert.

Dieser Punkt war zwar auch schon des öfteren ein Thema unserer News, soll jedoch hiermit nochmals eindeutig und umfassend behandelt werden. Dabei geht es nicht darum, DDR3-Speicher prinzipiell zu "bashen", sondern vielmehr aufzuzeigen, warum dieser Speichertyp derzeit mit Limitationen zu kämpfen hat, wann diese Limitationen aufgehoben werden und was sich daraus für Konsequenzen für den interessierten Käufer ergeben.

Anmerkungen: Alle im Artikel genannten Bandbreitenangaben wurden nach der 1024er Regel errechnet, als Maßeinheit hierfür wurde allerdings das altherkömmliche Gigabyte/Sekunde benutzt, nicht das neuere, in der Industrie jedoch nach wie vor unübliche Gibibyte/Sekunde. Die Ausnahme hiervon stellt die Kommentierung des Blockschaltbildes von Intels P35-Chipsatz dar, da Intel in diesem die für Speichergrößen unkorrekte 1000er Zählung ansetzt (um schlicht auf höhere Zahlen zu kommen).

Vorher wollen wir allerdings noch kurz klären, was DDR3-Speicher technisch überhaupt darstellt. Interessanterweise kann man hierbei die Erklärung über den Unterschied von DDR1 zu DDR2 fast 1:1 kopieren, denn DDR3 stellt nichts anderes als eine konsequente Fortsetzung des mit DDR2 eingeschlagenen Weges dar:

  • Bei DDR3 werden die Speicherzellen (ca. 90% eines Speicherchips, der Rest sind die I/O-Einheiten) nur mit einem Viertel des nominellen Taktes betrieben. Damit wird deutlich an Verlustleistung gespart, die Speicherchips sind somit auch für höhere Taktraten geeignet. Nebenbei sind DDR3-Speicherchips damit rein prinzipiell gesehen etwas günstiger herzustellen als DDR1- und DDR2-Speicherchips, da jene DDR3-Speicherzellen nicht mehr für die gleiche Taktfrequenz geeignet sein müssen.
  • Um aber die gleiche Leistung zu erhalten, werden Speicherchip-intern die Speicherzellen mit einem vierfach so breiten Interface gegenüber DDR1 (bzw. einem zweifach so breitem gegenüber DDR2) angebunden, so daß die nominelle theoretische Maximal-Bandbreite von gleichgetakteten DDR1-, DDR2- und DDR3-Speichern identisch bleibt.
  • Die Speicherchips werden mit einer geringeren Spannung betrieben, was zum einen aus dem niedrigeren Takt der reinen Speicherzellen und zum anderen aus den Fortschritten in der Speicherfertigung in den letzten Jahren resultiert. Damit wird wiederum Verlustleistung gespart, was die Speicherchips noch besser für höhere Taktraten geeignet macht.
  • Und letztlich sind die Zugriffs-Latenzen bei DDR3 (bei gleichem Takt) etwas höher als bei DDR2. Dies ermöglicht ebenfalls höhere Taktraten, welche bei den relativ niedrigen Latenzzeiten von DDR2 kaum noch zu realisieren wären. In dem Augenblick, wo DDR3 höhere Taktraten als DDR2 erreicht, werden diese relativ höhere Latenzen durch den höheren Takt natürlich wieder etwas ausgeglichen, die reine Latenzzeit wird dann im Laufe der Entwicklung wieder gleich zu DDR2.

Um das nochmals klarer zu machen: Zwischen einem (theoretischen) DDR1/800-, einem DDR2/800- und eine DDR3/800-Speicherriegel herrscht dieselbe Taktfrequenz zum Speichercontoller, nämlich 400 MHz DDR. Auch die I/O-Einheiten der Speicherchips takten jeweils mit 400 MHz, die reinen Speicherzellen der Speicherchips takten dann jedoch verschieden: Bei DDR1 in einem 1:1-Verhältnis, also 400 MHz, bei DDR2 in einem 1:2-Verhältnis, also 200 MHz und bei DDR3 in einem 1:4-Verhältnis, also nur noch 100 MHz. Das ist faktisch der ganze Trick an DDR2 & DDR3: Absenkung des Taktes der Speicherzellen.

Damit erreicht man wie gesagt Vorteile bei der Produktion und vor allem auch einen niedrigeren Stromverbrauch, was dann wiederum zur Steigerung der maximal möglichen Taktfrequenz verhilft. Faktisch hat sich seit DDR1 die Taktfrequenz der reinen Speicherzellen (von JEDEC-spezifizierten Speichern) nicht verändert: Bei DDR1 ging es offiziell bis auf DDR400 hinauf, was 200 MHz Takt in den Speicherzellen ergab. Bei DDR2 geht es offiziell bis auf DDR2/800 hinauf – wiederum 200 MHz Takt in den Speicherzellen. Und DDR3 wurde inzwischen bis DDR3/1600 spezifiziert – auch wieder nur 200 MHz Takt in den Speicherzellen ;).

Damit muß allen Darstellungen, mittels DDR3 würde irgendwas "erhöht" werden, eine klare Abfuhr erteilt werden: Vorzugsweise schreibt man an dieser Stelle die Marketingmunterlagen ab und behauptet dann, bei DDR3 würde der "Prefetch auf 8 erhöht" sein – was technisch richtig, aber inhaltlich falsch ist. Bei DDR3 ging man – wie schon bei DDR2 – den umgekehrten Weg und machte den Speicher einfacher, nicht technisch höherwertiger. Damit konnte man schlicht besser die angepeilten höheren Taktfrequenzen erreichen – was ja bei DDR2 auch eingetreten ist und sich bei DDR3 wiederholen wird.

  DDR1 DDR2 DDR3
offizielle Taktfrequenzen 100 – 200 MHz (DDR200 – DDR400) 200 – 400 MHz (DDR2/400 – DDR2/800) 400 – 800 MHz (DDR3/800 – DDR3/1600)
Taktfrequenzen Overclocker-Module bis zu 350 MHz (DDR700) (derzeit) bis zu 625 MHz (DDR2/1250) noch unbekannt
Takt-Verhältnis I/O-Einheiten zu Speicherzellen 1:1 1:2 1:4
Takt der Speicherzellen 200 MHz bei DDR400 200 MHz bei DDR2/800 200 MHz bei DDR3/1600
nominelle Speicherspannung 2.5V ± 0.2V 1.8V ± 0.1V 1.5V ± 0.075V
Bandbreite einiger Speichersorten (DualChannel) 6 GB/sec bei DDR400 8 GB/sec bei DDR2/533
10 GB/sec bei DDR2/667
12 GB/sec bei DDR2/800
16 GB/sec bei DDR2/1066
12 GB/sec bei DDR3/800
16 GB/sec bei DDR3/1066
20 GB/sec bei DDR3/1333
24 GB/sec bei DDR3/1600

Diese faktische Vereinfachung von DDR2 und DDR3 gegenüber DDR1 hat nun allerdings nichts damit zu tun, daß DDR3 nicht schlagkräftig wäre, denn: DDR3-Speicher ist – rein prinzipiell – sehr schlagkräftig. Die Technik selber ist gut, denn sie ist in der Lage, deutlich mehr Bandbreite als bei DDR2 zur Verfügung zu stellen, da DDR3 sich einfach für deutlich höhere Taktraten eignet als DDR2. Und auf diesen höheren Taktfrequenzen dürften dann auch die Latenzzeiten wieder genauso niedrig wie bei DDR2-Speicher sein.

Das (derzeitige) Problem von DDR3-Speicher liegt allerdings nicht in der Technik begründet, sondern in der Umgebung, unter welcher DDR3-Speicher derzeit zum Einsatz kommt. Aktuell ist DDR3-Speicher nur für Intel-Prozessoren verwendbar, da der integrierte Speichercontoller der aktuellen AMD-Prozessoren diese Speicherart nicht versteht und dafür ein Update der Prozessoren selber notwendig ist (welches im zweiten Halbjahr 2008 ansteht). Bei den aktuellen Intel-Prozessoren wird der Speicher allerdings nicht direkt an die CPU angebunden, sondern "nur" indirekt über den Mainboard-Chipsatz. Dieser kommuniziert über seinen Speichercontroller mit dem verbauten Speicher – und dann über den Front Side Bus mit der CPU selber.

Und hier liegt dann die ganze Crux: Der Speichercontoller im Mainboard-Chipsatz kann noch so technisch hochwertig und der verbaute Speicher noch so hoch getaktet sein – was davon bei der CPU ankommt, bestimmt die Klasse des Front Side Bus und nicht der Speichercontroller oder der Speicher selber. Prinzipiell kann man sich Front Side Bus (zwischen CPU und Mainboard-Chipsatz) und Speicherbus (zwischen Mainboard-Chipsatz und Speicher) als zwei Glieder einer Kette vorstellen: Und in dieser Kette limitiert natürlich immer das schwächste Glied.

(Verkürztes) Blockschaltbild von Intels P35-Chipsatz
(Verkürztes) Blockschaltbild von Intels P35-Chipsatz: Die FSB1333-CPU gibt Intel mit 10,6 GB/sec Bandbreite an, speicherseitig stehen aber schon 12,8 GB/sec bei DDR2-Speicher und gar 17,0 GB/sec bei DDR3-Speicher zur Verfügung (Bandbreiten seitens Intel nach der 1000er Regel errechnet, nach der korrekteren 1024er Regel sind es 10, 12 und 16 GB/sec)

Gerade nun aber mit den hohen Bandbreiten von schnell getaktetem DDR3-Speicher wird der Front Side Bus der aktuellen Intel-Prozessoren immer mehr zu diesem schwächsten Glied in der Kette. Und dies in einem so hohen Maße, daß die hohen Taktfrequenzen von DDR3-Speichern gar nicht mehr ausgenutzt werden können, dies trifft sogar auf schnell getakteten DDR2-Speicher zu. Faktisch ist zuletzt einfach die Entwicklung der Taktfrequenzen bei DDR2- und DDR3-Speicher viel schneller vonstatten gegangen als die Entwicklung der Taktfrequenzen von Intels FSB – womit letzterer inzwischen einwandfrei limitiert.

Um das an einem Beispiel zu klassifizieren: Intels aktuelle FSB1333-Prozessoren können über ihren Front Side Bus maximal 10 GB/sec an Daten empfangen, mehr ist technisch gar nicht möglich. Um dafür speicherseitig die passenden Bandbreite zur Verfügung zu stellen, reicht an den DualChannel-Speicherinterfaces der heutigen Mainboard-Chipsätze einfaches DDR2/667 aus – dieses erreicht auch eine Bandbreite von 10 GB/sec. Natürlich kann man auch auf der Speicherseite etwas mehr Bandbreite zur Verfügung stellen, da durch Latenzen im Speichercontroller des Mainboard-Chipsatzes und andere kleine Effekte hierbei immer noch ein paar Prozente Performance herauszuholen sind – sagen wir also DDR2/800.

Danach ist allerdings definitiv Feierabend, jeder höher getakteter Speicher, der keine besseren Latenzzeiten vorzuweisen hat, wird in diesem Beispiel absolut gar nichts an weiterer Performance herausholen können. Wie sollte das auch gehen – auf der Speicherseite kann noch so viel Bandbreite zur Verfügung stehen, so lange der Front Side Bus das nicht aufnehmen kann, verpufft das alles nutzlos. Genau das ist die richtige Bezeichnung: Hohe Speichertaktungen verpuffen derzeit bei Intel-Prozessoren weitestgehend nutzlos. Der Front Side Bus des Prozessors kann die Datenflut gar nicht aufnehmen, was es demzufolge auch zwecklos macht, die Datenflut durch noch besseren Speicher weiterhin zu erhöhen.

Somit läßt sich ganz einfach für jede FSB-Taktung auch eine Speichertaktung finden, welche zu dieser FSB-Taktung die theoretisch optimal benötigte Bandbreite liefert. Wie gesagt kann man gern auch noch die jeweils nächstgrößere Speichertaktung benutzen, da diese dann auch noch einmal ein paar Restpunkte an Performance bringt. Damit ergibt sich folgendes Bild für die einzelnen Intel-Prozessoren:

FSB-Taktung optimale Speichertaktung (DualChannel) nächsthöhere Speichertaktung (DualChannel)
FSB533 DDR266 DDR333
FSB800 DDR400 oder DDR2/400 DDR433/466 oder DDR2/533
FSB1066 DDR533 oder DDR2/533 DDR566/600 oder DDR2/667
FSB1333 DDR2/667 DDR2/800 oder DDR3/800
FSB1600 DDR2/800 oder DDR3/800 DDR2/1066 oder DDR3/1066

Wie man sehr gut sehen kann, gibt es selbst bei einem derzeit noch gar nicht verfügbaren FSB1600 keinerlei Notwendigkeit, DDR3-Speicher einzusetzen, da die für diesen Front Side Bus nötigen Speichertaktung schlicht auch unter DDR2 schon zur Verfügung stehen. Intel müsste den Front Side Bus der eigenen Prozessoren auf FSB2666 hochreißen, damit solcherart Prozessoren einen von DDR2-Speicher nicht mehr leistbaren Speichertakt benötigen würden (nämlich DDR3/1333).

Allerdings wird Intel in der aktuellen Core-Prozessorenarchitekur den Front Side Bus nicht auf über FSB1600 anheben. Es ist somit schon jetzt abzusehen, daß DDR3-Speicher für die aktuelle Intel-Architektur immer nutzlos sein wird. Man beachte bitte hier den kleinen, aber feinen Unterschied zwischen "nutzlos" und "sinnlos": DDR3-Speicher ist nicht sinnlos, weil er seine Aufgabe genauso gut erfüllen wird wie niedriger getakteter DDR2-Speicher. Er ist nur nicht nutzvoll, weil das durch die hohen Taktfrequenzen von DDR3-Speicher im Raum stehende Versprechen von mehr Leistung hier nicht erfüllt werden kann und wird – was wie gesagt nicht am Speicher, sondern an den Intel-Prozessoren selber liegt.

HyperThreading vs. DualCore in Spielen

Dienstag, 31. Juli 2007
 / von Leonidas & Madkiller
 

Als Intel anno 2002 HyperThreading mit dem Pentium 4 3.06 GHz HyperThreading veröffentlichte, dachte kaum jemand an eine bessere Spieleperformance durch dieses Feature und war natürlich die derzeitig laufende Entwicklung hin über Dual- und QuadCore-Prozessoren hin zu ManyCore-Prozessoren noch überhaupt nicht absehbar. Schnell wurde zudem auch klar, dass sich hinter HyperThreading mehr oder weniger "nur" eine Technologie zur besseren Ausnutzung der beim Pentium-4-Design oftmals brachliegenden Recheneinheiten verbarg, welche jedoch nur in eher speziellen Fällen wirkliche Leistungsgewinne erzielen konnte.

Spiele gehörten von Anfang an nicht zu den Lieblingen von HyperThreading, hier zeigten sich selbst nach einiger Zeit im Markt nur selten Leistungsgewinne, welche im Fall des Falles zudem ausnahmslos nicht wirklich relevante Größenordnungen erreichten. Und dennoch hat HyperThreading für die aktuell laufende Dual- und QuadCore-Offensive mehr getan als mancher denkt: Denn seinerzeit wurde zum ersten Mal auf dem Desktop-Segment das Programmieren für mehrere Prozessorkerne (ob nun physikalisch oder nur logisch vorhanden) angestoßen. Ohne diese Vorlaufzeit mittels HyperThreading hätten es die ersten DualCore-Prozessoren wohl noch schwerer gehabt, im Spielebereich irgendwelche Vorteile aufzuzeigen – und der Anfang war für DualCore-Modelle wie bekannt sowieso schon nicht besonders rosig.

Nun haben sich die Verhältnisse inzwischen stark gedreht und DualCore-Prozessoren sind inzwischen totaler Standard bei neu verkauften Rechnern und dürften inzwischen auch in der Gruppe der Computerspieler (der Gesamtmarkt mit all den verkauften Büro-Rechnern ist für die Spiele-Branche natürlich nicht maßgebend, sondern allein die verkauften bzw. im Einsatz befindlichen Home-Computer) auf einen erheblichen Anteil an der installierten Basis kommen. Demzufolge – und auch wegen des Vorlaufs mittels HyperThreading – sind DualCore-Optimierungen von aktuellen Spielen inzwischen normal geworden, selbst wenn der Leistungsgewinn nur in den eher selteneren Fällen wirklich in die Nähe der Leistungsverdopplung geht und oftmals auch nur 10 bis 20 Prozent Leistungsplus erreicht werden (was man mit einem höheren Takt der SingleCore-Modelle auch hätte erreichen können).

Vorteilhafterweise sind diese DualCore-Optimierungen in den allermeisten Fällen aber auch bei HyperThreading-Prozessoren einsetzbar. Gerade die eher einfachen Optimierungen wie das Auslagern abgetrennter Teilaufgaben (wie K.I., Sound, Physik) auf den zweiten Kern sind problemlos auch von HyperThreading-Modellen mit einer gewissen Leistungssteigerung handelbar, da diese Teilaufgaben meist deutlich weniger Performance benötigen als die auf dem ersten Kern verbleibende Hauptaufgabe und demzufolge im Fall eines HyperThreading-Modells auch auf einem nur logisch vorhandenem zweiten Kern vernünftig laufen können. Was in der Summe bedeutet: DualCore-Optimierungen sollten eigentlich auch HyperThreading-Prozessoren zu mehr Leistung verhelfen können.

So zumindestens die Theorie – wie dies praktisch aussieht, wollen wir an dieser Stelle in einem Test ausmessen. Hierzu haben wir zwei verschiedenen Prozessoren zum Test eingeladen, wobei diese beiden Prozessoren keineswegs gegeneinander antreten, sondern nur jeweils einen Vertreter der Spezies HyperThreading und einen Vertreter der Spezies DualCore repräsentieren. Im Fall von HyperThreading haben wir uns für den Pentium 4 560 mit 3.6 GHz entschieden, welcher die Tests mit aktiviertem und mit deaktiviertem HyperThreading durchlief, im Fall von DualCore war es dann der Athlon 64 X2 4600+, welcher die Tests sowohl als Dual- als auch als SingleCore durchlief. Ziel der ganzen Sache war dabei, zu erkennen, wieviel HyperTreading in DualCore-optimierten Spielen heutzutage an Gewinn bringen kann, und gleichzeitig, wie nahe der Leistungsgewinn durch HyperThreading dem Leistungsgewinn durch DualCore kommen kann.

Vorab sei an dieser Stelle den Firmen Intel und Sapphire für die unkomplizierte Stellung von Testsamples für unsere neuen Teststationen gedankt, womit auch dieser Artikel wieder ermöglicht wurde.

         

Natürlich basiert auch dieser Artikel wieder auf Messungen mit Savegames anstatt Timedemos. Dies ermöglichte uns, auch aufgrund der Kürze der Savegames, speziell nur jene Szenen herauszusuchen, welche wir auch wirklich vermessen wollten – während bei einem Timedemo meistens mehrere Szenen (und viel Leerlauf) auf einmal vermessen werden, welche aber jeweils unterschiedliche Performance-Charakteristiken aufweisen können. Ein Timedemo-Durchlauf verwischt diese unterschiedlichen Szenen und deren unterschiedliche Performance-Charakteristik aber immer zu einer einzelnen Performance-Aussage, was die Aussagekraft einer solchen Messung dann doch erheblich einschränkt.

Anstatt Messungen des eher durchschnittlichen Gameflusses mittels Timedemos stellen unsere Messungen ausgewählter kurzer Szenen über den Weg der Savegames somit eher Worstcase-Benchmarks dar: Wir messen dann, wenn die Hardware wirklich unter Stress gerät – und eben auch nur die jeweilige Stress-Szene und nicht noch jede Menge Leerlauf oder gleich eine andere Szene mit hinzu. Die von uns benutzten Savegames stellen dann verschiedene Anforderungsvarianten dar – von geringen Anforderungen bis zu extrem fordernden.

Bei allen Savegames wurden jeweils immer die ersten fünf Sekunden zur Messung benutzt, welche dabei immer mittels Fraps durchgeführt wurden. Dabei wurde jedes Savegame generell fünffach ausgeführt wie gemessen und dann der Durchschnitt dieser Messungen als Ergebnis genommen. Die für diesen Artikel zum Einsatz kommenden Savegames wurden in den entsprechenden Performance-Reports schon genauer beschrieben: Anno 1701, Command & Conquer: Tiberium Wars, Need for Speed: Carbon, Supreme Commander und Test Drive Unlimited.

Die für diesen Artikel benutzten Testsysteme wollen wir an dieser Stelle nur absolut grob nennen, da es bereits hier umfassend ausgeführt wurde. Als Prozessoren für diesen Test wurden jedoch wie gesagt ein Pentium 4 560 (3.6 GHz) und ein Athlon 64 X2 4600+ (2.4 GHz) angesetzt, als Grafikkarte kamen einheitlich eine Radeon X1900 XT (auf Catalyst 7.3, A.I. default mit Area-AF) zum Einsatz. In den Test-Spielen selber wurde immer die bestmögliche Grafikqualität und 5.1 Surround-Sound ausgewählt. Im Sinne eines CPU-limitierten Tests wurde jedoch kein Anti-Aliasing oder anisotroper Filter angesetzt und zudem die Auflösung auf 800x600 bzw. 1024x768 bei Supreme Commander beschränkt.

Intel Core 2: Allendale vs. Conroe und FSB266 vs. FSB333

Sonntag, 28. Oktober 2007
 

Intel hat mittlerweile eine ansehnlich breite Palette an Prozessoren der Core-2-Familie auf den Markt gebracht. Die wesentlichen Unterschiede, die es bei den Core-2-Prozessoren gibt, sind neben Takt und Kernanzahl auch die Größe des Level2-Cache und die Anbindung der CPU an den FrontSideBus (FSB). Mit den Merkmalen Level2-Cache und FSB-Takt stuft Intel die Prozessoren insbesondere in verschiedene Marktsegmente ein: So gibt es 1 und 2 MB Level2-Cache (Allendale-Core) sowie den FSB800 nur bei den günstigsten Angebot, 4 MB Level2-Cache (Conroe-Core) und FSB1066 bilden das Mittelfeld, während es den FSB1333 nur bei den neuesten und teuersten Prozessoren gibt.

In diesem Artikel wird es nun darum gehen, Unterschiede in der Leistungsfähigkeit bei differierenden Cache-Größen und bei differierendem FSB-Takt aufzuzeigen. Hierbei geht es natürlich allein um die Leistungsfähigkeit unter Spielen, andere Anwendungsgebiete sind für diesen Artikel nicht relevant. Daher setzt sich der Artikel mit folgenden Fragen auseinander:

  • Wie gut skaliert die Spieleleistung mit einer Vergrößerung des Level2-Caches bei gleichbleibendem CPU-Takt?
  • Wie gut skaliert die Spieleleistung mit Erhöhung des FSB-Taktes bei gleichbleibendem CPU-Takt?
  • Wie gut skaliert die Spieleleistung mit steigendem CPU-Takt?

Die Frage No.3 genießt sicherlich die geringste Priorität, da hier kaum noch Informationsbedarf herrscht: In CPU-limitierten Szenarien haben bereits vorangegangene Tests gezeigt, daß die Skalierung hier am Besten ist – im Normalfall ist sie 1:1, im Extremfall jedoch kann sie, wie wir noch sehen werden, deutlich höher ausfallen.

Die Frage No.2 wirft hingegen die erneute Frage auf, welcher Anteil der Performancesteigerung auf die Erhöhung des Speichertakts zurückzuführen ist – die Erhöhung des Speichertakts geht schließlich Hand in Hand mit Erhöhung des FSB-Takts.

    Für den Test haben wir folgende CPUs verwendet:

  • Core 2 Duo E6400; 2133 MHz; 2 MB Level2-Cache; 266 MHz FSB-Takt (FSB1066)
  • Core 2 Duo E6420; 2133 MHz; 4 MB Level2-Cache; 266 MHz FSB-Takt (FSB1066)
  • Core 2 Duo E6750; 2667 MHz; 4 MB Level2-Cache; 333 MHz FSB-Takt (FSB1333)

Der Core 2 Duo E6420 wird dabei simuliert durch einen Core 2 Duo E6750 mit einem auf 266 MHz reduzierten FSB-Takt. Ebenfalls wurde der Core 2 Duo E6400 bei den Tests auch übertaktet auf 2667 MHz getestet, der Core 2 Duo E6750 wurde zudem auch auf 2000 MHz untertaktet. Ersteres, um auch bei höheren Takten den Leistungsunterschied bei verschiedenen Cachegrößen deutlich zu machen, zweiteres, um die Auswirkungen des höheren FSB zu unterstreichen.

Die verwendete Grafikkarte ist eine ATI Radeon HD 2900 XT, in dem System sind 4 GB RAM verbaut, genauere Daten zum System sind hier zu finden. Wie immer, wenn es um CPU-basierte Tests geht, wurden die Grafikeinstellungen heruntergedreht, um einen Einfluß der Grafikkarte möglichst auszuschließen. Wir testen also in der niedrigsten Auflösung, die in dem jeweiligen Spiel möglich ist, die Details lassen wir zwar auf hoch, Kantenglättung und anisotrope Filterung sind allerdings deaktiviert. Jedes Spiel wird getestet mit vier verschiedenen Savegames, um Ausreisser zu identifizieren und somit den Wahrheitsgehalt der Ergebnisse zu erhöhen.

Vorab sei an dieser Stelle den Firmen Intel und Sapphire für die unkomplizierte Stellung von Testsamples für unsere Teststationen gedankt, womit auch dieser Artikel wieder ermöglicht wurde.

         
Inhalt abgleichen