Erste genauere Informationen zu Intels Larrabee

Dienstag, 5. August 2008
 / von Leonidas
 

Mit dem Start der Woche hat Intel erstmals genauere technische Informationen zum kommenden Grafikchip-Projekt Larrabee veröffentlicht, womit nunmehr zu erkennen ist, auf welche technische Basis Intel bei diesem Projekt setzen will. Zwar bleiben weiterhin viele Fragen unbeantwortet und ist vor allem die Schlagkraft der Larrabee-Architektur bislang kaum einzuschätzen, dies wird dann die Zukunft zeigen müssen. Heute aber wollen wir uns nur kurz anschauen, wie Intels Larrabee überhaupt prinzipiell gedacht hat.

Daß Intel sich bei diesem Grafikchip nahe an einem CPU-Design halten würde, war zwar von Anfang an klar, allerdings überrascht nunmehr trotzdem die Nähe der Designs. Generell kann man Larrabee als ManyCore-CPU (mit wohl 32 Kernen) sehen, welche "nur" virtuell als Grafikkarte arbeitet. Denn die typischen Elemente eines Grafikchips fehlen fast vollständig, Intel bildet den Grafikchip faktisch in Software ab und versucht dafür, zum einen die hohe Rechenleistung von Larrabee ins Spiel zu bringen – und zum die unbestreitbare Eignung des Designs für Raytracing-Grafik durchzusetzen.

Doch eins nach dem anderen: Technisch besteht einer der Larrabee-Kerne aus einem einfachen x86-Prozessorkern (für dessen Entwicklung der originale Pentium-Prozessor aus dem Jahr 1993 Pate stand), welcher primär mit einer mächtigen Vektoreinheit rechnet und zudem über eine geringe Anzahl an "fixed function" Einheiten verfügt, von denen eine Textureneinheit als wichtigste zu nennen wäre:

Intel Larrabee Blockschaltbild

Bis auf die "fixed function" Einheiten handelt es sich also um ein deutlich CPU-nahes Design, eventuell noch besser zutreffend wäre hier jedoch der Begriff Parallelrechner, am besten nutzbar beispielsweise für GPGPU-Aufgaben oder auch für Raytracing-Grafikberechnungen.

Damit ist in Larrabee vom ursprünglichen Pentium-Design mehr oder weniger nur noch die (kurze) Prozessor-Pipeline übrigbeblieben – und auch dieser wurden reichlich neue Tricks (64-Bit, 4fach SMT) beigebracht. Insofern kann man schwerlich davon reden, Intel würde hier originale Pentium-Kerne verbauen – das Pentium-Design war eine Ausgangsgrundlage bei der Larrabee-Entwicklung, in deren Folge das Design allerdings deutlich verändert wurde. Aber natürlich macht es sich aufmerksamkeitstechnisch besser, daß ganze schlicht als "Pentium-Kerne" zu betiteln ;).

Wie schon genannt, ist daß ganze ein stark CPU-nahes Design und hat auf den ersten Blick wenig mit einem Grafikchip zu tun. Intel geht hier einen wirklich anderen Weg als (derzeit) ATI und nVidia: Mehr oder weniger die komplette Grafik-Pipeline wird in Larrabee virtuell abgebildet – dafür auch der eher umständliche Ansatz mit den x86-Prozessorkernen. Diese verwalten die ganze Geschichte, während die Vektoreinheiten dann für die eigentliche Rechenleistung verantwortlich sind (gleich den Shader-Einheiten in regulären Grafikchips).

Nur in ausgewählten Fällen hat Intel dem Design dann "fixed function" Einheiten spendiert – also Hardware-Einheiten für eine spezielle Aufgabe, welche diese gewöhnlich rasend schnell erledigen, aber eben auch nur für diese Aufgabe nutzbar sind. So gehört zu jedem Kern eine Textureneinheit – welche jedoch mit 8 Bit Breite erstaunlich klein ausfällt. Heutzutage üblich sind durchgehend 32bittige Texturen, ob das Larrabee-Design diese ohne Peformance-Verlust verarbeiten kann, ist noch nicht klar.

Zu den anderen "fixed function" Einheiten kann derzeit mangels Informationen noch nichts gesagt werden, Intel hat hier schlicht noch nichts bekanntgegeben. Allerdings soll sich das gesamte Larrabee-Design eher weniger solcherart "fixed function" Einheiten bedienen, so daß hier nicht mehr all zu viel zu erwarten ist.

In der Summe ist das ganze dann doch wieder einer Grafik-Pipeline nicht ganz unähnlich: Der x86-Prozessor bildet die Pipeline, die Vektoreinheiten sind für die Rechenleistung zuständig und die Textureneinheiten sowie einige andere "fixed function" Einheiten erfüllen ihre Spezialaufgaben. Bei Larrabee ist dies eben halt nur mittels CPU-Innereien gebildet worden und nicht wie bei ATI und nVidia aus langjähriger Arbeit an expliziten Grafikchips hervorgegangen.

Auch bei der Bildaufteilung geht Intel seinen eigenen Weg: Wie einst bei den Kyro-Chips von PowerVR wird das darzustellende Bild in kleine Kacheln (Tiles) aufgeteilt, welche dann von den einzelnen x86-Kernen bearbeitet werden. Damit wird zum einen Speicherbandbreite gespart, zum anderen soll somit die Effizienz bei steigender Anzahl an Kernen gewahrt bleiben. Laut Intel skaliert Larrabee derzeit mit bis zu 32 Kernen nahezu linear, bei 32 bis 48 Kernen liegt die Effizienz immer noch sehr hoch und erst darüber geht diese dann spürbar zurück (bei 64 Kernen nur noch das 5,5fache der Performance von 8 Kernen).

Intel Larrabee Kern-Skalierung

Zum Larrabee-Speicherinterface läßt sich derzeit noch nicht viel sagen. Zwar wird an dieser Stelle öfters das Ringbus-Interface von Larrabee erwähnt (je nach Darstellung mit einer Bitbreite von 128 oder 1024 Bit). Allerdings handelt es sich bei diesem Ringbus "nur" um den internen Kommunikationsweg, nicht um das eigentliche Speicherinterface zur Anbindung des Grafikkartenspeichers. Nur aus diesem kann man aber schlußfolgern, was für eine Speicherbandbreite Larrabee letztlich zur Verfügung stehen wird. Gut möglich aber, daß Intel dies derzeit selber noch nicht sicher weiss und erst je nach Praxis-Erfordernis festlegen wird.

Was bleibt, ist auf jeden Fall ein sehr ungewöhnliches Design – vor allen Dingen, wenn man sich vor Augen führt, daß Intel damit ja die jahrelangen Grafikchip-Platzhirsche ATI und nVidia angreifen will (und muss). Hätten diese beiden Grafikchip-Entwickler ein solches Design gebracht, könnte man sich halbwegs sicher sein, daß diese schon wissen, was sie da tun – bei Intel muß aber immer ein wenig die Befürchtung mitschwingen, daß Larrabee nur ein erster Entwurf ist, von welchem sich Intel in erster Linie einen Neuanfang im Grafikchip-Business erhofft und keinen sofort durchschlagenden Markterfolg.

Denn bei aller Fortschrittlichkeit hat das Larrabee-Design doch einige Schwächen: So erscheint der Verzicht auf soviel wie mögliche "fixed function" Einheiten eher als sehr weiter Zugriff auf die Zukunft und für die in den Jahren 2009 bis 2011 zu lösenden Aufgaben als sehr riskant. ATI und nVidia bauen diese Einheiten nicht umsonst ein – in vielen Fällen bringt eine dedizierte Hardware-Einheit für gewisse, häufig benötigte Schritte einfach enorme Performancevorteile, welche mit einem "kann alles, aber alles nur ein bißchen" Design niemals zu erreichen sind.

Ein solch radikaler Schritt ist dann sinnvoll, wenn Intel seinen Raytracing-Ansatz bei Larrabee schon durchgedrückt hätte und diese ja zumeist nur für Rasterizer-Grafik benötigten "fixed function" Einheiten dann überflüssig werden würden. Unglücklicherweise für Intel wird Larrabee aber allerhöchstens ein erster Versuch in Richtung Raytracing sein können – man hat halt schon einmal die Hardware (wobei natürlich auch die aktuellen ATI- und nVidia-Chips mit den passenden Treibern Raytracing leisten können). Ohne aber einer standarisierten Schnittstelle für Raytracing in Direct3D11 wird Raytracing in den nächsten Jahren nicht über den Status einer technischen Spielerei hinauskommen können.

Ergo wird Larrabee weiterhin – und will Intel den Chip nicht ausschließlich aus GPGPU-Beschleuniger vermarkten – sich fast durchgehend mit gewöhnlicher Rasterizer-Grafik herumschlagen müssen, bei welcher eine höhere Zahl an "fixed function" Einheiten dann doch wieder ganz nützlich wären. Denn das Fehlen dieser zehrt natürlich an der zur Verfügung stehenden Rechenleistung – im Larrabee-Design gehen viel mehr Funktionen über die eigentlichen Rechenwerke als bei den Designs von ATI und nVidia und senken somit die effektive Leistungsfähigkeit.

Diese ist zudem mit 2 TFlops bei angenommen 32 Kernen nicht wahnwitzig hoch, zumindest nicht für einen Grafikchip des zweiten Halbjahres 2009. ATIs DualChip-Lösung Radeon HD 4870 X2 übertrifft diese Zahl schon jetzt, bei den SingleChip-Grafikkarten dieses Zeitraums dürften 2 TFlops wohl normal sein. Natürlich ist derzeit noch nicht klar, für welchen Preisbereich Intel Larrabee plant, womit hierbei noch nicht das letzte Wort gesprochen ist. Der große Überflieger, welcher ATI und nVidia klar im Regen stehen läßt, ist jedoch schon jetzt eher unwahrscheinlich.

Nicht unbeachtet werden soll der Punkt, daß Intel mit Larrabee mindestens zweigleisig fährt, weil Larrabee für Intel auch Anteile im rasch wachsenden GPGPU-Geschäft sichern soll. Für dieses erscheint das Larrabee-Design auf jeden Fall perfekt geeignet, die für Grafikberechnungen zu verzeichnenden Nachteile treffen dort nicht mehr zu. Im schlimmsten Fall läßt sich Larrabee somit immer noch als rasanter Parallel-Beschleuniger verwenden.

Aber wie gesagt: Wir vermuten, daß Larrabee sowieso nur den ersten Versuch seitens Intel darstellt, wieder im Grafikchip-Business Fuß zu fassen. Dafür hat Intel dann auch eine Architektur aus dem Hut gezaubert, welche man eventuell erst in fünf Jahren erwarten würde – sowohl bei der Hardware mit dem sehr CPU-nahen Ansatz als auch bei der Bevorzugung der Raytracing-Renderingtechnologie. Ob sich Larrabee damit schon zum Releasezeitpunkt 2009 wird durchsetzen können, bleibt das große Fragezeichen dieses technologisch sicherlich sehr fortschrittlichen Designs.