Seti@home, die über das Internet koordinierte Suche nach außerirdischem Leben, Filmtauschbörsen und die Berechnung des künftigen Klimas, vor allem für solche und ähnliche Vorhaben hat man bislang Grids eingesetzt. So wie es in der IT mittlerweile üblich ist: Neue Technologien werden zuerst im Internet und in Wissenschaftseinrichtungen ausprobiert. Und reif ist eine Technologie unverkennbar dann, wenn sie in den Unternehmen Einzug hält. Bei den Grids ist es jetzt eindeutig soweit. Seit ein paar Wochen sind die ersten kommerziellen Standardprodukte auf dem Markt. Oracles neue Datenbank und Flexframe von Fujitsu-Siemens. Das deutsch-japanische Joint-venture hat die allgegenwärtige Betriebswirtschafts-Software der Walldorfer SAP auf ein Grid gepackt, einen sich selbst organisierenden Rechner-Verbund, der aus so genannten Serverblades besteht - kleinen, preiswerten Einschub-Computern. Theoretisch ist die SAP-Implementierung von Fujitsu-Siemens kein Grid, praktisch aber schon, wie der Technik-Chef des Konzerns, Dr. Joseph Reger, erläutert:
Flexframe ist eine Grid-Implementierung in einer Box. Normalerweise ist ein Grid nach wissenschaftlicher Definition die Vernetzung nicht zusammengehöriger Domänen. Unser Flexframe dagegen ist in einem einzigen Serverschrank umgesetzt, setzt aber dennoch das Konzept des Gridcomputings um. Es ist ein Rechnersystem mit vielen Kleinelementen, die zusammenarbeiten und die Aufgaben stets optimiert verteilen.
Also das Prinzip "Masse statt Klasse". Bei einem Mainframe oder einem großen Unix-Server, also den Maschinen, auf denen Unternehmensoftware üblicher Weise läuft, ist man ja schnell mit ein paar Millionen US-Dollar dabei. Und dafür kann man sich schon etliche Serverblades zum Stückpreis von vielleicht zwei, drei tausend Dollar kaufen. Damit daraus aber ein koordiniert arbeitender Rechnerverbund wird, ist noch ein Stück Software nötig, das die Arbeit einzelnen Blades zuweist, abgestürzte ersetzt und, wenn besonders viel zu tun ist, zusätzliche Blades hochfährt - eben die Grid-Software. Das Anwendungsprogramm greift dann nicht mehr direkt auf die Hardware zu, sondern statt dessen auf die Grid-Middleware. Die Hardware wird virtualisiert, wie die Technologen das ausdrücken. Nun wäre es ja ein Problem, mit sehr vielen Kopien des Betriebssystems zu arbeiten. Der Administrator müsste dann sehr genau Buch führen über die aufgespielten Patches und die Release-Stände. Deshalb wird im Unternehmens-Grid vorzugsweise nur eine Betriebssystem-Kopie eingesetzt, die dann über das Netz gebootet wird. Dr. Joseph Reger:
Mit einer einzigen Kopie des Betriebssystems zu arbeiten, hat aber auch weitere Vorteile. Diese eine Kopie machen wir für die Elemente des Systems nur lesbar. Dadurch schützt sich das System vor der Ausbreitung von Fehlerkonditionen oder gar Viren.
Die Möglichkeit, dass mehrere Rechner von ein- und derselben Platte booten, also Speicher-Netzwerke und Netzwerkspeicher, das ist eine der Technologien, die in die Entwicklung von Grids eingegangen ist. Die Clustertechnik eine andere. Wie ja überhaupt ein Grid eigentlich ein Sammelsurium von altbekannten und bloß weiterentwickelten Techniken ist. So war’s auch beim jüngsten Grid-Produkt, der neuen Oracle-Datenbank. Michael Voitz von Oracle:
Oracle hat vor etwa zwei Jahren mit dem so genannten Real-Application-Cluster – einer der ersten Lösungen für Hochverfügbarkeit und Skalierung innerhalb der Datenbank – angefangen. Dieses System ist jetzt auch die Grundlage für die so genannte Enterprise-Grid-Computing-Architecture, die entsprechend um Komponenten der Middleware und des Data-Storage erweitert wurden.
Und diese Datenbank betreibt die Grid-typische Virtualisierung gleich auf zwei Ebenen. Zum einen wird - wie gehabt - die Hardware virtualisiert. Und zum anderen die Daten. Das heißt, die Datenbank wird mehrfach gestartet - auf vielen Blades an den verschiedenen Standorten eines Unternehmens - und die laufenden Programme tauschen dann untereinander einzelne Tabellen aus und halten sie aktuell. So dass immer der Datensatz vor Ort ist, der gerade gebraucht wird.
Flexframe ist eine Grid-Implementierung in einer Box. Normalerweise ist ein Grid nach wissenschaftlicher Definition die Vernetzung nicht zusammengehöriger Domänen. Unser Flexframe dagegen ist in einem einzigen Serverschrank umgesetzt, setzt aber dennoch das Konzept des Gridcomputings um. Es ist ein Rechnersystem mit vielen Kleinelementen, die zusammenarbeiten und die Aufgaben stets optimiert verteilen.
Also das Prinzip "Masse statt Klasse". Bei einem Mainframe oder einem großen Unix-Server, also den Maschinen, auf denen Unternehmensoftware üblicher Weise läuft, ist man ja schnell mit ein paar Millionen US-Dollar dabei. Und dafür kann man sich schon etliche Serverblades zum Stückpreis von vielleicht zwei, drei tausend Dollar kaufen. Damit daraus aber ein koordiniert arbeitender Rechnerverbund wird, ist noch ein Stück Software nötig, das die Arbeit einzelnen Blades zuweist, abgestürzte ersetzt und, wenn besonders viel zu tun ist, zusätzliche Blades hochfährt - eben die Grid-Software. Das Anwendungsprogramm greift dann nicht mehr direkt auf die Hardware zu, sondern statt dessen auf die Grid-Middleware. Die Hardware wird virtualisiert, wie die Technologen das ausdrücken. Nun wäre es ja ein Problem, mit sehr vielen Kopien des Betriebssystems zu arbeiten. Der Administrator müsste dann sehr genau Buch führen über die aufgespielten Patches und die Release-Stände. Deshalb wird im Unternehmens-Grid vorzugsweise nur eine Betriebssystem-Kopie eingesetzt, die dann über das Netz gebootet wird. Dr. Joseph Reger:
Mit einer einzigen Kopie des Betriebssystems zu arbeiten, hat aber auch weitere Vorteile. Diese eine Kopie machen wir für die Elemente des Systems nur lesbar. Dadurch schützt sich das System vor der Ausbreitung von Fehlerkonditionen oder gar Viren.
Die Möglichkeit, dass mehrere Rechner von ein- und derselben Platte booten, also Speicher-Netzwerke und Netzwerkspeicher, das ist eine der Technologien, die in die Entwicklung von Grids eingegangen ist. Die Clustertechnik eine andere. Wie ja überhaupt ein Grid eigentlich ein Sammelsurium von altbekannten und bloß weiterentwickelten Techniken ist. So war’s auch beim jüngsten Grid-Produkt, der neuen Oracle-Datenbank. Michael Voitz von Oracle:
Oracle hat vor etwa zwei Jahren mit dem so genannten Real-Application-Cluster – einer der ersten Lösungen für Hochverfügbarkeit und Skalierung innerhalb der Datenbank – angefangen. Dieses System ist jetzt auch die Grundlage für die so genannte Enterprise-Grid-Computing-Architecture, die entsprechend um Komponenten der Middleware und des Data-Storage erweitert wurden.
Und diese Datenbank betreibt die Grid-typische Virtualisierung gleich auf zwei Ebenen. Zum einen wird - wie gehabt - die Hardware virtualisiert. Und zum anderen die Daten. Das heißt, die Datenbank wird mehrfach gestartet - auf vielen Blades an den verschiedenen Standorten eines Unternehmens - und die laufenden Programme tauschen dann untereinander einzelne Tabellen aus und halten sie aktuell. So dass immer der Datensatz vor Ort ist, der gerade gebraucht wird.