Direkt zum Inhalt
  1. Publizieren |
  2. Suche |
  3. Browsen |
  4. Neuzugänge rss |
  5. Open Access |
  6. Rechtsfragen |
  7. EnglishCookie löschen - von nun an wird die Spracheinstellung Ihres Browsers verwendet.

A Modular and Fault-Tolerant Data Transport Framework

Steinbeck, Timm Morten

Deutsche Übersetzung des Titels: Ein Modulares und Fehler-Tolerantes Daten-Transport Framework

[thumbnail of dissertation-steinbeck.pdf]
Vorschau
PDF, Englisch
Download (3MB) | Nutzungsbedingungen

Zitieren von Dokumenten: Bitte verwenden Sie für Zitate nicht die URL in der Adresszeile Ihres Webbrowsers, sondern entweder die angegebene DOI, URN oder die persistente URL, deren langfristige Verfügbarkeit wir garantieren. [mehr ...]

Abstract

The High Level Trigger (HLT) of the future ALICE heavy-ion experiment has to reduce its input data rate of up to 25 GB/s to at most 1.25 GB/s for output before the data is written to permanent storage. To cope with these data rates a large PC cluster system is being designed to scale to several 1000 nodes, connected by a fast network. For the software that will run on these nodes a flexible data transport and distribution software framework, described in this thesis, has been developed. The framework consists of a set of separate components, that can be connected via a common interface. This allows to construct different configurations for the HLT, that are even changeable at runtime. To ensure a fault-tolerant operation of the HLT, the framework includes a basic fail-over mechanism that allows to replace whole nodes after a failure. The mechanism will be further expanded in the future, utilizing the runtime reconnection feature of the framework's component interface. To connect cluster nodes a communication class library is used that abstracts from the actual network technology and protocol used to retain flexibility in the hardware choice. It contains already two working prototype versions for the TCP protocol as well as SCI network adapters. Extensions can be added to the library without modifications to other parts of the framework. Extensive tests and measurements have been performed with the framework. Their results as well as conclusions drawn from them are also presented in this thesis. Performance tests show very promising results for the system, indicating that it can fulfill ALICE's requirements concerning the data transport.

Übersetzung des Abstracts (Deutsch)

Das High Level Trigger (HLT) System des zukünftigen Schwerionen-Experiments ALICE muss seine Eingangsdatenrate von bis zu 25 GB/s zur Ausgabe auf höchstens 1.25 GB/s reduzieren bevor die Daten gespeichert werden. Zur Handhabung dieser Datenraten ist ein großer PC Cluster geplant, der bis zu mehreren tausend Knoten skalieren soll, die über ein schnelles Netzwerk verbunden sind. Für die Software, die auf diesem System eingesetzt werden soll, wurde ein flexibles Software-Gerüst zum Transport der Daten entwickelt, das in dieser Arbeit beschrieben wird. Es besteht aus einer Reihe separater Komponenten, die über eine gemeinsame Schnittstelle verbunden werden können. Auf diese Weise können verschiedene Konfigurationen für das System einfach erstellt werden, die sogar zur Laufzeit geändert werden können. Um ein fehlertolerantes Arbeiten des HLT Systems zu gewährleisten, enthält die Software einen einfachen Reparatur-Mechanismus, der es erlaubt ganze Knoten nach einem Fehler zu ersetzen. Dieser Mechanismus wird in Zukunft unter Ausnutzung der dynamischen Rekonfigurierbarkeit des Systems weiter ausgebaut werden. Zur Verbindung der einzelnen Knoten wird eine Kommunikationsklassenbibliothek benutzt, die von den spezifischen Netzwerkeigenschaften, wie Hardware und Protokoll, abstrahiert. Sie erlaubt es, dass eine Entscheidung für eine bestimmte Technologie erst zu einem späteren Zeitpunkt getroffen werden muss. Die Bibliothek enthält bereits funktionierende Prototypen für das TCP-Protokoll sowie SCI Netzwerkkarten. Erweiterungen können hinzugefügt werden, ohne dass andere Teile des Systems geändert werden müssen. Mit dem Software-Gerüst wurden ausführliche Tests und Messungen durchgeführt. Ihre Ergebnisse sowie aus ihnen gezogene Schlussfolgerungen werden ebenfalls in dieser Arbeit vorgestellt. Messungen zeigen für das System sehr vielversprechende Ergebnisse, die deutlich machen, dass es beim Transport von Daten eine ausreichende Leistung erreicht, um die durch ALICE gestellten Anforderungen zu erfüllen.

Dokumententyp: Dissertation
Erstgutachter: Lindenstruth, Prof. Dr. Volker
Tag der Prüfung: 12 Februar 2004
Erstellungsdatum: 07 Apr. 2004 10:23
Erscheinungsjahr: 2003
Institute/Einrichtungen: Fakultät für Physik und Astronomie > Kirchhoff-Institut für Physik
DDC-Sachgruppe: 530 Physik
Normierte Schlagwörter: Cluster <Rechnernetz>, Parallelverarbeitung, Parallelrechner, Fehlertoleranz, Schwerionenphysik, Datenerfassung, Online-Datenerfassung
Freie Schlagwörter: TriggersystemeTriggersystems
Leitlinien | Häufige Fragen | Kontakt | Impressum |
OA-LogoDINI-Zertifikat 2013Logo der Open-Archives-Initiative