Direkt zum Inhalt
  1. Publizieren |
  2. Suche |
  3. Browsen |
  4. Neuzugänge rss |
  5. Open Access |
  6. Rechtsfragen |
  7. EnglishCookie löschen - von nun an wird die Spracheinstellung Ihres Browsers verwendet.

bwSFS - Storage for Science: Stand und Entwicklungen eines verteilten FDM-Systems

Hahn, Ulrich ; von Suchodoletz, Dirk ; Quandt, Markus ; Gloglowski, Kolja ; Seifert, Mark

[thumbnail of bwSFS_E-Science-Tage_2021.pdf]
Vorschau
PDF, Deutsch - Hauptdokument
Download (3MB) | Lizenz: Creative Commons LizenzvertragbwSFS - Storage for Science: Stand und Entwicklungen eines verteilten FDM-Systems von Hahn, Ulrich ; von Suchodoletz, Dirk ; Quandt, Markus ; Gloglowski, Kolja ; Seifert, Mark steht unter einer Creative Commons Namensnennung 4.0

Zitieren von Dokumenten: Bitte verwenden Sie für Zitate nicht die URL in der Adresszeile Ihres Webbrowsers, sondern entweder die angegebene DOI, URN oder die persistente URL, deren langfristige Verfügbarkeit wir garantieren. [mehr ...]

Abstract

Das Speichersystem bwSFS (Storage-for-Science) bildet die georedundant verteilte technische Plattform für Basis-Speicherdienste, Forschungsdatenmanagement und das Teilen von Daten sowohl während laufender Forschungen als auch durch Datenveröffentlichung nach Projektabschluss. Die zentralen Speicherkomponenten befinden sich an den Standorten Tübingen und Freiburg, zusätzlich kommen Cache-Systeme an den Universitäten Konstanz und Stuttgart zum Einsatz. bwSFS stellt insgesamt knapp 20 Petabyte nutzbare Speicherkapazität in Form von Netzwerkdateisystemen (NFS/SMB) und Objektspeicher (S3) auf Basis von NetApp-Komponenten bereit. Das System verfügt über eine solide Hardwarebasis mit moderner Überwachung und verschiedenen, teilweise über die Standortgrenzen hinweg reichenden Redundanzen. bwSFS ist einerseits ein zentraler Baustein für das Data Intensive Computing der BinAC- und NEMO-Communities und stellt andererseits darüberhinaus Kapazitäten und Dienste für die Forschenden der beteiligten Universitäten sowie dem Science Data Center BioDATEN und der NFDI DataPLANT bereit. Um die vorgesehene breite Nutzerbasis des Systems vernünftig verwalten zu können und eine nahtlose Integration in die BaWü-Datenföderation zu erreichen, ist ein föderiertes Management der Projekt-, User- und Gruppendaten notwendig. Hierbei wird auf etablierte Strukturen aus dem HPC-Umfeld aufgesetzt, wo ein Teil der Nutzerbasis beheimatet ist. Schon in der Implementierungsphase der Software und Dienste, die die Fachwissenschaften einbezieht, zeichnet sich ab, dass die vorhandenen Methoden zum Identitäsmanagement nicht genügen. Im Vergleich zu HPC-Diensten erfordern die Speicherdienste eine wesentlich tiefere Integration bestehender Infrastrukturen und ein flexibleres Nutzermanagement. Zur Unterstützung des Forschungsdatenmanagements wird innerhalb von bwSFS auf die Verwendung von InvenioRDM gesetzt, welches ein komfortables Userinterface und die OAI-PMH-Schnittstelle bereits beinhaltet. In diese Entscheidung wurden frühzeitig alle am FDM Prozess beteiligten zentralen Einrichtungen und Projekte einbezogen. In Tübingen sind das die Universitätsbibliothek und die Core-Facility eScience-Center. In Freiburg erfolgt die Koordination mit zentralen Einrichtungen und die Communities durch die Research Data Management Group. In Freiburg wird ein Gitlab für Versionierung, Kollaboration und Teilen von Daten laufender Projekte zum Einsatz kommen. Für die DOI-Vergabe in Invenio wird auf etablierte Dienste der UBs zurückgegriffen, für die persistente Identifikation von Forschenden auf ORCID. Damit werden die Resourcen für FDM gebündelt, um bessere Unterstützung für die Fachwissenschaften in der Umsetzung spezifischer FDM-Anforderungen zu verbesseren und eine besserer Beratung der Forschenden zu gewährleisten. Zur Durchsetzung der FAIR und OpenAccess Prinzipien wird auf DMPs gesetzt, die durch Vorgaben der Fachkommunities mit Richtlinien für Metadatenmanagement, Archivierung und Lizenzmodelle unterstützen.

Dokumententyp: Konferenzbeitrag
Ort der Veröffentlichung: Heidelberg
Erstellungsdatum: 29 Apr. 2021 15:24
Erscheinungsjahr: 2021
Seitenanzahl: 1
Veranstaltungsdatum: 04.03. - 05.03.2021
Veranstaltungsort: Heidelberg
Veranstaltungstitel: E-Science-Tage 2021: Share Your Research Data
Institute/Einrichtungen: Zentrale und Sonstige Einrichtungen > Rechenzentrum der Universität (URZ)
DDC-Sachgruppe: 000 Allgemeines, Wissenschaft, Informatik
004 Informatik
Sammlung: E-Science-Tage 2021
Leitlinien | Häufige Fragen | Kontakt | Impressum |
OA-LogoDINI-Zertifikat 2013Logo der Open-Archives-Initiative