eprintid: 29643 rev_number: 24 eprint_status: archive userid: 5787 dir: disk0/00/02/96/43 datestamp: 2021-04-29 15:24:12 lastmod: 2021-05-06 10:21:24 status_changed: 2021-04-29 15:24:12 type: conferenceObject metadata_visibility: show creators_name: Hahn, Ulrich creators_name: von Suchodoletz, Dirk creators_name: Quandt, Markus creators_name: Gloglowski, Kolja creators_name: Seifert, Mark corp_creators: Universität Tübingen corp_creators: Universität Freiburg title: bwSFS - Storage for Science: Stand und Entwicklungen eines verteilten FDM-Systems subjects: ddc-000 subjects: ddc-004 divisions: i-704000 pres_type: poster abstract: Das Speichersystem bwSFS (Storage-for-Science) bildet die georedundant verteilte technische Plattform für Basis-Speicherdienste, Forschungsdatenmanagement und das Teilen von Daten sowohl während laufender Forschungen als auch durch Datenveröffentlichung nach Projektabschluss. Die zentralen Speicherkomponenten befinden sich an den Standorten Tübingen und Freiburg, zusätzlich kommen Cache-Systeme an den Universitäten Konstanz und Stuttgart zum Einsatz. bwSFS stellt insgesamt knapp 20 Petabyte nutzbare Speicherkapazität in Form von Netzwerkdateisystemen (NFS/SMB) und Objektspeicher (S3) auf Basis von NetApp-Komponenten bereit. Das System verfügt über eine solide Hardwarebasis mit moderner Überwachung und verschiedenen, teilweise über die Standortgrenzen hinweg reichenden Redundanzen. bwSFS ist einerseits ein zentraler Baustein für das Data Intensive Computing der BinAC- und NEMO-Communities und stellt andererseits darüberhinaus Kapazitäten und Dienste für die Forschenden der beteiligten Universitäten sowie dem Science Data Center BioDATEN und der NFDI DataPLANT bereit. Um die vorgesehene breite Nutzerbasis des Systems vernünftig verwalten zu können und eine nahtlose Integration in die BaWü-Datenföderation zu erreichen, ist ein föderiertes Management der Projekt-, User- und Gruppendaten notwendig. Hierbei wird auf etablierte Strukturen aus dem HPC-Umfeld aufgesetzt, wo ein Teil der Nutzerbasis beheimatet ist. Schon in der Implementierungsphase der Software und Dienste, die die Fachwissenschaften einbezieht, zeichnet sich ab, dass die vorhandenen Methoden zum Identitäsmanagement nicht genügen. Im Vergleich zu HPC-Diensten erfordern die Speicherdienste eine wesentlich tiefere Integration bestehender Infrastrukturen und ein flexibleres Nutzermanagement. Zur Unterstützung des Forschungsdatenmanagements wird innerhalb von bwSFS auf die Verwendung von InvenioRDM gesetzt, welches ein komfortables Userinterface und die OAI-PMH-Schnittstelle bereits beinhaltet. In diese Entscheidung wurden frühzeitig alle am FDM Prozess beteiligten zentralen Einrichtungen und Projekte einbezogen. In Tübingen sind das die Universitätsbibliothek und die Core-Facility eScience-Center. In Freiburg erfolgt die Koordination mit zentralen Einrichtungen und die Communities durch die Research Data Management Group. In Freiburg wird ein Gitlab für Versionierung, Kollaboration und Teilen von Daten laufender Projekte zum Einsatz kommen. Für die DOI-Vergabe in Invenio wird auf etablierte Dienste der UBs zurückgegriffen, für die persistente Identifikation von Forschenden auf ORCID. Damit werden die Resourcen für FDM gebündelt, um bessere Unterstützung für die Fachwissenschaften in der Umsetzung spezifischer FDM-Anforderungen zu verbesseren und eine besserer Beratung der Forschenden zu gewährleisten. Zur Durchsetzung der FAIR und OpenAccess Prinzipien wird auf DMPs gesetzt, die durch Vorgaben der Fachkommunities mit Richtlinien für Metadatenmanagement, Archivierung und Lizenzmodelle unterstützen. date: 2021 id_scheme: DOI id_number: 10.11588/heidok.00029643 collection: c-55 ppn_swb: 175723523X own_urn: urn:nbn:de:bsz:16-heidok-296435 language: ger bibsort: HAHNULRICHBWSFSSTORA2021 full_text_status: public place_of_pub: Heidelberg pages: 1 event_title: E-Science-Tage 2021: Share Your Research Data event_location: Heidelberg event_dates: 04.03. - 05.03.2021 citation: Hahn, Ulrich ; von Suchodoletz, Dirk ; Quandt, Markus ; Gloglowski, Kolja ; Seifert, Mark (2021) bwSFS - Storage for Science: Stand und Entwicklungen eines verteilten FDM-Systems. [Conference Item] document_url: https://archiv.ub.uni-heidelberg.de/volltextserver/29643/7/bwSFS_E-Science-Tage_2021.pdf