Preview |
PDF, English
- main document
Download (1MB) | Lizenz: ![]() |
Abstract
Open Science ist ein Prinzip, dem vom Grundsatz breit zugestimmt wird. In den Humanities sehen viele Forschende für sich jedoch keinen schnellen oder praktikablen Weg, dem zu folgen. Open Science wird mit Digitalisierung assoziiert, die in den Humanities vielerorts Abwehr auslöst. Mit dem Poster wird gezeigt, wie die Open Source Plattform Galaxy als Self-Service-Tool den Einstieg erleichtert. Für viele Fachbereiche gibt es zahlreiche Trainingsmodule und Best-Practice-Workflows, die ohne Barrieren zugänglich sind. Das Poster zeigt Beispiele von Workflows, die das auf Analyseverfahren der Humanities übertragbar machen. Zu Galaxy gibt es eine grafisch orientierte Oberfläche, die zum Experimentieren einlädt. Auf Wunsch kann das Herumspielen aufgezeichnet, im Nachgang bereinigt und als Prozedur gespeichert werden. Solche Workflows werden so zum Ausgangspunkt weiterer Verfeinerung, sind teilbar, transparent und im besten Fall reproduzierbar. Die FAIR-Prinzipien bleiben kein schwer erfüllbarer Anspruch, sondern werden beiläufig gelebtes Prinzip.
Wir stellen ein Beispiel zum Textvergleich chinesischer historischer Zeitungen vor, wo zensierte und unzensierte Zeitungsartikel mit chinesischen Zeichen gegenübergestellt werden. Der Vergleich ist visuell aufschlussreich und kann mit Standardtools wie diff ausgewertet werden. Dadurch können auch große Datenmengen schnell analysiert werden. Technisch überraschend einfach, aber mit hoher Aussagekraft hinsichtlich der Forschungsfrage, welche Inhalte in den Zeitungen zensiert wurden. Bei der Auswertung ist weiterhin spezifische Erfahrung aus den Humanities gefragt, besonders bei der kritischen Einordnung von Zwischenergebnissen und daraus folgend der experimentierenden weiteren Bearbeitung des Materials. Die Nutzung von Galaxy zeigt, wie Teile der Analyse auch in den Geisteswissenschaften teilautomatisiert werden können, so dass größere Textmengen verarbeitet werden können. So werden Ergebnisse aussagekräftiger. Gleichzeitig bleibt für die eigentliche Auswertung mehr Zeit.
Der Workflow, die einzelnen Analyseschritte und die Daten jedes Teilschritts können dabei gemäß der guten wissenschaftlichen Praxis geteilt und wiederholt werden. Obwohl die Ausgangsdaten wegen ihres proprietären Ursprungs nicht zugänglich sind, kann so der Prozess geteilt werden. Das zeigt gleichzeitig, dass Open Science selbst dort möglich ist, wo Daten aus guten Gründen nicht offen sind. Analysen werden parametrisierbar und schaffen eine neue Vergleichbarkeit von Ergebnissen. Daten und Inhalte von Plattformen, wie beispielsweise Zenodo, können in Galaxy importiert und in einem Workflow algorithmisch analysiert werden. Die Ergebnisse sind wiederum in einem frei wählbaren Repositorium (Zenodo, FreiData, etc.) als Faires Digitales Objekt (FDO), beispielsweise RO-Crate, speicherbar. FDO sind auf Export und maschinenlesbare Weiterverarbeitung ausgelegt.
Galaxy bietet Open Educational Resources (OER) — ebenso Arbeitsfeld von Open Science — im Galaxy Training Network (GTN), das bereits über 400 Tutorials enthält, die in offenen Lizenzen bereitgestellt sind. Neben den praktischen Tutorials bietet es Beispieldatensätze, E-Learning-Material, Videos, Aufzeichnungen und komplette Schulungsworkshops, die Forscher*innen weltweit lizenzfrei zum Selbststudium zur Verfügung stehen. Das Schulungsnetzwerk wird von einer globalen Community unterstützt, die neuen Nutzer*innen den Einstieg erleichtert und in kollaborative Arbeitsformen einführt. Durch diesen Ansatz haben verschiedene Wissenschaftsfelder Galaxy für sich entdeckt. Erste Analyseprojekte aus den Humanities finden sich bereits auf der Plattform.
Document type: | Conference Item |
---|---|
Place of Publication: | Heidelberg |
Date Deposited: | 02 Apr 2025 07:32 |
Date: | 2025 |
Number of Pages: | 1 |
Event Dates: | 12.03.2025 - 14.03.2025 |
Event Location: | Universität Heidelberg |
Event Title: | E-Science-Tage 2025 |
Faculties / Institutes: | Service facilities > Computing Centre |
DDC-classification: | 004 Data processing Computer science |
Collection: | E-Science-Tage 2025 |