Directly to content
  1. Publishing |
  2. Search |
  3. Browse |
  4. Recent items rss |
  5. Open Access |
  6. Jur. Issues |
  7. DeutschClear Cookie - decide language by browser settings

Open Science in the Humanities: Galaxy as a Flexible and yet Reproducible Platform

Schneider, Daniela ; Leendertse, Jan

[thumbnail of Schneider_Leendertse_Poster_Galaxy_2025.pdf]
Preview
PDF, English - main document
Download (1MB) | Lizenz: Creative Commons LizenzvertragOpen Science in the Humanities: Galaxy as a Flexible and yet Reproducible Platform by Schneider, Daniela ; Leendertse, Jan underlies the terms of Creative Commons Attribution 4.0

Citation of documents: Please do not cite the URL that is displayed in your browser location input, instead use the DOI, URN or the persistent URL below, as we can guarantee their long-time accessibility.

Abstract

Open Science ist ein Prinzip, dem vom Grundsatz breit zugestimmt wird. In den Humanities sehen viele Forschende für sich jedoch keinen schnellen oder praktikablen Weg, dem zu folgen. Open Science wird mit Digitalisierung assoziiert, die in den Humanities vielerorts Abwehr auslöst. Mit dem Poster wird gezeigt, wie die Open Source Plattform Galaxy als Self-Service-Tool den Einstieg erleichtert. Für viele Fachbereiche gibt es zahlreiche Trainingsmodule und Best-Practice-Workflows, die ohne Barrieren zugänglich sind. Das Poster zeigt Beispiele von Workflows, die das auf Analyseverfahren der Humanities übertragbar machen. Zu Galaxy gibt es eine grafisch orientierte Oberfläche, die zum Experimentieren einlädt. Auf Wunsch kann das Herumspielen aufgezeichnet, im Nachgang bereinigt und als Prozedur gespeichert werden. Solche Workflows werden so zum Ausgangspunkt weiterer Verfeinerung, sind teilbar, transparent und im besten Fall reproduzierbar. Die FAIR-Prinzipien bleiben kein schwer erfüllbarer Anspruch, sondern werden beiläufig gelebtes Prinzip.

Wir stellen ein Beispiel zum Textvergleich chinesischer historischer Zeitungen vor, wo zensierte und unzensierte Zeitungsartikel mit chinesischen Zeichen gegenübergestellt werden. Der Vergleich ist visuell aufschlussreich und kann mit Standardtools wie diff ausgewertet werden. Dadurch können auch große Datenmengen schnell analysiert werden. Technisch überraschend einfach, aber mit hoher Aussagekraft hinsichtlich der Forschungsfrage, welche Inhalte in den Zeitungen zensiert wurden. Bei der Auswertung ist weiterhin spezifische Erfahrung aus den Humanities gefragt, besonders bei der kritischen Einordnung von Zwischenergebnissen und daraus folgend der experimentierenden weiteren Bearbeitung des Materials. Die Nutzung von Galaxy zeigt, wie Teile der Analyse auch in den Geisteswissenschaften teilautomatisiert werden können, so dass größere Textmengen verarbeitet werden können. So werden Ergebnisse aussagekräftiger. Gleichzeitig bleibt für die eigentliche Auswertung mehr Zeit.

Der Workflow, die einzelnen Analyseschritte und die Daten jedes Teilschritts können dabei gemäß der guten wissenschaftlichen Praxis geteilt und wiederholt werden. Obwohl die Ausgangsdaten wegen ihres proprietären Ursprungs nicht zugänglich sind, kann so der Prozess geteilt werden. Das zeigt gleichzeitig, dass Open Science selbst dort möglich ist, wo Daten aus guten Gründen nicht offen sind. Analysen werden parametrisierbar und schaffen eine neue Vergleichbarkeit von Ergebnissen. Daten und Inhalte von Plattformen, wie beispielsweise Zenodo, können in Galaxy importiert und in einem Workflow algorithmisch analysiert werden. Die Ergebnisse sind wiederum in einem frei wählbaren Repositorium (Zenodo, FreiData, etc.) als Faires Digitales Objekt (FDO), beispielsweise RO-Crate, speicherbar. FDO sind auf Export und maschinenlesbare Weiterverarbeitung ausgelegt.

Galaxy bietet Open Educational Resources (OER) — ebenso Arbeitsfeld von Open Science — im Galaxy Training Network (GTN), das bereits über 400 Tutorials enthält, die in offenen Lizenzen bereitgestellt sind. Neben den praktischen Tutorials bietet es Beispieldatensätze, E-Learning-Material, Videos, Aufzeichnungen und komplette Schulungsworkshops, die Forscher*innen weltweit lizenzfrei zum Selbststudium zur Verfügung stehen. Das Schulungsnetzwerk wird von einer globalen Community unterstützt, die neuen Nutzer*innen den Einstieg erleichtert und in kollaborative Arbeitsformen einführt. Durch diesen Ansatz haben verschiedene Wissenschaftsfelder Galaxy für sich entdeckt. Erste Analyseprojekte aus den Humanities finden sich bereits auf der Plattform.

Document type: Conference Item
Place of Publication: Heidelberg
Date Deposited: 02 Apr 2025 07:32
Date: 2025
Number of Pages: 1
Event Dates: 12.03.2025 - 14.03.2025
Event Location: Universität Heidelberg
Event Title: E-Science-Tage 2025
Faculties / Institutes: Service facilities > Computing Centre
DDC-classification: 004 Data processing Computer science
Collection: E-Science-Tage 2025
About | FAQ | Contact | Imprint |
OA-LogoDINI certificate 2013Logo der Open-Archives-Initiative