Directly to content
  1. Publishing |
  2. Search |
  3. Browse |
  4. Recent items rss |
  5. Open Access |
  6. Jur. Issues |
  7. DeutschClear Cookie - decide language by browser settings

Platform to Assist Medical Experts in Training, Application, and Control of Machine Learning Models Using Patient Data from a Clinical Information System

Greiner, Matthias

[thumbnail of Main document of the thesis, the prototypical implementation is published on GitHub, accessible using the following link: https://github.com/magreiner/MMLP.] PDF, English (Main document of the thesis, the prototypical implementation is published on GitHub, accessible using the following link: https://github.com/magreiner/MMLP.) - main document
Download (3MB) | Terms of use

Citation of documents: Please do not cite the URL that is displayed in your browser location input, instead use the DOI, URN or the persistent URL below, as we can guarantee their long-time accessibility.

Abstract

In recent years, clinical data scientists achieved major breakthroughs advancing machine learning models for the medical domain, which have great potential assisting medical experts. Machine learning models can be leveraged to assist medical experts in tasks such as analyzing and diagnosing patient data, for example, from computed tomography scans. However, it is a challenge to translate the latest advancements in academic research fields such as computer sciences and physics into clinical practice. For this purpose, clinical data scientists and medical experts need to closely collaborate. This thesis tackles challenges of accessibility and usability of state-of-the-art machine learning models as well as designing a scalable computing architecture. Hence, conceptual ideas of possible strategies, as well as a prototype of such a machine learning platform, are presented.

A systematic literature review was conducted on the current approaches to create medical machine learning platforms, the management of machine learning models, and the version management of large data sets. Afterward, the functional and nonfunctional requirements of the new machine learning platform were elicited as part of the requirements analysis. Two streamlined workflows for clinical data scientists and medical experts were derived from the requirement analysis. The workflow for the clinical data scientists includes steps to define, train, and share machine learning methods, including pre- and postprocessing modules, and management of data sets. Medical experts are able to analyze patient data using pre-defined machine learning methods. Building on the result of these analyses, the architecture of the platform was derived. The architecture consists of a scalable infrastructure stack, a lightweight and easy-to-use web interface, as well as a backend component to provide the required functionalities. The final design decisions solve the issue of efficiently standardizing, parallelizing, and applying machine learning workflows within a scalable computing infrastructure.

The proposed platform was evaluated with 22 participants, consisting of clinical data scientists (N=12) and medical experts (N=10). Both groups were asked to rate specific workflows of the platform, as well as the platform as a whole, and to provide additional ideas and feedback. 92% of the medical experts and 90% of the clinical data scientists rated their overall impression of the platform as very good. Furthermore, medical experts and clinical data scientists strongly agreed that the platform facilitates method development and collaborations with 92% and 90%, respectively.

The conducted expert survey suggests that the here proposed platform could be used to develop, optimize, and apply machine learning methods in the medical domain and beyond, thereby easing the collaboration between medical experts and clinical data scientists.

Translation of abstract (German)

Klinische Datenwissenschaftler haben in den letzten Jahren große Durchbrüche im Bereich des medizinischen maschinellen Lernens erzielen können. Diese Durchbrüche haben großes Potential, Mediziner in ihrer Arbeit zu unterstützen. Beispielsweise können Algorithmen des maschinellen Lernens genutzt werden, um Mediziner bei der Analyse von Patientendaten zu unterstützen. Eine Beispielanwendung ist die Analyse von computertomographischen Bilddaten. Jedoch ist es eine Herausforderung, den neusten Stand der akademischen Forschung in Natur- und Computerwissenschaften in die klinische Praxis zu überführen; eine enge Zusammenarbeit zwischen Datenwissenschaftlern und Medizinern ist daher essentiell. Das Ziel dieser Arbeit ist es, die Entwicklung, Zugänglichkeit und Anwendbarkeit modernster Algorithmen des maschinellen Lernens zu verbessern. Dafür wird in dieser Arbeit eine Plattform entworfen, die Mediziner und Datenwissenschaftler im Bereich des maschinellen Lernens im klinischen Kontext unterstützt. In der Arbeit werden Anforderungen, mögliche Lösungsansätze, sowie ein Prototyp einer solchen Plattform vorgestellt.

Als Grundlage wurde eine systematische Literaturrecherche zu aktuellen Lösungsansätzen durchgeführt. Dabei werden Strategien zur Erstellung einer solchen Plattform, zur Verwaltung von Algorithmen des maschinellen Lernens, sowie für die Versionierung und Datenverwaltung von sehr großen Datensätzen untersucht. Anschließend werden im Rahmen der Anforderungsanalyse funktionale und nichtfunktionale Anforderungen an die Plattform ermittelt. Der Arbeitsablauf eines klinischen Datenwissenschaftlers umfasst das Definieren, Trainieren, und das Teilen der Algorithmen des Maschinellen Lernens. Wohingegen der Fokus des Arbeitsablaufs für Mediziner darin liegt, neue Patientendaten mithilfe der zuvor erstellen Algorithmen in der Plattform zu analysieren. Die aus den Anforderungen abgeleitete Architektur der Plattform beinhaltet eine skalierbare Infrastruktur, eine leichtgewichtige und benutzerfreundliche Web-Schnittstelle, sowie ein Backend, welches die Funktionen der Plattform umsetzt.

Die vorgeschlagene Plattform wurde mit 22 Teilnehmern evaluiert, die sich aus klinischen Datenwissenschaftlern (N=12) und medizinischen Experten (N=10) zusammensetzten. Die Teilnehmer wurden gebeten, sowohl bestimmte Prozesse innerhalb der Plattform, als auch die Plattform als Ganzes zu bewerten. Des Weiteren wurden die Teilnehmer gebeten weitere Verbesserungsvorschläge, Rückmeldungen und Anmerkungen zu geben. 92% der Mediziner und 90% der Datenwissenschaftler bewerteten ihren Gesamteindruck der Plattform als sehr gut. Darüber hinaus äußerten 92% der Mediziner und 90% der Datenwissenschaftler eine starke Zustimmung zu der Aussage, dass die Plattform die Methodenentwicklung und Zusammenarbeit erleichtert.

Die durchgeführte Evaluierung legt nahe, dass die in dieser Arbeit erstellte Plattform zur Entwicklung, Optimierung und Anwendung von Algorithmen des maschinellen Lernens im medizinischen Kontext verwendet werden und somit insbesondere die Zusammenarbeit zwischen Datenwissenschaftlern und Medizinern erleichtern könnte.

Document type: Master's thesis
Supervisor: Paech, Prof. Dr. Barbara
Place of Publication: Heidelberg
Date of thesis defense: 21 August 2019
Date Deposited: 02 Dec 2019 13:58
Date: 2019
Faculties / Institutes: The Faculty of Mathematics and Computer Science > Department of Computer Science
DDC-classification: 004 Data processing Computer science
610 Medical sciences Medicine
Additional Information: The prototypical implementation is published on GitHub: https://github.com/magreiner/MMLP
About | FAQ | Contact | Imprint |
OA-LogoDINI certificate 2013Logo der Open-Archives-Initiative