German Title: Klinische Entscheidungsunterstützung für das Multiple Myelom: Computerinterpretierbare Leitlinien und die openEHR-Spezifikation
![]() |
PDF, English (Dissertation)
- main document
Download (30MB) | Terms of use |
Abstract
Clinical decision support systems provide healthcare professionals with knowledge at the point-of care to support medical decisions. Systems medicine has emerged as a discipline that integrates and analyzes data to deliver decision support for complex diseases, facing the challenge of heterogeneous clinical and omics data integration. For the disease of multiple myeloma, a gene-expression profiling report known as the GEP-R report and a case based-reasoning approach had been proposed as decision support components in a systems medicine research project.
The GEP-R report resulted from a series of analytical steps in a bioinformatics pipeline. Analysis of genomic data in bioinformatics pipelines support diagnosis and treatment decisions, yet the availability of new tools and software versions can lead to unintended side effects that affect stability and validation of results. To address this first research problem, strategies and software tools to document and archive pipelines in a reproducible way were assessed, using the GEP-R report as a test case. The formalization of guidelines from a narrative into a computer-interpretable format is known as guideline-based clinical decision support, in which knowledge is matched to patient data to provide recommendations. Within the multiple myeloma research project, the delivery of evidence-based knowledge found in clinical practice guidelines had not been explored. To address this second problem, a guideline-based application was proposed and termed as the G-CDS approach. In addition, the lack of semantic interoperability is a challenge observed in healthcare systems, which results in isolated systems unable to share and reuse data. One of the proposed solutions has been the openEHR specification, which enables the definition of health data as reusable clinical data models. It was unknown if openEHR could support an interoperable integration of three clinical decision support components proposed for multiple myeloma (GEP-R report, case-based reasoning and guideline-based application). To address this third problem, the feasibility of openEHR to represent data regarding GEP-R report results, case-based reasoning attributes and modelling of clinical guidelines was explored. Additionally, an integration combining rule-based and case-based reasoning components was investigated.
Seven tasks were defined to address these three research problems: 1. reproducibility approaches for bioinformatics pipelines, 2. knowledge synthesis, 3. knowledge modelling, 4. semi-structured knowledge representation, 5. knowledge formalization, 6. knowledge localization and 7. integration of CDS approaches. Tasks 2 – 6 follow three phases for clinical decision support development and implementation. They were mainly implemented for the design of the new G-CDS application, however knowledge synthesis and modelling were also performed for the other two components.
Following a qualitative evaluation of technical and organizational challenges for bioinformatics pipelines, snapshots and pipeline documentation were two strategies identified to improve stability, reproducibility and validation. A hybrid approach termed as the KNIME-Docker implementation, which combined the advantages of two open-source software packages, was proposed and implemented for the GEP-R pipeline to generate the GEP-R report. Afterwards, openEHR archetypes were modelled to represent 32 data points for a gene-expression profiling report, 67 data points for a guideline-based decision support application and 42 data points for a case-based reasoning algorithm. As a result, a set of 31 openEHR archetypes were defined, consisting of 13 newly authored and 10 specialized archetypes, of which 80% were shared by at least two methods and 10% by all three. This demonstrated their appropriateness as resources to enable a complementary decision support approach.
For the proposed G-CDS application, synthesized knowledge was extracted from clinical practice guidelines and formalized as computer-interpretable guideline models. Knowledge sources were the multiple myeloma guidelines published by the European Society of Medical Oncology, and a report by the Multiple Myeloma Working Group referring to the use of geriatric assessments in elderly patients to define a frailty profile and support treatment decisions. Both sources were translated into a semi- structured representation as clinical algorithms maps for decision scenarios regarding diagnosis, staging, frailty and treatment settings. Eight guideline models were authored applying the Guideline Definition Language, which is a formal language to express decision support logic as rules in a machine-readable format using openEHR archetypes. The G-CDS required 56 input data points to provide a full summary of recommendations for four decision scenarios. To validate rule logic for all guideline models, test cases were performed, resulting in 100% of execution according to expected outcomes. Lastly, features and requirements were defined to design a user interface.
To support decisions at different stages of multiple myeloma patient care, outputs provided for diagnosis, risk stratification and treatment were examined. The G-CDS application and GEP-R report support diagnosis and risk stratification, whereas the G-CDS, GEP-R report and case-based reasoning all provide relevant information to support treatment decisions. An architecture concept was described, to enable sharing of data through a data repository of openEHR archetypes. Although each component is intended to execute independently, the proposed integration facilitates to utilize output data from rule- based components as input patient attributes, in order to contribute to a case base used in a case-based reasoning algorithm.
The digitization in healthcare is bringing new opportunities for medical informatics research and innovation in clinical settings. The proposed complementary approach of clinical decision support would maintain a knowledge base for rule-based components, while using each new patient case to gradually increment the case base in a case-based reasoning component. Thus, general evidence-based knowledge as well as specific knowledge would be delivered, outweighing the disadvantages of each component. This approach resembles the way human decisions are made for complex and real-world situations, and may refine decision support outputs, accelerate the adoption of evidence-based knowledge, improve the quality of decisions and support a holistic view of diseases and patients.
Translation of abstract (German)
Klinische Systeme zur Entscheidungsunterstützung dienen dazu medizinischen Fachkräften Wissen direkt am Behandlungsort zu vermitteln, um medizinische Entscheidungen zu unterstützen. Die Systemmedizin hat sich als die Wissenschaftsmedizin etabliert, welche Daten integriert und analysiert, um Entscheidungshilfen für komplexe Krankheiten zu liefern und welche sich der Herausforderung stellt, heterogene klinische Daten sowie Omics-Daten zu integrieren. Für die Krankheit Multiples Myelom wurden in Rahmen eines systemmedizinischen Forschungsprojektes als Komponenten der Entscheidungsunterstützung ein Bericht zur Erstellung von Genexpressionsprofilen, bekannt als der GEP-R-Bericht, und ein fallbasierter Argumentationsansatz (Case Based Reasoning) vorgeschlagen.
Der GEP-R-Bericht resultierte aus einer Reihe von Analyseschritten in einer Bioinformatik-Pipeline. Die Analyse genomischer Daten in Bioinformatik-Pipelines unterstützt Diagnose- und Behandlungsentscheidungen, jedoch kann die Verfügbarkeit neuer Tools und Softwareversionen zu unbeabsichtigten Nebeneffekten führen, welche die Stabilität und V alidierung der Ergebnisse beeinträchtigen. Um dieses erste Forschungsproblem anzugehen, wurden Strategien und Softwaretools zur reproduzierbaren Dokumentation und Archivierung von Pipelines anhand des Testfalls des GEP-R- Berichts bewertet. Die Formalisierung von Richtlinien aus einem narrativem Format in ein computerinterpretierbares Format wird als richtlinienbasierte klinische Entscheidungsunterstützung bezeichnet, bei der das vorhandene Wissen mit den Patientendaten abgeglichen wird um Empfehlungen abzugeben. Im Rahmen des systemmedizinischen Forschungsprojekts zum multiplen Myelom wurde die Bereitstellung von evidenzbasiertem Wissen aus den Richtlinien für die klinische Praxis nicht untersucht. Um dieses zweite Forschungsproblem anzugehen, wurde eine richtlinienbasierte Anwendung mit Namen G-CDS-Ansatz vorgeschlagen. Eine weitere Herausforderung für die Gesundheitssysteme ist der Mangel an semantischer Interoperabilität, was dazu führt, dass isolierte Systeme nicht in der Lage sind, Daten gemeinsam zu nutzen und wiederzuverwenden. Eine der dazu vorgeschlagenen Lösungen war die openEHR-Spezifikation, welche die Definition von Gesundheitsdaten als wiederverwendbare klinische Datenmodelle ermöglicht. Es war nicht bekannt, ob openEHR bei einer interoperablen Integration der drei für das multiple Myelom vorgeschlagenen Komponenten der Entscheidungsunterstützung (GEP-R-Bericht, Case Based Reasoning und G-CDS- Ansatz) behilflich sein könnte. Um dieses dritte Forschungsproblem anzugehen, wurde die Umsetzbarkeit von openEHR hinsichtlich der Datendarstellung zu den Ergebnissen des GEP-R- Berichts, zu den Attributen des Case Based Reasoning und zur Modellierung klinischer Richtlinien erforscht. Zu guter Letzt wurde eine Integration untersucht, die richtlinienbasierte Komponenten mit Komponenten des Case Based Reasoning kombiniert.
Sieben Aufgaben wurden definiert, um diese drei Forschungsprobleme anzugehen: 1. Reproduzierbarkeitsansätze für Bioinformatik-Pipelines, 2. Wissenssynthese, 3. Wissensmodellierung, 4. halbstrukturierte Wissensrepräsentation, 5. Wissensformalisierung, 6. Wissenslokalisierung und 7. Integration der CDS-Ansätze. Die Aufgaben 2 bis 6 folgen drei Phasen für die Entwicklung und Implementierung der Unterstützung klinischer Entscheidungen. Sie wurden hauptsächlich für das Design des neuen G-CDS-Ansatzes implementiert, aber auch für die beiden anderen Komponenten wurden Wissenssynthese und -modellierung durchgeführt.
Nach einer qualitativen Bewertung der technischen und organisatorischen Herausforderungen für Bioinformatik-Pipelines wurden Snapshots und Pipeline-Dokumentation als zwei Strategien zur Verbesserung der Stabilität, Reproduzierbarkeit und Validierung identifiziert. Für die GEP-R-Pipeline wurde ein als KNIME-Docker-Implementierung bezeichneter hybrider Ansatz vorgeschlagen und implementiert, welcher die Vorteile von zwei Open-Source-Softwarepaketen kombiniert, um den GEP- R-Bericht zu erstellen. Anschließend wurden openEHR-Archetypen modelliert, um 32 Datenpunkte für einen Genexpressionsprofilbericht, 67 Datenpunkte für eine richtlinienbasierte Entscheidungsunterstützungsanwendung und 42 Datenpunkte für einen Algorithmus des Case Based Reasoning darzustellen. Ein Satz von 31 openEHR-Archetypen wurde definiert, bestehend aus 13 neu verfassten und 10 spezialisierten Archetypen, von denen 80% von mindestens zwei Methoden und 10% von allen drei Methoden geteilt wurden. Dies zeigte die Eignung der openEHR-Archetypen als Ressourcen, um einen ergänzenden Ansatz zur Entscheidungsunterstützung zu ermöglichen.
Für den vorgeschlagene G-CDS-Ansatz wurde synthetisiertes Wissen aus den Richtlinien für die klinische Praxis extrahiert und als computerinterpretierbare Richtlinienmodelle formalisiert. Wissensquellen waren die von der Europäischen Gesellschaft für Medizinische Onkologie veröffentlichten Richtlinien für das multiple Myelom und ein Bericht der Arbeitsgruppe für das multiple Myelom, in dem auf die Verwendung geriatrischer Untersuchungen bei älteren Patienten zur Definition eines Gebrechlichkeitsprofils und zur Unterstützung von Behandlungsentscheidungen verwiesen wurde. Beide Quellen wurden in eine halbstrukturierte Darstellung übersetzt, während klinische Algorithmen Karten für Entscheidungsszenarien in Bezug auf Diagnose, Krankheitsstadium, Gebrechlichkeit und Behandlungseinstellungen abbildeten. Acht Richtlinienmodelle wurden unter V erwendung der Richtliniendefinitionssprache verfasst, einer formalen Sprache, welche die Entscheidungsunterstützungslogik als Regeln in einem maschinenlesbaren Format unter Verwendung von openEHR-Archetypen ausdrückt. Der G-CDS Ansatz benötigte 56 Eingabedatenpunkte, um eine vollständige Zusammenfassung der Empfehlungen für die vier obig genannten Entscheidungsszenarien bereitzustellen. Um die Regellogik für alle Richtlinienmodelle zu validieren, wurden Testfälle durchgeführt, die zu 100% zu den erwarteten Ergebnissen führten. Zuletzt wurden Funktionen und Anforderungen definiert, um eine Benutzeroberfläche zu entwerfen. Um Entscheidungen in verschiedenen Stadien der Patientenversorgung beim multiplem Myelom zu unterstützen, wurden die gelieferten Ergebnisse der Diagnose, Risikostratifizierung und Behandlung untersucht. Der G-CDS-Ansatz und der GEP-R-Bericht unterstützen die Diagnose und Risikostratifizierung, während der G-CDS-Ansatz, der GEP-R-Bericht und das Case Based Reasoning relevante Informationen zur Unterstützung von Behandlungsentscheidungen liefern. Es wurde ein Architekturkonzept beschrieben, um die gemeinsame Datennutzung mithilfe einer aus openEHR- Archetypen bestehenden Datenbank zu ermöglichen. Obwohl jede Komponente unabhängig ausgeführt werden soll, vereinfacht die vorgeschlagene Integration die Nutzung der Ausgabedaten von richtlinienbasierten Komponenten als Eingabeattribute bei den Patienten, die auch als Patientenfälle in einem Algorithmus des Case Based Reasoning benutzt werden.
Die Digitalisierung im Gesundheitswesen eröffnet neue Möglichkeiten für die Forschung und Innovation in der medizinischen Informatik im klinischen Umfeld. Der vorgeschlagene ergänzende Ansatz der klinischen Entscheidungsunterstützung würde es ermöglichen eine Wissensgrundlage für richtlinienbasierte Komponenten beizubehalten, während jeder neue Patientenfall dazu verwendet werden könnte schrittweise die Fallzahl in einer Komponente des Case Based Reasoning zu erhöhen. Somit würden sowohl allgemeines evidenzbasiertes Wissen als auch spezifisches Wissen geliefert, welches die Nachteile jeder einzelnen Komponente übertrifft. Dieser Ansatz ähnelt der Art und Weise, wie menschliche Entscheidungen für komplexe und reale Situationen getroffen werden und könnte dazu führen die Ergebnisse der Entscheidungsunterstützung zu verfeinern, die Übernahme evidenzbasierten Wissens zu beschleunigen, die Qualität von Entscheidungen zu verbessern und eine ganzheitliche Sicht auf Krankheiten und Patienten zu unterstützen.
Document type: | Dissertation |
---|---|
Supervisor: | Knaup-Gregori, Dr. Petra |
Place of Publication: | Heidelberg |
Date of thesis defense: | 15 June 2022 |
Date Deposited: | 30 Oct 2024 11:57 |
Date: | 2024 |
Faculties / Institutes: | Medizinische Fakultät Heidelberg > Institut für Medizinische Informatik |
DDC-classification: | 600 Technology (Applied sciences) 610 Medical sciences Medicine |
Controlled Keywords: | Medizinische Informatik |