Directly to content
  1. Publishing |
  2. Search |
  3. Browse |
  4. Recent items rss |
  5. Open Access |
  6. Jur. Issues |
  7. DeutschClear Cookie - decide language by browser settings

Consensus approach for assessing and resolving uncertainty in genome-scale metabolic models: advancing systems-level understanding of microbial metabolism

Matveishina, Elena

[thumbnail of matveishina_phd_thesis_print.pdf]
Preview
PDF, English
Download (18MB) | Terms of use

Citation of documents: Please do not cite the URL that is displayed in your browser location input, instead use the DOI, URN or the persistent URL below, as we can guarantee their long-time accessibility.

Abstract

Genome-scale metabolic models (GEMs) are an important methodology in systems biology: they play a major role in investigating microbial metabolism and predicting responses to perturbations by representing bacterial metabolism as a whole system. GEMs can be automatically reconstructed from bacterial genomes with computational tools that employ distinct methodological approaches. My initial analyses of GEMs reconstructed by different tools for a small set of diverse gut microbial species revealed that automated reconstruction pipelines often produce GEMs with different structures and predictive behaviour, even for the same organism. Because individual models can excel at different tasks and capture distinct metabolic capabilities, I hypothesised that combining them can increase confidence in network content and improve performance. In this thesis, I present a consensus approach implemented in GEMsembler, a Python package for cross-tool model comparison and assembly of consensus models from any subset of input GEMs. Alongside the consensus strategy, GEMsembler offers broad analysis functionality, including detection and visualisation of biosynthetic pathways, growth evaluation, and an agreement-driven curation workflow. In a use-case study, consensus models curated with this workflow, combining four automatically reconstructed GEMs for Lactiplantibacillus plantarum and Escherichia coli, outperform gold-standard models on auxotrophy and gene-essentiality benchmarks. Moreover, enabled by GEMs comparison, optimising gene–protein–reaction (GPR) rule combinations derived from input and consensus models improves gene-essentiality predictions even for manually curated gold-standard models. GEMsembler also helps explain model performance by highlighting relevant metabolic pathways and, together with the consensus principle, supports the assessment of network uncertainty and informs the design of targeted experiments to resolve it. Finally, I apply the consensus approach to de novo reconstruction of two of the most abundant human gut bacteria, Bacteroides uniformis and Phocaeicola vulgatus, yielding first-iteration curated models that reproduce their growth and major metabolic phenotypes. In agreement with experimental data, the B. uniformis model secretes more lactate and malate but grows less, whereas the P. vulgatus model secretes less of these metabolites, grows more, and also secretes succinate. Together, these results show that the consensus approach facilitates building metabolic models that are more accurate, concise, and biologically informed, advancing systems-level understanding of microbial metabolism.

Translation of abstract (German)

Genome-scale metabolic models (GEMs) sind eine wichtige Methodik in der Systembiologie: sie spielen eine zentrale Rolle bei der Untersuchung des mikrobiellen Metabolismus und der Vorhersage von Reaktionen auf Störungen, indem sie den bakteriellen Stoffwechsel als ein gesamtes System darstellen. GEMs können automatisch aus bakteriellen Genomen mit rechnergestützten Werkzeugen rekonstruiert werden, die unterschiedliche methodische Ansätze verwenden. Meine ersten Analysen von GEMs, die mit verschiedenen Tools für eine kleine Auswahl unterschiedlicher Darmmikrobenarten rekonstruiert wurden, zeigten, dass automatisierte Rekonstruktionspipelines oft GEMs mit unterschiedlichen Strukturen und unterschiedlichem Vorhersageverhalten erzeugen, selbst für denselben Organismus. Da einzelne Modelle in verschiedenen Aufgabenbereichen besonders leistungsfähig sein und unterschiedliche metabolische Fähigkeiten abbilden können, stellte ich die Hypothese auf, dass ihre Kombination das Vertrauen in den Netzwerkinhalt erhöhen und die Leistungsfähigkeit verbessern kann. In dieser Arbeit präsentiere ich einen Konsensusansatz implementiert in GEMsembler, einem Python-Paket für werkzeugübergreifenden Modellvergleich und die Erstellung von Konsensusmodellen aus beliebigen Teilmengen von Eingabe-GEMs. Neben der Konsensusstrategie bietet GEMsembler umfangreiche Analysefunktionen, einschließlich der Erkennung und Visualisierung von Biosynthesewegen, Wachstumsauswertung und einem auf Übereinstimmung basierenden Kurations-Workflow. In einer Fallstudie zeigen Konsensusmodelle, die mit diesem Workflow kuratiert wurden, und vier automatisch rekonstruierte GEMs für Lactiplantibacillus plantarum und Escherichia coli kombinieren, bessere Ergebnisse als Goldstandardmodelle in Auxotrophie- und Genessenzialitäts-Benchmarks. Darüber hinaus ermöglicht der Vergleich von GEMs die Optimierung von Gen-Protein-Reaktions-(GPR)-Regelkombinationen, die aus Eingabe- und Konsensusmodellen abgeleitet werden, wodurch die Vorhersage der Genessenzialität selbst für manuell kuratierte Goldstandardmodelle verbessert wird. GEMsembler trägt zudem zum Verständnis der Modellleistung bei, indem es relevante Stoffwechselwege hervorhebt, und unterstützt zusammen mit dem Konsensusprinzip die Bewertung von Netzwerkunsicherheiten sowie die Planung gezielter Experimente zu deren Auflösung. Schließlich wende ich den Konsensusansatz auf die de novo-Rekonstruktion von zwei der häufigsten menschlichen Darmbakterien, Bacteroides uniformis und Phocaeicola vulgatus, an, was zu erstkuratierten Modellen führt, die deren Wachstum und zentrale metabolische Phänotypen reproduzieren. In Übereinstimmung mit experimentellen Daten sezerniert das B. uniformis-Modell mehr Laktat und Malat, wächst jedoch weniger, während das P. vulgatus-Modell geringere Mengen dieser Metabolite produziert, stärker wächst und zusätzlich Succinat freisetzt. Zusammen zeigen diese Ergebnisse, dass der Konsensusansatz die Erstellung metabolischer Modelle erleichtert, die präziser, kompakter und biologisch aussagekräftiger sind, und damit das systemische Verständnis des mikrobiellen Metabolismus vorantreibt.

Document type: Dissertation
Supervisor: Zimmermann-Kogadeeva, Dr. Maria
Place of Publication: Heidelberg
Date of thesis defense: 17 December 2025
Date Deposited: 14 Jan 2026 14:12
Date: 2026
Faculties / Institutes: The Faculty of Bio Sciences > Dean's Office of the Faculty of Bio Sciences
DDC-classification: 570 Life sciences
Controlled Keywords: Systembiologie, Bioinformatik, Metabolismus, Mikrobiologie
About | FAQ | Contact | Imprint |
OA-LogoDINI certificate 2013Logo der Open-Archives-Initiative