Directly to content
  1. Publishing |
  2. Search |
  3. Browse |
  4. Recent items rss |
  5. Open Access |
  6. Jur. Issues |
  7. DeutschClear Cookie - decide language by browser settings

Uncovering the mechanisms and information content of CpG-resolved DNA methylation programming during hematopoietic differentiation

Krämer, Stephen Jörg

German Title: Mechanismen und Informationsgehalt der CpG-aufgelösten DNA-Methylierungsprogrammierung während der hämatopoetischen Differenzierung

[thumbnail of thesis_stephen_kraemer_for_UB.pdf]
Preview
PDF, English - main document
Download (6MB) | Terms of use

Citation of documents: Please do not cite the URL that is displayed in your browser location input, instead use the DOI, URN or the persistent URL below, as we can guarantee their long-time accessibility.

Abstract

DNA methylome remodeling is an essential molecular mechanism underlying all stages of hematopoietic differentiation. However, current datasets only cover a fraction of the genome and are often limited to specific hematopoietic cell types. A comprehensive, genome-wide atlas of the DNA methylation dynamics during hematopoietic differentiation is still missing. Preliminary evidence suggests that the single-cell landscape of the hematopoietic stem and progenitor cell (HSPC) compartment is characterized by a structured continuum of epigenetically-defined cell states. Significant advances in charting this epigenetic state manifold have recently been achieved for the chromatin accessibility and histone modification layers. However, despite its potential importance, the landscape of single-cell DNA methylome states in the HSPC compartment remains largely unexplored. This project aimed to comprehensively map the genome-wide DNA methylation dynamics during hematopoietic differentiation and leverage this atlas as a reference to analyze the single-cell DNA methylome landscape in the HSPC compartment and among mature hematopoietic cells. The functional importance and rich information content of differentially methylated regions (DMRs) are well-established. However, the DNA methylation layer inherently possesses the capability to encode information at CpG resolution. The role and extent of differentially methylated CpG (DMCpG) programming within DMR regions is largely unexplored. This project therefore aimed to evaluate the role and mechanisms of DMCpG programming during hematopoietic differentiation. Using high-coverage tagmentation-based whole-genome bisulfite sequencing data for 25 hematopoietic populations, I have compiled a genome-wide, dual-layer DMR/DMCpG atlas, which maps, annotates, and integrates DMR and DMCpG programming during hematopoietic differentiation. Loss of stemness was associated with lineage-independent gain of DNA methylation, while lineage specification was accompanied by hierarchical DNA methylation dynamics, characterized by unidirectional loss of DNA methylation. Different DMCpGs within focal DMR intervals were often distinctly programmed and thus contained heterogeneous information content. In particular, most of the DMRs were seeded and progressively expanded through subsequent programming of specific DMCpGs at different stages of differentiation. Mature hematopoietic cells exhibited systematic seed DMCpG hypomethylation in DMRs associated with alternative cell fates. This seed hypomethylation likely represents epigenetic memory of alternative fate explorations in progenitor cells. Collectively, these findings suggest a hierarchical model of DNA methylation programming, in which information is encoded through DMR programming and through DMCpG programming within DMR regions. This model represents a significant extension of the commonly accepted paradigm of regional DNA methylation programming. Using the dual-layer DMR/DMCpG atlas as a reference, single-cell methylome states for 312 HSPCs, as well as for a total of 136 mature B cells, T cells, CFU-Es, and monocytes, could be dissected with high resolution. The HSPC compartment was characterized by a structured continuum of single-cell DNA methylome states. Multiple lines of evidence suggested that differentiation starts from apex HSCs possessing a lineage-naive DNA methylome state. Exit from the apex HSC state was initiated by balanced, multi-lineage DMR seeding. This early DMR programming was strictly restricted to specific DMR seeding regions, which often comprised only one or two DMCpGs. This contrasts with the conventional paradigm that functionally relevant DMRs always contain at least several DMCpGs. Further differentiation within the HSPC compartment was accompanied by continuous, gradually more lineage-specific accumulation of hypomethylation, leading to progressive DMR expansion. The dual-layer DMR/DMCpG atlas provides an essential resource for studying the epigenetic regulation of the hematopoietic differentiation process and serves as a valuable reference for the analysis of single-cell bisulfite sequencing data. This work highlights the highly-resolved, progressive, and stable nature of DNA methylome remodeling during hematopoietic differentiation and reveals several aspects of the structure and information content of the DNA methylome layer which go beyond the currently accepted paradigms. It appears likely that the DNA methylome remodeling mechanisms active in other differentiation systems and related processes, such as tumor evolution, share the same principles of hierarchical DNA methylation programming with CpG resolution. However, in many systems, the information content of the DNA methylome may be convoluted by a combination of this programming mechanism and other programming mechanisms characterized by stochastic regional accumulation of DNA methylation alterations. The analysis strategies presented in this work provide a basis for the further development of computational methods capable of dissecting the rich but complex information content of the DNA methylome with high resolution.

Translation of abstract (German)

Epigenetische Programmierung mittels DNA-Methylierung ist ein wesentlicher molekularer Mechanismus, der allen Stadien der hämatopoetischen Differenzierung zugrunde liegt. Aktuelle Datensätze decken jedoch nur einen Bruchteil des Genoms ab und sind häufig auf bestimmte hämatopoetische Zelltypen beschränkt. Ein umfassender, genomweiter Atlas der DNA-Methylierungsdynamik während der hämatopoetischen Differenzierung fehlt. Vorläufige Erkenntnisse deuten darauf hin, dass die Einzelzelllandschaft der hämatopoetischen Stamm- und Vorläuferzellen (HSPCs) durch ein strukturiertes Kontinuum epigenetisch definierter Zellzustände gekennzeichnet ist. Bei der Kartierung dieses epigenetischen Zustandsraums mittels der Vermessung der Chromatinzugänglichkeitslandschaft und Histonmodifikationslandschaft von einzelnen HSPCs wurden kürzlich vielversprechende Fortschritte erzielt. Trotz ihrer potenziellen Bedeutung sind die Einzelzell-DNA-Methylomzustände von HSPCs dagegen noch weitgehend unerforscht. Dieses Projekt zielte darauf ab, die genomweite DNA-Methylierungsdynamik während der hämatopoetischen Differenzierung umfassend abzubilden und diesen Atlas als Referenz für die Analyse der Einzelzell-DNA-Methylomlandschaft in HSPCs und reifen hämatopoetischen Zellen zu nutzen. Die funktionelle Bedeutung und der reichhaltige Informationsgehalt von differenziell methylierten Regionen (DMRs) sind gut belegt. Allerdings besitzt DNA-Methylierung die Fähigkeit, Informationen mit CpG-Auflösung zu codieren. Das Ausmaß der Programmierung von differenziell methylierten CpGs (DMCpGs) innerhalb der DMR-Regionen ist weitgehend unerforscht. Dieses Projekt zielte daher darauf ab, die Rolle und Mechanismen der CpG-aufgelösten Programmierung während der hämatopoetischen Differenzierung systematisch zu untersuchen. Unter Verwendung von Tagmentierungs-basierten Bisulfit-Sequenzierungsdaten für 25 hämatopoetische Populationen habe ich einen genomweiten, zweischichtigen DMR/DMCpG-Atlas zusammengestellt, der die DMR- und DMCpG-Programmierung während der hämatopoetischen Differenzierung kartiert, annotiert und integriert. Verlust des Stammzellcharakters war mit einem differenzierungslinienunabhängigen Gewinn an DNA-Methylierung verbunden, während die Spezifizierung von bestimmten Differenzierungslinien jeweils mit einer hierarchischen DNA-Methylierungsdynamik einherging, die durch einen unidirektionalen Verlust von DNA-Methylierung gekennzeichnet war. Verschiedene CpGs innerhalb fokaler DMR-Intervalle wurden oft unterschiedlich programmiert und trugen daher heterogene Informationsinhalte. Insbesondere wurden die meisten DMRs zunächst in kleinen Initiierungsregionen angelegt und dann durch anschließende Programmierung spezifischer benachbarter CpGs in verschiedenen Differenzierungsstadien schrittweise erweitert. Reife hämatopoetische Zellen zeigten eine systematische Hypomethylierung in den Initiierungsregionen von DMRs, die mit alternativen Zellschicksalen verbunden sind. Die Teilhypomethylierung dieser DMRs scheint epigenetisches Gedächtnis über die Exploration alternativer Zellschicksale in Vorläuferzellen darzustellen. Zusammengenommen legen diese Ergebnisse ein hierarchisches Modell der epigenetischen Programmierung mittels DNA-Methylierung nahe, bei dem Informationen durch DMR-Programmierung und durch CpG-Programmierung innerhalb von DMR-Regionen codiert werden. Dieses Modell stellt eine bedeutende Erweiterung des allgemein akzeptierten Paradigmas eines auf regionaler Ebene programmierten DNA-Methylierungs-Layers dar. Unter Verwendung des zweischichtigen DMR/DMCpG-Atlas als Referenz konnten Einzelzell-DNA-Methylomzustände für 312 HSPCs sowie für insgesamt 136 reife B-Zellen, T-Zellen, CFU-Es und Monozyten mit hoher Auflösung untersucht werden. Die DNA-Methylierungslandschaft der HSPCs war durch ein strukturiertes Kontinuum von Einzelzell-DNA-Methylomzuständen gekennzeichnet. Mehrere Ergebnisse legten nahe, dass die Differenzierung bei Apex-HSCs beginnt, die einen differenzierungsliniennaiven DNA-Methylomzustand besitzen. Der Ausstieg aus dem Apex-HSC-Zustand wurde durch ausgewogenes Initiieren von verschiedenen DMRs eingeleitet, die mit mehreren Differenzierungslinien assoziiert waren. Diese frühe DMR-Programmierung war streng auf bestimmte DMR-Initiierungsregionen beschränkt, die oft nur ein oder zwei CpGs umfassten. Dies steht im Gegensatz zum gegenwärtig akzeptierten Paradigma, dass funktionsrelevante DMRs typischerweise drei oder mehr CpGs enthalten. Die weitere Differenzierung von HSPCs ging mit einer kontinuierlichen, allmählich stärker differenzierungslinienspezifischen Akkumulation der Hypomethylierung einher, was zu einer fortschreitenden DMR-Erweiterung führte. Der zweischichtige DMR/DMCpG-Atlas stellt eine wesentliche Ressource für die Untersuchung der epigenetischen Regulation des hämatopoetischen Differenzierungsprozesses dar und dient als wertvolle Referenz für die Analyse von Einzelzell-Bisulfit-Sequenzierungsdaten. Diese Arbeit unterstreicht die hochaufgelöste, progressive und stabile Natur des DNA-Methylom-Umbaus während der hämatopoetischen Differenzierung und deckt mehrere Aspekte der Struktur und des Informationsgehalts des DNA-Methyloms auf, die über die derzeit akzeptierten Paradigmen hinausgehen. Es scheint wahrscheinlich, dass ähnliche Mechanismen der epigenetischen Programmierung mittels DNA-Methylierung auch in anderen Differenzierungssystemen und verwandten Prozessen, wie der Tumorentwicklung, aktiv sind. In vielen Systemen könnte das DNA-Methylom programmiert werden durch eine Kombination von systematischen, CpG-aufgelösten Mechanismen und von Mechanismen, die durch eine stochastische regionale Anhäufung von DNA-Methylierungsänderungen gekennzeichnet sind. Die in dieser Arbeit vorgestellten Analysestrategien bilden eine Grundlage für die Weiterentwicklung bioinformatischer Methoden, mit denen der reichhaltige, aber komplexe Informationsgehalt des DNA-Methyloms mit hoher Auflösung analysiert werden kann.

Document type: Dissertation
Supervisor: Eils, Prof. Dr. Roland
Place of Publication: Heidelberg
Date of thesis defense: 13 September 2023
Date Deposited: 05 Dec 2023 09:53
Date: 2023
Faculties / Institutes: The Faculty of Bio Sciences > Dean's Office of the Faculty of Bio Sciences
Service facilities > German Cancer Research Center (DKFZ)
DDC-classification: 004 Data processing Computer science
500 Natural sciences and mathematics
570 Life sciences
About | FAQ | Contact | Imprint |
OA-LogoDINI certificate 2013Logo der Open-Archives-Initiative