Directly to content
  1. Publishing |
  2. Search |
  3. Browse |
  4. Recent items rss |
  5. Open Access |
  6. Jur. Issues |
  7. DeutschClear Cookie - decide language by browser settings

INVESTIGATING ORIGIN AND FUNCTIONAL IMPACT OF GENOMIC STRUCTURAL VARIANTS WITH NEXT-GENERATION SEQUENCING

Tica, Jelena

[thumbnail of JelenaTica_PhDThesis_Final.pdf]
Preview
PDF, English - main document
Download (21MB) | Lizenz: Creative Commons LizenzvertragINVESTIGATING ORIGIN AND FUNCTIONAL IMPACT OF GENOMIC STRUCTURAL VARIANTS WITH NEXT-GENERATION SEQUENCING by Tica, Jelena underlies the terms of Creative Commons Attribution 3.0 Germany

Citation of documents: Please do not cite the URL that is displayed in your browser location input, instead use the DOI, URN or the persistent URL below, as we can guarantee their long-time accessibility.

Abstract

Genomic variants play an important role in phenotypic variation and have significant impact on a disease development. Due to the technology limitations, inference of genomic variants and their potential consequence on phenotype was until recently restricted. Only with the advent of next-generation sequencing (NGS) approaches, could a vast majority of genomic variants be successfully identified for the first time. In my PhD Thesis I will present my work on structural variants (SVs), their formation mechanism and their functional impact. The first part of my Thesis focuses on structural variants in non-human primates, studies of which using NGS have not been pursued prior to the research studies we carried out. In order to inspect the origin and functional impact of SV formation mechanisms, we constructed a comprehensive SV map based on the fibroblast-derived DNA from three different species: chimpanzee, orangutan and rhesus macaque. We noted striking differences in the activity of homology-related SV formation mechanisms between the great apes and rhesus macaques, with a third of the chimpanzee and orangutan SVs inferred to be formed by non-allelic homologous recombination compared with only 2% of the macaque SVs. One additional key finding was the presence of a markedly higher mobile element activity in macaques compared to the other non-human primates studies. Additionally, we could show that long L1 elements surpassed Alu activity in chimpanzee and orangutan as opposed to macaque where AluMacYa3 dominates the genomic landscape causing a burst of relatively short SVs. In addition to inserting into genome, active L1 elements possess the ability to mobilize 3’ flanking DNA to different genomic loci as transductions. By combining translocation and L1 discovery pipelines we further developed a novel computational methodology, termed TIGER, for the discovery of polymorphic L1-mediated 3’ transductions. We employed TIGER to a deeply sequenced human genome and to aforementioned non-human primates species to characterize transductions. TIGER enables studying germline L1-mediated 3’ transductions, making a relevant structural variation class amenable for population and disease studies for the first time. In the second part of my Thesis, I discuss the differences in the formation mechanisms of both germline and somatic SVs in the human genome. Our de novo mechanism classification analyses performed on four previously published SV datasets revealed that almost half of germline human SVs are due to mechanisms independent of homology, followed by homology-related DNA repair, mobile elements and variable number of tandem repeats. We also investigated the formation of somatic SVs in four medulloblastoma brain tumor patients with a germline TP53 mutation (Li- Fraumeni syndrome). In contrast to the germline SVs, our analyses of rearrangement breakpoints in medulloblastoma in the context of mutated TP53, rather support a model of massive DNA double strand breaks known as chromothripsis, followed by exclusive homology-independent repair.

Translation of abstract (German)

Genomische Varianten sind von großer Bedeutung für phänotypische Unterschiede; somit auch bei der Entwicklung von Krankheiten. Bis jetzt war die Untersuchung von Genomvarianten und ihren potentiellen Auswirkungen auf den Phänotypen von technischen Möglichkeiten beschränkt. Durch das Aufkommen der Hochdurchsatz-Sequenzierungsmethoden (NGS) kann nun erstmalig erfolgreich eine große Anzahl von Genomvarianten identifiziert werden. In meiner Doktorarbeit erläutere ich das Auftreten großer struktureller Variationen (SVs), ihrer Bildungsmechanismen und funktionelle Bedeutung. Der erste Teil meiner Dissertation bezieht sich auf SVs in Primaten. Vor der vorliegenden Arbeit wurden derartige Analysen, noch nicht verfolgt unter Verwendung von NGS. Um das Auftreten und die funktionelle Auswirkung von SVs erforschen zu können, konstruierten wir umfassende SV-Listen basierend auf der Fibroblasten-DNS dreier Spezies: Schimpanse, Orang-Utan und Rhesusaffe. Wir haben markante Unterschiede in der Aktivität von Homologie-abhängiger SVBildung zwischen Menschffen und Rhesusaffen festgestellt, wodurch ein Drittel der SVs bei Schimpanse und Orang-Utan durch nichthomologe Rekombination entstehen, im Gegensatz von nur 2% der SVs beim Rhesusaffen. Ein weiteres Schlüsselergebnis war die eindeutig höhere Aktivität von mobilen Elementen im Rhesusaffen verglichen mit den anderen untersuchten Primaten. Es konnte auch gezeigt werden, dass die Aktivität langer L1 Elemente die Alu-Aktivität im Schimpansen und Orang-Utan übertrifft, verglichen mit dem Rhesusaffen, bei welchem kurze AluMacYa3 das Genom dominieren. Zusätzlich können aktive L1 Elemente auch 3’ benachbarte DNS Sequenzen mobilizieren in andere Genomregionen durch den Prozess der Transduktion einbauen. Wir haben einen Algorithmus namens TIGER entwickelt, der die Methoden zur Detektion von sowohl L1- als auch Translokationen verbindet und mit dessen Hilfe polymorphe, L1-vermittelte 3’ Transduktionen aufdeckt. Wir haben TIGER zur Charakterisierung von Transduktionen bei Primaten und für das humane Genom verwendet. TIGER ermöglicht somit erstmals die Untersuchung L1-vermittelter 3’ Transduktionen in der Keimbahn, und damit die Erforschung dieser bedeutenden SVs innerhalb von Populationen und ihr Auftreten bei Erkrankungen. Im zweiten Teil bespreche ich die Entstehungsmechanismen von sowohl Keimbahn- als auch somatischen SV Datensätzen im humanen Genom. Unsere de novo Klassifikationsanalyse, basierend auf bereits publizierten SVs zeigt, dass fast die Hälfte der humanen Keimbahn SVs durch nichthomologe Mechanismen hervorgerufen werden. Weiterhin haben wir das Auftreten somatischer SVs in vier Medulloblastom Gehirntumorpatienten mit Keimbahn-TP53-Mutation (Li-Fraumeni Syndrom) untersucht. Im Gegensatz zur Keimbahnanalyze, unterstützen unsere Analysen von SVs beim Medulloblastom eher das Modell massiver Doppelstrangbrüche, durch einen Chromothripsis genannten Mechanismus, welche alleinig von nicht-homologie-abhängigerer DNS-Reparatur korrigiert werden.

Document type: Dissertation
Supervisor: Korbel, Dr. Jan
Date of thesis defense: 18 May 2015
Date Deposited: 12 Jun 2015 08:55
Date: 2015
Faculties / Institutes: Service facilities > European Molecular Biology Laboratory (EMBL)
DDC-classification: 500 Natural sciences and mathematics
Controlled Keywords: Genomics, Structural Variation, Retrotransposons
About | FAQ | Contact | Imprint |
OA-LogoDINI certificate 2013Logo der Open-Archives-Initiative