Directly to content
  1. Publishing |
  2. Search |
  3. Browse |
  4. Recent items rss |
  5. Open Access |
  6. Jur. Issues |
  7. DeutschClear Cookie - decide language by browser settings

Mixed Integer Linear Programming based approaches to study telomere maintenance mechanisms

Poos, Alexandra Maria

[img] PDF, English - main document
Please note: Access restricted to Repository staff only until 20 March 2020.
Login+Download (12MB) | Terms of use

Citation of documents: Please do not cite the URL that is displayed in your browser location input, instead use the DOI, URN or the persistent URL below, as we can guarantee their long-time accessibility.

Abstract

Gene regulation is mainly controlled by a complex network of transcription factors (TFs). TFs activate or repress the expression of a gene by binding to its promoter or enhancer regions. Mutations of TFs or their binding sites are linked to several diseases including cancer. Here, I present a new approach to identify the regulatory relationships between TFs and their target genes based on Mixed Integer Linear Programming (MILP) and machine learning called ‘Mixed Integer linear Programming based Regulatory Interaction Predictor’ (MIPRIP). Compared to other approaches, MILP has the advantage of using the L1 norm for regression to avoid overestimating outliers and to implement constraints to get sparse models. MIPRIP predicts the expression of a gene of interest by a linear model with all TFs potentially binding to the gene’s promoter as covariates. MIPRIP was first enhanced with a statistical analysis pipeline to compare the regulatory processes of a particular gene between two or multiple conditions (MIPRIP-Comparison). The second enhancement of MIPRIP enables a modularity-based approach to analyze the gene regulatory network of the TFs regulating the gene of interest (MIPRIP-Network). MIPRIP was applied to study the regulation of telomere maintenance, which is crucial for cancer cells to proliferate unlimitedly. The majority of cancer cells maintain their telomeres by re-expressing the reverse transcriptase telomerase, while a minor fraction uses the alternative lengthening of telomeres (ALT) pathway. Firstly, MIPRIP was used to study the regulation of telomerase expression in Saccharomyces cerevisiae. S. cerevisiae is a well suited model system to study telomere maintenance because of its active telomerase and high structure-function homology to humans. In yeast, I uncovered novel regulators of telomerase expression, several of which affect histone levels or modifications, e.g. Sum1 and Hst1. Secondly, I performed a pan-cancer MIPRIP analysis to identify the most common regulators of the human telomerase reverse transcriptase (TERT) gene across 19 different cancer entities and also the specific TERT regulators in each cancer type. For prostate cancer, the modularity-based analysis using MIPRIP predicted a subnetwork of 20 regulators, in which PITX1, CTCF, IRF1, TFAP2D, MITF and BHLHE40 were the most important regulators of TERT expression. Four out of these six TERT regulators could be validated as novel prognostic markers with elevated protein expression levels in patient samples. Thirdly, I constructed a classifier to predict the active telomere maintenance mechanism (ALT or non-ALT) of pediatric glioblastoma (pedGBM) patients based on typical telomere features extracted from next-generation sequencing, cytological and molecular assays. After the patient classification several regulators could be identified which were differentially expressed between ALT and non-ALT pedGBM patients using the MIPRIP framework. In summary, the newly developed MIPRIP framework extends the methodological toolbox to study gene regulation. The application on telomere maintenance provided novel insights about the regulatory processes underlying (i) telomerase expression and (ii) the ALT pathway. Furthermore, I identified new prognostic markers for prostate cancer.

Translation of abstract (German)

Genregulation wird hauptsächlich von einem komplexen Netzwerk an Transkriptionsfaktoren (TFs) kontrolliert. TFs beeinflussen die Expression der Gene durch Bindung an Promotor- oder Enhancer-Regionen, positiv oder negativ. Mutationen von TFs oder ihren Bindestellen sind mit verschiedenen Tumorerkrankungen assoziiert. Um den Zusammenhang der TFs und ihrer Zielgene besser zu verstehen, habe ich einen neuen Ansatz basierend auf gemischt-ganzzahliger linearer Programmierung und Maschinenlernverfahren entwickelt, den „Mixed Integer linear Programming based Regulatory Interaction Predictor“ (MIPRIP). Dieser Ansatz hat im Vergleich zu anderen Algorithmen den Vorteil, dass eine L1 Norm für die Regression verwendet wird, um zu hoch eingeschätzte Werte (Ausreißer) zu vermeiden, und durch die Implementierung von Beschränkungen dünnbesetzte Modelle entstehen zu lassen. MIPRIP verwendet ein lineares Modell mit allen an den Promotor des Genes bindenden TFs als Kovariaten, um die Genexpression eines Genes vorherzusagen. MIPRIP wurde um eine statistische Analysepipeline erweitert, um die regulatorischen Prozesse eines Genes zwischen zwei oder mehreren Datensätzen zu vergleichen (MIPRIP-Comparison). Des Weiteren wurde MIPRIP mit einem Modularitäts-basierten Ansatz kombiniert, um ein Genregulatorisches Netzwerk von TFs zu identifizieren, welches für die Regulation eines bestimmten Genes verantwortlich ist (MIPRIP-Network). MIPRIP wurde angewandt, um die Regulation der Telomererhaltung zu untersuchen. Telomererhaltungsmechanismen sind für Tumorzellen essentiell, um sich unbegrenzt teilen zu können. Die meisten Tumorzellen verlängern ihre Telomere, indem sie die reverse Transkriptase Telomerase exprimieren, während andere Tumorzellen einen alternativen Mechanismus verwenden, „alternative lengthening of telomeres“ (ALT). Mit Hilfe von MIPRIP wurde zuerst die Regulation der Telomerase-Gene in Saccharomyces cerevisiae untersucht, da sich Hefe auf Grund ihrer aktiven Telomerase und der großen Homologie zu menschlichen Telomer-Proteinen als idealer Modellorganismus für Telomererhaltungsstudien eignet. Hierbei wurden neue Regulatoren der Telomeraseexpression identifiziert, wovon einige, wie z.B. Sum1 und Hst1, die Level oder Modifikationen der Histone beeinflussen. Weiterhin wurde MIPRIP verwendet, um die Regulatoren des menschlichen Telomerase-Reverse-Transkriptase (TERT) Genes in 19 verschiedenen Tumorentitäten zu identifizieren. Dabei lag der Fokus auf TFs, die TERT in allen Tumorentitäten regulieren, sowie auf den spezifischen TFs der einzelnen Tumorentitäten. Für Prostatakrebs-Daten wurde mit Hilfe der Modularitäts-basierten Erweiterung von MIPRIP ein Netzwerk von 20 Regulatoren vorhergesagt, wovon PITX1, CTCF, IRF1, TFAP2D, MITF und BHLHE40 die wichtigsten Regulatoren von TERT waren. Vier von diesen sechs Regulatoren konnten anhand deren Proteinexpression auf Gewebeschnitten als klinisch neue prognostische Marker validiert werden. Außerdem habe ich einen Klassifikator konstruiert, der den aktiven Telomererhaltungsmechanismus in pädiatrischen Glioblastomen (pedGBM) vorhersagt. Dafür wurden Ergebnisse für typische ALT-Merkmale aus Sequenzierdaten, sowie zytologischen und molekularen Analysen kombiniert. Damit konnten alle pedGBM Patienten in ALT-positiv und ALT-negativ unterteilt werden. Mit Hilfe von MIPRIP konnten Regulatoren identifiziert werden, die eine unterschiedliche Aktivität zwischen ALT positiven und ALT negativen Patienten zeigten. Zusammenfassend habe ich mit MIPRIP einen neuen Ansatz entwickelt, um die Regulation von Genen zu untersuchen. Die Anwendung auf Telomererhaltungsmechanismen hat zu neuen Erkenntnissen über die Regulation der Telomerase, sowie den ALT-Mechanismus geführt. Außerdem konnten neue prognostische Marker für Prostatakrebs identifiziert werden.

Item Type: Dissertation
Supervisor: Rippe, Prof. Dr. Karsten
Date of thesis defense: 17 May 2019
Date Deposited: 07 Jun 2019 09:05
Date: 2020
Faculties / Institutes: The Faculty of Bio Sciences > Dean's Office of the Faculty of Bio Sciences
Service facilities > German Cancer Research Center (DKFZ)
Subjects: 570 Life sciences
Controlled Keywords: telomere maintenance, mathematical modelling, gene regulation
Uncontrolled Keywords: gene regulatory networks
About | FAQ | Contact | Imprint |
OA-LogoDINI certificate 2013Logo der Open-Archives-Initiative