Directly to content
  1. Publishing |
  2. Search |
  3. Browse |
  4. Recent items rss |
  5. Open Access |
  6. Jur. Issues |
  7. DeutschClear Cookie - decide language by browser settings

Integrative and Comparative Analysis of Retinoblastoma and Osteosarcoma

Delhomme, Nicolas

German Title: Retinoblastom und Osteosarkom, integrativ und vergleichende Analyse

[thumbnail of Doctoral Thesis]
Preview
PDF, English (Doctoral Thesis) - main document
Download (8MB) | Terms of use

Citation of documents: Please do not cite the URL that is displayed in your browser location input, instead use the DOI, URN or the persistent URL below, as we can guarantee their long-time accessibility.

Abstract

In the last one and a half decades, the generalization of high throughput methods in molecular biology has led to the generation of vast amounts of datasets that unraveled the unfathomed complexity of the cell regulatory mechanisms. The recently published results of the ENCODE project (ENCODE Project Consortium et al., 2012) demonstrated the extend of these in the human genome and certainly more regulation mechanisms will be discovered in the future. Already, this complexity within a single cell - without taking into account cell-cell interaction or micro-environment influences - cannot be abstracted by the human mind. However, understanding it is the key to devise adapted treatments to genetic diseases or disorders, among which is cancer. In mathematics, such complex problems are addressed using methods that reduce their complexity, so that they can be modeled in a solvable manner. In biology, it led researchers to develop the concept of systems biology as a mean to abstract the complexity of the cell regulatory network. To date, most of the published studies using high throughput technologies only focus on one kind of regulatory mechanism and hence cannot be used as such to investigate the interactions between these. Moreover, distinguishing causative from confounding factors within such studies is difficult.

These were my original motivations to develop analytical and statistical methods that control for confounding factors effects and allow the integrative and comparative analysis of different kinds of datasets. In fine, three different tools were developed to achieve this goal. First, "customCDF": a tool to redefine the Custom Definition File (CDF) of Affymetrix GeneChips. It results in the increased sensitivity of downstream analyses as these bene fit from the constantly evolving human genome reference and annotations. Second, "aSim": a tool to simulate microarray data, which was required to benchmark the developed algorithms. Third, for the integrative analysis, a set of combined statistical methods and finally for the comparative analysis, a modification of the integrative analysis approach. These were bundled in the "crossChip" R package. The "customCDF" and "aSim" tools were first validated on independant datasets. The developed analytical methods ("crossChip") were first validated on "aSim" simulated data and publicly available datasets and then used to answer two biological questions. First, using two retinoblastoma datasets, the effect of genomic copy number variations on gene-expression was investigated. Then, motivated by the fact that retinoblastoma patients have a higher chance to develop osteosarcoma later in life than the average population, datasets of both these tumors were comparatively analyzed to assess these tumors similarities and differences.

Despite a rather limited number of samples within the selected datasets, the developed approaches with their higher sensitivity and sensibility were successful and set the ground for larger scale analyses. Indeed, the integrative analysis applied to retinoblastoma revealed the high importance of the chromosome 6 gain at a later stage of the disease, indicating that many genes on that chromosome are beneficial to cancerogenesis. Moreover, in comparison to standard microarray analyses, it demonstrated its efficacy at detecting the interplay of regulatory mechanisms: examples of positive and negative compensation of gene expression in lost and gained regions, respectively, as well as examples of antisense transcription, pseudogene and snRNAs regulation were identified in this dataset. The comparative analysis on the other hand revealed the high similarity of the retinoblastoma and osteosarcoma tumors, while at the same time showing that either of them take advantage of their distinct micro-environment and consequently appear to make use of different signaling pathways, PKC/calmodulin in retinoblastoma and GPCR/RAS in osteosarcoma. The developed tools and statistical methods have demonstrated their validity and utility by giving sensible answers to the two biological questions addressed. Moreover, they generated a large number of interesting hypotheses that need further investigations. And as they are not limited to microarray analysis but can be applied to analyze any high-throughput generated data, they demonstrated the usefulness of "systems biology" approaches to study cancerogenesis.

Translation of abstract (German)

In den letzten eineinhalb Jahrzehnten hat die breite Nutzung der Hochdurchsatzmethoden in der Molekularbiologie zu grossen Mengen von Datensätzen geführt, die eine unerwartete Komplexität der Zellregulation zeigen. Die kürzlich veröffentlichten Ergebnisse des ENCODE Projekts (ENCODE Project Consortium et al., 2012) haben das Ausmass dieser Mechanismen im menschlichen Genom gezeigt und sicherlich werden in der Zukunft noch weitere entdeckt. Diese Komplexität innerhalb einer einzelnen Zelle, ganz zu schweigen von Zell-Zell-Wechselwirkungen oder dem Einfluss der Mikroumgebung,ist schwer zu erfassen. Dieses Verständnis ist allerdings der Schlüssel zur Entwicklung von individuell angepassten Behandlungen genetischer Krankheiten oder Störungen, darunter auch Krebs.

In der Mathematik geht man solche komplexen Probleme mit Methoden an, die die Komplexität reduzieren, so dass man sie in auflösbarer Weise modellieren kann. In der Biologie haben Forscher diese Methode angewandt, um das Systembiologie konzept zu entwickeln, welches das Verständnis der Zellregulationsmechanismen vereinfacht. Die meisten veröffentlichten Studien, in denen Hochdurchsatz-Technologien verwendet wurden, waren jedoch nur auf eine einzige Art der Zellregulation ausgerichtet und können daher nicht als solche verwendet werden, um die Regulationswechselwirkungen zu untersuchen. Ausserdem ist bei solchen Studien die Unterscheidung zwischen aus lösenden Faktoren und Störfaktoren schwierig. Diese beiden Punkte waren meine ursprüngliche Motivation für die Entwicklung statistischer Methoden, die die integrative und vergleichende Analyse von verschiedenen Arten von Datensätzen ermöglichen.

Es wurden drei verschiedene Softwares entwickelt, um dieses Ziel zu erreichen. Erstens, "customCDF": dies ist eine Methode, um die Custom Definition File (CDF)des Affymetrix GeneChips neu zu definieren; dies dient im Wesentlichen dazu, die ständige Aktualisierung der Sequenz des menschlichen Genoms und dessen Annotationen zu erfassen. Zweitens, "aSim": eine Methode, um Microarray-Daten zu simulieren; dies erstellt die notwendigen Daten um die entwickelten Algorithmen auszuwerten. Drittens, eine Reihe von kombinierten statistischen Methoden, die integrative Analysen ermöglichen und die schliesslich durch gezielte Modifikationen auch vergleichende Analysen erlauben. "CustomCDF" und "aSim" wurden auf unabhängigen Datensätzen validiert, währen die entwickelten analytischen Methoden auf "aSim" simulierten Dateien und öffentlich verfügbaren Datensätzen validiert wurden. Die oben beschriebenen Methoden wurden angewandt, um zwei biologische Fragen zu beantworten. Zunächst wurden zwei Retinoblastom Datensätze benutzt, um die Auswirkung von Genom-Aberrationen auf die Gen-Expressionen zu untersuchen. Dann, motiviert durch die Tatsache, dass Retinoblastom-Patienten im späteren Leben ein höheres Risiko haben ein Osteosarkom zu entwickeln als der Durchschnitt der Bevölkerung, wurden Datensätze von beiden Tumoren vergleichend analysiert, um Aehnlichkeiten und Unterschiede zu identifizieren. Trotz der eher begrenzten Anzahl von Datensätzen waren beide Ansätze dank ihrer hohen Präzision und niedrigen Fehlerrate erfolgreich und haben so die Basis für grössere Analysen gebildet. In der Tat hat die hier angewandte integrative Analyse des Retinoblastoms gezeigt, dass dem Zugewinn des Chromosoms 6 eine wichtige Bedeutung in der Progression der Krankheit zukommt, was wieder um darauf hinweist, dass viele Gene auf diesem Chromosom eine Krebsentwicklung fördern. Im Vergleich zu Microarray-Standardanalysen war diese Analyse darüber hinaus in der Lage, die Interaktion von Regulierungsmechanismen zu entdecken: Beispiele von positivem und negativem Ausgleich der Genexpression in Regionen mit DNA-Zugewinn beziehungsweise -Verlust, sowie Beispiele von Antisense-Transkription, Pseudogen- und snRNA-Regulation wurden in diesem Datensatz identifiziert. Durch die vergleichende Analyse hingegen konnte gezeigt werden, dass Retinoblastome und Osteosarkome grosse Aehnlichkeit aufweisen und darüber hinaus, dass beide Vorteil aus ihren jeweiligen Mikroumgebungen ziehen und damit verschiedene Signalwege, PKC/Calmodulin in Retinoblastom und GPCR/RAS in Osteosarkom, zu nutzen scheinen. In dieser Arbeit konnte die Bedeutung und der Nutzen der entwickelten Softwares und statistischen Methoden demonstriert werden: durch sie konnten präzise Antworten auf die zwei gestellten biologischen Fragen gefunden werden. Desweiteren konnte dadurch eine Reihe interessanter Hypothesen aufgestellt werden, die weitere Untersuchungen erfordern. Diese Softwares sind nicht auf Microarray-Analysen begrenzt, sondern können auf alle Hochdurchsatz-Daten appliziert werden: mittels der hier entwickelten Methoden kann das Konzept der Systembiologie auf die Erforschung der Karzinogenese angewandt werden.

Document type: Dissertation
Supervisor: Rippe, PD Dr. Karsten
Place of Publication: Heidelberg
Date of thesis defense: 29 April 2013
Date Deposited: 10 May 2013 09:41
Date: 2013
Faculties / Institutes: The Faculty of Bio Sciences > Dean's Office of the Faculty of Bio Sciences
DDC-classification: 500 Natural sciences and mathematics
About | FAQ | Contact | Imprint |
OA-LogoDINI certificate 2013Logo der Open-Archives-Initiative