Directly to content
  1. Publishing |
  2. Search |
  3. Browse |
  4. Recent items rss |
  5. Open Access |
  6. Jur. Issues |
  7. DeutschClear Cookie - decide language by browser settings

Bayesian Inference of Gene Regulatory Networks : From Parameter Estimation to Experimental Design

Mazur, Johanna

German Title: Bayes'sche Inferenz von Genregulationsnetzwerken : Von der Parameterschätzung bis zur Experimentplanung

[thumbnail of PhD_Thesis.pdf]
Preview
PDF, English
Download (6MB) | Terms of use

Citation of documents: Please do not cite the URL that is displayed in your browser location input, instead use the DOI, URN or the persistent URL below, as we can guarantee their long-time accessibility.

Abstract

To learn the structure of gene regulatory networks is an interesting and important topic in systems biology. This structure could be used to specify key regulators and this knowledge may be used to develop new drugs which affect the expression of these regulators. However, the inference of gene regulatory networks, especially from time-series data is a challenging task. This is due to the limited amount of given data which additionally contain a lot of noise. These data cause from the technical point of view for the parameter estimation procedure problems like the non-identifiability and sloppiness of parameters. To address these difficulties, in these thesis new methods for both, the parameter estimation task and the experimental design for gene regulatory networks, are developed for a non-linear ordinary differential equations model, which use a Bayesian procedure and generate samples of the underlying distribution of the parameters. These distributions are of high interest, since they do not provide only one network structure but give all network structures that are consistent with the given data. And all of these structures can then be examined in more detail. The proposed method for Bayesian parameter estimation uses smoothing splines to circumvent the numerical integration of the underlying system of ordinary differential equations, which is usually used for parameter estimation procedures in systems of ordinary differential equations. An iterative Hybrid Monte Carlo and Metropolis-Hastings algorithm is used to sample the model parameters and the smoothing factor. This new method is applied to simulated data, which shows that it is able to reconstruct the topology of the underlying gene regulatory network with high accuracy. The approach was also applied to real experimental data, a synthetic designed 5-gene network (the DREAM 2 Challenge #3 data) and outperforms other methods. For the Bayesian experimental design step, a full Bayesian approach was used which does not use any parametric assumption of the posterior distribution, nor linearizes around a point estimate. To make the full Bayesian approach computationally manageable, maximum entropy sampling is used together with a population-based Markov chain Monte Carlo algorithm. The approach was applied to simulated and real experimental data, the DREAM 2 Challenge #3 data, and outperforms the usage of random experiments and a classical experimental design method.

Translation of abstract (German)

Die Struktur von Genregulationsnetzwerken zu lernen ist eine interessante und wichtige Fragestellung in der Systemsbiologie. Diese gelernte Struktur könnte dazu dienen, essentielle Regulatoren zu spezifizieren und dieses Wissen könnte weiterhin für die Entwicklung neuer Arzneimittelwirkstoffe genutzt werden, die die Expression dieser Regulatoren beeinflussen. Die Inferenz von Genregulationsnetzwerken, speziell aus Zeitreihendaten, ist jedoch eine herausfordernde Aufgabe. Dies liegt daran, dass die Menge der gegebenen Daten klein ist und diese Daten zusätzlich auch sehr verrauscht sind. Aus technischer Sicht für die Parameterschätzung führt dies zu Problemen wie der Nicht-Identifizierbarkeit und der “Sloppiness” von Parametern. Um diese Schwierigkeiten zu addressieren, werden in dieser Dissertation sowohl Methoden für die Parameterschätzung als auch für das Experimentdesign von Genregulationsnetzwerken entwickelt und zwar für ein nicht-lineares gewöhnliches Differentialgleichungs-Modell. Diese Methoden benutzen einen Bayes’schen Ansatz und erzeugen Stichproben der zugrunde liegenden Verteilungen der Modell-Parameter. Diese Verteilungen sind von hohem Interesse, da sie nicht nur eine Netzwerkstruktur als Lösung präsentieren, sondern alle Netzwerkstrukturen, die mit den gegebenen Daten konsistent sind. Und alle diese erhaltenen Strukturen können dann näher untersucht werden. Die vorgestellte Methode für die Bayes’sche Parameterschätzung benutzt geglättete Splines, um die numerische Integration, die üblicherweise benutzt wird, des zugrunde liegenden Systems bestehend aus gewöhnlichen Differentialgleichungen, zu verhindern. Ein iterativer hybrider Monte-Carlo- und Metropolis-Hastings-Algorithmus wird benutzt, um Stichproben der Modellparamter und des Glättungsfaktors der geglättenen Splines zu generieren. Mit Anwendung dieser Methode auf simulierte Daten wird gezeigt, dass die Topologie des zugrunde liegenden Genregulationsnetzwerkes mit hoher Genauigkeit gelernt werden kann. Der gleiche Ansatz wird auch auf echte experimentelle Daten, einem synthetisch konstruierten 5-Gen- Netzwerk (den DREAM-2-Challenge-#3-Daten), angewendet und übertrifft die Resultate anderer Methoden. Für das Bayes’sche Experimentdesign wird ein vollständiger Bayes’scher Ansatz benutzt, welcher weder eine parametrische Annahme über die a-posteriori-Verteilung annimmt noch um einen Punktschätzer herum linearisiert. Um diesen vollständigen Bayes’schen Ansatz rechnerisch handhabbar zu machen, wird “Maximum Entropy Sampling” zusammen mit einem populations-basierten Markov-Chain-Monte-Carlo-Algorithmus benutzt. Diese Methode wird sowohl auf simulierten als auch echten experimentellen Daten, den DREAM-2-Challenge-#3- Daten, angewendet und übertrifft sowohl die Resultate der Anwendung zufälliger Experimente als auch einer klassischen Experimentdesignmethode.

Document type: Dissertation
Supervisor: Körkel, Dr. Stefan
Date of thesis defense: 24 July 2012
Date Deposited: 20 Sep 2012 09:13
Date: 2012
Faculties / Institutes: Service facilities > Interdisciplinary Center for Scientific Computing
DDC-classification: 510 Mathematics
Controlled Keywords: Parameterschätzung, Bayes-Inferenz, Bayes-Lernen, Markov-Ketten-Monte-Carlo-Verfahren
Uncontrolled Keywords: Bayes'sche Experimentplanung , Netzwerkinferenz , Genregulationsnetzwerke , Gewöhnliche DifferentialgleichungenBayesian experimental design , Markov chain Monte Carlo , gene regulatory networks , network inference , maximum entropy sampling
About | FAQ | Contact | Imprint |
OA-LogoDINI certificate 2013Logo der Open-Archives-Initiative