German Title: Untersuchung der Pathogenität von Bovine Meat and Milk Faktoren durch Genom- und Transkriptomanalyse
![]() |
PDF, English
![]() Login+Download (11MB) | Terms of use |
Abstract
Bovine Meat and Milk factors are circular DNA sequences isolated from bovine milk and serum samples, which have been proposed to contribute to cancer development of different cancer types by inducing chronic inflammation in exposed tissues. While experimental analyses indicated the presence of certain BMMF sequences in different tumor types, only specific BMMF genomes and cancer types have been targeted in experiments so far. For this reason, I screened multiple publicly available high-throughput sequencing data sets for a comprehensive library of BMMF genomes using the D-ViSioN algorithm to fill this knowledge gap by in silico analysis. With this, I managed to prove the feasibility of BMMF detection via computational tools in RNA, WGS and single cell sequencing data and developed processing steps to filter, normalize and characterize the BMMF signal. I screened WGS and RNA sequencing samples of 29 and 25 different cancer cohorts of the PCAWG project, RNA sequencing data of five cancer types provided by the TCGA project, as well as, 15 healthy tissue cohorts derived from healthy donors included in the GTEx project. Additionally, I analyzed cell line data of the DepMap project and a single cell data set of metastatic lung cancer. I detected BMMF sequences on the RNA and even stronger on the DNA level in tumor and non-tumor samples of patients with a wide range of different cancer types as well as in samples of healthy donors. The detection of BMMF group 1 targets outnumbered the detection of BMMF group 2, 3 and 4 targets by far both on DNA and RNA level. The comparison of BMMF detection in a set of cancer and tissue types across five different data sets revealed the highest percentage of BMMF positive samples for ovarian, stomach and uterine cancer in RNA sequencing data as well as for breast, kidney, lung, pancreas, prostate and stomach cancer in WGS data. For further subtyping of the reported BMMF hits, I defined in total 26 BMMF subgroups spanning the four main BMMF groups. Detailed analysis of BMMF detection at subgroup level showed that for a broad set of BMMF subgroups and a broad range of different cancer cohorts a lower BMMF signal was found in the RNA data of tumor samples compared to matched healthy tissue samples. These findings would indicate no increased cancer risk upon detection of these BMMF types. On the contrary, BMMF subgroup 6 in acute myeloid leukemia and ovarian cancer, subgroup 5 in stomach cancer, subgroup 8 in uterine cancer and subgroup 21 in acute myeloid leukemia were found to be increased in the case versus control comparison of RNA data, which are thus candidates for investigating potential high-risk patterns. While WGS data of early-onset prostate cancer patients exhibited a higher BMMF signal in non-tumor samples than in tumor samples of the same patients, a kidney, lung, pancreatic and prostate II cancer cohort each included two or more BMMF subgroups with increased BMMF detection in tumor samples compared to non-tumor samples of the same patients. These analyses highlighted the importance of BMMF subgroups 1, 5, 6, 7, 10 and 21, which frequently stood out in different data sets analyzed. In addition, I characterized the specific coverage of BMMF reads on the respective BMMF templates for the BMMF genomes C1MI.3M.1, H1MSB.1, C1MI.2 and C1HB.4, which showed that either the entire sequence or large parts of it are covered by BMMF reads indicating a specific detection. With these analyses, I identified new cancer types-of-interest as well as new target BMMF genomes for further BMMF research. The definition and characterization of BMMF-positive cohorts and subgroups might help to understand the pathogenic phenotype of BMMFs and to establish BMMF detection workflows helpful in diagnostic and therapeutic setup.
Translation of abstract (German)
Bovine Meat and Milk Faktoren sind zirkuläre DNA Sequenzen, die aus Rindermilch und Rinderserumproben isoliert wurden und die im Verdacht stehen durch das Auslösen chronischer Entzündungen als mögliche Risikofaktoren zu der Entstehung bestimmter Krebstypen beizutragen. Experimentelle Analysen konnten bestimmte BMMFs in verschiedenen Krebsproben nachweisen, jedoch wurde bisher nur eine kleine Gruppe an BMMF Genomen in wenigen verschiedenen Krebsarten experimentell analysiert. Um diese Wissenslücke zu füllen, habe ich in meiner Doktorarbeit öffentlich verfügbare Sequenzierungsdatensätze mit dem D-ViSioN Algorithmus auf eine Bibliothek an BMMF-Genomen untersucht. Dabei konnte ich zeigen, dass BMMF-Sequenzen in RNA-, Ganz-Genom- und Einzelzellsequenzierungsdaten nachgewiesen werden können, und verschiedene Schritte für das Filtern, Normalisieren und die genauere Charakterisierung der detektierten BMMF-Sequenzen entwickeln. Insgesamt habe ich Ganz-Genom und RNA Sequenzierungsdaten von 29 beziehungsweise 25 verschiedenen Krebskohorten des PCAWG Projektes, wie auch RNA Sequenzierungsdaten fünf verschiedener Krebstypen aus dem TCGA Projekt und 15 Gewebekohorten gesunder Spender aus dem GTEx Projekt auf BMMF-Sequenzen untersucht. Neben den Daten dieser Sequenzierungsprojekte habe ich außerdem Zellliniendaten des DepMap Projektes und einen Datensatz von Einzelzellsequenzierungsdaten aus Patienten mit metastasierendem Lungenkrebs auf BMMFs analysiert. Sowohl auf RNA- als auch noch stärker auf DNA-Ebene konnte ich BMMF-Sequenzen in Tumor-, in Blut- oder in Gewebeproben außerhalb des Ausgangstumors von Krebspatienten mit einer großen Spannbreite verschiedener Krebstypen detektieren. Die Anzahl der detektieren Reads von BMMF Gruppe 1 übertraf dabei die Detektion von den Gruppen 2, 3 und 4 bei weitem. Der Vergleich der BMMF-Detektion in Tumor- und Gewebeproben fünf verschiedener Datensätze, zeigte, dass die RNA-Daten von Eierstock-, Magen- und Gebärmutterkrebspatienten wie auch die WGS-Daten von Brust-, Nieren-, Lungen-, Bauchspeicheldrüsen-, Prostata- und Magenkrebs die höchsten prozentualen Anteile an BMMF-positiven Proben enthalten. Für eine genauere Klassifizierung der detektierten BMMF-Sequenzen habe ich 26 verschiedene Untergruppen innerhalb der vier BMMF Hauptgruppen definiert. Die detaillierte Analyse der detektierten Untergruppen zeigte für viele verschiedene Untergruppen und Krebstypen ein stärkeres BMMF-Signal in RNA-Daten von gesunden Gewebeproben als in Tumorproben. Dies würde darauf hindeuten, dass kein Zusammenhang zwischen der Anwesenheit dieser BMMF-Untergruppen und diesen Krebsarten besteht. Einige IV Tumor-Kohorten des PCAWG RNA-Datensatzes enthielten jedoch auch Untergruppen mit erhöhter Detektion in den Tumorproben verglichen mit gesunden Gewebeproben. Dies betrifft Untergruppe 6 in akuter myeloischer Leukämie und Eierstockkrebs, wie auch Untergruppe 5 in Magenkrebs, Untergruppe 8 in Gebärmutterkrebs und Untergruppe 21 in akuter myeloischer Leukämie. Dementsprechend stellen diese Untergruppen Kandidaten für die weitere Suche nach Hochrisiko-BMMF-Sequenzen dar. Während die WGS-Daten von Prostatakrebs bei jungen Patienten ein höheres BMMF-Signal in Blutproben als in Tumorproben aufweisen, ist die BMMF-Detektion in jeweils einer Nieren-, Lungen-, Bauchspeicheldrüsen- und Prostatakrebs-Kohorte für mindestens zwei Untergruppen erhöht. Dabei stechen immer wieder die Untergruppen 1, 5, 6, 7, 10 und 21 heraus. Deswegen, habe ich im Anschluss die Read-Abdeckung der BMMF-Genome C1MI.3M.1, H1MSB.1, C1MI.2 und C1HB.4 analysiert. Die Abdeckung der gesamten Genome beziehungsweise zumindest weiter Teile davon weist auf eine spezifische Detektion dieser Genome hin. Mit diesen Analysen konnte ich neue relevante Krebstypen für die BMMF-Forschung identifizieren wie auch mehrere potentielle Hochrisiko-BMMF-Genome. Die Definition and Charakterisierung von BMMF-positiven Kohorten und Untergruppen kann dazu beitragen, die Detektion von BMMFs in Experimenten zu verbessern und die Bedeutung und Rolle von BMMFs in Krankheiten wie Krebs besser zu verstehen.
Document type: | Dissertation |
---|---|
Supervisor: | Brors, Prof. Dr. Benedikt |
Place of Publication: | Heidelberg |
Date of thesis defense: | 20 September 2024 |
Date Deposited: | 24 Oct 2024 12:28 |
Date: | 2025 |
Faculties / Institutes: | The Faculty of Bio Sciences > Dean's Office of the Faculty of Bio Sciences |