Directly to content
  1. Publishing |
  2. Search |
  3. Browse |
  4. Recent items rss |
  5. Open Access |
  6. Jur. Issues |
  7. DeutschClear Cookie - decide language by browser settings

Evaluation of Risk Models and Biomarkers for the Optimization of Lung Cancer Screening

González Maldonado, Sandra

German Title: Evaluierung von Risiko Modellen und Biomarkern zur Optimierung des Lungenkrebs-Screenings

[thumbnail of Dissertation Dr. sc. hum.]
Preview
PDF, English (Dissertation Dr. sc. hum.) - main document
Download (2MB) | Lizenz: Creative Commons LizenzvertragEvaluation of Risk Models and Biomarkers for the Optimization of Lung Cancer Screening by González Maldonado, Sandra underlies the terms of Creative Commons Attribution-NonCommercial-NoDerivatives 4.0

Citation of documents: Please do not cite the URL that is displayed in your browser location input, instead use the DOI, URN or the persistent URL below, as we can guarantee their long-time accessibility.

Abstract

More deaths can be attributed to lung cancer, than to any other cancer type. Evidence collected over the last 10 years, from randomized trials in the USA and Europe, indicates that screening by means of low-dose computed tomography (LDCT) could reduce the number of lung cancer (LC) deaths by about 20%-24%. While these findings have led to the implementation of screening programs in the USA, South Korea and Poland, discussions on their optimal design and execution are still ongoing in various countries, including Germany. Optimizing screening means finding the right balance between mortality reduction and risks, harms, and monetary costs. LDCT-scans are expensive, expose participants to radiation and put them at risk for overdiagnosis, as well as at risk for unnecessary invasive and expensive confirmatory procedures triggered by false positive (FP) results. Minimizing the number of unnecessary screening and confirmatory examinations should be prioritized. While risk-based eligibility has been shown to best target candidates, questions regarding optimal screening frequency, accurate nodule evaluation, stop-screening criteria to reduce overdiagnosis, and the use of complementary non-invasive diagnostic methods, remain open. Statistical models and biomarkers have been developed to help answer these questions. However, there is limited evidence of their validity in data from screening contexts and populations other than those in which they were developed. The analyses presented in this thesis are based on data collected as part of the German Lung Cancer Screening Intervention (LUSI) trial in order to validate models that address the questions: 1) can candidates for biennial vs annual screening be identified on the basis of their LC risk? 2) can the number of FP test results be reduced by accurately estimating the malignancy of LDCT-detected nodules? 3) What was the extent of overdiagnosis in the LUSI trial and how does overdiagnosis risk relate to the age and remaining lifetime of participants? Additionally, blood samples from participants of the LUSI were measured to evaluate: 4) whether the well-validated diagnostic biomarker test EarlyCDT®-Lung is sensitive enough to detect tumors seen in LDCT images. The LCRAT+CT and Polynomial models predict LC risk based on subject characteristics and LDCT imaging findings. Results of this first external validation confirmed their ability to identify participants with LC detected within 1-2 years after first screening. Discrimination was higher compared to a criterion based on nodule size and, to a lesser degree, compared to a model based on smoking and subject characteristics (LCRAT). This suggested that while LDCT findings can enhance models, most of their performance can could be attributed to information on smoking. Skipping 50% of annual LDCT examinations (i.e., for participants with estimated risks <5th decile) would have caused <10% delayed diagnoses, indicating that candidates for biennial screening could be identified based on their predicted LC risks without compromising on early detection. Absolute risk estimates were, on average, below the observed LC rates, indicating poor calibration. Models developed using data from the Canadian screening study PanCan showed excellent ability to differentiate between tumors and non-malignant nodules seen on LDCT scans taken at first screening participation and to accurately predict absolute malignancy risk. However, they showed lower performance when applied on data of nodules detected in later rounds. In contrast, a model developed on data from the UKLS trial and models developed on data from clinical settings did not perform as well in any screening round. Excess incidence of screen-detected lung tumors, an estimator of overdiagnosis, was within the range of values reported by other trials after similar post-screening follow-up (ca. 5-6 years). Estimates of mean pre-clinical sojourn time (MPST) and LDCT detection sensitivity were obtained via mathematical modeling. The highest excess incidence and longest MPST estimates were found among adenocarcinomas. The proportion of tumors with long lead times predicted based on MPST estimates (e.g., 23% with lead times ≥8 years) suggested a substantial overdiagnosis risk for individuals with residual life expectancies shorter than these hypothetical lead times, for example for heavy smokers over the age of 75. The tumor autoantibody panel measured by EarlyCDT®-Lung, a test widely validated as a diagnostic tool in clinical settings and recently tested as a pre-screening tool in a large randomized Scottish trial (ECLS), was found to have insufficient sensitivity for the identification of lung tumors detected via LDCT and of participants with screen-detected pulmonary nodules for whom more invasive diagnostic procedures should be recommended. Overall, the findings presented in this thesis indicate that risk prediction models can help optimize LC screening by assigning participants to appropriate screening intervals, and by increasing the accuracy of nodule evaluation. However, there is a need for further external model validation and re-calibration. Additionally, while excess incidence can provide estimates of overdiagnosis risk at a population-level, a better approach would be to obtain model-based personalized estimates of tumor lead and residual lifetime. Better individualized decisions about whether to start or stop screening could be taken on the basis of the relationship between these estimates and the risk of overdiagnosis. Finally, although there is evidence for the potential of biomarkers to complement LC screening, the so far most promising candidate (EarlyCDT®-Lung) cannot be recommended as a pre-screening tool given its poor sensitivity for the identification of lung tumors detected via LDCT. In conclusion, while steps have been taken in the right direction, more research is required in order to answer all open questions regarding the optimal design of lung cancer screening programs.

Translation of abstract (German)

Auf Lungenkrebs können mehr Todesfälle zurückgeführt werden als auf jede andere Krebsart. Evidenz der letzten 10 Jahre zeigt, dass Screening mittels Niedrigdosis-Computertomografie (LDCT) die Anzahl der Todesfälle durch Lungenkrebs (LK) um 20% -24% reduzieren könnte. Während diese Erkenntnis zur Einführung von Screening-Programmen in den USA, Südkorea und Polen geführt hat, wird in verschiedenen Ländern, darunter auch in Deutschland, noch über die optimale Gestaltung und Durchführung diskutiert. Screening-Programme zu optimieren bedeutet, die Balance zwischen Mortalitätsreduktion und Risiken, negativen Auswirkungen und Kosten, zu finden. LDCT-Scans sind teuer, setzen die Teilnehmer Strahlung sowie einem Risiko für Überdiagnose und unnötiger invasiver und teurer Abklärungsdiagnostik aus, verursacht durch falsch-positive (FP) Ergebnisse. Die Reduktion unnötiger Screenings und Abklärungsdiagnostiken senkt somit Risiken und Kosten. Während sich gezeigt hat, dass zu screenende Personen idealerweise risikobasiert ausgewählt werden sollten, bleiben Fragen zu optimalen Screening-Intervallen, zur Lungenknotenbewertung, zu Abbruch-Kriterien und zur Verwendung nicht-invasiver Diagnostikmethoden offen. Statistische Modelle und Biomarker wurden entwickelt, um diese Fragen zu beantworten. Es gibt jedoch nur begrenzte Beweise für ihre Gültigkeit in anderen Studienpopulationen. Diese Arbeit stellt Analysen, basierend auf Daten aus der deutschen Lung Cancer Screening Intervention (LUSI) Studie vor, die Modelle validieren, welche sich mit den folgenden Fragen befassen: 1) Können Kandidaten für ein nur zweijährliches Screening anhand ihres LK-Risikos identifiziert werden? 2) Kann die Anzahl der FP-Ergebnisse reduziert werden, indem die Bösartigkeit von LDCT-detektierten Knoten genau geschätzt wird? 3) Wie hoch war das Ausmaß der Überdiagnose in der LUSI-Studie und wie hängt es mit Alter und verbleibender Lebensdauer zusammen? Zusätzlich wurden Blutproben von Probanden der Studie gemessen, um zu bewerten: 4) ob der diagnostische Biomarker-Test, EarlyCDT®-Lung, sensitiv genug ist, um Tumore zu entdecken, die in LDCT-Bildern erkannt wurden. Die LCRAT+CT- und Polynomial-Modelle sagen das LK-Risiko basierend auf Merkmalen der Probanden und deren LDCT-Befunden voraus. Die Ergebnisse dieser ersten externen Validierung bestätigten die Fähigkeit der Modelle, Teilnehmer zu identifizieren, bei denen LK innerhalb von 1-2 Jahren nach dem ersten Screening entdeckt werden konnte. Im Vergleich zur Knotengröße als alleinigem Kriterium und zu einem Modell basierend auf Rauchverhalten und personenbezogener Risikoindikatoren (LCRAT) war die Diskriminierung der beiden erstgenannten Modelle etwas genauer. Dies deutet darauf hin, dass LDCT-Ergebnisse zwar Modelle verbessern können, der größte Teil ihrer Leistung jedoch auf Informationen über das Rauchverhalten zurückzuführen ist. Eine zweijährliche- anstelle von jährlicher LDCT-Untersuchung für Teilnehmer mit geschätzten Risiken <5. Dezil hätte zu <10% verzögerten Diagnosen geführt. Dies weist darauf hin, dass Kandidaten für ein zweijährliches Screening basierend auf ihren vorhergesagten LK-Risiken identifiziert werden könnten, ohne Kompromisse bei der Früherkennung einzugehen. Die absoluten Risikoschätzungen lagen im Durchschnitt unter den beobachteten LK-Raten, was auf eine schlechte Kalibrierung hindeutet. Modelle, die anhand von Daten aus der kanadischen PanCan Screening-Studie entwickelt wurden, zeigten eine ausgezeichnete Fähigkeit, zwischen Tumoren und nicht-bösartigen Knoten zu unterscheiden, die in LDCT-Scans bei der ersten Screening-Teilnahme beobachtet wurden und konnten das absolute Risiko gut vorhersagen. Sie zeigten jedoch eine geringere Leistung, wenn sie auf Daten von Knoten angewendet wurden, die in späteren Runden entdeckt wurden. Im Gegensatz dazu zeigte ein Modell, das aufgrund von Daten aus der UKLS-Studie-, ebenso wie andere Modelle die anhand von klinischen Daten entwickelt wurden, in keiner Screening-Runde vergleichbar gute Leistung. Die überhöhte Inzidenz (ÜI) von screen-detektierten (SD) Lungentumoren, lag innerhalb des Wertebereichs, der in anderen Studien nach ähnlichem Follow-up (ca. 5-6 Jahre post-Screening) berichtet wurde. Schätzungen der mittleren präklinischen Verweilzeit (MPST) und der LDCT-Sensitivität wurden mittels mathematischer Modellierung geschätzt. Die höchste ÜI und längste MPST wurden bei Adenokarzinomen gefunden. Der Anteil der Tumore mit langen Vorlaufzeiten, die auf der Grundlage von MPST-Schätzungen vorhergesagt wurden (z. B. 23% mit Vorlaufzeiten ≥8 Jahren), deutete auf ein erhebliches Überdiagnoserisiko für Personen mit einer Restlebenserwartung hin, die kürzer ist als diese Vorlaufzeiten, beispielsweise für Raucher über 75 Jahre. Das Tumor Autoantikörper-Panel, gemessen mit EarlyCDT®-Lung, einem Test, der weithin als diagnostische Methode in klinischen Umgebungen validiert und kürzlich als Pre-Screening-Tool in einer großen randomisierten schottischen Studie (ECLS) getestet wurde, wies eine unzureichende Sensitivität für die Identifizierung von Lungentumoren auf, die über LDCT erkannt wurden. Auch die Sensitivität zur Identifikation von Teilnehmern mit SD-Lungenknoten, für die invasivere Diagnoseverfahren empfohlen werden sollten, war unzureichend. Insgesamt deuten die Ergebnisse dieser Arbeit darauf hin, dass Risikovorhersagemodelle dazu beitragen können LK-Screening zu optimieren, indem sie Teilnehmer geeigneten Screening-Intervallen zuweisen und die Genauigkeit der Lungenknotenbewertung erhöhen. Es besteht jedoch Bedarf an weiterer externer Modellvalidierung und Kalibrierung. Während die ÜI das Überdiagnoserisiko auf Bevölkerungsebene schätzen kann, ist eine modellbasierte personalisierte Schätzung der MPST und der Restlebensdauer zu bevorzugen. Anhand dieser Schätzungen und dem Risiko einer Überdiagnose könnten besser individualisierte Entscheidungen darüber getroffen werden, ob das Screening gestartet oder abgebrochen werden sollte. Obwohl es Hinweise auf das Potenzial von Biomarkern gibt, LK-Screening zu ergänzen, kann der bisher vielversprechendste Test, EarlyCDT®-Lung, aufgrund seiner niedrigen Sensitivität, nicht als Pre-Screening-Tool empfohlen werden. Zusammenfassend, lässt sich feststellen, dass zwar Schritte in die richtige Richtung unternommen wurden, jedoch mehr Forschung erforderlich ist, um alle offenen Fragen zur optimalen Gestaltung von LK-Screening-Programmen zu beantworten.

Document type: Dissertation
Supervisor: Kaaks, Prof. Dr. Rudolf
Place of Publication: Heidelberg
Date of thesis defense: 30 May 2022
Date Deposited: 08 Feb 2023 13:42
Date: 2023
Faculties / Institutes: Medizinische Fakultät Heidelberg
Service facilities > German Cancer Research Center (DKFZ)
DDC-classification: 000 Generalities, Science
310 General statistics
500 Natural sciences and mathematics
510 Mathematics
600 Technology (Applied sciences)
610 Medical sciences Medicine
Uncontrolled Keywords: Lung cancer Screening Early diagnosis Computed Tomography Biostatistics Mathematical modelling Estimation Validation Risk
About | FAQ | Contact | Imprint |
OA-LogoDINI certificate 2013Logo der Open-Archives-Initiative