eprintid: 31920 rev_number: 46 eprint_status: archive userid: 6566 dir: disk0/00/03/19/20 datestamp: 2022-08-19 08:44:54 lastmod: 2022-08-29 11:46:39 status_changed: 2022-08-19 08:44:54 type: doctoralThesis metadata_visibility: show creators_name: Wu, Yu-Le title: Maximum-likelihood model fitting for quantitative analysis of SMLM data subjects: ddc-500 subjects: ddc-570 divisions: i-140001 divisions: i-850800 adv_faculty: af-14 cterms_swd: Einzelmolekülmikroskopie cterms_swd: Mikroskopie cterms_swd: Fluoreszenzmikroskopie cterms_swd: Bildanalyse cterms_swd: Maximum-Likelihood-Schätzung cterms_swd: Endocytose cterms_swd: Kernpore abstract: Super-resolution techniques have enabled fluorescence microscopy to surpass the diffraction limit of light and resolve nanoscale biological structures with molecular specificity. As with other microscopy data, quantitative analyses of super-resolution images have enabled great insight into the underlying architecture of many macromolecular structures. However, this is still a challenging process, especially in the field of single-molecule localization microscopy (SMLM). Unlike pixelated images yielded by most microscopy techniques, SMLM data is composed of a list of fluorophore coordinates and their specific positional uncertainties. Therefore, applying pixel-based approaches to SMLM data requires image rendering, which can cause loss of information and can complicate the analysis. These drawbacks can be mitigated by using coordinate-based approaches. However, currently available coordinate-based approaches in SMLM are typically only applicable to simple geometries or require identical structures. These approaches do not support a basic task in structural analysis: postulating a model with a suitable underlying geometry to probe key parameters in a biological structure. Here, I present LocMoFit (Localization Model Fit), a new framework for fitting a parameterized geometric model to SMLM data at the level of localizations. Based on maximum likelihood estimation, LocMoFit extracts meaningful parameters from individual structures and can select the most suitable model. Using the nuclear pore complex, microtubules, and clathrin-mediated endocytosis (CME) as examples, I demonstrate the application of LocMoFit in in situ structural biology for extracting descriptive parameters of complex, heterogeneous and even dynamic structures. Beyond that, I further showcase applications including assembling multi-protein distribution maps of six nuclear pore components, calculating single-particle averages without any structural prior, and reconstructing the progression of endocytosis - a highly dynamic process - from static snapshots. On the one hand, the quantitative analysis allowed to address a long-standing controversy of how the clathrin coat is rearranged during CME in mammalian cells. On the other hand, the dynamic reconstruction of representative endocytic proteins over the endocytic progression shows the potential of revealing previously unknown nanoscale features that may be associated with force generation during CME in yeast. To ensure all these functionalities are accessible, I implemented LocMoFit as open-source and provided instructions and model templates. A simulation engine and visualization routines are also supplied for users to examine the plausibility of their own analysis, which is also what I used to validate the robustness of the framework in this work. With these, I believe LocMoFit will enable any user to extend the information that can be faithfully extracted from SMLM data. abstract_translated_text: Superauflösende Techniken haben es der Fluoreszenzmikroskopie ermöglicht, die Beugungsgrenze des Lichts zu überwinden und biologische Strukturen im Nanobereich mit molekularer Spezifität aufzulösen.Wie auch bei anderen Mikroskopiedaten hat die quantitative Analyse von superaufgelösten Aufnahmen neue biologische Erkenntnisse ermöglicht. Allerdings stellen solche Untersuchungen noch immer eine Herausforderung dar, insbesondere in der Einzelmolekül-Lokalisationsmikroskopie (engl. single-molecule localization microscopy, SMLM). Im Gegensatz zu den pixelbasierten Bildern der meisten Mikroskopietechniken bestehen SMLM-Daten aus einer Liste von Fluorophor-Koordinaten und den Unsicherheiten, mit denen sie bestimmt wurden. Daher erfordert die Anwendung von pixelbasierten Ansätzen auf SMLM-Daten die Rekonstruktion eines Bildes, was zum Verlust von Informationen führt und die Analyse erschweren kann. Diese Nachteile können durch die Verwendung koordinatenbasierter Verfahren verringert werden. Derzeit verfügbare koordinatenbasierte Verfahren sind jedoch in der Regel nur auf einfache Geometrien anwendbar oder erfordern identische Strukturen. Damit unterstützen sie eine grundlegende Aufgabe der Strukturanalyse nicht: die Erstellung eines geometrischen Modells, um wichtige Parameter einer biologischen Struktur zu untersuchen. Hier stelle ich LocMoFit (engl. Localization Model Fit) vor, ein neues Verfahren welches das Fitten eines parametrisierten geometrischen Modells an SMLM-Daten ermöglicht, und direkt auf der Ebene der Fluorophor-Koordinaten angewendet wird. Auf der Grundlage der Maximum-Likelihood-Methode extrahiert LocMo- Fit aussagekräftige Parameter aus einzelnen Strukturen und kann das am besten geeignete Modell auswählen. Am Beispiel von Kernporenkomplexen, Mikrotubuli und Clathrin-vermittelter Endozytose (engl. clathrin-mediated endocytosis, CME) demonstriere ich die Anwendung von LocMoFit in der in situ Strukturbiologie zur Extraktion von Parametern komplexer, heterogener und sogar dynamischer Strukturen. Darüber hinaus stelle ich weitere Anwendungen vor, darunter die Bestimmung der räumlichen Verteilung von sechs Kernporenkomponenten, die Berechnung einer Durchschnittsstruktur aus einzelnen Partikeln ohne strukturelles Vorwissen und die dynamische Rekonstruktion des Verlaufs der Endozytose – eines hochdynamischen Prozesses – aus statischen Einzelaufnahmen. Einerseits ermöglichte die quantitative Analyse der CME in Säugetierzellen die Aufklärung einer langjährigen Kontroverse darüber, wie die Clathrin-Hülle während des Prozesses umgeordnet wird. Andererseits zeigt die dynamische Rekonstruktion vier verschiedener Proteine – die als Beispiel für verschiedene endozytotische Module dienen – während der Endozytose in Hefe das Potenzial von LocMoFit, bisher unbekannte Merkmale im Nanobereich aufzudecken, die mit der Krafterzeugung während der CME im Zusammenhang stehen könnten. Um all diese Funktionalitäten leicht zugänglich zu machen, habe ich LocMoFit als Open-Source-Programm implementiert und Anleitungen und Modellvorlagen bereitgestellt. Funktionen zur Simulation und Visualisierung sind ebenfalls enthalten, damit die Nutzer die Plausibilität ihrer eigenen Analysen überprüfen können. Ich glaube, dass LocMoFit es jedem Nutzer ermöglicht, mehr Informationen aus SMLM-Daten zu extrahieren. abstract_translated_lang: ger date: 2022 id_scheme: DOI id_number: 10.11588/heidok.00031920 ppn_swb: 1815086319 own_urn: urn:nbn:de:bsz:16-heidok-319202 date_accepted: 2022-06-24 advisor: HASH(0x55fc36ae6f40) language: eng bibsort: WUYULEMAXIMUMLIK full_text_status: public place_of_pub: Heidelberg citation: Wu, Yu-Le (2022) Maximum-likelihood model fitting for quantitative analysis of SMLM data. [Dissertation] document_url: https://archiv.ub.uni-heidelberg.de/volltextserver/31920/2/Thesis_Yu_Le.pdf