Directly to content
  1. Publishing |
  2. Search |
  3. Browse |
  4. Recent items rss |
  5. Open Access |
  6. Jur. Issues |
  7. DeutschClear Cookie - decide language by browser settings

Development and applications of small-angle scattering-based structure modeling tools for proteins and nucleic acids

Manalastas-Cantos, Karen Katrina

[thumbnail of manalastas-phdthesis_22Oct2019.pdf]
Preview
PDF, English
Download (7MB) | Terms of use

Citation of documents: Please do not cite the URL that is displayed in your browser location input, instead use the DOI, URN or the persistent URL below, as we can guarantee their long-time accessibility.

Abstract

Small-angle scattering (SAS) of X-rays and neutrons allows the study of biological macromolecules in solution, at close to native conditions. The rapidly increasing popularity of the technique is attributed to both improvement in experimental facilities and continuous development of SAS data analysis and structure modeling tools. ATSAS, a software suite developed at the EMBL, is arguably the most comprehensive and utilized computer package for SAS data analysis worldwide. I present here the development of three computational tools, two of which have already been integrated into ATSAS: (1) SAS-guided normal mode analysis in torsion angle space (TNMA); (2) the use of sequence coevolution to reduce the ambiguity of SAS-based modeling; and (3) computation of anomalous scattering (ASAXS) effects in the context of SAXS data. Further, this PhD work contains the results of integrative structural biology projects in collaborations with user groups of the ESRF and EMBL Hamburg SAXS beamlines, where the newly developed methods were utilized.

In normal mode analysis, macromolecular motion is approximated as collective, low frequency harmonic oscillations around an initial, equilibrium structure. NMA in Cartesian space (CNMA) has been demonstrated to reasonably approximate conformational changes for a large set of proteins, and was thus used as the basis for SREFLEX, a method in the ATSAS suite to morph crystallographic structures to fit SAS data. However, it was shown in this work that SAS-guided CNMA results in stereochemically broken structures when applied to RNA. In comparison, SAS-guided TNMA of the same RNA structures resulted in improved models, in terms of both accuracy and stereochemistry. An implementation of SAS-guided TNMA, NMATOR, was thus developed and made available in the latest ATSAS v3.0.0 package. NMATOR was also used to generate SAXS-based solution structure models of Alu RNA, and the condensin HEAT-repeat protein Ycg1, and the ISC proteins HscA and IscU. The solution properties and structure of Ycg1, as determined through SAXS, have been published (Manalastas-Cantos et al, 2019).

SAS modeling ambiguity was also tackled in this work and two ways of ameliorating it through the generation of distance constraints were discussed: (1) experimentally, through anomalous scattering effects; and (2) bioinformatically, by evaluating sequence coevolution. A program to account for energy-dependent anomalous effects when computing SAXS data from macromolecular models was written and is available in ATSAS version 3.0.0, for planning and analyzing ASAXS experiments. In addition, sequence coevolution analysis and the integration of identified coevolving pair distance constraints into SAXS-guided modelling, was shown to improve heterodimer modeling accuracy. Sequence coevolution was utilized to generate distance constraints for HscB-IscU heterodimer modeling.

Translation of abstract (German)

Die Kleinwinkelstreuung (SAS) von Röntgenstrahlen und Neutronen ermöglicht die Untersuchung biologischer Makromoleküle in Lösung unter nahezu natürlichen Bedingungen. Die schnell zunehmende Popularität der Technik ist sowohl auf die Verbesserung der experimentellen Einrichtungen als auch auf die kontinuierliche Entwicklung von SAS-Datenanalyse- und Strukturmodellierungsmethoden zurückzuführen. ATSAS, eine am EMBL entwickelte Software-Suite, ist das wohl umfassendste und am meisten genutzte Computerpaket für die SAS-Datenanalyse weltweit. Ich präsentiere hier die Entwicklung von drei neuen Analyseprogrammen, von denen zwei bereits in ATSAS integriert wurden: (1) SAS-gesteuerte Normalmodenanalyse im Torsionswinkelraum (TNMA); (2) die Verwendung von Sequenzkoevolution, um die Mehrdeutigkeit der SAS-basierten Modellierung zu verringern; und (3) Berechnung von Anomalous Scattering (ASAXS) -Effekten in SAXS- Daten. Darüber hinaus enthält diese Doktorarbeit die Ergebnisse integrativer strukturbiologischer Projekte in Zusammenarbeit mit Anwendergruppen der SAXS-Beamlines des ESRF und des EMBL Hamburg, bei denen die neu entwickelten Methoden zum Einsatz kamen.

In der Normalmodenanalyse wird die makromolekulare Bewegung als kollektive, niederfrequente harmonische Schwingung um eine anfängliche Gleichgewichtsstruktur angenähert. Es wurde gezeigt, dass NMA im kartesischen Raum (CNMA) Konformationsänderungen für einen großen Satz von Proteinen annähernd annimmt, und es wurde daher als Grundlage für SREFLEX verwendet, eine Methode in der ATSAS-Suite, um kristallographische Strukturen an SAS-Daten anzupassen. In dieser Arbeit wurde jedoch gezeigt, dass SAS-gesteuertes CNMA bei Anwendung auf RNA zu stereochemisch gebrochenen Strukturen führt. Im Vergleich dazu führte SAS-gesteuertes TNMA mit denselben RNA-Strukturen zu verbesserten Modellen sowohl hinsichtlich der Genauigkeit als auch der Stereochemie. Daher wurde eine Implementierung von SAS-gesteuertem TNMA, NMATOR, entwickelt und im neuesten ATSAS v3.0.0-Paket verfügbar gemacht. NMATOR wurde auch verwendet, um SAXS-basierte Lösungsstrukturmodelle von Alu-RNA und dem Kondensin-HEAT- Repeat-Protein Ycg1 sowie den ISC-Proteinen HscA und IscU zu generieren. Die durch SAXS bestimmten Lösungseigenschaften und Strukturen von Ycg1 wurden veröffentlicht (Manalastas- Cantos et al., 2019).

In dieser Arbeit wurde auch die Zweideutigkeit der SAS-Modellierung behandelt, und es wurden zwei Möglichkeiten zur Verbesserung durch die Erzeugung von Abstandsbeschränkungen erörtert: (1) experimentell durch anomale Streueffekte; und (2) bioinformatisch durch Auswertung der Sequenzkoevolution. Ein Programm zur Berücksichtigung energieabhängiger anomaler Effekte bei der Berechnung von SAXS-Daten aus makromolekularen Modellen wurde geschrieben und ist in ATSAS Version 3.0.0 für die Planung und Analyse von ASAXS-Experimenten verfügbar. Darüber hinaus wurde gezeigt, dass eine Sequenzkoevolutionsanalyse und die Integration identifizierter Zwangsbedingungen für Koevolutionspaare in eine SAXS-geführte Modellierung die Genauigkeit der Heterodimer- Modellierung verbessern. Die Sequenzkoevolution wurde verwendet, um Abstandsbeschränkungen für die HscB-IscU-Heterodimer-Modellierung zu erzeugen.

Document type: Dissertation
Supervisor: Svergun, Dr. Dmitri
Place of Publication: Heidelberg
Date of thesis defense: 17 December 2019
Date Deposited: 08 Oct 2020 10:25
Date: 2020
Faculties / Institutes: The Faculty of Bio Sciences > Dean's Office of the Faculty of Bio Sciences
DDC-classification: 570 Life sciences
Controlled Keywords: Röntgen-Kleinwinkelstreuung, Normalkoordinatenanalyse, Strukturbiologie
Uncontrolled Keywords: ATSAS
About | FAQ | Contact | Imprint |
OA-LogoDINI certificate 2013Logo der Open-Archives-Initiative