eprintid: 29677 rev_number: 14 eprint_status: archive userid: 5854 dir: disk0/00/02/96/77 datestamp: 2021-04-28 16:54:28 lastmod: 2021-05-10 07:56:16 status_changed: 2021-04-28 16:54:28 type: doctoralThesis metadata_visibility: show creators_name: Schötz, Christof title: The Fréchet Mean and Statistics in Non-Euclidean Spaces title_de: Das Fréchet-Mittel und Statistik in nicht-euklidischen Räumen subjects: 310 subjects: 510 divisions: 110400 adv_faculty: af-11 keywords: Fréchet Mean cterms_swd: Nichtparametrische Statistik cterms_swd: Inferenzstatistik cterms_swd: Nichteuklidische Geometrie abstract: In this thesis, we study statistical properties of the Fréchet mean and its generalizations in abstract settings. These settings include large classes of scenarios, which may be of great interest in practice when dealing with nonstandard data. Our main focus is on the convergence of sample Fréchet means of independent observations to their population counterpart. The results are exemplarily applied to some specific spaces. The expectation of a real-valued, square-integrable random variable is characterized by being the unique constant value that minimizes the expected squared difference to the random variable. One can use this property to generalize the notion of mean. A Fréchet mean of a metric space-valued random variable is any minimizer of the expected squared distance to that random variable. This definition achieves two important things: Firstly, it encompasses many commonly used types of mean -- like the expectation, the median, or the geometric mean -- allowing to state powerful, general, and far-reaching theorems about properties of means. Secondly, it defines a mean for non-Euclidean spaces -- like the sphere, the space of phylogenetic trees, or Wasserstein spaces -- opening up these spaces for profound applications of probability theory and statistics. We show strong laws of large numbers of Fréchet mean sets with two different notions of convergence of sets assuming only a first moment condition. After having established consistency of the sample Fréchet mean, we investigate the rate of this convergence. We demonstrate, using projected means, an instance of the Fréchet mean, that Fréchet means may exhibit very different rates depending on the geometry of the metric space and properties of the distribution of the data. Then we prove rates of convergence in a general setting under some conditions. One of these is the quadruple inequality -- a generalization of the Cauchy-Schwarz inequality. This and some other conditions are fulfilled in Hadamard spaces -- geodesic metric spaces of nonpositive curvature -- which makes them particularly interesting to study in the context of Fréchet means. We show a quadruple inequality for certain powers of Hadamard metrics -- a purely geometric result with an intriguingly complex proof. Lastly, we examine regression models where responses live in a metric space and the regression function is a conditional Fréchet mean. We compare two approaches to transform known estimators to this non-Euclidean setting. In doing so, we establish rates of convergence for four different estimation procedures, two of which are new methods. To illustrate these regression estimators, an R-package was developed that allows their application and comparison on the sphere. abstract_translated_text: In dieser Dissertation werden statistische Eigenschaften des Fréchet-Mittelwertes und seiner Verallgemeinerungen in abstrakten Rahmen untersucht. Dadurch werden vielerlei verschiedene Anwendungen abgedeckt, welche insbesondere in der Untersuchung von Nicht-Standard-Daten von Interesse sind. Der Fokus der Arbeit liegt auf der Konvergenz und Konvergenzgeschwindigkeit des empirischen Fréchet-Mittelwertes unabhängiger Beobachtungen. Die abstrakten Ergebnisse werden beispielhaft in spezifischen Räumen angewendet. Der Erwartungswert einer reellwertigen, quadratintegrierbaren Zufallsvariable kann dadurch charakterisiert werden, dass er den erwarteten quadratischen Abstand zu dieser Zufallsvariable eindeutig minimiert. Diese Eigenschaft kann benutzt werden, um den Begriff Mittelwert zu verallgemeinern. Ein Fréchet-Mittelwert einer Zufallsvariable mit Werten in einem metrischen Raum ist jeder Minimierer des erwarteten quadratischen Abstandes zu dieser Zufallsvariable. Durch diese Definition werden zwei Dinge erreicht: Erstens werden viele gebräuchliche Arten von Mittelwerten – etwa der Erwartungswert, der Median oder das geometrische Mittel – in einem Begriff umfasst. Zweitens wird ein Mittelwertsbegriff für nicht-euklidische Räume – wie etwa die Kugel, der Raum phylogenetischer Bäume oder die Wasserstein-Räume – definiert, wodurch diese der Anwendung von Wahrscheinlichkeitstheorie und Statistik zugänglich gemacht werden. Wir zeigen starke Gesetze der großen Zahlen für Mengen von Fréchet-Mittelwerten mit zwei verschiedenen Begriffen der Konvergenz von Mengen. Dabei setzen wir nur ein endliches erstes Moment voraus. Als nächstes wenden wir uns der Geschwindigkeit dieser Konvergenz zu. Zuerst zeigen wir anhand des projizierten Mittelwertes – einer Instanz des Fréchet-Mittelwertes – dass hierbei sehr unterschiedliche Konvergenzraten zustande kommen können, abhängig von der Geometrie des zugrundeliegenden Raumes und einiger Eigenschaften der Verteilung der Daten. Danach beweisen wir Konvergenzraten in einem allgemeinen Rahmen. Eine der Bedingungen, die wir dafür aufstellen, ist die Qua\-dru\-pel\-un\-glei\-chung – eine Verallgemeinerung der Cauchy-Schwarz-Ungleichung. Diese und einige weitere der von uns aufgestellten abstrakten Bedingungen sind in Hadamard-Räumen – geodätische metrische Räume mit nicht-positiver Krümmung – erfüllt, sodass sie sich besonders zur Untersuchung im Kontext des Fréchet-Mittelwertes eignen. Wir zeigen eine Quadrupelungleichung für Potenzen von Hadamard-Metriken – ein rein geometrisches Resultat mit verblüffend komplexem Beweis. Zuletzt untersuchen wir Regressionsmodelle mit Zielwerten aus metrischen Räumen und einem bedingten Fréchet-Mittelwert als Regressionsfunktion. Wir vergleichen zwei Ansätze, wie bekannte Schätzer auf nicht-euklidische Szenarien angepasst werden können. Dabei zeigen wir Konvergenzraten für vier verschiedene Schätzer; zwei davon sind neue Methoden. Die Verfahren werden auf der Kugel angewendet und verglichen. Zu diesem Zweck wurde eigens ein R-Paket entwickelt. abstract_translated_lang: ger date: 2021 id_scheme: DOI id_number: 10.11588/heidok.00029677 ppn_swb: 1757445021 own_urn: urn:nbn:de:bsz:16-heidok-296774 date_accepted: 2021-04-12 advisor: HASH(0x564e1c36ba20) language: eng bibsort: SCHOTZCHRITHEFRECHET2021 full_text_status: public place_of_pub: Heidelberg citation: Schötz, Christof (2021) The Fréchet Mean and Statistics in Non-Euclidean Spaces. [Dissertation] document_url: https://archiv.ub.uni-heidelberg.de/volltextserver/29677/1/Dissertation_Sch%C3%B6tz.pdf