Directly to content
  1. Publishing |
  2. Search |
  3. Browse |
  4. Recent items rss |
  5. Open Access |
  6. Jur. Issues |
  7. DeutschClear Cookie - decide language by browser settings

The Fréchet Mean and Statistics in Non-Euclidean Spaces

Schötz, Christof

German Title: Das Fréchet-Mittel und Statistik in nicht-euklidischen Räumen

[thumbnail of Dissertation_Schötz.pdf]
Preview
PDF, English - main document
Download (5MB) | Lizenz: Creative Commons LizenzvertragThe Fréchet Mean and Statistics in Non-Euclidean Spaces by Schötz, Christof underlies the terms of Creative Commons Attribution 4.0

Citation of documents: Please do not cite the URL that is displayed in your browser location input, instead use the DOI, URN or the persistent URL below, as we can guarantee their long-time accessibility.

Abstract

In this thesis, we study statistical properties of the Fréchet mean and its generalizations in abstract settings. These settings include large classes of scenarios, which may be of great interest in practice when dealing with nonstandard data. Our main focus is on the convergence of sample Fréchet means of independent observations to their population counterpart. The results are exemplarily applied to some specific spaces.

The expectation of a real-valued, square-integrable random variable is characterized by being the unique constant value that minimizes the expected squared difference to the random variable. One can use this property to generalize the notion of mean. A Fréchet mean of a metric space-valued random variable is any minimizer of the expected squared distance to that random variable. This definition achieves two important things: Firstly, it encompasses many commonly used types of mean -- like the expectation, the median, or the geometric mean -- allowing to state powerful, general, and far-reaching theorems about properties of means. Secondly, it defines a mean for non-Euclidean spaces -- like the sphere, the space of phylogenetic trees, or Wasserstein spaces -- opening up these spaces for profound applications of probability theory and statistics.

We show strong laws of large numbers of Fréchet mean sets with two different notions of convergence of sets assuming only a first moment condition. After having established consistency of the sample Fréchet mean, we investigate the rate of this convergence. We demonstrate, using projected means, an instance of the Fréchet mean, that Fréchet means may exhibit very different rates depending on the geometry of the metric space and properties of the distribution of the data. Then we prove rates of convergence in a general setting under some conditions. One of these is the quadruple inequality -- a generalization of the Cauchy-Schwarz inequality. This and some other conditions are fulfilled in Hadamard spaces -- geodesic metric spaces of nonpositive curvature -- which makes them particularly interesting to study in the context of Fréchet means. We show a quadruple inequality for certain powers of Hadamard metrics -- a purely geometric result with an intriguingly complex proof. Lastly, we examine regression models where responses live in a metric space and the regression function is a conditional Fréchet mean. We compare two approaches to transform known estimators to this non-Euclidean setting. In doing so, we establish rates of convergence for four different estimation procedures, two of which are new methods. To illustrate these regression estimators, an R-package was developed that allows their application and comparison on the sphere.

Translation of abstract (German)

In dieser Dissertation werden statistische Eigenschaften des Fréchet-Mittelwertes und seiner Verallgemeinerungen in abstrakten Rahmen untersucht. Dadurch werden vielerlei verschiedene Anwendungen abgedeckt, welche insbesondere in der Untersuchung von Nicht-Standard-Daten von Interesse sind. Der Fokus der Arbeit liegt auf der Konvergenz und Konvergenzgeschwindigkeit des empirischen Fréchet-Mittelwertes unabhängiger Beobachtungen. Die abstrakten Ergebnisse werden beispielhaft in spezifischen Räumen angewendet.

Der Erwartungswert einer reellwertigen, quadratintegrierbaren Zufallsvariable kann dadurch charakterisiert werden, dass er den erwarteten quadratischen Abstand zu dieser Zufallsvariable eindeutig minimiert. Diese Eigenschaft kann benutzt werden, um den Begriff Mittelwert zu verallgemeinern. Ein Fréchet-Mittelwert einer Zufallsvariable mit Werten in einem metrischen Raum ist jeder Minimierer des erwarteten quadratischen Abstandes zu dieser Zufallsvariable. Durch diese Definition werden zwei Dinge erreicht: Erstens werden viele gebräuchliche Arten von Mittelwerten – etwa der Erwartungswert, der Median oder das geometrische Mittel – in einem Begriff umfasst. Zweitens wird ein Mittelwertsbegriff für nicht-euklidische Räume – wie etwa die Kugel, der Raum phylogenetischer Bäume oder die Wasserstein-Räume – definiert, wodurch diese der Anwendung von Wahrscheinlichkeitstheorie und Statistik zugänglich gemacht werden.

Wir zeigen starke Gesetze der großen Zahlen für Mengen von Fréchet-Mittelwerten mit zwei verschiedenen Begriffen der Konvergenz von Mengen. Dabei setzen wir nur ein endliches erstes Moment voraus. Als nächstes wenden wir uns der Geschwindigkeit dieser Konvergenz zu. Zuerst zeigen wir anhand des projizierten Mittelwertes – einer Instanz des Fréchet-Mittelwertes – dass hierbei sehr unterschiedliche Konvergenzraten zustande kommen können, abhängig von der Geometrie des zugrundeliegenden Raumes und einiger Eigenschaften der Verteilung der Daten. Danach beweisen wir Konvergenzraten in einem allgemeinen Rahmen. Eine der Bedingungen, die wir dafür aufstellen, ist die Qua\-dru\-pel\-un\-glei\-chung – eine Verallgemeinerung der Cauchy-Schwarz-Ungleichung. Diese und einige weitere der von uns aufgestellten abstrakten Bedingungen sind in Hadamard-Räumen – geodätische metrische Räume mit nicht-positiver Krümmung – erfüllt, sodass sie sich besonders zur Untersuchung im Kontext des Fréchet-Mittelwertes eignen. Wir zeigen eine Quadrupelungleichung für Potenzen von Hadamard-Metriken – ein rein geometrisches Resultat mit verblüffend komplexem Beweis. Zuletzt untersuchen wir Regressionsmodelle mit Zielwerten aus metrischen Räumen und einem bedingten Fréchet-Mittelwert als Regressionsfunktion. Wir vergleichen zwei Ansätze, wie bekannte Schätzer auf nicht-euklidische Szenarien angepasst werden können. Dabei zeigen wir Konvergenzraten für vier verschiedene Schätzer; zwei davon sind neue Methoden. Die Verfahren werden auf der Kugel angewendet und verglichen. Zu diesem Zweck wurde eigens ein R-Paket entwickelt.

Document type: Dissertation
Supervisor: Mammen, Prof. Dr. Enno
Place of Publication: Heidelberg
Date of thesis defense: 12 April 2021
Date Deposited: 28 Apr 2021 16:54
Date: 2021
Faculties / Institutes: The Faculty of Mathematics and Computer Science > Institut für Mathematik
DDC-classification: 310 General statistics
510 Mathematics
Controlled Keywords: Nichtparametrische Statistik, Inferenzstatistik, Nichteuklidische Geometrie
Uncontrolled Keywords: Fréchet Mean
About | FAQ | Contact | Imprint |
OA-LogoDINI certificate 2013Logo der Open-Archives-Initiative