Numerical Contributions to the Asymptotic Theory of Robustness

Numerische Beiträge zur asymptotischen Theorie der Robustheit

In the framework of this dissertation a software package – the R bundle RobASt – by means of the statistics software R has been developed. It includes all robust procedures introduced throughout the thesis. The dissertation itself consists of five parts and starts with a brief motivation, which makes precise why robust statistics is necessary. After that a detailed summary in German and English is given. Part I provides a description of the asymptotic theory of robustness (Chapter 1) which formsIn the framework of this dissertation a software package – the R bundle RobASt – by means of the statistics software R has been developed. It includes all robust procedures introduced throughout the thesis. The dissertation itself consists of five parts and starts with a brief motivation, which makes precise why robust statistics is necessary. After that a detailed summary in German and English is given. Part I provides a description of the asymptotic theory of robustness (Chapter 1) which forms the basis of this thesis. It is based on Chapters 4 and 5 of Rieder (1994). Chapter 2 provides supplements to the asymptotic theory of robustness which have proved necessary for this thesis. More precisely, it contains results about: properties of the optimally robust influence curves (ICs), how one should proceed in an optimal way if the neighborhood radius is unknown – as mostly in practice, and the construction of estimates by means of the one-step method. At the end of Chapter 2 convergence of robust models is introduced which is related to the concept of convergence of experiments of Le Cam. Part II deals with optimally robust estimators for some non-standard models in robust statistics. These models are covered by the R package ROptEst which makes use of S4 classes and methods and is part of the R bundle RobASt. More precisely, the binomial (Chapter 3) and Poisson (Chapter 4) model, the exponential scale and Gumbel location model (Chapter 5) as well as the Gamma model (Chapter 6) are investigated. In particular, the binomial and Poisson model are used to study convergence of robust models. Using exponential scale and Gumbel location one can show that there is a connection between certain scale and location models via a log-transformation which also holds for the corresponding optimally robust ICs. Finally, the Gamma model is used to demonstrate how differentiable parameter transformations can be estimated in an optimally robust way. In Part III robust regression with random regressor and unknown error scale (Chapter 7) is treated where it is distinguished between simultaneous and separate estimation. In both cases the optimally robust estimators as well as robust estimators for several narrower classes of M estimators are considered. All these estimators are implemented in the R packages ROptRegTS and RobRex which are part of the R bundle RobASt. Numerical comparisons for several regressor distributions show that the various suboptimal M estimators may have very small but also huge efficiency losses. A further comparison of these and several other well-known robust estimators in case of normal location and scale is made in Chapter 8. These location and scale estimators are implemented in the R package RobLox which is part of the R bundle RobASt. In Part IV (Chapter 9) robust adaptivity in terms of two asymptotic MSE problems is defined. Hence, adaptivity is no longer only a dichotomous criterion but can be evaluated quantitatively in terms of efficiency loss. The various regression and time series models considered include models which are classically as well as robust-adaptive, models which are classically but not robust-adaptive, and finally models which are neither classically nor robust-adaptive. The numerical evaluations show that non-adaptivity depends in a crucial way on the considered model and may be very small in some models (e.g. AR(1) and MA(1)) but may be really huge in other models (e.g. ARCH(1)). Finally, in Part V (Chapter 10 – 12) asymptotic results are compared with their exact finite-sample counterparts. In case of a particular pseudo-loss function in terms of under-/overshoot probabilities an exact finite-sample as well as an asymptotic theory are available. As the analytic evaluation of the finite-sample risk turns out very difficult or even impossible for sample sizes larger than 2, algorithms based on the fast Fourier transform (FFT) have been developed to determine the exact finite-sample distribution of these differently robust estimators. Two interesting findings are: The (first order) asymptotics is too optimistic and the convergence towards the asymptotic values is better in case of total variation than in case of contamination neighborhoods. The appendix of this thesis contains supplementary results on the asymptotic theory of robustness for regression-type models (Appendix A), on the Kronecker product and the vec and vech operators (Appendix B) as well as on the convolution via FFT (Appendix C). Moreover, Appendix D provides a brief description of the R packages distrEx, RandVar, ROptEst and ROptRegTS which are part of the R bundle RobASt.show moreshow less
Im Rahmen der Dissertation wurde ein Programmpaket - das R bundle RobASt - entwickelt, in dem alle im Textteil vorgestellten robusten Verfahren mit Hilfe der Statistiksoftware R implementiert sind. Die Arbeit selbst besteht aus fünf Teilen und beginnt mit einer kurzen Motivation, die deutlich macht, dass Robuste Statistik notwendig ist. Es folgt eine Zusammenfassung in Deutsch und Englisch. In Teil I werden zum besseren Verständnis der Arbeit zuerst die Grundlagen der asymptotischen Theorie der Im Rahmen der Dissertation wurde ein Programmpaket - das R bundle RobASt - entwickelt, in dem alle im Textteil vorgestellten robusten Verfahren mit Hilfe der Statistiksoftware R implementiert sind. Die Arbeit selbst besteht aus fünf Teilen und beginnt mit einer kurzen Motivation, die deutlich macht, dass Robuste Statistik notwendig ist. Es folgt eine Zusammenfassung in Deutsch und Englisch. In Teil I werden zum besseren Verständnis der Arbeit zuerst die Grundlagen der asymptotischen Theorie der Robustheit (Kapitel 1) eingeführt. Diese Theorie wird in Kapitel 2, um einige theoretische Resultate erweitert. Es handelt sich um Resultate zu den Eigenschaften optimal-robuster Influenzkurven (ICs), einer optimalen Vorgehensweise für den Fall, dass der Umgebungsradius – wie meist in der Praxis – unbekannt ist und zur Schätzerkonstruktion mittels der ein-Schritt Methode. Zum Abschluss von Kapitel 2 wird die Konvergenz robuster Modelle eingeführt, die mit dem Konzept der Konvergenz von Experimenten von Le Cam in Zusammenhang gebracht werden kann. Teil II der Dissertation beschäftigt sich mit den optimal-robusten Schätzern für einige nicht-standard Modelle der robusten Statistik. Deren Implementation ist durch die S4 Klassen und Methoden des R Pakets ROptEst, welches Bestandteil des R bundles RobASt ist, abgedeckt. Im einzelnen werden das Binomial (Kapitel 3) und das Poisson (Kapitel 4) Modell, das Modell von Exponentialer Skala und Gumbel Lokation (Kapitel 5) sowie das Gamma Modell (Kapitel 6) untersucht. Anhand von Binomial und Poisson Modell wird insbesondere der Begriff der Konvergenz der robusten Modelle genauer studiert. Am Beispiel von Exponentialer Skala und Gumbel Lokation wird gezeigt, dass mittels einer log-Transformation ein Zusammenhang zwischen gewissen Skalen- und Lokationsmodellen hergestellt werden kann, der sich auf die optimal-robusten ICs überträgt. Das Gamma Modell schließlich wird außerdem dazu verwendet, um zu demonstrieren, wie differenzierbare Parametertransformationen in optimal-robuster Weise geschätzt werden können. Im Teil III wird das Problem der robusten Regression mit zufälligem Regressor und unbekannter Skala (Kapitel 7) behandelt. Es wird dabei zwischen simultaner und separater Schätzung von Regression und Skala unterschieden. In beiden Fällen werden neben den optimal-robusten Schätzern auch robuste Schätzer für verschiedene engere Klassen von M Schätzern hergeleitet. Alle diese Schätzer sind in den R Paketen ROptRegTS und RobRex, welche Bestandteil des R bundles RobASt sind, implementiert. Ein numerischer Vergleich für verschiedene Regressorverteilungen zeigt, dass die verschiedenen M Schätzer z.T. sehr kleine aber auch riesige Effizienzverluste aufweisen können. Ein weiterer Vergleich dieser und weiterer, aus der Robustheitsliteratur bekannter Schätzer findet sich in Kapitel 8 für den Fall der normalen Lokation und Skala. Implementiert sind diese Lokation- und Skalen-Schätzer im R Paket RobLox, welches Bestandteil des R bundles RobASt ist. Teil IV (Kapitel 9) der Dissertation befasst sich mit robuster Adaptivität, die in Termen zweiter asymptotischer MSE Probleme definiert wird. Dadurch ist Adaptivität nicht länger ein dichotomes Merkmal, sondern kann quantitativ als Effizienzverlust berechnet werden. Im einzelnen werden Regressions- und Zeitreihenmodelle betrachtet, die sowohl klassisch als auch robust-adaptiv sind, welche, die klassisch, aber nicht robust-adaptiv sind, sowie welche, die weder klassisch noch robust-adaptiv sind. Die numerischen Auswertungen zeigen, dass die Nicht-Adaptivität entscheidend vom betrachteten Modell abhängt und in einigen Modellen (z.B. AR(1) und MA(1)) sehr klein, in anderen Modellen (z.B. ARCH(1)) jedoch riesig sein kann. Im Teil V (Kapitel 10 – 12) schließlich werden asymptotische mit exakten Resultaten für finite Stichproben verglichen. Im Fall einer speziellen Pseudo-Verlustfunktion in Gestalt von Unter-/Überschusswahrscheinlichkeiten gibt es sowohl eine Theorie für finite Stichproben als auch eine asymptotische Theorie. Da die analytische Berechnung der exakten finiten Risiken für Stichprobenumfänge größer als 2 sehr schwer oder sogar unmöglich ist, wurden Algorithmen basierend auf der schnellen Fourier Transformation (FFT) entwickelt, mit deren Hilfe diese Berechnung möglich ist. Die numerischen Vergleiche offenbaren zwei interessante Resultate: Die (erste Ordnungs-) Asymptotik ist zu optimistisch und die Konvergenz gegen die asymptotischen Werte ist besser im Fall von Totalvariations- als im Fall von Kontaminationsumgebungen. Im Anhang der Dissertation finden sich ergänzende Resultate zur asymptotischen Theorie der Robustheit für Regressions-Typ Modelle (Anhang A), zum Kronecker Produkt und den vec und vech Operatoren (Anhang B) sowie zur Faltung mittels FFT (Anhang C). Außerdem enthält der Anhang D eine kurze Beschreibung der R Pakete distrEx, RandVar, ROptEst und ROptRegTS, welche Bestandteil des R bundles RobASt sind.show moreshow less

Export metadata

  • Export Bibtex
  • Export RIS
  • frontdoor_exportcitavi

Additional Services

    Share in Twitter Search Google Scholar
Metadaten
Institutes:Mathematik
Author: Matthias Kohl
Advisor:Prof. Dr. Helmut Rieder
Granting Institution:Universität Bayreuth,Fakultät für Mathematik, Physik und Informatik
Date of final exam:15.12.2005
Year of Completion:2005
SWD-Keyword:Asymptotische Statistik; Lokale Asymptotik; R <Programm>; Robuste Statistik; S <Programmiersprache>
Tag:Asymptotisch Linearer Schätzer; Infinitesimale Umgebung; Influenzkurve; Robuste Adaptivität; Robuste Regression
Asymptotically Linear Estimator; Infinitesimal Neighborhood; Influence Curve; Robust Adaptivity; Robust Regression
Dewey Decimal Classification:510 Mathematik
RVK - Regensburg Classification:SK 830
URN:urn:nbn:de:bvb:703-opus-1958
Document Type:Doctoral Thesis
Language:English
Date of Publication (online):11.01.2006