Allgemeines zur nichtparametrischen Statistik

Parametrischen statistischen Verfahren (http://de.wikipedia.org/wiki/Parametrische_Statistik) liegt in der Regel ein mathematisches Modell zugrunde, das auf einer Verteilungsannahme beruht, häufig der Normalverteilung. Dabei müssen nicht unbedingt die Merkmale selbst der Verteilung folgen, häufig sind es auch abgeleitete Größen wie z.B. die Residuen. Die im Modell angenommene Verteilung hat Parameter (z.B. Mittelwert m und Standardabweichung s bei der Normalverteilung), über die sich dann die Parameter des Modells bestimmen lassen. Bei den nichtparametrischen Verfahren, auch verteilungsfreie Verfahren genannt (http://de.wikipedia.org/wiki/Parameterfreie_Statistik), wird in der Regel keine solche Verteilung angenommen.

Parametrische Verfahren werden meistens angewandt, wenn die abhängige Variable metrisch ist und zusätzliche Verteilungsvoraussetzungen, wie Normalverteilung der Residuen, erfüllt sind. Häufig kommen zusätzliche Voraussetzungen hinzu, wie z.B. Homogenität der Varianzen oder Unabhängigkeit der Beobachtungen. So z.B. bei der Varianz- oder Regressionsanalyse. Ist eine der Voraussetzungen nicht erfüllt, versucht man, äquivalente nichtparametrische Verfahren anzuwenden, sofern vorhanden. Letztere haben gegenüber den parametrischen eine geringere (asymptotische) Effizienz, in der Regel zwischen 63.7% (2/pi), z.B. beim Vorzeichen- und Mediantest, und 95,5% (3/pi), so beim U-, H-, Wilcoxon- und Friedman-Test, falls alle Voraussetzungen erfüllt sind. Die Effizienz nichtparametrischer Tests kann allerdings auch umgekehrt über 100% , sogar beliebig hoch, liegen, wenn die Verteilungsvoraussetzungen nicht erfüllt sind. D.h. je weniger die Voraussetzungen eines parametrischen Tests erfüllt sind, desto eher ist zu einem nichtparametrischen Test zu raten. (Eine Effizienz von 95% oder 67 % bedeutet, dass z.B. bei gleichen Mittelwertunterschieden der nichtparametrische Test eine 5% bzw. 50% größere Stichprobe erfordert, um dieselbe Signifikanz zu erreichen.)

In Abhängigkeit vom Skalenniveau der abhängigen Variablen unterscheidet man die Verfahren in solche für

Literaturhinweise:
G.A.Lienert: Verteilungsfreie Methoden in der Biostatistik - Band 1 und 2, 1987 (der Klassiker)
J. Bortz, G.A. Lienert, K. Boehnke: Verteilungsfreie Methoden in der Biostatistik, Springer, 2008 (gekürzte Neuauflage des Klassikers)
E. Brunner & U. Munzel: Nichtparametrische Datenanalyse - unverbundene Stichproben, Springer, ISBN 3-540-43375-9
W.J. Conover: Practical nonparametric Ststitsics, Wiley, 1980 (Standardverfahren mit einigen Zusatzinformationen)
M.L. Puri & P.K. Sen: Nonparametric Methods in General Linear Models, Wiley, Ney York, 1985 (schwer lesbar, aber Basis für neuere Methoden)

Haiko Lüpsen
Regionales Rechenzentrum der Universität zu Köln
21.2.2013