Test Wilcoxona dla par obserwacji
Z Wikipedii
Test Wilcoxona dla par obserwacji jest nieparametryczną alternatywą dla testu t-Studenta dla przypadku dwóch równolicznych próbek dających się połączyć w pary. Często używa się tego testu do porównywania danych zebranych przed i po eksperymencie, w celu zbadania, czy nastąpiła istotna statystycznie zmiana.
Spis treści |
[edytuj] Porównanie z testem t-Studenta
O ile test t-Studenta sprawdza hipotezę zerową o równości średnich arytmetycznych w odpowiadających im populacjach, test Wilcoxona weryfikuje równość median.
Tak jak test t-Studenta, test Wilcoxona bazuje na różnicach pomiędzy wartościami cech z porównywanych zbiorów, stąd również wymaga zmiennych na skali interwałowej. W przeciwieństwie jednak do testu t-Studenta, nie posiada założeń dotyczących rozkładu próby. Może zatem być używany w sytuacjach, gdy założenia testu t-Studenta nie są spełnione.
[edytuj] Dane
Załóżmy, że zebraliśmy 2n obserwacji, po dwie dla każdego z n przypadków. Niech i będzie indeksem danego przypadku, xi będzie pierwszą, a yi drugą obserwacją przypadku i.
[edytuj] Założenia
- Niech
dla
. Zakłada się, że różnice
są niezależne.
- Każda różnica
pochodzi z populacji o identycznym ciągłym rozkładzie, symetryczny względem wspólnej mediany
[edytuj] Wyliczanie statystyki Wilcoxona
Testowaną hipotezą zerową jest:
Algorytm wyliczania statystyki testu Wilcoxona:
- Wyliczenie różnic di
- Uporządkowanie wartości bezwzględnych
- Rangowanie tak otrzymanego zbioru. Oznaczamy rangi przez Ri. Rangi związane uzyskują wartość średnią (zob. ranga).
- Statystyka W + jest zdefiniowana jako suma rang Ri dla których di > 0
Niekiedy wykonuje się dalsze kroki:
- Analogicznie obliczana jest statystyka W − , czyli suma rang dla których di < 0
- Statystyka S jest obliczana jako:
[edytuj] Właściwości statystyki Wilcoxona
Właściwości statystyki W + :
- Dla dowolnej liczby
:
gdy
Do obliczenia p-wartości dla prób o małej liczności (zwykle przyjmuje się ) korzysta się z tablic statystycznych. Dla dużych prób, używa się przybliżenia rozkładem normalnym, z parametrami podanymi powyżej.
[edytuj] Historia
Twórcą testu był Frank Wilcoxon (1892–1965), który zaproponował go w jednym artykule (Wilcoxon, 1945) z innym testem, zwanym obecnie testem Manna-Whitneya-Wilcoxona.
Test Wilcoxona był spopularyzowany przez Siegla (1956) w jego wpływowym podręczniku statystyki nieparametrycznej. Siegel używał symbolu T dla wielkości oznaczanej powyżej przez S. W konsekwencji test czasami jest nazywany testem T Wilcoxona, a statystyka testowa jest podawana jako wartość T.
[edytuj] Zobacz też
- test t-Studenta
- test Manna-Whitneya-Wilcoxona (wersja dla dwóch próbek)
- test znaków
[edytuj] Źródła
- Jacek Koronacki, Jan Mielniczuk: Statystyka dla studentów kierunków technicznych i przyrodniczych. Warszawa: WNT, 2001, ss. 467-471.
- Sidney Siegel: Non-parametric statistics for the behavioral sciences. Nowy York: McGraw-Hill, 1956.
- Frank Wilcoxon: Individual comparisons by ranking methods. Biometrics, 1945, ss. 1, 80-83. .
[edytuj] Linki zewnętrzne
- (en) Metoda wyliczania p dla testu Wilcoxona
- (en) Przykład zastosowania testu Wilcoxona
- (en) Wersja testu online
[edytuj] Implementacje
- ALGLIB zawiera implementację testu Wilcoxona w C++, C#, Delphi, Visual Basicu, itp.