Test Wilcoxona dla par obserwacji

Test Wilcoxona dla par obserwacjinieparametryczna alternatywa dla testu t-Studenta dla przypadku dwóch równolicznych prób dających się połączyć w pary. Często używa się tego testu do porównywania danych zebranych przed i po eksperymencie w celu zbadania, czy nastąpiła istotna statystycznie zmiana.

Porównanie z testem t-Studenta

edytuj

O ile test t-Studenta sprawdza hipotezę zerową o równości średnich arytmetycznych w odpowiadających im populacjach, test Wilcoxona weryfikuje równość median.

Jak test t-Studenta, test Wilcoxona bazuje na różnicach między wartościami cech z porównywanych zbiorów, stąd również wymaga zmiennych na skali interwałowej. W przeciwieństwie jednak do testu t-Studenta nie posiada założeń dotyczących rozkładu próby. Może zatem być używany w sytuacjach, gdy założenia testu t-Studenta nie są spełnione.

Załóżmy, że zebraliśmy   obserwacji, po dwie dla każdego z n przypadków. Niech   będzie indeksem danego przypadku,   będzie pierwszą, a   drugą obserwacją przypadku  

Założenia

edytuj
  1. Niech   dla   Zakłada się, że różnice  niezależne.
  2. Każda różnica   pochodzi z populacji o identycznym ciągłym rozkładzie, symetryczny względem wspólnej mediany  

Wyliczanie statystyki Wilcoxona

edytuj

Testowaną hipotezą zerową jest:

 

Algorytm wyliczania statystyki testu Wilcoxona:

  • wyliczenie różnic  
  • uporządkowanie wartości bezwzględnych  
  • zrangowanie tak otrzymanego zbioru i oznaczenie rang przez   Rangi związane uzyskują wartość średnią.
  • zdefiniowanie statystyki   jako sumy rang   dla których  

Niekiedy wykonuje się dalsze kroki:

  • Analogicznie obliczana jest statystyka   czyli suma rang, dla których  
  • Statystyka   jest obliczana jako:
 

Właściwości statystyki Wilcoxona

edytuj

Właściwości statystyki  

 
 
  • Dla dowolnej liczby  
  gdy  

Do obliczenia wartości p dla prób o małej liczności (zwykle przyjmuje się  ) korzysta się z tablic statystycznych. Dla dużych prób używa się przybliżenia rozkładem normalnym, z parametrami podanymi wyżej.

Historia

edytuj

Twórcą testu był Frank Wilcoxon (1892–1965), który zaproponował go w jednym artykule (Wilcoxon, 1945) z innym testem, zwanym obecnie testem Manna-Whitneya (lub testem Wilcoxona dla dwóch prób).

Test Wilcoxona był spopularyzowany przez Siegla (1956) w jego wpływowym podręczniku statystyki nieparametrycznej. Siegel używał symbolu   dla wielkości oznaczanej powyżej przez   W konsekwencji test czasami jest nazywany testem T Wilcoxona, a statystyka testowa jest podawana jako wartość  

Bibliografia

edytuj
  • Jacek Koronacki, Jan Mielniczuk: Statystyka dla studentów kierunków technicznych i przyrodniczych. Warszawa: WNT, 2001, s. 467–471. ISBN 83-204-2684-7.
  • Sidney Siegel: Non-parametric statistics for the behavioral sciences. Nowy York: McGraw-Hill, 1956.
  • Frank Wilcoxon: Individual comparisons by ranking methods. Biometrics, 1945, s. 1, 80-83.

Linki zewnętrzne

edytuj

Implementacje

edytuj
  NODES
INTERN 1