Wariancja

parametr zmiennych losowych

Wariancja – miara zmienności zmiennej losowej będąca wartością oczekiwaną kwadratu różnicy wartości zmiennej losowej X i jej wartości oczekiwanej[1]. W statystyce opisowej obliczana jest jako średnia arytmetyczna kwadratów odchyleń (różnic) poszczególnych wartości cechy od średniej[2].

Wariancja zmiennej losowej oznaczana jako lub zdefiniowana jest wzorem[1]:

gdzie:

jest wartością oczekiwaną zmiennej losowej podanej w nawiasach kwadratowych,
jest wartością oczekiwaną zmiennej

Innym, często prostszym, sposobem wyznaczania wariancji jest wzór:

Wariancja jest momentem centralnym drugiego rzędu zmiennej losowej.

Jeżeli ponadto oraz jest σ-ciałem zdarzeń, to wariancją warunkową nazywamy:

Statystyka opisowa

edytuj

Jako jedna z najpopularniejszych miar w statystyce opisowej służąca do opisu danego kompletnego zbioru danych[3], wariancja zdefiniowana jest dla zbioru obserwacji z cechą   wzorem[2]:

 

gdzie   oznacza średnią wartość cechy, a   liczebność zbioru.

Wyrażona jest w jednostkach miary badanej cechy podniesionych do kwadratu[4].

Dane pogrupowane

edytuj

W przypadku obliczania wariancji dla danych pogrupowanych w postaci szereg rozdzielczego punktowego, wykorzystuje się wzory[5]:

 

gdzie   oznacza liczbę klas szeregu punktowego,   – liczebność i-tej klasy, a   – liczebność całej zbiorowości (odpowiednik   we wzorze powyżej).

W przypadku szeregu rozdzielczego przedziałowego za wartość   przyjmuje się środki poszczególnych przedziałów  [6]:

 

Ze względu na przyjęcie jako reprezentacji przedziałów wartości środkowych   wariancja liczona według powyższego wzoru jest przybliżeniem wariancji dla danych kompletnych[7].

Estymatory

edytuj

Wariancja próby losowej o wartościach   gdzie   jest następująca:

 

Wariancję dla populacji można estymować za pomocą n-elementowej próby losowej. Estymator największej wiarygodności:

 

jest zgodnym, lecz obciążonym estymatorem wariancji (jest nieobciążony asymptotycznie). Innymi słowy, gdybyśmy z populacji losowali próbkę wielokrotnie i obliczali jego wyniki, to ich średnia nie byłaby równa wariancji w całej populacji. Dlatego też częściej używa się również zgodnego, lecz nieobciążonego estymatora:

 

W przypadku, gdy znamy dokładną wartość oczekiwaną   w populacji, wówczas estymator

 

jest już nieobciążony i zgodny.

Własności wariancji

edytuj

Dla zmiennych losowych     i dowolnych stałych   zachodzą następujące własności:

1.  

Dowód. Korzystając z własności wartości oczekiwanej (wartość oczekiwana stałej jest równa tej stałej), mamy:

 

2.  

Dowód. Korzystamy z własności wartości oczekiwanej mówiącej o tym, że jeżeli zmienna losowa jest dodatnio określona prawie wszędzie to jej wartość oczekiwana jest dodatnia. Ponieważ zmienna losowa   jest dodatnio określona, mamy:

 

3.  

Dowód. Korzystając z definicji wariancji, a następnie z liniowości wartości oczekiwanej mamy:

 

4.  

Dowód. Korzystamy z własności wartości oczekiwanej mówiącej o tym, że   dla   stałej i z liniowości:

 

5.   w ogólnym przypadku; (gdzie   to kowariancja)

Dowód. Sprawdzone zostanie tylko twierdzenie dla sumy, twierdzenie dla różnicy rozwiązuje się analogicznie. Czyli mamy:

 

Korzystając z liniowości wartości oczekiwanej i definicji kowariancji, mamy:

 

Z powyższego twierdzenia łatwo wysnuć wniosek, że jeżeli zmienne   i   są niezależne, zachodzi:

 

Pierwiastek kwadratowy z wariancji definiujemy jako odchylenie standardowe.

Pierwiastek z estymatora nieobciążonego wariancji jest często używany jako estymator odchylenia standardowego, jednak jest wówczas obciążony (zobacz odchylenie standardowe).

Zobacz też

edytuj

Przypisy

edytuj
  1. a b Wariancja, [w:] Encyklopedia PWN [online], Wydawnictwo Naukowe PWN [dostęp 2023-03-25].
  2. a b Mirosław Krzysztofiak, Andrzej Luszniewicz, Statystyka, Warszawa: Państwowe Wydawnictwo Ekonomiczne, 1976, s. 131.
  3. Ewa Wasilewska, Statystyka opisowa od podstaw. Podręcznik z zadaniami, Warszawa: Wydawnictwo SGGW, 2009, s. 165–166, ISBN 978-83-7583-172-6.
  4. Ewa Wasilewska, Statystyka opisowa od podstaw. Podręcznik z zadaniami, Warszawa: Wydawnictwo SGGW, 2009, s. 163, ISBN 978-83-7583-172-6.
  5. Ewa Wasilewska, Statystyka opisowa od podstaw. Podręcznik z zadaniami, Warszawa: Wydawnictwo SGGW, 2009, s. 233–234, ISBN 978-83-7583-172-6.
  6. Ewa Wasilewska, Statystyka opisowa od podstaw. Podręcznik z zadaniami, Warszawa: Wydawnictwo SGGW, 2009, s. 239, ISBN 978-83-7583-172-6.
  7. Ewa Wasilewska, Statystyka opisowa od podstaw. Podręcznik z zadaniami, Warszawa: Wydawnictwo SGGW, 2009, s. 241, ISBN 978-83-7583-172-6.

Bibliografia

edytuj
  • W. Krysicki, J. Bartos, W. Dyczka, K. Królikowska, M. Wasilewski: Rachunek prawdopodobieństwa i statystyka matematyczna w zadaniach, część 2. Statystyka matematyczna. Warszawa: Wydawnictwo Naukowe PWN, 2006, s. 48. ISBN 83-01-14292-8.
  • Jacek Jakubowski, Rafał Sztencel: Wstęp do teorii prawdopodobieństwa. Warszawa: Script, 2004, s. 84. ISBN 83-89716-01-1.
  NODES
INTERN 1