Wariancja to w statystyce klasyczna miara zmienności. Intuicyjnie utożsamiana ze zróżnicowaniem zbiorowości; jest średnią arytmetyczną kwadratów odchyleń (różnic) poszczególnych wartości cechy od wartości oczekiwanej.
Wariancja zmiennej losowej
, oznaczana jako
lub
, zdefiniowana jest wzorem:
,gdzie:
jest wartością oczekiwaną zmiennej losowej podanej w nawiasach kwadratowych,
jest wartością oczekiwaną zmiennej
.Innym, często prostszym sposobem wyznaczania wariancji jest wzór:
.Wariancja jest momentem centralnym drugiego rzędu zmiennej losowej.
Jeżeli ponadto
oraz
jest σ-ciałem zdarzeń, to wariancją warunkową nazywamy:

Spis treści |
Wariancję dla szeregu szczegółowego wyznacza się ze wzoru:

a dla szeregu rozdzielczego:

Wariancja próby losowej o wartościach
, gdzie
, jest następująca:

Wariancję dla populacji można estymować za pomocą n-elementowej próby losowej. Estymator największej wiarygodności:

jest zgodnym lecz obciążonym estymatorem wariancji (jest nieobciążony asymptotycznie). Innymi słowy, gdybyśmy z populacji losowali próbkę wielokrotnie i obliczali jego wyniki, to ich średnia nie byłaby równa wariancji w całej populacji. Dlatego też częściej używa się również zgodnego, lecz nieobciążonego estymatora:

W przypadku, gdy znamy dokładną wartość oczekiwaną
w populacji, wówczas estymator

jest już nieobciążony i zgodny.
Dla zmiennych losowych
,
i dowolnych stałych a, b, c zachodzą następujące własności:




, gdy
i
są nieskorelowane
w ogólnym przypadku; (gdzie
to kowariancja)Pierwiastek kwadratowy z wariancji definiujemy jako odchylenie standardowe.
Pierwiastek z estymatora nieobciążonego wariancji jest często używany jako estymator odchylenia standardowego, jednak jest wówczas obciążony (zobacz odchylenie standardowe).