Najważniejsze rozkłady zmiennych losowych
W statystyce i rachunku prawdopodobieństwa istnieje wiele różnych rozkładów zmiennych losowych, które opisują prawdopodobieństwo wystąpienia różnych zdarzeń losowych. Poniżej przedstawiono najczęściej występujące w praktyce rozkłady zmiennych losowych wraz z krótkim objaśnieniem dotyczącym typowych sytuacji, w których można się ich spodziewać.
Rozkład dwumianowy (Bernoulliego)
Rozkład dwumianowy, zwany także rozkładem Bernoulliego, opisuje liczbę sukcesów w serii $n$ niezależnych prób, z których każda kończy się sukcesem z prawdopodobieństwem $p$ lub porażką z prawdopodobieństwem $1-p$. Zmienną losową $S_n$, której rozkład określony jest przez:
$$ P\{S_n = k\} = \binom{n}{k} p^k (1-p)^{n-k} \qquad (k = 0, 1, ..., n) $$
nazywamy zmienną losową o rozkładzie dwumianowym. Rozkład ten znajduje zastosowanie w sytuacjach, gdzie interesuje nas liczba sukcesów, takich jak liczba trafień w rzucie monetą, liczba zrealizowanych zamówień lub liczba osób pozytywnie odpowiadających na ankietę.
Rozkład Poissona
Rozkład Poissona opisuje liczbę zdarzeń rzadkich występujących w jednostce czasu lub przestrzeni. Zmienna losowa $X$ ma rozkład Poissona, jeśli dla pewnej liczby $\lambda > 0$ prawdopodobieństwo, że $X$ przyjmie wartość $k$, jest dane wzorem:
$$ P\{X = k\} = \frac{\lambda^k}{k!}e^{-\lambda} \qquad (k = 0, 1, ...) $$
Rozkład Poissona stosuje się do modelowania zdarzeń, które są rzadkie i niezależne od siebie, takich jak liczba wypadków drogowych w ciągu dnia, liczba pożarów w mieście w ciągu miesiąca, liczba cząstek emitowanych przez źródło promieniowania w jednostce czasu, czy liczba telefonów otrzymywanych przez centralę w danym okresie.
Rozkład geometryczny
Rozkład geometryczny opisuje liczbę prób potrzebnych do uzyskania pierwszego sukcesu w serii niezależnych prób Bernoulliego, w których sukces występuje z prawdopodobieństwem $p$. Zmienna losowa $X$ ma rozkład geometryczny, jeśli:
$$ P\{X = k\} = (1-p)^k p \qquad (0 < p < 1, \; k = 0, 1, 2, ...) $$
Typowym przykładem zastosowania rozkładu geometrycznego jest modelowanie liczby rzutów kostką do momentu uzyskania pierwszej szóstki lub liczby dni potrzebnych do zakończenia projektu, gdy każdy dzień ma określoną szansę na zakończenie prac.
Rozkład hipergeometryczny
Rozkład hipergeometryczny opisuje liczbę sukcesów w próbce pobranej bez zwracania z populacji skończonej. Zmienna losowa $X$ ma rozkład hipergeometryczny, jeśli prawdopodobieństwo uzyskania dokładnie $k$ sukcesów jest dane wzorem:
$$ P\{X = k\} = \frac{\binom{m}{k} \binom{N-m}{n-k}}{\binom{N}{n}} $$
gdzie $N$ to liczba wszystkich elementów w populacji, $m$ to liczba elementów posiadających interesującą cechę, $n$ to liczba elementów w próbce, a $k$ to liczba sukcesów. Rozkład hipergeometryczny jest używany w badaniach statystycznych, na przykład do modelowania liczby wybranych osób, które spełniają określone kryterium, w próbce pobranej z większej populacji.
Rozkład normalny
Rozkład normalny, zwany również rozkładem Gaussa, jest jednym z najważniejszych rozkładów w statystyce. Opisuje on zmienne losowe ciągłe, które są wynikiem działania wielu niezależnych czynników, z których każdy ma niewielki efekt. Zmienna losowa $X$ ma rozkład normalny, jeśli jej funkcja gęstości prawdopodobieństwa $f(x)$ jest dana wzorem:
$$ f(x) = \frac{1}{\sigma\sqrt{2\pi}} e^{-\frac{(x-\mu)^2}{2\sigma^2}} $$
gdzie $\mu$ jest średnią, a $\sigma$ jest odchyleniem standardowym. Rozkład normalny jest powszechnie używany w przypadku danych, które mają tendencję do układania się w kształt dzwonu, takich jak wzrost ludzki, błędy pomiaru czy wyniki testów.
Rozkład wykładniczy
Rozkład wykładniczy opisuje czas lub odległość między zdarzeniami w procesie Poissona. Zmienna losowa $X$ ma rozkład wykładniczy, jeśli jej funkcja gęstości prawdopodobieństwa $f(x)$ jest dana wzorem:
$$ f(x) = \begin{cases} ae^{-ax} & \text{dla} \; x \geq 0 \\ 0 & \text{dla} \; x < 0 \end{cases} $$
gdzie $a > 0$. Rozkład wykładniczy jest często używany do modelowania czasu życia urządzeń, takich jak sprzęt elektroniczny lub komponenty mechaniczne, gdzie prawdopodobieństwo awarii w danym okresie czasu jest stałe i nie zależy od tego, jak długo urządzenie już pracowało.
Zastosowania rozkładów zmiennych losowych
Rozkłady zmiennych losowych znajdują szerokie zastosowanie w statystyce, naukach przyrodniczych, ekonomii, inżynierii oraz naukach społecznych. Pozwalają one na modelowanie i analizę zjawisk losowych, przewidywanie przyszłych wyników oraz podejmowanie decyzji w warunkach niepewności. Znajomość różnych rozkładów zmiennych losowych i ich właściwości jest kluczowa dla każdego, kto zajmuje się analizą danych i statystyką.