Zmienne losowe

Zmienne losowe są podstawowym pojęciem w rachunku prawdopodobieństwa i statystyce. Reprezentują one wielkości liczbowe, które opisują wynik zjawiska losowego. Zmienna losowa $X$ to funkcja, która przypisuje każdemu możliwemu wynikowi zjawiska losowego liczbę rzeczywistą. Intuicyjnie, zmienna losowa jest sposobem na ilościowe opisanie wyników zdarzeń losowych.

Definicja zmiennej losowej

Zmienną losową $X$ nazywamy wielkość liczbową zależną od przypadku, taką, że dla dowolnych stałych $a < b$ określone jest prawdopodobieństwo, że $X$ przybierze wartość z przedziału $(a, b)$. Wyznaczenie rozkładu zmiennej losowej $X$ polega na określeniu wartości prawdopodobieństw, że zmienna losowa przyjmuje wartości w różnych przedziałach.

Dystrybuanta zmiennej losowej

Rozkład zmiennej losowej często opisuje się za pomocą funkcji zwanej dystrybuantą. Dystrybuanta $F(x)$ zmiennej losowej $X$ jest to funkcja niemalejąca, która dla każdej liczby rzeczywistej $x$ określa prawdopodobieństwo, że $X$ przyjmie wartość mniejszą lub równą $x$. Matematycznie jest to wyrażone jako:

$$ F(x) = P\{X \leq x\} $$

Funkcja $F(x)$ ma kilka kluczowych właściwości:

  • Funkcja $F(x)$ jest niemalejąca: jeśli $a \leq b$, to $F(a) \leq F(b)$.
  • Funkcja jest ograniczona: $0 \leq F(x) \leq 1$ dla każdego $x \in \mathbb{R}$.
  • $F(-\infty) = 0$ i $F(\infty) = 1$, co oznacza, że dystrybuanta zawsze zaczyna się od 0 i kończy na 1.

Dystrybuanta pozwala na łatwe wyznaczenie prawdopodobieństw, że zmienna losowa $X$ przyjmie wartość w danym przedziale, np.:

$$ P\{a < X \leq b\} = F(b) - F(a) $$

Typy zmiennych losowych

Zmienna losowa może być dyskretna lub ciągła, w zależności od tego, jakie wartości może przyjmować:

  • Zmienna losowa dyskretna: To zmienna losowa, która przyjmuje tylko skończoną lub przeliczalną nieskończoność różnych wartości. Typowym przykładem jest liczba wyrzuconych oczek w rzucie kostką. W przypadku zmiennych losowych dyskretnych rozkład opisuje się za pomocą funkcji zwanej funkcją masy prawdopodobieństwa (PMF - Probability Mass Function), która przypisuje każdej wartości zmiennej losowej prawdopodobieństwo jej wystąpienia.
  • Zmienna losowa ciągła: To zmienna losowa, która może przyjmować dowolną wartość z pewnego przedziału liczbowego. Przykładem jest wysokość osoby, czas oczekiwania na przystanku autobusowym lub inne wielkości mierzone w sposób ciągły. Rozkład zmiennej losowej ciągłej opisuje się za pomocą funkcji gęstości prawdopodobieństwa (PDF - Probability Density Function), która opisuje, jak prawdopodobieństwo jest "rozłożone" na wartościach zmiennej losowej.

Przykłady zmiennych losowych

Aby lepiej zrozumieć pojęcie zmiennych losowych, rozważmy kilka przykładów:

  • Zmienna losowa dyskretna: Rozważmy rzucanie sześcienną kostką do gry. Zmienna losowa $X$ oznaczająca liczbę wyrzuconych oczek może przyjmować wartości od 1 do 6. Prawdopodobieństwo uzyskania każdej z tych wartości jest równe $P(X = k) = \frac{1}{6}$ dla $k = 1, 2, 3, 4, 5, 6$.
  • Zmienna losowa ciągła: Wyobraźmy sobie losowe wybieranie punktu na odcinku o długości 1 jednostki. Zmienna losowa $Y$ oznaczająca odległość tego punktu od jednego końca odcinka może przyjmować dowolną wartość z przedziału $[0, 1]$. Funkcja gęstości prawdopodobieństwa jest tutaj stała i wynosi $f(y) = 1$ dla $y \in [0, 1]$.

Zastosowanie zmiennych losowych

Zrozumienie zmiennych losowych i ich rozkładów jest kluczowe dla wielu dziedzin nauki i techniki, w tym statystyki, finansów, fizyki i inżynierii. Umożliwiają one modelowanie zjawisk losowych i analizę danych, co jest podstawą do podejmowania decyzji w warunkach niepewności. W rachunku prawdopodobieństwa, zmienne losowe są podstawą do wyprowadzania wzorów i zasad, takich jak rozkład dwumianowy i wiele innych.

Zrozumienie pojęcia zmiennych losowych, ich typów oraz sposobów opisu rozkładów jest kluczowe dla każdego, kto zajmuje się analizą danych lub modelowaniem statystycznym. W kontekście bardziej zaawansowanych analiz, jak zmienne losowe dyskretne i zmienne losowe ciągłe, szczegółowe poznanie tych pojęć pozwala na dokładniejszą analizę wyników i modelowanie rzeczywistych procesów.