Szansa (statystyka)

Szansa (ang. odds) – w rachunku prawdopodobieństwa i statystyce, stosunek prawdopodobieństwa wystąpienia zdarzenia losowego do prawdopodobieństwa niewystąpienia tego zdarzenia[1]. Szansę S ( A ) {\displaystyle \mathbb {S} (A)} zdarzenia A {\displaystyle A} można wyznaczyć za pomocą wzoru:

S ( A ) = P ( A ) P ( nie  A ) = P ( A ) 1 P ( A ) {\displaystyle \mathbb {S} (A)={\frac {\mathbb {P} (A)}{\mathbb {P} ({\text{nie }}A)}}={\frac {\mathbb {P} (A)}{1-\mathbb {P} (A)}}} .

Przekształcenie odwrotne wygląda następująco:

P ( A ) = S ( A ) 1 + S ( A ) {\displaystyle \mathbb {P} (A)={\frac {\mathbb {S} (A)}{1+\mathbb {S} (A)}}} .

Szansa może również zostać obliczona dla konkretnej próby. Wówczas stosuje się zaobserwowane w próbie częstości zamiast odpowiednich prawdopodobieństw[2].

Dla prawdopodobieństw (i częstości) z przedziału ( 0 , 1 ) {\displaystyle (0,1)} szansa przyjmuje wartości z przedziału ( 0 , + ) . {\displaystyle (0,+\infty ).}

Zapis

Szansę można zapisać w formie stosunku m:n, np. 5:1. W przypadku takiego zapisu m może być liczbą jednakowo prawdopodobnych sposobów osiągnięcia sprzyjającego rezultatu, zaś n liczbą sposobów osiągnięcia niesprzyjającego rezultatu. Zaleca się jednak zapisywać szanse w jak najprostszy sposób, np. 3:2 zamiast 6:4[1].

W epidemiologii, a także w innych zastosowaniach statystycznych, szansa jest często wyrażana w postaci pojedynczej liczby, np. szansa 1,5 oznacza stosunek 1,5:1 (3:2).

Wykorzystanie

Logarytm szansy (funkcja logitowa) wykorzystywany jest w regresji logistycznej. Logarytm szansy może przyjmować wartości z przedziału ( , + ) {\displaystyle (-\infty ,+\infty )} , co ułatwia zastosowanie uogólnionego modelu liniowego.

Iloraz szans to miara wielkości efektu stosowana, gdy porównywane są dwie frakcje (prawdopodobieństwa lub częstości dwóch zdarzeń), czyli gdy dane można przedstawić w tabeli krzyżowej o wymiarach 2 × 2[3]. Szanse i ilorazy szans wykorzystuje się często w epidemiologii[1].

Twierdzenie Bayesa można zapisać z wykorzystaniem szans i czynnika Bayesa[4].

Podawanie informacji o rozkładzie prawdopodobieństwa w postaci szansy, z wykorzystaniem zapisu m:n (najczęściej m:1), jest popularne w przypadku gier hazardowych, szczególnie w świecie anglosaskim.

Przypisy

  1. a b c AndrzejA. Stanisz AndrzejA., Modele regresji logistycznej. Zastosowania w medycynie, naukach przyrodniczych i społecznych, Wydawnictwo StatSoft Polska, 2016, s. 37, ISBN 978-83-88724-73-2 .
  2. AlanA. Agresti AlanA., Categorical Data Analysis, Hoboken, New Jersey: John Wiley & Sons, 2013, ISBN 978-0-470-46363-5  (ang.).
  3. SusanS. Chinn SusanS., A simple method for converting an odds ratio to effect size for use in meta-analysis, „Statistics in Medicine”, 19 (22), 2000, s. 3127–3131, DOI: 10.1002/1097-0258(20001130)19:22<3127::AID-SIM784>3.0.CO;2-M, ISSN 0277-6715 [dostęp 2024-02-27]  (ang.).
  4. XeniaX. Schmalz XeniaX., José BiurrunJ.B. Manresa José BiurrunJ.B., LeiL. Zhang LeiL., What is a Bayes factor?, „Psychological Methods”, 28 (3), 2023, s. 705–718, DOI: 10.1037/met0000421, ISSN 1939-1463 [dostęp 2024-02-27]  (ang.).
Encyklopedia internetowa (stosunek):
  • Britannica: topic/odds
  • SNL: odds
  • DSDE: odds