Professional Documents
Culture Documents
Raport 4
Raport 4
Alicja Jordan
2023-11-24
gdzie:
- µ1 , µ2 to odpowiednio średnie pierwszej i drugiej próby,
- σ12 , σ22 to odpowiednio wariancje pierwszej i drugiej próby,
- n1 , n2 to odpowiednio liczności pierwszej i drugiej próby,
- zα/2 to kwantyl rozkładu normalnego dla poziomu ufności 1 − α/2.
Uzasadnienie
Rozważamy dwie niezależne próby losowe z populacji o rozkładzie normalnym, przy czym wariancje obu
populacji są znane i oznaczone jako σ12 oraz σ22 . Celem jest oszacowanie przedziału ufności dla różnicy
średnich (µ1 − µ2 ) na poziomie ufności 1 − α.
Rozpoczynamy od założenia, że różnica średnich ma rozkład normalny, co jest uzasadnione zastosowaniem
centralnego twierdzenia granicznego dla odpowiednio dużych prób. Ponadto, przyjmuje się równość wariancji
w obu populacjach (σ12 = σ22 ), co umożliwia skorzystanie z testu z rozkładem normalnym dla różnicy średnich.
Załóżmy, że µ1 i µ2 to średnie prób pierwszej i drugiej odpowiednio, n1 i n2 to liczności prób, a zα/2 to
kwantyl rozkładu normalnego dla poziomu ufności 1−α/2. Ostateczny przedział ufności dla różnicy średnich
można wyrazić wzorem:
s
σ12 σ2
(µ1 − µ2 ) ± zα/2 + 2
n1 n2
Przyjęcie tego przedziału ufności opiera się na założeniu, że różnica średnich jest statystycznie istotna, jeżeli
zero nie zawiera się w przedziale ufności. Zakładając normalność rozkładu różnicy średnich oraz znane
wariancje, przedstawiony przedział ufności stanowi adekwatne narzędzie do estymacji i testowania hipotez
dotyczących różnic między dwiema populacjami.
1
Ekperyment numeryczny
Obserwacje i wnioski
• W przypadku dwóch próbek z tego samego rozkładu normalnego (N (0, 1)), przedział ufności dla
różnicy średnich zawiera 0, co jest spodziewanym rezultatem, ponieważ obie próbki są z tego samego
rozkładu.
• W przypadku dla próbek N (0, 1) i N (1, 2) przedział ufności nie zawiera zera, co sugeruje istotną
statystycznie różnicę między nimi.
• Dla dwóch próbek z rozkładu logistycznego (L(0, 1)), przedział ufności dla różnicy średnich ponownie
obejmuje zero, co jest zgodne z oczekiwaniami, ponieważ obie próbki pochodzą z tego samego rozkładu.
• W przypadku dla próbek L(0, 1) i L(1, 2) przedział ufności również nie zawiera zera, co ponownie
sugeruje istotną statystycznie różnicę między nimi.
Uwzgędniając fakt, że krótsze przedziały ufności odpowiadają bardziej precyzyjnym oszacowaniom, można
zauważyć, że nasze oszacowania są mniej precyzyjne w przypadku podpunktu (b) niż (d). W obu przypadkach
występuje istotna statystycznie różnica między badanymi rozkładami, co potwierdzają przedziały ufności,
które nie zawierają zera. Jednak długość przedziałów ufności wskazuje, że oszacowania różnic są mniej
precyzyjne w przypadku (b) niż w przypadku (d).
Następnie doświadczenie powtarzamy 10 000 razy. Oszacujemy prawdopodobieństwo pokrycia nieznanego
parametru przez przedział ufności oraz jego długość. Wyniki przedstawiamy w poniższej tabeli:
Obserwacje i wnioski
2
• W przypadku dwóch próbek z tego samego rozkładu normalnego (N (0, 1)) mamy prawdopodobieństwo
pokrycia bliskie 95%, czego oczekiwaliśmy. Ponadto średnia długość przedziałów jest stosunkowo niska,
co sugeruje precyzyjne oszacowanie.
• W przypadku rozkładów N (0, 1) i N (1, 2) mamy prawdopodobieństwo pokrycia większe niż 95%,
jednakże średnia długość przedziałów jest większa - oszacowania są mniej precyzyjne niż w pierwszym
przypadku.
• Dla dwóch próbek z rozkładu logistycznego (L(0, 1)) mamy prawdopodobieństwo pokrycia bliskie
95%, średnia długość przedziałów może sugerować pewną niepewność, jednakże nie na tyle istotną, by
oszacowania nie były stosunkowo precyzyjne.
gdzie:
- µ1 , µ2 to odpowiednio średnie pierwszej i drugiej próby,
- s21 , s22 to odpowiednio estymatory wariancji pierwszej i drugiej próby,
- n1 , n2 to odpowiednio liczności pierwszej i drugiej próby,
- tα/2 to kwantyl t-rozkładu o (1 − α/2)-tym percentylu, obliczany na podstawie stopni swobody zas-
tosowanego w testach Welch’a.
Uzasadnienie
Rozważamy dwie niezależne próby losowe pochodzące z populacji o rozkładzie normalnym, gdzie wariancje
obu populacji są nieznane i różne, oznaczone odpowiednio jako σ12 i σ22 . Celem jest oszacowanie przedziału
ufności dla różnicy średnich (µ1 − µ2 ) na poziomie ufności 1 − α.
Rozpoczynamy analizę od założenia, że różnica średnich populacji ma rozkład t-rozkładu, co wynika z
zastosowania centralnego twierdzenia granicznego dla odpowiednio dużych prób. W sytuacji, gdy wariancje
są nieznane i różne, zastosowana jest metodyka Welch’a, co prowadzi do modyfikacji wzoru przedziału
ufności.
Zakładając, że µ1 i µ2 to odpowiednio średnie prób pierwszej i drugiej, a s21 i s22 to estymatory wariancji,
możemy skonstruować przedział ufności w następujący sposób:
s
s21 s2
(µ1 − µ2 ) ± tα/2,df + 2
n1 n2
3
gdzie n1 i n2 to liczności prób, tα/2,df to kwantyl t-rozkładu o (1 − α/2)-tym percentylu, a df to dostosowane
do sytuacji stopnie swobody.
Zastosowanie metody Welch’a umożliwia elastyczne uwzględnienie różnic w wariancjach między populacjami,
co wpływa na dokładność przedziału ufności. Estymatory wariancji s21 i s22 zastępują rzeczywiste wartości
wariancji, co czyni procedurę bardziej odporną na ewentualne nieregularności w danych.
Ostateczny przedział ufności oparty jest na wartościach średnich, estymatorach wariancji, licznościach prób
oraz odpowiednim kwantylu t-rozkładu. Przyjęcie tego przedziału ufności opiera się na założeniu, że różnica
średnich jest statystycznie istotna, jeżeli zero nie zawiera się w przedziale ufności. Uzyskany przedział stanowi
skuteczne narzędzie statystyczne do estymacji i testowania hipotez dotyczących różnic między dwiema pop-
ulacjami, szczególnie w sytuacji nieznanych i różnych wariancji.
Eksperyment numeryczny
dla parametru µ1 −µ2 na poziomie ufności 1−α = 0.95 oraz jego długość. Wyniki przedstawiamy w poniższej
tabeli:
Obserwacje i wnioski
• W przypadku (a) i (c), gdzie obie próbki pochodzą z tego samego rozkładu, przedziały ufności
zawierają zero, co jest spodziewanym wynikiem.
• W przypadku (b) i (d), gdzie rozważane są różne rozkłady, przedziały ufności nie zawierają zera, co
sugeruje statystyczną istotność różnic między grupami.
Można wyciągnąć wniosek, że dla różnych rozkładów (b i d), istnieją statystycznie istotne różnice między
grupami, ale oszacowania są mniej precyzyjne niż dla tych samych rozkładów (a i c). Długość przedziałów
ufności stanowi miarę tej precyzji.
Następnie doświadczenie powtarzamy 10 000 razy. Oszacujemy prawdopodobieństwo pokrycia nieznanego
parametru przez przedział ufności oraz jego długość. Wyniki przedstawiamy w poniższej tabeli:
4
Rozkłady Prawdopodobieństwo pokrycia Długość przedziału
N (0, 1) i N (0, 1) 0.9515 0.7925525
N (0, 1) i N (1, 2) 0.9736 1.2577454
L(0, 1) i L(0, 1) 0.9521 1.4351481
L(0, 1) i L(1, 2) 0.9758 2.2760484
Obserwacje i wnioski
• Długość przedziałów ufności stanowi miarę precyzji oszacowań, a wyniki wskazują umiarkowaną pre-
cyzję dla rozkładów normalnych oraz pewną niepewność dla rozkładów logistycznych, zwłaszcza w
przypadku (d).
s21 1 σ2 s2
2 · ≤ 12 ≤ 12 · Fα/2,df2 ,df1
s2 Fα/2,df1 ,df2 σ2 s2
gdzie:
- s21 , s22 to estymatory wariancji pierwszej i drugiej próby,
- σ12 , σ22 to odpowiednio wariancje pierwszej i drugiej populacji,
- Fα/2,df1 ,df2 to kwantyl rozkładu F dla poziomu ufności 1 − α/2 z df1 i df2 stopniami swobody.
Uzasadnienie
Rozważamy dwie niezależne próby losowe z populacji o rozkładzie normalnym, przy czym wariancje obu
populacji są nieznane i oznaczone jako σ12 oraz σ22 . Celem jest oszacowanie przedziału ufności dla ilorazu
σ2
wariancji ( σ12 ) na poziomie ufności 1 − α.
2
Przyjęcie tego przedziału ufności opiera się na założeniu, że iloraz wariancji jest statystycznie istotny, jeżeli
σ2
wartość σ12 zawiera się w przedziale ufności. Zakładając normalność rozkładu ilorazu wariancji oraz nieznane
2
wariancje, przedstawiony przedział ufności stanowi adekwatne narzędzie do estymacji i testowania hipotez
dotyczących stosunku wariancji między dwiema populacjami.
5
Eksperyment numeryczny
s21 1 σ2 s2
2 · ≤ 12 ≤ 12 · Fα/2,df2 ,df1
s2 Fα/2,df1 ,df2 σ2 s2
σ12
dla parametru σ22
na poziomie ufności 1 − α = 0.95 oraz jego długość. Wyniki przedstawiamy w poniższej
tabeli:
Wnioski i obserwacje
• Dla (a) i (c), gdzie obie próbki pochodzą z tego samego rozkładu, przedziały ufności zawierają 1, co
sugeruje brak statystycznie istotnej różnicy w wariancjach.
• Dla (b) i (d), gdzie rozważane są różne rozkłady, przedziały ufności nie zawierają 1, co wskazuje na
statystycznie istotną różnicę w wariancjach.
• Długość przedziałów ufności stanowi miarę precyzji oszacowań, a wyniki wskazują na umiarkowaną do
pewnej precyzji w oszacowaniach różnicy wariancji w badanych przypadkach.
Metoda Delta
Metoda Delta, znana również jako technika propagacji błędów, jest narzędziem matematycznym używanym
do szacowania błędów lub niepewności w wynikach pomiarów lub obliczeń, które zależą od wielu zmiennych.
Jest szczególnie przydatna w sytuacjach, gdzie mamy funkcję wielu zmiennych i chcemy oszacować, jak błąd
w tych zmiennych wpływa na błąd w wyniku funkcji.
Rozważmy funkcję Y = f (X1 , X2 , . . . , Xn ), gdzie X1 , X2 , . . . , Xn to zmienne niezależne o pewnych błędach
lub niepewnościach. Metoda Delta pozwala oszacować błąd standardowy σY wyniku Y w oparciu o błędy
standardowe σX1 , σX2 , . . . , σXn zmiennych niezależnych.
W przypadku funkcji jednej zmiennej (n = 1), ogólna formuła Metody Delta wygląda następująco:
s 2 2 2
∂f ∂f ∂f
σY = σX + σX + ... + σX
∂X1 1 ∂X2 2 ∂Xn n
gdzie ∂f
∂Xi to pochodna cząstkowa funkcji f względem zmiennej Xi .
Jeśli mamy funkcję dwóch zmiennych (n = 2), wzór ten upraszcza się do:
6
s 2 2
∂f ∂f
σY = σX + σX
∂X1 1 ∂X2 2
Metoda Delta potencjalnie znajduje zastosowanie w konstrukcji przedziałów ufności poprzez wykorzystanie
oszacowanych błędów standardowych do określenia przedziałów wokół wartości funkcji. Przy założeniu
normalności zmiennych, możemy użyć rozkładu normalnego do określenia przedziałów ufności. W praktyce,
stosujemy kwantyle tego rozkładu do zakresu wartości oszacowanej wraz z błędem standardowym, co pozwala
uzyskać przedział ufności zawierający prawdziwą wartość funkcji z określonym poziomem ufności.