Download as pdf or txt
Download as pdf or txt
You are on page 1of 7

Raport_4

Alicja Jordan

2023-11-24

Przedział ufności dla różnicy dwóch średnich - znane wariancje


Aby podać przedział ufności dla różnicy dwóch średnich w modelu normalnym o znanych wariancjach,
możemy skorzystać z tzw. przedziału ufności z testu t. Zakładamy, że obie populacje mają rozkład normalny
i znane, ale równe wariancje.
Przedział ufności dla różnicy dwóch średnich przy założeniu normalności i znanych wariancji można przed-
stawić w następujący sposób:
s
σ12 σ2
(µ1 − µ2 ) ± zα/2 + 2
n1 n2

gdzie:
- µ1 , µ2 to odpowiednio średnie pierwszej i drugiej próby,
- σ12 , σ22 to odpowiednio wariancje pierwszej i drugiej próby,
- n1 , n2 to odpowiednio liczności pierwszej i drugiej próby,
- zα/2 to kwantyl rozkładu normalnego dla poziomu ufności 1 − α/2.
Uzasadnienie
Rozważamy dwie niezależne próby losowe z populacji o rozkładzie normalnym, przy czym wariancje obu
populacji są znane i oznaczone jako σ12 oraz σ22 . Celem jest oszacowanie przedziału ufności dla różnicy
średnich (µ1 − µ2 ) na poziomie ufności 1 − α.
Rozpoczynamy od założenia, że różnica średnich ma rozkład normalny, co jest uzasadnione zastosowaniem
centralnego twierdzenia granicznego dla odpowiednio dużych prób. Ponadto, przyjmuje się równość wariancji
w obu populacjach (σ12 = σ22 ), co umożliwia skorzystanie z testu z rozkładem normalnym dla różnicy średnich.
Załóżmy, że µ1 i µ2 to średnie prób pierwszej i drugiej odpowiednio, n1 i n2 to liczności prób, a zα/2 to
kwantyl rozkładu normalnego dla poziomu ufności 1−α/2. Ostateczny przedział ufności dla różnicy średnich
można wyrazić wzorem:
s
σ12 σ2
(µ1 − µ2 ) ± zα/2 + 2
n1 n2

Przyjęcie tego przedziału ufności opiera się na założeniu, że różnica średnich jest statystycznie istotna, jeżeli
zero nie zawiera się w przedziale ufności. Zakładając normalność rozkładu różnicy średnich oraz znane
wariancje, przedstawiony przedział ufności stanowi adekwatne narzędzie do estymacji i testowania hipotez
dotyczących różnic między dwiema populacjami.

1
Ekperyment numeryczny

Generujemy próby o n1 = 50 i n2 = 50 obserwacji z rozkładu:


(a) normalnego z parametrami µ1 = 0, σ1 = 1; µ2 = 0, σ2 = 1
(b) normalnego z parametrami µ1 = 0, σ1 = 1; µ2 = 1, σ2 = 2
(c) logistycznego z parametrami µ1 = 0, σ1 = 1; µ2 = 0, σ2 = 1
(d) logistycznego z parametrami µ1 = 0, σ1 = 1; µ2 = 1, σ2 = 2
Na ich podstawie wyznaczymy przedział ufności postaci
s
σ12 σ2
(µ1 − µ2 ) ± zα/2 + 2
n1 n2
dla parametru µ1 −µ2 na poziomie ufności 1−α = 0.95 oraz jego długość. Wyniki przedstawiamy w poniższej
tabeli:

Rozkłady Przedział ufności Długość przedziału


N (0, 1) i N (0, 1) [-0.3752691, 0.3415128] 0.7167819
N (0, 1) i N (1, 2) [-1.9296194, -0.6828286] 1.2467908
L(0, 1) i L(0, 1) [-0.3649925, 1.2345866] 1.5995791
L(0, 1) i L(1, 2) [-2.0450174, 0.0999096] 2.144927

Obserwacje i wnioski

• W przypadku dwóch próbek z tego samego rozkładu normalnego (N (0, 1)), przedział ufności dla
różnicy średnich zawiera 0, co jest spodziewanym rezultatem, ponieważ obie próbki są z tego samego
rozkładu.

• W przypadku dla próbek N (0, 1) i N (1, 2) przedział ufności nie zawiera zera, co sugeruje istotną
statystycznie różnicę między nimi.

• Dla dwóch próbek z rozkładu logistycznego (L(0, 1)), przedział ufności dla różnicy średnich ponownie
obejmuje zero, co jest zgodne z oczekiwaniami, ponieważ obie próbki pochodzą z tego samego rozkładu.

• W przypadku dla próbek L(0, 1) i L(1, 2) przedział ufności również nie zawiera zera, co ponownie
sugeruje istotną statystycznie różnicę między nimi.

Uwzgędniając fakt, że krótsze przedziały ufności odpowiadają bardziej precyzyjnym oszacowaniom, można
zauważyć, że nasze oszacowania są mniej precyzyjne w przypadku podpunktu (b) niż (d). W obu przypadkach
występuje istotna statystycznie różnica między badanymi rozkładami, co potwierdzają przedziały ufności,
które nie zawierają zera. Jednak długość przedziałów ufności wskazuje, że oszacowania różnic są mniej
precyzyjne w przypadku (b) niż w przypadku (d).
Następnie doświadczenie powtarzamy 10 000 razy. Oszacujemy prawdopodobieństwo pokrycia nieznanego
parametru przez przedział ufności oraz jego długość. Wyniki przedstawiamy w poniższej tabeli:

Rozkłady Prawdopodobieństwo pokrycia Długość przedziału


N (0, 1) i N (0, 1) 0.9463 0.7917825
N (0, 1) i N (1, 2) 0.9746 1.2576996
L(0, 1) i L(0, 1) 0.9528 1.4337699
L(0, 1) i L(1, 2) 0.975 2.2718775

Obserwacje i wnioski

2
• W przypadku dwóch próbek z tego samego rozkładu normalnego (N (0, 1)) mamy prawdopodobieństwo
pokrycia bliskie 95%, czego oczekiwaliśmy. Ponadto średnia długość przedziałów jest stosunkowo niska,
co sugeruje precyzyjne oszacowanie.
• W przypadku rozkładów N (0, 1) i N (1, 2) mamy prawdopodobieństwo pokrycia większe niż 95%,
jednakże średnia długość przedziałów jest większa - oszacowania są mniej precyzyjne niż w pierwszym
przypadku.

• Dla dwóch próbek z rozkładu logistycznego (L(0, 1)) mamy prawdopodobieństwo pokrycia bliskie
95%, średnia długość przedziałów może sugerować pewną niepewność, jednakże nie na tyle istotną, by
oszacowania nie były stosunkowo precyzyjne.

• W przypadku rozkładów logistycznych L(0, 1) i L(1, 2) prawdopodobieństwo pokrycia wynosi więcej


niż 95%, jednakże średnia długość przedziałów wskazuje na pewną niepewność w oszacowaniach, która
moża wynikać z większej zmienności mającej miejsce w tych rozkładach.

Podsumowując, eksperymenty sugerują wysokie prawdopodobieństwo pokrycia rzeczywistych różnic między


średnimi przez przedziały ufności, ale długość przedziałów może znacząco różnić się w zależności od badanych
rozkładów.

Przedział ufności dla różnicy dwóch średnich - nieznane wariancje


Aby podać przedział ufności dla różnicy dwóch średnich w modelu normalnym o nieznanych i różnych
wariancjach, stosujemy tzw. przedział ufności z testu t przy założeniu niezależności i normalności obu
populacji. W przypadku nieznanych i różnych wariancji używamy tzw. przybliżonego przedziału Welch’a.
Przedział ufności dla różnicy dwóch średnich przy założeniu normalności i nieznanych, różnych wariancjach
można przedstawić w następujący sposób:
s
s21 s2
(µ1 − µ2 ) ± tα/2 + 2
n1 n2

gdzie:
- µ1 , µ2 to odpowiednio średnie pierwszej i drugiej próby,
- s21 , s22 to odpowiednio estymatory wariancji pierwszej i drugiej próby,
- n1 , n2 to odpowiednio liczności pierwszej i drugiej próby,
- tα/2 to kwantyl t-rozkładu o (1 − α/2)-tym percentylu, obliczany na podstawie stopni swobody zas-
tosowanego w testach Welch’a.
Uzasadnienie
Rozważamy dwie niezależne próby losowe pochodzące z populacji o rozkładzie normalnym, gdzie wariancje
obu populacji są nieznane i różne, oznaczone odpowiednio jako σ12 i σ22 . Celem jest oszacowanie przedziału
ufności dla różnicy średnich (µ1 − µ2 ) na poziomie ufności 1 − α.
Rozpoczynamy analizę od założenia, że różnica średnich populacji ma rozkład t-rozkładu, co wynika z
zastosowania centralnego twierdzenia granicznego dla odpowiednio dużych prób. W sytuacji, gdy wariancje
są nieznane i różne, zastosowana jest metodyka Welch’a, co prowadzi do modyfikacji wzoru przedziału
ufności.
Zakładając, że µ1 i µ2 to odpowiednio średnie prób pierwszej i drugiej, a s21 i s22 to estymatory wariancji,
możemy skonstruować przedział ufności w następujący sposób:
s
s21 s2
(µ1 − µ2 ) ± tα/2,df + 2
n1 n2

3
gdzie n1 i n2 to liczności prób, tα/2,df to kwantyl t-rozkładu o (1 − α/2)-tym percentylu, a df to dostosowane
do sytuacji stopnie swobody.
Zastosowanie metody Welch’a umożliwia elastyczne uwzględnienie różnic w wariancjach między populacjami,
co wpływa na dokładność przedziału ufności. Estymatory wariancji s21 i s22 zastępują rzeczywiste wartości
wariancji, co czyni procedurę bardziej odporną na ewentualne nieregularności w danych.
Ostateczny przedział ufności oparty jest na wartościach średnich, estymatorach wariancji, licznościach prób
oraz odpowiednim kwantylu t-rozkładu. Przyjęcie tego przedziału ufności opiera się na założeniu, że różnica
średnich jest statystycznie istotna, jeżeli zero nie zawiera się w przedziale ufności. Uzyskany przedział stanowi
skuteczne narzędzie statystyczne do estymacji i testowania hipotez dotyczących różnic między dwiema pop-
ulacjami, szczególnie w sytuacji nieznanych i różnych wariancji.

Eksperyment numeryczny

Generujemy próby o n1 = 50 i n2 = 50 obserwacji z rozkładu:


(a) normalnego z parametrami µ1 = 0, σ1 = 1; µ2 = 0, σ2 = 1
(b) normalnego z parametrami µ1 = 0, σ1 = 1; µ2 = 1, σ2 = 2
(c) logistycznego z parametrami µ1 = 0, σ1 = 1; µ2 = 0, σ2 = 1
(d) logistycznego z parametrami µ1 = 0, σ1 = 1; µ2 = 1, σ2 = 2
Na ich podstawie wyznaczymy przedział ufności postaci
s
s21 s2
(µ1 − µ2 ) ± tα/2 + 2
n1 n2

dla parametru µ1 −µ2 na poziomie ufności 1−α = 0.95 oraz jego długość. Wyniki przedstawiamy w poniższej
tabeli:

Rozkłady Przedział ufności Długość przedziału


N (0, 1) i N (0, 1) [-0.115882, 0.6592951] 0.7751771
N (0, 1) i N (1, 2) [-1.4729988, -0.179821] 1.2931778
L(0, 1) i L(0, 1) [-1.1177574, 0.414419] 1.5321764
L(0, 1) i L(1, 2) [-2.9678244, -0.6733161] 2.2945083

Obserwacje i wnioski

• W przypadku (a) i (c), gdzie obie próbki pochodzą z tego samego rozkładu, przedziały ufności
zawierają zero, co jest spodziewanym wynikiem.

• W przypadku (b) i (d), gdzie rozważane są różne rozkłady, przedziały ufności nie zawierają zera, co
sugeruje statystyczną istotność różnic między grupami.

• Długość przedziałów ufności wskazuje, że oszacowania są umiarkowanie do mniej precyzyjne w przy-


padku (b) i (d), szczególnie w porównaniu do (a) i (c).

Można wyciągnąć wniosek, że dla różnych rozkładów (b i d), istnieją statystycznie istotne różnice między
grupami, ale oszacowania są mniej precyzyjne niż dla tych samych rozkładów (a i c). Długość przedziałów
ufności stanowi miarę tej precyzji.
Następnie doświadczenie powtarzamy 10 000 razy. Oszacujemy prawdopodobieństwo pokrycia nieznanego
parametru przez przedział ufności oraz jego długość. Wyniki przedstawiamy w poniższej tabeli:

4
Rozkłady Prawdopodobieństwo pokrycia Długość przedziału
N (0, 1) i N (0, 1) 0.9515 0.7925525
N (0, 1) i N (1, 2) 0.9736 1.2577454
L(0, 1) i L(0, 1) 0.9521 1.4351481
L(0, 1) i L(1, 2) 0.9758 2.2760484

Obserwacje i wnioski

• Eksperymenty sugerują wysokie prawdopodobieństwo pokrycia rzeczywistych różnic między średnimi


przez przedziały ufności.

• Długość przedziałów ufności stanowi miarę precyzji oszacowań, a wyniki wskazują umiarkowaną pre-
cyzję dla rozkładów normalnych oraz pewną niepewność dla rozkładów logistycznych, zwłaszcza w
przypadku (d).

Przedział ufności dla ilorazu dwóch wariancji - nieznane średnie


Aby podać przedział ufności dla ilorazu dwóch wariancji w modelu normalnym o nieznanych średnich,
możemy skorzystać z tzw. przedziału ufności z rozkładu F. Zakładamy, że obie populacje mają rozkład
normalny i nieznane, ale równe wariancje.
Przedział ufności dla ilorazu dwóch wariancji przy założeniu normalności i nieznanych wariancji można
przedstawić w następujący sposób:

s21 1 σ2 s2
2 · ≤ 12 ≤ 12 · Fα/2,df2 ,df1
s2 Fα/2,df1 ,df2 σ2 s2

gdzie:
- s21 , s22 to estymatory wariancji pierwszej i drugiej próby,
- σ12 , σ22 to odpowiednio wariancje pierwszej i drugiej populacji,
- Fα/2,df1 ,df2 to kwantyl rozkładu F dla poziomu ufności 1 − α/2 z df1 i df2 stopniami swobody.
Uzasadnienie
Rozważamy dwie niezależne próby losowe z populacji o rozkładzie normalnym, przy czym wariancje obu
populacji są nieznane i oznaczone jako σ12 oraz σ22 . Celem jest oszacowanie przedziału ufności dla ilorazu
σ2
wariancji ( σ12 ) na poziomie ufności 1 − α.
2

Rozpoczynamy od założenia, że iloraz wariancji ma rozkład F, co jest uzasadnione w modelu normalnym


dla odpowiednio dużych prób. Przyjmuje się, że wariancje obu populacji są nieznane, co skutkuje wykorzys-
taniem estymatorów wariancji (s21 , s22 ).
s2
Załóżmy, że s12 to estymator ilorazu wariancji dla prób pierwszej i drugiej. Ostateczny przedział ufności dla
2
ilorazu wariancji można wyrazić za pomocą kwantyli rozkładu F:

s21 1 σ12 s21


· ≤ ≤ · Fα/2,df2 ,df1
s22 Fα/2,df1 ,df2 σ22 s22

Przyjęcie tego przedziału ufności opiera się na założeniu, że iloraz wariancji jest statystycznie istotny, jeżeli
σ2
wartość σ12 zawiera się w przedziale ufności. Zakładając normalność rozkładu ilorazu wariancji oraz nieznane
2
wariancje, przedstawiony przedział ufności stanowi adekwatne narzędzie do estymacji i testowania hipotez
dotyczących stosunku wariancji między dwiema populacjami.

5
Eksperyment numeryczny

Generujemy próby o n1 = 50 i n2 = 50 obserwacji z rozkładu:


(a) normalnego z parametrami µ1 = 0, σ1 = 1; µ2 = 0, σ2 = 1
(b) normalnego z parametrami µ1 = 0, σ1 = 1; µ2 = 1, σ2 = 2
(c) logistycznego z parametrami µ1 = 0, σ1 = 1; µ2 = 0, σ2 = 1
(d) logistycznego z parametrami µ1 = 0, σ1 = 1; µ2 = 1, σ2 = 2
Na ich podstawie wyznaczymy przedział ufności postaci

s21 1 σ2 s2
2 · ≤ 12 ≤ 12 · Fα/2,df2 ,df1
s2 Fα/2,df1 ,df2 σ2 s2

σ12
dla parametru σ22
na poziomie ufności 1 − α = 0.95 oraz jego długość. Wyniki przedstawiamy w poniższej
tabeli:

Rozkłady Przedział ufności Długość przedziału


N (0, 1) i N (0, 1) [0.6178387, 1.9185799] 1.3007411
N (0, 1) i N (1, 2) [0.175099, 0.5437363] 0.3686373
L(0, 1) i L(0, 1) [0.6041179, 1.8759723] 1.2718544
L(0, 1) i L(1, 2) [0.1176503, 0.3653404] 0.2476901

Wnioski i obserwacje

• Dla (a) i (c), gdzie obie próbki pochodzą z tego samego rozkładu, przedziały ufności zawierają 1, co
sugeruje brak statystycznie istotnej różnicy w wariancjach.

• Dla (b) i (d), gdzie rozważane są różne rozkłady, przedziały ufności nie zawierają 1, co wskazuje na
statystycznie istotną różnicę w wariancjach.

• Długość przedziałów ufności stanowi miarę precyzji oszacowań, a wyniki wskazują na umiarkowaną do
pewnej precyzji w oszacowaniach różnicy wariancji w badanych przypadkach.

Metoda Delta
Metoda Delta, znana również jako technika propagacji błędów, jest narzędziem matematycznym używanym
do szacowania błędów lub niepewności w wynikach pomiarów lub obliczeń, które zależą od wielu zmiennych.
Jest szczególnie przydatna w sytuacjach, gdzie mamy funkcję wielu zmiennych i chcemy oszacować, jak błąd
w tych zmiennych wpływa na błąd w wyniku funkcji.
Rozważmy funkcję Y = f (X1 , X2 , . . . , Xn ), gdzie X1 , X2 , . . . , Xn to zmienne niezależne o pewnych błędach
lub niepewnościach. Metoda Delta pozwala oszacować błąd standardowy σY wyniku Y w oparciu o błędy
standardowe σX1 , σX2 , . . . , σXn zmiennych niezależnych.
W przypadku funkcji jednej zmiennej (n = 1), ogólna formuła Metody Delta wygląda następująco:
s 2  2  2
∂f ∂f ∂f
σY = σX + σX + ... + σX
∂X1 1 ∂X2 2 ∂Xn n

gdzie ∂f
∂Xi to pochodna cząstkowa funkcji f względem zmiennej Xi .
Jeśli mamy funkcję dwóch zmiennych (n = 2), wzór ten upraszcza się do:

6
s 2  2
∂f ∂f
σY = σX + σX
∂X1 1 ∂X2 2

Metoda Delta potencjalnie znajduje zastosowanie w konstrukcji przedziałów ufności poprzez wykorzystanie
oszacowanych błędów standardowych do określenia przedziałów wokół wartości funkcji. Przy założeniu
normalności zmiennych, możemy użyć rozkładu normalnego do określenia przedziałów ufności. W praktyce,
stosujemy kwantyle tego rozkładu do zakresu wartości oszacowanej wraz z błędem standardowym, co pozwala
uzyskać przedział ufności zawierający prawdziwą wartość funkcji z określonym poziomem ufności.

You might also like