Professional Documents
Culture Documents
Raport 3
Raport 3
Alicja Jordan
2023-11-07
σ2
X̄ ∼ N µ,
n
2. Normalizacja rozkładu: Aby uzyskać przedział ufności, normalizujemy rozkład X̄ poprzez odjęcie
średniej i podzielenie przez odchylenie standardowe.
X̄ − µ
Z= ∼ N (0, 1)
√σ
n
3. Obliczanie wartości krytycznej: Wartość krytyczna Z α2 dla poziomu ufności 1 − α jest taka, że
prawdopodobieństwo, że zmienna losowa Z jest mniejsza niż Z α2 wynosi 1 − α2 .
α
P Z < −Z α2 =
2
α
Oznacza to, że Z α2 jest kwantylem rzędu 1 − 2 rozkładu normalnego standardowego.
4. Budowa przedziału ufności: Teraz, mając znormalizowany rozkład Z, możemy skonstruować
przedział ufności dla µ:
!
X̄ − µ
P −Z α2 < < Z α2 =1−α
√σ
n
Ostatecznie przedział ufności dla średniej µ przy założeniu znanej wariancji σ 2 na poziomie ufności 1 − α
ma postać:
σ
X̄ ± Z α2 · √
n
1
PU(znana wariancja) i ich długości dla różnych rozkładów (n=50)
Generujemy próby o n=50 obserwacjach i obliczamy dla nich przedziały ufności na poziomie ufności 0.95
oraz długości tychże przedziałów. Wyniki przedstawiamy w poniższej tabeli:
Wnioski
Dla rozkładów normalnych i logistycznych uzyskane prawdopodobieństwo pokrycia wynosiło około 95%, a
długość przedziałów rosła z rozszerzaniem się rozkładu. Dla rozkładu Cauchy’ego zaobserwowano znacznie
niższe prawdopodobieństwo pokrycia (około 18%), co jest związane z jego ekstremalnymi właściwościami.
2
Rozkład wykładniczy oraz chi-kwadrat również potwierdziły teoretyczne założenia, utrzymując praw-
dopodobieństwo pokrycia na poziomie 95%. Ogólnie rzecz biorąc, wyniki wskazują na skuteczność estymacji
przedziałów ufności, przy czym różnice wynikają z charakterystyki konkretnych rozkładów.
3
Rozkład Przedział ufności Długość przedziału ufności
χ2 (3) [2.326, 3.7069] 1.3808
Wnioski
Dla rozkładów normalnych i logistycznych uzyskane prawdopodobieństwo pokrycia wynosiło około 94.91%
i 95.47% odpowiednio, a długość przedziałów rosła z rozszerzaniem się rozkładu. Dla rozkładu Cauchy’ego
zaobserwowano znaczne prawdopodobieństwo pokrycia (ok. 98.2%), co może wynikać z wpływu wartości
odstających. Równocześnie długość przedziałów tego rozkładu utrzymuje się na wyjątkowo dużym poziomie.
Estymacje dla rozkładu wykładniczego oraz chi-kwadrat również potwierdzają teoretyczne założenia, przy
czym różnice między powtórzeniami wynikają głównie z charakterystyki poszczególnych rozkładów. Warto
zauważyć, że dla rozkładu Cauchy’ego, mimo wysokiego prawdopodobieństwa pokrycia, długość przedziałów
jest istotnie większa, co podkreśla jego wyjątkowe właściwości wrażliwości na obserwacje odstające.
4
Niech X1 , . . . , Xn ∼ N (µ, σ 2 ), w szczególności Xi ∼ N (µ, σ 2 ) po standaryzacji otrzymamy (Xi − µ)/σ ∼
N (0, 1). Liczba stopni swobody w rozkładzie chi-kwadrat to liczba składników sumy.
n 2
X Xi − µ
∼ χ2n
i=1
σ
Oznaczymy jako M2 . Czyli n · M2 /σ 2 ∼ χ2n . Po prawej stronie nie ma σ 2 . Po lewej stronie jest σ 2 i jest µ.
Czyli n · M2 /σ 2 = Q(X, σ 2 ) może być funkcją centralną.
Powtarzając wcześniejsze rozumowania otrzymujemy:
n · M2
P χ2n (β) ≤ ≤ χ2
n (1 − α + β) =1−α
σ2
n · M2 n · M2
σ2 ∈ 2
, 2
χn (1 − α/2) χn (α/2)
Używając R Studio obliczamy minimalną wartość funkcji h(β) otrzymujemy, że β = α/2. Zatem ostatecznie
nasz przedział ufności wynosi:
2 n · M2 n · M2
σ ∈ ,
χ2n (1 − α/2) χ2n (α/2)
5
Rozkład Szacowane prawdopodobieństwo Długość przedziału
N (0, 1) 0.9501 0.845
N (0, 2) 0.9501 3.381
N (0, 3) 0.9501 7.607
L(0, 1) 0.8835 2.779
L(0, 2) 0.8835 11.115
L(0, 3) 0.8835 25.009
C(0, 1) 0 113449
C(0, 2) 0 453797
C(0, 3) 0 1021044
Exp(1) 0.7096 0.844
Exp( 12 ) 0.7096 3.376
Exp( 13 ) 0.7096 7.595
χ2 (1) 0.5743 1.677
χ2 (2) 0.7092 3.341
χ2 (3) 0.7761 5.071
Wnioski
Dla rozkładów normalnych i wykładniczych uzyskane wyniki są zgodne z oczekiwaniami, natomiast dla
rozkładu Cauchy’ego obserwujemy zerowe prawdopodobieństwo pokrycia, co wynika z jego dużego wpływu
wartości odstających. Szacowane prawdopodobieństwa dla rozkładu logistycznego są niższe niż oczekiwane,
co może być efektem jego skośności. Dla rozkładu chi-kwadrat zaobserwowano zmienne rezultaty, zwiększając
się wraz z ilością stopni swobody. Podsumowując, wyniki te potwierdzają wpływ charakterystyki rozkładu
na skuteczność przedziałów ufności oraz ich podatność na specyficzne właściwości danego rozkładu.
6
Rozkład Przedział ufności Długość przedziału ufności
C(0, 3) [620.0785, 1379.9246] 759.8462
Exp(0, 1) [0.4121, 0.917] 0.5049
Exp( 12 ) [2.8019, 2.557] 3.4334
Exp( 13 ) [3.7267, 3.1476] 4.5667
χ2 (1) [2.2491, 5.0052] 2.7561
χ2 (2) [2.7725, 6.1698] 3.3974
χ2 (3) [4.1182, 9.1646] 5.0464
Wnioski
Dla rozkładów normalnych oraz wykładniczych uzyskane prawdopodobieństwo pokrycia oscyluje wokół
95%, co jest zgodne z oczekiwaniami. Natomiast dla rozkładu Cauchy’ego obserwujemy zerowe praw-
dopodobieństwo pokrycia, co podkreśla jego nadzwyczajną podatność na wpływ wartości odstających.
W przypadku rozkładu logistycznego, szacowane prawdopodobieństwa są niższe niż oczekiwane, co może
wynikać z charakterystyki rozkładu. Dla rozkładu chi-kwadrat zauważamy zmienne rezultaty, zwiększające
się wraz z ilością stopni swobody. Ogólnie rzecz biorąc, wyniki te potwierdzają, że skuteczność przedziałów
ufności jest zależna od specyfiki danego rozkładu oraz jego parametrów. Długość przedziałów dla wszystkich
rozkładów wzrasta wraz ze wzrostem rozproszenia danych, co jest zgodne z oczekiwaniami.
7
Gdy podstawimy p := p, to
√ p−p d
np → N (0, 1)
p(1 − p)
Wnioski
Wyniki z eksperymentu numerycznego dla asymptotycznego przedziału ufności (n = 50) prezentują niewielkie
różnice dla różnych rozkładów. Szacowane prawdopodobieństwo pokrycia wynosi około 93.63%, a długość
przedziału utrzymuje się na stałym poziomie w okolicach 0.274. Dla wszystkich rozkładów (normalnego, lo-
gistycznego, Cauchy’ego) oraz różnych parametrów skala (1, 2, 3), uzyskane wyniki są zaskakująco zbliżone.
W przypadku asymptotycznego przedziału ufności, nie obserwujemy znacznych różnic pomiędzy rozkładami
czy ich parametrami, co może wynikać z asymptotycznej natury tego podejścia, które działa dobrze dla
większych prób. Długość przedziału pozostaje stała, co może wskazywać na pewną niezależność od charak-
terystyki rozkładu przy dostatecznie dużym n.
8
Formalnie, niech X̄ będzie średnią próbki, a S jej odchyleniem standardowym. Dla dużych wartości n, X̄
można przybliżyć rozkładem normalnym za pomocą równania:
X̄ − µ
Z=
√S
n
Dla małych prób (n = 20), CTG nie musi być jeszcze wyraźnie zauważalne, co oznacza, że rozkład próbki
może być bardziej podatny na wpływ czynników losowych. W rezultacie, dla mniejszych n, możemy oczeki-
wać większej zmienności w wynikach i szerszych przedziałów ufności.
Podsumowując, różnice w precyzji oszacowań pomiędzy małą (n = 20), średnią (n = 50), a dużą (n = 100)
próbą wynikają głównie z działania CTG. W miarę wzrostu liczności próby, zgodnie z CTG, oczekujemy, że
precyzja oszacowań wzrośnie, co przełoży się na węższe przedziały ufności. Różnice między wartościami n
będą wpływać na stopień zbliżenia rozkładu próbki do rozkładu normalnego oraz na zmienność wyników.