Statinz 4

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 37

4.

Rozkłady Dwóch Zmiennych Dyskretnych

4.1 Rozkłady Łączne Dwóch Zmiennych Dyskretnych


Zakładamy że zmienne dyskretne X i Y mają nośniki SX i SY ,
odpowiednio.
Rozkład łączny zmiennych X i Y jest określony zbiorem
prawdopodobieństw {P(X = x, Y = y )}x∈SX ,y ∈SY .
Rozkład łączny spełnia

P(X = x, Y = y )­0
X X
P(X = x, Y = y )=1.
x∈SX y ∈SY

1 / 37
Rozkłady Łączne Dwóch Zmiennych Dyskretnych

Gdy SX i SY są małymi zbiorami, rozkład łączny zmiennych X i Y


zwykle się przedstawia za pomocą tabelki, np.

Y = −1 Y =0 Y =1
1
X =0 0 3 0
1 1
X =1 3 0 3

Tutaj P(X = 0, Y = −1) = 0, P(X = 0, Y = 0) = 13 , itp.

2 / 37
4.2 Rozłady Brzegowe
Należy zanotować że gdy sumujemy po danym wierszu (czyli po
wszystkich możliwych realizacjach zmiennej Y dla ustalonej
wartości realizacji zmiennej X ), otrzymujemy prawdopodobieństwo
tego że X przyjmuje odpowiednią wartość, czyli
X
P(X = x) = P(X = x, Y = y ).
y ∈SY

Podobnie, gdy sumujemy po danej kolumnie (czyli po wszystkich


możliwych realizacjach zmiennej X dla ustalonej wartości realizacji
zmiennej Y ), otrzymujemy prawdopodobieństwo tego że Y
przyjmuje odpowiednią wartość, czyli
X
P(Y = y ) = P(X = x, Y = y ).
x∈SX

3 / 37
Rozłady Brzegowe

Rozkłady zmiennych X i Y otrzymanych w ten sposób są zwane


rozkładami brzegowymi.
Rozkłady brzegowe posiadają wszystkie standardowe własności
rozkładu prawdopodobieństwa, czyli
X
P(X = x) ­ 0; P(X = x) = 1.
x∈SX

Rozkłady brzegowe dla przykładu z 2-giego slajdu podano na


następnym slajdzie

4 / 37
Rozłady Brzegowe

Y = −1
P
Y =0 Y =1
1 1
X =0 0 3 0 3 [P(X = 0)]
1 1 2
X =1 3 0 3 3 [P(X = 1)]
1 1 1
[P(Y = −1)]
P
3 3 [P(Y = 0)] 3 [P(Y = 1)] 1

5 / 37
4.3 Niezależność dwóch Zmiennych Losowych

Dwie zmienne losowe X i Y są niezależne wtedy i tylko wtedy gdy

P(X = x, Y = y ) = P(X = x)P(Y = y ), ∀x ∈ SX , y ∈ SY .

Aby udowodnić że zachodzi niezależność, trzeba pokazać iż


warunek ten jest spełniony dla każdej komórki rozkładu łącznego.

6 / 37
4.4 Wartość Oczekiwana Funkcji dwóch Zmiennych
Losowych

Wartość oczekiwana funkcji g (X , Y ) dwóch zmiennych losowych


wyraża się wzorem
X X
E [g (X , Y )] = g (x, y )P(X = x, Y = y ).
x∈SX y ∈SY

W szczególności, wartość oczekiwana zmiennej X wyraża się


wzorem X X
E [X ] = xP(X = x, Y = y ).
x∈SX y ∈SY

Należy zanotować że jeżeli już wyznaczyliśmy rozkład brzegowy


zmiennej X , łatwiej wyznaczyć E [X ] z tego rozkładu brzegowego.

7 / 37
4.5 Kowariancja i Współczynnik Korelacji

Kowariancja między zmiennymi X a Y , Cov (X , Y ) wyraża się


wzorem
Cov (X , Y ) = E (XY ) − E (X )E (Y )
Należy zanotować że z definicji
Cov (X , X ) = E (X 2 ) − E (X )2 = Var (X ). W dodatku, dla
dowolnych stałych a, b

Cov (X , aY + b) = aCov (X , Y ).

Współczynnik korelacji między zmiennymi X a Y wyraża się


wzorem
Cov (X , Y )
ρ(X , Y ) = p .
Var (X )Var (Y )

8 / 37
Własności Współczynnika Korelacji
1. −1 ¬ ρ(X , Y ) ¬ 1.
2. Jeżeli |ρ(X , Y )| = 1, wtedy istnieje liniowy związek
deterministyczny między X a Y , czyli Y = aX + b.
Gdy ρ(X , Y ) = 1, wtedy a > 0. Gdy ρ(X , Y ) = −1,
wtedy a < 0.
3. Jeżeli zmienne X i Y są niezależne, wtedy
ρ(X , Y ) = 0. Należy zanotować że gdy ρ(X , Y ) = 0,
X i Y nie muszą być niezależne. (zob. Przykład 4.1).
Natomiast, gdy ρ(X , Y ) ̸= 0, wtedy X i Y są
zależne.
4. Jeżeli a > 0, wtedy ρ(X , aY + b) = ρ(X , Y ), czyli
współczynnik korelacji nie zależy od jednostek, w
których zmierzono zmienne. Jeżeli a < 0, wtedy
ρ(X , aY + b) = −ρ(X , Y ).
9 / 37
Przykład 4.1

Dyskretne zmienne losowe X i Y mają następujący rozkład łączny:

Y = −1 Y =0 Y =1
1
X =0 0 3 0
1 1
X =1 3 0 3

a) Wyznaczyć i) P(X > Y ),


ii) rozkłady brzegowe zmiennych X i Y ,
iii) wartości oczekiwane oraz wariancje zmiennych X i Y ,
iv) współczynnik korelacji między X a Y .
b) Czy X i Y są niezależne?

10 / 37
Przykład 4.1

a) i) Sumujemy po wszystkich komórkach gdzie warunek X > Y


jest spełniony

P(X > Y )=P(X = 0, Y = −1)+P(X = 1, Y = −1)+P(X = 1, Y = 0)


1 1
=0 + + 0 =
3 3

11 / 37
Przykład 4.1

ii)

Y = −1
P
Y =0 Y =1
1 1
X =0 0 3 0 3 [P(X = 0)]
1 1 2
X =1 3 0 3 3 [P(X = 1)]
1 1 1
[P(Y = −1)]
P
3 3 [P(Y = 0)] 3 [P(Y = 1)] 1

12 / 37
Przykład 4.1

iii) SX = {0, 1}
X
E (X )= xP(X = x)
x∈SX
2 2
=0P(X = 0) + 1P(X = 1) = 1 × =
X
3 3
E (X 2 )= x 2 P(X = x)
x∈SX
2 2
=02 P(X = 0) + 12 P(X = 1) = 1 × =
3 3
Więc
2 4 2
Var (X ) = E (X 2 ) − E (X )2 = − = .
3 9 9

13 / 37
Przykład 4.1
SY = {−1, 0, 1}
X
E (Y )= yP(Y = y )
y ∈SY
1 1
=−1P(Y = −1)+0P(Y = 0)+1P(Y = 1) = −1 × +1× = 0
X 3 3
2 2
E (Y )= y P(Y = y )
y ∈SY
1 1 2
=(−1)2 P(Y = −1)+02 P(Y = 0)+12 P(Y = 1) = 1× +1 × =
3 3 3
Więc
2
Var (Y ) = E (Y 2 ) − E (Y )2 = .
3
Uwaga: E (Y ) = 0 wynika z symetrii rozkładu względem Y = 0.

14 / 37
Przykład 4.1

iv) Cov (X , Y ) = E (XY ) − E (X )E (Y )


X X
E (XY ) = xyP(X = x, Y = y ).
x∈SX y ∈SY

Sumujemy po wszystkich komórkach rozkładu łącznego


1 1
E (XY ) = 0 + 0 + 0 + (−1) × + 0 + 1 × = 0.
3 3
Więc
2
Cov (X , Y ) = 0 − × 0 = 0.
3

15 / 37
Przykład 4.1

Cov (X , Y )
ρ(X , Y ) = p = 0.
Var (X )Var (Y )

16 / 37
Przykład 4.1

b) Skoro ρ(X , Y ) = 0 należy sprawdzić z definicji czy X i Y są


niezależne. Na przykład
1 1
P(X = 0, Y = −1) = 0 ̸= P(X = 0)P(Y = −1) = ×
3 3
Zatem, zmienne X i Y są zależne.

17 / 37
4.6 Rozkłady Warunkowe i Warunkowe Wartości
Oczekiwane

Warunkowy rozkład zmiennej X przy warunku Y = y , gdzie


y ∈ SY jest zbiorem {P(X = x|Y = y )}x∈SX . Mamy

P(X = x, Y = y )
P(X = x|Y = y ) = .
P(Y = y )

Analogicznie, warunkowy rozkład zmiennej Y przy warunku X = x,


gdzie x ∈ SX jest zbiorem {P(Y = y |X = x)}y ∈SY . Mamy

P(X = x, Y = y )
P(Y = y |X = x) = .
P(X = x)

18 / 37
Warunkowe Wartości Oczekiwane

Warunkową wartość oczekiwaną funkcji g (X ) przy warunku Y = y


oznaczamy przez E [g (X )|Y = y ]. Mamy
X
E [g (X )|Y = y ] = g (x)P(X = x|Y = y ).
x∈SX

W szczególności,
X
E [X |Y = y ] = xP(X = x|Y = y ).
x∈SX

Warunkowa wartość oczekiwana funkcji g (Y ) przy warunku X = x


jest zdefiniowana w sposób analogiczny.

19 / 37
Niezależność i Rozkłady Warunkowe

Zmienne losowe X i Y są niezależne wtedy i tylko wtedy gdy dla


każdego x ∈ SX

P(X = x|Y = y ) = P(X = x), dla każdego y ∈ SY .

Jest to warunek konieczny i wystarczający.


Intuicyjnie, X jest niezależne od Y gdy rozkład zmiennej X nie
zależy od realizacji zmiennej Y .

20 / 37
Niezależność i Warunkowe Wartości Oczekiwane

Gdy zmienne losowe X i Y są niezależne

E (X |Y = y ) = E (X ), dla każdego y ∈ SY .

Jest to warunek konieczny, ale nie wystarczający żeby X i Y były


niezależne.
Ale gdy ten warunek jest spełniony, wtedy ρ(X , Y ) = 0.
Intuicyjnie, gdy X jest niezależne od Y , wartość oczekiwana E (X )
nie zależy od realizacji zmiennej Y .

21 / 37
Przykład 4.2

Zmienne losowe X i Y mają następujący rozkład łączny:

Y = −1 Y =0 Y =1
1
X =0 0 3 0
1 1
X =1 3 0 3

a) Wyznaczyć warunkowy rozkład zmiennej Y przy


warunku i) X = 0, ii) X = 1.
b) Wyznaczyć warunkową wartość oczekiwaną zmiennej
Y przy warunku i) X = 0, ii) X = 1.
c) W oparciu o twoje wyniki z części a) i b), czy można
stwierdzić że X i Y są i) zależne, ii) niezależne?
Krótko uzasadnić twoją odpowiedź.

22 / 37
Przykład 4.2

a) Y przyjmuje wartości ze zbioru SY = {−1, 0, 1}.


i) Przy warunku X = 0

P(X = 0, Y = −1)
P(Y = −1|X = 0)= =0
P(X = 0)
P(X = 0, Y = 0) 1/3
P(Y = 0|X = 0)= = =1
P(X = 0) 1/3
P(X = 0, Y = 1)
P(Y = 1|X = 0)= =0
P(X = 0)

23 / 37
Przykład 4.2

ii) Przy warunku X = 1

P(X = 1, Y = −1) 1/3 1


P(Y = −1|X = 1)= = =
P(X = 1) 2/3 2
P(X = 1, Y = 0)
P(Y = 0|X = 1)= =0
P(X = 1)
P(X = 1, Y = −1) 1/3 1
P(Y = 1|X = 1)= = =
P(X = 1) 2/3 2

24 / 37
Przykład 4.2

b) i) Przy warunku X = 0
X
E (Y |X = 0)= yP(Y = y |X = 0)
y ∈SY
=−1 × 0 + 0 × 1 + 1 × 0 = 0

ii) Przy warunku X = 1


X
E (Y |X = 1)= yP(Y = y |X = 1)
y ∈SY
1 1
=−1 × + 0 × 0 + 1 × = 0.
2 2

25 / 37
Przykład 4.2

c) E (Y |X = 0) = E (Y |X = 1) = 0 (czyli warunkowa wartość


oczekiwana zmiennej Y nie zależy od X ), więc ρ(X , Y ) = 0.
Ale rozkład warunkowy zmiennej Y zależy od X .
Wynika z tego, iż zmienne X i Y są zależne.

26 / 37
Regresja Probabilistyczna przy Dwóch Zmiennych
Dyskretnych

Wykres regresji probabilistycznej dla zmiennej Y względem


zmiennej X składa się ze zbioru punktów {(x, E [Y |X = x])}x∈SX .
Czyli na osi x mamy wartości zmiennej X , a na osi y mamy
warunkowe wartości oczekiwane zmiennej Y .

27 / 37
Regresja Probabilistyczna przy Dwóch Zmiennych
Dyskretnych
1.0
0.5
E(Y|X=x)

0.0
−0.5
−1.0

0.0 0.2 0.4 0.6 0.8 1.0

28 / 37
Regresja Probabilistyczna i Współczynnik Korelacji

1. Gdy E (Y |X = x) rośnie względem x, wtedy


ρ(X , Y ) > 0.
2. Gdy E (Y |X = x) maleje względem x, wtedy
ρ(X , Y ) < 0.
3. Gdy E (Y |X = x) nie zależy od x, wtedy
ρ(X , Y ) = 0.
4. Gdy E (Y |X = x) nie jest monotoniczne, wtedy
ρ(X , Y ) może być ujemne, dodatnie lub równe zeru.

29 / 37
4.7 Wylosowanie Liczb Pseudolosowych z Rozkładu
Łącznego
Gdy para liczb (X , Y ) jest zależna, można
a) wylosować parę realizacji (x, y ) z rozkładu łącznego za pomocą
metody p’stw skumulowanych, lub
b) wylosować x z rozkładu brzegowego, a potem wylosować y z
odpowiedniego rozkładu warunkowego (lub analogicznie najpierw
y , a potem x).
Na przykład, zakładamy że chcemy wylosować z rozkładu łącznego
P
Y =0 Y =1 Y =2
X =0 0.1 0.2 0.3 0.6
X =1 0.0 0.05 0.35 0.4

30 / 37
Wylosowanie Liczb Pseudolosowych z Rozkładu Łącznego

a) Bezpośrednio z rozkładu łącznego Uporządkujemy p’stwa w


kolejności malejącej (razem z odpowiadającymi im parami
realizacji).
Wyznaczamy p’stwa skumulowane.

p s (X , Y )
0.35 0.35 (1; 2)
0.3 0.65 (0; 2)
0.2 0.85 (0; 1)
0.1 0.95 (0; 0)
0.05 1 (1; 1)

31 / 37
Wylosowanie Liczby Pseudolosowej z Rozkładu Łącznego -
Pseudokod

Wygenerować u
Jeżeli u < 0.35, {x = 1; y = 2}
Inaczej, jeżeli u < 0.65, {x = 0; y = 2}
Inaczej, jeżeli u < 0.85, {x = 0; y = 1}
Inaczej, jeżeli u < 0.95, {x = 0; y = 0}
Inaczej, {x = 1; y = 1}.

32 / 37
Wylosowanie Liczby Pseudolosowej z Rozkładów
Warunkowych
Wygenerować u1 (aby wygenerowć x z rozkładu brzegowego)
Wygenerować u2 (aby wygenerowć y z rozkładu warunkowego)
Jeżeli u1 < 0.6, {x = 0
Jeżeli u2 < 0.5, {y = 2}
Inaczej jeżeli u2 < 5/6, {y = 1}
Inaczej {y = 0}
}
Inaczej, {x = 1
Jeżeli u2 < 7/8, {y = 2}
Inaczej, {y = 1}
}
33 / 37
Wylosowanie Liczb Pseudolosowych z Rozkładu Łącznego

Gdy X i Y są niezależne, możemy wylosować X i Y osobno


według rozkładów brzegowych.
Na przykład, zakładamy że chcemy wylosować z rozkładu łącznego
P
Y =0 Y =1 Y =2
1 1 1 1
X =0 18 9 6 3
1 2 1 2
X =1 9 9 3 3
P 1 1 1
6 3 2 1

34 / 37
Wylosowanie Liczb Pseudolosowych z Rozkładu Łącznego

Skoro P(X = x, Y = y ) = P(X = x)P(Y = y ) dla każdej pary


x ∈ {0; 1}, y ∈ {0; 1; 2}, X i Y są niezależne.
Mamy P(X = 0) = 13 , P(X = 1) = 23 .
P(Y = 0) = 61 , P(Y = 1) = 31 , P(Y = 2) = 1
2

35 / 37
Wylosowanie Liczb Pseudolosowych z Rozkładu Łącznego

Więc, aby wylosować realizację x:


Wygenerować u1
Jeżeli u1 < 23 , x = 1
Inaczej, x = 0
Podać x

36 / 37
Wylosowanie Liczb Pseudolosowych z Rozkładu Łącznego

Podobnie, aby wylosować realizację y :


Wygenerować u2
Jeżeli u2 < 12 , y = 2
Inaczej, jeżeli u2 < 56 , y = 1
Inaczej, y = 0
Podać y

37 / 37

You might also like