6

You might also like

Download as doc, pdf, or txt
Download as doc, pdf, or txt
You are on page 1of 7

D2NE FiR semestr zimowy 2012/2013 Lista zada nr 6 Statystyka (Wspczynnik korelacji Pearsona, regresja liniowa) wiczenia w. 1.

Chcc zbada zaleno midzy iloci emitowanych dziennie w TV reklam pewnego proszku do prania a wysokoci obrotw przeprowadzono badanie. Wyniki podano w poniszej tabeli:

Tabela:

xi
3 4 5 6 5 7 30,00 6 5,00

yi
12 13 16 18 15 22 96,00 6 16,00

( x x)
i

( yi y )
-4,00 -3,00 0,00 2,00 -1,00 6,00 suma n kowariancja

( x x )( y y )
i i

( x x)
i

( yi y ) 2
16,00 9,00 0,00 4,00 1,00 36,00 66,00 6 11,00 3,32

-2,00 -1,00 0,00 1,00 0,00 2,00

suma n rednia

8,00 3,00 0,00 2,00 0,00 12,00 25,00 6 4,167

suma n wariancja odchylenie

4,00 1,00 0,00 1,00 0,00 4,00 10,00 6 1,67 1,29

Wzory pomocnicze:s rednia arytmetyczne dla obu cech:

xi = 30 = 5 x = i =1 6 n

y=

y
i =1

96 = 16 6

Odchylenie standardowe dla obu cech:

S ( x) =

( x x)
i =1 i

10 = 1,29 6 66 = 3,32 6

S ( y) =

( y y)
i =1 i

n
k

Kowariancja:

cov( x, y ) =

( x x )( y y ) = 25 = 4,167
i =1 i i

a) Obliczy wspczynnik korelacji Pearsona. Czy istnieje zaleno midzy iloci reklam a wielkoci obrotw? Jeeli zaleno istnieje to jaka jest jej sia? wspczynnik korelacji liniowej Pearsona - miernik siy zwizku prostoliniowego midzy dwoma cechami mierzalnymi

rxy =

cov ( x, y ) 4,167 = = 0,973 S( x ) S ( y ) 1,29 * 3,32

[wspczynnik korelacji liniowej Pearsona]

Przyjte oznaczenie w korelacji liniowej: X - ilo emitowanych dziennie w TV reklam Y - wysoko obrotw w tys. z

rxy = 0
0,0 0,1 0,3 0,5 0,7 0,9

zmienne nie s skorelowane korelacja nika korelacja saba korelacja przecitna korelacja wysoka korelacja bardzo wysoka korelacja prawie pena

rxy < 0,1 rxy <0,3 rxy <0,5 rxy <0,7 rxy <0,9 rxy <1,0

Przedstawiona skala jest oczywicie umowna; w literaturze mona spotka rwnie inne okrelenia. Uwaga: Gdy warto bezwzgldna wspczynnika korelacji jest bliska zeru, nie oznacza to braku zalenoci midzy cechami, a jedynie brak zalenoci liniowej (moe istnie krzywoliniowa). Ocena kierunku korelacji (xy):

rxy 1;+1

rxy = 0 zmienne X oraz Y nie s skorelowane (s niezalene), rxy < 0 zmienne X oraz Y s skorelowane ujemnie, rxy > 0 zmienne X oraz Y s skorelowane dodatnio,
lub

cov( xy ) < 0 zmienne X oraz Y s skorelowane ujemnie, cov( xy ) > 0 zmienne X oraz Y s skorelowane dodatnio, cov( xy ) = 0 zmienne X oraz Y s nieskorelowane ze sob, rxy = +1 rxy = -1
zaleno funkcyjna dodatnia, zaleno funkcyjna ujemna.

Przypadki skrajne:

Interpretacja Warto wspczynnika korelacji ( r = 0,973) wskazuje, e midzy iloci emitowanych dziennie w TV reklam, a wysokoci obrotw zachodzi dodatnia bardzo wysoka korelacja. Wraz ze wzrostem iloci emitowanych dziennie w TV reklam wzrostowi podlega wysoko obrotw. b) Wyznaczy prost regresji obrotw wzgldem liczby reklam. Poda interpretacj parametrw regresji. Przyjte oznaczenie w analizie regresji liniowej: X objaniajca - ilo emitowanych dziennie w TV reklam Y objaniana - wysoko obrotw w tys. z

yt = a y * x t + b

(wzr rwnania regresji liniowej cechy Y wzgldem cechy X)

Znale oszacowania parametrw regresji prostej (z jedn zmienn objaniajc) to oznacza znale wartoci wyrazu wolnego (b) oraz wspczynnika kierunkowego regresji liniowej (a). a,b = ?

Wspczynnik kierunkowy w regresji prostej (a) to parametr stojcy przy zmiennej objaniajcej (najczciej X):

ay =

4,167 cov( x, y ) = = 2,50 2 S ( x) (1,29) 2

b - wyraz wolny w regresji prostej b = y a y * x = 16 ( 2,50 ) * 5 = 3,50


Oszacowane rwnanie regresji liniowej ma posta:

y t = 2,5 * x t + 3,50 > 0)

Interpretacja uzyskanej oceny parametru przy zmiennej objaniajcej Zasada interpretacji parametru a (wspczynnika kierunkowego regresji liniowej) prostej regresji:

(a (a

y y

< 0)

=> =>

jeli X wzronie o 1 jednostk, to Y wzronie rednio o a jednostek, jeli X wzronie o 1 jednostk, to Y spadnie rednio o a jednostek.

a y = 2,5
Jeli ilo emitowanych dziennie w TV reklam wzronie o 1 reklam to spowoduje to wzrost wysokoci obrotw rednio o 2,5 [tys. z]. Interpretacja wyrazu wolnego w regresji Czsto spotykan interpretacj jest warto Y, gdy X = 0. b = 3,5 Jeli poziom ilo emitowanych dziennie (w szt.) jest zerowa, wysoko obrotw wynosi rednio 3,5 (tys. z). c) Wyznaczy prost regresji liczby reklam wzgldem obrotw. Poda interpretacj parametrw regresji.

xi = ax * yi + b ax =

(Model regresji X wzgldem Y)

cov( x, y ) 4,167 = = 0,38 S 2 ( y) 3,32 2 b = x a x * y = 5 ( 0,38) *16 = -1,06 x i = 0,38 * y i - 1,06 a x = 2,5

[wspczynnik kierunkowy w regresji]

[oszacowany model]

Wzrost wysokoci obrotw o 1 tys. z powoduje wzrost ilo emitowanych dziennie w TV reklam rednio o 0,38 [reklamy]. Interpretacja wyrazu wolnego w regresji Czsto spotykan interpretacj jest warto Y, gdy X = 0. b = -1,06 Brak sensu ujemnej liczby reklam. d) Jeli zwikszymy ilo reklam do 8 dziennie, to jakie bd spodziewane obroty? Przyjte oznaczenie w analizie regresji liniowej: X ilo emitowanych dziennie w TV reklam = 8 Y - wysoko obrotw w tys. z = ? Oszacowana warto:

y t = 2,5 * x t + 3,50 = 2,5 * 8 + 3,50 = 23,5

Interpretacja Spodziewane obroty bd wynosi 23,5 tys. z. e) Otrzymano obroty 17 tys. z, jaka bya przypuszczalna liczba reklam dziennie? X ilo emitowanych dziennie w TV reklam = ? Y - wysoko obrotw w tys. z = 17 tys. z Oszacowana warto:

x i = 0,38 * y i - 1,06 = 0,38 *17 - 1,06 = 5,4

Interpretacja Przypuszczalna liczba reklam dziennie bdzie wynosi 5,4 reklam. w. 2. W celu zbadania zalenoci midzy cenami X a poda Y wynotowano w 10 rnych okresach ceny danego artykuu i jego poda. Otrzymano nastpujce wyniki: rednia cena 25 x z, rednia poda 17 y tys. sztuk oraz

a) Gdzie obserwujemy wiksze zrnicowanie, w przypadku cen czy poday? X ceny Y poda

S ( x ) = S 2 ( x ) = 90 = 9,487

S( y) = S 2 ( y) = 6

Vklas = Vklas

S ( x) 90 * 100% = = 37,947% x 25 S( y) = *100% = 36 = 35,294% y 17

Interpretacja Wiksze zrnicowanie obserwujemy wrd cen, bo wspczynnik V jest wyszy dla cen. b) Oceni zaleno midzy badanymi cechami.

rxy =

cov ( x, y ) 54 = = 0,949 S( x ) S ( y ) 90 * 36
korelacja prawie pena

[wspczynnik korelacji liniowej Pearsona]

W tym przypadku zachodzi: 0,9

rxy <1,0

rxy > 0 zmienne X oraz Y s skorelowane dodatnio,


Interpretacja Warto wspczynnika korelacji ( r = 0,949) wskazuje, e midzy cen, a poda zachodzi dodatnia bardzo wysoka korelacja. Wraz ze wzrostem cen wzrostowi podlega poda. c) Wyznaczy obie proste regresji i przedstawi je na wykresie. Wspczynnik kierunkowy w regresji prostej (a) to parametr stojcy przy zmiennej objaniajcej (najczciej X):

ay =

cov( x, y ) 54 = = 0,6 S 2 ( x) 90

b = y a y * x = 17 ( 0,6 ) * 25 = 2 Oszacowane rwnanie regresji liniowej ma posta: y t = 0,6 * x t + 2


b - wyraz wolny w regresji prostej

xi = ax * yi + b (Model regresji X wzgldem Y) cov( x, y ) 54 ax = = = 0,9 [wspczynnik kierunkowy w regresji] S 2 ( y) 60 b = x a x * y = 25 ( 0,9 ) *17 = 9,7 x i = 0,9 * y i + 9,7 [oszacowany model]
d) Oszacowa cen artykuu, gdy poda wynosi 16 tys. sztuk. X ceny = ?

x i = 0,9 * y i + 9,7

Y poda = 16 [oszacowany model]

x i = 0,9 * y i + 9,7 = 0,9 *16 + 9,7 = 24,1


Interpretacja Szacowana cena to 24,1 z. Zadania (do samodzielnego rozwizania) Zad. 1. Obserwacje dotyczce czstoci wypadkw w zalenoci od szerokoci drogi przyniosy nastpujce wyniki: (X szeroko szosy w metrach, Y liczba wypadkw)

Tabela:

xi

yi

( x x)
i

( yi y )
23,29 16,29 9,29 12,29 -14,71 -17,71 -28,71 suma n kowariancja

( x x )( y y )
i i

( x x)
i

( yi y ) 2
542,22 265,22 86,22 150,94 216,51 313,80 824,51 2399,43 7 342,78 18,51

8 92 10 85 14 78 16 81 20 54 22 51 24 40 suma 114,00 481,00 n 7 7 rednia 16,29 68,71

-8,29 -6,29 -2,29 -0,29 3,71 5,71 7,71

-192,94 -102,37 -21,22 -3,51 -54,65 -101,22 -221,51 -697,43 suma 7 n -99,633 wariancja odchylenie

68,65 39,51 5,22 0,08 13,80 32,65 59,51 219,43 7 31,35 5,60

Wzory pomocnicze: rednia arytmetyczne dla obu cech:

x=

xi
i =1

114 = = 16,29 7

y=

y
i =1

481 = 68,71 7

Odchylenie standardowe dla obu cech:

S ( x) =

( x x)
i =1 i

219,43 = 5,60 7

S ( y) =

( y y)
i =1 i

2399,43 = 18,51 7

Kowariancja:

cov( x, y ) =

( x x )( y y ) = 481 = 68,71
i =1 i i

a) Jak skorelowane s cechy X i Y?

rxy =

cov ( x, y ) - 99,633 = = -0,961 S( x ) S ( y ) 5,6 *18,51

[wspczynnik korelacji liniowej Pearsona] Y liczba wypadkw

Przyjte oznaczenie w korelacji liniowej: W tym przypadku zachodzi:

X szeroko szosy w metrach,

rxy < 0 zmienne X oraz Y s skorelowane ujemnie,


0,9

rxy <1,0

korelacja prawie pena

Interpretacja Warto r = - 0,961 oznacza, e midzy szerokoci szosy, a liczb wypadkw zachodzi ujemna prawie pena korelacja. Wraz ze wzrostem szerokoci szosy spadkowi podlega liczba wypadkw. b) Wyznaczy prost regresji liczby wypadkw w zalenoci od szerokoci szosy i zinterpretowa wspczynniki regresji. Oceni przecitn liczb wypadkw na szosach o szerokoci 15 i 25 m.

yt = a y * x t + b

(wzr rwnania regresji liniowej cechy Y wzgldem cechy X)

Znale oszacowania parametrw regresji prostej (z jedn zmienn objaniajc) to oznacza znale wartoci wyrazu wolnego (b) oraz wspczynnika kierunkowego regresji liniowej (a). a,b = ? Wspczynnik kierunkowy w regresji prostej (a) to parametr stojcy przy zmiennej objaniajcej (najczciej X):

ay =

cov( x, y ) - 99,633 = = -3,18 S 2 ( x) ( 5,60) 2

b - wyraz wolny w regresji prostej b = y a y * x = 68,71 ( - 3,18) *16,29 = 120,48

y t = -3,18x t Oszacowane rwnanie regresji liniowej ma posta: X szeroko szosy w metrach = 15, Y liczba wypadkw = ? X szeroko szosy w metrach = 25, Y liczba wypadkw = ? y t = -3,18x t + 120,48 = -3,18 *15 + 120,48 = 72,78 y t = -3,18x t + 120,48 = -3,18 * 25 + 120,48 = 40,98

+ 120,48

Jeli szosa ma szeroko 15 m, wwczas oczekiwana liczba wypadkw to ok. 73 wypadki. Jeli szosa ma szeroko 25 m, wwczas oczekiwana liczba wypadkw to ok. 41 wypadkw. Zad. 2. Spoycie dwch rodzajw napojw (w litrach) przez studentw przedstawia ponisza tabela:

Obliczy szacowane spoycie A, jeeli spoycie B jest rwne 70. X spoycie B = 70 Y spoycie A = ? Tabela:

xi
25 30 39 35 50 55 234,00 6 39,00

yi
15 25 30 35 45 54 204,00 6 34,00

( x x)
i

( yi y )
-19,00 -9,00 -4,00 1,00 11,00 20,00 suma n kowariancja

( x x )( y y )
i i

( x x)
i

( yi y ) 2
361,00 81,00 16,00 1,00 121,00 400,00 980,00 6 163,33 12,78

-14,00 -9,00 0,00 -4,00 11,00 16,00

suma n rednia

266,00 81,00 0,00 -4,00 121,00 320,00 784,00 suma 6 n 130,667 wariancja odchylenie

196,00 81,00 0,00 16,00 121,00 256,00 670,00 6 111,67 10,57

Zad. 3. W pewnym zakadzie przeprowadzono badanie w celu ustalenia zalenoci midzy produkcj pewnego wyrobu (w tonach) zmienna zalena (X) a zuyciem surowca (w kg), potrzebnego do produkcji tego wyrobu zmienna niezalena (Y). Otrzymano nastpujce wyniki: , r = 0,914. Oszacowa wielko produkcji wyrobu przy zuyciu 80 kg danego surowca. Zad. 4. Dla 50 losowo wybranych rodzin obliczono, e rednie miesiczne spoycie misa w rodzinie wynosi 12kg., a wspczynnik zmiennoci 10%. redni dochd rodziny wynis natomiast 3 tys. z. i wspczynnik zmiennoci 20%. Obliczono rwnie kowariancj midzy spoyciem misa a dochodem rwn 0,648: a) Obliczy i zinterpretowa wspczynnik korelacji. b) Wyznaczy parametry prostej regresji spoycia misa od dochodw i poda interpretacje. Zad. 5. W zakadach odzieowych przeprowadzono badania w celu ustalenia zalenoci midzy dugoci serii produkcji w tys. sztuk (X) a jednostkowym kosztem produkcji wyrobu w tys. z (Y). Otrzymano proste regresji: x = -0,003y + 1,7 y = -0,27x + 5,16 a) Poda interpretacj wspczynnikw regresji. b) Okreli si zalenoci midzy cechami. c) W jakim procencie zmienna X wyjania zmienn Y? d) Jaki jest przewidywany poziom kosztu jednostkowego przy serii o dugoci 10 tys. sztuk? e) Jaka jest oczekiwana dugo serii, gdy koszt jednostkowy wynosi 200 z? f) Obliczy rednie dugoci serii produkcji oraz jednostkowego kosztu produkcji. Z podrcznika Statystyka. Elementy teorii i zadania zadania z rozdziau 11.

You might also like