Professional Documents
Culture Documents
6
6
6
Chcc zbada zaleno midzy iloci emitowanych dziennie w TV reklam pewnego proszku do prania a wysokoci obrotw przeprowadzono badanie. Wyniki podano w poniszej tabeli:
Tabela:
xi
3 4 5 6 5 7 30,00 6 5,00
yi
12 13 16 18 15 22 96,00 6 16,00
( x x)
i
( yi y )
-4,00 -3,00 0,00 2,00 -1,00 6,00 suma n kowariancja
( x x )( y y )
i i
( x x)
i
( yi y ) 2
16,00 9,00 0,00 4,00 1,00 36,00 66,00 6 11,00 3,32
suma n rednia
xi = 30 = 5 x = i =1 6 n
y=
y
i =1
96 = 16 6
S ( x) =
( x x)
i =1 i
10 = 1,29 6 66 = 3,32 6
S ( y) =
( y y)
i =1 i
n
k
Kowariancja:
cov( x, y ) =
( x x )( y y ) = 25 = 4,167
i =1 i i
a) Obliczy wspczynnik korelacji Pearsona. Czy istnieje zaleno midzy iloci reklam a wielkoci obrotw? Jeeli zaleno istnieje to jaka jest jej sia? wspczynnik korelacji liniowej Pearsona - miernik siy zwizku prostoliniowego midzy dwoma cechami mierzalnymi
rxy =
Przyjte oznaczenie w korelacji liniowej: X - ilo emitowanych dziennie w TV reklam Y - wysoko obrotw w tys. z
rxy = 0
0,0 0,1 0,3 0,5 0,7 0,9
zmienne nie s skorelowane korelacja nika korelacja saba korelacja przecitna korelacja wysoka korelacja bardzo wysoka korelacja prawie pena
rxy < 0,1 rxy <0,3 rxy <0,5 rxy <0,7 rxy <0,9 rxy <1,0
Przedstawiona skala jest oczywicie umowna; w literaturze mona spotka rwnie inne okrelenia. Uwaga: Gdy warto bezwzgldna wspczynnika korelacji jest bliska zeru, nie oznacza to braku zalenoci midzy cechami, a jedynie brak zalenoci liniowej (moe istnie krzywoliniowa). Ocena kierunku korelacji (xy):
rxy 1;+1
rxy = 0 zmienne X oraz Y nie s skorelowane (s niezalene), rxy < 0 zmienne X oraz Y s skorelowane ujemnie, rxy > 0 zmienne X oraz Y s skorelowane dodatnio,
lub
cov( xy ) < 0 zmienne X oraz Y s skorelowane ujemnie, cov( xy ) > 0 zmienne X oraz Y s skorelowane dodatnio, cov( xy ) = 0 zmienne X oraz Y s nieskorelowane ze sob, rxy = +1 rxy = -1
zaleno funkcyjna dodatnia, zaleno funkcyjna ujemna.
Przypadki skrajne:
Interpretacja Warto wspczynnika korelacji ( r = 0,973) wskazuje, e midzy iloci emitowanych dziennie w TV reklam, a wysokoci obrotw zachodzi dodatnia bardzo wysoka korelacja. Wraz ze wzrostem iloci emitowanych dziennie w TV reklam wzrostowi podlega wysoko obrotw. b) Wyznaczy prost regresji obrotw wzgldem liczby reklam. Poda interpretacj parametrw regresji. Przyjte oznaczenie w analizie regresji liniowej: X objaniajca - ilo emitowanych dziennie w TV reklam Y objaniana - wysoko obrotw w tys. z
yt = a y * x t + b
Znale oszacowania parametrw regresji prostej (z jedn zmienn objaniajc) to oznacza znale wartoci wyrazu wolnego (b) oraz wspczynnika kierunkowego regresji liniowej (a). a,b = ?
Wspczynnik kierunkowy w regresji prostej (a) to parametr stojcy przy zmiennej objaniajcej (najczciej X):
ay =
Interpretacja uzyskanej oceny parametru przy zmiennej objaniajcej Zasada interpretacji parametru a (wspczynnika kierunkowego regresji liniowej) prostej regresji:
(a (a
y y
< 0)
=> =>
jeli X wzronie o 1 jednostk, to Y wzronie rednio o a jednostek, jeli X wzronie o 1 jednostk, to Y spadnie rednio o a jednostek.
a y = 2,5
Jeli ilo emitowanych dziennie w TV reklam wzronie o 1 reklam to spowoduje to wzrost wysokoci obrotw rednio o 2,5 [tys. z]. Interpretacja wyrazu wolnego w regresji Czsto spotykan interpretacj jest warto Y, gdy X = 0. b = 3,5 Jeli poziom ilo emitowanych dziennie (w szt.) jest zerowa, wysoko obrotw wynosi rednio 3,5 (tys. z). c) Wyznaczy prost regresji liczby reklam wzgldem obrotw. Poda interpretacj parametrw regresji.
xi = ax * yi + b ax =
cov( x, y ) 4,167 = = 0,38 S 2 ( y) 3,32 2 b = x a x * y = 5 ( 0,38) *16 = -1,06 x i = 0,38 * y i - 1,06 a x = 2,5
[oszacowany model]
Wzrost wysokoci obrotw o 1 tys. z powoduje wzrost ilo emitowanych dziennie w TV reklam rednio o 0,38 [reklamy]. Interpretacja wyrazu wolnego w regresji Czsto spotykan interpretacj jest warto Y, gdy X = 0. b = -1,06 Brak sensu ujemnej liczby reklam. d) Jeli zwikszymy ilo reklam do 8 dziennie, to jakie bd spodziewane obroty? Przyjte oznaczenie w analizie regresji liniowej: X ilo emitowanych dziennie w TV reklam = 8 Y - wysoko obrotw w tys. z = ? Oszacowana warto:
Interpretacja Spodziewane obroty bd wynosi 23,5 tys. z. e) Otrzymano obroty 17 tys. z, jaka bya przypuszczalna liczba reklam dziennie? X ilo emitowanych dziennie w TV reklam = ? Y - wysoko obrotw w tys. z = 17 tys. z Oszacowana warto:
Interpretacja Przypuszczalna liczba reklam dziennie bdzie wynosi 5,4 reklam. w. 2. W celu zbadania zalenoci midzy cenami X a poda Y wynotowano w 10 rnych okresach ceny danego artykuu i jego poda. Otrzymano nastpujce wyniki: rednia cena 25 x z, rednia poda 17 y tys. sztuk oraz
a) Gdzie obserwujemy wiksze zrnicowanie, w przypadku cen czy poday? X ceny Y poda
S ( x ) = S 2 ( x ) = 90 = 9,487
S( y) = S 2 ( y) = 6
Vklas = Vklas
Interpretacja Wiksze zrnicowanie obserwujemy wrd cen, bo wspczynnik V jest wyszy dla cen. b) Oceni zaleno midzy badanymi cechami.
rxy =
cov ( x, y ) 54 = = 0,949 S( x ) S ( y ) 90 * 36
korelacja prawie pena
rxy <1,0
ay =
cov( x, y ) 54 = = 0,6 S 2 ( x) 90
xi = ax * yi + b (Model regresji X wzgldem Y) cov( x, y ) 54 ax = = = 0,9 [wspczynnik kierunkowy w regresji] S 2 ( y) 60 b = x a x * y = 25 ( 0,9 ) *17 = 9,7 x i = 0,9 * y i + 9,7 [oszacowany model]
d) Oszacowa cen artykuu, gdy poda wynosi 16 tys. sztuk. X ceny = ?
x i = 0,9 * y i + 9,7
Tabela:
xi
yi
( x x)
i
( yi y )
23,29 16,29 9,29 12,29 -14,71 -17,71 -28,71 suma n kowariancja
( x x )( y y )
i i
( x x)
i
( yi y ) 2
542,22 265,22 86,22 150,94 216,51 313,80 824,51 2399,43 7 342,78 18,51
-192,94 -102,37 -21,22 -3,51 -54,65 -101,22 -221,51 -697,43 suma 7 n -99,633 wariancja odchylenie
68,65 39,51 5,22 0,08 13,80 32,65 59,51 219,43 7 31,35 5,60
x=
xi
i =1
114 = = 16,29 7
y=
y
i =1
481 = 68,71 7
S ( x) =
( x x)
i =1 i
219,43 = 5,60 7
S ( y) =
( y y)
i =1 i
2399,43 = 18,51 7
Kowariancja:
cov( x, y ) =
( x x )( y y ) = 481 = 68,71
i =1 i i
rxy =
rxy <1,0
Interpretacja Warto r = - 0,961 oznacza, e midzy szerokoci szosy, a liczb wypadkw zachodzi ujemna prawie pena korelacja. Wraz ze wzrostem szerokoci szosy spadkowi podlega liczba wypadkw. b) Wyznaczy prost regresji liczby wypadkw w zalenoci od szerokoci szosy i zinterpretowa wspczynniki regresji. Oceni przecitn liczb wypadkw na szosach o szerokoci 15 i 25 m.
yt = a y * x t + b
Znale oszacowania parametrw regresji prostej (z jedn zmienn objaniajc) to oznacza znale wartoci wyrazu wolnego (b) oraz wspczynnika kierunkowego regresji liniowej (a). a,b = ? Wspczynnik kierunkowy w regresji prostej (a) to parametr stojcy przy zmiennej objaniajcej (najczciej X):
ay =
y t = -3,18x t Oszacowane rwnanie regresji liniowej ma posta: X szeroko szosy w metrach = 15, Y liczba wypadkw = ? X szeroko szosy w metrach = 25, Y liczba wypadkw = ? y t = -3,18x t + 120,48 = -3,18 *15 + 120,48 = 72,78 y t = -3,18x t + 120,48 = -3,18 * 25 + 120,48 = 40,98
+ 120,48
Jeli szosa ma szeroko 15 m, wwczas oczekiwana liczba wypadkw to ok. 73 wypadki. Jeli szosa ma szeroko 25 m, wwczas oczekiwana liczba wypadkw to ok. 41 wypadkw. Zad. 2. Spoycie dwch rodzajw napojw (w litrach) przez studentw przedstawia ponisza tabela:
Obliczy szacowane spoycie A, jeeli spoycie B jest rwne 70. X spoycie B = 70 Y spoycie A = ? Tabela:
xi
25 30 39 35 50 55 234,00 6 39,00
yi
15 25 30 35 45 54 204,00 6 34,00
( x x)
i
( yi y )
-19,00 -9,00 -4,00 1,00 11,00 20,00 suma n kowariancja
( x x )( y y )
i i
( x x)
i
( yi y ) 2
361,00 81,00 16,00 1,00 121,00 400,00 980,00 6 163,33 12,78
suma n rednia
266,00 81,00 0,00 -4,00 121,00 320,00 784,00 suma 6 n 130,667 wariancja odchylenie
Zad. 3. W pewnym zakadzie przeprowadzono badanie w celu ustalenia zalenoci midzy produkcj pewnego wyrobu (w tonach) zmienna zalena (X) a zuyciem surowca (w kg), potrzebnego do produkcji tego wyrobu zmienna niezalena (Y). Otrzymano nastpujce wyniki: , r = 0,914. Oszacowa wielko produkcji wyrobu przy zuyciu 80 kg danego surowca. Zad. 4. Dla 50 losowo wybranych rodzin obliczono, e rednie miesiczne spoycie misa w rodzinie wynosi 12kg., a wspczynnik zmiennoci 10%. redni dochd rodziny wynis natomiast 3 tys. z. i wspczynnik zmiennoci 20%. Obliczono rwnie kowariancj midzy spoyciem misa a dochodem rwn 0,648: a) Obliczy i zinterpretowa wspczynnik korelacji. b) Wyznaczy parametry prostej regresji spoycia misa od dochodw i poda interpretacje. Zad. 5. W zakadach odzieowych przeprowadzono badania w celu ustalenia zalenoci midzy dugoci serii produkcji w tys. sztuk (X) a jednostkowym kosztem produkcji wyrobu w tys. z (Y). Otrzymano proste regresji: x = -0,003y + 1,7 y = -0,27x + 5,16 a) Poda interpretacj wspczynnikw regresji. b) Okreli si zalenoci midzy cechami. c) W jakim procencie zmienna X wyjania zmienn Y? d) Jaki jest przewidywany poziom kosztu jednostkowego przy serii o dugoci 10 tys. sztuk? e) Jaka jest oczekiwana dugo serii, gdy koszt jednostkowy wynosi 200 z? f) Obliczy rednie dugoci serii produkcji oraz jednostkowego kosztu produkcji. Z podrcznika Statystyka. Elementy teorii i zadania zadania z rozdziau 11.