Download as doc, pdf, or txt
Download as doc, pdf, or txt
You are on page 1of 6

Analiza regresji

Zadanie 1

Wiek Cena
1 40
2 32
2 33
3 27
3 25
3 26
5 17
7 12
8 9
34 221
a) Określić zmienną zależną i niezależną.
b) Wraz ze wzrostem wieku cena…………….
c) Oblicz współczynnik korelacji i podaj jego interpretację.
d) Wyznaczyć liniową funkcję regresji opisującą wpływ wieku samochodu na jego cenę.
e) Wyznaczyć parametry dopasowania liniowej funkcji regresji do rzeczywistej ceny
samochodu.
f) Oszacować cenę auta 6-letniego z uwzględnieniem średniego błędu szacunku.

b = - 4,17 tys. zł
Przy wzroście wieku samochodu o 1 rok, cena zmniejsza się przeciętnie o 4,17 tys. zł.
a = 40,30 tys. zł
Jeżeli wiek samochodu wynosi 0 lat (nowy), to jego teoretyczna cena wynosi 40,30 tys. zł.

Współczynnik determinacji
R2 – im większa wartość, tym lepiej dopasowana funkcja regresji.

R2 = 95%
Zmienność ceny samochodu wyjaśniona jest zmiennością wieku samochodu w 95%.
Cena samochodu jest zależna od poziomu wieku samochodu w 95%.
Wiek wyjasnia w 95% cenę samochodu.

Współczynnik indeterminacji
φ2 – im mniejsza wartość, tym lepiej dopasowana funkcja regresji.

φ 2 = 5%
Zmienność ceny samochodu nie jest wyjaśniona zmiennością wieku samochodu w 5%.
Cena samochodu nie zależy od poziomu wieku samochodu w 5%.

Średni błąd szacunku


(odchylenie standardowe składnika losowego)
Se = 2,43 tys. zł
Rzeczywista cena samochodu odchyla się od teoretycznej ceny wyznaczonej liniową funkcją
regresji średnio o 2,43 tys. zł.
Współczynnik zmienności losowej
Ve – im mniejsza wartość, tym lepiej dopasowana funkcja regresji.

Ve = 9,85 %
Błąd standardowy stanowi 9,85% średniej ceny samochodów. Na średnią cenę samochodów
w 9,85%wpływają czynniki o charakterze losowym.
Teoretyczna cena 6-letniego samochodu po uwzględnieniu średniego błędu szacunku jest w
przedziale od 12,85 tys. zł do 17,71 tys.zł

15,29 – 2,43 <= y(6) <= 15,29 + 2,43


12,85 <= y(6) <= 17,71

Zadanie 2 DO DOMU
W pewnej firmie produkcyjnej badano zależność zużycia głównego surowca od wielkości
produkcji i otrzymano informacje zgodne z poniższą tabelą:
Zużycie surowca w tonach 1 2 3 4 5 6 7 8 9 10 11 12
Wielkość produkcji w tys. 8 10 13 18 20 21 22 24 25 27 30 32
kg

a) Określić zmienną zależną i niezależną.


b) Wraz ze wzrostem zużycia surowca, wielkość produkcji…………….
c) Wyznaczyć liniową funkcję regresji opisującą wpływ zużycia surowca na wielkość
produkcji.
d) Wyznaczyć parametry dopasowania liniowej funkcji regresji do rzeczywistej
wielkości produkcji
e) Oszacować wielkość produkcji, gdy zużycie surowca będzie na poziomie 15 ton..

Zadanie 3
Zbadano zależność między liczbą reklam pewnego wyrobu emitowanego dziennie w TV a
wysokością obrotów (w tys. zł).
Liczba Wielkość
reklam obrotów
3 115
5 133
4 142
5 150
6 148
7 151
1. Czy informacje potwierdzają istnienie zależności między liczbą reklam a wielkością
obrotów?
2. Przedsiębiorstwo planuje zwiększenie l. reklam do 8 dziennie. Określić spodziewane
obroty dla tej liczby reklam.
r = 0,79
rs = 0,81
y(8) = 163,23 + / - Se
Se = 9,44
153,79 tys. zł < = y(8) < = 172,67 tys. zł
Spodziewane obroty przy 8 reklamach dziennie
będą się kształtować w przedziale od 153,79 tys. zł do 172,67 tys. zł

Zadanie 4
Wylosowano 7 redakcji terenowych wydań pewnej gazety o krajowym zasięgu i zebrano
informacje o liczbie sprzedanych egzemplarzach w tys. i przychodzie z tytułu umieszczonych
reklam w mln zł.
Redakcja Sprzedaż Wielkość
w tys. obrotów
O 5,4 1,4
P 7,1 1,8
R 11,0 2,9
L 13,5 3,7
S 15,5 3,6
Ł 23,5 6,8
G 24,1 9,2
Suma 100 29,4
1. Określić jednostkę statystyczną i zmienne
2. Narysować diagram korelacyjny
3. Obliczyć współczynnik korelacji Pearsona
4. Wyznaczyć liniową funkcję regresji
5. Ocenić dopasowanie funkcji regresji do danych empirycznych

Zadanie 5
a) Regresja to……………………..przyporządkowania jednej cechy (zmiennej zależnej)
wartościom drugiej cechy (zmiennej niezależnej).
b) Zmienna X nazywana jest zmienną ……………….lub……………………………
c) Zmienna Y nazywana jest zmienną ……………….lub……………………………
d) Parametry funkcji regresji można szacować metodą……………………………………..,
która polega na zminimalizowaniu kwadratów odchyleń wartości empirycznych yi od
wartości teoretycznych (wyznaczonych z funkcji regresji).
e) Wartości teoretyczne oznaczamy symbolem ……………………….

Zad. 6
Zależność między l. osób w rodzinie (x) i poziomem miesięcznych wydatków na kulturę w
zł/os w 25 losowo wybranych gosp. domowych opisuje funkcja:
Y=86,7-12,5x, dla której 1-R2=0,2775 i Se2=1,44

1. Podać wartość i interpretację współczynnika regresji


2. Podać wartość i interpretację współczynnika determinacji
3. Podać wartość i interpretację odchylenia standardowego szacunku
4. Podać wartość i interpretację współczynnika korelacji Pearsona
5. Jakiej wysokości wydatków należy się spodziewać w 4-os. gospodarstwach
domowych

Zad. 7
Ustalić teoretyczną liczbę dzieci urodzonych przez kobiety o 5 letnim stażu małżeńskim,
jeżeli na podstawie badań empirycznych stwierdzono, że:

- przyrost stażu małżeńskiego o 1 rok, powodował średni wzrost liczby dzieci o 0,08
- wyraz wolny liniowego równania regresji liczby dzieci urodzonych względem czasu trwania
małżeństwa wynosi 0,7
- odchylenie standardowe szacunku wynosi 0,03

Zad. 8
Napisz jaki to rodzaj funkcji i podaj interpretację, przyjmując, że x- prędkość, y-droga
hamowania.

Y=0,022* x 1,714 Potęgowa Wzrostowi prędkości o 1% odpowiada wzrost długości drogi


hamowania przeciętnie o 1,714%

Y=3,22*1,024x wykładnicza Wzrostowi prędkości o 1 km odpowiada wzrost długości


hamowania przeciętnie o 2,4% (1,024-1)*100

Zad. 9
Zbadano zależność między przychodem z reklam ilości sprzedanych egzemplarzy gazety.
Która funkcja lepiej dopasowana jest do danych empirycznych?

F. liniowa F. wykładnicza
Równanie funkcji Y=1,048+0,367x Y=0,963*1,094x
Średni błąd szacunku 0,892 mln zł 0,691 mln zł
Współczynnik zmienności 21,2% 16,5%
R2 91,4% 95%
Powtórka

Zadanie 10.
Losowo wybrano 10 studentów, którzy uzyskali następującą liczbę punktów na egzaminie
pośrednim (x) i końcowym (y) z języka angielskiego.

xi 8 8 9 7 8 8 5 10 7 10
yi 7 8 8 5 5 6 6 10 6 9

1. Oszacuj parametry liniowego modelu regresji opisującego zależność liczby punktów


na egzaminie końcowym od liczby punktów na egzaminie pośrednim
2. Wyznacz wsp. zbieżności i determinacji
3. Zinterpretuj uzyskane wyniki
4. Jakiej liczby punktów na egzaminie końcowym może spodziewać się student, który na
egzaminie pośrednim uzyskał 6 punktów.

(A.Zeliaś „Metody statystyczne. Zadania i sprawdziany” str. 161)

Zadanie 11.
W poniższej tablicy przedstawiono dane dotyczące liczby samochodów osobowych na
1000 mieszkańców oraz liczby ofiar śmiertelnych na 100 wypadków dla wybranych
krajów świata.
Jaka jest zależność przyczynowo-skutkowa badanych zmiennych?
1. Oblicz współczynnik korelacji liniowej
2. Oszacuj parametry liniowej funkcji regresji
3. Oceń dopasowanie wyznaczonej funkcji regresji do danych empirycznych.
4. Jakie można wyciągnąć wnioski na podstawie uzyskanych wyników?

Kraj Liczba samochodów osobowych Liczba ofiar śmiertelnych


na 1000 mieszkańców na 100 wypadków
USA 542 2
Wielka Brytania 384 2
Austria 433 3
Włochy 479 4
Szwecja 408 4
Czechy 287 6
Dania 310 7
Węgry 212 8
Polska 185 13
Rosja 87 20
(A.Zeliaś „Metody statystyczne. Zadania i sprawdziany” str. 161)
Zad. 12
Poniżej podano informacje dotyczące wieku kobiet i ich miesięcznych wydatków na
kosmetyki.
a) Jak silna istnieje współzależność między wiekiem kobiety a wydatkami na kosmetyki?
b) Metodą najmniejszych kwadratów oszacuj współczynnik równania regresji i podaj
jego interpretację.
c) Oszacuj wydatki na kosmetyki kobiety 30-letniej
d) W jakim stopniu wiek kobiety wyjaśnia wielkość wydatków na kosmetyki?

Wiek kobiet Wydatki na kosmetyki


18 20
20 24
23 24
24 28
24 26
27 27
27 34

Zad. 13

Jeśli w analizie regresji zmienna zależna wyrażona jest w zł, to zmienna niezależna wyrażona
będzie:
a) Również w zł
b) W innej walucie
c) W dowolnych jednostkach
d) Żadna z powyższych odpowiedzi

Jeżeli wsp. Korelacji liniowej wynosi 0,4, to procent zmienności zmiennej zależnej
wyjaśnionej zmiennością zmiennej niezależnej wynosi:
a) 0,4%
b) 4%
c) 16%
d) 40%
e) Żadna z powyższych

Współczynnik determinacji liniowej jest:


a) Pierwiastkiem kwadratowym ze współczynnika korelacji
b) Zazwyczaj większy od zera
c) Kwadratem współczynnika korelacji
d) Żadna z powyższych odpowiedzi

You might also like