Download as pdf or txt
Download as pdf or txt
You are on page 1of 34

Sveuilite u Rijeci Fakultet za menadment u turizmu i ugostiteljstvu Sveuilini preddiplomski studij Poslovna ekonomija u turizmu i hotelijerstvu Temeljni predmet

S T A T I S T I K A
PREDAVANJE 8:

KORELACIJSKA I REGRESIJSKA ANALIZA

Ciljevi predavanja
Objasniti razliku izmeu funkcionalnih i statistikih veza meu pojavama Definirati pojam regresijske analize Objasniti postupak izraunavanja modela jednostavne linearne regresije (izraunavanje pravaca regresije) Definirati pojam korelacijske analize Definirati pojam dijagrama rasipanja Definirati pojam koeficijenta linearne korelacije (naglasak na Pearsonovom koeficijentu) Definirati pojam koeficijenta korelacije ranga (naglasak na Spearmanovom koeficijentu) Objasniti postupak izraunavanja spomenutih koeficijenata Objasniti znaenje izraunatih parametara.

Uvod
Mnoge pojave u poslovanju, gospodarstvu i drugim podrujima djelatnosti su meusobno povezane i uvjetovane. Npr. poveanje opsega proizvodnje poveava ukupne trokove; osobna potronja stanovnitva ovisi o raspoloivom dohotku; teina osoba ovisi o njihovoj visini, spolu;... Stoga je vano poznavati njihovu uzronoposljedinu vezu. Primjena: ispitivanje meusobnih odnosa pojava vano je u gospodarskoj analizi, poslovnom odluivanju i sl. Cilj istraivanja odnosa meu pojavama je utvrditi statistiku ovisnost i pokazatelje jakosti takve ovisnosti. U tu svrhu se koriste metode regresijske i korelacijske analize (regresija = statistiki odnos meu pojavama; korelacija = uzajamna ovisnost).

Funkcionalne i statistike veze


Odnosi (veze) meu pojavama mogu biti funkcionalni i statistiki (stohastiki). Funkcionalni odnosi (veze) su postojani, izraavaju zakonitosti koje se iskazuju analitiki (formulom, jednadbom). Svakoj vrijednosti jedne pojave odgovara tono odreena vrijednost druge pojave. Primjer: povrina kvadrata ovisi o njegovoj stranici. Odnos je funkcionalan, jer se izraava jednadbom (P=a2). Statistiki ili stohastiki odnosi (veze) su slabiji od funkcionalnih. Svakoj vrijednosti jedne pojave odgovara vie razliitih vrijednosti druge pojave. Takva odstupanja su u praksi ea. Primjer: zaposlenici iste strune spreme imaju razliite (a ne iste) plae; kuanstva s istim dohotkom imaju razliitu (a ne istu) razinu potronje; sve osobe iste visine nemaju jednaku teinu;...

Regresijska analiza
Regresijska analiza se sastoji u primjeni metoda kojima se analitiki (jednadbom) objanjava statistika veza izmeu promatranih pojava. U okviru regresijske analize istrauje se uzrono-posljedini karakter veze. Jedna varijabla je uzrok (nezavisna varijabla), a druga je posljedica (zavisna varijabla). Regresijska analiza se temelji na regresijskom modelu. To je jednadba s parametrima i varijablama, kojima se objanjava povezanost promatranih pojava, te se predviaju vrijednosti zavisne varijable za odreene vrijednosti nezavisne varijable. Uz zavisnu varijablu moe biti samo jedna nezavisna varijabla (jednostavni regresijski model) ili vei broj nezavisnih varijabli (model multiple ili viestruke regresije).

Model jednostavne linearne regresije


Modelom jednostavne linearne regresije analitiki se izraava odnos izmeu dviju pojava (zavisna i nezavisna varijabla). Karakteristika ovog modela je, da promjenu jedne pojave prati priblino jednaka linearna promjena druge pojave. Analiza jednostavne linearne regresije sastoji se u utvrivanju jednadbe regresijskog pravca i pripadajuih mu parametara (odreuju se dva pravca, jedan za zavisnu, drugi za nezavisnu varijablu). Jednadba prvog pravca regresije:

Yc = a + b x

Model jednostavne linearne regresije


Izraunavanje parametara:

XY X Y b= X XX
2

a =Y bX
X X= N

Y Y= N

Model jednostavne linearne regresije


Jednadba drugog pravca regresije:

Xc= a +b y
' '
Izraunavanje parametara:

XY YX b= Y YY
' 2

a ' = X b 'Y

Model jednostavne linearne regresije


Znaenje koeficijenta a (a): Parametar a u regresijskoj jednadbi predstavlja konstantni lan. To je regresijska (oekivana) vrijednost zavisne varijable Y kada je nezavisna varijabla X jednaka nuli. Obino nema posebno znaenje te se esto ne moe smisleno interpretirati. Primjer 1: utvrivanjem odnosa izmeu ostvarenog prometa (varijabla X) i dobiti (varijabla Y), parametar a iznosi -1,55 mil. kn. Interpretacija izraunatog parametra: oekuje se gubitak od 1,55 mil. kn ako poduzee ne radi (ne ostvari promet). Primjer 2: u modelu gdje je ostvareni promet zavisna, a broj zaposlenih nezavisna varijabla, parametar a iznosi 11.300 kn. Interpretacija izraunatog parametra: oekuje se ostvarenje prometa od 11.300 kn, ako broj zaposlenih iznosi nula (ovdje se vidi da parametar a nema uvijek logino znaenje).

Model jednostavne linearne regresije


Znaenje koeficijenta b (b): Parametar b zove se regresijski koeficijent. To je najvaniji pokazatelj u regresijskoj analizi. Pokazuje prosjenu linearnu promjenu zavisne varijable Y ako se nezavisna varijabla X promijeni za jedinicu mjere. Primjer 1: utvrivanjem odnosa izmeu ostvarenog prometa (varijabla X) i dobiti (varijabla Y), parametar b iznosi 0,13 mil. kn. Interpretacija izraunatog parametra: ako promet poraste za 1 mil. kn, dobit e u prosjeku porasti za 0,13 mil. kn. Primjer 2: u modelu gdje je ostvareni promet zavisna, a broj zaposlenih nezavisna varijabla, parametar b iznosi 5.660kn. Interpretacija izraunatog parametra: u sluaju poveanja broja zaposlenih za jedan, oekuje se poveanje prometa u prosjeku za 5.660kn.

Model jednostavne linearne regresije


PRIMJER 1. Na prvom i drugom kolokviju iz kolegija Statistika est studenata dobilo je bodove prikazane u tablici. I. kolokvij II. kolokvij 88 47 62 63 55 70 96 80 78 70 49 40

Odredite prvi i drugi pravac regresije.

Model jednostavne linearne regresije


PRIMJER 1. - Rjeenje:

I. kolokvij II. Kolokvij X Y 88 62 55 96 78 49 428 47 63 70 80 70 40 370

XY 4 136 3 906 3 850 7 680 5 460 1 960 26 992

X2 7 744 3 844 3 025 9 216 6 084 2 401 32 314

Y2 2 209 3 969 4 900 6 400 4 900 1 600 23 978

Model jednostavne linearne regresije


Izraunavanje jednadbe prvog pravca regresije:

Yc = a + bx
x y x y 26.992 71,33 370 599,90 = b= = = 0,34 x x x 32.314 71,33 428 1.784,76
2

x 428 x= = = 71,33 N 6

y 370 y= ,67 = = 61 N 6

Model jednostavne linearne regresije


(nastavak)

a = y b x = 61,67 0,34 71,33 = 37,42

Yc = 37 , 42 + 0,34 x

Model jednostavne linearne regresije


Izraunavanje jednadbe drugog pravca regresije:

Xc = a + b y
, ,

x y y x 26.992 61,67 428 597,24 = = = 0,51 = y y y 23.978 61,67 370 1.160,10


2

a = x b y = 71,33 0,51 61,67 = 39,88


, ,

Xc = 39,88 + 0,51 y

Korelacijska analiza
Korelacijska analiza sastoji se u primjeni metoda kojima se utvruje stupanj (jakosti i smjer) povezanosti izmeu promatranih pojava. Prema smjeru veze razlikujemo pozitivnu i negativnu korelaciju. Pozitivna korelacija: porast jedne pojave prati porast druge pojave, tj. pad jedne pojave prati pad druge pojave (npr. opseg proizvodnje i ukupni trokovi; dohodak po stanovniku i standard stanovnitva). Negativna korelacija: porast jedne pojave prati pad druge pojave, tj. pad jedne pojave prati porast druge pojave (npr. standard stanovnitva i mortalitet). Korelacijska analiza ukljuuje grafiki prikaz (dijagram rasipanja) i utvrivanje brojanog pokazatelja jakosti i smjera veze izmeu varijabli (koeficijent korelacije)

Korelacijska analiza dijagram rasipanja


Dijagram rasipanja ili oblak rasprenosti je grafiki prikaz pomou kojeg se uoava priroda odnosa izmeu promatranih pojava. Sastoji se od toaka, koje su odreene parovima vrijednosti varijabli X i Y. Iz rasporeda toaka u dijagramu rasipanja zakljuuje se o obliku, smjeru i jakosti veze. to su toke blie zamiljenom pravcu, veza je jaa, odnosno, to su toke udaljenije (rasprenije) od zamiljenog pravca, veza je slabija. Ako toke ine pravac, veza je funkcionalna ili potpuna. Veza je pozitivna, ako oblak toaka ima smjer od lijevog donjeg prema desnom gornjem kutu grafikona, tj. veza je negativna ako oblak toaka ima smjer od lijevog gornjeg prema desnom donjem kutu grafikona. Ako se iz rasporeda toaka ne moe definirati ni jedna spomenuta vrsta veze, veze izmeu pojava nema.

Korelacijska analiza dijagram rasipanja


Slika 1: Jaka i pozitivna veza

Korelacijska analiza dijagram rasipanja


Slika 2: Slaba veza

Korelacijska analiza dijagram rasipanja


Slika 3: Funkcionalna ili potpuna i negativna veza

Korelacijska analiza dijagram rasipanja


Slika 4: Odsustvo veze (veze nema)

Korelacijska analiza koeficijent korelacije


Koeficijent korelacije je brojani pokazatelj stupnja statistike povezanosti meu pojavama. Koeficijent korelacije moe poprimiti vrijednosti iz intervala od -1 do +1. Predznak pokazuje smjer (pozitivna ili negativna veza), a veliina koeficijenta pokazuje jakost veze (jaka, slaba, srednja, potpuna):
Potpuna negativna veza jaka negativna veza -1 -0,6 Odsustvo veze srednje jaka slaba negativna negativna veza veza -0,3 0 slaba srednje jaka pozitivna pozitivna veza veza 0,3 Potpuna pozitivna veza jaka pozitivna veza 0,6 1

Korelacijska analiza koeficijent korelacije

Vrste koeficijenata korelacije: - koeficijent linearne korelacije, - koeficijent multiple ili viestruke linearne korelacije, - koeficijent krivolinijske korelacije, - koeficijent korelacije ranga.

Koeficijent linearne korelacije


Koeficijent linearne korelacije (Pearsonov koeficijent linearne korelacije) je brojana mjera kojom se mjeri jakost i smjer povezanosti dviju pojava koje su u linearnom statistikom odnosu. Oznaka: r. Formule: (1)

r=

(X X) (Y Y) (X X) (Y Y)
i i 2 i i

ili (2)

r=

b b

'

Koeficijent linearne korelacije


PRIMJER 2. Na prvom i drugom kolokviju iz kolegija Statistika est studenata dobilo je bodove prikazane u tablici. I. kolokvij II. kolokvij 88 47 62 63 55 70 96 80 78 70 49 40

Izraunajte koeficijent linearne korelacije, te objasnite njegovo znaenje.

Koeficijent linearne korelacije


RJEENJE: U Primjeru 1 su izraunati parametri b i b, te e se traeni koeficijent izraunati pomou formule (2).

r = b b = 0,34 0,51= 0,42


,

Zakljuak: Vrijednost koeficijenta linearne korelacije (r=0,42) pokazuje, da je veza izmeu bodova ostvarenih na prvom i drugom kolokviju srednje jaka i pozitivna.

Koeficijent korelacije ranga


Stupanj povezanosti izmeu pojava koje su izraene modalitetima redoslijednog obiljeja (npr. ocjena, broj bodova,...) mjeri se koeficijentom korelacije ranga. Razlikujemo dvije vrste koeficijenta korelacije ranga: 1. Spearmanov koeficijent korelacije ranga 2. Kendallov koeficijent korelacije ranga Postupak pridruivanja rangova: elementu s najmanjim stupnjem svojstva pridruuje se rang jedan, sljedeemu rang dva, a posljednjemu rang N, koji ujedno oznaava najvei stupanj promatranog svojstva. Kod jednakih vrijednosti dodjeljuje se prosjeni rang.

Koeficijent korelacije ranga


Spearmanov koeficijent korelacije ranga izraunava se kod ispitivanja korelacije dviju varijabli ranga. Oznaka: rs Formula:

rs = 1

6 d i2 n n
i =1 3

= rx ry

Koeficijent korelacije ranga


PRIMJER 3. Na prvom i drugom kolokviju iz kolegija Statistika est studenata dobilo je bodove prikazane u tablici. I. kolokvij II. kolokvij 88 47 62 63 55 70 96 80 78 70 49 40

Izraunajte Spearmanov koeficijent korelacije ranga i objasnite njegovo znaenje. Nacrtajte dijagram rasipanja.

Koeficijent korelacije ranga


RJEENJE: I. kolokvij X 88 62 55 96 78 49 II. Kolokvij Y 47 63 70 80 70 40 rx 5 3 2 6 4 1 ry 2 3 4,5 6 4,5 1 di 3 0 -2,5 0 -0,5 0 d i2 9 0 6,25 0 0,25 0 15,50

Koeficijent korelacije ranga


Postupak odreivanja rangova: Stupac rx: najmanji broj ostvarenih bodova na 1. kolokviju (stupac X) je 49 rang 1; sljedei vei broj bodova je 55 rang 2, ..., najvei broj bodova na 1. kolokviju je 96 rang 6. Stupac ry: najmanji broj ostvarenih bodova na 2. kolokviju (stupac Y) je 40 rang 1,... Dva studenta ostvarila su jednak broj bodova (70), kojima po veliini pripadaju rangovi 4 i 5. Kako se radi o jednakim vrijednostima, potrebno je izraunati prosjeni rang:

4+5 r (70) = = 4,5 2

Svakom bodu 70 dodjeli se rang 4,5.

Koeficijent korelacije ranga


Izraunavanje rs:

6 15 ,50 93 =1 =1 =1 0,44= 0,56 rs =1 3 216 6 210 n n


Zakljuak:

6 di

Na temelju dobivene vrijednosti koeficijenta korelacije ranga moe se zakljuiti da postoji srednje jaka i pozitivna veza izmeu bodova ostvarenih na prvom i drugom kolokviju.

Koeficijent korelacije ranga


Dijagram rasipanja
90 80 70 60 50 Y 40 30 20 10 0 0 20 40 60 X 80 100 120

Literatura

oi, I., Serdar, V., Uvod u statistiku, kolska knjiga, Zagreb, 2000., str. 79-133. oi, I., Statistika udbenik za srednje kole sa zbirkom zadataka, kolska knjiga, Zagreb, 2006., str. 196-228. Papi, M., Primijenjena statistika u MS Excelu, Zoro, Zagreb, 2005., str. 133-154. Gogala, Z., Osnove statistike, Sinergija, Zagreb, 2001., str. 131154. Rozga, A., i Gri, B., Poslovna statistika, Veleuilite u Splitu, Split, 2000., str. 121-136.

You might also like