Download as doc, pdf, or txt
Download as doc, pdf, or txt
You are on page 1of 23

Mirza Muhi ima greka, kod viestrukog regresionog modela na slici sa etri strelice u boji.

strelice trebaju da idu na kolonu coef a ne na std error Mirza Muhi poto radim ovaj zadatak to je on stavio moe li neko samo da kae ta je "prediktor", je li to varijabla sales ili su one druge . to je odre!ivanje adekvatne veliine uzorka

". #$%#&'()*$ +&,-#$.(


+ipoteza je tvrdnja koju je mogue empirijski provjeriti. )ulta hipoteza uvijek odraava status/0uo situaciju. 1rugim rijeima, ukoliko se ne odbaci nulta hipoteza onda ne treba poduzimati nikakve korektivne akcije dok alternativna hipoteza odraava ono to istraiva smatra da je istina. +ipoteza moe biti postavljena jednosmjerno, dvosmjerno i viesmjerno. 2riterij koji koristimo za prihvatanje ili odbacivanje nulte hipoteze naziva se nivoom statistike znaajnosti a izraava se preko p-vrijednosti. 1akle, p-vrijednost nije nita drugo nego vjerovatnoa da dobijemo rezultat toliko razliit od onog kojeg bi imali pod pretpostavkom da je nulta hipoteza istinita. 3koliko je p<0,05 nulta hipoteza se odbacuje. ,ostoji nekoliko naina kkako e se testirati hipoteza odnosno koji tip testa e se koristiti. 3 zavisnosti od mjerne skale i postavke hipoteze, odnosno broja uzoraka biramo koji test koristimo. One-Sample T o-Sample Tests Measure/ ment %cale !elated Samples k-Sample Tests "ndependent Samples

"ndependent !elated Samples Samples

4inomial Mc)emar #ominal x2 one/ test sample test 2olmogorov/ 8ilco9on Ordinal %mirnov one/ test sample test t/test for "nterval -ne/sample paired and !atio t/test samples

x2 t5o/ x2 for k 6ochran 7 samples test samples Mann/ 8hitne: 3 test ;riedman test 2ruskal/ 8allis test

'epeated/ &ndependent -ne/5a: measures t/test ()-<( ()-<(

#estovi kod kojih je zavisna varijabla =efekat> mjerena na nominalnom ili ordinalnom nivou nazivaju se neparametarski testovi. % druge strane, ako je zavisna varijabla metrijskog tipa =intervalna ili racio> onda govorimo o parametarskim testovima. *o jedna stvar na koju treba obratiti panju prilikom izbora testa je da li su uzorci zavisni ili nezavisni =to je hipoteza sa ? ili vie tj. k/uzoraka>. %lovo 6@ ne treba kucati u program, to je samo ovdje obiljeje da se radi o naredbi.

,rije poetka dobro bi bilo instalirati slijedee alate i upoznati sa sa nekim optim naredbama. ,rvo instalirati csgof. 6@ findit csgof. *o dvije naredbe koje mogu valjati@ 6@ codebook imevarijable A gleda se kako je kodirana varijabla, koja je oznaka data vrijednostima iz neke odre!ene varijable koju gledamo, npr. varijabla spol i tu vidimo da su mukarci oznaeni sa B a ene sa ", moglo se koristiti " i ?. 6@ tab imevarijable A tabelarni pregled varijable ,rimjeri $. %inomni test =)ominalna varijabla, jedan uzorak> -vim metodom se testira jednosmjerna hipoteza sa nominalnom varijablom. 3 primjeru koji je dao profesor =baza podataka seniors.dat> traeni su odgovori na slijedea pitanja@ ". 2olika je proporcija ispitanika prema polu u uzorkuC 6@ tab gender, missing A ovim je pokazana struktura varijable gender i vidi se koliko je ena a koliko mukaraca

?. ,retpostavimo da je u +olandiji u slinoj studiji u uzorku bilo DEF ena. 1a li se postotak ena iz belgijskog uzorka =Seniors.dta> statistiki znaajno razlikuje u odnosu na holandski uzorakC 6@ bitest genderG.DE 3 naredbu smo unijeli .DE jer je to predpostavljena proporcija u odnosu na koju se testira opservirana proporcija. )akon naredbe se dobije ovo

Hleda se drugi red dole. <rijednost B,BD =to je ono p> kae da trebamo prihvatiti nultu hipotezu, to znai da se postotak ena iz belgijskog uzorka ne razlikuje statistiki znaajno od holandskog. =tako je profa postavio hipoteze>

&. 'i kvadrat test proporcije =)ominalna varijabla, jedan uzorak>

&sta baza podataka. ,roporcija je objanjena na prethodnom primjeru. 1a li su ove tri grupe ravnomjerno zastupljene u uzorkuC 6@ csgof education )isam ba najsigurniji ta se dobilo ovom naredbom. -igledano je da nisu svi isto zastupljeni, jer prva i druga kolona su neke oekivane vrijednosti dok u treoj koloni imamo observirane vrijednosti. 3glavnom trebalo bi zbog ovog pGB da se odbaci nulta hipoteza

,retpostavimo da u ukupnoj populaciji otprilike ima I miliona ljudi, od ega ". miliona sa osnovnim obrazovanjem =?DF>, ?.J miliona sa srednjokolskim obrazovanjem =IKF> i " milion sa nekim vidom vieg obrazovanja =?BF>. 1a li je na uzorak reprezentativan u pogledu populacije kada je rije o stepenu obrazovanjaC 6@ csgof education, e9pperc =?D IK ?B> A iznosi u zagradi uzeti prema zadatim vrijednostima iz zadatka

)ije ba najjasnije objanjeno u profesorovim materijalima ali mislim da je uzorak reprezentativan jer se prema ovom pGB nulta hipoteza odbija a prihvaa alternativana koja bi trebala da ide u korist reprezentativnosti uzorka. (. T-test =Metrijska varijabla, jedan uzorak> &sta baza podataka. #/test sa jednim uzorkom testira nultu hipotezu tako to pretpostavlja da je srednja vrijednost populacije jednaka ,itanje@ ,retpostavimo da u drugom uzorku prosjena vrijednost za varijablu Lvalue consciousenessM iznosi .NC 1a li se ovaj prosjek statistiki znaajno razlikuje odnosu navrijednost u naem uzorku =Seniors.dta>C 6@ ttest valueG .N if ageGG =uvijek iz &; naredbe idu dva znaka jednakosti>

Hledamo vrijednost oznaenu strelicom. ,okazuje da je pGB, znai odbacujemo nultu hipotezu i prihvatamo alternativnu. 'azlikuje se znaajnoCCC ). 'i kvadrat test, =test sa dva nezavisna uzorka> +i/kvadrat test se koristi kada elite vidjeti postoji li veza izme!u dviju kategorian varijabli. -tvoriti bazu 61.sav. ,itanje@ 1a li pol ispitanika ima uticaj na odluku o kupovini novog 61/aC ,rvo je provjeren sadraj varijable da se vidi koliko mukaraca i ena hoe ili nee kupiti 61. 6@ tab bu:ing gender

.atim se radi +i/kvadrat test za dva nezavisna uzorka. 6@ tab 43O&)H gender, column nofre0 chi?

3 ovom sluaju postoji statistika znaajnost. ,GB.BBBB =pPB,BI>, nulta hipoteza se odbaciju i prhvata se alternativna koja glasi da postoji statistika znaajnost. &z tabele se vidi da e veina ena kupiti 61. 5. *ann-+hitne, - test =-rdinalna varijabla, dva nezavisna uzorka> -tvoriti bazu podataka %eniors.dta. &spitanici su zamoljeni da probaju I vrsta pia =(, 4, 6, 1 i $> i rangiraju ih prema svojim preferencijama. ,ie koje najvie preferiaju oznaeno je sa ", a ono koje najmanje preferiraju sa I. <arijabla rankA sadri rang =" do I> koji je svaki ispitanik dodijelio piu (. ,itanje@ 1a li postoji razlika izme!u mukaraca i ena u pogledu rangiranja pia (C 6@ ranksum, rank(, b:=gender>

Hleda se prob .. 3 ovom sluaju vee je od B,BI i nulta hipoteza se prihvata. .akljuak@ ne postoji razlika izme!u mukaraca i ena po pitanju rangiranja piaCCC .. #ezavisni t-test, =&ntervalna varijabla, dva nezavisna uzorka> -tvoriti file car.dta. &spitanici su zamoljeni da na skali od " do "B izraze svoje preferencije prema automobilu ( i automobilu 4. )a skali " ocjena " oznaava potpunu averziju a ocjena "B potpuno prefereiranje. ,ored ovoga zabiljeen je i podatak o polu ispitanika. ,itanje@ 1a li postoji razlika izme!u mukaraca i ena u pogledu preferencija prema automobilima ( i 4C #reba uraditi test o homogenosti varijanse. 6@ sdtest pQcarQa, b:=gender>

Hleda se f koje je oznaeno strelicom. <arijansa je homogena i test je nesignifikantan. ,oto je varijansa bila homogena idemo na slijedei korak. 6@ ttest pQcarQa, b:=gender>.

& ovdje varijansa nije homogena pa se ide na sljedei korakCCC =ovo profa nije objasni ta se ovdje deilo> 6@ ttest pQcarQb, b:=gender> -vdje smo radili ttest sa pretpostavkom da su varijanse nejednake.

Hleda se opet t i poto u ovom sluaju iznosi preko B,I varijanse su homogene i to je dokaz da ima razlike u preferencijama. /. *c#emar test =nominalna varijabla, dva zavisna uzorka> -tvoriti file 5ine.dta. )a sajmu vina, na tandu jednog od izlagaa ljudi su mogli kupiti brand L(M. &zlaga je organizovao eksperiment. %luajno je odabrano "BB posjetilaca sajma koji su obilazili izlobene tandove i koji ranije nisu probali brand L(M. %vakom od odabranih ispitanika prvo je postavljeno pitanje da li bi kupio bocu vina marke L(M, bez da ga probaC 1akle, samo na bazi izgleda =dizajn boce, miris i sl.>. .atim je svakom ispitaniku ponu!eno da proba au vina branda L(M i onda mu je postavljeno pitanje da li je nakon probe promjenio miljenje i da li bi kupio vino L(M. ,itanje@ 2oliko ispitanika je nakon probe promjenilo miljenjeC )apravite krostabelaciju odgovora prije probe i nakon probe =kod krostabeliranja uobiajeno je da redovi predstavljaju vrijednosti nezavisne varijable, a kolone vrijednosti zavisne varijable>. ,rvo se uradi krostabeliranje da se vidi koliko je ljudi kupilo vino prije probanja, koliko nakon probanja i koliko nije kupilo vino u ove dvije situacije. 6@ tab before after =before i afte su imena varijabli, ne neki dijelovi naredbi za statu>

)a slici se vidi da je ?B ljudi promijenilo miljenje.

,itanje@ 1a li je rezultat testiranja ukusa vina statistiki signifikantanC 6@ mcci II "I I ?I =unose se projevi po redovima iz tabele>.

'ezultat je da je test statistiki signifikantan jer je nae p u ovom sluaju GB,BK"K =pPB,BI>. /. +ilco0onov test =-rdinalna varijabla, dva zavisna uzorka> -tvoriti file seniors.dta. &spitanici su zamoljeni da probaju I vrsta pia =(, 4, 6, 1 i $> i rangiraju ih prema svojim preferencijama. ,ie koje najvie preferiaju oznaeno je sa ", a ono koje najmanje preferiraju sa I. <arijabla R'ank(S sadri rang =" do I> koji je svaki ispitanik dodijelio piu (. .amislimo da je nakon eksperimenta ispitanicima reeno da pie ( sadri odre!eni sastojak za koji se smatra da je tetan ali to nikad nije pouzadno dokazano. )akon ovoga ispitanici su zamoljeni da ponovo rangiraju svih pet pia. <arijabla R'ank((S sadri rang =" do I> koji je svaki ispitanik dodijelio piu ( u ponovljenom rangiranju. ,itanje@ 2ako su ispitanici rangirali pia ( prije, a kako nakon dobijanja informacije o sastojcimaC 6@ tab rank(

,ia su poredana po potroakim preferencijama. 3 izvjetaju nabrojati ih po redu. #umaenje@ I ispitanika ili "J,"F ispitanih su rekli da ima je pie ( drugo preferirano. 6@ tab rank(( =ime varijable je ((>

'angiranje po preferenciji pia nakon to su saznali informacije o sastojcima.

,itanje@ 1a li je pruanje dodatne informacije uticalo znaajno na preferencije ispitanikaC 6@ signrank rank( G 'ank((

Hleda se z, u ovom sluaju ono je B.EBNN. ,oto je vee od B,BI prihvata se pretpostavka da je dolo do promjene preferncija nakon to su ispitanici saznali sastojke pia. 1. 2avisni t-test =intervalna varijabla, dva zavisna uzorka> -tvoriti file car.dta. &spitanici su zamoljeni da na skali od " do "B izraze svoje preferencije prema automobilu ( i automobilu 4. )a skali " ocjena " oznaava potpunu averziju a ocjena "B potpuno prefereiranje. ,ored ovoga zabiljeen je i podatak o polu ispitanika. ,itanje@ 1a li postoji znaajna razlika u preferencijama izme!u automobila ( i 4C 6@ ttest pQcarQa G pQcarQb

,rema onom to je profesor rekao na predavanjima radi se o prosjenoj preferenciji kao parametru i postoji signifikantnost. )e znam na osnovu ega je to zakljuio vjerovatno na osnovi zadnjeg reda, sredina. )a netu sam naao slian primjer gdje je na istom mjestu i z i p=f> za koje je dato objanjenje. 3. 'i kvadrat test =)ominalna varijabla, k nezavisnih uzoraka> -tvoriti cd.dta. &spitanicima je postavljeno pitanje da li bi kupili novi 61 poznatog izvodaa. .amislimo da su ispitanici podjeljeni u etiri dobne skupine. 1a li pripadnost razliitim dobnim skupinama ima uticaj na odluku o kupovini novog 61/aC

&sto ide kao i za prethodne primjere +i kvadrata "B. 4ruskal-+allis test =-rdinalna varijabla, k nezavisnih uzoraka> -tvoriti seniors.dta. &spitanici su zamoljeni da probaju I vrsta pia =(, 4, 6, 1 i $> i rangiraju ih prema svojim preferencijama. ,ie koje najvie preferiaju oznaeno je sa ", a ono koje najmanje preferiraju sa I. <arijabla R'ank(S sadri rang =" do I> koji je svaki ispitanik dodijelio piu (. ,itanje@ 1a li postoji razlika izme!u tri dobne skupine u pogledu rangiranja pia (C 6@ k5allis rank(, b:=age>

Hleda se probabilit:. #reba da bude manji od B,BI. 3 ovom sluaju ovo je nesignifikantno, dakle mala je vjerovatnoa da postoji razlika u preferencijama izme!u generacija. &spravite ako grijeim =moda je hipoteza naopako postavljena>. "". -ne 5a: ()-<( test =&ntervalna varijabla, k nezavisnih uzoraka> -tvoriti soup.dta. #ri razliita promotivna alata su testirana za novu marku juhe@ veliki poster proizvoda ='">, proba u prodavnici ='?> i dekoracija oko tanda sa proizvodima =' >. %vaka od ove tri promocije je isprobana u pet razliitih prodavnica ="I ukupno>. )a kraju mjeseca izmjeran je prodaja nove marke juhe u svih "I prodavnica. ,itanje@ 1a li su razliiti promotivni alati imali uticaj na prodaju nove marke juheC 6@ one5a: sales promotion

Hleda se ,rob T;, u ovom sluaju B. Uta to znai treba vidjeti. 6@ one5a: sales promotion, sidak bonferroni scheffe

-vo je cijela slika, a prof. je u materijal stavio sam ovaj prvi kvadrat. 2oliko sam ja shvatio na predavanju gleda se broj oznaen strelicom i ako je on vei od B,BI onda nema razlike. $$. 5ochran 6 test =)ominalna varijabla, k zavisnih uzoraka> ,rije testiranja cochran test treba instalirati. 6@ findit cochran -tvoriti posteri.dta. 2ako bi ispitao adekvatnost ogaavakih plakata, istraiva marketinga je proveo sljedeieksperiment. %luajnim odabirom izdvojio je B ispitanika. %vakom ispitaniku pokazana su tri razliita oglaavaka plakata koje su ispitanici ocjenjivali kao dobre =GB> ili kao loe =G">. ,itanje@ 1a li postoji statistiki znaajna razlika izme!u tri razliita oglaavaka plakata u pogledu toga koliko ispitanika je svaki od ova tri plakata ocjenilo kao dobar =GB>. 6@ cochran poster"/poster

Hleda se broj oznaen strelicom. Hranica je B,BI ali ta ona predstavljaCCC

?. 2-'$V6(&-)( & '$H'$%&-)( ()(V&.(


%tatistika tehnika kojom se ispituje veza izme!u zavisne varijable i jedne ili vie nezavisnih varijabli. cilja@ 3tvrditi da li postoji veza izme!u zavisne varijable O i nezavisnih varijabli i koliko je jaka ta veza. 3stanoviti koliko varijabiliteta zavisne varijable moe biti objanjeno nezavisnim varijablama. ,rocijeniti vrijednost zavisne varijable na bazi izabrane vrijednosti nezavisnih varijabli. Linearni regresioni model ,rimjer ". record".dta ,rvo to moemo uraditi je predstaviti grafiki dijagram rasprivanja i regresionu liniju 6@ t5o5a: =lfit sales adbudget> =scatter sales adbudget> i onda to izgleda ovako

Uto je vei nagib linije to je vea vjerovatnoa da postoji uticaj nezavisne varijable na zavisnu.

.atim uradimo regresiju 6@ regress sales adbudget

,rvo gledamo donje t. #o je za hipotezu. 3 ovom sluaju je "J.N a da bi se nulta hipoteza odbacila ono treba da bude ".ED ili vee. Hleda se i p koje mora biti manje od B,BI za odbacivanje nulte hipoteze, u ovom primjeru je B.BBB. 3 konkretnom sluaju adbudget je statistiki signifikantan u predvi!anju prodaje. .atim se prouava reprezentativnost modela. 3 gornjem desnom uglu postoje ? stvari koje treba gledati, to su '/s0ured i (dj '/s0uared. -vo drugo je vanije. #aj broj predstavlja koliko su takice na grafiku udaljene od linije regresije. 2rajnji sluajevi su '/s0uare G " =sve take na liniji> i '/s0uared G B =toalno rasulo, nijedna nije na liniji>. 'egresiona linija bi trebala biti znaajno bolja od aritmetike sredine. 1 predstavlja nagib regresione linije. Ako se vrijednost nezavisna varijable (adbudget) povea za 1$ prodae se dodatnih 0,09 ko!ada. "r#gi! rije$i!a, ako povea!o b#d%et za ogla&avanje za 100$ # prosjek# e!o prodati dodatnih 9, ko!ada. '0 ( )*ons +a$ka # kojoj regresiona linija sije$e ,-os#. .ez #laganja # ogla&avanje (/(0) prodali bi 101.109 ko!ada.

%ada imamo sve parametre za regresioni model koji izgleda ovako@ Oi G WB X W"Yi X Zi, gdje je@ Oi Azavisna varijabla =prodaja> Yi/ vrijednost nezavisne varijable =budet> WB A konstanta =slobodni lan> W" A nagib Zi A rezidual =sluajna greka> Salesi G WB X W"adbudgeti X Zi Sales G " K." E,E X =B,BED 9 "BB.BBB> G " K." E,E X E.DBB G "K .JKB u ovom primjeru profesor nije koristio rezidual Zi, kako ga nai to treba skontat. Viestruki regresioni model (Viestruka regresiona analiza) ,rimjer ". record".dta .avisna varijabla@ sales =prodaja u kom.>, )ezavisne varijable@ adbudget =oglaavaki budet u [>, airplay =broj putanja na radiju u sedmici prije prodaje>, attract =atraktivnost benda>. ,regled varijabli 6@ summarize

zatim ide 6@ regress sales adverts attract airpla: =uvijek se na prvo mjesto iza regress stavlja zavisna varijabla>

dole je ista tabela u manjem prikazu

1 individ#alni doprinos nezavisne varijable 21(adverts) prodaji. Ako se b#d%et za ogla&avanje povea za 1$ prodae se dodatnih 0,034 ko!ada #z #slova da s# ostale nezavisne varijable nepro!ijenjene.

5 individ#alni doprinos nezavisne varijable 25(airplay) prodaji. Ako se broj p#&tanja na radij# povea za 1 prodae se dodatnih 0.0 6 ko!ada #z #slova da s# ostale nezavisne varijable nepro!ijenjene.

'0 ( )*ons 0 individ#alni doprinos nezavisne varijable 20(attract) prodaji. Ako se atraktivnost banda poraste za 1 prodae se dodatnih 11.03 ko!ada #z #slova da s# ostale nezavisne varijable nepro!ijenjene. 7 konkretno! sl#$aj# ne!a s!isla i ne t#!a$i se posebno.

-pet imamo sve parametre modela koji se uvrtavaju u formulu za multiregresioni model Oi G WB X W"Y" X W?Y? X ... X WnYni X Zi %ales G /?D.D"?,E X =B,BNK\adverts> X = . DJ,K\airpla:> X ="".BND, \attract> %alesG ... A vrijednost koja se dobije je iznos prodaje nakon uea sve tri nezavisne varijable

Pretpostavke i njihovo testiranje %lijedei dio odnosi se na neke pretpostavke vezane ra regresiju koji treba provjeriti. -dnosi se na dijagnostiku i generalizaciju nakon zavrene regresije. 3glavnom postoji N pretpostavki @ $. Tipovi varijabli 78ariable t,pes9 %ve nezavisne varijable moraju biti kvantitavne ili kategorike. .avisna varijabla mora biti kvantitativna, neprekidna =continous> i neograniena =unbounded>. 2ad kaemo da varijabla mora biti kvantitativna to znai da je mjerna bar na intervalnoj skali. (ko je recimo zavisna varijabla mjera koja uzima vrijednost od " A "B a ipak prikupljeni podaci variraju od recimo A J onda se javlja ogranienost.)e smije postojati greka u mjerenju zavisne varijable. )e smije postojati greka u mjerenju nezavisnih varijabli

&. :kstremne vrijednosti 7Outliers9 ?.". 1etekcija ekstremnih vrijednosti@ 6ase5ise diagnostics 1a bi smo ita mogli uraditi ovdje prvo treba regresioni model uraditi =radi se na primjeru record?.dta>. 6@ regress sales adverts attract airpla: zatim jednu iz druge kucati =dok se zadnja ne otkuca nee se nita desiti> 6@ predict psales 6@ predict r, resid 6@ predict sr, rstand 6@ list sr sales airpla: attract adverts psales r if abs=sr> T ? %ada se pojavi ova tabela

%tata je sada izlistala varijable kod kojih je rezidual izvan X]/? standardne devijacije. 2od nas ih ima "? a imamo ?BB opservacija. "?]?BB G B,BD ili DF a trebalo bi biti manje od IF. .atim gledamo to isto za rang X]/ standardna devijacija i dolazimo do zakljuka da je B,IF takvih varijabli a trebalo bi ih biti "F.

?.?. 1etekcija ekstremnih vrijednosti@ 6ook^s distance .atim idu dvije naredbe koje se kucaju jedna iza druge 6@ predict d, cooksd 6@ list sales airpla: attract adverts d if dTK]?BB

6ook^s distance je mjera koja pokazuje veliinu uticaja pojedinane opservacije na model.<rijednosti T" su razlog za zabrinutost =6ook and 8eisberg , "ENN>. ?. . 1etekcija ekstremnih vrijednosti@ Veverage opet kucati naredbe jednu iza drugi da bi se neto desilo @> 6@ predict lev, leverage 6@ list sales airpla: attract adverts lev if levT=?\ X?>]?BB

Veverage pokazuje uticaj koji pojedinana opservacija ima na procjenjene beta koeficijente. ,oelno je ispitati sve opservacije koje imaju vrijednost za lev T =?kX?>]n. k G broj nezavisnih varijabli, n G veliina uzorka. ?.K. 1etekcija ekstremnih vrijednosti@ 1;&# opet dvije naredbe u nizu 6@ predict dfit, dfits 6@ list sales airpla: attract adverts dfit if abs=dfit>T?\s0rt= ]?BB>

1;&# pokazuje razliku izme!u predvi!ene vrijednosti kada je opservacija ukljuena u model i kada nije. 2ao i 6ook^s distance, ovo je mjera uticaja opservacije na model u cjelini. ,oeljno je provjeriti sve opservacije koje imaju dfit T ?\s0rt=k]n>. 3 ovom primjeru to su opservacije sa dfitTB.?KI ?.I. 1etekcija ekstremnih vrijednosti@ 1;4$#( 6@ dfbeta 6@ list sales airpla: attract adverts QdfbetaQ" if abs=QdfbetaQ">T?]s0rt=?BB>

1;4$#( pokazuje razliku izme!u vrijednosti koeficijenta kada je opservacija ukljuena u model i kada nije. &zraunava se za svaku varijablu posebno. ,oeljno je provjeriti sve opservacije koje imaju dfbeta T ?]s0rt=n>. 3 ovom primjeru dfbeta T B."K" ?.D. 1etekcija ekstremnih vrijednosti@ ,artial plots 6@ avplots 6@ avplots, mlabel=id>

#raiti take koje se ba izdvajaju iz gomile. . )e postoji savrena multikolinearnost =Multicollinearit:> .". %imptomi multikolinearnosti 8 .natno vee standardne greke uz znatno nie vrijednosti t/statistike, 8 )eoekivane promjene u veliini ili predznaku koeficijenata, 8 )esignifikantni koeficijenti uprkos visokom '?. .?. ,okazatelji multikolinearnosti 6@ 0uietl: regress sales airpla: attract adverts 6@ vif Ako je 9:; prosjek znatno vei od 1 onda postoji !og#nost da je regresija pristrasna (biased).

Ako je najvea 9:; vrijednost vea od 10 onda postoji razlog za zabrin#tost.

+oleran*e (1<9:;) ispod 0,1 #kaz#je na zna$ajan proble!. +oleran*e (1<9:;) ispod 0,5 #kaz#je na poten*ijalni proble!.

K. Vinearnost =Vinearit:> ,od ovim se podrazumjeva da su veze koje modeliramo izme!u nezavisnih varijabli i prosjene vrijednosti zavisne varijable linearnog tipa. K.". Vinearnost@ ,rovjera prirode veze 2od proste regresije dovoljno je nacrtati dijagram rasipanja izme!u Y i O. 6@ t5o5a: =lfit sales adverts> =scatter sales adverts> =lo5ess sales adverts> K.?. Vinearnost A residulas vs predictors 6@ predict r, resid 6@ scatter airpla: 6@ scatter attract 6@ scatter adverts *edan od naina je da nacrtamo dijagram rasipanja reziduala i svake nezavisne varijable. )a dobijenim dijagramima ne bi trebalo biti jasno izraenog nelinearnog uzorka. K. . Vinearnost A acrplot 6@ acprplot airpla:, lo5ess lsopts=b5idth=">> 6@ acprplot attract, lo5ess lsopts=b5idth=">> 6@ acprplot adverts, lo5ess lsopts=b5idth=">> dobije se isto ono to i prije sa ukljuenom linijom regresije I. +omoskedastinost =+omoscedasticit:> <arijansa reziduala oko predvi!enih vrijednosti zavisne varijable treba da je priblino jednaka za sve predvi!ene vrijednosti. 3koliko je ova pretpostavka naruena pojavljuje se problem heteroskedastinosti. I.". Hrafiki metodi za provjeru heteroskedastinosti 6@ rvfplot, :line=B> ,rikazana su K mogua sluaja

I.?. #estovi za provjeru heteroskedastinosti 6@ estat imtest

6@ estat hettest

#reba skontat ta se gleda D. )ema autokorelacije =&ndependet errors> -va pretpostavka se ogleda u tome da izme!u reziduala bilo koje dvije opservacije ne postoji korelacija. D.". #esiranje pretpostavke o nezavisnosti@ 1urbin/8atson test

D.?. #esiranje pretpostavke o nezavisnosti@ vizuelna provjera 6@ predict r, residual 6@ scatter r id

-100000 -50000 0

Residuals 0 50000

100000 150000

50

100 id

150

200

J. Zi ima normalan raspored =)ormall: distributed errors> J.". ,rovjera da Zi ima normalan raspored A 2ernel densit: 6@ predict r, resid 6@ kdensit: r, normal slika koja se dobije prikazuje normalnu distribuciju i nau distribuciju. gleda se koliko oblik odstupa J.?. ,rovjera da Zi ima normalan raspored@ ,/, plot 6@ pnorm r J. . ,rovjera da Zi ima normalan raspored@ 7/7 plot 6@ 0norm r J.K. ,rovjera da Zi ima normalan raspored@ testovi 6@ s5ilk r 6@ sktest r

#reba skontati ta se gleda, koji parametar N. ,ravilna specifikacija modela ". )ezavisne varijable =prediktori> ne smiju biti u korelaciji sa "eksternim varijablamaM =no simultaneit: bias> ?. 3kljuene sve relevantne varijable =no ommited variables> . &skljuene sve irelevantne varijable =no irrelevant variables> 6@ estat ovtest 6@ estat ovtest, rhs

You might also like