Download as xlsx, pdf, or txt
Download as xlsx, pdf, or txt
You are on page 1of 32

Dvouvýběrové testy

proc univariate data=work1 normal plot;


class pohon;
histogram naklady/normal;
qqplot naklady/normal (mu= est sigma= est);
var naklady;
run;
p = 0,22 > 0,05
přijímáme H0,rozdělení je normální

p = 0,04 < 0,05


zamítáme H0, přijímáme H1,rozdělení není normální
musíme použit neparametrický test

proc npar1way data=work1 wilcoxon;


class pohon;
var naklady;
run;
p = 0,0001 < 0,05
zamítáme Ho, rozdíl mezi soubory B a N je statistický významný
p = 0,06 > 0,05
přijímáme H0,rozdělení je normální
p = 0,56 > 0,05
přijímáme H0,rozdělení je normální

musíme použit parametrický test

proc ttest data=work2;


class Producer;
var Bat_life;
run;

p = 0,0001 < 0,05


zamítáme Ho, rozdíl mezi soubory TOSHIBA a HP je statistický významný
p = 0,1 > 0,05
přijímáme H0,rozdělení je normální
p = 0,65 > 0,05
přijímáme H0,rozdělení je normální

Párový t-test o průměrech pro závislé soubory (parametrická forma testu o


proc ttest data=work3;
paired puvodni*upraveny;
run;

p = 0,65 < 0,05


prijímáme Ho, rozdíl mezi soubory puvodni a upraveny není statistický významný
ANOVA

ANALÝZA ROZPTYLU

příklad
V nadmořské výšce 250 m byla sledována teplota půdy v hloubce 60 cm v měsících leden, únor a březen s následujícími výsledky:

Měsíc Výsledky měření teploty


Leden 1.00 0.64 1.22 1.19 0.62 0.87 1.23 0.96
Únor 1.06 0.88 1.04 1.66 1.06 1.07 0.87 0.97
Březen 1.19 1.77 1.46 1.58 1.55 1.22 1.64 1.35

proc univariate data=work1 normal plot;


class mesic;
histogram vysledky/normal;
qqplot vysledky/normal (mu= est sigma= est);
var vysledky;
run;
p = 0,93 > 0,05
přijímáme H0,rozdělení je normální

p = 0,6 > 0,05


přijímáme H0,rozdělení je normální
p = 0,0007 < 0,05
zamítáme H0, přijímáme H1,rozdělení není normální

Jednoduchá analýza rozptylu – neparametrická forma – KruskalWallisův test

proc npar1way data=work1 wilcoxon;


class mesic;
var vysledky;
run;
p = 0,0001 < 0,05
zamítáme Ho, rozdíl mezi soubory Leden, Unor a Brezen je statistický významný

Rozdil pro Unor a Leden neni statisticke vyznamny


Rozdil pro Brezen a Unor + Brezen a Leden je statisticke vyznamny

Hodinové mzdy pracovníků v ekonomickém oddělení byly roztříděny podle kvalifikace do tří tříd a výsledky jsou uvedeny v následující tabulce:

Klasifikační Hodinová mzda (v Kč)


třída
1. 70 75 75 80 90 90 70
2. 75 80 85 90 100 100 105 110
3. 100 110 120 120 120 115 125 115
proc univariate data=work2 normal plot;
class trida;
histogram plat/normal;
qqplot plat/normal (mu= est sigma= est);
var plat;
run;

p = 0,22 > 0,05


přijímáme H0,rozdělení je normální
p = 0,77 > 0,05
přijímáme H0,rozdělení je normální
p = 0,26 > 0,05
přijímáme H0,rozdělení je normální

Jednoduchá analýza rozptylu – parametrická forma


proc glm data=work2;
class trida;
model plat=trida;
means trida/hovtest tukey;
run;

p = 0,0001 < 0,05


zamítáme Ho, rozdíl mezi soubory 1, 2 a 3 je statistický významný
Všechny 3 třide se statisticke liší od sebe

KORELACE
Jednoduchá regrese

proc gplot data=work1;


plot vek*chol;
run;

proc reg data=work1;


model vek=chol/clm;
plot vek*chol/conf;
run;
H0 říká že model není statistický významný
H1 říká že model je statistický významný

p <0,05 zamítáme Ho, model je statistický významný

Chlosterin na 61% ovlivnuje vek


korelacni koef = 0,78 => stredni zavislost
vek = 0,83 + 0,12*chol

p chol < 0.0001

H0 říká že proměnna není statistický významná


H1 říká že proměnna je statistický významná

p <0,05 zamítáme Ho, proměnna je statistický významná

KORELACE
proc corr data=work1 pearson spearman;
var vek chol;
run;
Mnohonásobná regrese včetně regresní diagnostiky
proc reg data=work1;
model cena=mistnosti zastavena uzitna parcela centrum/r influence spec vif;
plot r.*p.;
run;

H0 říká že model není statistický významný


H1 říká že model je statistický významný

p <0,05 zamítáme Ho, model je statistický významný

Model ovlivnuje cenu na 52%

mistnosti = je
zastavena = neni
uzitna = neni
parcela = neni
centrum = je

cena = 1,17 + 1,37*mistnosi - 0,003*zastavena +0,01*uzitna+0,002*parcela - 0,233*centrum


pozorovani cislo 20 44 45 jsou vlivne

Nulová hypotéza předpokládá homoskedasticitu reziduí

p >0,05 přijímáme Ho, rezidua jsou homoskedastická

proc reg data=work3;


model cena = vykon objem/r influence spec vif;
plot r.*p.;
run;
trická forma testu o středních hodnotách pro závislé soubory)

ický významný
mi výsledky:

0.92 1.11
2.00 1.09
1.29 1.41
ruskalWallisův test
cký významný

eny v následující tabulce:

110
3*centrum

You might also like