Logisticka Regresija

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 65

Binarna logistička regresija

1
Šta je logistička regresija?

Oblik regresija koja omogućava predikciju zavisne


varijable (koja je diskretna varijabla) na osnovu
kontinuiranih i diskretnih prediktora.
Logistička regresija se najčešće koristi kada relacija
između zavisne (diskretne) varijable i prediktora nije
linearna.
Primer: verovatnoća za pojavu srčane bolesti kod
osoba koje imaju normalan krvni pritisak, vrlo malo
se menja kada se vrednost pritiska poveća za 10,
ali se verovatnoća za pojavu srčane bolesti kod
osoba koje imaju povišen krvni pritisak drastično
povećava, kada se vrednost pritiska poveća za 10.

2
Binarna logistička regresija

Tip regresione analize u kojoj je zavisna varijabla dihotomna i


najmanje jedna nezavisna je kontinuirana
Relacija između zavisne i nezavisne/nezavisnih varijabli nije linearna
Dihotomna varijabla (dummy variable) kodira se:
0 – zdrav, preživeo, nije glasao, nepušač, žena ...
1 – bolestan, umro, glasao, pušač, muškarac ...
Sa 1 se kodira ono što nas interesuje
Predviđamo verovatnoću da je nivo zavisne varijable koji nas
interesuje u funkciji od nezavisne varijable
Zavisne dihotomne promenljive su česte u biologiji i medicini

3
Linearna regresija
y = β0 + β1x + ε
ε – greška koja je normalno distribuirana sa srednjom
vrednošću 0 i konstantnom varijansom

Kada je zavisna varijabla binarna, y = 0 ili y = 1


1 – pozitivan odgovor (uspeh) P
0 – negativan odgovor (neuspeh) Q = (1-P)

ε = 1 − β0 − β1x
ε = 0 − β0 − β1x

4
Primena

Upoređivanje dve željene verovatnoće (verovatnoća za


uspeh) – kliničke studije
Utvrđivanje koji faktori rizika su važni / nisu važni –
epidemiologija
Utvrđivanje relacija među odgovorima na različite doze
- toksikologija

5
Primer 1 – Da li je pušenje prediktor za pojavu KSB

Dizajn:
60 pacijenata
dve grupe: pušači i nepušači
pušači – 1; nepušači – 0

Zavisna varijabla
Koronarna srčana bolest: DA / NE

Traži se odgovor na pitanje:


Da li ima razlike u pojavi KSB kod pušača i
nepušača

6
Primer 1

outcome smoking + smoking - total

CHD + 17 (a) 9 (b) 26 (r)

CHD - 7 (c) 27 (d) 34 (s)

total 24 (m) 36 (n) 60 (N)

Analiza:
Student t – test za proporciju: pKSB+ puš
pušači : p KSB+ nepuš
nepušači

t = 3,53 p < 0,01


ili χ2 - test

7
Dihotomna varijabla Y (0/1):

KSB

0 1
pušenje

Potrebna je transformacija podataka!

8
Example 1
outcome smoking + smoking - total

CHD + 17 (a) 9 (b) 26 (r)

CHD - 7 (c) 27 (d) 34 (s)

total 24 (m) 36 (n) 60 (N)

a / m a 17
Odds KSB (pušači) = = = = 2,429
c /m c 7

Pušači imaju 2,428 puta veću šansu da dobiju KSB nego da je ne dobiju

b/n b 9
Odds KSB (nepušači) = = = = 0,333
d / n d 27

Nepušači imaju 0,333 puta veću šansu dobiju KSB nego da je ne dobiju

9
Odds
Odds za neki događaj je

 p 
odds =  
 1− p 

odnosno

 p 
log (odds ) = log  
 1− p 

gde je p verovatnoća da se događaj desi

Što je odds nekog događaja veći, to je veća verovatnoća da se


događaj desi

10
Logit transformacija

Logit – prirodni logaritam (ln) odds (šanse) da se


posmatrani događaj desi (kodiranog sa 1)
obeležava se kao log odds
logit skala je kontinuirana i ponaša se na sličan
način kao z-score skala
p = 0.50, logit = 0
p = 0.70, logit = 0.84
p = 0.30, logit = -0.84

11
Logit transformacija
Logit transformacija daje linearnu relaciju između
verovatnoće posmatranog događaja i vrednosti
nezavisne varijable x
 p 
log (odds) = log   = β0 + β1x
 1− p 

Model je sličan prostom regresionom modelu, ali:


• raspodela je binomna, a ne normalna
• koeficijenti a i b se ne određuju na isti način kao u
linearnom regresionom modelu 12
Logistički regresioni model

Jednačina za P (y=1) za jedan prediktor:

 p 
log (odds ) = log   = β0 + β1x
 1− p 
p
= eβ0 +β1x
1− p
eβ0 +β1x
p= za populaciju
β0 +β1x
1− e
eb0 +b1x
p= za uzorak
b0 +b1x
1− e

e ≈ 2,718
p = P(y=1)
x = prediktor
13
Logistički regresioni model

Jednačina za P (y=1) za više prediktora:

eb0 +b1x1 +b2 x 2 +......


p=
1 − eb0 +b1x1 +b2 x 2 +......

e ≈ 2,718
p = P(y=1)

14
Interpretacija koeficijenata b0 i b1
b0
neophodan za jednačinu, nema značaja za interpretaciju
predstavlja vrednost log odds kada je prediktor jednak 0

b1 – mera za asocijaciju između prediktora i log odds za pojavu


događaja koji nas interesuje
b1 > 0 – pozitivna asocijacija
b1 = 0 – nema asocijacije
b1 < 0 – negativna asocijacija

15
Interpretacija koeficijenta b1
b1 je frakcija za koju se promeni rizik za pojavu događaja koji nas
interesuje kada se prediktor x promeni za jednu jedinicu

Primer
osoba 1, prediktor (x) = k
osoba 2, prediktor (x) = k + 1
Jednačine za log odds glase
log (odds za događaj kod osobe 2) = b0 + b1 (k + 1)
log (odds za događaj kod osobe 1) = b0 + b1 (k)
Dalje:
log (odds za događaj kod osobe 2) = b0 + b1 (k) + b1
log (odds za događaj kod osobe 1) = b0 + b1 (k)

16
Interpretacija koeficijenta b1
Razlika između log odds osobe 1 i osobe 2:
log (odds za događaj kod osobe 2) = b0 + b1 (k) + b1
log (odds za događaj kod osobe 1) = b0 + b1 (k)

log odds za pojavu događaja koji nas interesuje kod osobe 2 čiji je
prediktor x = k + 1, razlikuje se od log odds za pojavu događaja koji
nas interesuje kod osobe 1 čiji je prediktor x = k za vrednost
koeficijenta b1

odnosno

b1 je frakcija za koju se promeni rizik za pojavu događaja koji nas


interesuje kada se prediktor x promeni za jednu jedinicu

17
Interpretacija koeficijenta b1

b1 = log (odds za pojavu događaja kod osobe 2) −


- log (odds za pojavu događaja kod osobe 1)

odds za pojavu događaja kod osobe 2


b1 = log
odds za pojavu događaja kod osobe 1

b1 = log (odds ratio )

odds ratio (OR ) = eb1

18
Interpretacija koeficijenta b1

b1 = 0
odds i verovatnoća za pojavu željenog događaja su
jednaki za sve vrednosti x (eb1 = OR = 1)

b1 > 0
odds i verovatnoća za pojavu željenog događaja se
povećavaju sa povećanjem vrednosti x (eb1 = OR > 1)

b1 < 0
odds i verovatnoća za pojavu željenog događaja se
smanjuju sa smanjenjem vrednosti x (eb1 = OR < 1)

19
Example 1 – Odds ratio
outcome smoking + smoking - total

CHD + 17 (a) 9 (b) 26 (r)

CHD - 7 (c) 27 (d) 34 (s)

total 24 (m) 36 (n) 60 (N)

a / m a 17
Odds CHD (smo ker s) = = = = 2,429
c/m c 7

b/n b 9
Odds CHD (non − smo ker s) = = = = 0,333
d / n d 27

2,429
Odds ratio (OR ) = = 7,286
0,333

Interpretation:
Smokers are 7,29 times more likely to have CHD than non-smokers
20
Odds ratio (Relativni odds, Ukršteni odnos)
Odds Ratio (OR) je odnos šansi prethodne izloženosti kod slučajeva
(prisutan događaj koji nas interesuje, kodiran sa 1) i kontrola (odsutan
događaj koji nas interesuje, kodiran sa 0):

događaj
ukupno
prisutan (+) odsutan (-)
da (+) a b r (a + b)
izloženost ne (-) c d s (c + d)
ukupno m (a + c) n (b + d) N (a+b+c+d)

Odds za prisutan događaj koji nas interesuje: (a/m) / (c/m) = a/c


Odds za odsutan događaj koji nas interesuje: (b/n) / (d/n) = b/d
Odds ratio: (a/c) / (b/d) = ad/bc

21
Interpretacija koeficijenata
Odds (pušači) = 2.429
ln (odds) = 0.887
Odds (nepušači) = 0.333
ln (odds) = -1.099

 p 
Model za ovaj primer je ln   = b 0 + b 1 x
1− p 

 p 
Za nepušače (x = 0) imamo ln   = b 0 + b 1 × 0 = b 0
1− p 

Intercept je jednak ß0 i predstavlja  p 


ln   = β 0 = − 1 . 099
log odds za nepušače 1− p 

22
Interpretation of coefficients
Nagib predstavlja razliku između log odds za pušače i log odds za
nepušače:

 p1   p0 
b1 = ln
  − ln  = 0.887 − (−1.099) = 1.986
 (1 − p1 )   (1 − p 0 ) 

Model je:
log(odds) = -1,099 + 1.986x

Odds ratio je:

Oddssmo ker s e (−1.099+1.986 )


= ( −1. 099 ) = e1.986
= 7.286
Odds non −smo ker s e

23
Logistic regression in SPSS
In the menu, click on Dependent : chd
Analyze Covariates: smoking
Point to Method: Enter
Regression Then Continue
Point to and OK
Binary Logistic
... and click

24
Example 1 in SPSS

Point to the variable labeled chd


Move variable chd, to the box
labeled Dependent Variable by
clicking the arrow
Point to the variable labeled
smoking
Move variable smoking to the
box labeled Covariates by
clicking the arrow
Method
Enter

25
Example 1 in SPSS
In the menu, click on Options
Check
CI for exp(B)
and Continue

Then click OK

26
Example 1 in SPSS
In the menu, click on Options
Check
CI for exp(B)
and Continue

Then click OK

27
Example 1 in SPSS - Output
Case Processing Summary
a
Unweighted Cases N Percent
We see that there are 60 cases Selected Cases Included in Analysis 60 100,0
used in the analysis. Missing Cases 0 ,0
Total 60 100,0
Unselected Cases 0 ,0
Total 60 100,0
a. If weight is in effect, see classification table for the total
number of cases.

Classification Tablea,b

Predicted

CHD Percentage
Observed 0 1 Correct
Step 0 CHD 0 34 0 100,0
1 26 0 ,0
Overall Percentage 56,7
a. Constant is included in the model.
b. The cut value is ,500

The Block 0 output is for a model that includes only the intercept
(which SPSS calls the constant).
Given the base rates of the two CHD options (34/60 = 56.7% no CHD,
43.3% with CHD), and no other information, the best strategy is to
predict, for every case, that the subject has CHD. Using that strategy,
you would be correct 56.7% of the time.
28
Example 1 in SPSS - Output
Under Variables in the Equation you see that the intercept-only model is
ln(odds) = -.268
The predicted odds that nonsmokers have CHD is [Exp(B)] = 0.765

Variables in the Equation

B S.E. Wald df Sig. Exp(B)


Step 0 Constant -,268 ,261 1,060 1 ,303 ,765

Omnibus Tests of Model Coefficients gives us a Chi-Square of 12.645 on


1 df, significant beyond 0.001.
This is a test of the null hypothesis that adding the smoking variable to the
model has not significantly increased our ability to predict the CHD in our
subjects.
Omnibus Tests of Model Coefficients

Chi-square df Sig.
Step 1 Step 12,645 1 ,000
Block 12,645 1 ,000
Model 12,645 1 ,000

29
Example 1 in SPSS - Output
Under Model Summary we see that the -2 Log Likelihood statistic is
69.463.
This statistic measures how poorly the model predicts the decisions --
the smaller the statistic the better the model.
The Cox & Snell R2 can be interpreted like R2 in a multiple regression,
but cannot reach a maximum value of 1.
The Nagelkerke R2 can reach a maximum of 1.

Model Summary

-2 Log Cox & Snell Nagelkerke


Step likelihood R Square R Square
1 69,463 ,190 ,255

30
Example 1 in SPSS - Output
The Variables in the Equation output shows us that the regression
equation is

log (odds ) = −1,099 + 1,986 × smoking

Variables in the Equation

95,0% C.I.for EXP(B)


B S.E. Wald df Sig. Exp(B) Lower Upper
Step
a
PUSENJE 1,986 ,591 11,274 1 ,001 7,286 2,286 23,223
1 Constant -1,099 ,385 8,147 1 ,004 ,333
a. Variable(s) entered on step 1: PUSENJE.

Wald χ2 - significance of the coefficients in a model


2
 coefficient 
Wald χ = 2

 SE 

df = 1, χ20,05; 1 = 3,841
31
Example 1 in SPSS - Output
The Variables in the Equation output also gives us the Exp(B) or
the odds ratio predicted by the model.

Variables in the Equation

95,0% C.I.for EXP(B)


B S.E. Wald df Sig. Exp(B) Lower Upper
Step
a
PUSENJE 1,986 ,591 11,274 1 ,001 7,286 2,286 23,223
1 Constant -1,099 ,385 8,147 1 ,004 ,333
a. Variable(s) entered on step 1: PUSENJE.

OR = e1,986 = 7,286 p OR

32
Example 1 in SPSS - Output
We can now use this model to predict the odds that a subject has
CHD.
The odds prediction equation is odds = ea+bx

If our subject is a non-smoker (smoking = 0), then


odds = e-1.099+1.986(0) = e-1.099 = 0.333
A non-smoker is only 0.333 times more likely to have CHD as he
is likely to have not CHD.

If our subject is a smoker (smoking = 1), then


odds = e-1.099+1.986(1) = e0.887 = 2.428
A smoker is 2.428 times more likely to have CHD than he is likely
to have not CHD

33
Example 1 in SPSS - Output
Convert Odds to probability p = odds / (1+odds)

Non-smokers: p = 0.333 / (1+0.333) = 0.250 = 25%


Probability is 25% that non-smoker will have CHD

Smokers: p = 2.428 / (1+2.428) = 0.708 = 70.8%


probability is 70.8% that smoker will have CHD

34
Primer 2 – Faktori rizika za pojavu KSB
Povezanost između pojave KSB i godina starosti, pušenja i
gojaznosti
60 osoba
26 sa KSB (43,3%)
23 pušača (38,3%)
22 gojazne osobe (36,7%)

Cilj:
Pokazati da li su starost, pušenje i gojaznost faktori
rizika za KSB
Ako su faktori rizika kolika je “jačina” njihovog
delovanja

35
Primer 2 – Faktori rizika za pojavu KSB
Pokazati da li su starost, pušenje, gojaznost i holesterol faktori
rizika za KSB
Ako su faktori rizika kolika je “jačina” njihovog delovanja

Varijable:
KSB: 0 – KSB odsutna; 1 – KSB prisutna
zavisna varijabla, nominalna skala (binarna)
Starost: 0 - < 50 g; 1 - > 50 g
prediktor, kategorička varijabla, nominalna skala (binarna)
Pušenje: 0 – nepušač; 1 – pušač
prediktor, kategorička varijabla, nominalna skala (binarna)
Gojaznost: 0 – negojazni; 1 – gojazni
prediktor, kategorička varijabla, nominalna skala (binarna)
Holesterol: kontinuirane vrednosti
prediktor, skala odnosa

36
Primer 2 - Logistička regresija
Omogućava da se izračuna jednačina koja izražava relaciju
između binarnog ishoda i jednog ili više faktora uticaja (prediktora):
verovatnoća za pojavu KSB i starost
verovatnoća za pojavu KSB i pušenje
verovatnoća za pojavu KSB i gojaznost
verovatnoća za pojavu KSB i holesterol
verovatnoća za pojavu KSB i starost + pušenje + gojaznost +
holesterol
i ako nas interesuje
verovatnoća za pojavu KSB i starost + pušenje
verovatnoća za pojavu KSB i starost + gojaznost
verovatnoća za pojavu KSB i starost + holesterol
verovatnoća za pojavu KSB i pušenje + gojaznost
verovatnoća za pojavu KSB i pušenje + holesterol
verovatnoća za pojavu KSB i gojaznost + holesterol

37
KSB : Godine
ishod > 50 g < 50 g ukupno
KSB+ 20 6 26
KSB− 12 22 34
ukupno 32 28 60

Odds za prisustvo KSB kod starijih:


20/12 = 1,667
Odds za prisustvo KSB kod mlađih:
6/22 = 0,273
Odds ratio (OR)
1,667/0,273 = 6,11

Osobe starije od 50 g imaju 6,11 puta veću šansu da obole od


KSB

38
Primer 2 u SPSS-u

KSB : Faktor rizika “Starost”

Variables in the Equation

95,0% C.I.for EXP(B)


B S.E. Wald df Sig. Exp(B) Lower Upper
Step
a
AGE 1,810 ,588 9,485 1 ,002 6,111 1,931 19,338
1 Constant -1,299 ,461 7,958 1 ,005 ,273
a. Variable(s) entered on step 1: AGE.

b0 b1 p OR

OR = e-1,299 = 6,111
Osobe starije od 50 g imaju 6,11 puta veću verovatnoću da obole od KSB
nego osobe mlađe od 50 g
Model Summary

-2 Log Cox & Snell Nagelkerke


Step likelihood R Square R Square
1 71,437 ,163 ,219

39
KSB : Pušenje

ishod pušenje + pušenje − ukupno


KSB+ 17 9 26
KSB− 7 27 34
ukupno 24 36 60

Odds za prisustvo KSB kod pušača:


17/7 = 2,429
Odds za prisustvo KSB kod nepušača:
9/27 = 0,333
Odds ratio (OR)
2,429 / 0,333 = 7,286

Pušači imaju 7,286 puta veću šansu da obole od KSB

40
Primer 2 u SPSS-u

KSB : Faktor rizika “Pušenje”


Variables in the Equation

95,0% C.I.for EXP(B)


B S.E. Wald df Sig. Exp(B) Lower Upper
Step
a
PUSENJE 1,986 ,591 11,274 1 ,001 7,286 2,286 23,223
1 Constant -1,099 ,385 8,147 1 ,004 ,333
a. Variable(s) entered on step 1: PUSENJE.

p OR

OR = e1,986 = 7,286
Pušači imaju 7,29 puta veću verovatnoću da obole od KSB nego
nepušači
Model Summary

-2 Log Cox & Snell Nagelkerke


Step likelihood R Square R Square
1 69,463 ,190 ,255

41
KSB : Gojaznost

ishod BMI + BMI − ukupno


KSB+ 14 12 26
KSB− 9 25 34
ukupno 23 37 60

Odds za prisustvo KSB kod gojaznih:


14/9 = 1,555
Odds za prisustvo KSB kod negojaznih:
12/25 = 0,48
Odds ratio (OR)
1,555 / 0,48 = 3,241

Gojazne osobe imaju 3,241 puta veću šansu da obole od KSB

42
Primer 2 u SPSS-u

KSB : Faktor rizika “Gojaznost”


Variables in the Equation

95,0% C.I.for EXP(B)


B S.E. Wald df Sig. Exp(B) Lower Upper
Step
a
OBESITY 1,176 ,553 4,520 1 ,034 3,241 1,096 9,581
1 Constant -,734 ,351 4,368 1 ,037 ,480
a. Variable(s) entered on step 1: OBESITY.

p OR

OR = e1,176 = 3,241
Gojazne osobe imaju 3,24 puta veću verovatnoću da obole od KSB
nego negojazne osobe

Model Summary

-2 Log Cox & Snell Nagelkerke


Step likelihood R Square R Square
1 77,415 ,075 ,101

43
Primer 2 u SPSS-u

KSB : Faktor rizika “Holesterol”

p OR

OR = e0,696 = 2,005
Kada se holesterol poveća za jednu jedinicu (1 mmol/L), verovatnoća da
osoba oboli od KSB povećava se za 2,005 puta

Model Summary

-2 Log Cox & Snell Nagelkerke


Step likelihood R Square R Square
1 73,490 ,134 ,179

44
Example 2
In the menu, click on Options
Check
CI for exp(B)
Hosmer-Lemeshow goodness-
of-fit
and Continue

Then click OK

45
Example 2

Point to the variable labeled chd


Move variable chd, to the box
labeled Dependent Variable by
clicking the arrow
Point to the variable labeled
smoking, then obesity, age and
cholestero
Move variables to the box
labeled Covariates by clicking
the arrow
Method
Enter

46
Example 2 in SPSS - Output
The -2 Log Likelihood statistic has dropped to 55.86, indicating
that our expanded model is doing a better job at predicting CHD
than was one-predictor model
The R2 statistics have also increased
Model Summary

-2 Log Cox & Snell Nagelkerke


Step likelihood R Square R Square
1 55,860 ,354 ,475

The Hosmer-Lemeshow tests the null hypothesis that there is a


linear relationship between the predictor variables and the log odds of
the criterion variable.
Hosmer and Lemeshow Test

Step Chi-square df Sig.


1 5,583 8 ,694

47
Example 2 in SPSS - Output

Variables in the Equation

95,0% C.I.for EXP(B)


B S.E. Wald df Sig. Exp(B) Lower Upper
Step
a
SMOKING 2,067 ,695 8,843 1 ,003 7,899 2,023 30,840
1 OBESITY 1,126 ,675 2,785 1 ,095 3,084 ,822 11,575
AGE 1,615 ,781 4,280 1 ,039 5,027 1,089 23,216
CHOLESTE ,314 ,334 ,886 1 ,347 1,369 ,712 2,633
Constant -4,482 2,013 4,960 1 ,026 ,011
a. Variable(s) entered on step 1: SMOKING, OBESITY, AGE, CHOLESTE.

one-predictor four-predictors
model model
OR p OR p

smoking 7.286 < 0.05 7.899 < 0.05

obesity 3.241 < 0.05 3.084 > 0.05

age 6.111 < 0.05 5.027 <0.05

cholesterol 2.005 < 0.05 1.369 >0.05

48
Example 2 in SPSS – Method
Forward:Wald

Point to the variable labeled chd


Move variable chd, to the box
labeled Dependent Variable by
clicking the arrow
Point to the variable labeled
smoking, then obesity, age and
cholestero
Move variables to the box
labeled Covariates by clicking
the arrow
Method
Forward: Wald

49
Example 2 in SPSS – Method Forward:Wald -
Output
Variables in the Equation

95,0% C.I.for EXP(B)


B S.E. Wald df Sig. Exp(B) Lower Upper
Step
a
SMOKING 1,986 ,591 11,274 1 ,001 7,286 2,286 23,223
1 Constant -1,099 ,385 8,147 1 ,004 ,333
Step
b
SMOKING 2,092 ,669 9,776 1 ,002 8,104 2,183 30,080
2 AGE 1,924 ,675 8,129 1 ,004 6,846 1,824 25,688
Constant
-2,239 ,636 12,376 1 ,000 ,107

a. Variable(s) entered on step 1: SMOKING.


b. Variable(s) entered on step 2: AGE.

Model Summary
Variables not in the Equation -2 Log Cox & Snell Nagelkerke
Step likelihood R Square R Square
Score df Sig.
1 69,463 ,190 ,255
Step Variables OBESITY 3,769 1 ,052
1 2 60,020 ,308 ,413
AGE 9,234 1 ,002
CHOLESTE 6,060 1 ,014
Overall Statistics 12,654 3 ,005
Step Variables OBESITY 3,247 1 ,072
2 CHOLESTE 1,262 1 ,261
Overall Statistics 4,106 2 ,128 Hosmer and Lemeshow Test

Step Chi-square df Sig.


2 ,053 2 ,974

50
Primer 3 – Faktori rizika za pojavu KSB
Pokazati da li su starost, pušenje, gojaznost i holesterol faktori
rizika za KSB
Ako su faktori rizika kolika je “jačina” njihovog delovanja

Varijable:
KSB: 0 – KSB odsutna; 1 – KSB prisutna
zavisna varijabla, nominalna skala (binarna)
Starost: kontinuirane vrednosti
prediktor, skala odnosa
Pušenje: 0 – nepušač; 1 – pušač
prediktor, kategorička varijabla, nominalna skala (binarna)
Gojaznost (BMI): kontinuirane vrednosti
prediktor, skala odnosa
Holesterol: kontinuirane vrednosti
prediktor, skala odnosa

51
Primer 3 – Faktori rizika za pojavu KSB

Model Summary
Hosmer and Lemeshow Test
-2 Log Cox & Snell Nagelkerke
Step likelihood R Square R Square Step Chi-square df Sig.
1 43,255 ,477 ,639 1 6,370 8 ,606

Variables in the Equation

95,0% C.I.for EXP(B)


B S.E. Wald df Sig. Exp(B) Lower Upper
Step
a
SMOKING 2,569 ,867 8,788 1 ,003 13,054 2,388 71,358
1 BMI ,297 ,125 5,680 1 ,017 1,346 1,054 1,719
YEARS ,106 ,038 7,603 1 ,006 1,111 1,031 1,198
CHOLESTE -,031 ,396 ,006 1 ,938 ,970 ,446 2,107
Constant -14,624 4,594 10,134 1 ,001 ,000
a. Variable(s) entered on step 1: SMOKING, BMI, YEARS, CHOLESTE.

52
Primer 3 – Faktori rizika za pojavu KSB
Model Summary
Hosmer and Lemeshow Test
-2 Log Cox & Snell Nagelkerke
Step Chi-square df Sig.
Step likelihood R Square R Square
1 2,687 8 ,952
1 64,361 ,256 ,343
2 4,078 8 ,850
2 50,473 ,410 ,550
3 6,346 8 ,609
3 43,261 ,477 ,639

Variables in the Equation

95,0% C.I.for EXP(B)


B S.E. Wald df Sig. Exp(B) Lower Upper
Step
a
YEARS ,085 ,024 12,268 1 ,000 1,089 1,038 1,142
1 Constant -4,744 1,339 12,558 1 ,000 ,009
Step
b
SMOKING 2,566 ,784 10,724 1 ,001 13,016 2,802 60,461
2 YEARS ,101 ,029 12,337 1 ,000 1,106 1,046 1,171
Constant
-6,703 1,763 14,451 1 ,000 ,001

Step
c
SMOKING 2,558 ,854 8,973 1 ,003 12,910 2,421 68,831
3 BMI ,298 ,125 5,681 1 ,017 1,347 1,054 1,720
YEARS ,104 ,034 9,515 1 ,002 1,110 1,039 1,186
Constant -14,739 4,365 11,402 1 ,001 ,000
a. Variable(s) entered on step 1: YEARS.
b. Variable(s) entered on step 2: SMOKING.
c. Variable(s) entered on step 3: BMI.

53
54
55
Logistička regresija u SPSS

KSB : (Godine + Pušenje)


Variables in the Equation

95,0% C.I.for EXP(B)


B S.E. Wald df Sig. Exp(B) Lower Upper
Step
a
GODINE ,101 ,029 12,337 1 ,000 1,106 1,046 1,171
1 PUSENJE 2,566 ,784 10,724 1 ,001 13,016 2,802 60,461
Constant -6,703 1,763 14,451 1 ,000 ,001
a. Variable(s) entered on step 1: GODINE, PUSENJE.

p OR

log (odds) = −6,703 + 0,101× godine+ 2,566× pušenje


ORgodine = e0,101 = 1,106
ORpuš 2,566 = 13,016
pušenje = e

56
KSB : (Godine + Pušenje)

70

60

50

40
%
30

20

10

0 KSB -
pušači KSB +
> 50 g nepušači
pušači
< 50 g nepušači

KSB + KSB -

57
Logistička regresija u SPSS

KSB : (Godine + Gojaznost)


Variables in the Equation

95,0% C.I.for EXP(B)


B S.E. Wald df Sig. Exp(B) Lower Upper
Step
a
GODINE ,086 ,025 11,659 1 ,001 1,090 1,037 1,145
1 BMI 1,186 ,644 3,393 1 ,065 3,274 ,927 11,564
Constant -5,297 1,461 13,144 1 ,000 ,005
a. Variable(s) entered on step 1: GODINE, BMI.

p OR

log (odds) = −5,297 + 0,086× godine+ 1,186× gojaznost

ORgodine = e0,086 = 1,090


ORgojaznost = e1,186 = 3,274
58
KSB : (Godine + Gojaznost)

70

60

50

40

30

20

10

0 KSB -
gojazni KSB +
negojazni
> 50 g gojazni
< 50 g negojazni

KSB + KSB -

59
Logistička regresija u SPSS

KSB : (Pušenje + Gojaznost)

Variables in the Equation

95,0% C.I.for EXP(B)


B S.E. Wald df Sig. Exp(B) Lower Upper
Step
a
PUSENJE 1,987 ,616 10,402 1 ,001 7,290 2,180 24,380
1 BMI 1,177 ,620 3,599 1 ,058 3,244 ,962 10,943
Constant -1,565 ,488 10,266 1 ,001 ,209
a. Variable(s) entered on step 1: PUSENJE, BMI.

p OR
log (odds) = −1,565 + 1,987× pušenje+ 1,177× gojaznost

ORpuš 1,987 = 7,290


pušenje = e

ORgojaznost = e1,177 = 3,244


60
KSB : (Pušenje + Gojaznost)

60

50

40

% 30

20

10

0 KSB -
gojazni KSB +
pušači negojazni
gojazni
nepušači negojazni

KSB + KSB -

61
Logistička regresija u SPSS

KSB : (Godine + Pušenje + Gojaznost)


Variables in the Equation

95,0% C.I.for EXP(B)


B S.E. Wald df Sig. Exp(B) Lower Upper
Step
a
GODINE ,106 ,031 11,467 1 ,001 1,112 1,046 1,182
1 PUSENJE 2,615 ,819 10,197 1 ,001 13,666 2,745 68,029
BMI 1,271 ,749 2,883 1 ,090 3,565 ,822 15,464
Constant -7,587 2,055 13,631 1 ,000 ,001
a. Variable(s) entered on step 1: GODINE, PUSENJE, BMI.

p OR
log (odds ) = −7,587 + 0,106 × godine + 2,615 × pušenje + 1,271× gojaznost
ORgodine = e0,106 = 1,112
ORpuš 2,615 = 13,666
pušenje = e

ORgojaznost = e1,271 = 3,565


62
Faktori rizika za KSB
prediktor OR p
godine 1,089 p<0,001
pušenje 7,286 p=0,001
gojaznost 3,241 p=0,034
godine + 1,106 p<0,001
pušenje 13,016 p<0,001
godine + 1,090 p=0,001
gojaznost 3,274 p=0,065
pušenje + 7,290 p=0,001
gojaznost 3,244 p=0,058
godine + 1,112 p=0,001
pušenje + 13,666 p=0,001
gojaznost 3,565 p=0,090
63
Primer 2 – lečenje artritisa
tret pobolj tret pobolj tret pobolj
dani pol god dani pol god dani pol god
man šanje man šanje man šanje
57 1 0 27 1 27 1 1 58 0 50 0 1 31 1
46 1 0 29 0 2 1 1 59 1 38 0 1 32 0
77 1 0 30 0 59 1 1 59 1 35 0 1 33 1
17 1 0 32 1 62 1 1 60 1 51 0 1 37 0
36 1 0 46 1 84 1 1 61 1 54 0 1 44 0
23 1 0 58 1 64 1 1 62 1 76 0 1 45 0
75 1 0 59 0 34 1 1 62 1 16 0 1 46 0
39 1 0 59 1 58 1 1 66 1 69 0 1 48 0
33 1 0 63 0 13 1 1 67 1 31 0 1 49 0
55 1 0 63 0 61 1 1 68 1 20 0 1 51 0
30 1 0 64 0 65 1 1 68 1 68 0 1 53 0
5 1 0 64 1 11 1 1 69 0 81 0 1 54 0
63 1 0 69 0 56 1 1 69 1 4 0 1 54 0
83 1 0 70 1 43 1 1 70 1 78 0 1 54 1
66 1 1 23 0 9 0 0 37 0 70 0 1 55 1
40 1 1 32 0 14 0 0 44 0 49 0 1 57 0
6 1 1 37 1 73 0 0 50 0 10 0 1 57 1
7 1 1 41 0 74 0 0 51 0 47 0 1 58 1
72 1 1 41 1 25 0 0 52 0 44 0 1 59 1
37 1 1 48 0 18 0 0 53 0 24 0 1 59 1
82 1 1 48 1 21 0 0 59 0 48 0 1 61 0
53 1 1 55 1 52 0 0 59 0 19 0 1 63 1
79 1 1 55 1 45 0 0 62 0 3 0 1 64 0
26 1 1 56 1 41 0 0 62 0 67 0 1 65 1
28 1 1 57 1 8 0 0 63 1 32 0 1 66 0
60 1 1 57 1 80 0 1 23 0 42 0 1 66 0
22 1 1 57 1 12 0 1 30 0 15 0 1 66 1
27 1 1 58 0 29 0 1 30 0 71 0 1 68 1
64
Variables in the Equation

95,0% C.I.for EXP(B)


B S.E. Wald df Sig. Exp(B) Lower Upper
Step
a
DANI ,003 ,011 ,056 1 ,813 1,003 ,982 1,024
1 TRETMAN 1,786 ,538 11,005 1 ,001 5,966 2,077 17,140
POL 1,454 ,595 5,967 1 ,015 4,282 1,333 13,756
GODINE ,046 ,021 4,767 1 ,029 1,047 1,005 1,090
Constant -4,459 1,393 10,250 1 ,001 ,012
a. Variable(s) entered on step 1: DANI, TRETMAN, POL, GODINE.

Artritis
dani: dužina lečenja u danima
tretman: 1 – lek ; 0 – placebo
pol: 0 – muškarci : 1 – žene
godine: godine starosti
poboljšanje: 0 – nema poboljšanja ; 1 - poboljšanje

65

You might also like