Download as pdf or txt
Download as pdf or txt
You are on page 1of 30

ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΛΟΓΑΡΙΘΜΙΣΤΙΚΗ
ΕΞΑΡΤΗΣΗ

Γιώτα Τουλούµη Βάνα Σύψα


Αναπληρώτρια Καθηγήτρια Επίκουρη Καθηγήτρια
Βιοστατιστικής και Επιδηµιολογίας Επιδηµιολογίας και Προληπτικής
Ιατρικής
Εργαστήριο Υγιεινής, Επιδηµιολογίας και Ιατρικής Στατιστικής
Ιατρική Σχολή Πανεπιστηµίου Αθηνών

Εισαγωγή

 Έχουµε µάθει ότι αν θέλουµε να διερευνήσουµε


την εξάρτηση ενός ποσοτικού µεγέθους από ένα
άλλο παράγοντα µπορούµε να χρησιµοποιήσουµε
την απλή γραµµική εξάρτηση

 π.χ. Εξάρτηση επιπέδων τριγλυκεριδίων από


την ηλικία

(Γ. ΤΟΥΛΟΥΜΗ-Β.ΣΥΨΑ) 1
ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

200
^
150 Y = 36.7 + 1.47 * X
Triglyceride
100
50
0

0 20 40 60 80
Age

Γραµµική εξάρτηση
 Η χρήση αυτής της µεθόδου επιτρέπει:
 Να αξιολογήσουµε αν η ηλικία επηρεάζει τα επίπεδα
τριγλυκεριδίων
 Να κάνουµε προβλέψεις για τα αναµενόµενα επίπεδα
τριγλυκεριδίων µε βάση την ηλικία του ατόµου

 Προϋπόθεση:
 Η εξαρτηµένη µεταβλητή Υ να έχει κανονική κατανοµή
 Η ευθεία γραµµή να είναι ικανοποιητική προσέγγιση της
σχέσης Υ και Χ

(Γ. ΤΟΥΛΟΥΜΗ-Β.ΣΥΨΑ) 2
ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Κανονικά γραµµικά µοντέλα

Μοντέλα για δίτιµες µεταβλητές

Τι συµβαίνει αν η µεταβλητή την οποία


θέλουµε να µελετήσουµε (η εξάρτηµένη)
δεν είναι ποσοτική αλλά ποιοτική µε 2
επίπεδα;

π.χ
ανάπτυξη Ναι ή Οχι καρκίνου του µαστού
ανταπόκριση ΝΑΙ ή Οχι στη θεραπεία

(Γ. ΤΟΥΛΟΥΜΗ-Β.ΣΥΨΑ) 3
ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Παράδειγµα

 Ηλικία και παρουσία στεφανιαίας νόσου (CHD-


Coronary Heart Disease)
Age CHD Age CHD Age CHD
22 0 40 0 54 0
23 0 41 1 55 1
24 0 46 0 58 1
27 0 47 0 60 1
28 0 48 0 60 0
30 0 49 1 62 1
30 0 49 0 65 1
32 0 50 1 67 1
33 0 51 0 71 1
35 1 51 1 77 1
38 0 52 0 81 1

Πώς µπορούµε να αναλύσουµε αυτά τα


δεδοµένα;
 Συγκρίνοντας τη µέση ηλικία ασθενών µε τη µέση
ηλικία των υγιών
Υγιείς: 38.6 έτη
t-test: p<0.001
Ασθενείς: 58.7 έτη

 Μπορώ να χρησιµοποιήσω γραµµική εξάρτηση;

(Γ. ΤΟΥΛΟΥΜΗ-Β.ΣΥΨΑ) 4
ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Διάγραµµα ηλικίας και CHD

Yes
Signs of coronary disease

OXI

No

0 20 40 60 80 100
AGE (years)

Μοντέλα για δίτιµες µεταβλητές


 Όταν η εξαρτηµένη είναι συνεχής µεταβλητή, µας
ενδιαφέρει να εκτιµήσουµε πως µεταβάλλονται τα επίπεδα
της κατά µέσο όρο αν αυξηθεί η ανεξάρτητη κατά µία
µονάδα, π.χ.
αύξηση της εβδοµαδιαίας φυσικής δραστηριότητας κατά
1 ώρα σηµαίνει µείωση του βάρους κατά 500 gr κατά
µέσο όρο

 Όταν η εξαρτηµένη είναι δίτιµη µεταβλητή (π.χ. απουσία/


παρουσία νόσου) µας ενδιαφέρει αν η αύξηση της
ανεξάρτητης µεταβλητής (π.χ. αριθµός τσιγάρων)
σχετίζεται µε αύξηση ή µείωση της πιθανότητας να έχει
το άτοµο τη νόσο

(Γ. ΤΟΥΛΟΥΜΗ-Β.ΣΥΨΑ) 5
ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Μοντέλα για δίτιµες µεταβλητές


 Σε τέτοια δεδοµένα η εξαρτηµένη µεταβλητή (Υ)
παίρνει τιµές 0 και 1
Π.χ. θεραπεία 0=αποτυχία, 1=επιτυχία
νόσος 0=απουσία, 1=παρουσία

 Συµβολίζουµε
πιθανότητα παρουσίας της νόσου=Pr(Y=1)= π
πιθανότητα απουσίας της νόσου=Pr(Y=0)=1- π

 Μας ενδιαφέρει να ανιχνεύσουµε τις µεταβλητές


(ανεξάρτητες µεταβλητές) που ενδέχεται να
σχετίζονται µε την πιθανότητα π εµφάνισης της
νόσου.

Στο παράδειγµα της CHD


Αρχική διερεύνηση για το πως εξαρτάται η πιθανότητα CHD
από την ηλικία στο δείγµα µας  υπολογισµός % ασθενών
ανά ηλικιακή οµάδα
Diseased

Age group # in group # %

20 - 29 5 0 0

30 - 39 6 1 17

40 - 49 7 2 29

50 - 59 7 4 57

60 - 69 5 4 80

70 - 79 2 2 100

80 - 89 1 1 100

(Γ. ΤΟΥΛΟΥΜΗ-Β.ΣΥΨΑ) 6
ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Αντίστοιχο σχήµα

100

80
% Ασθενών

60

40

20

0
0 20-29
1 30-39
2 40-49
3 50-594 60-695 70-79 680-89 7
Ηλικιακή οµάδα

Λογαριθµιστική (logistic) συνάρτηση

1,0
eα + β x
π=
Πιθανότητα ασθένειας π

1 + eα + β x
Π.χ. Πιθανότητα CHD

0,8

0,6

0,4

0,2

0,0

x
Π.χ. ηλικία

(Γ. ΤΟΥΛΟΥΜΗ-Β.ΣΥΨΑ) 7
ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Λογαριθµιστική (logistic) συνάρτηση

 Η πιθανότητα της νόσου π εξαρτάται από την


ηλικία (X) µέσω της λογαριθµιστικής συνάρτησης

eα + βX
π=
1 + eα + βX

 Πώς µπορώ να µετασχηµατίσω το παραπάνω σε


µία πιο «οικεία» µορφή όπως αυτή της γραµµικής
εξάρτησης (Y=a+βX) ;

Μετασχηµατισµός
eα + βx
π=
1 + eα + βx

π
⇒ = eα + βx
1− π
π
⇒ ln( ) = α + βx
1− π
{

Logit(π)

(Γ. ΤΟΥΛΟΥΜΗ-Β.ΣΥΨΑ) 8
ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Odds και πιθανότητα


 Πιθανότητα: π

 Odds (λόγος συµπληρωµατικών πιθανοτήτων)


πιθανότητα να συµβεί π
odds = =
πιθανότητα να µη συµβεί 1 − π

 π.χ. πιθανότητα 80% να κερδίσει µία οµάδα 


odds=0.80/(1-0.80=4/1 
για κάθε 4 νίκες, µία ήττα

 H έννοια του odds χρησιµοποιείται για να εκφράσει γενικά


την πιθανότητα ή τον κίνδυνο (χωρίς να έχει ακριβώς την
ίδια ερµηνεία µε τις έννοιες αυτές)

Λογαριθµιστική εξάρτηση
Αν Χ η ανεξάρτητη µεταβλητή:
Y
π
ln( ) = α + βX
1− π
ln(odds) = α + βX

 Εξετάζουµε µέσω του β την εξάρτηση της «πιθανότητας»


της νόσου (για την ακρίβεια του log-odds) από την Χ

 Με το µετασχηµατισµό αυτό µεταφερόµαστε από εύρος


τιµών (0,1) που είχε η πιθανότητα π σε εύρος (−∞ , + ∞)

(Γ. ΤΟΥΛΟΥΜΗ-Β.ΣΥΨΑ) 9
ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Μέθοδος εκτίµησης συντελεστών

Μέθοδος διαδοχικών προσεγγίσεων της


πιθανοφάνειας (iterative maximum likelihood
method)

Γραµµική και λογαριθµιστική εξάρτηση

Γραµµική εξάρτηση Λογαριθµιστική


εξάρτηση

Είδος εξαρτηµένης Ποσοτική µε κανονική Ποιοτική µε 2 επίπεδα


µεταβλητής κατανοµή
Τι εκφράζει η Τα επίπεδα της Την πιθανότητα
εξαρτηµένη ποσοτικής µεταβλητής παρουσίας (ή απουσίας)
µεταβλητή (Υ) του ποιοτικού
χαρακτηριστικού (π)
Μοντέλο
^ π
Υ=α+βX ln( ) = α + βX
1−π

(Γ. ΤΟΥΛΟΥΜΗ-Β.ΣΥΨΑ) 10
ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Ερµηνεία του β
π
ln( ) = a + βX
1− π
 Με αυτή την παραµετροποίηση το µοντέλο «µοιάζει» µε
αυτό της απλής γραµµικής εξάρτησης

 Ερµηνεία β: Αύξηση της Χ κατά µία µονάδα συνεπάγεται


αύξηση του log-odds κατά β

 Πως µπορεί να ερµηνευτεί αυτό µε πιο φυσικό τρόπο;


Π.χ. θα µας ενδιέφερε αν η αύξηση της ηλικίας
συνεπάγεται αύξηση του odds (κινδύνου, πιθανότητας)
για CHD (και όχι του log-odds)

Στο παράδειγµα της CHD: Δύο άτοµα


µε ηλικία που διαφέρει κατά 1 έτος
π
ln( 1 ) = a + βX
1 − π1 π π
ln( 2 ) − ln( 1 ) = a + β ( X + 1) − a − βΧ
π 1− π 2 1 − π1
ln( 2 ) = a + β ( X + 1)
1− π 2 π π
⇒ ln( 2 ) − ln( 1 ) = β
1− π 2 1 − π1
 π2 
 
1− π 2
⇒ ln =β
 π1 
 1−π 
 1 
Οdds να έχει CHD π2
το 2ο άτοµο 1− π 2
⇒ = Odds Ratio (OR) = e β
Οdds να έχει CHD π1
το 1ο άτοµο 1 − π1

(Γ. ΤΟΥΛΟΥΜΗ-Β.ΣΥΨΑ) 11
ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Στο παράδειγµα της CHD: Δύο άτοµα


µε ηλικία που διαφέρει κατά 1 έτος
π2
Οdds2
1− π 2
= OR = e β
π1
Οdds1
1 − π1
 Π.χ. eβ =1.2  odds2=1.2*odds1
Αύξηση της ηλικίας κατά µία µονάδα
συνεπάγεται 1.2 φορές µεγαλύτερο odds CHD

(ένα άτοµο έχει 1.2 φορές µεγαλύτερη


«πιθανότητα» CHD σε σχέση µε ένα άλλο που
είναι ένα έτος µικρότερο)

Ερµηνεία του OR (eβ)


π2
 Αν η ηλικία δεν παίζει ρόλο
1− π 2
(β=0) = OR = e β ≅ 1
π1
1 − π1

π2
 Αν όσο αυξάνει η ηλικία αυξάνει ο 1− π 2
= OR = e β > 1
π1
κίνδυνος CHD (β>0):
1 − π1

π2
 Aν όσο αυξάνει η ηλικία µειώνεται 1− π 2
= OR = e β < 1
ο κίνδυνος CHD (β<0): π1
1− π1

(Γ. ΤΟΥΛΟΥΜΗ-Β.ΣΥΨΑ) 12
ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Ερµηνεία του OR (eβ)


 Aν OR κοντά στο 1: παρόµοιος κίνδυνος παρουσίας της νόσου σε άτοµα
που διαφέρει η ηλικία τους κατά 1 έτος

 Αν OR>1, π.χ. OR=1.2: ένα άτοµο έχει 1.2 φορές µεγαλύτερη


«πιθανότητα» CHD σε σχέση µε ένα άλλο που είναι ένα έτος µικρότερο
 ENAΛΛΑΚΤΙΚΑ: ένα άτοµο έχει 20% µεγαλύτερη πιθανότητα CHD
σε σχέση µε ένα άλλο που είναι ένα έτος µικρότερο
1.2-1=0.2=20%

 Αν OR<1, π.χ. OR=0.75: ένα άτοµο έχει 0.75 φορές µικρότερη


«πιθανότητα» CHD σε σχέση µε ένα άλλο που είναι ένα έτος µικρότερο
 ENAΛΛΑΚΤΙΚΑ: ένα άτοµο έχει 25% µικρότερη πιθανότητα CHD σε
σχέση µε ένα άλλο που είναι ένα έτος µικρότερο
0.75-1=-0.25=-25%

Ερµηνεία του συντελεστή β στη γραµµική


και λογαριθµιστική εξάρτηση

Σχέση µε ανεξάρτητη µεταβλητή Χ


Απουσία Θετική Αρνητική
σχέσης σχέση σχέση
Γραµµική β=0 β>0 β<0
εξάρτηση
Λογαριθµιστική β=0 β>0 β<0
εξάρτηση ή ή ή
β
e =1 β
e >1 β
e <1

(Γ. ΤΟΥΛΟΥΜΗ-Β.ΣΥΨΑ) 13
ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Πολλαπλή λογαριθµιστική εξάρτηση


Αν Χ1, Χ2, …, Χp p ανεξάρτητες µεταβλητές

Μοντέλο:
π
ln( ) = log(odds ) = α + β1 X 1 + β 2 X 2 + ... + β p X p
1− π

 Παρόµοια ερµηνεία µε πολλαπλή γραµµική


εξάρτηση:
Αύξηση του log-odds για µία µονάδα αύξησης της
Χι όταν οι υπόλοιπες µεταβλητές είναι σταθερές
(ανεξάρτητα δηλαδή από τις υπόλοιπες
µεταβλητές)

Ποιοτικές ανεξάρτητες µεταβλητές


 Όπως στην πολλαπλή γραµµική παλινδρόµηση, οι
ανεξάρτητες µεταβλητές µπορεί να είναι
Ποσοτικές
Ποιοτικές

 Πως εισάγονται οι ποιοτικές µεταβλητές στο µοντέλο και


πως ερµηνεύονται οι συντελεστές β;

(Γ. ΤΟΥΛΟΥΜΗ-Β.ΣΥΨΑ) 14
ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Ποιοτικές µεταβλητές µε 2 επίπεδα


Αν η ποιοτική µεταβλητή έχει 2 επίπεδα (π.χ. φύλο):

 Αποφασίζουµε ποια σύγκριση επιθυµούµε να κάνουµε π.χ.


άνδρες σε σχέση µε γυναίκες ή αντίστροφα
Π.χ. παρουσία CHD σε άνδρες σε σχέση µε γυναίκες
 κατηγορία αναφοράς: γυναίκες

 Η κατηγορία αναφοράς κωδικοποιείται µε 0 και η άλλη


κατηγορία µε 1 (γενικά η κατηγορία αναφοράς
κωδικοποιείται µε τη µικρότερη τιµή)

 Ο συντελεστής eβ για το φύλο εκφράζει πόσο αυξηµένο (ή


µειωµένο) κίνδυνο έχουν οι άνδρες σε σχέση µε τις
γυναίκες

Ποιοτικές µεταβλητές µε >2 επίπεδα


Όπως στην πολλαπλή γραµµική εξάρτηση: Δηµιουργία ψευδοµεταβλητών
(dummy variables- indicator variables)

Παράδειγµα: φυλή
1: White / 2: Black / 3: Hispanic / 4: Other

Η µεταβλητή έχει 4 επίπεδα  3 ψευδοµεταβλητές στο µοντέλο


Π.χ. αν κατηγορία αναφοράς: White

Χ1 = 1 black
= 0 not black

Χ2 = 1 hispanic
= 0 not hispanic

Χ3 = 1 other
= 0 not other

(Γ. ΤΟΥΛΟΥΜΗ-Β.ΣΥΨΑ) 15
ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Πως εισάγουµε ποιοτικές µεταβλητές στο


µοντέλο;
 Εκτιµώνται τα βi για τη σύγκριση κάθε µίας κατηγορίας
προς την κατηγορία αναφοράς, π.χ.
β
Black vs. white  e 1 δείχνει πόσο
αυξηµένο/µειωµένο κίνδυνο CHD έχουν οι µαύροι σε
σχέση µε λευκούς
β
Hispanic vs. white e 2 δείχνει πόσο
αυξηµένο/µειωµένο κίνδυνο CHD έχουν οι hispanic σε
σχέση µε λευκούς
β
Other vs. white e 3 δείχνει πόσο
αυξηµένο/µειωµένο κίνδυνο CHD έχουν οι άλλοι σε
σχέση µε λευκούς

Παράδειγµα: Φυλή και CHD

RACE Odds ratio (eβ)


White Κατηγορία αναφοράς

Black 8.0

Hispanic 6.0

Other 4.0

 Π.χ. οι µαύροι έχουν 8 φορές µεγαλύτερο κίνδυνο


CHD σε σχέση µε τους λευκούς

(Γ. ΤΟΥΛΟΥΜΗ-Β.ΣΥΨΑ) 16
ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Στατιστική αξιολόγηση συντελεστών


λογαριθµιστικής εξάρτησης
β
 Το β µπορεί να αξιολογηθεί µέσω του SEβ . Η
ποσότητα αυτή ελέγχεται στην κανονική κατανοµή
ή στην t κατανοµή στους άπειρους βαθµούς
ελευθερίας

 Η αξιολόγηση επίσης µπορεί να γίνει ακόµα και αν


δεν δίνεται το SE µέσω των 95% ορίων
αξιοπιστίας του β ή του odds ratio eβ

Παράδειγµα
RACE Odds ratio 95% CI
(eβ)
White Κατηγορία αναφοράς

Black 8.0 (2.3, 27.6)

Hispanic 6.0 (1.7, 21.3)

Other 4.0 (1.1, 14.9)

 Απουσία συσχέτισης: β=0  eβ=1


 Αν τα 95% ΟΑ του odds ratio περιλαµβάνουν το 1  όχι
στατιστικά σηµαντικό

(Γ. ΤΟΥΛΟΥΜΗ-Β.ΣΥΨΑ) 17
ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Παράδειγµα
RACE Odds ratio 95% CI p
(eβ)
White Κατηγορία αναφοράς

Black 8.0 (2.3, 27.6) 0.001

Hispanic 6.0 (1.7, 21.3) 0.006

Other 4.0 (1.1, 14.9) 0.039

Αποτελέσµατα πολλαπλής λογαριθµιστικής εξάρτησης για τη διερεύνηση


του ρόλου ορισµένων µεταβλητών στην εµφάνιση εµφράγµατος του
µυοκαρδίου. Μελέτη 234 ασθενών και 1742 µαρτύρων

Ανεξάρτητη µεταβλητή Συντελεστής Πιθανό Πηλίκο OR


µερικής σφάλµα bi/SE(bi) Exp(bi)
εξάρτησης (bi) SE(bi)

Χ1: Χρήση αντισυλληπτικών b1: 1,188 0,261 4,552 3,281


(0: Όχι, 1: Ναι)

Χ2: Ηλικία (έτη) b2: 0,152 0,014 10,857 1,164


Χ3: Κάπνισµα 1-24 τσιγ./ηµ. b3: 1,125 0,210 5,357 3,080
(0: Όχι, 1: Ναι)
Χ4: Κάπνισµα ≥25 τσιγ./ηµ. b4: 2,137 0,209 10,225 8,474
(0: Όχι, 1: Ναι)

OR ανά 5-ετή αύξηση της ηλικίας:


exp(0,152*5)=exp(0.760)=2.138

(Γ. ΤΟΥΛΟΥΜΗ-Β.ΣΥΨΑ) 18
ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Λογαριθµιστική εξάρτηση και πίνακες


συνάφειας
 Έχουµε δει ότι η σχέση 2 ποιοτικών µεταβλητών µπορεί
να διερευνηθεί µε την εφαρµογή του X2 τεστ

 Επίσης, αν υπάρχει µία τρίτη µεταβλητή που είναι πιθανός


συγχυτικός παράγοντας (π.χ. κάπνισµα στη σχέση καφέ-
καρκίνου πνεύµονα), κάνουµε διάστρωση, δηλ. πίνακες για
τη σχέση καφέ-καρκίνου χωριστά για καπνιστές και µη
καπνιστές

 Τα παραπάνω µπορούν να υπολογιστούν και µε τη


λογαριθµιστκή εξάρτηση

Λογαριθµιστική εξάρτηση και πίνακες


συνάφειας
Exposed Unexposed Total

Disease a b a+b
No disease c d c+d
Total a+c b+d n

 Υπάρχει σχέση µεταξύ ασθένειας και έκθεσης σε


κάποιον παράγοντα; (καρκίνος και κάπνισµα)

 To X2 τεστ δεν ποσοτικοποιεί τη σχέση ούτε µας


δείχνει την κατεύθυνση.
 Σχετικός λόγος ή odds ratio.

(Γ. ΤΟΥΛΟΥΜΗ-Β.ΣΥΨΑ) 19
ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Οdds ratio (σχετικός λόγος)


Exposed Unexposed Total

Disease a b a+b
No disease c d c+d
Total a+c b+d n

odds of disease in exposed


Εκτίµηση σχετικού λόγου: OR =
odds of disease in unexposed

π exp a /( a + c)
1 − π exp c /( a + c) ad
⇒ OR =
π un exp ⇒ OR =
b /(b + d )
⇒ OR =
bc
1 − π un exp d /(b + d )

Παράδειγµα: Τα δεδοµένα χρήσης


αντισυληπτικών (Little, 1998,
Rodriguez, 2000)

(Γ. ΤΟΥΛΟΥΜΗ-Β.ΣΥΨΑ) 20
ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Age Education Desires more Contraceptive use Total


Children? No Yes
<25 Lower Yes 53 6 59
<25 No 10 4 14

<25 Higher Yes 212 52 264


<25 No 50 10 60

25-29 Lower Yes 60 14 74


25-29 No 19 10 29

25-29 Higher Yes 155 54 209


25-29 No 65 27 92

30-39 Lower Yes 112 33 145


30-39 No 77 80 157

30-39 Higher Yes 118 46 164


30-39 No 68 78 146

40-49 Lower Yes 35 6 41


40-49 No 46 48 94

40-49 Higher Yes 8 8 16


40-49 No 12 31 43

Total 1100 507 1607

Πιθανά ερωτήµατα

 Σχέση επιθυµίας για περισσότερα παιδιά µε


χρήση αντισυλληπτικών

 Σχέση ηλικίας µε χρήση αντισυλληπτικών

 Σχέση επιθυµίας για περισσότερα παιδιά µε


χρήση αντισυλληπτικών, διορθωµένη για ηλικία

(Γ. ΤΟΥΛΟΥΜΗ-Β.ΣΥΨΑ) 21
ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Πίνακας συνάφειας
Desires more Contrac. use
children? Yes No
Yes 219 753
No 288 347

 Αξιολόγηση σχέσης χρήσης αντισυλληπτικών µε επιθυµία


για περισσότερα παιδιά: µέσω X2

X2=92.04

Βαθµοί ελευθερίας: (K-1)(L-1)= (2-1)*(2-1)=1


(όπου Κ και Λ ο αριθµός των γραµµών και των στηλών
αντίστοιχα)

Αξιολόγηση στους πίνακες της Χ2 κατανοµής:

ΒΕ 10% 5% 1% 1‰
1 2,71 3,84 6,64 10,83

92.04>10.83
Στατιστικά σηµαντικό στο 1‰
(p<1‰)

(Γ. ΤΟΥΛΟΥΜΗ-Β.ΣΥΨΑ) 22
ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Πως θα ερµηνεύσω καλύτερα τη σχέση


που υπάρχει;
Desires more Contrac. use
children? Yes No
Yes 219 753
No 288 347

219*347
OR = = 0.35
288*753
 Οι γυναίκες που επιθυµούν περισσότερα παιδιά έχουν (1-
0.35=0.65) 65% µικρότερη πιθανότητα να χρησιµοποιούν
αντισυλληπτικά από τις γυναίκες που δεν επιθυµούν
παιδιά

Ανάλυση µε λογαριθµιστική εξάρτηση


 π: πιθανότητα να χρησιµοποιεί µία γυναίκα αντισυλληπτικά
 π/(1-π): odds

 Χ: επιθυµεί (ναι/όχι) περισσότερα παιδιά


Θέλω να συγκρίνω αυτές που επιθυµούν σε σχέση µε
αυτές που δεν επιθυµούν, άρα:
X=1  επιθυµούν παιδιά
Χ=0  δεν επιθυµούν παιδιά (κατηγορία αναφοράς)
π
 Μοντέλο: ln( ) = a + β X και εκτιµάται από
1− π
π
τα δεδοµένα: ln( ) = −0.186 − 1.049 X
1−π

(Γ. ΤΟΥΛΟΥΜΗ-Β.ΣΥΨΑ) 23
ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Διαφέρει η πιθανότητα χρήσης αντισυλληπτικών σε


µία γυναίκα που επιθυµεί περισσότερα παιδιά σε
σχέση µε γυναίκα που δεν επιθυµεί;
π yes
ln( ) = a + β *1 = a + β
1 − π yes π π
ln( yes ) − ln( no ) = a + β − a
π 1 − π yes 1 − π no
ln( no ) = a + β * 0 = a
1 − π no π π
⇒ ln( yes ) − ln( no ) = β
1 − π yes 1 − π no
 π yes 
 
 1 − π yes 
⇒ ln
π no =β
 
Οdds να χρησιµοποιεί  1 − π no 
αντισυλληπτικά γυναίκα  
που επιθυµεί παιδιά π yes
1 − π yes
Οdds να χρησιµοποιεί ⇒ = Odds Ratio (OR) = e −1.049 = 0.35
π no
αντισυλληπτικά γυναίκα
που δεν επιθυµεί παιδιά 1 − π no

Αξιολόγηση συντελεστών
β
 SEβ : Αξιολογείται στους πίνακες της κανονικής
κατανοµής ή t κατανοµής στους άπειρους
Β.Ε.

 95% όρια αξιοπιστίας (ΟΑ- CI) του OR:


β ±1.96 SEβ
e

(Γ. ΤΟΥΛΟΥΜΗ-Β.ΣΥΨΑ) 24
ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Αξιολόγηση συντελεστών
 Από το µοντέλο εκτιµήθηκε SEβ=0.111, άρα:

β − 1.049
= = 89.78
SEβ 0.111

t κατανοµή στους άπειρους Β.Ε.


ΒΕ 10% 5% 1% 1‰
∞ 1,65 1,96 2,58 3,29

89,78>3,29
p<1‰

Εποµένως, το β διαφέρει στατιστικά σηµαντικά από το 0 (ή


αντίστοιχα το odds ratio eβ διαφέρει από το 1) 
στατιστικά σηµαντική σχέση χρήσης αντισυλληπτικών και
επιθυµίας παιδιών

95% ΟΑ
95%CI:
β ±1.96 SEβ
e
exp(-1.049±1.96*0.111)

exp(-1.267) exp(-0.831)

0.282 0.435

Εποµένως OR (95% CI): 0.35 (0.28, 0.44)


(δεν περιλαµβάνεται η µονάδα)

(Γ. ΤΟΥΛΟΥΜΗ-Β.ΣΥΨΑ) 25
ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Η επίδραση της ηλικίας


Η επίδραση του παράγοντα ηλικία µπορεί να διαπιστωθεί µε
παρόµοιο τρόπο θεωρώντας τον παρακάτω 2× ×4 πίνακα
Age Contraceptive use Total
Yes No
<25 72 325 397
25-29 105 299 404
30-39 237 375 375
40-49 93 101 101
Total 507 1100 1607

Age Contraceptive use Age Contraceptive use Age Contraceptive use


Yes No Yes No Yes No
25-29 105 299 30-39 237 375 40-49 93 101
<25 72 325 <25 72 325 <25 72 325

105*325 237 *325 93*325


OR25−29/ <25 = = 1.585 OR30−39 / <25 = = 2.853 OR40−49 / <25 = = 4.156
72* 299 72*375 72*101

Η επίδραση της ηλικίας


(µε λογαριθµιστική εξάρτηση)
 Εφόσον η ηλικία είναι ένας παράγοντας µε τέσσερα
επίπεδα, για να εισαχθεί στο µοντέλο απαιτείται η
δηµιουργία ψευδοµεταβλητών. Έτσι, θα δηµιουργήσουµε 3
ψευδοµεταβλητές Χ1, Χ2 και Χ3 όπως φαίνεται παρακάτω
(εδώ η οµάδα των γυναικών ηλικίας <25 ετών
χρησιµοποιείται ως κατηγορία αναφοράς).
Dummy Age factor
variable <25 25-29 30-39 40-49
X1 0 1 0 0
X2 0 0 1 0
X3 0 0 0 1

Το µοντέλο είναι της µορφής:

 π 
log  = a + b1 X1 + b2 X 2 + b3 X 3
 1− π 
 

(Γ. ΤΟΥΛΟΥΜΗ-Β.ΣΥΨΑ) 26
ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Αποτελέσµατα και ερµηνεία


π
ln( ) = −1.507 + 0.461X 1 + 1.048 X 2 + 1.425 X 3
1−π

Ερµηνεία:
exp(0.461)=1.585
Γυναίκες ηλικίας 25-29 ετών είναι 58.5% πιο πιθανό να
χρησιµοποιούν αντισυλληπτικά σε σχέση µε γυναίκες <25
ετών.

exp(1.425)=4.156
Γυναίκες ηλικίας 40-49 ετών είναι 4.2 φορές πιο πιθανό να
χρησιµοποιούν αντισυλληπτικά σε σχέση µε γυναίκες <25
ετών.

Συνδυάζοντας 2x2 πίνακες συνάφειας: σχέση µεταξύ


επιθυµίας παιδιών και χρήσης αντισύλληψης ανάλογα µε την
ηλικιακή οµάδα
Στις νέες γυναίκες, αυτές που
επιθυµούν παιδιά έχουν παρόµοια
πιθανότητα χρήσης αντισυλληπτικών
µε αυτές που δεν επιθυµούν

(Γ. ΤΟΥΛΟΥΜΗ-Β.ΣΥΨΑ) 27
ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Πώς εξετάζω τη σχέση 2 µεταβλητών


λαµβάνοντας υπόψη ένα πιθανό συγχυτικό
παράγοντα;
 Στρωµατοποιηµένη ανάλυση (Stratified analysis):
Εξετάζω τη σχέση αντισυλληπτικών-επιθυµίας παιδιών µε
διάστρωση κατά ηλικιακή οµάδα
Ένα odds ratio για τη σχέση αντισυλληπτικών-
επιθυµίας παιδιών για κάθε ηλικιακή οµάδα
Σύνθεση των αποτελεσµάτων για εκτίµηση ενός
«συνολικού» odds ratio το οποίο λαµβάνει υπόψη
(διορθώνει) την ηλικία  Mantel-Haenszel:

∑a d / N
i i i

OR Μ − Η = = 0.43
∑bc / N
i i i

Αξιολόγηση Ho: ORMH = 1 µέσω του τεστ Μ-Η.

Ανάλυση µέσω λογαριθµιστικής


παλινδρόµησης
Ανάλυση µέσω λογαριθµιστικής παλινδρόµησης: για να
ελέγξω τη σχέση αντισυλληπτικών-επἶθυµίας παιδιών
διορθώνοντας για την ηλικία, αρκεί να προσθέσω στο
µοντέλο και την ηλικία:
π
ln( ) = −870 + 0.368 AGE1 + 0.808 AGE 2 + 1.023 AGE 3 − 0.824CHILDREN
1− π

 Διορθωµένος OR για τη σχέση αντισυλληπτικών-


επιθυµίας παιδιών: exp(-0.824)=0.44
όπως και µέσω στρωµατοποιηµένης ανάλυσης κατά Μ-Η.

Άρα: Αδρός (unadjusted) OR = 0.35


Διορθωµένος ως προς ηλικία (age-adjusted) OR = 0.44
P<0.001

(Γ. ΤΟΥΛΟΥΜΗ-Β.ΣΥΨΑ) 28
ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Γραφική αναπαράσταση του µοντέλου µε


διόρθωση
P(Y=1|X=0) (no more children) P(Y=1|X=1) (more children)

.6
Probability

.4

.2

1 2 3 4
Age

Γραφική αναπαράσταση του µοντέλου µε


αλληλεπίδραση
P(Y=1|X=0) (no more children) P(Y=1|X=1) (more children)

.6

.5
Probability

.4

.3

.2

1 2 3 4
Age

Αυτό σηµαίνει ότι ενώ η πιθανότητα χρήσης αντισυλληπτικών αυξάνει µε την


ηλικία, η αύξηση αυτή είναι εντονότερη µεταξύ των γυναικών που δεν επιθυµούν
περισσότερα παιδιά

(Γ. ΤΟΥΛΟΥΜΗ-Β.ΣΥΨΑ) 29
ΙΑΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Μελέτη ασθενών µαρτύρων µε


εξωµείωση: τρόπος ανάλυσης
 Εξοµοίωση κατανοµής (frequency matching)
 Για την ανάλυση χρησιµοποιείται λογαριθµιστική
εξάρτηση, µε τις µεταβλητές εξοµοίωσης στο
µοντέλο
 Ατοµική εξοµοίωση (individual matching)
 Επιβάλλεται η χρήση ειδικής λογαριθµιστικής
εξάρτησης: δεσµευµένη λογαριθµική εξάρτηση.
Αν χρησιµοποιήσουµε απλή λογαριθµική
εξάρτηση θα έχουµε εσφαλµένα αποτελέσµατα
(αντίστοιχο µε το απλό προς το κατά ζεύγη Χ2
τεστ

(Γ. ΤΟΥΛΟΥΜΗ-Β.ΣΥΨΑ) 30

You might also like