Download as ppt, pdf, or txt
Download as ppt, pdf, or txt
You are on page 1of 87

Βασικές αρχές ιατρικής στατιστικής

Παν. Ανδριόπουλος
• Με τον όρο Πληθυσµός σε µια έρευνα, εννοούµε ένα σύνολο που
µπορεί να αποτελείται από ανθρώπους, ζώα ή αντικείµενα
(πρωταρχικές µονάδες δειγµατοληψίας), τα χαρακτηριστικά των
οποίων θέλουµε να µελετήσουµε.

• Ο όρος ∆είγµα σε µια έρευνα, αναφέρεται σε µια


συλλογή (υποσύνολο) από µονάδες του πληθυσµού που µας
ενδιαφέρει, τις οποίες επιλέγουµε έτσι ώστε να αποτελούν µια
αντιπροσωπευτική εικόνα του πληθυσµού.
• Στη Στατιστική θα αναφερόµαστε σε τυχαία δείγµατα µε την
έννοια ότι οι επιλεγόµενες µονάδες δεν επηρεάζουν η µία την άλλη
και έχουν παρόµοια συµπεριφορά ως προς το χαρακτηριστικό που
µελετάµε.
Μεταβλητές
Τα άτοµα ενός πληθυσµού ή ενός δείγµατος µπορούν να µελετηθούν ως προς ένα
ή περισσότερα χαρακτηριστικά τους. Τα χαρακτηριστικά αυτά τα
ονοµάζουµε µεταβλητές.

Οι µεταβλητές, ανάλογα µε τις τιµές που µπορούν να πάρουν και το είδος


της µέτρησης που επιδέχονται, διακρίνονται σε
α. Κατηγορικές ή ποιοτικές (categorical, qualitative), των οποίων
ενδιαφέρουσες υποπεριπτώσεις είναι οι δίτιµες ή διχοτοµικές
(binary) και οι διατάξιµες (ordinal)
και
β. Ποσοτικές, οι οποίες µπορούν να είναι είτε διακριτές (π.χ. αριθµός
τσιγάρων που καπνίζει ηµερησίως ένας καπνιστής) είτε συνεχείς (π.χ.
τιµή σακχάρου σε ένα ασθενή)
Πίνακες συχνοτήτων και σχετική συχνότητα
Πίνακες συχνοτήτων και σχετική συχνότητα
Πίνακες συχνοτήτων και αθροιστική συχνότητα
Γραφήματα - Πίτες
Γραφήματα - Ραβδόγραμμα
Γραφήματα - Ιστόγραμμα
Κατανομή συχνοτήτων
Κατανομή συχνοτήτων
Κατανομή συχνοτήτων – Κανονική κατανομή
• Επικρατούσα τιμή: η τιμή με την μεγαλύτερη συχνότητα

•Διάμεσος: η μεσαία τιμή του δείγματος (όσες τιμές κάτω τόσες και πάνω)

•Μέσος: αριθμητικός μέσος , επηρεάζεται από την διασπορά και τις ακραίες
τιμές

• Εκατοστημόρια: χωρίζουμε το δείγμα σε 100 ίσα τμήματα

•Εύρος τιμών: η απόσταση από την χαμηλότερη στην ανώτερη τιμή


Boxplot
Σταθερή απόκλιση - Standard deviation

Εκτίμηση της διαφοράς των τιμών του δείγματος::

• Αφαιρούμε τον μέσο από κάθε τιμή


• Υψώνουμε τις διαφορές στο τετράγωνο
• Αθροίζουμε το αποτέλεσμα
• Διαιρούμε το άθροισμα με ν-1
• Παίρνουμε την τετραγωνική ρίζα
• 68% των τιμών βρίσκονται ± 1 SD από τον μέσο
• 95% των τιμών βρίσκονται ± 2 SD από τον μέσο
• 99% των τιμών βρίσκονται ± 3 SD από τον μέσο
Είδη μελετών

• Παρατήρησης – Παρέμβασης
• Προοπτικές – Αναδρομικές
• Διαχρονικές – Συγχρονικές

• case – series, cross section, cohort, case – control


Συγχυτικοί παράγοτνες
• clinical trials
Τυχαιοποίηση – Τυφλή μεθοδολογία
Πραγμάτωση μιας περιγραφικής έρευνας
Εύρημα Σύνολο
Πάσχουν Δεν πάσχουν
Θετικό α β α+β
«ορθό θετικό» «εσφαλμένα
θετικό»
Αρνητικό γ δ γ+δ
«εσφαλμένα «ορθά αρνητικό»
αρνητικό»
Σύνολο α+γ β+δ α+β+γ+δ

Ευαισθησία: η αναλογία των ορθά θετικών ευρημάτων στο σύνολο


εκείνων που πάσχουν α/α+γ
Ειδικότητα: η αναλογία των ορθά αρνητικών ευρημάτων στο σύνολο
εκείνων που δεν πάσχουν δ/β+δ
Δεν εξαρτώνται από την αναλογία πασχόντων προς μη πάσχοντες στον
εξεταζόμενο πληθυσμό
Πραγμάτωση μιας περιγραφικής έρευνας
Εύρημα Σύνολο
Πάσχουν Δεν πάσχουν

Θετικό α β α+β
«ορθό θετικό» «εσφαλμένα
θετικό»
Αρνητικό γ δ γ+δ
«εσφαλμένα «ορθά αρνητικό»
αρνητικό»
Σύνολο α+γ β+δ α+β+γ+δ

Θετική διαγνωστική αξία: αναλογία ορθά θετικών επί συνόλου θετικών


ευρημάτων α/α+β
Αρνητική διαγνωστική αξία: αναλογία ορθά αρνητικών επί συνόλου
αρνητικών ευρημάτων δ/γ+δ
Εξαρτώνται από την αναλογία πασχόντων προς μη πάσχοντες στον
εξεταζόμενο πληθυσμό
Σχέση μεταξύ ευαισθησίας και ειδικότητας

• Η καμπύλη ROC (Receiver Operator Characteristic curve)


Κατασκευάζεται από την σχέση ευαισθησίας (αληθώς θετικά) και
ειδικότητας (ψευδώς αρνητικά)
Όσο μεγαλύτερη είναι η περιοχή κάτω από την καμπύλη τόσο
χρησιμότερη είναι η δοκιμασία
Σχέση μεταξύ ευαισθησίας και ειδικότητας
• Θετική διαγνωστική αξία: η πιθανότητα να έχει κάποιος την νόσο αν
έχει θετική την διαγνωστική εξέταση
• Αρνητική διαγνωστική αξία: η πιθανότητα να μην έχει κάποιος την
νόσο αν η διαγνωστική εξέταση είναι αρνητική

Η διαγνωστική αξία μιας δοκιμασίας εξαρτάται από τον επιπολασμό


την νόσου (η του χαρακτηριστικού ή της κατάστασης που αναζητούμε.

Αν μια εξέταση για μια ασθένεια έχει 95% ευαισθησία και 95%
ειδικότητα και ο επιπολασμός της νόσου είναι 1/1000, αν κάποιος έχει
θετική την δοκιμασία τι πιθανότητα έχει να έχει την νόσο;
Θετική διαγνωστική αξία:
ειδικότητα * επιπολασμός /
(ειδικότητα * επιπολασμός) +((1-ειδικότητα)*(1-επιπολασμός))

• Όσο μεγαλύτερη η ευαισθησία τόσο μεγαλύτερη η αρνητική διαγνωστική αξία


δηλαδή η πιθανότητα να μην έχει κάποιος την νόσο αν η διαγνωστική εξέταση
είναι αρνητική
• Όσο μεγαλύτερη η ειδικότητα τόσο μεγαλύτερη η θετική διαγνωστική αξία
δηλαδή η πιθανότητα να έχει κάποιος την νόσο αν έχει θετική την διαγνωστική
εξέταση
Πιθανότητα – κίνδυνος - odds

•Πιθανότητα p: τιμές από 0 έως 1


Αν κάτι έχει πιθανότητα να συμβεί p τότε η πιθανότητα να μην συμβεί
είναι 1-p
Κανονική κατανομή πιθανότητα 0.95 η τιμή που έχει μια μέτρηση να
είναι ± 2 SD από τον μέσο
• Κίνδυνος risk: η χρήση της πιθανότητας στις κλινικής μελέτες
Συνήθως μας απασχολεί ο σχετικός κίνδυνος (relative risk)
• odds: πιθανότητα
Συνήθως μας απασχολεί ο λόγος των συμπληρωματικών πιθανοτήτων odds ratio:
μικρότερος ίσος μεγαλύτερος της μονάδας
• Ασθενείς με εγκεφαλικό που ασκήθηκαν 55, που δεν ασκήθηκαν 70. odds
αυτών που ασκήθηκαν και έπαθαν εγκεφαλικό 55/70: 0.7857
•Ασθενείς χωρίς εγκεφαλικό που ασκήθηκαν 130, που δεν ασκήθηκαν 68.
odds αυτών που ασκήθηκαν και δεν έπαθαν εγκεφαλικό 120/68: 1,9118
•Λόγος των odds 0.7857/1.9118: η άσκηση προστατεύει
Διάστημα εμπιστοσύνης

• Standard error: τυπικό σφάλμα: SD/√ n σταθερή απόκλιση προς τετραγωνική ρίζα
του μεγέθους του δείγματος

• Όσο μικρότερο τόσο καλύτερα


•Εκτίμηση της διασποράς του δείγματος
• Διάστημα εμπιστοσύνης Confidence interval: αριθμητικός μέσος ± 2se
Τι σημαίνει: πιθανότητα 95% να βρίσκεται ο αριθμητικός μέσος του πληθυσμού σε
τιμή από αριθμητικό μέσο -2se έως αριθμητικό μέσο +2se
• Με παρόμοια φιλοσοφία υπολογίζουμε διαστήματα εμπιστοσύνης για risk ratio,
odds ratio
• Αν τα διαστήματα εμπιστοσύνης περιλαμβάνουν την μονάδα τότε δεν υπάρχει
στατιστικά σημαντική διαφορά
Στατιστική συσχέτιση

Παράγοντας Α πιθανότητα α

Νόσημα Β πιθανότητα β

Ανεξαρτησία Α και Β πιθανότητα να υπάρχουν και τα δυο: α επί β

Στην πραγματικότητα ποια είναι η πιθανότητα μεγαλύτερη, μικρότερη ή ίση με


α επί β? (θετική, καμιά, αρνητική συσχέτιση)

Παράδειγμα κάπνισμα και στεφανιαία νόσος

Συστηματικό σφάλμα (κακή μεθοδολογία)


Στατιστική συσχέτιση

Πλασματική δευτερογενής αιτιολογική συσχέτιση:


Μια στατιστική συσχέτιση δεν είναι πάντοτε αιτιολογικής φύσεως.
Αυτές ονομάζονται δευτερογενείς
Παράδειγμα: καρκίνος πνεύμονα και χρωματισμός δακτύλων

Όταν ένας παράγοντας Α αποτελεί «αιτία» ενός νοσήματος Β και


ενός παράγοντα Γ και οι οντότητες Β και Γ δεν συνδέονται
αιτιολογικά, τότε μεταξύ Β και Γ υπάρχει δευτερογενής πλασματική
συσχέτιση
Στατιστική συσχέτιση

Πλασματική δευτερογενής αιτιολογική συσχέτιση:

Πώς γίνεται η διάκριση

• Χρονική αλληλουχία

• Βαθμός συσχετίσεως

•Συμβατότητα με την περιγραφική επιδημιολογία του νοσήματος

•Συμβατότητα με τα βιολογικά δεδομένα


Στατιστική συσχέτιση

Δευτερογενής αιτιολογική συσχέτιση:

Κάθε παράγοντας που σχετίζεται στατιστικά με ένα νόσημα ονομάζεται


«παράγοντας κινδύνου» ακόμη και αν η συσχέτιση αυτή είναι αιτιολογική ή
δευτερογενής πλασματική

Κάπνισμα και χρωματισμός δακτύλων


Παράγοντας Α και Νόσημα Β
(ή γενικά δυο κατηγορίες γεγονότων ή καταστάσεων)

•Από στατιστικής άποψης άσχετα (ανεξάρτητα)


•Από στατιστικής άποψης σχετικά (συσχετιζόμενα)
Λόγω συστηματικού σφάλματος
Λόγω πλασματικής δευτερογενούς σχέσης
Λόγω αιτιολογικής σχέσης
Έμμεσης
Άμεσης
Συμπερασματολογία
• Στόχος: εξαγωγή συμπερασμάτων για το σύνολο ενός
πληθυσμού, αντλώντας πληροφορίες από ένα μικρό
υποσύνολο αυτού
• Ορισμοί
– Πληθυσμός: σύνολο όλων των υπό εξέταση μονάδων (ατόμων)
– Χαρακτηριστικό: μέτρηση που αφορά όλα τα άτομα του
πληθυσμού
– Δείγμα: υποσύνολο του πληθυσμού
Έλεγχοι υποθέσεων
• Λήψη απόφασης σε κάποιο επιστημονικό πρόβλημα
• Υπολογισμός σφάλματος στην περίπτωση της εσφαλμένης
απόφασης
• Σε όλους τους στατιστικούς ελέγχους υποθέσεων έχουν
οριστεί οι:
– Μηδενική υπόθεση Ηο: η υπόθεση εκείνη την οποία καλείται να
απορρίψει ο ερευνητής
• Απουσία σχέσης μεταξύ δύο χαρακτηριστικών
– Εναλλακτική υπόθεση Η1: η άρνηση της Ηο
• Παρουσία σχέσης μεταξύ δύο χαρακτηριστικών
Στρατηγική
• Βήματα:
– Καθορίζεται η Ηο
– Καθορίζεται μια πιθανότητα (συνήθως 0,05) η οποία είναι η
μέγιστη πιθανότητα αποδεκτού σφάλματος
– Λαμβάνουμε ένα κατάλληλο δείγμα για τη μελέτη της
ερευνητικής μας υπόθεσης
– Ανάλογα με τη μορφή της Ηο και την τιμή του στατιστικού
κριτηρίου απορρίπτουμε την Ηο
Λήψη απόφασης
Πραγματική Κατάσταση της Ηο

Η Ηο είναι αληθής (Α) Η Ηο είναι ψευδής (Ψ)

Η Ηο είναι αληθής (Α) Σωστή απόφαση, Σφάλμα Τύπου ΙΙ,


(αποδεκτή) 1-α β
Η Ηο είναι ψευδής (Ψ) Σφάλμα Τύπου Ι, Σωστή απόφαση
(απορρίπτεται) α, 1-β,
επίπεδο σημαντικότητας δύναμη του ελέγχου

Η επιλογή της κατάλληλης στατιστικής εξαρτάται από:


• τη φύση της μηδενικής υπόθεσης Ηο και της εναλλακτικής υπόθεσης Η1
• τη δύναμη του ελέγχου
Επίπεδο σημαντικότητας
• Η ακριβής τιμή του σφάλματος Τύπου Ι για τα δεδομένα
του προβλήματος (επίπεδο σημαντικότητας, “p –
value”, significance level)
– η πιθανότητα η ληφθείσα απόφαση να είναι υπέρ της ύπαρξης
σχέσης, ενώ στην πραγματικότητα δεν υπάρχει σχέση
• Θέλουμε να έχει πολύ μικρή τιμή
– (συνήθως < 5%)
• Μπορεί το επίπεδο σημαντικότητας p να είναι μικρό
χωρίς απαραίτητα και η συσχέτιση να είναι βιολογικά ή
κλινικά σημαντική
Στατιστική ισχύς
• Η πιθανότητα να απορριφθεί η Ho υπόθεση (δηλ. δεν
υπάρχει σχέση), ενώ αυτή είναι εσφαλμένη
– Αυτό επιζητούμε σε κάθε έρευνα!!!
Τελική Επιλογή Υπόθεσης
• Ορίζουμε το επίπεδο στατιστικής σημαντικότητας α, στο
οποίο θα διεξαχθεί ο έλεγχος
• p-value: η μικρότερη τιμή του α για την οποία
απορρίπτεται η Ηο
– p-value < α τότε απορρίπτω την Ηο και αποδέχομαι την Η1
– p-value > α τότε δεν απορρίπτω την Ηο
• Προσοχή τι δηλώνει η Ηο στην ερμηνεία του
αποτελέσματος!!!
Έλεγχοι Υποθέσεων για Μέσους
• Μέσος ενός πληθυσμού
– π.χ. αν το εισόδημα ενός πληθυσμού είναι 900€
– Ηο: μ = 900€ vs. H1: μ ≠ 900€
• Μέσοι δύο πληθυσμών
– Αξιολόγηση ενός χαρακτηριστικού σε δύο ανεξάρτητα δείγματα
• π.χ. τη διαφορά της μέσης συστολικής αρτηριακής πίεσης σε άνδρες και
γυναίκες
• Ηο: ΣΑΠ(άνδρες) = ΣΑΠ(γυναίκες) vs. H1: ΣΑΠ(άνδρες) ≠
ΣΑΠ(γυναίκες)
– Μέτρηση ενός χαρακτηριστικού στα ίδια άτομα πριν και μετά
• π.χ. διαφορά στο βάρος σώματος πριν και μετά την παρέμβαση
• Ηο: Βάρος(πριν) = Βάρος(μετά) vs. H1: Βάρος(πριν) ≠ Βάρος(μετά)
• Όταν θέλουμε να ελέγξουμε αν η μέση τιμή μιας μεταβλητής σε
μια ομάδα Α διαφέρει από τη μέση τιμή μιας άλλης ομάδας Β
– Η μεταβλητή πρέπει να κατανέμεται κανονικά και στις 2 ομάδες
– Έλεγχος για την ισότητα των διακυμάνσεων

• Στατιστικό κριτήριο: t-test του Student


– Ηο: μ1=μ2 έναντι Η1: μ1μ2 (αμφίπλευρος έλεγχος) ή
– Η1 : μ1>μ2 ή μ1<μ2 (μονόπλευροι έλεγχοι)
Ανάλυση Διακύμανσης
• Έλεγχος για την ύπαρξη διαφορών στις μέσες τιμές ενός
ποσοτικού χαρακτηριστικού μεταξύ των κατηγοριών (>2)
ενός άλλου χαρακτηριστικού
– π.χ. έλεγχος του σωματικού βάρους σε άτομα με καθιστική
ζωή, με μέτρια φυσική δραστηριότητα, με έντονη φυσική
δραστηριότητα
• Ηο: μ1 = μ2 = μ3 vs. H1: οι μέσοι διαφέρουν για τουλάχιστον ένα
ζεύγος
– Η μεταβλητή πρέπει να κατανέμεται κανονικά και στις 2 ομάδες
– Έλεγχος για την ισότητα των διακυμάνσεων
Έλεγχοι υποθέσεων για
Ποιοτικές Μεταβλητές
• Έλεγχος ανεξαρτησίας Χ2 : δύο ομάδες (ασθενείς-
μάρτυρες) εξετάζονται ως προς την έκθεσή τους σε
κάποιο κίνδυνο
– Ελέγχουμε αν τα επίπεδα έκθεσης σε κάποιο παράγοντα
διαφέρουν σε δύο ή περισσότερες κατηγορίες του
χαρακτηριστικού
• π.χ. Ηο: το σύνδρομο επαγγελματικής εξουθένωσης και η επαγγελματική
κατάσταση είναι ανεξάρτητες vs. H1: οι δύο παράγοντες δεν είναι
ανεξάρτητοι
• Όσο πιο μεγάλες τιμές παίρνει το κριτήριο Χ2 τόσο πιο
κοντά είμαστε στο να απορρίψουμε την Ηο
• Όσο πιο μικρές τιμές (0) παίρνει το κριτήριο Χ2 τόσο
πιο κοντά είμαστε στο να ΜΗΝ απορρίψουμε την Ηο
• Το στατιστικό κριτήριο Χ2 μπορεί επίσης να
χρησιμοποιηθεί για έλεγχο
– Ομοιογένειας:
• π.χ. ελέγχουμε αν η κατανάλωση αλκοόλ διαφέρει στους ασθενείς απ’ ότι
στους υγιείς και αν αυτό επηρεάζεται από το φύλο
– Καλής προσαρμογής: ελέγχουμε αν η κατανομή του
πληθυσμού από όπου προέρχεται το δείγμα είναι μια δεδομένη
θεωρητική κατανομή (κανονική)
Συσχέτιση
• Εξετάζει κατά πόσο η μια μεταβλητή επηρεάζεται
από την άλλη
– Απλή συσχέτιση: 2 μεταβλητές
– Πολλαπλή συσχέτιση: >2 μεταβλητές
• Χαρακτηριστικά:
– Γραμμική – μη γραμμική
– Θετική – αρνητική
– Πλήρης
– Όχι συσχέτιση
Συντελεστές συσχέτισης
• Εργαλεία στατιστικού ελέγχου
– r του Pearson (για συνεχείς και κανονικά
κατανεμημένες μεταβλητές)
– ρ (rho) του Spearman (για διακριτές ή μη κανονικά
κατανεμημένες μεταβλητές)
Συντελεστής Συσχέτισης Pearson
• Ενδεδειγμένος για έλεγχο γραμμικής συσχέτισης
μεταξύ δύο μεταβλητών
• Δεν έχει μονάδες μέτρησης
• Όρια: -1 ≤ ρ ≤ 1
– -1 πλήρης αρνητική συσχέτιση
– +1 πλήρης θετική συσχέτιση
– 0 απουσία γραμμικής συσχέτισης
• Αν δύο μεταβλητές είναι ανεξάρτητες είναι και
ασυσχέτιστες
– Δεν ισχύει το αντίθετο!!!
Συντελεστής Συσχέτισης
Τάξεως Spearman
• Ενδείκνυται όταν μια από τις δύο μεταβλητές που
εξετάζουμε είναι διατάξιμη
• Εναλλακτικός του συντελεστή συσχέτισης Pearson
όταν τα δεδομένα παρουσιάζουν ασυμμετρία
• Όταν οι δύο μεταβλητές είναι κατηγορικές αλλά
μπορούν να διαταχθούν
• Όρια: -1 ≤ spearman’s rho ≤ 1
Συντελεστής Συμφωνίας Kendall’s-tau
• Μετρά το βαθμό συμφωνίας μεταξύ δύο
ποσοτικών ή διατάξιμων μεταβλητών
• Όρια: -1 ≤ kendall’s tau ≤ 1
-1 … -0,8 -0,8 … -0,3 -0,3 … +0,3 +0,3 … +0,8 +0,8 … +1
Ισχυρή Μέτρια Ελαφρά Μέτρια Ισχυρή
αρνητική αρνητική συσχέτιση ή θετική θετική
συσχέτιση συσχέτιση ασυσχέτιστα συσχέτιση συσχέτιση

• Η παραπάνω κατηγοριοποίηση δεν εκφράζει στατιστική σημαντικότητα

• Για να γνωρίζουμε αν η παρατηρηθείσα συσχέστιση είναι το ίδιο σημαντική και στον


πληθυσμό πρέπει να γίνει ο κατάλληλος στατιστικός έλεγχος που θα δώσει και το
αντίστοιχο σφάλμα (p)
Σύνοψη
• Ο συντελεστής συσχέτισης εκφράζει μόνο την «ένταση» της γραμμικής σχέσης
• Αν η τιμή του είναι 0 σημαίνει ότι δεν υπάρχει γραμμική συσχέτιση μεταξύ των
μεταβλητών. Αυτό όμως δεν αποκλείει τη δυνατότητα να υπάρχει μη γραμμική
συσχέτιση
• Η τιμή του συντελεστή δεν προσδιορίζει την ευθεία γύρω από την οποία
συγκεντρώνονται τα σημεία του διαγράμματος. Δηλαδή δεν προσδιορίζει την
κλίση και το σταθερό όρο της ευθείας
• Ο συντελεστής συσχέτισης δίνει ένα μέτρο της γραμμικής συσχέτισης των
μεταβλητών Χ και Υ αλλά δεν προσδιορίζει την αιτιώδη σχέση που τις συνδέει,
δηλαδή δεν προσδιορίζει ποιο είναι το αίτιο και ποιο το αποτέλεσμα
• Έτσι είναι δυνατόν η Χ να επηρεάζει την Υ, ή αντίστροφα ή και τα δύο να
συμμεταβάλονται διότι εξαρτώνται από μια τρίτη μεταβλητή ή τέλος η
συσχέτιση που βρέθηκε στο δείγμα να οφείλεται στην τύχη ή σε κάποιο
συστηματικό σφάλμα
Οι έλεγχοι υποθέσεων χωρίζονται σε:

– παραµετρικούς ελέγχους και


– µη παραµετρικούς ελέγχους.

• Οι παραµετρικοί έλεγχοι χρησιµοποιούνται όταν η µεταβλητή Χ που µελετάµε


(ή οι µεταβλητές, αν είναι περισσότερες από µία) ακολουθεί κάποια γνωστή
κατανοµή. Η πιο συνήθης περίπτωση είναι να έχουµε κανονική κατανοµή
• Οι µη παραµετρικοί έλεγχοι χρησιµοποιούνται όταν η µεταβλητή Χ που
µελετάµε (ή οι µεταβλητές, αν είναι περισσότερες από µία) ακολουθεί µια
άγνωστη κατανοµή.
Ερμηνεία στατιστικού τεστ

• Η διαφορά p(a) και p(b)

• Τι σημαίνει p< 0.05: πιθανότητα μικρότερη από 1 στα 20

• p(b): στατιστική δύναμη του τεστ = 1-p(b)


η πιθανότητα ψευδώς αρνητικού αποτελέσματος
1.δεν υπολογίζεται συχνά
2.δεν δημοσιεύονται τέτοιες μελέτες
συνήθως το όριο τίθεται στο 20% (0.02)
Η Φυσική Ιστορία της νόσου: Εκτίμηση Πρόγνωσης

Πρόγνωση: εκφράζεται είτε ως θάνατοι από την νόσο είτε ως


επιβιώσαντες με την νόσο
Τελικό σημείο: θάνατος

Προγνωστικοί παράγοντες: παράγοντες που επηρεάζουν αρνητικά


ή θετικά την επιβίωση

Δεν ταυτίζονται με τους παράγοντες κινδύνου


Η Φυσική Ιστορία της νόσου: Εκτίμηση Πρόγνωσης
Η Φυσική Ιστορία της νόσου: Εκτίμηση Πρόγνωσης

Δείκτες πρόγνωσης:

•5ετής επιβίωση: ποσοστό ασθενών που επιζούν 5 έτη μετά από κάποιο
σημείο στην πορεία της νόσου
•Θνητότητα: ποσοστό ασθενών με την ασθένεια που πεθαίνουν από
αυτή
•Ανταπόκριση: ποσοστό ασθενών που εμφανίζουν ενδείξεις βελτίωσης
μετά από κάποια παρέμβαση
• Ύφεση: ποσοστό ασθενών που εισέρχονται σε στάδιο κατά το οποίο η
νόσος δεν είναι ανιχνεύσιμη
• Υποτροπή: Ποσοστό ασθενών που εμφανίζουν ξανά την νόσο μετά
από ένα διάστημα ελεύθερο αυτής
Εκτίμηση επιβίωσης: Καμπύλες επιβίωσης -Η μέθοδος Kaplan Meier
Εκτίμηση επιβίωσης: Καμπύλες επιβίωσης -Η μέθοδος Kaplan Meier
Εκτίμηση επιβίωσης: Καμπύλες επιβίωσης -Η μέθοδος Kaplan Meier

Αθροιστική πιθανότητα S: p1*p2*p3 κ.ο.κ.


Εκτίμηση επιβίωσης: Καμπύλες επιβίωσης -Η μέθοδος Kaplan Meier

Μέση επιβίωση: η στιγμή που επιβιώνει το 50%


Εκτίμηση επιβίωσης: Καμπύλες επιβίωσης -Η μέθοδος Kaplan Meier

Σύγκριση μεταξύ δυο ομάδων


Γραμμική Παλινδρόμηση (Ι)
• Τεχνική που προσδιορίζει ποια η αιτία και ποιο
το αποτέλεσμα
• Πόσο μεταβάλλεται η τιμή μιας μεταβλητής Υ
(εξαρτημένης) από την μεταβολή μιας άλλης
μεταβλητής Χ (ανεξάρτητης)
– Η Υ στη γραμμική παλινδρόμηση είναι συνεχής
– Υποθέσεις:
• Γραμμική σχέση Υ κ Χ
• Γνωρίζουμε όλες τις τιμές της Χ
Γραμμική Παλινδρόμηση (ΙΙ)
Y  bo  b1 X 1  b2 X 2  ...  bk X k

– Απλή: ένας ανεξάρτητος παράγοντας


– Πολλαπλή: πολλοί ανεξάρτητοι παράγοντες
• bo: σταθερός όρος, η τιμή Υ για Χi=0
• bi: κλίση της ευθείας, συντελεστής παλινδρόμησης
(i=1,2,..,k)
– εκφράζει την κατά μέσο όρο μεταβολή στην εξαρτημένη
μεταβλητή, όταν η αντίστοιχη ανεξάρτητη μεταβλητή
μεταβάλλεται κατά μια μονάδα και οι άλλες μεταβλητές
παραμένουν σταθερές
Γραμμική Παλινδρόμηση (ΙΙΙ)
• Προϋποθέσεις:
– Κανονικότητα: οι παρατηρήσεις προέρχονται από πληθυσμό ο
οποίος ακολουθεί την κανονική κατανομή
– Ομοσκεδαστικότητα: η διασπορά της Υ είναι η ίδια για κάθε
τιμή της Χ
– Ανεξαρτησία: η τιμή της Υi δεν επηράζει την τιμή της Υj (i≠j, i,
j=1,2,…,n)
– Οι τιμές των ανεξάρτητων μεταβλητών Χi παραμένουν σταθερές
σε επανειλημμένα δείγματα
– Οι τιμές των Χ & Υ έχουν μετρηθεί χωρίς σφάλματα
• Τα σφάλματα της παλινδρόμησης , έχουν μέση τιμή μηδέν (0) για κάθε
τιμή της Χ και διακύμανση ανεξάρτητη από τις τιμές της Χ
• Σφάλματα μέτρησης, παράλειψη προσθήκης σημαντικών μεταβλητών
Συσχέτιση vs Παλινδρόμηση
Συσχέτιση Παλινδρόμηση
• Οι μεταβλητές Χ κ Υ είναι • Η μεταβλητή Υ είναι τυχαία
τυχαίες • Η μεταβλητή Χ είναι
• Δείχνει την παρουσία ή όχι καθορισμένη
σχέσης μεταξύ δύο • Δείχνει το βαθμό μεταβολής
μεταβλητών μιας μεταβλητής, αν
• Μετράει την ένταση της μεταβάλλεται μια ή
σχέσης περισσότερες μεταβλητές
• Θετική συσχέτιση  θετική • Μαθηματική σχέση μεταξύ Υ
κλίση της ευθείας &Χ
παλινδρόμησης
Λογαριθμιστική Παλινδρόμηση (Ι)
• Η εξαρτημένη μεταβλητή Υ είναι δίτιμη
– Παίρνει τις τιμές 0 (π.χ. υγιείς, μη καπνιστές) & 1 (π.χ.
ασθενείς, καπνιστές)
• Αναδρομικές μελέτες (ασθενών-μαρτύρων)
– Τυχαιοποίηση ως προς την έκθεση
– Εκτιμάμε τον Odds Ratio: η πιθανότητα να έχουν εκτεθεί σε
κάποιο παράγοντα οι νοσούντες σε σχέση με τους μη νοσούντες
• Προοπτικές μελέτες
– Τυχαιοποίηση ως προς το συμβάν
– Εκτιμάμε το Σχετικό Κίνδυνο (Risk Ratio): ο κίνδυνος να
νοσήσουν οι εκτεθέντες σε κάποιο παράγοντα προς τους μη
εκτεθέντες
Λογαριθμιστική Παλινδρόμηση (ΙΙ)

• Η πιθανότητα π(Χ) είναι συνήθως συνάρτηση


μιας ή περισσοτέρων μεταβλητών {Χ}
(ανεξάρτητες μεταβλητές) οι οποίες ερμηνεύουν
σε μικρό ή μεγάλο βαθμό την π,
– δηλαδή την πιθανότητα της παρουσίας μιας
κατάστασης
– Η πιθανότητα να συμβεί ένα γεγονός για δεδομένες
τιμές των ανεξάρτητων μεταβλητών Χi
Λογαριθμιστική Παλινδρόμηση
(ΙΙΙ)
• Η πιθανότητα π(Χ) είναι συνήθως συνάρτηση
μιας ή περισσοτέρων μεταβλητών {Χ}
(ανεξάρτητες μεταβλητές) οι οποίες ερμηνεύουν
σε μικρό ή μεγάλο βαθμό την π,
– δηλαδή της πιθανότητα της παρουσίας μιας
κατάστασης

You might also like