STAT JH Kompenium - Eksempler I Statistik

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 55

EKSEMPLER -i statistik anvendt i sundhedsvidenskab.

Jacob v.B. Hjelmborg Oktober 2005

Indhold
1 Introduktion 2 Deskription 3 Om sandsynlighed og hypotesetest. 4 Er der forskel mellem to middelvrdier? 5 Sammenligning af tre eller ere middelvrdier 6 Regression og korrelation 7 Sammenligning af grupper 8 Overlevelsesanalyse 9 Risikoberegning Litteraturliste Index
Resum e Disse noter indeholder eksempler i statistik, og er tnkt som et supplement til en egentlig lrebog. Eksemplerne stammer fra statistikkens hovedomr ader i sundhedsvidenskab. Forslag til ndringer, udvidelser og rettelser er yderst velkomne. Der rettes en stor tak til Henrik Frederiksen, Jakob Mortensen, Inge Petersen, Henrik Stvring og Axel Skytthe for god hjlp og inspiration.

2 7 13 16 23 28 33 40 45 52 52

Institut for Sundhedstjenesteforskning, Epidemiologi og statistik. Syddansk Universi-

tet.

Odense i oktober 2005 Jacob v. B. Hjelmborg. jhjelmborg@health.sdu.dk

Introduktion

Ordet statistik er aedt af det latinske status. Oprindeligt betegnede det lren om politiske strrelser og tal, nrmere bestemt hvordan man kunne m staters ressourcer s ale asom befolkningsstrrelse og skattegrundlag. I denne betydning kaldes faget nu for statskundskab, mens ordene statistik og statistisk analyse i dag betyder at gre status og uddrage essentiel information fra (empiriske) undersgelser. Det kan eksempelvis blot vre at sandsynliggre, om en gruppes m alinger (i gennemsnit) er strre end en andens. Vi vil eksemplicere ofte anvendte statistiske metoder og i hj grad fokusere p hvilke sprgsm vi kan stille, hvortil metoderne kan give svar. a al I dette afsnit betragter vi eksempler p statistikkens hovedomr a ader i sundhedsvidenskab, nemlig; Design af undersgelse, beskrivelse af observationer, analyse og fortolkning. Uddybende eksempler forest i senere afsnit. ar

1.1

Streptomycin behandling af tuberkulose


dde 4 14 overlevede 51 38

streptomycin tb-patient tuberkulose patient

Tabel 1: Klinisk randomiseret undersgelse (RCT) af tuberkulose patienter (MRC 1948, se [6]). P baggrund af oplysningerne i Tabel 1, som stammer fra en artikel i British a Medical Journal (1948) [6], kan vi stille flgende sprgsm al: ndrer behandling med streptomycin tuberkulose-mortaliteten? Flgende uddrag af artiklen er et svar til dette sprgsm al: Four of the 55 Streptomycin patients (7%) and 14 of the 52 control patients (27%) died before the end of six months. The dierence between the two groups is statistically signicant; the probability of it occurring by chance is less than one in a hundred. Idag vil vi sige: Fishers eksakte test giver, at p-vrdien (omtales senere) er mindre end 0.01. Dermed er der statistisk signikant forskel mellem det vi ville forvente hvis tuberkulose-mortaliteten var up avirket af streptomycin behandlingen og det faktisk observerede. Vi konkluderer alts at streptoa, mycin ndrer (her: snker) tuberkulose-mortaliteten. Man kan yderligere 2

sprge om, hvor stor ndringen i ddelighed er og angive usikkerhedsgrnser herfor. Mere herom i kapitel 7. Kapitel 7 indeholder eksempler p sammenligning af grupper; Test for a homogenitet (som ovenfor), samt vurdering af strrelsen af en eventuel forskel: Odds-ratio og relativ risiko. Eksemplerne opst ved forskellige underar sgelsesdesign; Eksempelvis case-control studium eller kohorte studium.

1.2

IQ-test - et eksempel p fortolkningsproblematik a

I det flgende eksempel optrder to sprgsm anvendt til kvanticering af al intelligens. Frste sprgsm stammer fra en en klassisk IQ-test, som indg al ar ved militr session med det form at bidrage til information for selektion al blandt potentielle soldater. Sprgsm fra en klassisk IQ-test Betragt flgende bogstaver: al ABBAABBAAXBAABBA Erstat X med det rigtige bogstav. Det rigtige svar giver: ABBAABBAABBAABBA Sprgsm fra en moderne IQ-test. Flgende sprgsm stammer fra al al en moderne IQ-test, som har vret anvendt til undersgelse af forskelle i intelligens mellem sociale grupper, uddannelsesgrupper mm. Betragt flgende ord: SWORD, ARROW, CLUB, DAGGER, BULLET Angiv to ord, som skiller sig ud. Det rigtige svar er: ARROW og BULLET, da de krver et ayringsinstrument. Nedenst aende svar afspejler muligvis intelligens, men giver ingen point i IQ-testen. Dette giver et fortolkningsproblem. CLUB og BULLET, da de er stumpe v aben. DAGGER og BULLET, da de best af seks bogstaver. ar

1.3

Test for diagnose I

Diagnostiske tests for diverse sygdomme, de s akaldte hjemme-tests, kan idag let anskaes. Evidensen af resultatet af visse s adanne tests kan vre forsvindende lille - specielt n testen anvendes for lavrisiko-grupper. Eksemar pelvis vil det vre meningslst at anvende ere af de p markedet tilgna gelige hurtig selv-test for HIV infektion (se [9]) p den danske befolkning: a En meget stor del af de som tester sig selv for HIV-infektion vil opleve, at testen er positiv uden at de reelt er smittede. Liges vil en del reelt smittede a opleve, at testen er negativ (se Eksempel 1.4 nedenfor). Dette er et generelt problem ved anvendelse af diagnostiske tests, og konsekvenserne heraf kan vre fatale. Problemet indg blandt andet i overvejelser om, hvor generelt ar i befolkningen man br screene for krft (se [4]). N man sammenholder den reelle sygdomsstatus, syg eller rask, for et ar individ med udfaldet af en test for sygdomsstatus er der re muligheder. Disse er angivet i Tabel 2. testen er positiv testen er negativ syg Sand positiv Falsk negativ rask Falsk positiv Sand negativ

Tabel 2: Udfaldet af en test sammenholdt med den reelle sygdomsstatus. Centrale sprgsm som opst i forbindelse med test, er: al, ar Hvad er risikoen for at vre syg, n testen er positiv? ar Denne risiko kaldes ogs for den positive prdiktive vrdi. a Hvad er chancen for at vre rask, n testen er negativ? ar Denne risiko kaldes ogs for den negative prdiktive vrdi. a Vi taler nu om risiko - alts sandsynlighed eller chance - for sikker a viden kan ikke forventes. Vi sger at kvanticere risikoen for, at en hndelse indtrer med et tal som antager vrdier mellem 0 og 1. Risikoen for at en bestemt sygdom indtrer kan som bekendt variere fra individ til individ. Lad os nu tnke, at vi betragter en gruppe af individer. Det kan vre alle mnd over 50 hele befolkningen eller en gruppe af homoseksuelle. ar, Andelen af sygdomsramte i en gruppe (til et speciceret tidspunkt) kaldes prvalensen af sygdommen i gruppen. Vores opgave er at diagnosticere, og hertil anvender vi en test. For at kunne vurdere den positive prdiktive vrdi udfra en test, m vi vide noget om testens evne til at skelne: a Sensitivitet: Sandsynligheden for at testen er positiv, n den anvenar des p en sygdomsramt. Vi vurderer sensitiviteten ved a sensitivitet = antal sande positive antal sande positive + antal falske negative 4

Specicitet: Sandsynligheden for at testen er negativ, n den anar vendes p en rask. Vi vurderer speciciteten ved a specicitet = antal sande negative antal sande negative + antal falske positive

Testens sensitivitet og specicitet karakteriserer dens evne til at skelne syge og raske. Jo hjere sensitivitet og specicitet jo bedre test. Vi vil vre interesserede i at vurdere den positive prdiktive vrdi af testen anvendt p en gruppe. I Kapitel 9 vises det, hvorledes den positive prdiktive a vrdi beregnes udfra testens sensitivitet, specicitet samt prvalensen for sygdommen i gruppen (se afsnit 9.4). I Eksempel 1.4 ses, at populationsrisikoen spiller en meget vsentlig rolle.

1.4

Eksempel: HIV test

Det flgende eksempel drejer sig om test for HIV infektion. En del medicinalrmaer annoncerer p internettet med s a adanne test til hjemme-brug. Hos mindst 10 annoncrer var det ikke muligt, at f oplyst b testens sena ade sitivitet og specicitet. I artiklen [1] sammenlignes 5 forskellige produkter med flgende resultatuddrag1 ; Wellcozyme ELISA (> 99%,98.9%), Capillus (97%,> 99%), SeroCard (98.3%,98.9%) og SalivaCard (79.7%,97.8%). Tallene i parantes angiver sensitivitet og specicitet respektivt. Men hvordan kunne forskerne kende den reelle infektionsstatus? Hertil benyttes en anden test for tilstedevrelsen af HIV antistoer (i plasma), som til dette tidspunkt regnes for mest p alidelig - the gold standard (I dette tilflde: Novopath Immunoblot Technique). I artiklen [9] ansl sensitiviteten af et produkt af as typen hurtig selv-test for HIV infektion at vre 86, 5%, hvor producenten angiver > 99%. For at anskueliggre ovenst aende oplysninger vil vi i det flgende antage, at vi anvender en test, hvor sensitiviteten er 98% og speciciteten er 97%. Testen vil alts vise korrekt positiv for i gennemsnit 98 ud af 100 incerede, a og vil ogs vise korrekt negativ for i gennemsnit 97 ud af 100 ikke-incerede. a Lad os nu tnke, at vi har at gre med en gruppe af individer, hvor prvalensen for infektion er 0.1%. Hvis 1 million anvender testen, vil vi med ovenst aende sensitivitet, specicitet og prvalens forvente, at Tabel 2 udmynter sig i nedenst aende Tabel 3 980 Risikoen for at vre inceret givet at testen viser positiv vil vre 980+29970 = 3.2%. For denne test med sensitivitet p 98% og specicitet p 97% og hvor a a prvalensen for infektion er 0.1%, vil den positive prdiktive vrdi alts a vre 3.2%. Ikke brugbart overhovedet! Hvis testen derimod kun blev anvendt af en hj-risiko gruppe, lad os sige, hvor risikoen for infektion er 50%, s vil den positive prdiktive vrdi vre a
1

For information om kondensintervaller og stikprvestrrelse henvises til [1]

testen er positiv testen er negativ

inceret 980 20

ikke-inceret 29970 969030

Tabel 3: Infektionstest med sensitivitet p 98% og specicitet p 97% ana a vendt af 1 million individer, hvor prvalensen for infektion er 0.1%.

.2

Positiv prediktiv vrdi .4 .6

.8

Sensitivitet = 98% Specificitet = 97%


0 .1 .2 Prevalens .3 .4 .5

Figur 1: Infektionstestens positive prdiktive vrdi som funktion af prvalens. 97%. Prvalensen har alts indydelse p den positive prdiktive vrdi a a for en given test og sammenhngen er angivet i Figur 1 for ovenst aende anvendte test. I Kapitel 9 uddybes denne sammenhng. Iflge WHO var det estimerede antal HIV-incerede i Danmark i slutningen af 2001 p 3800 i aldersgruppen 15-49 Dette svarer til en prvalens a ar. p 0.2% for denne gruppe. Det vil vre yderst problematisk, hvis alle i denne a gruppe eller blot tilfldige fra gruppen, anvendte ovenst aende test for HIVinfektion. I gur 2 angives den geograske variation af estimeret prvalens af HIV incerede 15-49 arige ved slutningen af 1999. Kilde: UNAIDS.

Figur 2: Estimeret HIV prvalens for 15-49 arige ved slutningen af 1999. Kilde: UNAIDS

1.5

Opgaver

Opgave 1.1. Overst sprgsm 2 i Eksempel 1.2 om IQ-test til andre sprog, al fx. dansk, og undersg mulige svar. Er sprgsm alets karakter kulturafhngigt? Opgave 1.2. Godtgr udfra Tabel 3, at sensitiviteten, speciciteten og prvalensen er som lovet i teksten.

Deskription
Kan vi beskrive det, som vi observerer?

N forsg udfres, s opsamles en mngde information. Det kan eksemar a pelvis vre ved m aling af blodtryk, observation af depression, udfrelse af sprgeskemaundersgelse, osv. Mngden af opsamlede observationer kaldes for data. Vi vil gerne beskrive data, og et vigtigt indledende skridt er grask reprsentation og klassikation af data. Yderligere vil vi betragte gennemsnit og varians, som giver en kvantitativ opsummering af data.

2.1

Typer af variable.

Det er nyttigt at klassicere variable efter om de er kvalitative eller kvantitative. En kvalitativ variabel kan vre nominal eller ordinal og en kvantitativ variabel kan vre diskret eller kontinuert. I tabel 4 vises eksempler p varia abler inddelt efter disse typer. Vrdier af variable plat & krone fdselsvgt 1, 2, 3 . . . jenfarve jenfarve i blgelngde slet, middel, god antal kokkehuer kn (mand & kvinde) Emil, Ida og Grisepjok telefonnumre 13-skalaen Kvalitativ nominal ordinal x Kvantitativ diskret kontinuert x x x x x x x x x x x

Tabel 4: Eksempler p klassicerede variabler a

2.2

Tvillinger

I Figur 3 angives tvillinge-tvillinge plot for tvillinge-par fra det danske tvillingeregister m med hensyn til inammationsmarkren SICAM-1 (Solubalt le InterCellular Adhension Molecule). Plottet skal lses s aledes, at et punkt p den vandrette akse angiver koncentrationen af sicam-1 for den ene tvila ling, og p den lodrette akse koncentrationen for den anden tvilling i et par. a Bemrk, at tvillinger i et par er mere ens, jo tttere deres afsatte punkt ligger ved diagonalen. Figur 3 indeholder tvillinge-tvillinge plots for monozygote par og for dizygote par. De monozygote par synes mere ens, end de dizygote. Dette antyder genetisk indydelse p koncentrationen af sicam-1 molekyler i ina divider, idet monozygote par er genetisk set ens, hvorimod dizygote par i middel deler halvdelen af deres gener. Figur 4 indeholder tilsvarende tvillinge-tvillinge plots, hvor akserne angiver livslngde (i antal for hvert par. Plottet indikerer, at tvillinger i ar) monozygote par har mindre indbyrdes variation i livslngde, end tvillinger i dizygote par.

Tvillingtvillinge plot
monozygote
1

Tvillingtvillinge plot
dizygote

SICAM1 for tvilling 2

.5 .5
Graphs by zygos

.5

.5

.5

.5

SICAM1 for tvilling 1

Figur 3: tvillinge-tvillinge plots for monozygote og dizygote par. Akserne angiver niveauet af sicam for hvert par. Kilde: Det Danske Tvillingeregister.
MZ
95 105

DZ

Lifespan of twin 2

5 5

15

25

35

45

55

65

75

85

15 25 35 45 55 65 75 85 95 105 5

15 25 35 45 55 65 75 85 95 105

Lifespan of twin 1
Graphs by zygosity

Figur 4: Plot af livslngde for monozygote og dizygote tvillingepar fdt i arene 1870-1910, og hvor begge tvillinger har overlevet i mindst 6 Kilde: ar. Det Danske Tvillingeregister. 9

2.3

Deskriptorer

Lad os tnke os, at vi studerer en egenskab, eksempelvis fdselsvgt, og betegner denne egenskab med X. Vi observerer en stikprve p N individer a i befolkningen og m vrdierne x1 , x2 , . . . , xN . Disse vrdier udgr vores aler data, og vi vil gerne give en kvantitativ opsummering af data. Hertil indfrer vi flgende deskriptorer: Gennemsnittet af stikprven: x = p middelvrdien af X. a
1 N (x1

+ x2 + + xN ) er vores bud

Variansen af stikprven, s2 = N 1 ((x1 x)2 + + (xN x)2 ), og 1 2 ), er m for variationen mellem al stikprve standard-afvigelsen s (= s observationerne. Stikprvens standard-fejl, se = delvrdien af X.
s N

er et m for variationen af midal

2.4

Fdselsvgt.

Histogrammet i gur 5 stammer fra en undersgelse af fdselsvgt for N = 2830 observerede spdbrn. Den gennemsnitlige fdselsvgt (i gram) er x= 1 (x1 + x2 + + x2830 ) = 3528 2830

Andel med fdselsvgt i intervaller a 200 gram


.15 Fraction 0 0 .05 .1

1000

2000

3000 4000 Fdselsvgt i gram

5000

6000

Figur 5: Histogram for fdselsvgt. Antal observerede spdbrn: N = 2830

10

Kondens interval: Hvad er middelfdselsvgten i befolkningen? Vores bedste bud er x = 3528, men x kan variere. Hvis samme undersgelse gentages p en tilsvarende stikprve af bea folkningen, s opn et nyt gennemsnit x, som kan vre forskelligt fra det a as frste. Vi kunne forstte med at gentage undersgelsen p nye tilsvarena de stikprver, og opn nye gennemsnit x for hver gentagelse. Vores bud a p middelfdselsvgten i befolkningen vil s a aledes variere med den udtagne stikprve. Men fordelingen af de x, der f ved hver gentagelse, vil tilnrme as sig den s akaldte normalfordeling med stigende antal gentagelser. Dette uddybes senere, men udnyttes her til at sige, at i 95% af alle gentagelserne af undersgelsen, vil middelfdselsvgten ligge i intervallet ( 1.96 se, x + 1.96 se) x dvs. i intervallet (3509, 3546), da x = 3528, se = 9.45. Dette interval kaldes for 95% kondensintervallet for middelfdselsvgten. Bemrk, at der for at lave kondensintervallet for middelfdselsvgten ikke er lavet gentagelser af undersgelsen. Den udfrte undersgelse, samt antagelsen om normalfordeling af gennemsnit (opn ved hypotetiske gentagelser af undersgelsen), aet er eneste ingredienser, som indg i udtalelsen om middelfdselsvgten i ar befolkningen og dets kondensinterval. NB! Oprindelsen af tallet 1.96, samt forudstninger for gyldigheden af ovenst aende kondensinterval omtales i afsnit 3 (se evt. [5]). Anden, men mindre undersgelse: Histogrammet i gur 6 stammer fra en anden og mindre undersgelse af fdselsvgt, end den ovenfor nvnte. Gennemsnitsfdselsvgten er nu: x = 3530, og standardfejlen er: se = 26.18 for N = 425 observerede spdbrn. Dette giver et 95% kondensinterval p a: (3479, 3581) -det foreg aende var: (3509, 3546). To undersgelser - sammenligning: I Tabel 5 sammenlignes deskriptorer for de to undersgelser af fdselsvgt. P astand: Jo strre stikprve,

- des mindre standardfejl. - des smallere kondensinterval. - des mere prcise konklusioner. Nste skridt kan vre at estimere middelfdselsvgten for drenge og for piger, eller at estimere middelfdselsvgten for spdbrn af rygere og af ikke-rygere, og vurdere forskelle (se afsnit 4). 11

Andel med fdselsvgt i intervaller a 300 gram

0 0

.05

.1

Fraction .15

1000

2000

3000 4000 Fdselsvgt i gram

5000

6000

Figur 6: Histogram for fdselsvgt. Antal observerede spdbrn: N = 425

N x s2 s se 95% konf. interval

nr. 1 2830 3528 252905.5 502.89 9.45 (3509, 3546)

nr. 2 425 3530 291243.3 539.66 26.18 (3479, 3581)

Tabel 5: Sammenligning af de to undersgelser af fdselsvgt.

12

Om sandsynlighed og hypotesetest.
Hvor stor tiltro kan/br vi tillgge en hypotese?

Empirisk baseret forskning g ud p at opstille (falsicerbare) hypoteser, ar a for s at teste hvorvidt de er i overensstemmelse med det observerede. Eka sempelvis kan vi betragte hypotesen: Der fdes lige mange piger og drenge. Hvis hypotesen er forkert, s fdes der enten ere drenge end piger a eller omvendt. Der er kun n m at afgre, om hypotesen er rigtig eller e ade forkert: Tl alle drenge- og pigefdsler i verden! Det vil vi ikke gre, men istedet njes med at tlle nogle af fdslerne, dvs. udtage en stikprve, for s a at give et kvaliceret gt p hypotesens rigtighed. Jo strre stikprve, des a bedre er vores gt. Mere konkret, s beror vores gt p sandsynligheden for a a at observere en stikprve, der er mindst lige s kritisk for hypotesen, som a den stikprve vi allerede har observeret. Denne strrelse kaldes for testens p-vrdi og jo mindre p-vrdi, des mindre tiltro har vi til hypotesen, og des mere tilbjelig er vi til at forkaste den. Vi vil i forelsningen diskutere, hvor lille p-vrdien skal vre for at hypotesen forkastes, hvilket leder til statistisk signikans, klassikation af fejl og testens styrke.

3.1

Fdselsvgt og normalfordeling.
Andel med fdselsvgt i intervaller a 200 gram
.15 Fraction 0 0 .05 .1

1000

2000

3000 4000 Fdselsvgt i gram

5000

6000

Figur 7: Histogram for fdselsvgt indhyldet af en Gauss-kurve (ogs kaldet a normalfordelingskurve).

13

I gur 7 er angivet et histogram for fdselsvgte (se evt. Eksempel 2.4). Vi forestiller os, at fdselsvgte egentligt fordeles efter kurven angivet ved histogrammet. Histogrammets sjler angiver, hvor store andele af spdbrn, som fdes i de forskellige fdselsvgt-intervaller i vores undersgelse. Vi tnker os nu, at de tilsvarende sjler for fdselsvgt-intervaller som afgrnses af kurven, istedetfor viser disse andele. N arealet under hele kurven er 1, ar s vil arealet af en sjle for et fdselsvgt-interval som afgrnses af kurven, a netop vre sandsynligheden for at fdes med fdselsvgt i det p agldende interval.
Middelvrdi=0 og Spredning=1
.4 .3 .3 4 2 0 x 2 4 0 4 .1 y .2 .4

Middelvrdi=0.5 og Spredning=1

.1

y .2

0 x

Middelvrdi=0 og Spredning=0.5
.8 y 0 .05 .1 .15 .2 .25 4 2 0 x 2 4 .6

Middelvrdi=0 og Spredning=2

.2

y .4

0 x

Figur 8: Gauss-kurver for forskellige middelvrdier () og spredninger ( eller sd) En s adan kurve kaldes for en Gauss-kurve eller normalfordelingskurve, og disse optrder overalt(!). Gauss-kurven har den matematiske forskrift: X 1 2 2 exp( 1 (X )2 ) 2 2

hvor er middelvrdien og er spredningen for variablen X. Kurven er fastlagt, n og er fastlagte, og benyttes til at tildele sandsynligheder. ar Som nvnt ovenfor, s svarer sandsynligheder til arealer under kurven. Eka sempelvis vil arealet under kurven for vrdier af X mellem 1.96 og + 1.96 udgre 95% af det samlede areal under kurven (se gur 9). Vi kan s aledes forvente, at 95% af observationerne vil ligge i intervallet ( 1.96 s, x + 1.96 s), x 14

n det antages, at observationerne stammer fra en normalfordeling fastlagt ar ved middelvrdi = x og spredning = s. I Eksempel 2.4 var vi interesserede i at udtale os om middelfdselsvgten. En bermt matematisk stning; Den centrale grnsevrdi stning, som vi ikke skal uddybe her, men hvis indhold blev skitseret i Eksempel 2.4, giver, at fordelingen af middelfdselsvgten vil tilnrme sig en normalfordeling med stigende antal observationer. Dette kan udnyttes til at opstille flgende 95% kondensinterval for middelfdselsvgten. Ved at antage, at den tilnrmede normalfordeling har middelvrdi = x og spredning lig med stikprvens standardfejl, se, f flgende 95% kondensinterval for as middelfdselsvgten: ( 1.96 se, x + 1.96 se) x .

4 sd

3 sd

2 sd

1 sd

mean

1 sd

2 sd

3 sd

4 sd

Figur 9: Gauss-kurven. Arealet under kurven for x mellem 1.96sd og + 1.96sd udgr 95% af det samlede areal under kurven. Sandsynligheder optrder bla. ved bestemmelse af kondensintervaller, som set i ovenst aende, og disse sandsynligheder kom i ovenst aende fra arealer under en fordelingskurve. I forbindelse med test af en hypotese om en empirisk strrelse, eksempelvis middelvrdien, optrder en sandsynlighed - den s akaldte p-vrdi. Denne vrdi er et m for, hvor sjldent vi vil al forvente at observere vores empiriske strrelse, s afremt hypotesen er sand. Vi skal i senere afsnit se, hvorledes p-vrdien optrder i forbindelse med 15

hypotesetest, og blot nvne her, at denne sansynlighed ofte f som arealet as under en passende fordelingskurve.

3.2

Anvendelse af normalfordelingen

Det flgende eksempel viser en anvendelse af normalfordelingen, og er uddraget fra [8]. Alkohol koncentration: 0.58 Fire m alinger p samme person gav a 0.52 0.57 0.48

M aleusikkerhed: Varians= 2 =0.002 promille. Gennemsnittet af m alingerne er x = 0.5375 (promille) Skal personen dmmes? (n den tilladte grnse er 0.5 promille.) ar For at svare p dette sprgsm m vi frst overveje hvor langt 0.5375 er a al, a fra 0.5. Hertil antages, at middel alkohol koncentrationen er normalfordelt. Hypotese: Middel alkohol koncentrationen () er mindre end eller lig med 0.5 promille. NB: Alternativet til hypotesen er; > 0.5 Test: p-vrdien er lig med sandsynligheden for den observerede vrdi (0.5375) eller en der er strre, hvis hypotesen er sand. Denne sandsynlighed er netop lig med arealet af det markerede omr p gur 10. Det vil sige at ade a p-vrdi =
0,5375

f (x, 0.5,

0.002 )dx = 0.0468 4

hvor f (x, , 2 /n) er funktionsforskriften for Gauss-kurven (Se afsnit 3.1). Konklusion: Hypotesen kan ikke accepteres p signikans-niveau 5%. Det a m gennemsnit, 0.5375, er statistisk signikant strre end den tilladte alte grnse p 0.5. Personen dmmes for spiritus-krsel. a

Er der forskel mellem to middelvrdier?

Betragt flgende sprgsm al: Anorexi-behandling: Er der vgtforskel fr og efter? Er der forskel i fdselsvgt for spdbrn af rygere og af ikke-rygere? Er der forskel i forbrnding af glucose for normale og for leverlse hunde? Det vi egentlig sprger om i ovenst aende, kan sammenfattes i sprgsm alet; 16

4.68% .4 .42 .44 .46 .48 .5 .52 .54 .56 .58 .6

Figur 10: Gauss-kurve. P-vrdien udregnet i Eksempel 3.2 svarer til arealet under kurven for middel alkoholkoncentrationer strre end 0.5375. Hvorn er en middelvrdi strre end en anden? ar Er en given slankekur eektiv? Hvis vi m vgten af 100 overvgtige, aler stter dem p en bestemt slankekur i 3 m a aneder, og derefter m vgten aler igen, s kan vi udregne estimater for middelvgten fr og efter slankekuren a for overvgtige. Er middelvrdierne for vgten fr og efter slankekuren ens? Hvis middelvrdien efter slankekuren er statistisk signikant lavere end fr, s har vi strre tiltro til at slankekuren virker. a En ofte anvendt metode til at afgre om to middelvrdier er signikant forskellige, er t-testen. Denne test optrder i to udgaver, hvor hver afhnger af eksperimentets design; Hvis vi har et par af observationer for hvert individ, som i eksemplet med slankekuren ovenfor, s anvendes den parrede a t-test. Den uparrede t-test optrder hvis der kun er n observation for hvert e individ, men hvor hvert individ hrer til n af to grupper. Det er eksempelvis e tilfldet i en undersgelse af fdselsvgten for spdbrn af ikke-rygere og af storrygere. Sprgsm her er s om middelvrdien af fdselsvgten er alet a, forskellig for de to grupper? Vi gennemg t-testen og dens forudstninger ar ved at betragte eksempler.

17

4.1

Leverlse hunde.

Forbrnding af glucose (GI) blev m for en gruppe af normale hunde og alt for en gruppe af leverlse hunde: normale 2.34 2.47 2.45 2.51 2.31 2.33 2.41 2.44 2.46 2.54 uden lever 2.44 2.13 2.20 2.12 2.08 2.24 2.26 2.32 2.25 .

Deskription: Vi begynder med at beskrive de ovenfor givne data. I Tabel 6 angives stikprvens strrelse, gennemsnit og varians. Det ses af Tabel 6, Normale N1 = 10 x1 = 2.426 s2 = 0.006027 1 Uden lever N2 = 9 x2 = 2.227 s2 = 0.012375 2

Tabel 6: Deskriptorer for stikprven af normal og leverlse hunde. at de normale hunde i gennemsnit har en hjere forbrnding af GI, end de leverlse hunde. Via den uparrede t-test vil vi undersge, om det kan skyldes en tilfldighed. Vi betragter nu teorien for den uparrede t-test, se afsnit 4.2, og vender tilbage til de leverlse hunde i afsnit 4.3.

4.2

t-test, uparret

Uparret t-test benyttes til test for ens middelvrdier fra to grupper. Om udfrelse af testen: (1) Normalfordelings-antagelse undersges. (2) Test for ens varianser. (3) Test for ens middelvrdier. (4) Konklusion (fra p-vrdi med valgt signikans-niveau). Ovenst aende punkter udfres i Eksempel 4.3. 18

4.3

Leverlse hunde, forsat

Det er en forudstning for t-test, at variablene for hver gruppe er normalfordelte. Forudstning om normalfordeling: Dette undersges ved om observationerne tilnrmelsesvist ligger p en ret linje i et probit-plot (se eksema pelvis [8] eller [2]). Figur 11 angiver et probit plot af glukoseforbrndingen for de normale hunde, mens gur 12 er det tilsvarende plot for de leverlse hunde. P baggrund af disse plots antages fordelingen af glukoseforbrnding a at vre normal i hver gruppe.
1.00 0.00 0.00 Normal F[(gnormalem)/s] 0.25 0.50 0.75

0.25

0.50 Empirical P[i] = i/(N+1)

0.75

1.00

Figur 11: Probit plot for de normale hunde.

Test for ens varianser: Hypotesen er, at varianserne i de to grupper er s2 ens. Test af denne hypotese i korte trk: Betragt varians-ratioen, Fobs = s2 . 2 1 Sandsynligheden for at observere Fobs , eller endnu mere kritiske vrdier, F , for hypotesen, f af F -fordelingen med (N1 1, N2 1) frihedsgrader. as s2 0.012375 2 = 2.05 = 0.006027 s2 1 p-vrdi = 0.31

Med denne p-vrdi kan hypotesen ikke forkastes, s vi antager ens varianser. a Test for ens middelvrdier: Hypotesen er, at middelvrdierne i de to grupper er ens. Test af hypotesen i korte trk: Betragt tobs = Sp 19 x1 x 2
1 N1

1 N2

0.00 0.00

Normal F[(gUdenLeverm)/s] 0.25 0.50 0.75

1.00

0.25

0.50 Empirical P[i] = i/(N+1)

0.75

1.00

Figur 12: Probit plot for de leverlse hunde. hvor


2 Sp =

Vrdier af t for hvilket |t| er strre end eller lig |tobs |, er kritiske for hypotesen. Sandsynligheden for at observere disse vrdier f af t-fordelingen med as N1 + N2 2 frihedsgrader. Se gur 13. Dette er analogt til normalfordelingstesten i afsnit 3. For de to grupper af hunde f as: t = 4.56 p-vrdi = 0.0003

(N1 1)s2 + (N2 1)s2 2 1 . (N1 1) + (N2 1)

Konklusion: Hypotesen kan ikke accepteres p signikans-niveau 5%. De a normale hunde har signikant hjere forbrnding af glucose GI. Bemrkninger: I eksemplet ovenfor har vi udfrt en to-sidet t-test. Hvis vi p forh a and var sikre p at normale hunde har en forbrnding, der er lige s stor a, a eller hjere, end de leverlse hunde, s ville vi have udfrt en `n-sidet a e t-test, hvilket blot ville halvere p-vrdien i forhold til den to-sidige test. Hvis hypotesen om ens varianser m forkastes, s kan test for ens a a middelvrdier udfres med en anden, men svagere, test. Hvis variablerne ikke kan antages normalfordelte, s kan de ofte transa formeres til at have normalfordeling. Alternativt kan Wilcoxon tests benyttes (se [5] side 65).

20

Fordeling af t med 10+92 frihedsgrader t=4.58 giver pvrdi=0.0003

0 5

.1

y .2

.3

.4

0 t

Figur 13: Frekvensfunktionen for t-fordelingen med 17 frihedsgrader.

4.4

t-test, parret

Parret t-test kommer i spil ved flgende situation: To m alinger udfres p a hvert individ - eksempelvis fr og efter en behandling. Sprgsm er nu, alet om der er forskel? Udfrelse af den parrede t-test: (1) Normalfordelings-antagelse undersges. (2) Test af hypotese om ingen forskel. (3) Konklusion (fra p-vrdi med valgt signikans-niveau).

4.5

Anorexi behandling

M alinger af vgt (i pund) fr og efter behandling af anorexi patienter:


Person 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. vgt(fr) vgt(efter) difference 83.8 95.2 11.4 83.3 94.3 11 86.0 91.5 5.5 82.5 91.9 9.4 86.7 100.3 13.6 79.6 76.7 -2.9 76.9 76.8 -.1 94.2 101.6 7.4 73.4 94.9 21.5 80.5 75.2 -5.3

21

11. 12. 13. 14. 15. 16. 17.

81.6 82.1 77.6 83.5 89.9 86.0 87.3

77.8 95.5 90.7 92.5 93.8 91.7 98.0

-3.8 13.4 13.1 9 3.9 5.7 10.7

Deskription: Vi begynder med at beskrive de ovenfor givne data. I Tabel 7 angives stikprvens strrelse, gennemsnit og varians. Det ses, at forskellen deskriptorer N d se(d) vrdi 17 7.26 1.73593

Tabel 7: Forskellen i vgt, vgt(efter)-vgt(fr), betegnes d. i vgt fr og efter behandlingen i gennemsnit er 7.26. Ved hjlp af den parrede t-test vil vi undersge, om det kan skyldes en tilfldighed.

0.00

Normal F[(diffm)/s] 0.25 0.50 0.75

1.00

probitplot af vgtforskel

0.00

0.25

0.50 Empirical P[i] = i/(N+1)

0.75

1.00

Figur 14: Probit plot af vgtforskellen, d, for anorexi-patienterne. Forudstning om normalfordeling: Observationerne i Figur 14 ligger tilnrmelsesvis p linjen, og afviger ikke systematisk. Vi antager, at vgta forskellen er normalfordelt. Hypotese: Der er ingen forskel, d = 0. 22

Test af hypotesen i korte trk: Betragt strrelsen: tobs = d se(d)

Vrdier af t for hvilket |t| er strre end eller lig |tobs |, er kritiske for hypotesen. Sandsynligheden for at observere disse vrdier f af t-fordelingen med as N 1 frihedsgrader. For anorexi-patienterne haves, at t = 4.18 p-vrdi = 0.0007

Konklusion: Hypotesen kan ikke accepteres p signikans-niveau 5%. a Vgtforskellen er statistisk signikant strre end nul, s behandlingen har a en eekt.

Sammenligning af tre eller ere middelvrdier


Hvorn er tre (eller ere) grupper forskellige? ar Er fdselsvgten for spdbrn af pdagoger, af sygeplejere og af fabriksarbejdere forskellig?

Spdbrn af pdagoger udgr n gruppe, spdbrn af sygeplejere udgr e en anden gruppe, og spdbrn af fabriksarbejdere udgr en tredie gruppe. Vores nulhypotese er, at middelvrdierne for fdselsvgten i de tre grupper er ens. Alternativt, hvis nulhypotesen er forkert, s er der mindst to grupper, a hvor de tilhrende middelvrdier er forskellige, og en nrmere analyse er p akrvet. Vi introducerer varians-analyse, som er en metode til at undersge hypotesen om, at alle grupper har samme middelvrdi. Metoden udmnter sig i F -testen, og er en generalisation af den tidligere beskrevne t-test (se afsnit 4).

5.1

Fibrinogen

I en undersgelse af inammations-markrer er niveauet af brinogen blevet m hos 568 individer. Hos de samme individer er genotypen bestemt med alt hensyn til et bestemt gen, som mistnkes for at vre associeret til brinogen. Vi vil i dette eksempel ikke forsge at af- eller bekrfte denne mistanke, men blot undersge, om niveauet af brinogen er ens for individer med forskellig genotype. Der ndes tre mulige genotyper, som vi betegner 1, 2 og 3. Genotyperne kunne liges vel betegnes aa, aA og AA. Nedenfor flger et lille udsnit a af observationerne: 23

Deskription: Vi begynder med at beskrive de ovenfor givne data. I Tabel 8 angives stikprvens strrelse, gennemsnit og standard afvigelse for hver genotype. Genotype: Gennemsnit Standard afvigelse Antal 1 0.02 0.24 361 2 0.04 0.23 189 3 0.02 0.25 18 Total 568

Tabel 8: Deskriptorer for stikprve af brinogen mht. associeret gen. Det ses af Tabel 8, at gennemsnittet af brinogen niveauet er forskellig for hver genotype. Vi nsker at afklare, om vi med rimelighed kan sige, at middelvrdierne er ens. Dertil benyttes variansanalyse. Vi betragter i korte trk variansanalyse i afsnit 5.2, og vender tilbage til brinogen eksemplet i afsnit 5.3.

5.2

F -testen

Antag, at der er givet k grupper med nj , j = 1, . . . , k observationer. Ialt haves n = k nj observationer. Man kan vise, at variablen F , givet ved j=1 varians mellem grupperne = F = varians indenfor grupperne
n n k 1 y 2 j=1 (j y ) k1 , nj k 1 2 j=1 i=1 (yij yj ) nk

j j 1 hvor yj = nj i=1 yij og y = n k 1 j=1 i=1 yij , har en F -fordeling med (k 1, nk) frihedsgrader, n variablerne {yij } er uafhngige og normalfordelte ar med samme varians. Yderligere, hvis middelvrdien er den samme i hver gruppe, s er F = 1. Store vrdier af F er kritiske for hypotesen om ens a middelvrdi for grupperne. Vi skal ikke g dybere ind i dette, og henviser den interesserede til [8]. a Vi lader naturligvis en computer forest udregningen af F og den tilhrende a p-vrdi. Det er vrd at bemrke, at for at vurdere hypotesen om ens middelvrdi for grupperne, betragtes variationen mellem grupperne i forhold til variationen indenfor grupperne, som angivet i udtrykket for F ovenfor. Vi udfrer variansanalysen p flgende vis: a

(1) Normalfordelings-antagelse undersges. (2) Test for ens varianser i grupperne (Bartletts test). (3) Test for ens middelvrdier i grupperne (F -testen). (4) Konklusion (fra p-vrdi med valgt signikans-niveau).

24

5.3

Fibrinogen, forsat

Vi udfrer nu ovenfor nvnte variansanalyse for vores brinogen observationer fra Eksempel 5.1. Vi nsker at teste flgende Hypotese: Middelvrdien af brinogen niveauet er den samme for hver genotype. Af probitplottene angivet i Figur 15 flger, at brinogen variablen kan antages normalfordelt for hver genotype. Ligeledes ses af Figur 15, at spredningen af brinogen niveauet er omtrent ens for de tre grupper.
Normal F[(lnfbgm)/s] 1.00 Empirical P[i] = i/(N+1) 1.00 Normal F[(lnfbgm)/s] Empirical P[i] = i/(N+1)

0.75 Normal F[(lnfbgm)/s] Normal F[(lnfbgm)/s]

0.75

0.50

0.50

0.25

0.25

0.00 0.00 0.25 0.50 Empirical P[i] = i/(N+1) 0.75 1.00

0.00 0.00 0.25 0.50 Empirical P[i] = i/(N+1) 0.75 1.00

Normal F[(lnfbgm)/s] 1.00

Empirical P[i] = i/(N+1) .718854

0.75 Normal F[(lnfbgm)/s]

0.50

0.25

0.00 0.00 0.25 0.50 Empirical P[i] = i/(N+1) 0.75 1.00

lnfbg .648572 1 fibg_hae 3

Figur 15: Probitplots af brinogen variablen mht. genotyperne 1, 2 og 3 (1 i verste venstre hjrne, og 3 i nederste venstre hjrne). I nederste hjre hjrne er angivet et plot af brinogen-vrdier som funktion af genotypen. Det ses, at spredningen, dvs. standard afvigelsen, er omtrent ens for de tre grupper. For at kunne teste ovenfor nvnte hypotese, krves ens varianser for grupperne: Hypotese: Variansen af brinogen-variablen er ens for de tre genotyper. Test: Bartletts test for ens varianser giver: p-vrdi = 0.91. Konklusion: Vi accepterer hypotesen om ens varianser for grupperne, og kan forstte med analysen. Vi kan nu udfre F -testen for hypotesen om ens middelvrdi for grupperne.

25

Test: F -testen giver at F = varians mellem grupperne = 4.08 varians indenfor grupperne

hvilket med (2, 565) frihedsgrader svarer til en p-vrdi p 0.0174. a Konklusion: Vi kan ikke acceptere hypotesen om ens middelvrdi for hver genotype.

5.4

Aids

Det flgende eksempel stammer fra [2]. Gennemtrngeligheden af tarmslimhinden med hensyn til stoet mannitol er blevet m for re grupper alt best aende af uafhngige individer mere eller mindre relateret til aids sygdommen. Disse grupper er: AIDS, ARC, HIV+ og HIV-. ARC st for ar aids related complex. Deskription: Variablen der angiver mannitolvrdier er kontinuert, og i Tabel 9 angives stikprvens strrelse, gennemsnit og standard afvigelse for hver genotype. Grupper Gennemsnit Standard afvigelse Antal AIDS 11.33 5.18 26 ARC 8.84 6.88 7 HIV+ 9.71 6.19 7 HIV11.40 4.26 19

Tabel 9: Deskriptorer for stikprve af mannitol mht. re aids relaterede grupper. Hypotese: Middelvrdien af mannitol gennemtrngeligheden er den samme for hver gruppe. Af probitplottene angivet i Figur 16 flger, at mannitol variablen kan antages normalfordelt for hver gruppe. Ligeledes ses af Figur 17, at spredningen af mannitol gennemtrngningen er omtrent ens for de re grupper. For at kunne teste ovenfor nvnte hypotese, krves ens varianser for grupperne: Hypotese: Variansen af mannitol variablen er ens for de tre genotyper. Test: Bartletts test for ens varianser giver: p-vrdi = 0.44. Konklusion: Vi accepterer hypotesen om ens varianser for grupperne, og kan forstte med analysen. Vi kan nu udfre F -testen for hypotesen om ens middelvrdi for grupperne. Test: F -testen giver at F = varians mellem grupperne = 0.6 varians indenfor grupperne 26

Normal F[(mannm)/s] 1.00

Empirical P[i] = i/(N+1) 1.00

Normal F[(mannm)/s]

Empirical P[i] = i/(N+1)

0.75 Normal F[(mannm)/s] Normal F[(mannm)/s]

0.75

0.50

0.50

0.25

0.25

0.00 0.00 0.25 0.50 Empirical P[i] = i/(N+1) 0.75 1.00

0.00 0.00 0.25 0.50 Empirical P[i] = i/(N+1) 0.75 1.00

Normal F[(mannm)/s] 1.00

Empirical P[i] = i/(N+1) 1.00

Normal F[(mannm)/s]

Empirical P[i] = i/(N+1)

0.75 Normal F[(mannm)/s] Normal F[(mannm)/s]

0.75

0.50

0.50

0.25

0.25

0.00 0.00 0.25 0.50 Empirical P[i] = i/(N+1) 0.75 1.00

0.00 0.00 0.25 0.50 Empirical P[i] = i/(N+1) 0.75 1.00

Figur 16: Probitplots af mannitol variablen mht. de re grupper.

22.03

Mannitol gut permeability

0.81 1 Diagnosis, 1=AIDS, 2=ARC, 3=HIV+ 4

Figur 17: Mannitol gennemtrngelighed mht. de re grupper.

27

hvilket med (3, 55) frihedsgrader svarer til en p-vrdi p 0.62. a Konklusion: Vi accepterer hypotesen om ens middelvrdi for hver gruppe. De observerede forskelle mellem gennemsnittene i Tabel 9 skyldes tilfldigheder, og giver ikke anledning til signikante forskelle i middelvrdierne for mannitol gennemtrngelighed i tarmslimhinden for de re aidsrelaterede grupper, hvoraf `n gruppe best af hiv negative individer. e ar

5.5

Opgaver

Opgave 5.1. De flgende data i Tabel 10 er opdigtede, og kan benyttes til udfrelse af variansanalyse. Gruppe 1 6 7 8 8 9 11 8.167 2 3 5 6 6 6 8 5.667 3 7 9 10 11 11 13 10.167 4 3 5 6 6 6 8 5.667

Gennemsnit

Tabel 10: Er middelvrdien ens for de re grupper?

Regression og korrelation
Kan vi beskrive sammenhngen mellem variable?

Regression g ud p at beskrive en variabels vkst eller formindskelse i ar a forhold til en anden. Eksempelvis kan vi beskrive forgelsen af det systoliske blodtryk, n vgten forges. Faktisk kan vi, og her er regression til ar stor nytte, undersge eekten af ere faktorer; Eksempelvis kan vi beskrive forgelsen af det systoliske blodtryk, n vgten forges og alderen ndres. ar Mens regressionsanalyse g ud p at give et udtryk for sammenhngen ar a mellem variable, vil vi med korelationsanalyse give et m for sammenhnal gens strrelse. Korrelationen mellem variable er et associationsm og har al, den vigtige egenskab, at hvis to variable er uafhngige, s er korrelationen a mellem dem nul (NB: Det modsatte, dvs. hvis korrelationen er nul, s er de a to variable uafhngige, glder ikke altid).

6.1

Forceret expiratorisk volumen

De flgende data for hjde og FEV1 (Forceret expiratorisk volumen p 1 a sekund) af 20 mandlige medicinstuderende stammer fra [2]; 28

I Figur 18 er FEV1 observationerne afbildet udfra den respektive hjde for hvert individ.

Forceret expiratorisk volumen


6 2 160 3 FEV1 4 5

170 Hjde (cm)

180

190

Figur 18: FEV1 m alinger af 20 mandlige medicinstuderende afbildet med hensyn til deres hjde. Vi tnker os, at fra et vist begyndelsesniveau vil vrdien af FEV1 vre proportional med hjden. Vi vil undersge om denne sammenhng med rimelighed glder, og formulerer den ved FEV1 = a hjde + b hvor a (som er hldningskoecienten) og b (som er skringspunktet med FEV1-aksen) er konstanter. Vi kender ikke a og b p forh a and, men vil udfra observationerne estimere disse. Dette gres ved mindste kvadraters metode, som er beskrevet i [5] og [8]. Ideen er at bestemme a og b s aledes, at den lodrette afstand fra hvert punkt i Figur 18 til den rette linje med forskriften FEV1 = a hjde + b er mindst mulig for samtlige punkter. For ovenst aende data estimeres a og b ved a= (xi x)(yi y ) = 0.074, 2 (xi x) = y ax = 9.19 b

Sammenhngen mellem FEV1 og hjde beskrives s aledes ved FEV1 = 0.074 hjde 9.19 29

Forceret expiratorisk volumen


6 2 160 3 FEV1 4 5

170 Hjde (cm) FEV1 (litres)

180 Fitted values

190

Figur 19: FEV1 m alinger af 20 mandlige medicinstuderende afbildet med hensyn til deres hjde. Den rette linje fremkommer ved mindste kvadraters metode (se teksten). Et 95% kondensinterval for hldningen estimeres til (0.023, 0.126) og tilsvarende interval for skringen med FEV1-aksen udgres af (18.2, 0.143). Vi kan antage, at hldningen er signikant forskellig fra nul p niveau 5%, a og s aledes er regressionslinjen ikke vandret. I nedenst aende eksempler ses anvendelser af regressionsligningen. Eksempel 1: En mand er 178 cm hj, s hans forventede FEV1 er 4, 13 a Liter. Eksempel 2: Bemrk at de tre personer A, B og C i nedenst aende tabel bedre kan sammenlignes med hensyn til FEV1 ved at betragte residualerne yderst til hjre. mnd Person A Person B Person C Hjde 171 181 191 M FEV1 alt 4.2 4.4 4.1 Forventet FEV1 3.5 4.3 5.0 Residual 0.7 0.1 0.9

30

6.2

Diagnostiske plots

I Figur 20 angives diagnostiske plots for regressionen af FEV1 mod hjden. Residualet af FEV1 for hvert individ er netop den observerede FEV1 fratrukket den forventede FEV1 vrdi.
Normal F[(resm)/s] 2 1.00 Empirical P[i] = i/(N+1)

1 Normal F[(resm)/s]

0.75

Residuals

0.50

0.25

2 160 170 Height (cm) 2 180 190

0.00 0.00 0.25 FEV1 (litres) hi 6 0.50 Empirical P[i] = i/(N+1) 0.75 1.00

Fitted values lo

1 Residuals FEV1 (litres)

1 3 3.5 Fitted values 4 4.5

2 160 170 Height (cm) 180 190

Figur 20: Diagnostiske plots for regressionen af FEV1 mod hjden. Se teksten for forklaring. Plottene i gur 20 kan beskrives s aledes: verst tv. Residualerne af FEV1 mod hjden. Ingen systematisk struktur antyder anden sammenhng end linearitet. verst th. Probitplot for residualerne af FEV1. Smukt! nederst tv. Residualerne af FEV1 mod forventet FEV1. Ingen forgelse af variationen mellem residualerne med voksende forventet FEV1. Ellers kan data transformeres. nederst th. Kondensb p 2 gange standardfejlen i plottet af FEV1 mod and a hjden Simulerede data. Punkterne afsat i gur 21 stammer fra simulerede data. Vi begrnser os til blot at betragte diagnostiske plots for disse data. Residualplottet (se foreg aende eksempel) for den linere regression af de simulerede data er angivet verst til hjre i gur 21 og afslrer (hjere ordens) sammenhng mellem de indg aende variable. Nederst i gur 21 er 31

angivet en kvadratisk regression af samme data, dvs. et 2. ordens polynomium i x-variablen er tilpasset data. De tilhrende residualer synes mere usystematisk placeret i det tilhrende residualplot.
yvalues 60 Fitted values 20

50

10

yvalues

40

Residuals 0 yvalues 2 4 xvalues 6 Fitted values 8

30

10

20 20 0 2 4 xvalues 6 8

10 60

50

yvalues

Residuals

40

30

20 0 2 4 xvalues 6 8

10 0 2 4 xvalues 6 8

Figur 21: verst: Liner regression af simulerede data og tilhrende plot af residualerne mod forklarende variabel. Nederst: Kvadratisk regression af samme data og tilhrende residualplot.

6.3

Korrelation

Vi vil gerne udtale os om strrelsen for sammenhngen mellem to variable. For kontinuerte variable X og Y er produkt-moment korrelationen et m al for sammenhngens strrelse, og givet ved r= Der glder at r har vrdier mellem 1 og 1. r er skalainvariant. Hvis variablerne er uafhngige, s er r = 0. Det omvendte glder ikke. a For FEV1 og hjde (se eksemplet i afsnit 6.1) estimeres korrelationen til r= (x x)(y y ) = 0.58 2 (x x) (y y )2 32 Kovarians(X,Y) . X Y

I gur 22 er angivet eksempler p korrelationer mellem variable. a


Korrelation = 0.58
6 Variabel Y 1 0 1 5 2

Korrelation = 0.9

FEV1 4

160

170 180 Hjde (cm)

190

2 2

0 1 Variabel X

Korrelation = 0
2 Variabel Z=(X1)*(X+1) 2 1 0 1 2 3 4 Variabel Y 1 0 1

Korrelation = 0

2 2

0 Variabel X

0 Variabel X

Figur 22: verst tv. ses observationer af FEV1 udfra hjde. verst th. plottes data med negativ korrelation. Nederst er angivet eksempler, hvor korrealtionen er nul. Plottet nederst tv. er fremkommet udfra uafhngige variable, mens plottet til hjre angiver en funktionel sammenhng mellem variablerne, der s aledes ikke er uafhngige.

Sammenligning af grupper
- spontan abort og alkohol indtag under graviditet?

Er der sammenhng mellem eksempelvis

For at tilnrme sig dette sprgsm kan man udfre en kohorte undersal, gelse. Lad os sige, at vi har indsamlet oplysninger hos et (tilfldigt) udsnit af de kvinder i befolkningen, som har vret gravide. Vi kan s inddele i to a grupper: Den ene gruppe best af dem, hvor moderen har haft alkoholindtag ar (af en given mngde) under graviditeten (alkohol gruppen), og den anden best af dem, hvor moderen ikke har haft alkohol indtag under graviditear ten (ikke-alkohol gruppen). Et helt centralt sprgsm er nu flgende: Er al andelen af spontane aborter indenfor alkohol gruppen den samme som andelen af spontane aborter indenfor ikke-alkohol gruppen? Vi betragter i dette kapitel en metode til afklaring af dette sprgsm Ideal. en er at antage, at de to andele er lige store - vi siger at de to grupper er homogene, for s at undersge rimeligheden af denne antagelse p baggrund a a af det observerede (data). Jo mere urimelig antagelsen er, des mere tiltro 33

har vi til, at alkohol under graviditet indvirker (positivt eller negativt) p a risikoen for spontan abort. Vi vil kvanticere denne sammenhng ved m alet relativ risiko. Det helt tilsvarende sprgsm om homogenitet opst ved case-control al ar studier; Er andelen af cases blandt eksponerede den samme som andelen af cases blandt ikke-eksponerede? Analogt med situationen ovenfor, opstilles hypotesen, at andelene er lige store for de to grupper, og dennes rimelighed undersges p tilsvarende vis. Vi vil kvanticere sammenhng ved m a alet odds-ratio. De indg aende observable strrelser, variablerne, vil i dette kapitel vre diskrete, oftest dichotome med vrdier som; ja, nej eller ryger, ikke-ryger osv.

7.1

Lunge-cancer og rygning

P baggrund af oplysningerne i Tabel 11 nsker vi at besvare sprgsm a alet: Er lunge-cancer p avirket af rygning? Kvinder Lunge-cancer patienter Andre patienter Ryger 41 28 Ikke-ryger 19 32

Tabel 11: Lunge-cancer og rygning (Doll & Hill, BMJ 1950). I Tabel 11 udgr andelen af lunge-cancer patienter i ryger gruppen 59% andelen af lunge-cancer patienter i ikke-ryger gruppen udgr

41 ( 41+28 ), mens 19 37% ( 19+32 ).

Hypotese: Andelen af lunge-cancer patienter er ens for rygere og ikkerygere. Test: Fishers eksakte test (se afsnit 7.5 eller [5] side 100) giver: p-vrdi = 0.026 (to-sidet). Konklusion: p-vrdien er mindre end 0.05, s der er signikant fora skel p observerede og forventede vrdier i tabellen. Hypotesen kan ikke a accepteres. Rygning p avirker risikoen for lunge-cancer.

7.2

Spontan abort og alkohol (kohorte studium)

P baggrund af oplysningerne i Tabel 12 kan vi stille sprgsm a alet: Er spontan abort risiko p avirket af moderens alkoholindtag? Hypotese: Andelen af spontane aborter er ens for de to grupper af alkoholindtag hos moderen. Test: Ved Fishers eksakte test f p-vrdi = 0.09 (to-sidet). as: Konklusion: Hypotesen accepteres. Vi kan ikke p avise en sammenhng (men heller ikke afvise en s adan). 34

spontan abort fdsel

>1 genstand/uge 46 8000

<1 genstand/uge 70 16768

Tabel 12: Spontan abort og alkohol. Tallene stammer fra ovenfor angivne artikel.

I undersgelsen tages der hjde for ryge-vaner, koein-indtagelse, alder, BMI (under graviditet), gteskabelig status, uddannelse, kn af barnet etc. Dette gres ved regressionsanalyse.

7.3

Hvor stor er sammenhngen?

Dette kan angives ved odds-ratio (benyttes ved case-control studier) og relativ risiko (benyttes ved kohorte studier). Odds-ratio = odds for eksponerede blandt cases odds for eksponerede blandt kontroller incidens for cases blandt eksponerede incidens for cases blandt ueksponerede Eksponeret a c Ueksponeret b d

Relativ risiko =

Cases Controls

Tabel 13: 2 2 tabel. Odds-ratio kan estimeres ved: Odds-ratio = b = ad , hvor a, b, c og d c bc d er angivet i Tabel 13. Et 95% kondensinterval for odds-ratio (= r) er givet ved: q q (e
ln r1.96
1 1 +1+1+d a b c a

,e

ln r+1.96

1 1 +1+1+d a b c

Odds-ratio er et m for sammenhngens strrelse. Variable er uafhnal gige hvis og kun hvis Odds-ratio = 1. 35

4132 I Eksempel 7.1 (lunge-cancer og rygning): Odds-ratio = 2819 = 2.5, dvs. odds for rygere for at have lunge-cancer vurderes til at vre 2.5 gange hjere end odds for ikke-rygere. Odds-ratio ligger i intervallet (1.1, 5.6) med 95% sandsynlighed. Bemrk, at vrdien 1 for odds-ratio ikke indg ar i ovenst aende 95% kondensinterval. Dette falder i tr med, at p-vrdien ad udregnet for Tabel 11 er mindre end 0.05. I Eksempel 7.2 (spontan abort og alkohol): Sammenhngens strrelse: Relativ risiko = 1.38 med 95% kondensinterval lig med (0.95, 2.0).

7.4

Medfdte misdannelser og rygning

lbe- og/eller ganespalte spdbarn uden ovenst.

ryger 88 175

ikke-ryger 115 356

Tabel 14: Medfdte misdannelser og rygning. Tallene stammer fra ovenfor angivne artikel. P baggrund af oplysningerne i Tabel 14 kan vi stille sprgsm a alet: Er lbe/gane spalte hos foster p avirket af moderens rygestatus? Hypotese: Andelen af spdbrn med medfdte misdannelser indenfor gruppen af rygende mdre, er den samme som andelen af spdbrn med medfdte misdannelser indenfor gruppen af ikke-rygende mdre. Test: Ved Fishers eksakte test f p-vrdi < 0.01 (to-sidet). as: Konklusion: Hypotesen kan ikke accepteres. Sammenhngens strrelse: Odds-ratio = 1.6 (1.1, 2.2) I undersgelsen justeres for alkohol, vitamin indtag, genotyper hos fosteret etc. Dette gres ved regressionsanalyse.

7.5

Fishers eksakte test

Det flgende omhandler Fishers eksakte test for uafhngighed i 22 tabeller (se evt.[5]). Testen er ogs gyldig i strre tabeller (betegnes r c tabeller), a 36

men vi njes med at omtale 2 2 tilfldet. Princippet generaliseres let til r c tabeller. Cases Controls sjlesum Eksponeret a c s1 Ueksponeret b d s2 rkkesum r1 r2 T

Tabel 15: Generel 2 2 tabel. Tabel 15 er en generel 2 2 tabel, hvor rkkesummer (r1 = a + b og r2 = c+d) og sljesummer (s1 = a+c og s2 = b+d) er angivet. Totalsummen T er ogs angivet. Vi vil beregne sandsynligheden for at observere Tabel 15 a under antagelse af uafhngighed mellem kategorierne i tabellen. N rkkear og sjlesummerne er fastlagte vil denne sandsynlighed netop vre lig sandsynligheden for at observere vrdien a i tabellens verste venstre hjrne. Denne sandsynlighed er givet ved (Antal m ader at udvlge a personer udaf r1 ) (-do- c personer udaf r2 ) (Antal m ader at udvlge s1 personer udaf T ) Med symboler2 kan dette skrives p(tabel) = p(verste venstre hjrne = a | r1 , r2 , s1 , s2 ) = =
r1 a T s1 r2 c

r1 !r2 !s1 !s2 ! T !a!b!c!d!

Sandsynligheden for at observere tabellen, eller en der er endnu mere kritisk for hypotesen, n hypotesen antages, dvs. p-vrdien, er da givet ved ar p(tabel) kritisk tabel P-vrdien udregnes alts ved at summere sandsynligheden for den obsera verede tabel og sandsynlighederne for alle de tabeller, som er endnu mere kritisk for hypotesen, end den observerede. Dette uddybes i det flgende eksempel. Eksempel: Tabel 16 stammer fra Politiken 14. november 1993, og angiver antal dde ud af samtlige levertransplantationer foretaget i Arhus og Kbenhavn. P astanden var, at Arhus var et d arligere operationssted end Kbenhavn. Vi analyserer dette sprgsm al.
Udr abstegnet ! kaldes fakultetsoperatoren og flgende eksempel viser brugen: 5! = 5 4 3 2 1 = 120.
2

37

Arhus Kbenhavn sjlesum

dde 7 5 12

overlevede 11 21 32

rkkesum 18 26 44

Tabel 16: Ddelighed ved levertransplantationer foretaget i Arhus og Kbenhavn. Hypotese: Arhus er ikke et d arligere operationssted end Kbenhavn. Dvs. andelen af dde blandt patienterne i Arhus er mindre end eller lig andelen af dde blandt patienterne i Kbenhavn. Denne hypotese, som er fremsat af journalister, er en-sidig. Muligheden for at Kbenhavn er d arligere end Arhus, betrages ikke. Sandsynligheden for at observere Tabel 16 under hypotesen er iflge ovenst aende givet ved 18!26!12!32! = 0.09925628100 44!7!11!5!21! I Tabel 17 angives de tabeller, der har samme rkke- og sjlesum som Tabel 16, og som er endmu mere kritiske for hypotesen om ingen sammenhng end Tabel 16. Arhus Kbenhavn sjlesum Arhus Kbenhavn sjlesum Arhus Kbenhavn sjlesum Arhus Kbenhavn sjlesum Arhus Kbenhavn sjlesum dde 8 4 12 9 3 12 10 2 12 11 1 12 12 0 12 overlevede 10 22 32 9 23 32 8 24 32 7 25 32 6 26 32 rkkesum 18 26 44 18 26 44 18 26 44 18 26 44 18 26 44

Tabel 17: Tabeller der er endnu mere ekstreme for hypotesen end Tabel 16, og som har samme rkke- og sjlesum.

Vi nsker, at bestemme sandsynligheden for at observere 2 2 tabellen 38

i Tabel 16 eller en der er endnu mere kritisk for hypotesen. Denne sandsynlighed, som kaldes den n-sidige p-vrdi, nder vi ved at summere sandsyne lighederne for at observere tabellerne i Tabel 16 og 17. Med sandsynligheder i samme rkkeflge, som i Tabel 16 og 17 f 0.09925628 + 0.03101759 + as 0.00599373 + 0.000674295 + 0.00003923 + 0.0000008801 = 0.136982. Fishers eksakte test giver alts at sandsynligheden for at observere 2 2 tabellen i a, Tabel 16 eller en der er endnu mere kritisk for hypotesen, er 0.13. Konklusion: Vi accepterer hypotesen. Arhus er ikke et d arligere operationssted for levertransplantationer end Kbenhavn. Fishers eksakte test og 2 testen. Fishers eksakte test er ekstremt beregningskrvende, og er frst i de senere med udviklingen af hurtige computere blevet praktisk anvenar delig. Tidligere benyttede man 2 testen med (r 1) (c 1) frihedsgrader, som er nem at anvende - se [5] side 86. 2 testen (med eller uden Yates korrektion) er dog underlagt antagelser, og for visse tabeller skal den anvendes varsomt. En tommelngerregel siger, at 2 testen kan benyttes hvis mindst 80% af cellerne i tabellen har forventet vrdi 5 og alle celler har forventet vrdi 1 (Cochran 1954). Benyt venligst Fishers eksakte test. Hvis det g for langsomt, benyttes ar 2 testen. En mulighed er at sl grupper sammen. da a I Tabel 18 gives et eksempel p en 2 2 tabel for sammenligning af a 2 testen. Fishers eksakte test og Cases Controls sjlesum Eksponeret 3 7 10 Ueksponeret 7 83 90 rkkesum 10 90 100

Tabel 18: Tabel hvor Fishers eksakte test og 2 testen giver forskellige konklusioner. Hypotese: Der er ikke ere cases blandt de eksponerede end blandt de ueksponerede i forhold til kontrolgruppen. Test: Fisher: p-vrdi= 0.06. 2 : p-vrdi= 0.0263. 39

Konklusion: Hypotesen m accepteres p signikansniveau 5%. Fishers a a eksakte test m tages for p a alydende.

Overlevelsesanalyse

Flgende situation optrder meget ofte i sundhedsvidenskab: En begivenhed er indtruet, og man vil gerne udtale sig om, hvorn en efterflgende ar begivenhed indtrder. Det kan eksempelvis vre ventetiden fra ophr af indtagelse af p-piller til graviditet, eller ventetiden fra udviklingen af visse cancertyper til dd. Er ventetiden kortere eller lngere end den forventede ventetid? Er ventetiden forskellig fra det forventede, s synes de to begivena heder at have noget med hinanden at gre. Dette konkretiseres i overlevelsesanalyse, som er et uhyre nyttigt, og ofte anvendt vrktj.

8.1

Overlevelseskurve

I gur 23 er angivet en generel overlevelseskurve. Kurven knytter sandsynligheder til overlevelsestider. Det primre m i dette kapitel vil vre at al konstruere en overlevelseskurve hrende til overlevelsesdata.
1

Survival

.5

0 0 10 20 analysis time 30 40

Overlevelseskurve

Figur 23: Overlevelseskurven knytter sandsynligheder til overlevelsestider.

8.2

Dukes C colorectal cancer

I [7] rapporteres om flgende ordnede overlevelsestider for 25 patienter med Dukes C colorectal cancer: 3+, 6, 6, 6, 6, 8, 8, 12, 12, 12+, 15+, 16+, 18+, 18+, 20, 22, 24, 28+, 28+, 28+, 30, 30+, 33+, 42, 42+ Overlevelsestiderne er i antal m aneder. 40

+ angiver censorering. Patienter med + overlever lngere end den angivne overlevelsestid, men flges ikke lngere i undersgelsen. Observationerne af overlevelsestid er oftest, som i dette tilflde, ikke komplette, dvs. de er censurerede. Dette indg i analysen. ar
Tid, dage 20 30Studium slut

Start

10

T > 28 o T > 15 o x T = 30 x

T > 42 o x I ovenst aende gur ses eksempler p censurering. Ddstidspunkt er mara keret med x, og (sidste) observationstidspunkt med o. Der er kun et individ, for hvilket de to tidspunkter er sammenfaldende (T=30). For de vrige individer vides blot, at ddstidspunktet er efter sidste observationstidspunkt. Fra colorectal cancer data til overlevelseskurve. Vi skal nu via KaplanMeier metoden konstruere en overlevelsekurve udfra overlevelsestiderne for de 25 patienter med Dukes C colorectal cancer, som er anfrt ovenfor. Denne metode anvendes ofte i lgevidenskab. I Tabel 19 er overlevelsestiderne organiseret i et skema. For hvert tidsinterval angives hvor mange patienter, som er under risiko ved intervallets start og ved intervallets slutning. Derudover kan ases hvor mange der blev censurerede i intervallet, og hvor mange der dde ved intervallets slutning. Udfra disse oplysninger beregnes den andel, som overlevede i intervallet, samt sandsynligheden for at overleve helt fra start (tidspunkt 0) indtil det tidspunkt, hvor intervallet slutter. Detaljerne i sidstnvnte udregninger er givet i Appendix 8.4. Udfra Tabel 19 kan vi nu tegne overlevelseskurven for Dukes C colorectal cancer (baseret p 25 patienters overlevelsestider). Den kumulerede overlea velse i tabellen afsttes udfra den forlbne tid. Dette er gjort i Figur 24, og det ses af kurven, at halvdelen overlever til 30. m aned (som er medianen). Vi kan antage, at overlevelseskurven for Dukes C colorectal cancer snarere har er eksponentielt aftagende forlb, dvs. at overlevelsesfunktionen er givet ved S(t) = exp(t),

41

Interval under risiko ved intervalstart censurerede i intervallet under risiko ved intervalslut dde ved intervalslut Andel der overlevede i intervallet Kumulativ overlevelse ved intervalslut

03 25 1 24 0
25 25

36 24 0 24 4
20 24

68 20 0 20 2 1
18 20 20 18 24 20

8 12 18 1 17 2
16 18

20 24

0.667

Tabel 19: Overlevelsestabel for colorectal cancer patienter.

KaplanMeier survival estimate 1.00

0.75

0.50

0.25

0.00 0 10 20 analysis time 30 40

25 patients with Dukes C colorectal cancer

Figur 24: Overlevelseskurve for Dukes C colorectal cancer bestemt ved Kaplan-Meier metoden.

42

hvor t er den forlbne tid under risiko, og hvor er en konstant ( kaldet hazard rate). For colorectal cancer overlevelsestiderne f ved bedste tilpasas ning, at = 0.02537. Det betyder, at det forventes, at til et givet tidspunkt vil 2.5% af colorectal cancer patienterne d indenfor den flgende m aned. 30% forventes at d indenfor det flgende (da 12 = 0.30). Den ekspoar nentielle overlevelseskurve er angivet i Figur 25. Vi vil her ikke beskftige os med, hvor godt denne kurve passer til det observerede.
1

.8

Survival

.6

.4

.2 0 10 20 analysis time 30 40

Eksponentiel overlevelseskurve tilpasset colorectal cancer data

Figur 25: Eksponentiel overlevelseskurve tilpasset Dukes C colorectal cancer data. Raten hvormed patienterne dr er konstant med hensyn til den forlbne risikotid - se teksten.

8.3

Sammenligning af to overlevelseskurver

I dette afsnit nsker vi at sammenligne to overlevelseskurver og betragter to behandlinger for cancer: Gruppe 1 har f behandling A. aet Gruppe 2 har f behandling B. aet Vi nsker at sammenligne de to behandlinger. Nedenfor flger et udsnit af observationerne:
1. 2. 3. 4. 5. 6. 7. 8. studytime 1 1 2 3 4 4 5 5 died 1 1 1 1 1 1 1 1 drug 1 1 1 1 1 1 1 1 age 61 65 59 52 56 67 63 58

43

9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. .

8 8 8 8 11 11 12 12 15 17 22 23 6 6 7 9 10 11 13 15 16 19 .

1 0 1 1 1 1 1 1 1 1 1 1 1 0 1 0 0 0 1 0 1 0 .

1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 .

56 58 52 49 50 55 49 62 51 49 57 52 67 65 58 56 49 61 62 50 67 50 .

I Figur 26 angives overlevelseskurver for de to grupper. Kurverne er fremkommet ved Kaplan-Meier metoden (se Appendix 8.4). Medianen for den frste gruppe er 11 (med 95% kondensinterval (6, 17)), dvs. halvdelen forventes af overleve til og med 11te m aned. Medianen for den anden gruppe er 25. Sprgsm Er de to kurver ens? al:
KaplanMeier survival estimates, by drug 1.00

0.75
drug 2

0.50

0.25

0.00 0 10 20 analysis time

drug 1

30

40

Figur 26: Overlevelseskurver for de to grupper af cancerpatienter. Vi kan formulere dette sprgsm ved flgende al Hypotese: S1 (t) = S2 (t) for alle t. Betegnelserne S1 og S2 henviser til de to kurver i Figur 26. Test for denne 44

hypotese udfres ved log rank testen, som er beskrevet i [3]. Log rank testen giver:
| Events Events drug | observed expected ------+------------------------1 | 23 15.21 2 | 8 15.79 ------+------------------------Total | 31 31.00 chi2(1) = Pr>chi2 = 8.13 0.0044

Log rank testen giver at p-vrdien er lig med 0.0044. De to kurver er signikant forskellige p niveau 5%. Hypotesen kan ikke accepteres. Der er a forskel p behandlingerne. a

8.4

Appendix: Kaplan-Meier metoden.


S(k) = sandsynligheden for at overleve til observationstidspunkt k.

Overlevelseskurven er grafen for funktionen

Lad nu p(k) angive sandsynligheden for at overleve observationstidspunkt k, n man allerede har overlevet til og med observationstidspunkt k 1 for ar k {2, 3 . . .}, og st p(1) = S(1) = 1. Da er S(k) = p(k)S(k 1) = p(k)p(k 1)S(k 2)

= p(k)p(k 1)p(k 2) p(k (k 2))S(1) = p(k)p(k 1)p(k 2) p(2)p(1)

Fra data kan vi estimere p(k) ved: p(k) = antal pat. fulgt til obstidspunkt k-1 og som overlever obstidspunkt k antal overlevende pat. fulgt til og med obstidspunkt k-1

p(k) udregnes og indsttes i ovenst aende udtryk for S(k) for hvert k, og vi kan tegne en overlevelseskurve.

Risikoberegning

Det flgende vil handle om beregning af risiko. Frst vil vi kort koncentrere os om risikobegrebet, for s at betragte en yderst anvendelig matematisk a stning fra betinget sandsynlighedsregning; Bayes Theorem. Kort beskrevet fortller denne stning, hvorledes vi beregner risikoen for, at en hndelse indtrer, givet at diverse betingelser forud for hndelsen er opfyldte. Vi vil derefter g til anvendelser, hovedsageligt indefor risikoberegning i genetik, a men ogs i forbindelse med prediktive test, som var emnet i afsnit 1.3. a 45

5 X-linked recessiv sygdom

Figur 27: En kvinde, mormoderen (2) i stamtret, er obligat brer af et X-linked recessivt sygdomsallel. Motivation: En kvinde, mormoderen (2) i stamtret i Figur 27, er obligat brer af et X-linked recessivt sygdomsallel. Hvad er datterens (3) risiko for at vre brer, n hendes sn (5) er rask? ar Vi har brug for en metode og vender tilbage til ovennvnte sprgsm i al Eksempel 9.2.

9.1

Risiko

Risiko er et sandsynlighedsbegreb; risiko = sandsynlighed for en hndelse. Risikoen for at en hndelse indtrer, er et tal mellem 0 og 1. Eksempel: Hndelser kan vre A: F inuenza? a B: Samlever har inuenza? Notation: Risikoen for at f inuenza skrives P (f inuenza), eller blot a a P (A). Risikoen for at f inuenza givet at samlever har inuenza skrives a P (inuenza | samlever har inuenza). Generelt: P (A givet at B er indtruet) skrives P (A | B) og deneres ved P (A | B) = P (A og B indtrer) , P (B) P (B) = 0

P (A | B) kaldes betinget risiko. 46

Bayes Theorem: glder:

Hvis A og B er hndelser s aledes at P (B) = 0, da

Theorem 1 (Bayes). P (A | B) = P (B | A)P (A) P (B)

Vi vil blot tage Bayes Theorem for p alydende og henvise interesserede til, at enhver bog om sandsynlighedsregning vil (br) indeholde et bevis for Bayes Theorem. Hndelser A og B siges at vre uafhngige, hvis P (A og B indtrer) = P (A)P (B). Hvis A og B er uafhngige, s flger det af Bayes Theorem, at a P (A | B) = P (A) Flgende omskrivning af Bayes Theorem er meget praktisk: Korollar 2 (Bayes). P (A | B) = P (B | A)P (A) P (B | D1 )P (D1 ) + P (B | D2 )P (D2 )

hvor D1 og D2 er hndelser, som udelukker hinanden og som opfylder, at hvis en hndelse er indtruet, s er D1 eller D2 ogs indtruet. a a Ofte er D1 = A og D2 = ikke A, og s kan Bayes Theorem formuleres a som: Korollar 3 (Bayes). P (A | B) = P (B | A)P (A) P (B | A)P (A) + P (B | ikke A)P (ikke A)

Ovenfor angivne version af Bayes Theorem, Korollar 3, vil blive benyttet i de flgende eksempler.

9.2

X-linked recessiv sygdom

Vi vender nu tilbage til eksemplet fra indledningen: En kvinde, mormoderen (2) i stamtret i gur 27, er obligat brer af et X-linked recessivt sygdomsallel. Hvad er datterens (3) risiko for at vre brer, n hendes sn (5) ar er rask? Apriori risici: 1 2 1 P (sn er rask | mor er brer) = 2 P (sn er rask | mor er ikke brer) = 1 P (mor er brer af d) = Ovenst aende risici er givet p forh udfra regler for arvegange. Vi er udfra a and disse oplysninger interesserede i at kende risikoen for at moderen er brer af sygdomsallelet d, n hendes sn vides at vre rask; ar 47

Aposteriori risiko: P (moderen er brer | sn er rask)? Af Bayes Theorem: = P (rask | brer)P (brer) P (rask | brer)P (brer) + P (rask | ikke brer)P (ikke brer)
1 4 1 4

Ved indsttelse af vrdier af apriori risici f as: P (moderen er brer | sn er ikke aceret) = = 1 3

1 2

NB! Tilstedevrelsen af en rask sn reducerer moderens risiko for at vre brer.

9.3

Huntingtons sygdom

3 Autosomal dominans (Huntington)

Figur 28: Faderen (1) i ovenst aende stamtr har Huntingtons sygdom, og dermed det tilhrende dominante sygdomsallel, D. Moderen (2) er rask. Datteren (3) er 70 og har ikke symptomer p Huntingtons sygdom. ar a Huntingtons sygdom f hvis og kun hvis det (tilhrende) dominante as sygdomsallel D er tilstede. Faderen (1) i stamtret i gur 28 har Huntingtons sygdom, og dermed det tilhrende dominante sygdomsallel, D. Moderen (2) er rask. Datteren (3) er 70 og har ikke symptomer p Huntingtons sygdom. ar a

48

Apriori risiko: P (datter har D) = P (70 uden symptomer | har D) = ar Aposteriori risiko: P (datter har D | 70 uden symptomer)? ar Af Bayes Theorem: = P (70 rask | har D)P (har D) ar P (70 rask | har D)P (har D) + P (70 rask | ikke D)P (ikke D) ar ar 1 21 1 2 1 20

Ved indsttelse af vrdier af apriori risici f as: P (datter har D | 70 uden symptomer) = ar

Hensyntagen til datterens alder uden symptomer reducerer risikoen for Huntington betydeligt.

9.4

Test for diagnose II

Vi har i ovenst aende eksempler set, hvorledes Bayes Theorem anvendes til at udregne den aposteriori risiko udfra p forh givne oplysninger, alts a and a Apriori risiko Aposteriori risiko

via Bayes Theorem. Kan vi vurdere den apriori risiko(?) Heri ligger kunsten - resten er h andvrk. Vi vil nu anvende ovenst aende lst p eksemplet a med test for HIV infektion fra afsnit 1.4. Lad os antage, at vi bruger en test til diagnosticering. Vi g udfra flgende: ar Apriori risiko: P (sygdom) = 0.001 P (test er positiv | sygdom) = 0.98 P (test er positiv | rask) = 0.03 (prvalens) (sensitivitet) (1-specicitet)

49

Aposteriori risiko: P (sygdom | test er positiv)? Af Bayes Theorem: = P (+ | sygdom)P (sygdom) P (+ | sygdom)P (sygdom) + P (+ | rask)P (rask) 0.98 0.001 = 0.98 0.001 + 0.03 0.999 = 3.2% (positiv prdiktiv vrdi)

Givet at testen er positiv, vil risikoen for sygdom alts vre 3.2%. Denne a lave vrdi, som gr testen ubrugelig p denne population, skyldes den lave a apriori risiko, P (sygdom), som er lig med prvalensen for sygdommen i populationen. Jo strre P (sygdom), des strre P (sygdom | test er positiv), som vist i gur 1, hvor ovenst aende udtryk for den positive prdiktive vrdi er plottet som funktion af prvalens.

9.5

Monty Hall Quiz Show

Det flgende handler om Monty Hall problemet, som udspiller sig i et quiz show. Du f som deltager mulighed for at vinde en ged eller en bil, men ar undervejs m du tre et betydningsfuldt valg. a Du bliver prsenteret for tre dre, som angivet nedenfor, og bag een af drene gemmer sig en (dyr) bil. Bag hver af de to andre er der en ged (lavet af plastik). Du vinder det som gemmer sig bag den dr, som endeligt vlges. Quiz-mester ved hvor gevinsten er, og beder dig vlge en af drene. Denne dr bliver ikke abnet i frste omgang, for nu abner quiz-mester en af de to vrige dre, og viser dig en ged. Du f nu valget, om du vil vlge den sidste dr, eller st fast p dit ar a a oprindelige valg. Hvilket valg trer du?

50

Lsning Det flgende lsningsforslag er ganske kortfattet, og uden uddybning af notation. Lad os kalde den dr, som du vlger, for den frste dr og betegne den D1 . De to resterende dre betegnes D2 og D3 . Lad Bi betegne hndelsen, at bilen gemmer sig bag ved dr Di for i = 1, 2, 3, og lad os antage, at der er lige stor sandsynlighed for, hvor bilen kan vre. Lad G betegne hndelsen, at quiz-mester viser dig en ged bag ved den tredje dr. I s afald vil vi gerne kende sandsynligheden for hndelsen B2 , alts en bil bag dr to, givet at a der er en ged bag ved dr tre: P (B2 | G) = = = = = = P (B2 G) P (G) P (G | B2 )P (B2 ) P (G) P (G | B2 )P (B2 ) C C P (G | B2 )P (B2 ) + P (G | B2 )P (B2 ) P (G | B2 )P (B2 ) P (G | B2 )P (B2 ) + P (G | B1 )P (B1 ) P (G | B2 ) P (G | B2 ) + P (G | B1 ) 1 2 1 = 3 1+ 2

P (G | B2 ) = 1, da quiz-mester skal vise geden bag ved den tredje dr. P (G | B1 ) = 1 , da quiz-mester skal vise dig en ged blandt een af de to 2 dre med en ged bag hver, og antages at vlge tilfldigt blandt disse3 .
3 Hvis quiz-mester derimod har en prference for en bestemt dr, n han eller hun ar 1 har valget mellem to, s er P (G | B1 ) ikke lngere 2 , men en given sandsynlighed, quiza mesters prference. Men ligegyldigt hvilken prference quiz-mester har, vil chancen for a gevinst efter skift af valg af dr vre strre end eller lig 1 . Det er alts under ingen 2 omstndigheder en ulempe at vlge den tilbudte nye dr

51

Det samme svar f p samme m as a ade, hvis quiz-mester istedet havde prsenteret en ged bag den anden dr.

Litteratur
[1] A.S. Akanmu, I. Akinsete, E.F. Adesemoye, and C.C. Okany, Evaluation of saliva-based diagnostic test kit for routine detection of antibodies to HIV., Afr J Med Med Sci. 30 (2001), no. 4, 3058. [2] M. Bland, An introduction to medical statistics, third edition ed., Oxford University Press, 2000. [3] D. Collett, Modelling survival data in medical research, Chapman and Hall, 1994. [4] P.C. Gtzsche, Screening for krft, www.cochrane.dk/screening, 2003. [5] N. Hammar and G. Persson, A short course in biostatistics, Studentlitteratur, Lund, 2001. [6] MRC, Streptomycin treatment of pulmonary tuberculosis, British Medical Journal (1948), no. 2, 76982. [7] M. Parmar and D. Machin, Survival analysis - A practical approach, Wiley, 1995. [8] Michael Srensen, Basal Statistik, Dept. of theoretical statistics, University of Aarhus, 1998, Forelsningsnoter. [9] E. Wooltorton, Failure of rapid hiv tests, CMAJ 167 (2002), no. 2, 170.

52

Indeks
2 testen, 39 aids, 5, 26 alkohol, 16 anorexi, 21 aposteriori risiko, 48, 49 apriori risiko, 47, 49 Bayes Theorem, 47 case-control studium, 34, 36 deskriptorer, 10 diagnosetest, 4, 49 diskret variabel, 8 eksakt test i r c tabel, 36 en-sidet test, 16 F-testen, 24 fdselsvgt, 10 falsk positiv, 4 FEV, 28 brinogen, 23 Fishers eksakte test, 36 fortolkning, 3 genetik, 8 risiko, 46 gennemsnit, 10 gold standard, 5 hj-risiko gruppe, 6 hazard rate, 43 histogram, 10 HIV test, 5, 49 homogenitet, 33 Huntingtons sygdom, 48 IQ-test, 3 kohorte studium, 34 kondens interval, 11 kontinuert variabel, 8 korrelation, 32 krydstabeller, 3436 Lunge-cancer og rygning, 34 Medfdte misdannelser og rygning, 36 middelvrdi, 10 Monty Hall Quiz Show, 50 normalfordeling, 13, 16 odds-ratio, 34, 35 overlevelse censurering, 41 exponentiel, 43 hazard rate, 43 Kaplan-Meier metoden, 45 kurve, 40 log rank testen, 43 sammenligning af kurver, 43 tabel, 41 overlevelseskurve, 40 p-vrdi, 13, 15 plot diagnostiske, 31 residual, 32 populationsrisiko, 4, 6 positive prdiktive vrdi, 4, 6 prvalens, 4 rct, 2 relativ risiko, 34, 35 residualplot, 32 risiko, 4, 46 aposteriori, 48 apriori, 47 sammenligning af grupper, 33 screening, 4 sensitivitet, 4, 49 specicitet, 4, 49 spredning, 10 53

stamtr, 46 standard fejl, 10 standard-afvigelsen, 10 stikprve, 10 t-test parret, 21 uparret, 18 test eksakt, 36 en-sidet, 16 uafhngighed, 36 test for homogenitet, 33 tuberkulose, 2 tvillinger, 8 tvillingeplots, 8 tvillingeregister, 8 variabeltyper, 8 varians, 10 variansanalyse, 24 X-linked recessiv sygdom, 47 Yates korrektion, 39

54

55

You might also like