Professional Documents
Culture Documents
SPSS-guide (Danish)
SPSS-guide (Danish)
God fornøjelse!
Instruktorerne i Statistik 1
1
SPSS Introduktionsguide
Indholdsfortegnelse
Introduktion ..............................................................................................................................................1
1. SPSS-interface og nyttige funktioner .....................................................................................................4
1.1 Data view vs. variable view ..................................................................................................................... 4
1.1.1 Data View ......................................................................................................................................... 4
1.1.2 Variable View.................................................................................................................................... 5
1.2 Indtastning og egenskaber ved variable .................................................................................................. 6
1.2.1 Name ................................................................................................................................................ 6
1.2.2 Label ................................................................................................................................................. 7
1.2.3 Measure (skalatype) ......................................................................................................................... 7
1.2.4 Type .................................................................................................................................................. 7
1.2.5 Width ................................................................................................................................................ 9
1.3 Indtastning af data .................................................................................................................................. 9
1.4 Udregning af ny variabel (Compute Variable) ......................................................................................... 9
1.5 Udvælgelse af datasæt (Select Cases) ................................................................................................... 11
1.6 Vægtning af data (Weight Cases) .......................................................................................................... 14
2. Deskriptiv statistik i SPSS ..................................................................................................................... 17
2.1 Deskriptiv statistik for den samlede data .............................................................................................. 18
2.2 Deskriptiv statistik for to grupper ......................................................................................................... 21
2.3 Mean plot i SPSS .................................................................................................................................... 24
2.4 Box plot i SPSS ....................................................................................................................................... 26
3. Tests i SPSS .......................................................................................................................................... 29
3.1 One sample t-test .................................................................................................................................. 30
3.1.1 Generel One Sample t-test APA-konklusion .................................................................................... 32
3.2 Paired samples t-test ............................................................................................................................. 32
3.2.1 Generel Paired Sample t-test APA-konklusion ................................................................................ 34
3.3 independent samples t-test .................................................................................................................. 34
3.3.1 Generel Independent samples t-test APA-konklusion ..................................................................... 35
3.4 Single case t-test.................................................................................................................................... 35
3.4.1 Generel single case t-test APA-konklusion ...................................................................................... 37
3.5 Binomial test.......................................................................................................................................... 37
3.5.1 Binomialtest i Excel ......................................................................................................................... 40
3.5.2 Generel binomialtest APA-konklusion ............................................................................................ 41
3.6 𝜒2-test (Chi-i-anden test) for independence......................................................................................... 42
2
SPSS Introduktionsguide
3
SPSS Introduktionsguide
Figur 1.1: SPSS-interface i Data view. Man kan skifte til Variable View i bunden af siden.
4
SPSS Introduktionsguide
4. Blodtryk_før
5. Blodtryk_efter
Vi kan desuden se, at der er 10 forsøgspersoner med i studiet (10 rækker).
5
SPSS Introduktionsguide
Tip Det er en god ide at give sin variabel et navn, der indikerer, hvad den går ud på, så man undgår
forvirring, når man skal forstå og fortolke sine resultater senere. F.eks. er det nemmere at forstå,
6
SPSS Introduktionsguide
at variablen ”Blodtryk_før” angiver blodtrykket før behandling, end hvis man f.eks. havde kaldt
den ”Variabel_4”.
1.2.2 Label
Under Label kan vi skrive det navn, vi gerne vil kalde vores variabel, uden at SPSS har nogen regler
for, hvilke tegn der må være med. For variablen ”Blodtryk_før”, kunne vi give variablen en label
ved navn ”Blodtryk før behandling” (Figur 1.5). Labelen angiver det navn, der kommer til at stå på
grafer og tabeller. For de to andre variable, Køn og Alder, er label bare det samme som variablens
navn.
1.2.4 Type
Under Type kan vi angive, om variablens værdier er Numeric (tal) eller en String (ord). Når vi
indtaster en ny variabel, vil SPSS automatisk vælge typen Numeric. Det er fint, når vores variabel
har talværdier; det gælder, i vores eksempel, for variablene Alder og Blodtryk_før.
Hvis vi derimod ønsker at kunne skrive variablens værdier i ord eller bogstaver, skal vi ændre
variablens Type. Det kunne f.eks. være i variablen Køn, hvor vi kunne ønske at angive værdierne
som Kvinde eller Mand. I så fald skal vi trykke på de tre små prikker i højre hjørne af feltet under
Type (Figur 1.7).
7
SPSS Introduktionsguide
Der vil nu dukke en dialogboks op, hvor man kan vælge typen String (Figur 1.8).
Når vi trykker OK (Figur 1.8), vil vi i Variable View kunne se, at variablens Type er blevet ændret til
en String (Figur 1.9).
Tip Vi kunne også have defineret Køn som en Numeric type ved f.eks. at skrive 1 for kvinde og 0
for mand. I så fald havde vi ikke behøvet at ændre variablens type. Til gengæld skal man så huske
at skrive ned et sted, hvilket tal, der er kvinde, og hvilket der er mand – ellers kan man hurtigt få
forvirret sig selv senere :-)
8
SPSS Introduktionsguide
1.2.5 Width
Width angiver hvor mange tegn, der må være i variables værdier. F.eks. har tallet ”39” en width på
2, og ordet ”Kvinde” har en width på 6. SPSS sætter automatisk width på 8, og det er typisk
tilstrækkeligt for de fleste datasæt. Men hvis vi forestiller os, at vi havde glemt at notere alderen
på en af vores forsøgspersoner, kunne det være, at vi gerne ville skrive ”Ikke defineret” under
personens alder. I så fald ville vi være nødt til at ændre Width for Alder fra 8 til 14 (og ændre
Alders type til en string).
9
SPSS Introduktionsguide
10
SPSS Introduktionsguide
11
SPSS Introduktionsguide
3. Vi ønsker at udvælge data for kvinderne, og betingelsen for at komme med i det nye datasæt
er derfor, at Køn skal have værdien F (for Female). Det angiver vi ved at skrive Køn = ”F” i den
øverste boks. Tryk dernæst på ”Continue”.
12
SPSS Introduktionsguide
4. Vi kan vælge at få SPSS til at lave et nyt datasæt med data kun for kvinderne ved at vælge
”Copy selected cases to a new dataset”. Vi navngiver det nye datasæt ”Blodtryk_kvinder”.
Tryk på OK.
13
SPSS Introduktionsguide
14
SPSS Introduktionsguide
”Weight cases”. Lad os forestille os, at vi har spurgt 100 mennesker på gaden, hvad deres
yndlingsfarve er. Deres svar fordeler sig sådan:
2. Tryk på ”Data” i menuen øverst på siden og vælg ”Weight Cases…” nederst i drop-down
menuen.
15
SPSS Introduktionsguide
3. Tryk på ”Weight cases by” og hiv “Frekvens” over i linjen under ”Frequency Variable”. Tryk OK.
4. SPSS fortæller ikke, at den har vægtet variablene, men det har den – så selvom der ikke sker
noget i output, er kommandoen alligevel gået igennem.
16
SPSS Introduktionsguide
17
SPSS Introduktionsguide
Alternativ metode: Vi kunne også have klikket Analyze à Descriptive Statistics à Frequencies (også
for variable på nominal skala) for at få den deskriptive statistik for vores variable.
De variable vi ønsker at kende den deskriptive statistik for, trækker vi over under Variable(s):
18
SPSS Introduktionsguide
Det er ikke nødvendigvis alle variable, vi ønsker statistik for, så vi vælger bare de relevante (her
vælger vi alle for eksemplets skyld).
19
SPSS Introduktionsguide
For Alder kan vi se, at range er 10. Dvs. at der er 10 år mellem den yngste og den ældste
forsøgsperson. Vi kan se, at gennemsnitsalderen er 𝑀!"#$% = 25,47 å𝑟, og standardafvigelsen er
𝑠!"#$% = 2,7 å𝑟 (hvilket betyder, at den gennemsnitlige afvigelse fra aldersgennemsnittet er 2,7 år).
&
Variansen for Alder er 𝑠!"#$% = 7,361 å𝑟 & .
For depressionsscore før behandlingen kan vi se, at der er 15 point mellem de to forsøgspersoner
med den hhv. laveste og højeste BDI (fordi range er 15). Vi kan se, at den gennemsnitlige
depressionsscore i samplet før behandlingen er 𝑀'()_+ø% = 26,1 𝑝𝑜𝑖𝑛𝑡, og at standardafvigelsen er
&
𝑠'()_+ø% = 4,1 𝑝𝑜𝑖𝑛𝑡. Variansen for BDI før behandling er 𝑠'()_+ø% = 16,7 𝑝𝑜𝑖𝑛𝑡 & .
For depressionsscore efter 4 mdr. behandling kan vi se, at der er 18 point mellem de to
forsøgspersoner med den hhv. laveste og højeste BDI (fordi range er 18). Vi kan se, at den
gennemsnitlige depressionsscore i samplet efter 4 mdr. behandling er 𝑀'()_-.#%. = 21,57 𝑝𝑜𝑖𝑛𝑡,
og at standardafvigelsen er 𝑠'()_-.#%. = 5,3 𝑝𝑜𝑖𝑛𝑡. Variansen for BDI efter 4 mdr. behandling er
&
𝑠'()_-.#%. = 27,8 𝑝𝑜𝑖𝑛𝑡 & .
20
SPSS Introduktionsguide
21
SPSS Introduktionsguide
Per default er der valgt både gennemsnit og standardafvigelse, men hvis man ønsker andre
statistikker som fx median, range eller varians, så kan man trække dem over her.
22
SPSS Introduktionsguide
Aflæsning af output
Vi kan se, at den gennemsnitlige depressionsscore i den nye behandlingsgruppe før behandlingen
er 𝑀01_+ø% = 26,34 𝑝𝑜𝑖𝑛𝑡, og efter 4 mdr. behandling er den 𝑀01_-.#%. = 19,54 𝑝𝑜𝑖𝑛𝑡.
Depressionsscoren i den nye behandlingsgruppe er altså faldet gennemsnitligt omkring 7 point fra
før til efter 4 mdr. behandling.
Vi kan se, at den gennemsnitlige depressionsscore for TAU før behandlingen er 𝑀2!3_+ø% =
25,87 𝑝𝑜𝑖𝑛𝑡, og efter 4 mdr. behandling er den 𝑀2!3_-.#%. = 23,6 𝑝𝑜𝑖𝑛𝑡. Depressionsscoren i den
gamle behandlingsgruppe (TAU) er altså faldet gennemsnitligt omkring 2 point fra før til efter 4 mdr.
behandling.
Tolkning af output
Vores deskriptive statistik tyder altså på, at effekten af den nye behandling er bedre end effekten af
den gamle behandling. Vi kan teste om forskellen er signifikant med en t-test, som gennemgås i
afsnittet ”t-tests i SPSS”.
23
SPSS Introduktionsguide
Ønsker vi en visuel repræsentation af den deskriptive statistik, kan vi fx lave et mean plot eller et
boxplot.
24
SPSS Introduktionsguide
Det lille billede med Simple Error Bar trækkes op i det hvide felt med blå skrift i:
Herefter placeres den uafhængige variabel i X-Axis og den afhængige variabel i Y-axis:
25
SPSS Introduktionsguide
95% konfidens-
95% konfidensintervallet
intervallet for den
for TAU-gruppens
nye behandlings-
depressionsscore
gruppes
depressionsscore
Vi har her lavet et mean plot for depressionsscore før behandling, og vi kan tilsvarende lave et for
depressionsscore efter 4 mdr. behandling ved i stedet at vælge variablen ”Depressionsscore efter 4
mdr. behandling” som afhængig variabel (og placere den på Y-aksen).
26
SPSS Introduktionsguide
Det lille billede med Simple Box Plot trækkes op i det hvide felt med blå skrift i:
Herefter placeres den uafhængige variabel i X-Axis og den afhængige variabel i Y-axis:
27
SPSS Introduktionsguide
Outlier
Median Maksimum
3. kvartil
1. kvartil
Minimum
Vi har her lavet et boxplot for depressionsscore efter 4 mdr. behandling, og vi kan tilsvarende lave
et for depressionsscore før behandling ved i stedet at vælge denne som afhængig variabel (og
placere den på Y-aksen).
28
SPSS Introduktionsguide
3. Tests i SPSS
I denne del af guiden tager vi udgangspunkt i et eksempel med Alzheimers patienter, og hvordan de scorer
forskelligt på en depressionsskala i forhold til gennemsnittet i normalbefolkningen.
29
SPSS Introduktionsguide
2. Vælge den variable vi er interesseret i at undersøge (Hint! Det skal være en kontinuert
variabel) og flytte den over til under ’Test variables(s)’
30
SPSS Introduktionsguide
4. Trykke ”OK” og få følgende output, hvor man kan aflæse t-værdi og p-værdi
Vælg efter om vi
har en et- eller to-
halet!
Ofte kender vi også
de her fra
opgaveteksten
31
SPSS Introduktionsguide
32
SPSS Introduktionsguide
2. Vælge de to variable vi ønsker at teste mod hinanden (altså en variabel for hver gang vi har
målt vores sample) og sæt dem ind under ’Paired variables’. Husk at tjekke ’Estimate effect
sizes’ for at få Cohens d.
3. Tryk ”OK” og få følgende output, hvor man kan aflæse t-værdi og p-værdi
Vælg den
der passer!
33
SPSS Introduktionsguide
OBS! Under ”Define Groups” skal der være en hak ved ”Estimate effect sizes”, hvis det skal angives (eks.
Cohens d)
1. Tryk på ”Analyse”
2. ”Compare Means”
3. ”Independent Samples T Test…”
4. Indsæt gruppevariablen nederst
5. Indsæt den anden variabel øverst
6. Tryk på ”Define Groups” og skriv de to grupper ind. (Husk at det skal staves præcis som i Data-view)
34
SPSS Introduktionsguide
En independent samples t test (two-tailed, α = 0.05) viste at efter 9 måneders behandling var procentdelen
af stavelser, hvor der stammes, signifikant mindre for de børn, der havde fuldt Lidcombe programmet,
M=1.5 (SD = 1.4), sammenlignet med børn, der havde modtaget standard-behandlingen, M= 3.9 (SD=3.5),
t(45) = 3.13, p=0.003.
35
SPSS Introduktionsguide
36
SPSS Introduktionsguide
En to halet single case t-test viste at ”a patient who had sustained bilateral hippocampal damage” scorede
en “distance error” M=37, som var significant større end gennemsnittet af kontrolgruppen 𝑀 = 10.42,
(𝑆𝐷 = 9.96), 𝑡(9) = −2,562, 𝑝 = .031
37
SPSS Introduktionsguide
38
SPSS Introduktionsguide
4. Dialogboks udfyldes:
- Flyt ‘Discrimination’ til ‘Test Variable List’
- Tryk på ‘Cut point’ og udfyld altid feltet med værdien 1,5
- Udfyld ’Test Proportion’ med værdien π (som antaget i nulhypotese), dette tilfælde: 0,333
- Tryk på ’OK’
5. Output:
Succes: Observed Prop.: ,871 er her 87 %
Exact Sig. (1-tailed): ,001 og dette er vores p-værdi
som her betyder p < α = 5 %
derfor er resultatet signifikant og 𝐻! forkastes
39
SPSS Introduktionsguide
=fakultet(X)
=binomial.fordeling(X;N;𝜋;FALSK)
=binomial.dist.interval(N;𝜋;X;Y)
• Sandsynligheden for x eller flere succeser, 𝑝(𝑋 ≥ 𝑥), udregnes med samme kommando ved at
finde sandsynligheden for mellem x og n succeser: p-VÆRDI !!!
=binomial.dist.interval(N;𝜋;X;N)
40
SPSS Introduktionsguide
• Testtype
• Signifikansniveau og et-halet
• Beskrivelse af resultatet
• Antal succeser og N
• (Opsamling)
Generelt:
En {eksakt binomialtest} (α=5%, one-tailed) viste, at {antallet af patienter, der blev raske efter en ny
behandling} (X=? af N=?) {ikke} var signifikant {flere} end forventet baseret på sandsynligheden for succes
ved {standardbehandlingen} {(π)}, {p=?}. Der er således {ikke} statistisk evidens for at anbefale den nye
behandling.
Eksempel:
En eksakt binomialtest (𝛼 = 5%, one-tailed) viste, at antallet af patienter, der blev raske efter en ny
behandling (𝑋 = 18 af 𝑁 = 20) var signfikant flere end forventeligt baseret på sandsynligheden for succes
ved standardbehandlingen (0.63), 𝑝 = .008. Der er således statistiks evidens for at anbefale den nye
behandling.
41
SPSS Introduktionsguide
42
SPSS Introduktionsguide
3. Herefter dukker et nyt vindue op, hvor man trækker kolonnen ”antal” hen i feltet ”frequency
variable”.
Man krydser desuden ”weight cases by” af. Herefter trykkes på ”ok”.
43
SPSS Introduktionsguide
44
SPSS Introduktionsguide
• Testtype
• Signifikansniveau og to-halet
• Beskrivelse af resultatet
• Succesraten i antal succeser af N eller π (procentsats) som angivet i opgaven for gruppen.
• Den udregnede p-værdi (findes i SPSS resultatet ved ”asymptotic significance (2-sided)
En 𝜒 " -test for independence (two-tailed, 𝛼 = 5%) viste, at {succesraten for en ny behandling} (X = ? af N ?
eller 𝝅) (ikke) var signifikant højere end/forskellig fra {succesraten for standardbehandlingen} /
{kontrolbehandlingen} (𝜋 𝑒𝑙𝑙𝑒𝑟 X = ? af N = ?), 𝜒 " (?, n = ?) = ?, p = ?
Eksempel:
En 𝜒 " -test for independence (two-tailed, 𝛼 = 5%) viste, at andelen af venstrehåndede drenge (X = 40 af N
400, 10%) var signifikant forskellig fra andelen af ventrehåndede piger (𝑋 = 42 𝑎𝑓 𝑁 = 709, 6%), 𝜒 " (1, n =
1109) = 6.17, p < .05
Eller
En 𝜒 " -test for independence (two-tailed, 𝛼 = 5%) viste, at succesraten for behandling med TMS (69%) var
signifikant højere end succesraten for den farmakologiske behandling (19%), 𝜒 " (1, n = 32) = 8.13, p = .004
45
SPSS Introduktionsguide
7. Output =
46
SPSS Introduktionsguide
3.8 Power
Med en Power-test bruger vi data fra fx tidligere studier til at sige noget om sandsynligheden for at vi
korrekt har forkastet en falsk nulhypotese.
Man kan både beregne Power og lave Samplesize planning, som begge vil indgå under Binomialtesten og T-
testen
3.8.1 Binomialtest
3.8.1.1 Power Beregning
Binomialtesten for Power findes under:
Analyze -> Power analysis -> Proportions -> one-Sample Binomial Test
47
SPSS Introduktionsguide
Dette
yder
dette
resultat:
48
SPSS Introduktionsguide
- Ønskede Power
- H0 succesrate (Succesraten for det pågældende studie)
- H1 Succesrate (Succesraten for studiet der sammenlignes med)
- Signifikans Niveau (Alpha, som regel 0.05
Resultatet af dette:
49
SPSS Introduktionsguide
a. Two-sided test.
b. Based on binomial enumeration.
- For at opnå en Power på mindst 0.8 (her 0.826), må der benyttes mindst 45 forsøgspersoner i det
gældende studie.
3.8.2 t-test
3.8.2.1 One-Sample t-test
Testen findes: Analyze à Power Analysis à Means à One-sample t-test
Hvad der skal bruges for at lave en One-sample t-test Power beregning:
- n, sample size
- M, gennemsnit af Sample
- µ, gennemsnit af Populationen
- s, standardafvigelsen for Sample
50
SPSS Introduktionsguide
Hvad Der skal bruges for at lave en One-sample t-test Sample Planning:
- Ønsket Power
- M, gennemsnit af Sample
- µ, gennemsnit af Populationen
- s, standardafvigelsen for Sample
51
SPSS Introduktionsguide
52
SPSS Introduktionsguide
53
SPSS Introduktionsguide
54
SPSS Introduktionsguide
- Ønsket Power
- 𝑴𝑫 , 𝐺𝑒𝑛𝑛𝑒𝑚𝑠𝑛𝑖𝑡 𝑎𝑓 𝐷𝑖𝑓𝑓𝑒𝑟𝑛𝑐𝑒𝑠𝑐𝑜𝑟𝑒𝑟
- 𝒔𝑫 , 𝑆𝑡𝑎𝑛𝑑𝑎𝑟𝑑𝑎𝑓𝑣𝑖𝑔𝑒𝑙𝑠𝑒 𝑓𝑜𝑟 𝐷𝑖𝑓𝑓𝑒𝑟𝑒𝑛𝑐𝑒𝑠𝑐𝑜𝑟𝑒𝑟
55
SPSS Introduktionsguide
- Der behøves et minimum af 14 deltagere for at opnå en power på minimum 0.8 (her 0.810).
Testen Findes:
56
SPSS Introduktionsguide
57
SPSS Introduktionsguide
58
SPSS Introduktionsguide
- Der behøves et minimum af 34 deltagere for opnå et minimum af 0.8/80% Power (her
0.805/80.5%)
59
SPSS Introduktionsguide
60