Professional Documents
Culture Documents
4 - 2 - 2023.03.24
4 - 2 - 2023.03.24
기초의학통계학
학습목표
• <3주차>
• 연속형 변수를 요약하는 통계량을 제시할 수 있다.
• 두 군에서 연속형 변수에 대해 t-검정으로 평균값의 비교를 수행할 수 있다.
• 짝지어진 자료에 대해 적절한 분석을 수행할 수 있다.
• 비모수적 방법을 사용하여 평균값의 비교를 수행할 수 있다.
• <4주차>
• 세 군 이상에서 분포를 분산분석으로 비교할 수 있다.
• 세 군 이상의 평균값 비교에서 사후검정을 수행할 수 있다.
• 비모수적 방법을 사용하여 세 군 이상의 평균값의 비교를 수행할 수 있다.
두 군에서 연속형 자료의 분포 비교
두 군에서 변수가 정
규분포를 하는가?
(정규성 검정)
Yes No
Yes No
독립 t 검정 수정된 독립 t 검정
자료의 요약:
평균(표준편차)
연속형 변수에 대한 통계 검정
결과변수 설명변수 기타 조건 모수적 방법 비모수적 방법
(Y) (X)
연속 비연속 독립적 자료 Student's t-test Wilcoxon rank sum
(2개 범주) test
Mann-Whitney test
Median test
짝지은 자료 paired t-test Wilcoxon signed
rank test
Sign test
짝지은 자료 & Mixed model
교란요인보정
연속 비연속 독립적 자료 ANOVA Kruskal-Wallis test
(3개 이상
의 범주) 독립적 자료 & GLM
교란요인 보정 Regression with
dummy variable
of groups
짝지은 자료 Repeated Mixed model
(반복측정자료) measures ANOVA
Mixed model
짝지은 자료 & Mixed model
교란요인보정
ANOVA
표본 1 : n1 , x1 , s1
표본 2 : n2 , x2 , s2
표본 3 : n3 , x3 , s3
표본 4 : n4 , x4 , s4
다중비교(multiple comparison)의 문제 발생
ANOVA
• 귀무가설
• H0: 1 = 2 = … = k
• H1:k개의 집단의 평균값( )은 모두 같지는 않다.
(적어도 두 군의 평균은 다르다)
• 가정
1. 정규분포 가정: 각 모집단의 종속변수는 정규분포를 따름
2. 등분산 가정: 각 모집단의 종속변수는 공통의 분산을 가짐
3. 독립된 관찰값의 가정: 각 관찰값은 독립
• 예제> 2012, 2013, 2014 학년도의 의학통계론 기말고사 점수를 비교하여 3개 년도간
점수가 차이가 있는지 검정하고자 한다.
y2
y3
y
분산분석표
Source SS df MS F(검정통계량)
Between SSB k-1 MSB=SSB/(k-1) F=MSB/MSW
Within SSW N-k MSW=SSW/(N-k)
Totals TSS N-1
(y tj y )
2
- Total Sum of Square (TSS): 각 관찰치와 전체평균의 차이 TSS
t ,j
- Sum of Square Between (SSB): 각 집단 평균과 전체 평균의 차이 SSB nt ( yt y )
2
t
- Sum of Square Within (SSW): 각 집단 내에서 관찰치와 집단평균의 차이
SSW ( y tj y t )
2
t, j
ANOVA(분산분석) 단계
1. F-test 수행
x1 x 2 x 3 x 4
2. F-test에서 통계적 유의성이 관찰되면 어느 그룹간에 차이가 있는지를 확인
사후검정으로 두 군씩 짝지어 평균 비교
• 사후검정방법
• Bonferroni : α’ = α / (# of comparisons), 보수적
• Scheffe: 집단의 n이 동수가 아닌 경우, 보수적
• Turkey: 모든 집단 n이 같을 때에 Scheffe 방법보다 검정력이 좋음
평균치를 큰 순서로 정렬한 뒤 가장 큰 평균과 가장 작은 평균을 먼저 비교 -> 이 차이가 유
의하면 그 다음으로 큰 평균과 가장 작은 평균을 비교
- Dunnett: 여러 집단을 하나의 대조군과 비교할 때 사용
Q. 고혈압 과거력에 따라 수축기 혈압이 차이가 있는가?
• 가정
1. 정규분포 가정: 각 모집단의 종속변수는 정규분포를 따름
2. 등분산 가정: 각 모집단의 종속변수는 공통의 분산을 가짐
3. 독립된 관찰값의 가정: 각 관찰값은 독립
ANOVA의 가정에 위배될 때
1. 정규분포 가정: 각 모집단의 종속변수는 정규분포를 따름
• 정규분포를 정확히 따르지 않더라도 충분한 sample size (각 집단에 30 이상)를 가지는 경우
크게 문제되지 않음
• 종속변수를 transformation 을 취해 정규분포에 가깝게 만들 수 있음 (natural log, 제곱 등)
• Transformation 해도 정규분포를 따르지 않으면 비모수적 통계기법 사용
두 군의 GPT 측정값들에 대해 순위
각 군의 순위의 합을 계산
- 투여집단(group=1) 순위 합: 15
- 비투여집단(group=2) 순위 합: 40