Download as pdf or txt
Download as pdf or txt
You are on page 1of 30

7장

표본추출과 표본분포
(sampling and sampling distributions)

단순무작위표본추출

점추정

표본분포 개요

의 표본분포

Slide 1
서론

요소(element)는 자료가 수집되는 대상이다.

모집단은 관심 대상이 되는 모든 요소들의 집합이다.

표본은 모집단의 부분집합이다.

표본이 되는 모집단(sampled population)은 표본이


추출되는 모집단이다.

프레임(frame)은 표본이 선정되는 요소들의 명단이다.

Slide 2
서론

표본을 선택하는 이유는 모집단에 관한 연구질문에


답하기 위한 자료를 수집하기 위함이다.

표본의 결과는 모집단 특성 값에 대한 추정치만


제공한다.

그 이유는 표본은 모집단의 단지 일부에 불과하기


때문이다.

적절한 표본추출 방법을 사용하면, 표본의 결과는


모집단 특성에 대한 좋은 추정치를 제공할 수 있다.

Slide 3
표본 선정

유한 모집단(finite population)으로부터 표본추출


무한 모집단(infinite population)으로부터 표본추출

Slide 4
유한 모집단으로 부터 표본 추출

유한 모집단의 예는 아래와 같다:


• 조직의 등록멤버
• 신용카드 계좌 수
• 재고생산품의 수
단순 무작위 표본(simple random sample): 규모 N인 유
한한 모집단으로부터 규모 n은 표본 각각이 선택될 확률
이 동일하다.

Slide 5
무한 모집단으로 부터 표본 추출

무한 모집단은 모집단의 요소들이 계속 진행되는 과정


(ongoing process)에 있기 때문에 생성되는 요소의 수에
상한이 없다.

무한 모집단에 해당하는, 진행중인 과정의 예는 다음과 같다.

• 생산라인에서 제조되는 부품
• 은행에서 발생하는 거래
• 기술상담창구에 걸려오는 전화
• 가게에 들어가는 고객

Slide 6
무한 모집단으로 부터 표본 추출

무한 모집단의 경우 타당한 통계적 추론을 위해


무작위 표본(random sample )을 추출하여야 한다.

무한 모집단으로부터의 무작위 표본은 다음 조건을


만족시키도록 선정되어야 한다.
1. 선택된 각 요소는 동일 모집단으로부터 나온다
2. 각 요소는 독립적으로 선택된다.

Slide 7
추정 방법(7장-9장)

점 추정
구간 추정
가설 검정

Slide 8
점추정(point estimation)
x

점추정은 통계적 추론의 한 형태이다.

점추정에서 모집단 모수를 추정하기 위해 표본 통계량의


값을 계산하는데 표본 자료를 사용할 수 있다.

는 모집단의 평균 의 점추정량(point estimator)이다.


s 는 모집단 표준편차 의 점추정량이다

는 모집단 비율 p의 점추정량이다.

Slide 9
x
의 표본분포(sampling distribution)
x
x

■ 통계적 추론 과정

n 요소의 단순
평균 μ= ? 를
x 무작위

표본을 모집단으로부터
가진 모집단
선정한다.

 의 값을 추정하는데 표본자료가 표본평균


의 값을 사용한다. 의 값을 제공한다.

Slide 10
x

x x

의 표본분포

의 표본분포는 표본평균 의 모든 가능한 값의


확률 분포이다.

x
의 기대값

E( ) = 

여기서:
 = 모집단 평균
점추정량의 기대값이 모집단 모수와 동일할 때,
그 점추정량은 편의가 없다(unbiased)라고 한다.

Slide 11
x

의 표본분포
x
의 표준편차
x
의 표준편차를 정의하기 위해 다음의 기호들을
사용한다.

 = x
의 표준편차
 = 모집단의 표준편차
n = 표본규모
N = 모집단 규모

Slide 12
x

()
n/(
N )
1

x

의 표본분포
x
의 표준편차

유한 모집단 무한 모집단

x
( 
n)N
1n 
x

n

• 만약 n/N < .05 이면, 유한 모집단은 무한모집단


인 것처럼 간주된다.
• : 유한모집단 수정계수
• : 평균의 표준오차(standard error)

Slide 13
x

의 표본분포

x
모집단이 정규분포일 때, 의 표본분포는 표본크기에
관계없이 정규분포이다.

x
대부분의 경우, 표본의 규모가 30이상이면 , 의 표본
분포는 정규분포에 가까워진다.

모집단의 분포가 비대칭적이거나 극단값이 있는 경우


표본 규모는 50이상으로 하는 것이 좋다.

Slide 14
x

의 표본분포

x x
의 표본분포는 표본평균 가 모집단평균 와
얼마나 가까운지에 관한 확률정보를 제공하기 위해
사용될 수 있다.

Slide 15
중심극한정리(central limit theorem)

무작위 표본이 추출되는 모집단이 정규분포가 아닐 때,


x
중심극한정리는 의 표본분포 모양을 확인하는데
도움을 준다.

중심극한 정리
모집단으로부터
x
규모 n의 무작위 표본을 선택할 때,
표본평균 의 표본분포는 표본규모가 커질수록
정규분포에 가까워진다.

Slide 16
x

SAT성적에 대한 의 표본분포
■ 예: St. Andrew’s College

표본평균 의

x14.6 
n80
30 
x
분포

x
E( x )  1090

Slide 17
SAT 성적에 대한
x

의 표본분포

■ 예: St. Andrew’s College

30명의 무작위 추출 표본에 대한 평균이 실제 모집단


평균의 +/- 10 안에 있을 확률은 얼마인가?
다시 말해서, x 가 1080에서 1100 사이에 있을 확률은
얼마인가?

Slide 18
SAT 성적에 대한
x

의 표본 분포

단계 1: 구간의 위(upper) 값에 해당하는 z-값을 구한다.


z = (1100 - 1090)/14.6= .68

단계 2: z-값 왼쪽 분포곡선 아래 면적을 구한다.


P( z < .68) = .7517

Slide 19
SAT성적에 대한
x

의 표본 분포

표준 정규 분포의 누적확률

z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
. . . . . . . . . . .
.5 .6915 .6950 .6985 .7019 .7054 .7088 .7123 .7157 .7190 .7224
.6 .7257 .7291 .7324 .7357 .7389 .7422 .7454 .7486 .7517 .7549
.7 .7580 .7611 .7642 .7673 .7704 .7734 .7764 .7794 .7823 .7852
.8 .7881 .7910 .7939 .7967 .7995 .8023 .8051 .8078 .8106 .8133
.9 .8159 .8186 .8212 .8238 .8264 .8289 .8315 .8340 .8365 .8389
. . . . . . . . . . .

Slide 20
x

Sampling Distribution of

x  x  14.6
표본 평균 의
분포

면적 = .7517

1090 1100

Slide 21
SAT 성적에 대한
x

의 표본 분포

단계3: 구간의 아래(lower) 값에 대한 z-값을 구한다.


z = (1080 - 1090)/14.6= - .68

단계 4: z-값 왼쪽 분포곡선 아래 면적을 구한다.


P(z < -.68) = .2483

Slide 22
x

SAT 성적에 대한 의 표본 분포

x
표본 평균 의 
x
14.6
분포

면적 = .2483

1080 1090

Slide 23
SAT 성적에 대한
x

의 표본 분포

Step 5: 구간 위와 아래 z-값 사이 곡선 아래 면적을


구한다.
P(-.68 < z < .68) = P(z < .68) - P(z < -.68)
= .7517 - .2483
= .5034
표본의 SAT 성적 평균이 1080과 1100 사이에 있을 확률
은:

P(1080 < < 1100) = .5034

Slide 24
SAT 성적에 대한
x

의 표본 분포

표본 평균 
x
14.6
의 분포

면적 = .5034

1080 1090 1100

Slide 25
표본규모(sample size)와
x

x x


x

의 표본분포와의 관계

30명이 아닌 100명의 단순 무작위 표본 추출을 가정하자.

표본 규모에 상관 없이 E( ) =  . 앞 예에서 E( )는
여전히 1090이다.
표본 규모가 증가하면 평균의 표준오차 는 감소한다.
표본의 규모가 100으로 증가함에 따라, 평균의 표준오차는
아래와 같이 감소한다.


x8.0 
n80
100 

Slide 26
x

8

x

14.6

x

표본규모와 의 표본분포와의 관계

n = 100일 때,

n = 30일 때,

x
( x) 990
E

Slide 27
x

표본규모와 의 표본분포와의 관계

n = 30일 때 , P(1080 < < 1100) = .5034.


n = 100 일 때, n = 30 일 경우의 단계를 적용하여
P(1080 < < 1100) 을 풀면,
P(1080 < < 1100) = .7888.

n = 100 일 경우 표본분포는 더 작은 표준오차를 가지기


때문에, 의 값들은 n = 30일 때 보다 더 작은 변동성을
가지며 모집단 평균에 더 가까워 진다.

Slide 28
x

표본규모와 의 표본분포와의 관계

의 표본 
x
8
분포

면적 = .7888

1080 1090 1100

Slide 29
7장 끝

Slide 30

You might also like