Download as pdf or txt
Download as pdf or txt
You are on page 1of 60

1 확률분포

2 통계적 추정

통계는 고대 국가가 조세나 징병을 위해 수집한 자료를 분석하는 것으로부터 시작되었다. 이후 골


턴, 피어슨, 고셋, 피셔 등이 자연 과학과 사회 과학의 한정된 조사와 실험 자료를 바탕으로 합리적인
추론을 하는 방법을 수학적으로 연구하면서 비로소 체계가 정립되었다. 오늘날의 통계는 디지털 기
기에서 수집된 빅데이터를 분석하기 위해 고도의 계산을 시도하는 방법으로 보다 발전하고 있다.
출처 Williams, H. , Twelve British statisticians

골턴 ●
(Galton, F., 1822~1911)

● 피어슨
(Pearson, K., 1857~1936)

고셋 ●
(Gosset, W. S., 1876~1937)

피셔 ●
(Fischer, R. A., 1890~1962)
학습 목표 •확률변수의 분포로부터 기댓값과 표준편차를 구할 수 있다.
•이항분포와 정규분포의 뜻을 알고, 그 성질을 이해한다.
•모집단과 표본의 관계를 이해한다.
•표본평균을 이용하여 모평균을 추정하고, 그 결과를 해석할 수 있다.

이 단원을 시작하며 나의 학습 계획을 세우고, 학습해 가면서 나만의 포트폴리오를 만들어 보세요.

학습 계획 그날 수업 시간에 배운 내용은 그날 바로 복습해야겠다.

통계 자료 모음집 공학 도구 활동 자료집 탐구 활동 보고서


포트폴리오
확률분포

출생
출생아
년출생아 생아
출생아
년 출생
생아 생아
년 출생아
출생
출생
출생아
년출

년 통계청에서는 년 출생아의 기대 수명이 .년으로 전년 대비 .년 증가했으며,


특히 남자는 년, 여자는 .년으로 예상된다고 발표했다. 이는 0&$% 국가 중에서 남자는
위, 여자는 위에 해당하는 기록이다. 통계 분석가들은 나이별 사망률 등을 이용하여 인간의
기대 수명을 확률적으로 예측하는데, 이는 미래 사회를 대비하기 위해 꼭 필요한 정보이다.
출처 통계청, 2016

준비 학습

●대푯값과 산포도 1 다음은 어느 마을의 다섯 가구를 대상으로 각 가구의 한 달 전기 사용량을 조사한 것이다. 한 달
자신 있음
전기 사용량의 평균과 표준편차를 각각 구하시오.
복습 필요
한 달 전기 사용량 단위: L8I

, , , , 

●독립시행의 확률 2 한 개의 주사위를 번 던졌을 때, 의 약수의 눈이 번 나올 확률을 구하시오.


자신 있음
복습 필요

80 │Ⅲ. 통계
확률변수와 확률분포
학습 목표 •확률변수와 확률분포의 뜻을 안다.

개념 1 ⪼෇ᄧᙿ௧ྛᨮᯣʳ"

탐구하기

한 개의 동전을 두 번 던지는 시행에서 앞면을 ), 뒷면을 5라고 할 때, 물음에


음에 답해 보자.

1 이 시행의 표본공간 4를 구해 보자.

2 표본공간 4의 각 근원사건에 대하여 앞면이 나온 횟수를 9라고 할 때, 각 근원사건


과 9가 취하는 값 사이의 대응 관계를 구해 보자.

위의 탐구하기의 시행에서 표본공간 4는 4 9의 값

4\ ), ) , ), 5 , 5, ) , 5, 5 ^ ) ) 
) 5
이다. 
5 )
이때 앞면이 나온 횟수를 9라고 하면 표본공간 4의 각 5 5 

근원사건
\ ), ) ^, \ ), 5 ^, \ 5, ) ^, \ 5, 5 ^
에 대응하는 9의 값은 각각
, , , 
이다.

이와 같이 어떤 시행에서 표본공간의 각 근원사건에 하나의 실수를 대응시키는 관계를


확률변수라고 한다. 즉, 위의 탐구하기에서 앞면이 나온 횟수 9는 확률변수이다.

문제
1 원짜리 동전 개를 동시에 던질 때, 앞면이 나오는 개수를 확률변수 9라고 하자. 이때 확
률변수 9가 취하는 값을 모두 구하시오.

1. 확률분포│ 81
개념 2 ᯛᔗ⪼෇ᄧᙿ௧ྛᨮᯣʳ"

확률변수 9가 취하는 값이 유한개이거나 자연수처럼 셀 수 있을 때, 확률변수 9를


이산확률변수라고 한다.
확률변수는 보통 9, :, ;, 이때 이산확률변수 9가 어떤 값 Y를 취할 확률을 기호로
U로 나타내고, 확률변수
가 취하는 값은 Y, Z, [, U  1 9Y
또는 Y, Y, Y, U으로 나
와 같이 나타낸다.
타낸다.

일반적으로 이산확률변수 9가 취하는 값이 Y, Y, Y, U, YO일 확률을 각각 Q,


Q, Q, U, QO이라고 하면
1 9YJ QJ J, , , U, O
로 나타낼 수 있고, 이때 Y, Y, Y, U, YO과 그 각각에 대응하는 확률 Q, Q, Q, U, QO
사이의 관계를 이산확률변수 9의 확률분포라고 한다.
또, 이 확률분포를 나타내는 함수 1 9YJ QJ 를 이산확률변수 9의 확률질량함수
라고 한다.

이산확률변수 9의 확률분포를 표와 그래프로 나타내면 각각 다음과 같다.

9 Y Y Y U YO 합계 1 9Y
Qf
1 9YJ Q Q Q U QO 

Qm
Q„ …

이산확률변수의 확률분포는 다음과 같은 성질을 갖는다. 0 Y„ YmYf … Y‰ Y

이산확률변수의 확률분포의 성질
이산확률변수 9가 취하는 값이 Y, Y, Y, U, YO일 때, 9의 확률분포를 나타내는
확률질량함수 1 9YJ QJ J, , , U, O 에 대하여
1. ƒQJƒ
2. Q Q Q AUA QO

참고 확률변수 9가 B 이상 C 이하의 값을 가질 확률은 1 Bƒ9ƒC 로 나타낸다.

보기 한 개의 동전을 두 번 던지는 시행에서 앞면이 나오는 횟수를 9라고 하면 9는 이산확률변수


이고, 9의 확률분포를 표로 나타내면 다음과 같다.

9    합계

1 9Y Å Å Å 

82 │Ⅲ. 통계
예제
어느 지역 문화 축제에 " 고등학교의 동
1 아리 팀과 # 고등학교의 동아리 팀이
참가하였다. 이 동아리들 중 오전에 공연
할 팀을 임의로 뽑을 때, 뽑힌 동아리
중에서 # 고등학교의 동아리의 수를 확률
변수 9라고 하자. 물음에 답하시오.

⑴ 9의 확률분포를 표로 나타내시오.
⑵ 오전에 공연하는 # 고등학교 동아리가 팀 이하일 확률을 구하시오.

확률변수 9의 확률질량함 풀이 ⑴ 오전에 팀이 공연하는데 " 고등학교의 동아리가 팀이므로 반드시 팀 이상의 # 고등
수는
학교의 동아리가 오전에 공연하게 된다.
$Y@$Y
1 9Y  즉, 확률변수 9가 취하는 값은 , , 이고, 각각의 확률은
$

단, Y, ,  $@$
1 9   cÅ
$

$@$
1 9   Å!
$

$@$
1 9   cÅ
$

따라서 9의 확률분포를 표로 나타내면 다음과 같다.

9    합계

1 9Y Å  Å 

⑵ 오전에 # 고등학교의 동아리가 팀 이하로 공연할 확률은 1 9ƒ 이므로


1 9ƒ 1 9 1 9

Å 

⑴ 풀이 참조 ⑵ 

문제
2 점 슛을 던져 성공할 확률이  인 농구 선수가
있다. 이 선수가 점 슛을 번 시도하여 성공한 횟
수를 확률변수 9라고 할 때, 물음에 답하시오.

⑴ 9의 확률분포를 표로 나타내시오.
⑵ 이 선수가 점 슛을 번 이상 성공할 확률
을 구하시오.

1. 확률분포│ 83
개념 3 ᩗᗴ⪼෇ᄧᙿ௧ྛᨮᯣʳ"

생각 열기

분 간격으로 운행되는 지하철이 있다. 임의의 시각에


지하철역에 가서 지하철을 기다리는 시간을 9라고 할
때, 빈칸에 알맞은 수를 써넣어 보자.
단, 9의 단위는 분이다.

1 9가 취하는 값의 범위는 ƒ9ƒ 이다.

2 지하철을 기다리는 시간이 분 이하가 될 확률


은 이다.

위의 생각 열기에서 지하철을 기다리는 시간을 9라고 하면 9는 에서 까지의


모든 실수의 값을 취할 수 있다. 이와 같이 확률변수 9가 취하는 값이 어떤 범위에 속
하는 모든 실수의 값일 때, 확률변수 9를 연속확률변수라고 한다.
지하철을 기다리는 시간이 B분 이상 C분 이하일 확률, 즉 연속확률변수 9에 대하여
Bƒ9ƒC일 확률은
    1 Bƒ9ƒC
와 같이 나타낸다.
이때 지하철이 분 간격으로 운행되고 1 ƒ9ƒ 이므로
CB
    1 Bƒ9ƒC  단, ƒBƒCƒ

임을 알 수 있다.
색칠한 부분의 넓이 이 확률 1 Bƒ9ƒC 는 오른쪽 그림의 색칠한 Z
1 Bƒ9ƒC
 CB @  
부분의 넓이와 같다. 
G Y 

CB
 그림에서 G Y 는 연속확률변수 9가 취하는 값인


ƒ9ƒ에서 G Y 이고, 함수 Z G Y 의 0 B C  Y

그래프와 Y축 사이의 넓이는 이다.

일반적으로 연속확률변수 9가 취하는 값이 =ƒ9ƒ>에 속하는 모든 실수의 값


이고, 이 범위에서 정의된 함수 Z G Y 가 다음 성질을 가질 때, 함수 Z G Y 를 연속
확률변수 9의 확률밀도함수라고 하고, 9는 확률밀도함수가 Z G Y 인 확률분포를
따른다고 한다.

84 │Ⅲ. 통계
연속확률변수의 확률분포의 성질
연속확률변수 9가 취하는 값이 =ƒ9ƒ>에 속하는 Z 1 Bƒ9ƒC
모든 실수의 값이고, =ƒYƒ>에서 정의된 확률밀도
함수 ZG Y 에 대하여
ZG Y
1. G Y y
2와 3으로부터 2. 함수 ZG Y 의 그래프와 Y축 및 두 직선 0 [r= [rB [rC > Y
1 =ƒ9ƒ> 
Y=, Y>로 둘러싸인 부분의 넓이는 이다.
이다.
3. 1 Bƒ9ƒC 는 함수 ZG Y 의 그래프와 Y축 및 두 직선 YB, YC로 둘러
싸인 부분의 넓이와 같다. 단, =ƒBƒCƒ>

보기 연속확률변수 9의 확률밀도함수 Z G Y 의 그래프가 Z

오른쪽 그림과 같을 때, 확률 ZG Y

1 ƒ9ƒ
은 색칠한 부분의 넓이와 같다.
0     Y

문제
3 연속확률변수 9가 취하는 값의 범위가 ƒ9ƒ이고, 확률변수 9의 확률밀도함수가
함수 ZG Y 의 그래프와 G Y LY일 때, 상수 L의 값과 확률 1 ƒ9ƒ 를 각각 구하시오.
Y축 및 직선 Y로 둘러
싸인 부분의 넓이는 이다.
Z
ZG Y
L

0   Y

생각과 표현 문제 해결 추론 창의・융합 의사소통

1 9가 연속확률변수일 때, 1 Bƒ9ƒC 1 Bƒ9C 를 만족시킨다. 다음 그림을 보고 1 9C 를


구해 보자.

1 Bƒ9ƒC 1 Bƒ9C 1 9C


ZG Y ZG Y ZG Y


[rB C Y [rB C Y C Y

2 1을 참조하여 1 Bƒ9ƒC 1 B9ƒC 1 B9C 가 성립함을 설명해 보자.

1. 확률분포│ 85
를 학습한 학생을 위한 내용

개념 4 ᩗᗴ⪼෇ᄧᙿᮿ⪼෇ᇫ⡓ᪧᱼᱨᇫ

연속확률변수 9의 확률분포의 성질을 확률밀도함수 Z G Y 의 정적분을 이용하여


나타낼 수 있다.
Z
연속확률변수 9가 취하는 값의 범위가 =ƒ9ƒ>이 1 Bƒ9ƒC

고, 9의 확률밀도함수가 Z G Y 일 때, 확률
ZG Y
1 Bƒ9ƒC 는 함수 Z G Y 의 그래프와 Y축 및 두
직선 YB, YC로 둘러싸인 부분의 넓이이므로 오른쪽 0 [r= [rB [rC > Y

그림의 색칠한 부분의 넓이와 같다. 단, =ƒBƒCƒ>


이를 정적분으로 나타내면 다음과 같다.

1 Bƒ9ƒC "CAA G Y EY

따라서 연속확률변수의 확률분포의 성질을 확률밀도함수 Z G Y =ƒYƒ> 와


정적분을 이용하여 나타내면 다음과 같다.

1. G Y y 2. ¥AAG Y EY

예제
연속확률변수 9가 취하는 값의 범위가 ƒ9ƒ이고, 확률변수 9의 확률밀도함수가
2 G Y BY일 때, 다음을 구하시오.

⑴ 상수 B의 값 ⑵ 1[ƒ9ƒÅ]

풀이 ⑴  AAG Y EY이어야 하므로

Y B B
 AAG Y EY AABY EYB< >  에서 , B
  
⑵ G Y Y이므로
Å Å
1[ƒ9ƒÅ] Y EY<Y> 


⑴  ⑵ 

문제
4 연속확률변수 9가 취하는 값의 범위가 ƒ9ƒ이고, 확률변수 9의 확률밀도함수가
G Y B YY 일 때, 상수 B의 값과 확률 1 ƒ9ƒ 을 각각 구하시오.

86 │Ⅲ. 통계
이산확률변수의 기댓값과 표준편차
학습 목표 •이산확률변수의 기댓값(평균)과 표준편차를 구할 수 있다.

개념 1 ᯛᔗ⪼෇ᄧᙿᮿʗ‫ݺ‬y ⠰ɇ ţ⣃ᵧ⠟₏௧ྛᨮᯣʳ"

생각 열기

어느 쇼핑몰에서 지난 한 달간 팔린 상품 개가 배송되는 데 소요된


기간을 조사하였더니 다음 표와 같았다. 이 쇼핑몰에서 상품을 주문하였
을 때, 상품이 배송되는 데 소요되는 기간의 평균을 구해 보자.

배송 소요 기간 일      합계
상품의 수 개      

위의 생각 열기의 쇼핑몰에서 상품을 주문하였을 때, 상품이 배송되는 데 소요되는


배웠어요! 중3

평균, 분산, 표준편차 기간의 평균은


(변량)의 총합
⑴ (평균) @ @ @ @ @
(변량)의 개수
⑵ (편차)(변량)(평균) 
⑶ (분산)
(편차)2의 총합 @oz @coz @ioz @zz @

(변량)의 개수
⑷ (표준편차)Ã(분산)    일
이다.
이때 상품이 배송되는 데 소요되는 기간을 9일이라고 하면 9는 , , , , 의 값
을 취하는 이산확률변수이고, 그에 대응하는 상품의 수의 상대도수를 확률로 생각할
수 있으므로 확률변수 9의 확률분포를 표로 나타내면 다음과 같다.

9      합계

1 9Y oz coz ioz zz  

이로부터 위에서 구한 상품이 배송되는 데 소요되는 기간의 평균은 확률변수 9가


취하는 각각의 값 Y와 그에 대응하는 확률 1 9Y 를 곱하여 더한 것과 같음을 알
수 있다.

1. 확률분포│ 87
일반적으로 이산확률변수 9의 확률분포가 다음 표와 같을 때

Q Q Q U QO 9 Y Y Y U YO 합계
1 9YJ Q Q Q U QO 

Y Q Y Q Y Q AUA YO QO
& 9 의 &는 기대를 뜻 을 이산확률변수 9의 기댓값 또는 평균이라고 하고, 이것을 기호로
하는 영어 단어
FYQFDUBUJPO의 첫 문자
& 9 또는 N
이고, N은 평균을 뜻하는
과 같이 나타낸다.
영어 단어 NFBO의 첫 문
자이다.

중학교에서는 변량이 평균을 중심으로 흩어져 있는 정도를 나타내는 산포도로서 분산


과 표준편차를 생각하였다. 마찬가지로 확률분포에서도 확률변수의 분산과 표준편차
를 생각할 수 있다.

이산확률변수 9의 기댓값 & 9 를 N이라고 하면 편차 9N의 제곱의 평균, 즉



& 9N  YN Q YN Q YN Q AUA A
YON QO
7 9 의 7는 분산을 뜻 을 이산확률변수 9의 분산이라고 하고, 이것을 기호로
하는 영어 단어 WBSJBODF
의 첫 문자이다. 7 9
와 같이 나타낸다.
N 9 의 N는 표준편차를 또, 분산의 양의 제곱근 7 9 를 9의 표준편차라고 하고, 이것을 기호로
뜻하는 영어 단어
TUBOEBSE EFWJBUJPO의
N 9
첫 문자 T에 해당하는 그리
와 같이 나타낸다.
스 문자이다.
즉, N 9 Ã7 9 이다.

위의 내용을 정리하면 다음과 같다.

이산확률변수 9의 기댓값(평균), 분산, 표준편차


이산확률변수 9의 확률질량함수가
1 9YJ QJ J, , , U, O
일때
1. 기댓값 평균 & 9 Y Q Y Q Y Q U YO QON
2. 분산 7 9 & 9N


 YN Q YN Q YN Q U YON QO


3. 표준편차 N 9 7 9

88 │Ⅲ. 통계
보기 이산확률변수 9의 확률분포가 오 9     합계
Q 기댓값과 평균은
어떻게 다를까요? 른쪽 표와 같을 때,
1 9Y  i d c 
A 평균은 변량의 총합 기댓값 평균 & 9 , 분산 7 9 ,
을 변량의 개수로 나 표준편차 N 9 는 각각 다음과 같다.
누어 구하고, 기댓값
은 확률변수와 그 확 & 9 @ @i @d @c
률변수의 확률을 곱
한 총합으로 구합니 7 9   @  @i  @d  @c
다. 구하는 방식의 차 N 9 7 9 
이가 있을 뿐 기댓값
과 평균은 의미가 같
습니다.

문제
1 이산확률변수 9의 확률분포가 다음 표와 같을 때, 9의 평균, 분산, 표준편차를 각각 구하
시오.

9     합계

1 9Y  i d Å 

이산확률변수 9의 분산 7 9 는
Q Q Q AUA QO
Y Q Y Q Y Q AUA YO QON
임을 이용하여 다음과 같이 구할 수도 있다.

7 9  YN Q YN Q AUA YON QO


 YYN N Q YYN N Q AUA
YOYON N QO
 YQ YQ AUA YOQO N Y Q Y Q AUA YO QO
N Q Q AUA QO
 
 YQ YQ AUA YOQO N@N N@

 YQ YQ AUA YOQO N
& 9 \& 9 ^

따라서 9의 분산을 다음과 같이 구하면 편리하다.

7 9 & 9 \& 9 ^

1. 확률분포│ 89
예제
인테리어 디자이너는 공간의 구조, 가구의 배치, 색상 등
1 을 계획하고 가구와 조명 등을 구체적으로 선정하는 일을
한다. 어떤 인테리어 디자이너가 같은 색과 밝기의 " 회
사 전구 개와 # 회사 전구 개 중에서 임의로 개를 선
택하여 공간 디자인을 하려고 한다. 선택된 전구 중에서
" 회사 전구의 개수를 확률변수 9라고 할 때, 9의 분산
과 표준편차를 각각 구하시오.

풀이 확률변수 9가 취하는 값은 , , 이므로 각각의 확률은


$@$
1 9      d
$

$@$
1 9  
$

$@$
1 9      
$

즉, 확률변수 9의 확률분포를 표로 나타내면 다음과 같다.

9    합계

1 9Y d   

확률변수 9의 평균은

& 9 @d @ @

따라서 9의 분산과 표준편차는 각각


7 9 & 9 \& 9 ^

@d @ @[]

Å>y

N 9 m‡y

7 9 y, N 9 

문제
2 파란 구슬 개, 노란 구슬 개가 들어 있는 주머니에서 임의

로 개의 구슬을 동시에 꺼낸다고 한다. 꺼낸 구슬 중에서 파
란 구슬의 개수를 확률변수 9라고 할 때, 9의 분산과 표준

편차를 각각 구하시오.

90 │Ⅲ. 통계
개념 2 ⪼෇ᄧᙿB9 Cᮿ⠰ɇţ⣃ᵧ⠟₏‫ۻ‬ᨛਢóǓ⧇ʳ"

확률변수 9의 확률분포가 다음 표와 같을 때, 일차식 :B9 C B, C는 상수, B 


로 정해지는 확률변수 :의 평균, 분산, 표준편차를 알아보자.

9 Y Y Y U YO 합계
1 9YJ Q Q Q U QO 

ZJBYJ C라고 하면 1 :ZJ 1 9YJ QJ J, , , U, O 이므로 확률


변수 :의 확률분포는 다음 표와 같다.

: Z Z Z U ZO 합계
1 :ZJ Q Q Q U QO 

따라서 확률변수 :의 평균, 분산, 표준편차는 각각 다음과 같다.


& : & B9 C
 BY C Q BY C Q AUA BYO C QO
& 9 B Y Q Y Q AUA YO Q O C Q Q AUA QO
Y Q Y Q U YO QO
Q Q U QO
B & 9 C
여기서 & 9 N, & : .으로 놓으면 .BN C이므로
7 : 7 B9 C
 Z. Q Z. Q AUA ZO. QO
\ BY C  BN C ^Q \ BY C  BN C ^Q AUA
\ BYO C  BN C ^QO
B\ YN Q YN Q AUA YON QO^
B 7 9
N : Ã7 : nB 7n 9
]B]N 9
이다.

위의 내용을 정리하면 다음과 같다.

이산확률변수 B9 C의 평균, 분산, 표준편차


이산확률변수 9와 상수 B B  , C에 대하여
1. 평균 & B9 C B & 9 C
2. 분산 7 B9 C B 7 9


3. 표준편차 N B9 C ]B]N 9

1. 확률분포│ 91
보기 확률변수 9의 & 9 , 7 9 일 때, 확률변수 :9 의 평균, 분산, 표준편
차는 각각 다음과 같다.
& : & 9  & 9   @ 
 
7 : 7 9    7 9   @
N : N 9  ]]N 9 @

문제
3 확률변수 9의 평균이 , 분산이 일 때, 확률변수 :9 의 평균, 분산, 표준편차
를 각각 구하시오.

예제
한 개의 동전을 두 번 던져서 앞면이 나오는 횟수를 확률변수 9라고 할 때, 확률변수
2 :9 의 평균과 분산을 각각 구하시오.

풀이 확률변수 9의 확률분포를 표로 나타내면 다음과 같다.

9    합계

1 9Y Å Å Å 

확률변수 9의 평균과 분산은 각각

& 9 @Å @Å @Å



7 9 & 9 \& 9 ^

@Å @Å @ÅÅ

따라서 확률변수 :의 평균과 분산은 각각


& : & 9  & 9 
7 : 7 9  7 9 
& : , 7 : 

문제
4 주사위를 한 번 던져서 나오는 눈의 수를 확률변수 9라고 할 때, 확률변수 :9의 평
균과 분산을 각각 구하시오.

92 │Ⅲ. 통계
이항분포
학습 목표 •이항분포의 뜻을 알고, 평균과 표준편차를 구할 수 있다.

개념 1 ᯛ⧔ᇫ⡓௧ྛᨮᯣʳ"

생각 열기

어느 천문대에서 음력 일에 보름달을 관측할 확률은 이다. 이 천문대에서는 이번 달부터 매

월 음력 일에 연속 회에 걸쳐 보름달 관측을 시도하려고 한다. 이 회의 시도에서 보름달을


관찰하는 횟수를 9라고 할 때, 9의 확률분포를 다음 표에 나타내 보자.

9     합계
 
1 9Y  $@[] @[Å] 

위의 생각 열기와 같이 각 시행의 결과가 그 다음 시행의 결과에 아무런 영향을 주지


않는 독립시행에서 일어나는 사건의 확률분포에 대하여 생각해 보자.

회의 시행에서 사건 "가 일어나는 확률을 Q, 일어나지 않을 확률을 R Q 라


고 하고, O회의 독립시행에서 사건 "가 일어나는 횟수를 9라고 하면 9는 , , ,
U, O의 값을 가지는 확률변수이고, 9의 확률질량함수는
Y, YO일 때, 1 9Y O$YQYROY Y, , , U, O
Q, R로 계산한다.
이다.
따라서 확률변수 9의 확률분포를 표로 나타내면 다음과 같다.

9    U O 합계
O  O  O O
1 9Y O $R $Q R
O $Q R
O U O $OQ 

Q R이므로 위 표의 각 확률은 이항정리에서 Q R O을 전개한 다음 식의 각 항과 같다.


O  O
O$ R O$ Q R U
O$OQO Q R OO$RO O $QRO $QRO
O AUA $OQO
O

1. 확률분포│ 93
# O, Q 의 #는 이항분포 이와 같은 이산확률변수 9의 확률분포를 이항분포라고 하고, 이것을 기호로
를 뜻하는 영어 단어
CJOPNJBM EJTUSJCVUJPO # O, Q
의 첫 문자이다.
와 같이 나타낸다.
즉, 이산확률변수 9는 이항분포 # O, Q 를 따른다고 한다.
여기서 O은 시행 횟수이고, Q는 회의 시행에서 사건 "가 일어날 확률이다.

보기 주사위 한 개를 번 던질 때, 의 눈이 나오는 횟수를 확률변수 9라고 하면, 회의 시행

에서 의 눈이 나올 확률은 Å이므로 9는 이항분포 #[, Å]을 따른다.

예제
어느 야구 선수가 타석에서 안타를 칠 확률이 라고
라고
1 한다. 이 선수가 타석에 번 들어서서 안타를 번 이상
칠 확률을 구하시오.

풀이 각 타석에서 안타를 칠 확률은 !이고, 번의 타석에서 안타를 치는 횟수를 확률변수 9라

고 하면 9는 이항분포 #[, !]를 따른다.

따라서 구하는 확률은


   1 9y 1 9 1 9
  
 
$ [!] [] $ [!]

ÅÅ!

ÅÅ!

문제
1 에서 까지의 자연수가 각각 하나씩 적힌 여섯 장의 카드에서 임의로 한 장의 카드를 뽑아
적힌 수를 확인하고 다시 넣는 시행을 번 반복할 때, 의 약수가 적힌 카드를 번 이하로 뽑
을 확률을 구하시오.

94 │Ⅲ. 통계
개념 2 ᯛ⧔ᇫ⡓ᮿ⠰ɇţ⣃ᵧ⠟₏‫ۻ‬ᨛਢóǓ⧇ʳ"

확률변수 9가 이항분포 # O, Q 를 따를 때, 9의 평균과 표준편차를 구해 보자.

예를 들어 어떤 확률변수 9가 이항분포 # , Q 를 따를 때, 확률변수 9의 확률분


포를 표로 나타내면 다음과 같다. 단, RQ

9     합계
     
1 9Y $R
  $Q R $Q R  $Q 

여기서 9의 평균과 분산을 구하면 각각 다음과 같다.


& 9 @$R @$QR @$QR @$Q
@R @QR @QR @Q
 
Q Q R
Q
7 9 & 9 \& 9 ^
 @R @QR @QR @Q  Q 

 
Q Q R Q R  Q
QR

일반적으로 이항분포 # O, Q 를 따르는 확률변수 9의 평균, 분산, 표준편차는 각


각 다음과 같다.

이항분포의 평균, 분산, 표준편차

확률변수 9가 이항분포 # O, Q 를 따를 때 단, RQ


1. 평균 & 9 OQ
2. 분산 7 9 OQR
3. 표준편차 N 9 OQR

보기 확률변수 9가 이항분포 #[, Å]을 따를 때, 9의 평균, 분산, 표준편차는 각각 다음과

같다.
    & 9 @Å

    7 9 @Å@go


    N 9 m‡‡@Ň@


1. 확률분포│ 95
문제
2 확률변수 9가 이항분포 #[, Å]을 따를 때, 9의 평균, 분산, 표준편차를 각각 구하시오.

예제
어느 가마에서 구워진 도자기 컵의 불량률은  
2 라고 한다. 이 가마에 개의 도자기 컵을 넣고 구웠
을 때, 불량품의 개수를 확률변수 9라고 하자. 이때
9의 평균, 분산, 표준편차를 각각 구하시오.

풀이 이 가마에서 구워진 도자기 컵이 불량품일 확률은 이고, 개의 도자기 컵 중 불량품

의 개수를 확률변수 9라고 하면 9는 이항분포 #[, ]을 따른다.

따라서 확률변수 9의 평균, 분산, 표준편차는 각각

& 9 @

7 9 @@y

N 9 m‡@‡‡@y

& 9 , 7 9 , N 9 

문제
3 어떤 질병에 대한 완치율이  인 신약을 해당 질병을 가진 환자 명에게 투약하였을
때, 완치되는 환자의 수를 확률변수 9라고 하자. 이때 9의 평균, 분산, 표준편차를 각각 구
하시오.

생각과 표현 문제 해결 추론 창의・융합 의사소통

어느 문화 센터에서 청소년 마술 공연을 기획하고 있다. 이 공연장은


전체 객석의 수보다 많은 관람객이 올 경우 보조 의자를 준비한다고 օẀ‫⼝ۀ‬ᷘ
한다. 오른쪽 공연 기획안을 보고 물음에 답해 보자.
ęₔ╄ҭ᦭᦭
1 예약자 중 실제 공연에 온 관람객의 수를 확률변수 9라고 할 때, ęẘḍ†ጕ
9의 평균과 분산을 각각 구해 보자. ęẘḍ†ҐօẀṠ
Ẽ⻥ᇰ 
2 보조 의자를 준비해야 할 확률을 계산기 또는 컴퓨터 프로그램을
사용하여 소수 넷째 자리까지 구해 보자.

96 │Ⅲ. 통계
개념 3 ⓗᙿᮿჼ⋀ᯛ௧ྛᨮᯣʳ"

한 개의 주사위를 O회 던지는 시행에서 의 눈이 나오는 횟수를 확률변수 9라고

할 때, 9가 이항분포 #[O, Å]을 따른다는 사실을 이용하여 O이 커짐에 따라 의 눈

9
이 나오는 횟수의 상대도수 O 와 수학적 확률 Å 사이의 관계를 알아보자.

O, , 일 때, 이항분포 #[O, Å]에서의 확률

Y OY
1 9Y O$Y[Å] [] Y, , , U, O

을 표와 그래프로 나타내면 각각 다음과 같다.

이항분포 #[O Å]의 표와 그래프

9
위의 표를 이용하여 O, , 일 때, 상대도수 O 와 수학적 확률 Å의 차가 

9
보다 작을 확률 1[\ O Å\]을 구해 보자.

9  Œ O일 때
\  \
O 
11 9
 9   1[\  Å\]1[!9] 
   
 O  
11 1 9 1 9
O O
9
  

 




1. 확률분포│ 97
 O일 때
9
1[\  Å\]1 9

1 9 1 9 AUA 1 9







 

 AUA 




Ž O일 때
9
1[\  Å\]1[z9cz]

1 9 1 9 AUA 1 9






  


   AUA 


  


9
이로부터 상대도수 O 와 수학적 확률 Å의 차가 보다 작을 확률

9
1[\ O Å\]은 O이 커짐에 따라 에 가까워짐을 알 수 있다. 이 결과는 을

, , U과 같이 임의의 작은 양수로 바꾸어도 성립한다.


9
이는 주사위를 던지는 횟수 O이 커짐에 따라 의 눈이 나오는 상대도수 O 는 수학

적 확률 Q에 가까워지는 경향이 있음을 의미한다.

9
이와 같이 상대도수 O 와 수학적 확률 Q 사이에는 다음과 같은 성질이 성립하며,

이를 큰수의 법칙이라고 한다.

큰수의 법칙

어떤 시행에서 사건 "가 일어날 수학적 확률이 Q일 때, O회의 독립시행에서 사건 "


가 일어나는 횟수를 9라고 하면, 아무리 작은 임의의 양수 I를 택하여도 O이 커짐에
9
따라 확률 1[\ Q\I]는 에 가까워진다.
O

9
큰수의 법칙에 따르면 시행 횟수 O을 충분히 크게 하면 상대도수 O 는 수학적 확률

에 가까워지는 경향이 있으므로 수학적 확률을 모를 때에는 시행 횟수를 충분히 크게


9
하여 얻은 사건 "의 상대도수 O 를 사건 "가 일어날 확률 1 " 로 사용할 수 있다.

그러므로 자연 현상이나 사회 현상에서 수학적 확률을 구하기가 곤란한 경우에는 통


계적 확률을 대신 사용할 수 있다.

98 │Ⅲ. 통계
정규분포
학습 목표 •정규분포의 뜻을 알고, 그 성질을 이해한다.

개념 1 ᱼɃᇫ⡓௧ྛᨮᯣʳ"

생각 열기

다음은 어느 남자 고등학교 학생 명을 대상으로 키를 조사하여 상대도수를 히스토그램으로


나타낸 것이다. 계급의 크기가 ADN, ADN, ADN인 히스토그램이 각각 다음과 같을 때, 계급
의 크기를 계속하여 작게 하면 히스토그램의 모양은 어떻게 변할지 생각해 보자.
상(대도수

상(대도수

상(대도수
  
  
  
)

  


  
  

      DN       DN       DN
계급의 크기가 ADN일 때 계급의 크기가 ADN일 때 계급의 크기가 ADN일 때

강수량이나 키, 전자 제품의 수명처럼 자연 현상이


나 사회 현상에서 얻을 수 있는 여러 가지 통계 자료의
개수가 충분히 클 때, 상대도수를 계급의 크기를 작게
하여 히스토그램으로 나타내면 오른쪽 그림과 같이 좌우
대칭인 종 모양의 곡선에 가까워지는 경우가 많다.

 YN ™

일반적으로 실수 전체의 집합에서 정의된 연속확률 G Y F‘ N™


LN
변수 9의 확률밀도함수가

 
YN
G Y  F N
LN
N Y
일 때, 9의 확률분포를 정규분포라고 한다. 여기서 N과 N N 는 각각 연속확률변수
9의 평균과 표준편차를 나타내는 상수이고, F는 값이 U인 무리수이다.

1. 확률분포│ 99
/ N, N  의 /은 정규 이와 같이 평균이 N이고 표준편차가 N, 즉 분산이 N인 정규분포를 기호로
분포를 뜻하는 영어 단어
OPSNBMEJTUSJCVUJPO의 / N, N
첫 문자이다.
과 같이 나타내고, 연속확률변수 9는 정규분포 / N, N 을 따른다고 한다.

보기 연속확률변수 9가 평균이 이고 표준편차가 인 정규분포를 따르면 기호로 / ,  과 같이


나타낸다.

정규분포 / N, N 을 따르는 확률변수 9의 확률밀도함수의 그래프는 평균 N과


표준편차 N의 값에 따라 그 모양이 다음과 같이 달라진다.
G Y G Y
N
N
N
N N
N
N  N
N
N 
N
N

N
N

0 Y 0   Y

N이고, N의 값이 변할 때 N이고, N의 값이 변할 때

일반적으로 정규분포 / N, N 을 따르는 확률변수 9의 확률밀도함수의 그래프는


다음과 같은 성질이 있다.

종 모양의 곡선의 특징은


1. 직선 YN에 대하여 대칭인 종 모양의 곡선이다.
좌우 대칭이며 중앙이 가장

높고 가장자리로 갈수록 2. YN일 때 최댓값은 LN 이다.
곡선을 이루며 낮아진다.
3. Y축을 점근선으로 한다.
4. 곡선과 Y축 사이의 넓이는 이다.
5. N의 값이 일정할 때, N의 값이 커지면 곡선의 중앙 부분이 낮아지면서 옆으로 퍼
지고, N의 값이 작아지면 곡선의 중앙 부분이 높아진다.
6. N의 값이 일정할 때, N의 값이 변하면 대칭축의 위치는 변하지만 곡선의 모양은
변하지 않는다.

문제
1 오른쪽 그림에서 곡선 ", #는 각각 정규분포 / N", N" ,
/ N#, N# 을 따르는 확률변수 9", 9#의 확률밀도함수
의 그래프이다. 다음의 대소를 비교하시오. " #
Y
⑴ N", N#
⑵ N", N#

100 │Ⅲ. 통계
개념 2 ⣃ᵧᱼɃᇫ⡓௧ྛᨮᯣʳ"

평균이 , 표준편차가 인 정규분포를 표준정규분포라고 하고, 기호로 / ,  과


표준정규분포를 따르는 확
률밀도함수 G [ 는 정규분 같이 나타낸다. 표준정규분포 / ,  을 따르는 확률변수 ;의 확률밀도함수는
포의 확률밀도함수 G Y 에
N, N을 대입한 것  [ 

G [  F 
이다. L G [
이며, 확률변수 ;가 ƒ;ƒ[인 범위에 있을  [™
G [ F‘ 
L 1 ƒ;ƒ[
확률 1 ƒ;ƒ[ 는 오른쪽 그림에서 색칠한
부분의 넓이와 같다. 이 넓이는 쪽의 표준정
0 [r[ [
규분포표에 주어져 있다.
예를 들어 오른쪽 표준정규분포표에서 [  …  …


1 ƒ;ƒ 
 
이다.


참고 확률밀도함수 G [ 의 그래프는 직선 [에 대하여 좌우 대칭이므로 1 ;y 1 ;ƒ 
이고 1 ƒ;ƒB 1 Bƒ;ƒ 이다. (단, B)

예제
확률변수 ;가 표준정규분포 / ,  을 따를 때, 표준정규분포표를 이용하여 다음
1 확률을 구하시오.

⑴ 1 ;ƒ ⑵ 1 ƒ;ƒ

풀이 ⑴ 표준정규분포표에서 1 ƒ;ƒ 이므로 G [


1 ;ƒ 1 ;ƒ 1 ƒ;ƒ
 
0  [

⑵ 표준정규분포표에서 1 ƒ;ƒ , G [


1 ƒ;ƒ 이므로
1 ƒ;ƒ
1 ƒ;ƒ 1 ƒ;ƒ  0  [

1 ƒ;ƒ 1 ƒ;ƒ
  ⑴  ⑵ 

문제
2 확률변수 ;가 표준정규분포 / ,  을 따를 때, 표준정규분포표를 이용하여 다음 확률을 구
하시오.

⑴ 1 ;ƒ. ⑵ 1 ];]ƒ.

1. 확률분포│ 101
개념 3 ᱼɃᇫ⡓ᪧ⣃ᵧᱼɃᇫ⡓‫ۻ‬ᨛ਋ŧīgᯯ᮫ʳ"

이제 정규분포와 표준정규분포의 관계를 알아보자.

9가 이산확률변수일 때, 확률변수 :B9 C B, C는 상수, B  에 대하여



& : B& 9 C, 7 : B 7 9
가 성립함을 알고 있다.
이와 마찬가지로 9가 연속확률변수일 때, 확률변수 :B9 C B, C는 상수, B 
에 대하여 다음이 성립한다.
& : B& 9 C, 7 : B 7 9

9N
이것을 이용하여 정규분포 / N, N 을 따르는 확률변수 9에 대하여 ;
N
이라고 하면 확률변수 ;의 평균과 분산은 각각 다음과 같다.
9N
& 9 N, 7 9 N & ; &[ ]
N
 N
 & 9  
N N
9N
7 ; 7[ ]
N

 7 9 
N
9N
이처럼 정규분포 / N, N 을 따르는 확률변수 9를 확률변수 ; 으로 나
N
타내면 ;는 표준정규분포 / ,  을 따른다. 즉, 정규분포 / N, N 을 따르는 확
9N
률변수 9의 확률을 확률변수 ; 의 확률을 이용하여 구할 수 있다.
N

정규분포 / N, N 을 따르 한편, 확률변수 9가 정규분포 / N, N 을 따를 때


는 확률변수 9와 확률변수
9N BN 9N CN
; 의 관계를 이용 1 Bƒ9ƒC 1[ ƒ ƒ ] 
N N N N
하면 표준정규분포로부터
BN CN
9의 확률을 구할 수 있다. 1[ ƒ;ƒ ]
N N
이므로 표준정규분포표를 이용하여 확률 1 Bƒ9ƒC 를 구할 수 있다.

B C Y BN CN [
N N

102 │Ⅲ. 통계
앞의 내용을 정리하면 다음과 같다.

정규분포와 표준정규분포의 관계

확률변수 9가 정규분포 / N, N 을 따를 때
9N
1. 확률변수 ; N
은 표준정규분포 / ,  을 따른다.
BN CN
2. 1 Bƒ9ƒC 1[ N ƒ;ƒ N ]

예제
확률변수 9가 정규분포 / ,  을 따를 때, 표준정규분포표를 이용하여 확률
2 1 ƒ9ƒ 을 구하시오.

9
풀이 확률변수 9가 정규분포 / ,  을 따르므로 확률변수 ; 은 표준정규분포

/ ,  을 따른다.
따라서 구하는 확률은
 9 
1 ƒ9ƒ 1[ ƒ ƒ ] G [
  
1 ƒ;ƒ
1 ƒ;ƒ 1 ƒ;ƒ
1 ƒ;ƒ 1 ƒ;ƒ  0  [

 



문제
3 확률변수 9가 정규분포 / ,  을 따를 때, 표준정규분포표를 이용하여 다음 확률을 구하
시오.

⑴ 1 9ƒ ⑵ 1 ƒ9ƒ

1. 확률분포│ 103
예제
어느 제약 회사에서 만드는 원 모양의 알약은 지름의 길이가 평균이  NN, 표준편
3 차가  NN인 정규분포를 따른다고 한다. 이 알약 개 중에서 지름의 길이가
 NN 이상  NN 이하인 것은 몇 개인지 표준정규분포표를 이용하여 구하시오.

풀이 원 모양의 알약에서 지름의 길이를 확률변수 9라고 하면 9는 정규분포 / ,  을


9
따르므로 확률변수 ; 은 표준정규분포 / ,  을 따른다.

즉, 지름의 길이가  NN 이상  NN 이하일 확률은 G [
 9 
1 ƒ9ƒ 1[ ƒ ƒ ] 
  
1 ƒ;ƒ
 0  [
1 ƒ;ƒ 1 ƒ;ƒ
1 ƒ;ƒ 1 ƒ;ƒ
 
따라서 알약 개 중에서 지름의 길이가  NN 이상  NN 이하인 것은
@ 개 이다.
개

문제
4 어느 회사가 자사의 스마트폰을 사용하는 소비자를 대상으로 스마트폰을 구입한 후 교체하기
까지의 기간을 조사하였다. 이 조사 결과 스마트폰을 구입한 후 교체하기까지의 기간은 평균
이 개월, 표준편차가 개월인 정규분포를 따르는 것으로 나타났을 때, 이 회사의 스마트폰
을 구입한 후 년에서 년 사이에 교체할 확률을 표준정규분포표를 이용하여 구하시오.

생각과 표현 문제 해결 추론 창의・융합 의사소통

어떤 평가에서 "과목의 평가 점수는 평균이 점, 표준편차가 점인 정규분포를 따르고, #과목의 평가 점
수는 평균이 점, 표준편차가 점인 정규분포를 따른다고 한다. 다음 대화를 보고 소영이와 지훈이 중에서
어느 학생의 평가 점수가 더 좋다고 할 수 있는지 이야기해 보자.

나는 이번 평가 그래? 나는 # 과목
에서 " 과목 점수가 점수가 점인데!
점이야.

104 │Ⅲ. 통계
개념 4 ᯛ⧔ᇫ⡓ᪧᱼɃᇫ⡓ᔓᯛᨷ‫ۻ‬ᨛ਋ŧīgᯯ᮫ʳ"

한 개의 주사위를 O번 던져서 의 눈이 나오는 횟수를 확률변수 9라고 하면 9는

이항분포 #[O, Å]을 따른다.

O, , , 일 때, 이항분포 #[O, Å]을 그래프로 나타내면 O이 커짐에 따

라 다음과 같이 정규분포 곡선에 가까워지는 것을 관찰할 수 있다.

일반적으로 확률변수 9가 이항분포 # O, Q 를 따르고 시행 횟수 O이 충분히 크면


9는 근사적으로 평균이 OQ이고, 분산이 OQR인 정규분포 / OQ, OQR 를 따른다는
사실이 알려져 있다. 단, RQ

위의 내용을 정리하면 다음과 같다.

이항분포 # O, Q 에서 이항분포와 정규분포 사이의 관계


OQy이고 ORy이면 O이
충분히 큰 것으로 생각한다. 확률변수 9가 이항분포 # O, Q 를 따르고 O이 충분히 크면 9는 근사적으로 정규분포
/ OQ, OQR 를 따른다. 단, RQ

이항분포에서 시행 횟수 O이 아주 큰 수이면 어떤 사건이 일어날 확률을 계산하기


가 쉽지 않다.
예를 들어 한 개의 주사위를 번 던지는 시행에서 의 눈이 나오는 횟수를 확률변수
9라고 하면 의 눈이 번 이상 번 이하가 나올 확률
   
$ [Å] []
1 ƒ9ƒ   $ [Å] [] AUA

 
 $ [Å] []

을 구하는 것은 쉽지 않다. 이와 같은 경우에는 이항분포와 정규분포 사이의 관계를


이용하여 이항분포의 확률을 근사적으로 계산할 수 있다.

1. 확률분포│ 105
보기 한 개의 주사위를 번 던질 때, 의 눈이 나오는 횟수를 확률변수 9라고 하면 9는 이항

분포 #[  Å]을 따른다. 이때 OQy이고 ORy이므로 O은 충분히

크다고 할 수 있다.
따라서 OQ, OQR이므로 9는 근사적으로 정규분포 / ,  을 따른다.

예제
어느 과수원에서 생산되는 멜론 통의
4 당도를 하나씩 조사하려고 한다. 이 과수원
브릭스 #SJY 는 당도를 에서 생산되는 멜론의  가 당도가 
나타내는 단위로, O브릭스
브릭스 #SJY 이상이라고 할 때, 통의
는 용액  H에 O H의 당
이 있음을 나타낸다. 멜론 중에 당도가 브릭스 #SJY 이상인
멜론이 통 이상일 확률을 표준정규분포
표를 이용하여 구하시오.

풀이 당도가 브릭스 이상인 멜론의 수를 확률변수 9라고 하면 9는 이항분포 #[, ]을

따르므로 확률변수 9의 평균과 분산은 각각

   & 9 @

   7 9 @@Å

이때 멜론의 수 은 충분히 크므로 확률변수 9는 근사적으로 정규분포 / ,  을


9
따르며, 확률변수 ; 은 표준정규분포 / ,  을 따른다.

따라서 구하는 확률은

   1 9y 1 [;y ]

1 ;y 1 ƒ;ƒ



문제
5 어느 날 한 영화관에서 관객이 " 영화를 관람할
확률은  였다고 한다. 이날 이 영화관에서
영화를 관람한 관객 명을 임의로 뽑아 조사
하였을 때, " 영화를 관람한 사람이 명 이상
이었을 확률을 표준정규분포표를 이용하여 구하
시오.

106 │Ⅲ. 통계
공학 도구 개념 탐구
수학
들여다 하 중 상
보기 ᯛ⧔ᇫ⡓ᪧᱼɃᇫ⡓ᔓᯛᮿŧī 난이도

이항분포 # O, Q 와 정규분포 / OQ, OQR 사이의 관계를 컴퓨터 프로그램을 사용하여


알아보자.

활동 확률변수 9가 이항분포 # ,  를 따를 때, 이항분포 # O, Q 와 정규분포


/ OQ, OQR 로 구한 확률을 비교해 보자.

❶ 입력 창에 ‘n’, ‘p’, ‘a’, ‘b’를 입력하여 슬라 ❷ 입력 창에 ‘이항분포[n, p]’를 입력하여 이항


이더 n, p, a, b를 만든다. 이때 n, 분포 # O, Q 를 그래프로 나타낸다.
p, a, b으로 슬라이더를
조절한다.

입력: 입력: 이항분포[n, p]

❸ 입력 창에 ‘정규분포[n p, sqrt(n p (p)), x]’ ❹ 입력 창에 ‘합[수열[조합[n, k] p^k (p)^


를 입력하여 정규분포 / OQ, OQR 를 그래 (nk), k, a, b]]’를 입력하여 이항분포로 확
프로 나타낸다. 률을 구한다. 이 값은 1 ƒ9ƒ 을
이항분포로 구한 값이다.

이항분포로 구한 확률 p1=P(a≤X≤b)=0.2767

입력: 정규분포[n p, sqrt(n p (1-p)), x] 입력: 합[수열[조합[n, k] p^k (1-p)^(n-k), k, a, b]]

❺ 입력 창에 ‘적분[f, a, b]’를 입력하여 정규분포 ❻ 슬라이더에서 a, b의 값을 변화시키면서


로 확률을 구한다. 이 값은 1 ƒ9ƒ ❹, ❺의 값을 비교하면 이항분포와 정규분포
을 정규분포로 구한 값이다. 사이의 관계를 확인할 수 있다.

이항분포로 구한 확률 p1=P(a≤X≤b)=0.2767 이항분포로 구한 확률 p1=P(a≤X≤b)=0.979


정규분포로 구한 확률 p2=P(a≤X≤b)=0.2525 정규분포로 구한 확률 p2=P(a≤X≤b)=0.9772

입력: 적분[f, a, b] 입력:

1. 확률분포│ 107
자신감을
확률분포
키우는

바탕 다지기
1 이산확률변수와 연속확률변수
⑴ 확률변수 9가 취하는 값이 유한개이거나 자연수 01 이산확률변수 9의 확률분포가 다음 표와 같을

처럼 셀 수 있을 때, 확률변수 9를 이산확률변수 때, 상수 B의 값과 9의 평균, 분산을 각각 구하

라고 한다. 시오.

⑵ 확률변수 9가 취하는 값이 어떤 범위에 속하는 모든 9     합계

실수의 값일 때, 확률변수 9를 연속확률변수라고 1 9Y Å Å B Å 


한다.

2 이산확률변수의 평균, 분산, 표준편차


⑴ 이산확률변수 9의 확률질량함수가
1 9YJ QJ J, , , U, O 일 때, 기댓값
(평균), 분산, 표준편차는
① & 9 Y Q Y Q Y Q U YO QON
02 연속확률변수 9가 취하는 값의 범위가
ƒ9ƒ이고, 확률변수 9의 확률밀도함수가
  
② 7 9 & 9N & 9 \& 9 ^
G Y Å Y  일 때, 확률 1 ƒ9ƒ 을
③ N 9 Ã7 9
⑵ 이산확률변수 B9 C B, C는 상수, B  의 평균, 구하시오.

분산, 표준편차는
① & B9 C B & 9 C

② 7 B9 C B 7 9
③ N B9 C ]B]N 9

3 이항분포의 평균, 분산, 표준편차


03 확률변수 9가 다음 이항분포를 따를 때, 9의
평균, 분산, 표준편차를 각각 구하시오.
확률변수 9가 이항분포 # O, Q 를 따를 때, 9의
평균, 분산, 표준편차는 단, RQ ⑴ A#[, Å]
⑴ & 9 OQ
⑵ A#[, Å]
⑵ 7 9 OQR
⑶ N 9 OQR

4 정규분포
⑴ 확률변수 9가 정규분포 / N, N 을 따를 때, 확
9N 확률변수 9가 정규분포 / ,  을 따를 때,
률변수 ;
N
은 표준정규분포 / ,  을 04
확률 1 9ƒ 을 구하시오. (단, ;가 표준정
따른다.
규분포를 따르는 확률변수일 때,
⑵ 확률변수 9가 이항분포 # O, Q 를 따르고 O이
1 ƒ;ƒ 이다.)
충분히 크면 9는 근사적으로 정규분포
/ OQ, OQR 를 따른다. 단, RQ

108 │Ⅲ. 통계
정답 및 해설 149쪽

05 확률변수 9가 이항분포 #[ ]를 따를 때,


08 확률변수 9에 대하여 & 9 , 7 9 일

확률 1 ƒ9ƒ 을 구하시오. (단, ;가 표준 때, & B9 C , 7 B9 C 을 만족시

정규분포를 따르는 확률변수일 때, 키는 상수 B, C의 값을 각각 구하시오. (단, B)

1 ƒ;ƒ ,
1 ƒ;ƒ 이다.)

09 확률변수 9가 이항분포 # O, Q 를 따르고


& 9 , & 9 일 때, O의 값을 구
하시오.

기본 익히기

06 다음은 이산확률변수 9의 확률분포를 나타낸


표이다. 9의 평균이 일 때, 상수 L의 값을 구 10 서로 다른 두 개의 주 [ 1 ƒ;ƒ[

하시오. (단, B는 상수) 사위를 동시에 번  

던질 때, 두 주사위의  


9 L L L 합계
눈의 수의 차가  이  
1 9Y B B B 
하인 사건의 횟수를  

확률변수 9라고 하자. 다음은 위의 표준정규분


포표를 이용하여 확률 1 9ƒ 을 구하는 과
정이다. 안에 알맞은 수를 써넣으시오.

한 번의 시행에서 두 주사위의 눈의 수의

차가  이하인 사건의 확률은 이다.

확률변수 9는 이항분포 #[ , ]를


07 , , , , 의 수가 각각 하나씩 적힌 개의 공
따르고 시행 횟수도 충분히 크므로 확률변수
이 들어 있는 주머니에서 임의로 한 개씩 공을
9는 근사적으로 정규분포 / ,
꺼낼 때, 이 적힌 공이 나올 때까지 꺼낸 공의
을 따른다.
개수를 확률변수 9라고 하자. 이때 9의 기댓
따라서 구하는 확률은
값을 구하시오.
1 9ƒ 1 ;ƒ 
(단, 꺼낸 공은 다시 주머니에 넣지 않는다.)

확인 학습 문제│ 109
자신감을
키우는 정답 및 해설 150쪽

확률변수 9가 정규분포 / N, N 을 따르고


11 14 원점 0를 출발하여 수직선 위를 움직이는 점 1
1 NNƒ9ƒN N B 가 있다. 한 개의 동전을 던져서 앞면이 나오면
9N 양의 방향으로 만큼, 뒷면이 나오면 음의 방향
1[\ \y]C
N
으로 만큼 각각 이동한다. 한 개의 동전을 
라고 할 때, 확률 1 9yN N 를 B, C로 나타
회 던졌을 때, 점 1의 좌표를 확률변수 9라고
내시오.
하자. 이때 9의 평균을 구하시오.

12 어느 고등학교 학생 [ 1 ƒ;ƒ[
들이 하루에 한 번 이   생각
상 도서관을 방문할   톡!톡!

확률이  라고 한  

다. 이 학교 학생 중   15 어느 회사의 채용 시 [ 1 ƒ;ƒ[


험에 명이 응시하  
에서 임의로 명을 택할 때, 그중 하루에 한 번
였다. 응시자들의 성  
이상 도서관을 방문하는 학생이 명 이상일 확
적 분포는 평균이  
률을 위의 표준정규분포표를 이용하여 구하
점, 표준편차가 점인 정규분포를 따른다
시오.
고 한다. 시험 점수가 높은 순으로 명이 합격
한다고 할 때, 합격하려면 적어도 O점 이상이 되
어야 한다. 이를 만족시키는 최소의 자연수 O의
값을 위의 표준정규분포표를 이용하여 구해 보자.
(단, 시험 점수는 최소 점에서 최대 점 사
이의 자연수이다.)
실력 키우기
ῡ᭬†ጕ↡Ṡ᦬ጕ ⷹԹⷨᑐწᥑᾔ
13 양의 실수 B, C에 대하여 연속확률변수 9가 취
 ॄṠ᨝ⷨ‫ۀ‬ᾔⷬ₠᪨ሌ‫ⷨ׼‬ጄರԓ
하는 값의 범위는 Bƒ9ƒ이고, 확률변수
ҩᷔ
9의 확률밀도함수가
 C 
Y B BƒYƒ
B
G Y 9
[
 CY ƒYƒ

이다. 1 ƒ9ƒ 1 Bƒ9ƒ 일 때,


B, C의 값을 각각 구하시오.

110 │Ⅲ. 통계
●수학으로 보는 카드 뉴스 창의 융합

생각을 수학은 우리가 사는 사회를 보다 객관적, 합리적, 과학적인 방법으로


넓히는 이해하고 설명하는 근거를 제공한다. 다음은 어느 모둠에서 유전에 의한

수학 피부색의 발현이 정규분포를 이룬다는 수학적 사실을 통해 피부색에 대한


편견을 카드 뉴스 형태로 발표한 자료의 일부이다.

피부색으로 인종을 구별하는 것은 편견이다!


1/6 : 피부색을 희게 하는 유전자 2/6 3/6
: 피부색을 검게 하는 유전자

흰색 BBCCDD
DD 검은색 ""##$$

부모

자녀

‫݋‬᮳ᮧ ⦣ᇧᔰᨷŧᩓ⦿‫ ۻ‬᝴ᮿ‫ݧ‬ฤᮇᱫ᯷gᯯ ᷰ€ᮧᇧ༏ᨷóᖃ᭫ᪧ€ᮧᇫ⡓ᮿ


‫݋‬Ň⦿໛⦣ᇧᔰ᮫çóำृ‫ۻ‬ᮇᱫ᯷ ⦣ᇧᔰ᮫gḫ᯷֧g╃ᨛԇᙿᯯ‫ۻ‬ê
᝴࣌ᯛ⋃᯷๋ᯛ‫݋‬ ෣ ƒᇧ▗ ƒʳḧgḫ᯷֧g╃ᨛԇ ᯛ‫݋‬
ᙿᯯ‫݋‬

 4/6
1/6 5/6
2/6 6/6
3/6

 
 

 
 
 
 
       매우 흰 피부색 매우 검은 피부색

gӿ᪋‫ᙿ⬆ۻ‬෣⪼෇ᄧᙿ 9௣Ň⦿໛ ᝋᲃೃᔓ௳ᮿ⦣ᇧᔰᮧ᝴ᯛᔨᮿ‫ݧ‬ฤ ⦣ᇧᔰᨷগ௣


9‫ۻ‬ᯛ⧔ᇫ⡓ #[ Å]᮫গෟ‫݋‬ ᮇᱫ᯷ᨷᮿ⧛ėᱼࡿဧೃ ᝴ᮿ‫ݧ‬ฤᮇ
ᱫ᯷ᮿ gӿ᪋‫ᙿ⬆ۻ‬෣⪼෇ᄧᙿ9௣Ň
ᯟᳬ᮫Ǔᇫ⦿‫ۻ‬êᮧ
ţ⧀ᱨᯟƒַᯛᦫ‫ܯ‬௣
⦿໛ 9‫ۻ‬ᯛ⧔ᇫ⡓ #[ Å]᮫গෛŇ
ᔓ⫳ᱨ⠟ēᯛ‫݋‬
ɣᔓᱨᮣೃᱼɃᇫ⡓ /   ᮫গෟ‫݋‬

출처 sbs뉴스, 2017. 9. 4.
좋아요 댓글 달기 공유하기

탐구 우리 주변의 실생활 또는 과학이나 사회 현상에서 확률분포로 설명할 수 있는 내용을 모둠별로 찾아서


카드 뉴스로 만들어 발표해 보자.
어떤 학교의 한 학년의 키, 특정 개체군의 생존 곡선, 한 국가의 연령별 인구수

생각을 넓히는 수학│ 111


통계적 추정

통계는 현재를 분석하고 미래를 예측하는 데도 쓰이지만, 과거를 추측하는 데도 유용하다. 영국의 역사가들은 세기 사망자
통계표 #JMMT PG .PSUBMJUZ 를 이용하여 런던의 인구를 추산하기도 했다. 그 시초는 그론트 (SBVOU, +., _ 로

년의 런던의 총 사망자 수인 ,명을 런던 일부 지역의 사망률인 d으로 나누어 그 당시 런던의 인구를 약 ,명

이라고 추산하였다. 출처 Ross, S. M., Introduction to Probability and Statistics for Engineers and Scientists, 4th Edition

준비 학습

●확률분포 1 서로 다른 원짜리 동전 개를 동시에 던져서 앞면이 나오는 동전의 금액의 합을 확률변수
자신 있음
9라고 할 때, 물음에 답하시오.
복습 필요
⑴ 9의 확률분포를 표로 나타내시오.
⑵ 9의 평균, 분산, 표준편차를 각각 구하시오.

●정규분포 2 확률변수 9가 정규분포 / ,  을 따를 때, 표준정규분포표를 이용하여 다음 확률을 구


자신 있음
하시오.
복습 필요
⑴ 1 ƒ9ƒ ⑵ 1 9ƒ

112 │Ⅲ. 통계
모집단과 표본
학습 목표 •모집단과 표본의 뜻을 알고 표본 추출의 원리를 이해한다.

개념 1 ༏Ḹ‫ݏ‬ţ⣃ᅟᯛ௧ྛᨮᯣʳ"

생각 열기

다음은 사과 농장의 농부와 그의 자녀들이 사과의 당도를 조사


하는 방법에 대해 나눈 대화이다. 사과의 당도를 어떻게 조사하
면 좋을지 이야기해 보자.

당도가 어느 정도일까요?
올해는 강수량도 얼른 사과를 다 따서
적당하고 일조량도 조사해 봐요!
풍부해서 사과가
아주 달겠는걸. 수확이
기다려지는구나!
안돼! 사과를
다 따서 당도를
조사하면, 팔 사과가
하나도 남지 않잖아!
그러지 말고….

통계청에서는 우리나라 전체 인구의 동향을 파악하기 위해 매 년마다 우리나라에


거주하고 있는 모든 사람들을 대상으로 인구 주택 총조사를 실시하고 있다. 또한, 언
론사는 출구 조사를 통해 개표 전에 미리 선거의 당선자를 예측하기도 한다.
이와 같이 자료를 조사하고 수집한 뒤 정리한 결과를 분석하는 통계 조사의 과정을
통해 일상생활의 여러 문제에 대한 의사 결정을 할 수 있다.

통계 조사에서 조사의 대상이 되는 집단 전체를 모집단이라고 하고, 모집단 전체를


조사하는 것을 전수조사라고 한다.
인구 주택 총조사처럼 전수조사를 하면 자료의 특성을 정확히 알 수 있지만, 조사한
자료를 수집하고 분석하는 데에 많은 시간과 비용이 소요된다.

2. 통계적 추정│ 113


한편, 출구 조사, 여론 조사, 시청률 조사와 같
이 전수조사에 많은 시간과 비용이 소요되거나,
휴대 전화 배터리의 수명 조사, 제품의 내구성 조
사와 같이 검사를 받은 제품을 상품으로 다시 판
매할 수 없는 경우에는 전수조사가 불가능하다.
이 경우에는 모집단에서 일부분을 뽑아 분석하고
이를 바탕으로 조사의 대상이 되는 집단 전체의 성질을 추측하기도 한다.
이와 같이 통계 조사를 하기 위해 뽑은 모집단의 일부분을 표본이라고 하고, 표본에
포함된 대상의 개수를 표본의 크기, 모집단에서 표본을 뽑는 것을 추출이라고 한다.
또, 조사하려는 모집단에서 표본을 추출하여 그 자료의 성질을 조사하는 것을 표본조사
라고 하고, 표본조사의 결과로부터 자료 전체의 성질을 추측한다.

보기 통계청에서는 삶의 질과 관련된 국민의 사회적 관심사와 주관적 의식을 조사하기 위해 매년


사회 조사를 실시한다. 년 사회 조사는 약 가구의 만 세 이상 가구원을 선정하
여 실시하였으며, 이를 바탕으로 국민의 생활 수준을 파악하여 효율적인 정책 수립의 기초
자료로 활용한다. 이때 모집단은 조사 시점 기준 전국의 만 세 이상 모든 가구원이며, 표
본은 조사 대상으로 선정된 가구의 만 세 이상 가구원이다.

문제
1 다음을 조사할 때, 전수조사와 표본조사 중 어느 것이 더 적합한지 말하시오.

⑴ 병역 의무자의 징병 검사 ⑵ 자동차 충돌 안전성 조사


⑶ 한강의 수질 오염도 조사 ⑷ 수혈 및 헌혈 시 혈액형 조사

이야기 속 수학 빅데이터와 심야 버스 노선

정보 통신 기술의 발전으로 규모를 가늠할 수 없을 정도로 다양하고 방대한


양의 정보와 빅데이터가 생산되고 있다. 서울시의 심야 버스 노선 정책은 이러
한 빅데이터를 활용한 사례이다. 서울시는 휴대 전화 통신사의 전화 통화 정보
약 억 건과 서울시의 택시 이용 데이터 등을 연계하여 심야 시간대의 유동 인
구를 분석하였고, 이를 이용하여 시민들의 이동 경로를 고려한 심야 버스 노선
을 설정하고 배차 간격을 조정하였다. 이렇듯 빅데이터는 미래 경쟁력의 우위
를 좌우하는 중요한 자원으로 주목받고 있다. 출처 문화일보 , 2014. 6. 17.

114 │Ⅲ. 통계
개념 2 ⣃ᅟᮧᨛਢó⇻∃⧛᧣⧇ʳ"

표본조사의 목적은 모집단에서 추출한 표본을 바탕으로 모집단의 성질을 추측하는


것이므로 정확한 추측을 위해서는 모집단의 특성을 잘 대표할 수 있는 표본을 추출하
는 것이 중요하다. 표본이 모집단의 성질을 잘 나타내기 위해서는 통계 조사자의 편의
나 주관을 배제하고 모집단의 어느 한 부분에 편중되지 않도록 표본을 추출해야 한다.

문제
2 다음 표본조사에서 표본을 추출하는 방법의 문제점을 말하시오.

⑴ 만 세 이상 인구의 여가 생활을 조사하기 위해 각종 누리소통망[4/4]을 통해 조


사 대상자를 모집하였다.
⑵ 우리나라 청소년들의 평균 수면 시간을 조사하기 위해 전국의 고등학생들을 대상
으로 설문 조사를 실시하였다.
⑶ 어느 도시에서는 고등학생들의 양성평등 인식을 조사하기 위해 시내 여고생들의
응답을 모아 분석하였다.
⑷ 교통안전공단에서는 우리나라 국민의 대중교통 이용 실태를 조사하기 위해 서울
시민을 대상으로 설문 조사를 실시하였다.

표본을 추출할 때 통계 조사자의 주관을 배제하고 모집단의 각 대상이 같은 확률로


추출되도록 하는 것을 임의추출이라고 한다. 임의추출을 할 때에는 난수표, 제비뽑기,
난수 주사위, 공학용 계산기, 컴퓨터 프로그램, 모바일 응용프로그램 등을 활용할 수
있다.

컴퓨터의 스프레드시트 프로그램을 사용하여 어느 학급의 학생 명 중에서 명의


표본을 추출하는 방법을 알아보자.

❶ 학생들에게 부터 까지의 번호를 ❷ 메뉴에서 ‘데이터’–‘데이터 분석’을 선


하나씩 부여한 후, "열에 부터  택하면 화면에 ‘통계 데이터 분석’ 창이
까지의 수를 차례대로 입력한다. 나타난다. 이때 ‘표본 추출’을 선택한다.
통계 데이터 분석

2. 통계적 추정│ 115


❸ 입력 범위에 자료의 범위를 입력하고, ❹ 새로운 워크시트에서 임의추출한 개의
표본 추출 방법으로 ‘무작위 추출’, 표 표본을 확인할 수 있다.
본 수에 표본의 크기 를 입력한다.
표본 추출

문제
3 컴퓨터 프로그램을 사용하여 우리 반 학생들 중에서 크기가 인 표본을 임의추출해 보시오.

모집단에서 표본을 추출할 때, 한 번 뽑은 대상을 되돌려 놓은 후 다시 뽑는 것을 복


원추출이라고 하고, 되돌려 놓지 않고 계속 뽑는 것을 비복원추출이라고 한다. 복원추
출은 임의추출이며, 비복원추출은 임의추출이 아니지만 모집단의 크기가 충분히 큰
경우에는 비복원추출과 복원추출의 차이가 별로 없기 때문에 실제 조사에서는 비복원
추출로 표본을 추출하는 경우가 많다.

생각과 표현 문제 해결 추론 창의・융합 의사소통

찬열이와 지아의 대화를 참고로 하여 이 잡지사의 대통령 당선 예측이 빗나간 이유가 무엇인지 이야기해 보자.

년 미국 대통령 선거 당시 어느 잡지사는 잡지의 정기 구독자, 전


화 가입자, 자동차 등록 명부, 사교 클럽 인명부에서 뽑은 천만 명에
게 우편 설문지를 발송하여 어느 후보자를 지지하는지를 묻고 약 
만 명으로부터 응답을 받았다. 그 분석 결과를 토대로 공화당의 알프
레드 랜던의 지지율을 , 민주당의 프랭클린 루스벨트의 지지율을
로 추정하여 랜던이 대통령에 당선될 것이라고 예측하였다. 그러
나 실제 개표 결과는 와 로 루스벨트가 압도적인 지지를 받 출처 Squire, P., Why the 1936
으며 대통령에 당선되었고, 이 잡지사의 예측은 완전히 빗나갔다. Literary Digest Poll Failed

찬열 1936년 당시 잡지의 정기 구독자, 전화 가입자, 자동차 소유자, 사교 클럽 가입자는 어떤 사람들이었을까?

지아 선거 당시 루스벨트는 뉴딜 정책을 내세웠는데, 이 정책은 서민층의 두터운 지지를 받았대.

116 │Ⅲ. 통계
공학 도구 개념 탐구
수학
들여다 하 중 상
난이도
보기 ᳲᮧ⣃ᅟᯛ௧"

컴퓨터 프로그램을 사용하면 모집단에서 간단히 표본을 임의추출할 수 있다. 이때 임의추출


한 표본에 대해 알아보자.

컴퓨터 프로그램을 사용하여 어느 고등학교 학생 명의 앉




발 크기와 앉은키를 산점도로 나타내고, 크기가 인 표본을
임의추출하는 것을 반복하려고 한다. 이때 여러 번의 임의추
었다면
출에서 다음 그림과 같은 형태로 표본이 임의추출되었다면
발 크기
표본조사의 결과가 어떻게 될지 생각해 보자.

<그림 1> <그림 2> <그림 3> <그림 4>

임의추출은 통계 조사자의 주관을 배제하기 때문에 좋은 표본 추출 방법이야. 단지 무작위로 추출


되다 보니 임의추출로 뽑은 표본으로 조사를 진행하더라도 우리가 예측할 수 없는 오차가 생길 수
소미 있을 것 같아.

맞아. 임의추출로 얻은 대부분의 표본의 분포는 <그림 1 > 과 유사하게 나왔지만, 아주 가끔


<그림 2, 3, 4>와 같이 특정한 부분에서 표본이 추출되는 경우가 있었어. <그림 2, 3, 4> 와 같은 표본

으로 표본조사를 진행한다면 어떤 문제가 생길까? 민혁

이 고등학교 학생들의 발 크기와 앉은키는 넓게 고루 분포되어 있는 반면, <그림 2> 의 표본에서는 대


체적으로 앉은키가 작은 걸 관찰할 수 있어. 이 표본으로 표본조사를 진행한다면 학생들의 앉은키가
소미 실제보다 낮게 추측될 거야.

<그림 4>의 표본으로 표본조사를 진행해도 비슷한 이유로 발 크기가 실제보다 크게 추측될 거야.

민혁
<그림 3 > 의 표본은 대체로 발 크기와 앉은키 사이에 관계가 있어 보이는걸? 실제로 전체의
산점도에서 발 크기와 앉은키 사이에는 아무런 상관이 없어 보이는데 말이야.
소미

2. 통계적 추정│ 117


모평균과 표본평균
학습 목표 •모평균과 표본평균의 관계를 이해하고 설명할 수 있다.

개념 1 ༏⠰ɇţ⣃ᅟ⠰ɇᯛ௧ྛᨮᯣʳ"

생각 열기

자동차 운전면허 종 보통, 종 보통 시험의 응시 자격은 만 고객명 취득 나이 고객명 취득 나이


세 이상인 자로, 학과 시험, 기능 시험, 도로 주행 시험에 김◯◯  손◯◯ 
합격해야 면허증이 발급된다. 또한, 자동차를 소유한 운전자 이◯◯  장◯◯ 
라면 누구나 차량 사고 시 최소한의 피해자 보호를 위해 제정된 민◯◯  김◯◯ 
자동차손해배상보장법 에 의한 책임 보험에 의무적으로 가입 윤◯◯  이◯◯ 
해야 한다. 오른쪽은 어느 자동차 보험 회사의 직원이 관리하
최◯◯  양◯◯ 
고 있는 고객 명의 운전면허 취득 나이를 정리한 표이다.
유◯◯  김◯◯ 
최◯◯  황◯◯ 
1 고객 명이 자동차 운전면허를 취득한 나이의 평
황◯◯  최◯◯ 
균을 구해 보자.
김◯◯  한◯◯ 
2 크기가 인 표본을 임의추출하여 그 표본의 평균을 진◯◯  이◯◯ 
구하고, 1에서 구한 평균과 비교해 보자.

3 2의 결과를 다른 친구가 얻은 결과와 비교해 보자.

모집단에서 조사하고자 하는 특성을 나타내는 확률변수를 9라고 할 때, 9의 평균,


분산, 표준편차를 각각 모평균, 모분산, 모표준편차라고 하고, 이것을 기호로 각각
N, N, N
와 같이 나타낸다.

위의 생각 열기에서 고객 명이 자동차 운전면허를 취득한 나이를 확률변수 9라고


하고 통그라미 누리집 IUUQUPOHLPTUBUHPLS 을 사용하여 모평균, 모분산, 모
표준편차를 각각 구해 보자.

118 │Ⅲ. 통계
❶ 통그라미 누리집에서 ‘ 통계 분석하기’ ❷ 자료 창의 V1열에 취득 나이를 입력
를 선택하여 통그라미를 실행한다. 한다.

❸ 메뉴에서 ‘ 통계’–‘ 기초통계량’을 선택 ❹ 그래프 창에서 취득 나이의 평균, 분


하여 ‘ V1: 취득 나이’를 분석 변수로 산, 표준편차를 확인할 수 있다.
선택한다.

즉, 모평균, 모분산, 모표준편차는 각각 N, N, N이다.

한편, 모집단에서 임의추출한 크기가 O인 표본을 9, 9, U, 9O이라고 할 때, 이


들의 평균, 분산, 표준편차를 각각 표본평균, 표본분산, 표본표준편차라고 하고, 이것을
기호로 각각
9”, 4, 4
와 같이 나타내고 다음과 같다.

9• O 9 9 U 9O


표본분산을 구할 때에는 4  O \ 99• 
99• 
U 9O9• ^
표본분산과 모분산의 차이
를 줄이기 위하여 편차의 4Ã4
제곱의 합을 O로 나눈다.

예를 들어 앞의 생각 열기에서 임의추출한 명의 운전면허 취득 나이가 , , 


이면 표본평균은 , 표본분산은 , 표본표준편차는 이고, 운전면허 취득 나이가 ,
, 이면 표본평균은 , 표본분산은 , 표본표준편차는 이다. 이와 같이
표본평균, 표본분산, 표본표준편차는 표본이 새롭게 추출될 때마다 달라진다.

모집단에서 크기가 같은 표본을 임의추출하였을 때, 모집단은 변하지 않기 때문에


모평균은 변하지 않지만 표본평균 9•는 추출한 표본에 따라 다른 값을 가질 수 있으므
로 표본평균 9•는 확률변수이다.

2. 통계적 추정│ 119


개념 2 ⣃ᅟ⠰ɇᮿ⪼෇ᇫ⡓‫ۻ‬ᨛਢóӿ┧ԣᙿᯯ᮫ʳ"

표본평균의 분포를 살펴보고, 표본평균과 모평균 사이의 관계를 알아보자.

, , , 의 수가 각각 하나씩 적힌 네 개의 공이 들어 있는 주머니에서 임의추출한


한 개의 공에 적힌 수를 9라고 할 때, 9의 확률분포, 즉 모집단의 확률분포를 표로
나타내면 다음과 같다.

모집단의 확률분포 9     합계
1 9Y
1 9Y Å Å Å Å 


이때 확률변수 9의 모평균 N, 모분산 N, 모표준편차 N는 각각 다음과 같다.

0     Y N& 9 @Å @Å @Å @Å



N7 9 @Å @Å @Å @Å[] 


NN 9  

9 9
표본평균 9• 
 이 모집단에서 크기가 인 표본을 복원추출하여 추출한 공에 적힌 수를 각각 9,
는 표본에 따라 다른 값을
9 9
갖는 확률변수이다. 9라고 할 때, 표본평균 9•  의 확률분포를 표로 나타내면 다음과 같다.
9 9
9•  의값

9”        합계
9m
   

1 9”Y”  i d c d i  
    
    
이때 표본평균 9•의 평균과 분산은 각각 다음과 같다.
    
     & 9• @ @i @d AUA @
표본평균 9•의 확률분포 

1 9Y
7 9• @ @i @d AUA @[] 


 여기서 표본평균 9•의 평균 는 모평균 와 같고, 표본평균 9•의 분산 는 모분산


를 표본의 크기 로 나눈 것과 같다.
0     Y

이와 비슷한 방법으로 이 모집단에서 크기가 인 표본을 복원추출하여 추출한 공에


9 9  9
적힌 수를 각각 9, 9, 9이라고 할 때, 표본평균 9•  의 확률분포

를 표로 나타내면 다음과 같다.

120 │Ⅲ. 통계
표본평균 9•의 확률분포
9”        z   합계
1 9Y

 1 9”Y”  d e Å Å! Å! Å e d  


 이때 표본평균 9•의 평균과 분산은 각각 다음과 같다.
0     Y
& 9• , 7 9• o

여기서 표본평균 9•의 평균 는 모평균 와 같고, 표본평균 9•의 분산 o는 모분산

를 표본의 크기 으로 나눈 것과 같다.

일반적으로 표본평균 9•의 평균과 분산 및 표준편차에 대하여 다음이 성립한다.

표본평균의 평균, 분산, 표준편차

모평균이 N이고 모표준편차가 N인 모집단에서 크기가 O인 표본을 임의추출할 때,


표본평균 9•에 대하여

N N
& 9• N, 7 9•  , N 9• 
O O

보기 모평균이 , 모분산이 인 모집단에서 크기가 인 표본을 임의추출할 때, 표본평균 9•의
평균, 분산, 표준편차는 각각 다음과 같다.

& 9• , 7 9• y, N 9• 

문제
1 모평균이 , 모분산이 인 모집단에서 크기가 인 표본을 임의추출할 때, 표본평균 9•의
평균, 분산, 표준편차를 각각 구하시오.

한편, 위의 예에서 모집단의 분 1 9Y


모집단의 분포

포와 표본의 크기가 각각 ,AA일 
 9„ 9m
9 의 분포
때의 표본평균 9•의 확률분포를 


그래프로 나타내면 오른쪽 그림  9
9„ 9m 9f
 
의 분포
과 같다. 이 그림에서 표본의 크 

기가 커지면 표본평균 9•의 확률 0     Y

분포는 정규분포에 가까워짐을 관찰할 수 있다.

2. 통계적 추정│ 121


일반적으로 모집단이 정규분포 / N, N 을 따를 때, 크기가 O인 표본의 표본평균
N
9•는 정규분포 /[N, O ]을 따른다.

또한, 표본의 크기 O이 충분히 크면 모집단의 분포가 정규분포가 아니더라도 표본


N
평균 9•는 근사적으로 정규분포 /[N, O ]을 따른다는 사실이 알려져 있다.

위의 내용을 정리하면 다음과 같다.

표본평균 9”의 확률분포

모평균이 N이고 모표준편차가 N인 모집단에서 크기가 O인 표본을 임의추출할 때,


표본평균 9•에 대하여

N
1. 모집단이 정규분포 / N, N 을 따르면 표본평균 9•는 정규분포 /[N, O ]을


따른다.

2. 모집단의 분포가 정규분포가 아니더라도 O이 충분히 크면 표본평균 9•는 근사적


N
으로 정규분포 /[N, ]을 따른다.
O

참고 일반적으로 표본의 크기 O이  이상이면 충분히 큰 것으로 본다.

보기 정규분포 / ,  을 따르는 모집단에서 크기가 인 표본을 임의추출할 때, 표본평균 9•의
평균, 표준편차는 각각 다음과 같다.
 
& 9• , N 9•  
 

따라서 표본평균 9•는 정규분포 /[, ]를 따른다.


문제
2 어느 지역 주민들의 하루 동안 A57 시청 시간은 평균이 분, 표준편차가 분인 정규분포
를 따른다고 한다. 이 지역 주민 명을 임의추출할 때, 표본평균 9•는 근사적으로 어떤 확률
분포를 따르는지 구하시오.

122 │Ⅲ. 통계
예제
어느 고등학교에서 학생건강체력평가를 통해 측정한 학생들의 N 달리기 기록
1 은 평균이 초, 표준편차가 초인 정규분포를 따른다고 한다. 이 학교에서 측정
에 참여한 학생 중 명을 임의추출할 때, 달리기 기록의 평균이 초 이상일 확률
을 구하시오. (단, ;가 표준정규분포를 따르는 확률변수일 때,
1 ƒ;ƒ 로 계산한다.)

풀이 표본평균 9•의 평균과 표준편차는 각각



& 9• , N 9•  

9•
즉, 표본평균 9•는 정규분포 / ,  을 따르므로 확률변수 ; 는

표준정규분포 / ,  을 따른다.
따라서 구하는 확률은

1 9•y 1[;y ] 

1 ;y
1 ƒ;ƒ


.

문제
3 어느 회사에서 생산한 드론의 최대 원격 조종 거리는 평균이 N, 표준편차가 N인 정규
분포를 따른다고 한다. 어느 인터넷 쇼핑몰에서 드론을 이용한 택배 시스템 구축을 위해 이
회사의 드론 대를 구입하였다. 이 인터넷 쇼핑몰에서 구입한 드론의 최대 원격 조종 거리의
평균이 N 이하일 확률을 구하시오.
(단, ;가 표준정규분포를 따르는 확률변수일 때, 1 ƒ;ƒ 로 계산한다.)

문제
4 어느 회사에서 생산한 야구공의 무게는 평균이 H, 표준편차가 H인 정규분포를 따른다
고 한다. 이 회사는 일정한 기간 동안 생산된 야구공 중에서 임의추출한 야구공 개의 무게
의 평균이 H 이하이거나 H 이상이면 생산 공정에 문제가 있다고 판단한다. 이 회사
에서 생산 공정에 문제가 있다고 판단할 확률을 구하시오. (단, ;가 표준정규분포를 따르는
확률변수일 때, 1 ƒ;ƒ , 1 ƒ;ƒ 로 계산한다.)

2. 통계적 추정│ 123


수학
들여다
보기 ⣃ᅟ⠰ɇᮿ⪼෇ᇫ⡓⪼ᯟ⦿ʗ

어느 고등학교 학생 명의 몸무게는 평균이  LH, 표준편차가  LH인 정규분포를 따


른다고 한다. 이 고등학교 학생 중에서 크기가 O인 표본을 임의추출할 때, 표본평균 9•의 평
균과 표준편차를 각각 구해 보고, 모집단이 정규분포 / N, N 을 따르면 표본평균 9•는 정
N
규분포 /[N, ]을 따르는 것을 컴퓨터 프로그램을 사용하여 확인해 보자.
O

활동 ❶ 모집단의 생성 및 모집단의 분포 관찰하기

❶ 스프레드시트 메뉴에서 ‘데이터’‘데이터 분석’ ❷ 모집단이 정규분포 / ,  을 따르는 난수


을 선택하면 화면에 ‘통계 데이터 분석’ 창이 개를 생성한다.
나타난다. 이때 ‘난수 생성’을 선택한다.
통계 데이터 분석 난수 생성

❸ 생성한 난수 개를 스프레드시트 창에 붙 ❹ 모집단의 값을 기하 창에 출력하여 모집단이


여 넣고, 이 리스트를 ‘모집단’으로 지정한다. 정규분포를 따름을 확인한다.

124 │Ⅲ. 통계
공학 도구 개념 탐구

하 중 상
난이도

활동 ❷ 크기가 인 표본을 임의추출하는 것을 반복하여 표본평균 9•의 확률분포 관찰하기

❶ 모집단에서 크기가 인 표본을 반복하여


추출하고, 추출할 때마다 표본평균 9•의
값을 오른쪽과 같이 기하 창에 출력한다.

❷ 표본을 추출하는 횟수가 증가할수록 표본


평균 9•의 확률분포는 정규분포에 가까워
짐을 관찰할 수 있다.

활동 ❸ 크기가 인 표본을 임의추출할 때, 표본평균 9•의 평균, 표준편차 관찰하기

❶ 표본의 크기를 로 설정한 후 표본을 반복하여 추출하고, 추출할 때마다 표본평균 9•의
평균과 표준편차를 관찰한다.

❷ 표본평균 9•의 평균은 모평균 과 유사함을 관찰할 수 있다.


❸ 모표준편차는 이고, 표본평균 9•의 표준편차는 [ ]와 유사함을 관찰할 수 있다.


표본을 번 추출하였을 때 표본을 번 추출하였을 때

N
모집단이 정규분포 / N, N 을 따를 때, 표본평균 9•는 정규분포 /[N, ]을 따른다.
O

탐구 표본의 크기가 인 경우 표본평균 9•의 분포를 예측하고, 그 결과를 확인해 보자.

2. 통계적 추정│ 125


모평균의 추정
학습 목표 •모평균을 추정하고, 그 결과를 해석할 수 있다.

개념 1 ༏⠰ɇᮧᨛਢó⇻ᱼ⧇ʳ"

생각 열기

수아네 학교 학생들의 하루 수면 시간의 평균을 알아보기 위해 명의 학생을 임의추출하여 표본조사를 하였


더니 하루 수면 시간의 평균은 시간이었다. 다음 대화를 보고 이 학교 학생 전체의 하루 수면 시간의 평균을
어떻게 구할 수 있을지 이야기해 보자.

임의로 뽑은 표본의 표본평균의 평균이


평균이 시간이니 전교생의 모평균과 같다고 배웠잖아.
평균 수면 시간도 정확히 크기가 인 표본을 모두 조사 크기가 인
시간일거야. 해서 각각의 표본평균을 구한 표본을 모두 조사하느
다음, 다시 그것들의 평균을 니 차라리 전수조사를
하는 것이 좋겠어. 표본평균과 대략
구하면 되지.
비슷하지 않을까?
시간보다 조금 작은
값과 큰 값 사이에 있을
것이라 추측하면
될 것 같은데?

표본조사의 목적은 모집단 전체를 조사하지 않고, ጸ≡୸


그 일부인 표본을 조사하여 얻은 정보를 바탕으로 ⳬᖈ
모집단의 특성을 알아보려는 데에 있다. 이와 같이
☤☬ 9„
9m
표본에서 얻은 정보를 이용하여 모평균, 모표준편차 ?
U


와 같은 모집단의 특성을 확률적으로 추측하는 것을
☤₥ 9 4
추정이라고 한다.
N N

표본조사를 통해 얻은 표본평균을 이용하여 모평균을 추정하는 방법을 알아보자.


정규분포 / N, N 을 따르는 모집단에서 크기가 O인 표본을 임의추출하면 표본평균
N 9•N
9•는 정규분포 /[N, O ]을 따르고, 확률변수 ; N 은 표준정규분포 / , 
O
을 따른다.

126 │Ⅲ. 통계
G [ 이때 표준정규분포표에서 1 ƒ;ƒ 이므로

9•N
1~ƒ N ƒ
 0  [ O
이다. 이것을 정리하면 다음과 같다.
N N
1[9• ƒNƒ9•  ]
O O
N N
따라서 모평균 N이 9• ƒNƒ9•  의 범위에 속해 있을 확률은
O O
이다. 여기서 실제로 얻은 표본평균 9•의 값을 Y라고
• 할 때,
N N
Y
• ƒNƒY• 
O O
를 모평균 N에 대한 신뢰도 의 신뢰구간이라고 한다.

모집단에서 크기가 O인 표본을 임의추출하는 일을 되풀이하면 추출하는 표본에 따


<그림 >에서 Y•, Y•, Y•, Y• 라 Y•가 달라지고 신뢰구간도 달라진다. 이
를 사용해서 계산한 신뢰
구간은 모평균 N을 포함 와 같은 신뢰구간 중에는 <그림 >과 같이 N N
 
하고, Y•를 사용해서 계산 NO NO
모평균 N을 포함하는 것과 포함하지 않는
한 신뢰구간은 모평균 N
N
을 포함하지 않는다. 것이 있을 수 있다. 9

모평균 N에 대한 신뢰도 의 신뢰 Ym
Yf
구간이라는 말은 크기가 O인 표본의 임의 Ye
Q 신뢰도  의 신뢰
Ys
U
구간을 사용하는 것 추출을 되풀이하여 신뢰구간을 구할 때,
이 가장 좋지 않나요? Y‰
이들 중에서  정도는 모평균 N을 포
A 아닙니다. 예를 들어 <그림 >
생각 열기에서 수면 함할 것으로 기대된다는 뜻이다.
시간의 신뢰구간을 
시간에서 시간으로 한편, 1 ƒ;ƒ 이므로 모평균 N에 대한 신뢰도 의 신뢰
하면 신뢰도는  
N N
이지만 학생들의 수면 구간은 Y• ƒNƒY• 
O O
시간에 대한 의미 있는
정보를 주지 못하게
됩니다.
위의 내용을 정리하면 다음과 같다.

모평균의 신뢰구간을 구할 모평균의 신뢰구간


때 실제로는 모표준편차 N
모집단의 확률분포가 정규분포 / N, N 을 따를 때, 크기가 O인 표본을 임의추출하여
를 모르는 경우가 대부분
이다. 이러한 경우 표본의 구한 표본평균을 Y•라고 하면, 모평균 N에 대한 신뢰구간은
크기 O이 충분히 클 때 N N
Oy , N 대신 표본표
1. 신뢰도 의 신뢰구간: Y
• O
ƒNƒY• 
O
준편차 T를 사용하여 근사 N N
적으로 모평균의 신뢰구간 2. 신뢰도 의 신뢰구간: Y
• O
ƒNƒY• 
O
을 구할 수 있다.

2. 통계적 추정│ 127


예제
어느 회사에서 생산하는 비누 개의 무게는 모평균이 N H, 모표준편차가  H인
1 정규분포를 따른다고 한다. 이 회사에서 생산한 비누 개를 임의추출하여 무게를
측정한 결과 평균이  H이었다고 할 때, 이 비누 개 무게의 모평균 N에 대한 신
뢰도  의 신뢰구간을 구하시오. (단, ;가 표준정규분포를 따르는 확률변수일
때, 1 ];]ƒ 로 계산한다.)

풀이 표본의 크기는 O, 표본평균은 Y•, 모표준편차는 N이므로 이 비누 개


무게의 모평균 N에 대한 신뢰도  의 신뢰구간은
 
@ ƒNƒ @
 
따라서 구하는 신뢰구간은 ƒNƒ
.ƒNƒ. 단위: H

문제
1 어느 생화학 연구소에서 지금까지 알려지지 않은 신종 바이러스를 발견하

였다. 이 바이러스에 감염된 숙주들 중에서 개를 임의추출하여 숙주

내 바이러스의 생존 기간을 조사하였더니 평균이 시간, 표준편차가

시간이었다. 바이러스의 생존 기간이 정규분포를 따른다고 할 때, 이
바이러스의 평균 생존 기간 N에 대한 신뢰도  의 신뢰구간을 구하시오.
시오.
(단, ;가 표준정규분포를 따르는 확률변수일 때, 1 ];]ƒ 로
로 계산한다.)

생각과 표현 문제 해결 추론 창의・융합 의사소통

다음 그림의 대화를 읽고 물음에 답해 보자.

1 슈퍼마켓 계산대의 평균 대기 시간 N에 대한 신뢰도 의 신뢰구간을 구해 보자.


단, ;가 표준정규분포를 따르는 확률변수일 때, 1 ];]ƒ 로 계산한다.

2 이 슈퍼마켓에서는 1에서 추정한 신뢰구간의 최댓값이 분을 초과하면 계산대의 수를 더 늘리


려고 한다. 계산대의 수를 더 늘려야 될지 늘리지 않아도 될지 1을 근거로 판단해 보자.

계산대의 줄이 너무 긴 것 같아요.
계산대 대기 시간이 너무 길면
고객들의 불만이 생길 텐데요.
네. 서비스 개선을 위해 고객
명을 임의추출하여 계산대 대기 시간을
조사하였더니 평균이 분, 표준편차가 분인
정규분포를 따른다고 조사되었습니다.

128 │Ⅲ. 통계
자신감을
통계적 추정
키우는

바탕 다지기
1 모집단과 표본
⑴ 모집단: 통계 조사에서 조사의 대상이 되는 집단 전체 01 다음을 조사할 때, 전수조사와 표본조사 중 어느

⑵ 전수조사: 모집단 전체를 조사하는 것 것이 더 적합한지 말하시오.

⑶ 표본: 통계 조사를 하기 위해 뽑은 모집단의 일부분 ⑴ 올해의 쌀 예상 수확량


⑷ 표본조사: 조사하려는 모집단에서 표본을 추출하여 ⑵ " 고등학교 학생들의 급식 신청 희망 조사
그 자료의 성질을 조사하는 것
⑸ 임의추출: 통계 조사자의 주관을 배제하고 모집단의
각 대상이 같은 확률로 추출되도록 표본을 추출하
는것

02 모평균이 , 모분산이 인 모집단에서 크기가


인 표본을 임의추출할 때, 표본평균 9•의 평
균, 분산, 표준편차를 각각 구하시오.
2 모평균과 표본평균
모평균이 N이고 모표준편차가 N인 모집단에서 크기
가 O인 표본을 임의추출할 때, 표본평균 9•에 대하여
N N
⑴ & 9• N, 7 9•  , N 9• 
O O
⑵ 모집단이 정규분포 / N, N 을 따르면 표본평균 03 어느 고등학교 학생들의 수학 점수는 평균이 

N 점, 표준편차가 점인 정규분포를 따른다고 한


9•는 정규분포 /[N, ]을 따른다.
O 다. 이 학생들 중에서 임의추출한 명의 수학
⑶ 모집단의 분포가 정규분포가 아니더라도 O이 충 점수의 평균이 점 이상일 확률을 구하시오.
분히 크면 표본평균 9• 는 근사적으로 정규분포 (단, ;가 표준정규분포를 따르는 확률변수일 때,
N 1 ƒ;ƒ 로 계산한다.)
/[N, ]을 따른다.
O

3 모평균의 신뢰구간
정규분포 / N, N 을 따르는 모집단에서 크기가 O 정규분포 / N,  을 따르는 모집단에서 크기
04
인 표본을 임의추출하여 구한 표본평균을 Y라고
• 하면 가 인 표본을 임의추출하였더니 표본평균이
⑴ 모평균 N에 대한 신뢰도 의 신뢰구간은 이었다. 모평균 N에 대한 신뢰도 의
N N 신뢰구간을 구하시오. (단, ;가 표준정규분포를
Y•. ƒNƒY• .
O O
따르는 확률변수일 때, 1 ];]ƒ 
⑵ 모평균 N에 대한 신뢰도 의 신뢰구간은
로 계산한다.)
N N
Y.
• ƒNƒY• .
O O

확인 학습 문제│ 129
자신감을
키우는

기본 익히기 08 어느 도시에서 주민들이 일 년 동안 영화를 관람


하는 횟수는 모평균이 N, 모표준편차가 인 정

05 어느 공장에서 생산된 배터리의 수명은 평균이 규분포를 따른다고 한다. 이 도시의 주민들 중에
시간, 표준편차가 시간인 정규분포를 따른 서 O명을 임의추출하여 일 년 동안 영화를 관람
다고 한다. 이 공장에서 생산된 배터리 중에서 하는 횟수를 조사하였더니 모평균 N에 대한 신
임의추출한 개의 배터리의 평균 수명이  뢰도  의 신뢰구간이 ƒNƒ이었
시간 이상일 확률을 구하시오. (단, ;가 표준정 다. 이때 O의 값을 구하시오. (단, ;가 표준정규
규분포를 따르는 확률변수일 때, 분포를 따르는 확률변수일 때,
1 ƒ;ƒ 로 계산한다.) 1 ƒ;ƒ 로 계산하고, 관람 횟
수의 단위는 회이다.)

정규분포 / ,  을 따르는 모집단에서 크기


06 정규분포 / ,   을 [ 1 ƒ;ƒ[ 09
가 인 표본을 임의추출하여 구한 표본평균을
따르는 모집단에서 크기  
9•, 정규분포 / , N 을 따르는 모집단에서
가 O인 표본을 임의추출  
  크기가 인 표본을 임의추출하여 구한 표본평
할 때, 표본평균 9•에 대
균을 :•라고 하자.
하여 1 9•ƒ 이다. 이때 위의 표준
다음은 1 9•ƒ 1 :•ƒ 일 때, N의
정규분포표를 이용하여 O의 값을 구하시오.
값을 표준정규분포표를 이용하여 구하는 과정이
다. 안에 알맞은 수를 써넣으시오.
(단, ;는 표준정규분포를 따르는 확률변수이다.)


표본평균 9•는 정규분포 / , 을
따르고, 표본평균 :•는 정규분포
07 어느 홍삼 음료 회사에서 생산된 음료 병에 함
/[, [
N 
] ]을 따른다.
유된 홍삼 함량은 표준편차가 NH인 정규분포
를 따른다고 한다. 이 회사에서 생산된 음료 중 1 9•ƒ  1 ƒ;ƒ
에서 병을 임의추출하여 홍삼 함량을 조사하
1 :•ƒ 1[ƒ;ƒ N ]
였더니 표본평균이 NH이었다고 할 때, 이
회사에서 생산된 음료 병에 함유된 홍삼 함량 이때 1 9•ƒ 1 :•ƒ 이므로
의 평균 N에 대한 신뢰도  의 신뢰구간을 1 ƒ;ƒ 1[ƒ;ƒ N ]
구하시오. (단, ;가 표준정규분포를 따르는 확률
따라서 N 이다.
변수일 때, 1 ];]ƒ 로 계산한다.)

130 │Ⅲ. 통계
정답 및 해설 152쪽

실력 키우기 12 표준편차가 인 정규분포를 따르는 모집단에


서 크기가 O인 표본을 임의추출하여 신뢰도

10 어느 고등학교 학생들의 [ 1 ƒ;ƒ[  로 추정할 때, 모평균과 표본평균의 차가


몸무게는 평균이 LH,    이하가 되도록 하는 O의 최솟값을 구하시
표준편차가 LH인 정규   오. (단, ;가 표준정규분포를 따르는 확률변수
분포를 따른다고 한다.   일 때, 1 ];]ƒ 로 계산한다.)
 
무게가 LH 이상이
되면 경고음을 내도록 설계되어 있는 엘리베이
터에 이 고등학교 학생 중에서 임의추출한 명
이 탑승하였을 때, 경고음이 울릴 확률을 위의
표준정규분포표를 이용하여 구하시오.

생각
톡!톡!

13 치명적인 질병에 걸린 환자들에게 신약을 투여


하여 이 신약의 효과를 알아보는 의학 실험을 진
11 어느 공장에서 생산한 [ 1 ƒ;ƒ[
과자의 중량은 평균이   행하려고 한다. 두 연구원 ", #는 신약을 투여
H, 표준편차가 H   받은 환자들이 신약을 투여하기 전에 진단받은
인 정규분포를 따른다고   수명보다 몇 년을 더 살 수 있는지 각각 연구를
한다. 이 공장에서는 생산   진행하여, 신뢰도  의 신뢰구간을 구하였다.
시스템의 이상 여부를 점검하기 위해 하루에 생 연구원 "가 구한 신뢰구간은 년 이상 년 이
산된 과자 중에서 크기가 인 표본을 임의추 하, 연구원 #가 구한 신뢰구간은 년 이상 년
출하여 과자의 중량에 대한 표본평균 9•를 구하 이하라고 할 때, 물음에 답해 보자. (단, 표본을
려고 한다. 이때 9•가 D보다 작으면 생산 시스템 제외하고 두 연구원이 진행한 연구의 모든 조건
에 이상이 있는 것으로 판단하고 생산 시스템을 이 동일하다고 가정한다.)
점검하기로 하였다. 이 공장에서 생산 시스템에 ⑴ 신약은 효과가 있다고 판단할 수 있는가?
이상이 있다고 판단할 확률이 이라고 할
⑵ 당신이 신약 개발 회사에 종사하고 있는
때, 위의 표준정규분포표를 이용하여 상수 D의
사람이라면 신약 효과를 뒷받침하는 자료
값을 구하시오.
로 어느 연구원의 신뢰구간을 더욱 선호
하겠는가?

⑶ ⑵의 이유를 이야기해 보자.

확인 학습 문제│ 131
영양 정보
총내용량 H(@봉)
●과자의 중량 표기 창의 융합 봉(H)당 LDBM

생각을 우진이는 과자 상자에 표시된 과자의


넓히는 중량이 실제 과자의 중량과 동일한지 확인하고
수학 싶은 호기심이 생겼다. 다음 순서에 따라 과자의
중량의 모평균을 추정하고, 상자에 표시된 과자
의 중량은 관련 표시 기준을 준수했는지 알아보자.

표본의 평균과 표준편차 구하기


표본
중량이 표시되어 있는 과자 개와 저울을 준비한다. 과자 상자에 표시된 중량을 확인한다.

모집단
표본
표본의 크기
과자의 중량

탐구 ❶ 과자 개의 중량을 저울로 재어 다음 표에 기록해 보자.

과자 개의 중량

탐구 ❷ 쪽에서 배운 것처럼 통그라미 누리집 IUUQUPOHLPTUBUHPLS 을 사용하여


탐구 ❶ 에서 얻은 크기가 인 표본의 평균과 표준편차를 각각 구해 보자.

❶ 자료 창의 V1열에 탐구 ❶ 에서 얻은 ❷ 메뉴에서 ‘통계’‘기초통계량’을 선택


과자의 중량을 입력한다. 하여 평균과 표준편차를 확인한다.

132 │Ⅲ. 통계
탐구 ❸ 이 과자의 중량이 정규분포를 따른다고 할 때, 탐구 ❷ 에서 얻은 표본평균과 표본표준
편차를 근거로 모평균을 추정해 보자.

모집단이 정규분포 / N N 을 따를 표본의 크기 O이 충분히 크면
때, 크기가 O인 표본을 임의추출하여 구한 Oy N 대신 표본표준편차
표본평균을 Y•라고 하면 모평균 N에 대한 T를 사용하여 근사적으로 모평
신뢰도  의 신뢰구간은 균의 신뢰구간을 구할 수 있어.
N N
Y• ƒNƒY•  야.
O O
근데 모표준편차 N를 모르는 걸?

나연 혁준

탐구 ❹ 탐구 ❸ 에서 구한 모평균의 신뢰구간과 과자 상자에 표시된 중량을 비교해 보자.

탐구 ❺ 식품의약품안전처가 정한 식품 등의 표시 기준 에 따르면 식품 등의 내용물의 경우 용


기ㆍ포장에 표시된 양과 실제 들어 있는 양을 비교했을 때, 그 부족량의 허용 오차(범위)
는 다음과 같다. 이에 비추어 탐구 ❹ 를 해석해 보자.

적용 분류 표시량 허용 오차 적용 분류 표시량 허용 오차
 H 이하   N- 이하 
 H 초과  H 이하  H  N- 초과  N- 이하  N-
 H 초과  H 이하    N- 초과  N- 이하  
 H 초과  H 이하 H  N- 초과  N- 이하  N-
중량  H 초과  H 이하  용량  N- 초과  N- 이하 
 H 초과  LH 이하  H  N- 초과  - 이하  N-
 LH 초과  LH 이하    - 초과  - 이하  
 LH 초과  LH 이하  H  - 초과  - 이하  N-
 LH 초과   - 초과 

* 로 표시된 허용 오차는 표시량에 대한 백분율임.


출처 국가법령정보센터, 2016

모둠 활동에서 모둠원들의 활동 모습을 생각해 보면서 가장 어울리는 모습과 연결해 보자.

모둠원 이름 내가 관찰했던 친구의 모습은 ….


모평균을 추정하고, 그 결과를 해석할 수 있다.
자신의 의견을 모둠원에게 이해하기 쉽게 표현했다.
모둠의 의견을 잘 종합하여 정리했다.
모둠원에게 내용을 잘 설명해 주었다.

생각을 넓히는 수학│ 133


실력을
쌓는 III . 통계

01 확률변수 9의 확률분포를 표로 나타내면 다음


05 한 개의 주사위를 번 던져 의 배수의 눈이
과 같다. 나오는 횟수를 확률변수 9라고 할 때, 확률변수
9의 평균 & 9 은?
9    합계

1 9Y B Å C  ①  ②  ③ 


④  ⑤ 
& 9 일 때, B, C의 값을 각각 구하시오.

Z
02 연속확률변수 9가
ZG Y
취하는 값의 범위 C
가 ƒ9ƒ이 0 B  Y

고, 확률변수 9의 확률밀도함수 Z G Y 의 그

래프가 위의 그림과 같다. 1 ƒ9ƒB !일


06 서로 다른 두 개의 동전을 동시에 던지는 시행을
반복할 때, 번 던져 모두 앞면이 나오는 횟
때, 상수 B, C의 값을 각각 구하시오. 수를 확률변수 9라고 하자. 확률변수
:9 의 평균을 구하시오.

03 확률변수 9가 이항분포 #[O, Å]을 따르고 분

산은 이다. 이때 자연수 O의 값을 구하시오.

07 어느 학교 매점에서 판매된 음료수 중에서 캔 음


료수의 비율은 이고, 판매된 캔 음료수 중 분
리수거된 캔 음료수의 비율은 이었다. 이 매

04 확률변수 9의 평균과 분산은 각각 , 이다. 점에서 판매된 음료수 중에서 개를 임의추출
상수 B, C에 대하여 확률변수 :B9 C의 평 하여 분리수거 여부를 조사할 때, 분리수거된 캔
균과 분산이 각각 , 일 때, BC의 값은? 음료수의 개수를 확률변수 9라고 하자. 이때 평
(단, B) 균 & 9 는?

① ② ③ ①  ②  ③ 
④ ⑤ ④  ⑤ 

134 │Ⅲ. 통계
정답 및 해설 154쪽

확률변수 9는 정규분포 / ,  을 따르고,


08 이산확률변수 9의 확률질량함수가
11
1 9Y 
B 확률변수 :는 정규분포 / ,  을 따른다고
Y Y 
한다. 이때 1 ƒ9ƒL 1 ƒ:ƒ
Y, , , U, 
을 만족시키는 실수 L의 값을 구하시오.
일 때, 상수 B의 값을 구하시오.

12 어느 회사에서 만든 로봇 [ 1 ƒ;ƒ[
청소기가 완전히 충전되  

었을 때 청소할 수 있는  


09 어느 지역에 등록된 자 [ 1 ƒ;ƒ[
시간은 평균이 분,  
동차 중에서 블랙박스를  
표준편차가 분인 정규  
장착한 자동차의 비율은  
분포를 따른다고 한다. 이 회사에서 만든 로봇
라고 한다. 이 지역에  
 
청소기 한 대를 임의로 선택할 때, 이 로봇 청소
등록된 자동차 대를
기가 완전히 충전되었을 때 청소할 수 있는 시간
임의추출할 때, 블랙박스를 장착한 자동차가 
이 B분 이상일 확률이 이다. B의 값을 위
대 이상일 확률을 위의 표준정규분포표를 이용
의 표준정규분포표를 이용하여 구한 것은?
하여 구하시오.
①  ②  ③ 
④  ⑤ 

10 어느 방송사 예능 프로그 [ 1 ƒ;ƒ[ 13 어느 고등학교 학생들의 허리둘레의 길이는 정


램의 방송 시간은 평균이   규분포를 따른다고 한다. 이 고등학교 학생들 중
분, 표준편차가 분인   에서 임의로 선택한 명의 허리둘레의 길이를
정규분포를 따른다고 한   조사하였더니 평균이  DN, 표준편차가  DN
다. 크기가 인 표본을   였다. 이 고등학교 학생 전체의 허리둘레의 길이
임의추출하여 조사한 방송 시간의 표본평균을 의 평균 N에 대한 신뢰도  의 신뢰구간을
9•라고 할 때, 확률 1 ƒ9•ƒ 를 위의 표 구하시오. (단, ;가 표준정규분포를 따르는 확률
준정규분포표를 이용하여 구하시오. 변수일 때, 1 ];]ƒ 로 계산한다.)

마무리 문제 │ 135
실력을
쌓는
정답 및 해설 155쪽


서술

14 어느 제과점에서 만든 [ 1 ƒ;ƒ[ 문제 해결
단팥빵 한 개의 무게는  
평균이  H, 표준편차   15 어느 지역에서 열린 좋은 한우 선발 대회에 후보로

 
등록된 한우 마리의 무게는 평균이  LH,
가  H인 정규분포를
  표준편차가  LH인 정규분포를 따른다고 한다.
따른다고 한다. 이 단팥
단계 심사를 통해 무게가 무거운 순서대로 
빵을 개씩 임의추출하여 한 상자에 넣어 판매
마리를 선별할 때, 보기의 한우 중 단계 심사를
하는데, 단팥빵 한 상자의 무게가  LH 이상
통과하는 한우는 모두 몇 마리인지 구하시오.
 LH 이하일 때 정상 제품으로 분류하여 판
(단, ;가 표준정규분포를 따르는 확률변수일 때,
매한다고 한다. 이 제과점에서 판매하는 단팥빵
1 ƒ;ƒ 로 계산한다.)
상자 중에서 임의추출한 한 상자가 정상 제품으
로 분류될 확률을 위의 표준정규분포표를 이용 보기

하여 구하시오. (단, 상자의 무게는 고려하지 않 ㄱ. ㄴ. ㄷ. ㄹ.


는다.) (풀이 과정을 자세히 쓰시오.) . LH . LH . LH . LH

⑴ 단계 심사를 통과하는 한우들은 상위 몇


에 속한다고 볼 수 있는가?
⑵ 보기의 한우 중에서 단계 심사를 통과하
는 한우는 모두 몇 마리인지 구하시오.
⑶ 구한 답이 문제의 뜻에 맞는지 확인하시오.

이 단원에서 나의 학습을 되돌아보며 스스로 평가해 보세요.

40 % 60 % 40 % 60 % 40 % 60 %

20 % 80 % 20 % 80 % 20 % 80 %

학습 계획 교과 서 흥미와
실천 100 % 내용 이해 100 % 자 신감 100 %

나의 모습 만족 보통 부족
✽확률변수와 그 분포를 수학적으로 분석하고 기댓값과 표준편차를 구할 수 있다.
내용 이해
✽표본평균의 성질을 알고 모평균의 신뢰구간을 추정할 수 있다.

✽방송 매체 등에서 발표하는 통계 조사의 결과를 더 잘 이해할 수 있게 되었다.


태도 및 실천 ✽확률분포나 통계 조사를 나타내는 표와 그래프를 보면서 얻을 수 있는 중요한 정보를 해
석하고 발표하면서 통계에 자신감을 갖게 되었다.

이 단원을 복습하며 흥미로웠던 내용과 내가 더 공부해야 할 내용을 써 보세요.

136 │Ⅲ. 통계
꿈을 키우는
수학

임상 통계 전문가란 무엇인가요? 임상 통계 전문가는 어떤 일을 하나요?

신약을 개발하는 사람들은 어떤 질병에 대해 효과가 기 임상 통계 전문가는 약의 효능을 입증하기 위해 필요한


대되는 새로운 신약 후보 물질을 발견하면 임상 실험을 수 최소한의 실험 대상자가 몇 명이어야 하는지 산출하고, 어
행합니다. 이 실험 결과를 통계적으로 분석하고 약의 효과 떤 실험 환경에서 투약하고 그 반응을 측정하여야 정확한
와 안전성을 객관적으로 입증하는 사람을 임상 통계 전문 결과를 도출할 수 있는지 판단합니다. 또한, 측정된 결과를
가라고 합니다. 어떻게 분석할 것인가에 대한 총괄적인 판단을 내리고 이
를 수행하게 됩니다.

직업 전망은 어떠한가요? 임상 실험과 관련된 수학 내용은 무엇인가요?

신약 개발은 부가 가치가 뛰어난 미래 산업의 동력입니 임상 통계 전문가는 임상 실험과 관련된 여러 가지 함수


다. 많은 제약 회사와 정부 기관이 신약 개발 연구에 투자 와 방정식을 이용하여 실험 대상자의 수를 계산해 내어야
하고 있으며, 이를 위해 뛰어난 능력의 임상 통계 전문가들 합니다. 무엇보다 통계적 추정과 가설을 입증하는 방법을
을 필요로 합니다. 특히, 다국적 제약 회사에서 일하거나 잘 이해하고 적용할 수 있어야 합니다.
국제적인 신약 판매 승인을 얻기 위해 해외의 여러 국가에
서 활동하기도 합니다. 출처 고용노동부 워크넷, 2017

꿈을 키우는 수학 │ 137

You might also like