3단원 (자료) 내용정리

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 6

Ⅲ-1. 자료의 정리 Ⅲ.

자료

(1) 용어 정리
❶ 전수 조사: 대상 집단 전체를 모두 조사하는 것.
❷ 표본 조사: 대상 집단의 일부를 조사하는 것.
* 일반적으로 전수 조사는 표본 조사보다 시간과 비용이 더 많이 들고 ,
전수 조사 자체가 불가능할 때도 있으므로 표본 조사가 널리 이용되고 있다.

❸ 모집단: 조사의 대상이 되는 집단 전체.


❹ 표본: 표본 조사를 하기 위하여 모집단에서
뽑은 대상들의 모임.
❺ 표본의 크기: 표본에 포함된 대상의 개수.
❻ 추출: 모집단에서 표본을 뽑는 것.

Ⅲ-1. 자료의 정리 Ⅲ. 자료

❼ 복원 추출: 한 번 추출된 대상을 다시 되돌려 놓은 후 다음 대상


을 뽑은 방법.
❽ 비복원 추출: 다시 되돌려 놓지 않고 다음 대상을 뽑은 방법.
❾ 임의추출: 모집단의 각 대상이 표본에 포함될 확률이 모두 같도록
추출하는 방법.
❿ 임의표본(또는 확률표본): 임의 추출한 표본.
* 표본 조사는 모집단으로부터 표본을 추출하고 그 표본에 포함된 정보를 이용하여 모집단의
성질을 추측하는 것이 목적이다. 따라서 표본은 모집단의 성질이 잘 반영되도록 치우침이 없이
추출해야 한다.
* 임의추출 방법: 표본을 임의추출할 때에는 제비뽑기, 난수 주사위, 난수표 등이 주로 사용되
었으나 공학 도구의 발전으로 현재에는 계산기 , 컴퓨터 프로그램을 주로 사용한다 .
Ⅲ-1. 자료의 정리 Ⅲ. 자료

(2) 줄기와 잎 그림
❶ 오른쪽과 같은 방법으로 나타낸 그
림을 줄기와 잎 그림이라고 한다.
❷ 자료를 점수와 같이 수량으로 나타
낸 것, 즉 변량이 최소한 2개 이상
의 자릿수를 가졌다면 가장 손쉽게
시각적으로 표현하는 방법이 줄기
와 잎 그림이다.
❸ 줄기와 잎 그림은 자료의 분포 상
태를 파악할 수 있을 뿐만 아니라
각 자료의 값을 알 수 있는 장점이 있다. 또, 잎을 크기순으로 정렬하면 좀 더
쉽게 자료를 파악할 수 있다. 그러나 줄기가 너무 많이 있을 때는 자료의 전체
적인 분포 상태를 파악하기 힘들다.

Ⅲ-1. 자료의 정리 Ⅲ. 자료

(3) 도수분포표
❶ 오른쪽과 같이 전체 자료를 몇 개
의 계급으로 나누고 각 계급의 도
수를 구하여 나타낸 표를 도수분
포표라고 한다.
❷ 도수분포표를 만들 때, 계급의 개
수가 적으면 자료의 분포 상태를
알기 어렵고, 너무 많으면 각 계급
의 도수가 적으므로 자료의 전반
적인 모양을 알 수 없다.
❸ 일반적으로 도수분포표를 만들 때,
계급의 크기는 모두 같게 하고 계
급의 개수는 보통 5~15개 정도가 되도록 한다.
Ⅲ-1. 자료의 정리 Ⅲ. 자료

(4) 히스토그램과 도수분포다각형


❶ 히스토그램: 도수분포표의 모양과 특징을 한눈에 알아
볼 수 있도록 각 계급을 가로로, 그 계급의 도수를 세
로로 하는 직사각형을 그린 그래프.
❷ 도수분포다각형: 히스토그램에서 각 계급의 직사각형
의 윗변 가운뎃점을 차례대로 선분으로 연결하고, 양
끝점은 도수가 0인 계급이 있는 것으로 생각하여 그
가운뎃점을 이은 그래프.
❸ 도수분포다각형도 각 계급의 계급값에 도수를 대응시
켜서 만든 그래프이므로 히스토그램과 마찬가지로 자
료의 분포 상태를 쉽게 알아볼 수 있다.
❹ 도수분포다각형은 각 계급의 가운데에 있는 값과 그
계급의 도수를 이용하여 히스토그램을 그리지 않고 직접 그릴 수도 있다.

Ⅲ-1. 자료의 정리 Ⅲ. 자료

❺ 히스토그램과 도수분포다각형 그리는 순서


Ⅲ-1. 자료의 정리 Ⅲ. 자료

(5) 상대도수와 그 그래프


❶ 도수분포표나 히스토그램에서는 각 계급의 도수는 알아보기 쉽지만 각 계급의
도수가 전체에서 차지하는 비율은 알아보기 쉽지 않다. 이때, 도수분포표에서
각각의 도수가 아니 도수의 총합에 대한 각 계급의 도수의 비율을 구하여 그
값을 비교하면 편리하다.
❷ 상대도수: 전체 도수에 대한 각 계급의 도수의
비율을 그 계급의 상대도수라고 한다.
❸ 상대도수의 합은 자료와 관계없이 항상 1이다.
❹ 상대도수의 분포표도 그래프로 나타내면 자료의
분포를 알아보는 데 편리하다. 이때, 도수분포표
와 마찬가지로 그래프의 가로축에는 계급을, 세
로축에는 상태도수를 써넣어 히스토그램이나 도
수분포다각형과 같은 모양으로 그린다.

Ⅲ-1. 자료의 정리 Ⅲ. 자료

❺ 도수의 합이 다른 두 자료의 분포를 비교하는 방법


- 도수의 합이 다른 두 자료에서 계급의 도수만으로 두 자료의 분포 상태를 비교하기는
어렵다.
- 일반적으로 두 자료에서 도수의 합이 다를 때는 상대도수를 이용하여 두 자료의 분포
상태를 비교하는 것이 편리할 때가 많다.
- 또, 도수의 합이 다른 두 집단의 분포를 비교할 때, 상대도수의 분포표를 보고 비교하는
것보다는 이를 그래프로 나타내면 더 쉽게 비교할 수 있다.
Ⅲ-2. 자료의 해석 Ⅲ. 자료

(1) 자료의 중심 위치를 나타내는 대푯값


❶ 대푯값: 주어진 자료가 어떤 값을 중심으로 분포되어 있는지 나타내는 값에는
평균, 중앙값, 최빈값 등이 있다. 이들을 통틀어 대푯값이라고 한다.

❷ 자료 전체의 특징을 나타내는 대푯값으로 평균을 가장 많이 사용하지만, 중앙


값과 최빈값을 사용하기도 한다.
❸ 자료의 중앙값은 자료의 수가 홀수일 때는 한가운데 놓이는 값이 하나로 정해
지지만, 자료의 수가 짝수일 때는 한가운데 놓이는 값이 두 개이므로 이 두 값
의 평균을 중앙값으로 정한다.

Ⅲ-2. 자료의 해석 Ⅲ. 자료

(2) 자료의 흩어진 정도를 나타내는 산포도


❶ 산포도: 자료들이 대푯값 주위에 흩어져 있는 정도를 하나의 수로 나타낸 값.
❷ 산포도를 나타내는 값으로는 자료의 최댓값에서 최솟값을
뺀 값으로 정의되는 범위와 모든 변량을 이용한 분산과
표준편차 등이 있다.
Ⅲ-2. 자료의 해석 Ⅲ. 자료

(3) 두 변량 사이의 관계를 알 수 있는 상관관계


❶ 상관관계: 짝을 이루는 두 변량 사이에 있는 직선적 관계.
❷ 산점도: 보통 상관관계는 두 변량의 순서쌍을 좌표로 하는 점을 좌표평면
위에 나타낸 그림인 산점도로 판단한다.

You might also like