Download as pdf or txt
Download as pdf or txt
You are on page 1of 189

-1-

PHẦN I: NGUYÊN LÝ THỐNG KÊ


CHƯƠNG I. NHỮNG VẤN ĐỀ CHUNG VỀ THỐNG KÊ HỌC
 Mục tiêu của chương
Nắm được những vấn đề lý luận chung về thống kê như: thống kê là gì, sự ra đời
và phát triển của thống kê, đối tượng nghiên cứu cụ thể của thống kê, quá trình nghiên
cứu thống kê bao gồm những giai đoạn cụ thể nào, đặc biệt nắm được và phân biệt
được các khái niệm thường dùng trong thống kê.
Thống kê là một môn khoa học xã hội, ra đời và phát triển nhằm đáp ứng nhu cầu
hoạt động thực tiển của xã hội, thống kê là một trong những môn khoa học xã hội có
nguồn gốc lịch sử phát triển khá lâu đời.
I. Lịch sử ra đời và quá trình phát triển của thống kê học
 Thời cổ đại tại các quốc gia như Ai cập, Trung quốc, Hylạp....biết thu thập ghi
chép số dân trong từng địa phương, cả nước, diện tích đất canh tác, phân hạng
ruộng đất....
 Thời kỳ chiếm hữu nô lệ: thống kê số liệu đơn thuần về diện tích đất đai, phân
hạng ruộng đất, số nô lệ.
 Dưới chế độ phong kiến, lý luận khoa học phát triển, thống kê được sử dụng
rộng rãi hơn.
 Cuối thế kỷ XVII, lực lượng sản xuất phát triển, phương thức sản xuất tư bản ra
đời, đúc kết thành lý luận khoa học
 Năm 1660 nhà kinh tế học người Đức Hconhung dạy phương pháp nghiên cứu
hiện tượng dựa vào số liệu điều tra
 Năm 1662, John Graunt người Anh sử dụng số liệu sinh và chết chia theo giới
tính trong thời kỳ 30 năm để dự đoán số sinh và số chết. Có thể nói John Graunt
là người tiên phong trong việc sử dụng số liệu để tiến hành phân tích thống kê
(đây là giai đoạn phân tích thống kê)
 Năm 1682, nhà kinh tế học người Anh William Petty đã cho xuất bản “số học
chính trị” đây là sách đầu tiên trong thời kỳ này, nội dung: tác giả đề cập đến
các chỉ tiêu kinh tế tổng hợp phản ánh kết quả sản xuất của một quốc gia và nói
về phương pháp tính toán các chỉ tiêu đó như giá trị tổng sản lượng quốc gia,
tổng lợi tức quốc gia. Thông qua đó để đánh giá trình độ phát triển kinh tế của
các quốc gia ở thế kỷ XVII
 Khoa học thống kê thực sự phát triển từ cuối thế kỷ XIX. Nó được ứng dụng
vào hầu hết các lĩnh vực khoa học như: vật lý, sinh học, công nghiệp, kế hoạch,
tâm lý, kinh tế.....Các phương pháp thống kê được dùng nhiều trong nghiên cứu
khoa học, là công cụ hữu hiệu cho việc lập kế hoạch và chính sách của chính
phủ.
II. Đối tượng nghiên cứu của thống kê học:
Thống kê học là một môn khoa học xã hội độc lập, nó ra đời và phát triển theo nhu
cầu của hoạt động thực tiển của xã hội, do đó có phương pháp riêng, đối tượng riêng.
Nghiên cứu quá trình hình thành và phát triển của thống kê học có thể thấy thống kê
học nghiên cứu các hiện tượng và quá trình kinh tế xã hội (thu thập tài liệu ban đầu và
phân tích số liệu để nhận định bản chất, đặc điểm của hiện tượng kinh tế xã hội) (chú ý
không nghiên cứu hiện tượng tự nhiên, kỷ thuật)
Nguyên lý thống kê
-2-

Các hiện tượng kinh tế xã hội mà thống kê nghiên cứu thường là:
 Dân số và lao động
 Các hiện tượng về quá trình tái sản xuất của cải vật chất xã hội qua các giai
đoạn vận động khác nhau của nó: quá trình sản xuất, phân phối, trao đổi,
tiêu dùng sản phẩm
 Các hiện tượng về đời sống vật chất và văn hoá của dân cư như mức sống
vật chất, trình độ văn hoá, mức độ bảo vệ sức khoẻ
 Các hiện tượng về sịnh hoạt chính trị-xã hội như cơ cấu của các cơ quan nhà
nước, đoàn thể, số người tham gia bầu cử, ứng cử....
Thống kê nghiên cứu các đặc điểm sau của hiện tượng kinh tế xã hội:
- Nghiên cứu mặt lượng trong mối quan hệ mật thiết với mặt chất của hiện tượng
đó. Chất và lượng của các sự vật hiện tượng là hai mặt không tách rời nhau mà có mối
quan hệ mật thiết với nhau. Thông qua mặt lượng của hiện tượng có thể giúp ta nhận
thức được đặc điểm, bản chất của hiện tượng
Ví dụ: Đánh giá trình độ phát triển kinh tế của một nước thông qua các chỉ tiêu:
tổng sản phẩm quốc nội (GDP), tổng sản phẩm quốc dân, GDP bình quân đầu người…
- Nghiên cứu thường là hiện tượng số lớn tức là tổng thể bao gồm nhiều đơn vị
cá biệt,. Vì mặt lượng của đơn vị cá biệt thường chịu tác động bởi các nhân tố ngẫu
nhiên, cho nên rất khó nhận định về đặc điểm, bản chất của hiện tượng nghiên cứu, do
đó không thể dùng mặt lượng của đơn vị cá biệt để đánh giá kết luận đặc điểm chung
cho cả tổng thể. Tuy nhiên giữa đơn vị cá biệt và tổng thể nghiên cứu thường có mối
liên hệ nhất định, việc kết hợp nghiên cứu hiện tượng số lớn với hiện tượng cá biệt
giúp ta nhận định được đối tượng một cách toàn diện. Tuy nhiên cũng có một số
trường hợp nghiên cứu hiện tượng cá biệt (1 số trường hợp nhất định)
Ví dụ: Đối với công nhân của một xí nghiệp, bậc thợ càng cao thì năng suất lao
động càng cao, đó là tính quy luật thống kê đúng với số đông công nhân, song vẫn có
thể có công nhân nào đó bậc thợ cao nhưng NSLĐ lại thấp.
- Nghiên cứu hiện tượng đặt nó trong điều kiện thời gian và không gian nhất
định. Trong những điều kiện lịch sử khác nhau thì hiện tượng xã hội cũng có đặc điểm
về chất và biểu hiện về lượng khác nhau.
 Kết luận: Đối tượng nghiên cứu của thống kê học là mặt lượng trong mối liên
hệ mật thiết với mặt chất của hiện tượng và quá trình kinh tế xã hội số lớn trong
điều kiện thời gian và địa điểm cụ thể.
III. Quy luật số lớn và tính quy luật thống kê:
a. Quy luật số lớn:
Quy luật này thuộc lĩnh vực toán học trong môn học lý thuyết xác suất
Ý nghĩa: tổng hợp sự quan sát số lớn tới mức đầy đủ các sự kiện cá biệt ngẫu nhiên
thì tính tất nhg m iên của hiện tượng sẽ bộc lộ một cách rõ rệt. Vì sự kiện, đơn vị cá
biệt chịu tác động bởi nhiều nguyên nhân bao gồm cả những nguyên nhân ngẫu nhiên,
cho nên thông qua quan sát trên số lớn các đơn vị, khi tổng hợp tác động của các nhân
tố ngẫu nhiên sẽ bù trừ và kết quả còn lại là cái tất nhiên, nói lên bản chất của hiện
tượng
Ví dụ 1: Định lý Becnuli: thực hiện n phép thử độc lập, trong mỗi phép thử chỉ có
hai sự kiện xảy ra là A và sự kiện đối lập của nó là A’. Xác suất xảy ra sự kiện A
trong mỗi phép thử đều bằng p không đổi.
Nguyên lý thống kê
-3-

Khi đó xác suất để trong n phép thử độc lập đó có đúng k lần xảy ra sự kiện A:
Pn (k )  Cn p k (1  p) nk
k

Ví dụ 2: Qua nghiên cứu số lớn, người ta rút ra kết luận: chiều cao của con cái mà
bố mẹ sinh ra thuộc người lùn thì cao hơn bố mẹ, chiều cao của con cái mà bố mẹ sinh
ra thuộc người cao thì thấp hơn bố mẹ
Định luật số lớn không giải thích được bản chất của hiện tượng kinh tế xã hội
nhưng vận dụng nó có thể lượng hoá được tính quy luật của các hiện tượng đó.
b. Tính quy luật thống kê:
Thống kê vận dụng quy luật số lớn để lượng hoá bản chất và quy luật của hiện
tượng kinh tế xã hội thông qua tính quy luật thống kê
- Tính quy luật thống kê là 1 trong những hình thức biểu hiện mối liên hệ chung của
các hiện tượng trong tự nhiên và trong xã hội.
- Tính quy luật thống kê là kết quả nghiên cứu thống kê đối với hiện tượng số lớn,
trong đó chênh lệch về lượng ở từng đơn vị cá biệt mang tính ngẫu nhiên đã được loại
trừ
Ví dụ: Qua nghiên cứu một số lượng lớn trẻ em được sinh ra ở nhiều địa phương,
nhiều nước, người ta thấy tỉ lệ sinh con trai và con gái là 105 trai/100 gái, đó là tính
quy luật sinh của dân số
- Khi nghiên cứu hiện tượng số lớn, sự thay đổi của các hiện tượng theo một chiều
hướng rõ rệt ta nói sự biến động của hiện tượng có tính quy luật thống kê.
Ví dụ 1: Tình hình sản xuất lương thực ở nước ta tăng dần theo thời gian
Ví dụ 2: Khi nghiên cứu tình hình tiêu thụ mặt hàng bánh trung thu vào dịp tết
trung thu qua 10 năm, ta thấy hầu hết các sản phẩm được tiêu thụ có xu hướng tăng
dần qua thời gian, mặc dù ở một vài năm nào đó bánh trung thu tiêu thụ có phần giảm
sút
- Tính quy luật thống kê cũng thể hiện mối quan hệ nhân quả
- Tính quy luật thống kê không mang tính chất rộng rãi mà phải đặt nó trong điều
kiện thời gian và không gian nhất định.
- Tính quy luật thống kê chỉ thể hiện trong điều kiện quan sát số lớn.
- Điều kiện số lượng của tính quy luật thống kê là một chỉ tiêu thống kê, ngược lại
chưa chắc đúng, một chỉ tiêu thống kê có thể là chất lượng
IV. Một số khái niệm thường dùng trong thống kê học
a. Tổng thể thống kê: là tập hợp những đơn vị cá biệt cần được quan sát hoặc
nghiên cứu mặt lượng của chúng trên cơ sở đặc điểm chung.
Tổng thể thống kê xác định phạm vi nghiên cứu của hiện tượng nào đó đang là đối
tượng nghiên cứu cụ thể của thống kê. Từ đó mà ta có thể xác định phạm vi điều tra,
tổng hợp và phân tích số liệu của hiện tượng đó trong thời gian và địa điểm chính xác.
Ví dụ: Toàn thể các trường Đại học nước ta vào một thời gian xác định là một tổng
thể
Ví dụ: Dân số của một nước là tổng thể thống kê vì nó là tập hợp những con người
có cùng quốc tịch không phân biệt tuổi, giới tính,....
 Nếu căn cứ vào khả năng nhận biết của đơn vị tổng thể thì tổng thể thống kê
chia 2 loại:
- Tổng thể bộc lộ: bao gồm những đơn vị có thể nhận biết bằng trực quan như các
tổng thể nhân khẩu và trường đại học nêu trên
Nguyên lý thống kê
-4-

- Tổng thể tiềm ẩn: bao gồm các đơn vị cấu thành nó không thể nhận biết bằng
trực quan
Ví dụ: Tổng thể những người ưa chuộng nghệ thuật sân khấu, tổng thể những
người mê tín dị đoan, tổng thể những người trung thành với tổ quốc.....
 Nếu căn cứ vào tính chất của đơn vị tổng thể thì chia tổng thể thành 2 loại:
- Tổng thể đồng chất: là tổng thể bao gồm các đơn vị có một số đặc điểm chủ
yếu, giống nhau liên quan đến mục đích nghiên cứu.
Ví dụ: Tổng thể các cơ sở sản xuất công nghiệp của toàn quốc hay của một địa
phương là đồng chất, nếu mục đích nghiên cứu là tìm hiểu kết quả hoạt động chế biến
và sản xuất sản phẩm vật chất
- Tổng thể không đồng chất: là tổng thể bao gồm các đơn vị có một số đặc điểm
khác nhau liên quan đến mục đích nghiên cứu.
Ví dụ 1: Tổng thể các cơ sở sản xuất công nghiệp của toàn quốc trên là không
đồng chất nếu mục đích nghiên cứu là tìm hiểu kết quả
hoạt động chế biến và sản xuất sản phẩm vật chất theo một hình thức sở hữu nào
đó.
Ví dụ 2: Nghiên cứu tình hình hoạt động của xí nghiệp công nghiệp thành phố Đà
Nẵng: nghiên cứu các hoạt động của các XNCN thuộc thành phố ĐN theo thành phần
kinh tế (quốc doanh và ngoài quốc doanh).
 Nếu căn cứ vào phạm vi nghiên cứu:
- Tổng thể chung: là tổng thể bao gồm tất cả các đơn vị thuộc đối tượng nghiên
cứu
- Tổng thể bộ phận là tổng thể bao gồm một số đơn vị được chọn ra trong toàn bộ
số đơn vị thuộc tổng thể nghiên cứu
b. Đơn vị tổng thể:
Là các đơn vị cá biệt cấu thành nên tổng thể thống kê, đó là các đơn vị có đặc điểm
giống nhau về mục đích nghiên cứu do đó nó kết hợp lại thành tổng thể thống kê, nó là
căn cứ đầu tiên cho quá trình nghiên cứu thống kê vì nó có mặt lượng mà chúng ta cần
nghiên cứu
Ví dụ: Từng người dân trong tổng dân số nước ta là một đơn vị tổng thể
Trường ĐHDL Duy Tân là một đơn vị của tổng thể các trường Đại học trong cả
nước
c. Tiêu thức thống kê:
Mỗi đơn vị tổng thể có nhiều đặc điểm và mỗi đặc điểm là một tiêu thức thống kê
Ví dụ 1: Khi nghiên cứu tình hình học tập sau một năm học của một nhóm sinh
viên, mỗi sinh viên là một đơn vị tổng thể, quan sát mỗi sinh viên có các đặc tính sau:
tuổi, giới tính, độ thông minh, điểm thi, mỗi đặc tính là một tiêu thức
Ví dụ 2: Tổng thể dân số, mỗi đơn vị tổng thể là nhân khẩu, mỗi nhân khẩu có các
tiêu thức là: tuổi, giới tính, trình độ văn hoá, tình trạng hôn nhân
Căn cứ vào nội dung của tiêu thức mà người ta chia tiêu thức thành các loại:
Tiêu thức thuộc tính: không thể hiện trực tiếp bằng con số
 Tiêu thức định tính (thuộc tính) phân chia chi tiết hơn bao gồm:
- Tiêu thức định tính không thể sắp thức tự được, Ví dụ: giới tính, dân tộc....

Nguyên lý thống kê
-5-

- Tiêu thức định tính có thể sắp thứ tự được như khả năng hiểu biết của sinh viên
có thể phân hạng theo các mức độ: giỏi, khá, trung bình, yếu, kém (theo một trật tự
giảm dần)
 Tiêu thức số lượng: biểu hiện trực tiếp bằng con số như chiều cao, trọng lượng
Ví dụ: Các tiêu thức định lượng như tuổi, điểm thi, thu nhập, số con của những cặp
vợ chồng có thể đo lường bằng những đơn vị thích hợp (gọi là lượng biến)
Những lượng biến này cũng có 2 loại:
- Loại rời rạc: được dùng phổ biến, chẳng hạn số con của những cặp vợ chồng, số
sinh viên trong một lớp, độ tuổi của nhân khẩu.....
- Loại liên tục: như chiều cao, trọng lượng của một người....có thể mang giá trị
lấp đầy một khoảng xác định, bao gồm cả phần thập phân
Tiêu thức thay phiên là tiêu thức có 2 hình thức biểu hiện đối lập nhau. Đây là một
dạng của tiêu thức thuộc tính
 Phân loại tiêu thức có ý nghĩa quan trọng trong việc lựa chọn phương pháp
thống kê thích hợp khi phân tích số liệu, chẳng hạn, người ta chỉ tính giá trị chỉ tiêu
trung bình cộng đối với các lượng biến, không dùng nó đối với các tiêu thức thuộc tính
d. Chỉ tiêu thống kê:
Mỗi đặc điểm của tổng thể thống kê là chỉ tiêu thống kê, nó phản ánh một cách
tổng hợp đặc điểm mặt lượng trong mối quan hệ mật thiết với mặt chất của hiện tượng
nghiên cứu trong điều kiện thời gian và không gian nhất định
Ví dụ: Trở lại Ví dụ nghiên cứu tình hình học tập của sinh viên sau một năm học,
từ các đặc tính của mỗi đơn vị tổng thể đó, ta tính được các đặc tính của tổng thể: tuổi
trung bình mỗi sinh viên trong nhóm, điểm thi trung bình từng môn học của nhóm sinh
viên, đó là các chỉ tiêu thống kê
Chỉ tiêu nói lên một ý niệm bao trùm và khái quát về một tổng thể
Ví dụ 1: Thu nhập trung bình: cho biết thu nhập hàng tháng nói chung của toàn thể
hộ gia đình
Ví dụ 2: Tính được B% chủ hộ là dân tộc kinh thì biết một khía cạnh về toàn bộ
tổng thể chứ không phải về một hộ cụ thể nào
Chỉ tiêu thống kê chia 2 loại:
- Chỉ tiêu khối lượng: là chỉ tiêu phản ánh quy mô khối lượng của hiện tượng
- Chỉ tiêu chất lượng: là kết quả so sánh giữa các chỉ tiêu khối lượng, nó phản ánh
trình độ phát triển, phổ biến của hiện tượng
Ví dụ: Chỉ tiêu khối lượng: tổng số công nhân, tổng số nhân khẩu
Chỉ tiêu chất lượng: Năng suất lao động bình quân Tổng doanh thu tiêu
thụ
Giá thành bình quân, giá cả bình quân.....
Chi phi san xuat
Gia thanh binh quan 
Khoi luong san pham
Tong doanh thu tieu thu
Gia ca binh quan 
Khoi luong hang hoa tieu thu
Giá trị sản xuất (tổng sản lượng) là chỉ tiêu khối lượng, phản ánh quy mô, số
lượng.

Nguyên lý thống kê
-6-

V. Quá trình nghiên cứu thống kê: bao gồm 3 giai đoạn:
1. Điều tra thống kê:
1.1. Khái niệm, ý nghĩa và nhiệm vụ của điều tra thống kê:
a. Khái niệm: Điều tra thống kê là tiến hành tổ chức một cách có khoa học và theo
một kế hoạch thống nhất việc thu thập ghi chép tài tiệu ban đầu về các hiện tượng và
quá trình kinh tế xã hội để phục vụ một mục đích nào đó.
Ví dụ: Để nghiên cứu về dân số trên quy mô toàn quốc, người ta phải tiến hành thu
thập tài liệu về từng người dân: tên, tuổi, nơi ở, giới tính, trình độ văn hoá, dân tộc,
tình trạng hôn nhân..., do đó việc điều tra chỉ có kết quả khi được tổ chức và thực hiện
một cách có khoa học, có kế hoạch thống nhất.
b. Ý nghĩa:
- Điều tra thống kê là cơ sở để nghiên cứu sự biến động của hiện tượng
- Tài liệu của điều tra thống kê là cơ sở để tổng hợp thống kê và phân tích
thống kê: trước khi xử lý số liệu ta phải thu thập được số liệu, điều tra là
giai đoạn thu thập số liệu thô, có số liệu ta mới phân tích và tổng hợp thống
kê được
- Điều tra thống kê không những có ý nghĩa trong kinh tế mà còn có ý nghĩa
khác.
c. Nhiệm vụ:
- Cung cấp tài liệu về các cá thể của tổng thể
- Điều tra thống kê là cơ sở để xây dựng kế hoạch và kiểm tra tình hình thực hiện
kế hoạch.
Ví dụ: Dựa vào số liệu năm trước ta mới có mốc để xây dựng kế hoạch năm sau,
kết hợp với số liệu thực tế của năm sau đó ta kiểm tra tình hình thực hiện kế hoạch.
- Cung cấp số liệu cho tổng hợp thống kê và phân tích thống kê
 Dựa trên ý nghĩa và nhiệm vụ thì yêu cầu điều tra thống kê phải chính xác, kịp
thời và đầy đủ:
+ Chính xác: tài liệu điều tra phải phản ánh đúng trạng thái của các đơn vị tổng
thể vì vậy phải ghi chép trung thực, có trình độ chuyên môn, có tinh thần trách nhiệm.
+ Kịp thời: là cung cấp tài liệu đúng lúc cần thiết để phát huy hết tác dụng của tài
liệu đó. Yêu cầu kịp thời được khẳng định bởi thời gian kết thúc việc thu thập ghi
trong tài liệu điều tra
+ Đầy đủ: tài liệu điều tra phải được thu thập theo đúng nội dung và số đơn vị
tổng thể đã quy định trong văn kiện điều tra
1.2. Các loại điều tra thống kê:
Tuỳ theo đặc điểm của hiện tượng kinh tế-xã hội, mục đích nghiên cứu thống kê và
khả năng thu thập tài liệu mà người ta áp dụng loại hình điều tra thống kê thích hợp.
a. Nếu căn cứ vào việc thu thập tài liệu liên tục hay không liên tục người ta chia
điều tra thống kê thành 2 loại:
- Điều tra thường xuyên: là tiến hành thu thập tài liệu một cách thường xuyên, liên
tục, gắn liền với tình hình biến động và sự phát sinh, phát triển của hiện tượng.
Loại này thường dùng đối với các hiện tượng cần được theo dõi liên tục do nhu cầu
quản lý.
Ví dụ: Cơ quan hộ tịch thường xuyên ghi chép số sinh, chết, số kết hôn... của từng
địa phương.

Nguyên lý thống kê
-7-

Trong một đơn vị kinh doanh hàng ngày ghi chép số lượng hàng hoá mua, bán,
doanh số bán....
Điều tra thường xuyên tạo ra khả năng theo dõi được tỷ mỉ tình hình biến động của
hiện tượng theo thời gian, thường dùng trong các đơn vị sản xuất, kinh doanh, lưu
thông và dịch vụ.
- Điều tra không thường xuyên:
Là ghi chép, thu thập tài liệu không cần theo sát sự tiến triển của hiện tượng, tuỳ
theo nhu cầu từng thời điểm mà điều tra.
Loại này thường dùng cho các hiện tượng có chi phí điều tra lớn.
Ví dụ: Điều tra dân số, điều tra nông nghiệp, tài sản cố định.
Loại này thường dùng cho các hiện tượng không xảy ra thường xuyên:
Ví dụ: Điều tra dư luận, điều tra năng suất thu hoạch của một loại cây trồng, điều
tra bệnh nghề nghiệp của công nhân làm việc trong một ngành công nghiệp nào đó
b. Nếu căn cứ vào phạm vi của đối tượng nghiên cứu chia ra:
 Điều tra toàn bộ: là loại điều tra mà việc thu thập tài liệu ban đầu được tiến hành
trên tất cả các đơn vị thuộc đối tượng điều tra, không bỏ sót bất kỳ một đơn vị nào
Ví dụ: Điều tra toàn bộ dân số lao động, điều tra diện tích đất đai…
Ưu điểm:
- Cung cấp tài liệu ban đầu đầy đủ cho quá trình nghiên cứu thống kê, giúp ta có
nhận định một cách toàn diện về tổng thể và các bộ phận cấu thành tổng thể đó.
- Tài liệu của điều tra toàn bộ là cơ sở để kiểm tra tình hình thực hiện kế hoạch và
lập kế hoạch, có căn cứ để hoạch định chiến lược phát triển kinh tế xã hội
- Điều tra toàn bộ cung cấp đầy đủ thông tin về hiện tượng nghiên cứu trên quy mô
toàn bộ tổng thể.
Nhược:
Điều tra toàn bộ đòi hỏi công tác chuẩn bị chu đáo và kinh phí điều tra rất lớn
 Điều tra không toàn bộ:
Điều kiện sử dụng: khi tổng thể điều tra quá lớn, yêu cầu điều ra cho phép có sai số
trong điều tra, khi không có đủ kinh phí để điều tra, khi ta không thể điều tra toàn bộ
được
Định nghĩa: là loại điều tra mà việc thu thập tài liệu ban đầu được tiến hành trên
một số đơn vị được chọn ra từ tổng số đơn vị của tổng thể nghiên cứu
Ví dụ: kiểm tra chất lượng một loại sản phẩm, hàng hoá nào đó đối tượng nghiên
cứu sẽ bị phá huỷ trong quá trình điều tra ( không thể điều tra toàn bộ được)
Ví dụ: điều tra năng suất lúa của một tỉnh nào đó, người ta không có thời gian cũng
như kinh phí để điều tra hết tất cả các huyện mà chọn ra một số huyện nhất định để
điều tra
Nhược: sai số trong điều tra
Ưu: tiến hành nhanh chóng, giúp ta có nhận định kịp thời về hiện tượng nghiên cứu
Điều tra không toàn bộ gồm có các loại sau:
- Điều tra chọn mẫu: người ta tiến hành điều tra thực tế trên một số đơn vị nhất
định được chọn ra từ tổng số đơn vị của tổng thể nghiên cứu rồi dùng kết quả tính toán
được để suy rộng ra đặc trưng chung của tổng thể nghiên cứu
Ví dụ: Trong 100 sinh viên, chọn ra ngẫu nhiên 20 sinh viên để điều tra

Nguyên lý thống kê
-8-

Ví dụ: Điều tra năng suất, sản lượng lúa là điều tra chọn mẫu trong đó, người ta
chọn ra một số diện tích nhất định để điều tra.
- Điều tra trọng điểm: tiến hành điều tra trên những bộ phận đơn vị chủ yếu của
tổng thể nghiên cứu, bộ phận này chiếm tỉ trọng lớn trong tổng thể nghiên cứu, kết quả
thu thập được phản ánh tình hình cơ bản của hiện tượng nhưng không thể dùng nó để
suy rộng ra những đặc trưng chung của tổng thể
Ví dụ: Điều tra tổng thể 100 sinh viên, trong đó số sinh viên trung bình chiếm 50
%, chọn 50 % đó để điều tra cách thức học tập, không thể suy ra cho các sinh viên
khác.
Trong nông nghiệp, có một số cây trồng tập trung thành vùng chuyên canh, nên có
thể điều tra trọng điểm, đối với điều tra năng suất, sản lượng chè, người ta có thể tiến
hành điều tra trọng điểm ở Vĩnh phúc, Hà tuyên, Bắc thái...
- Điều tra chuyên đề: là loại điều tra không toàn bộ trong đó người ta tiến hành
điều tra trên một số ít đơn vị thậm chí trên một đơn vị nhưng người ta đi sâu vào
nghiên cứu nhiều mặt của đơn vị đó. Loại điều tra này nhằm nghiên cứu kỹ những điển
hình (tốt, xấu) để phân tích tìm hiểu nguyên nhân, rút ra các kinh nghiệm, nghiên cứu
các nhân tố mới, xu hướng phát triển của hiện tượng.
1.3. Các phương pháp điều tra thống kê:
Tuỳ theo đặc điểm của đối tượng được điều tra, có thể vận dụng các phương pháp:
a. Phương pháp trực tiếp: theo phương pháp này nhân viên điều tra tự mình thực
hiện hoặc giám sát việc cân, đo, đếm, trực tiếp hỏi đối tượng được điều tra và sau đó
ghi chép các dữ kiện vào phiếu điều tra, thu thập tài liệu trực tiếp có thể tiến hành bằng
các cách sau đây:
- Đăng ký trực tiếp: Ví dụ điều tra năng suất lúa, kiểm tra vật tư, hàng hoá tồn
kho..
- Phỏng vấn trực diện:Ví dụ: trong điều tra dân số, nhân viên điều tra trực tiếp hỏi
đơn vị điều tra và ghi chép tài liệu vào phiếu
- Phỏng vấn qua điện thoại thường áp dụng ở các nước phát triển
b. Phương pháp gián tiếp: bao gồm:
- Phương pháp tự ghi:nhân viên điều tra cho biết mục đích của cuộc điều tra, giải
thích cách ghi vào các phiếu điều tra, sau một thời gian nhất định, nhân viên điều tra sẽ
thu lại các phiếu điều tra
- Phương pháp thu thập qua chứng từ sổ sách, người điều tra thu thập tài liệu căn
cứ vào các chứng từ sổ sách đã được ghi chép một cách có hệ thống
- Phương pháp gửi thư
1.4. Các hình thức tổ chức điều tra thống kê:
Tuỳ theo đặc tính của hiện tượng nghiên cứu và yêu cầu nghiên cứu, có hai hình
thức tổ chức điều tra:
- Báo cáo thống kê định kỳ: là hình thức tổ chức, thu thập tài liệu thường xuyên,
có định kỳ, theo nội dung, phương pháp và chế độ báo cáo thống nhất do cơ quan có
thẩm quyền quy định (Báo cáo kết quả hoạt động sản xuất kinh doanh, Báo cáo tài
chính, các mẫu kê khai thuế…)
- Điều tra chuyên môn: là hình thức điều tra không thường xuyên được tiến hành
theo một kế hoạch và phương pháp quy định riêng cho mỗi lần điều tra (điều tra dân
số, dư luận xã hội..)

Nguyên lý thống kê
-9-

1.5. Sai số trong thống kê:


a. Khái niệm: sai số trong điều tra thống kê là chênh lệch giữa các tiêu thức điều tra
mà ta thu thập được so với giá trị thực tế của hiện tượng nghiên cứu
Ví dụ: Khi ta thực hiện những cuộc điều tra có tính chất phức tạp, chẳng hạn như
điều tra mức sống dân cư hoặc cuộc điều tra được tiến hành trên phạm vi rộng như
tổng điều tra dân số, sẽ xảy ra sai số.
Sai số trong điều tra thống kê có ảnh hưởng trực tiếp đến giai đoạn tổng hợp và
chất lượng của quá trình nghiên cứu thống kê
b. Các loại sai số: người ta căn cứ vào nguyên nhân phát sinh sai số, ta chia sai số
thành 2 loại là:
+ Sai số do tính chất đại biểu: sai số này xảy ra chỉ ở cuộc điều tra chọn mẫu,
nguyên nhân phát sinh do số đơn vị điều tra không đủ tính chất đại biểu
+ Sai số do đăng ký ghi chép: là loại sai số phát sinh do việc ghi chép thu thập tài
liệu ban đầu không chính xác, việc sai sót do nhiều nguyên nhân, có thể do nhân viên
điều tra vô tình cân, đong, đo, đếm, nghe và ghi chép sai, hoặc có thể do người hoặc
đơn vị được điều tra chưa rõ mục đích, yêu cầu, chưa hiểu câu hỏi nên khai báo sai,
cũng có thể do nhân viên điều tra thiếu tinh thần trách nhiệm trong điều tra, sai số này
phát sinh có thể do chủ quan hoặc khách quan, có thể xảy ra cho cuộc điều tra toàn bộ
hoặc không toàn bộ
c. Biện pháp khắc phục sai số:
- Làm tốt công tác chuẩn bị điều tra, phải chuẩn bị phương án điều tra: phải xác
định mục đích điều tra, đối tượng điều tra, đơn vị điều tra, nội dung điều tra, chuẩn bị
ghi chép ban đầu, xác định thời gian điều tra, chuẩn bị đội ngũ điều tra.
- Tiến hành điều tra một cách có hệ thống toàn bộ cuộc điều tra và chủ yếu 2 nội
dung:
+ Kiểm tra tài liệu thu thập được
+ Kiểm tra tính chất đại biểu mẫu: so sánh một số đặc điểm cơ bản của số đơn
vị điều tra với đặc điểm cơ bản tương ứng của tổng thể chung, nếu sự chênh
lệch nằm trong phạm vi +-5% thì đủ tính chất đại biểu
2. Tổng hợp thống kê:
2.1 Ý nghĩa, nhiệm vụ của tổng hợp thống kê:
Điều tra thống kê thu thập tài liệu ở dạng thô, còn lộn xộn, khối lượng lớn, chưa
cho ta biết gì về trạng thái của hiện tượng nghiên cứu. Và qua đó ta thu thập tài liệu
ban đầu trên mỗi đơn vị thuộc tổng thể nghiên cứu. Tài liệu này mới chỉ phản ánh đặc
trưng cá biệt của từng đơn vị và có tính chất rời rạc cho nên chưa thể sử dụng cho công
tác nghiên cứu và phân tích. Do vậy để có thể nêu lên một số đặc trưng chung của cả
tổng thể, cần phải tổng hợp các tài liệu điều tra
Ví dụ: tài liệu thu thập được qua tổng điều tra dân số rất phong phú nhưng nếu
chưa được tổng hợp thì tài liệu đó chỉ nói lên các đặc điểm riêng biệt của từng người
dân, không phản ánh được: tổng số dân, mật độ dân số, cơ cấu dân số theo độ tuổi, giới
tính, dân tộc... cho nên ta cần tổng hợp lại.
2.2 Khái niệm:
Tổng hợp thống kê (THTK) là tiến hành tập trung, chỉnh lý và hệ thống hoá một
cách khoa học các tài liệu thu thập được trong điều tra thống kê

Nguyên lý thống kê
- 10 -

 Ý nghĩa: chất lượng tài liệu của THTK ảnh hưởng rất lớn đến quá trình nghiên
cứu thống kê
 Nhiệm vụ: chuyển các đặc trưng riêng biệt của từng đơn vị tổng thể sang các
đặc trưng chung của tổng thể
2.3. Những vấn đề cơ bản của THTK:
a. Xác định mục đích tổng hợp: khái quát hoá những đặc trưng chung của tổng thể
và đặc trưng chung đó được biểu hiện cụ thể bằng các chỉ tiêu thống kê.
b. Nội dung tổng hợp: căn cứ vào một trong những tiêu thức đã được xác định
trong giai đoạn điều tra, tổng hợp theo nội dung nào phải xuất phát từ mục đích
nghiên cứu thống kê
c. Kiểm tra tài liệu trước khi tổng hợp: số liệu càng chính xác, chất lượng của
tổng hợp và phân tích thống kê càng lớn.
d. Phương pháp tổng hợp: sử dụng phương pháp phân tổ thống kê để phản ánh
đầy đủ những mặt khác nhau của tổng thể để phân tích thống kê được toàn diện
e. Tổ chức và kỷ thuật tổng hợp thống kê:
- Chuẩn bị tài liệu để tổng hợp
- Hình thức tổ chức tổng hợp thống kê:
+ Tổng hợp từng cấp: Tiến hành tổ chức tổng hợp theo từng bước, từ cấp dưới
đến cấp trên theo một kế hoạch đã định để cuối cùng có được số liệu của cả
tổng thể
+ Tổng hợp tập trung: tất cả các tài liệu điều tra gởi về cho một cơ quan
- Kỷ thuật THTK: có hai hình thức kỷ thuật THTK:
+ Tổng hợp thủ công: sử dụng phương tiện thô sơ, thủ công, khối lượng không
nhiều
+ Tổng hợp bằng máy: lập chương trình sẳn
Kết quả tổng hợp thường được trình bày dưới dạng bảng hoặc đồ thị thống kê
2.4. Bảng thống kê và đồ thị thống kê:
2.4.1. Bảng thống kê
a. Ý nghĩa của bảng thống kê (BTK): BTK là một hình thức trình bày các tài liệu
thống kê một cách có hệ thống, hợp lý và vì vậy nhằm nêu lên được các đặc trưng về
lượng của hiện tượng nghiên cứu .
- Đặc điểm chung của bảng thống kê bao giờ cũng có những số liệu chung của
tổng thể và của từng bộ phận thuộc tổng thể đó, số liệu trong bảng có liên hệ mật thiết
với nhau
b. Cấu thành của bảng thống kê:
- Về hình thức bảng thống kê có các hàng ngang và cột dọc có các tiêu đề và được
giải thích bằng các chỉ tiêu thống kê, các hàng ngang, cột dọc tạo thành các ô vuông
được điền những con số thống kê
- Về nội dung có hai phần:
+ Phần chủ đề: Nêu lên đối tượng của bảng thống kê
+ Phần giải thích: gồm các chỉ tiêu giải thích, các đặc điểm của đối tượng
nghiên cứu nghĩa là giải thích phần chủ đề của bảng
Tên bảng thống kê (tiêu đề chung)
Phần giải thích Tên chỉ tiêu giải thích
Phần chủ đề (tên cột)
Nguyên lý thống kê
- 11 -

Tên chủ đề


(tên hàng)

c. Các loại bảng thống kê: người ta căn cứ vào đặc điểm và kết cấu của phần chủ đề,
chia bảng thống kê thành ba loại:
- Bảng đơn giản: là loại bảng thống kê mà trong đó phần chủ đề bao gồm những
danh mục các đơn vị tổng thể như tên xí nghiệp, tên nông trường, các thời gian khác
nhau
Ví dụ: Tình hình sản xuất trong tháng 01/2012 của các XN thuộc liên hiệp XN dệt X:
Tên XN SLCN Giá trị TSL NSLĐ (tạ/CN)
(tạ )
XNA 20 1500
XNB 15 1750
XNC 30 2000
- Bảng phân tổ là loại bảng thống kê mà phần chủ đề của nó được phân thành các
tổ theo một tiêu thức nào đó
- Bảng phân tổ kết hợp: là loại bảng thống kê mà phần chủ đề của nó được phân tổ
theo 2,3...tiêu thức kết hợp nhau
Ví dụ: Giá trị tổng sản lượng công nghiệp phân theo nhóm và thành phần kinh tế
Phân theo nhóm sp Và tphần ktế Năm 2018 (tấn) Năm 2019 (tấn)
Tổng số: 15000 23000
Phân theo nhóm
- Nhóm A 7000 13000
- Nhóm B
Phân theo TPKT 8000 10000
- Quốc doanh 7500 11000
- Tập thể 3000 8000
- Cá thể 4500 4000

d. Cách ghi trong bảng thống kê: tất cả các ô trong bảng thống kê không được bỏ
trống vì vậy phải dùng 1 số ký hiệu sau để ghi vào bảng thống kê:
- Ô nào không có số liệu ta ghi vào dấu (-)
- Ô nào thiếu số liệu sau này bổ sung ghi vào dấu....
- Ô nào hoàn toàn không có số liêụ hoặc ghi vào vô nghĩa ta ghi x
2.4.2. Đồ thị thống kê:
a. Khái niệm: là phương pháp dùng các hình vẽ hoặc đường nét hình học với các màu
sắc thích hợp để trình bày đặc trưng về mặt lượng của các hiện tượng kinh tế xã hội
b. Quy tắc xây dựng đồ thị thống kê:
- Lựa chọn loại đồ thị phù hợp với tính chất của hiện tượng nghiên cứu
- Trong hệ trục toạ độ trục hoành biểu thị thời gian, trục tung biểu thị các trị số
của hiện tượng.
- Thang và tỉ lệ xích thích hợp để mô tả hiện tượng trên đồ thị được chính xác.
Nguyên lý thống kê
- 12 -

- Ghi đơn vị tính


- Phần giải thích: bao gồm tên đồ thị, giải thích các ký hiệu quy ước
c. Các loại đồ thị thống kê:
 Căn cứ theo nội dung phản ánh, có thể phân chia đồ thị thống kê ra thành các loại:
+ Đồ thị so sánh
+ Đồ thị phát triển
+ Đồ thị kết cấu, hoàn thành kế hoạch (hoặc định mức)
+ Đồ thị liên hệ
+ Đồ thị phân phối
 Căn cứ vào một hình thức biểu hiện, có thể chia đồ thị thành các loại:
- Bản đồ thống kê
- Biểu đồ hình cột
- Biểu đồ hình tròn
- Đồ thị đường gấp khúc
Tuỳ theo nội dung cần phản ánh và trường hợp cụ thể để lựa chọn các hình thức
biểu hiện phù hợp.
3. Phân tích thống kê và dự đoán thống kê:
3.1. Khái niệm, ý nghĩa, nhiệm vụ của phân tích thống kê và dự đoán thống kê:
a. Khái niệm: Phân tích thống kê là nêu lên một cách tổng hợp bản chất và tính
quy luật của hiện tượng và quá trình kinh tế xã hội trong một điều kiện lịch sử nhất
định qua biểu hiện bằng số lượng tính toán mức độ tương lai của hiện tượng nhằm đưa
ra những căn cứ cho quyết định quản lý.
Ví dụ: Qua số liệu tính toán để phân tích tình hình biến động sản lượng của một
XN sản xuất qua 3 năm, để biết được nguyên nhân gây ra biến động.
b. Ý nghĩa: Tài liệu tổng hợp thống kê và điều tra thống kê chỉ khi tải qua giai
đoạn phân tích thống kê mới nói lên được bản chất và tính quy luật của hiện tượng,
nếu không trải qua giai đoạn cuối cùng này thì không thực hiện được nhiệm vụ của
thống kê.
Đây là giai đoạn tính toán các chỉ tiêu phân tích nhằm đánh giá, kết luận vấn đề
bằng các mô hình toán học
c. Nhiệm vụ: Phải nêu lên được bản chất các tính quy luật của hiện tượng trong
một điều kiện thời gian và không gian cụ thể và tính toán các mức độ tương lai của
hiện tượng.
Trong từng trường hợp cụ thể, nhiệm vụ của phân tích thống kê có thể là:
- Phân tích tình hình thực hiện kế hoạch: để đạt được mục đích này cần xác định:
mức độ hoàn thành kế hoạch, nguyên nhân ảnh hưởng, mức độ ảnh hưởng…, đánh giá
kế hoạch đặt ra có phù hợp với tình hình thực tế hay không…
- Phân tích đặc điểm, tính quy luật của hiện tượng và quá trình kinh tế xã hội.
Thống kê cần xác định các chỉ tiêu nói lên đặc trưng của hiện tượng, Ví dụ tính toán số
lượng, kết cấu, các quan hệ tỉ lệ. Nêu lên xu hướng và nhịp độ phát triển của hiện
tượng, các nhân tố tác động đến sự biến động của hiện tượng, dự đoán tương lai.
 Để đảm bảo kết luận đúng đắn và khách quan thì phân tích thống kê và dự đoán
thống kê phải dựa trên một số cơ sở sau:
- Dựa trên cơ sở phân tích lý luận kinh tế xã hội

Nguyên lý thống kê
- 13 -

Ví dụ: Muốn phân tích hoàn thành kế hoạch phải dựa trên tỉ lệ % hoàn thành kế
hoạch = giá trị thực tế/ giá trị kế hoạch
- Căn cứ toàn bộ dữ kiện và đặt chúng trong mối quan hệ ràng buộc
Ví dụ: Khi ta phân tích tình hình biến động sản lượng qua hai năm, ta phải tính
toán toàn bộ các loại sảnn lượng, tính giá trị trung bình rồi mới kết luận.
- Phân tích và dự đoán đối với những hiện tượng có hình thức và tính chất phát
triển khác nhau thì phải sử dụng phương pháp khác nhau
Ví dụ: đối với hiện tượng phức tạp, phải dùng phương pháp phân tổ có khoảng
cách tổ; đối với hiện tượng đơn giản thì không cần.
3.2. Những vấn đề chủ yếu của phân tích thống kê và dự đoán thống kê:
a. Xác định nhiệm vụ của phân tích thống kê và dự đoán thống kê để quyết định
xem:
- Căn cứ lựa chọn tài liệu gì
- Phương pháp tính nào cho phù hợp
- Hệ thống chỉ tiêu phân tích gì
b. Lựa chọn và đánh giá tài liệu dùng để phân tích: trên thực tế thống kê thu
thập tài liệu từ nhiều nguồn khác nhau và lựa chọn đánh giá tài liệu trên các mặt:
+ Xem xét tài liệu có chính xác, đầy đủ không
+ Xem xét tài liệu có phân bố khoa học không
+ Xem xét tài liệu có tính phù hợp không
c. Xác định phương pháp phân tích và các chỉ tiêu phân tích:
Gồm có: phương pháp số tương đối, số tuyệt đối, hồi quy, tương quan, chỉ số.
Vì vậy vấn đề lựa chọn chính xác phương pháp phân tích ảnh hưởng lớn đến kết
quả thống kê.
d. So sánh, đối chiếu các chỉ tiêu: mỗi chỉ tiêu chỉ phản ánh từng mặt nào đó của
hiện tượng, cho nên khi phân tích cần tính toán một hệ thống các chỉ tiêu có mối liên
hệ với nhau qua đó thấy được toàn diện về hiện tượng nghiên cứu.
Ví dụ: Hoàn thành kế hoạch về sản lượng, tiền lương, NSLĐ của một đơn vị trong
thời kỳ ta thấy được tình hình hoạt động của đơn vị đó
e. Dự đoán (ngắn hạn và dài hạn)
f. Kết luận và kiến nghị
CÂU HỎI CUỐI CHƯƠNG
I. Chọn câu trả lời đúng nhất
Câu 1: Tập hợp những đơn vị cá biệt cần quan sát hoặc nghiên cứu được gọi là:
a. Đơn vị tổng thể
b. Tiêu thức thống kê
c. Chỉ tiêu thống kê
d. Tổng thể thống kê
Câu 2: Một tiêu thức thống kê là:
a. một đặc điểm của tổng thể thống kê
b. Một đặc điểm của đơn vị tổng thể
c. Các đặc điểm của đơn vị tổng thể
d. Cả 3 câu a, b, c đều sai
Câu 3: Tiêu thức số lượng liên tục là tiêu thức có các hình thức biểu hiện như sau:

Nguyên lý thống kê
- 14 -

a. Chỉ biểu hiện là những số nguyên


b. Là những con số có cả phần thập phân
c. Biểu hiện là những con số
d. Cả a,b,c đều sai
Câu 4: Điều tra thống kê là:
a. Tập trung, chỉnh lý và hệ thống hóa tài liêu
b. Nêu lên đặc điểm, bản chất và tính quy luật của hiện tượng
c. Thu thập ghi chép tài liệu về hiện tượng
d. Cả 3 câu a, b, c đều sai
Câu 5 : Việc thu thập tài liệu được tiến hành trên một số ít đơn vị được chọn ra từ
tổng thể nghiên cứu gọi là:
a. Điều tra chọn mẫu
b. Điều tra toàn bộ
c. Điệu tra không toàn bộ
d. Điều tra trọng điểm
Câu 6: Thu thập tài liệu trên bộ phận đơn vị chủ yếu của tổng thể gọi là:
a. Điều tra chọn mẫu
b. Điều tra trọng điểm
c. Điều tra chuyên đề
d. Cả 3 câu a, b, c đều sai
Câu 7: Phân tổ là việc căn cứ vào một hoặc một số………..để tiến hành phân chia
các đơn vị tổng thể thành các tổ có tính chất khác nhau
a. Chỉ tiêu
b. Tổng thể
c. Tiêu thức
d. Đơn vị
Câu 8: Trong phân tổ thống kê, mỗi tổ chỉ có 1 lượng biến gọi là:
a. phân tổ có khoảng cách tổ đều
b. Phân tổ có khoảng cách tổ không đều
c. Phân tổ không có khoảng cách tổ
d. Cả 3 câu a, b, c đều sai
Câu 9 Hành động nào sau đây thể hiện công việc của thống kê
a. Thu thập tài liệu
b. Ghi chép tài liệu
c. Tổng hợp tài liệu
d. Tất cả đều đúng

Câu 10 Trong các tiêu thức sau, tiêu thức thuộc tính là
a. Số sinh viên c. Sức khỏe của sinh viên
b. . Tuổi sinh của viên d. Điểm học tập của sinh viên
Câu11: Qua điều tra, năm học 2012 -2013, Lớp STA- 271 A có 20% là sinh
viên nam. Căn cứ vào kết quả điều tra trên, hãy xác định đơn vị thống kê
a. Mỗi một sinh viên
b. Số sinh viên
c. Tên lớp
Nguyên lý thống kê
- 15 -

d. Năm học
II. Trả lời ngắn gọn
Câu 1. Đối tượng nghiên cứu của thống kê là gì? Nêu một số đối tượng chủ yếu.
Câu 2. Phân biệt chỉ tiêu và tiêu thức thống kê.
Câu 3. Phân biệt tiêu thức thuộc tính và tiêu thức số lượng
Câu 4. Quá trình nghiên cứu thống kê có bao nhiêu giai đoạn, nêu nội dung chính
của từng giai đoạn.

CHƯƠNG II: PHÂN TỔ THỐNG KÊ


 Mục tiêu của chương:
Sau khi nghiên cứu chương này, sinh cần nắm vững các vấn đề sau:
o Nắm được phân tổ thống kê là gì, ý nghĩa và nhiệm vụ của việc phân tổ.
o Phân biệt được các loại phân tổ thống kê.
o Nắm được các bước tiến hành phân tổ, biết cách phân tổ cho một tổng thể phức
tạp.
o Hiểu rõ các khái niệm trong dãy số phân phối như: lượng biến, tần số, tần suất,
tần số tích lũy, mật độ phân phối.
Phân tổ là một phương pháp trình bày dữ liệu vì thông tin ban đầu có tính chất rời
rạc chưa thể sử dụng trực tiếp cho quá trình phân tích cho nên các dữ liệu thu thập
được cần trình bày một cách có hệ thống, yêu cầu chúng ta cần phải phân tổ thống kê.
I. Khái niệm, ý nghĩa, nhiệm vụ của phân tổ thống kê:
a. Khái niệm: Phân tổ là việc căn cứ vào một hoặc một số tiêu thức nào đó để tiến
hành phân chia các đơn vị của tổng thể thành các tổ hoặc các tiểu tổ có tính chất khác
nhau.
Ví dụ: Phân tổ số nhân khẩu theo tiêu thức giới tính: nam, nữ
Phân tổ các XNCN theo các thành phần kinh tế.
b. Ý nghĩa:
- Phân tổ là phương pháp cơ bản để tiến hành tổng hợp thống kê: muốn hệ thống
hoá một cách khoa học các tài liệu điều tra thống kê, tổng hợp theo các chỉ tiêu nghiên
cứu phải căn cứ từng chỉ tiêu đó sắp xếp các đơn vị theo từng nhóm khác nhau (phân
tổ) sau đó mới tính toán các đặc trưng của từng nhóm cũng như cả tổng thể.
- Phân tổ thống kê là một trong các phương pháp để phân tích thống kê: là cơ sở
để vận dụng các phương pháp phân tích thống kê khác như phương pháp hồi quy
tương quan, phương pháp chỉ số, phương pháp số bình quân
Ví dụ: So sánh dân số trong độ tuổi 0-15 (chưa đến tuổi lao động) với dân số trong
độ tuổi 16-60 (trong tuổi lao động) qua kết quả so sánh sẽ giúp ta nhận định được đặc
điểm của dân số.
- Phân tổ thống kê là phương pháp quan trọng của điều tra thống kê: bởi trên thực
tế nhiều khi phải phân chia tổng thể thành các nhóm để thu thập số liệu
c. Nhiệm vụ:

Nguyên lý thống kê
- 16 -

- Phân chia các hiện tượng nghiên cứu ra thành các loại hình kinh tế xã hội khác
nhau: qua đó thấy được đặc trưng của từng loại hình và mối quan hệ giữa chúng với
nhau
Ví dụ: Phân chia các xí nghiệp công nghiệp đang hoạt động tại một địa phương
theo thành phần kinh tế: nhà nước, tư nhân, tập thể
- Biểu hiện kết cấu của hịên tượng nghiên cứu: mỗi một hiện tượng kinh tế-xã hội
cần nghiên cứu đều được cấu thành bởi nhiều bộ phận có tính chất khác nhau, mỗi bộ
phận chiếm 1 tỷ trọng khác nhau và nói lên tầm quan trọng trong tổng thể, sự thay đổi
kết cấu của mỗi bộ phận qua thời gian phản ánh sự thay đổi về chất và xu hướng phát
triển cơ bản của hiện tượng.
Ví dụ: Sự thay đổi cơ cấu của công nghiệp và nông nghiệp trong nền kinh tế, giữa
trồng trọt và chăn nuôi trong nông nghiệp.
Ví dụ: Hiện tượng mà ta nghiên cứu là dân số của một địa phương A bao gồm các độ
tuổi
0 - 15
16 - 60
60 trở lên
Chẳng hạn, năm 2007 dân số địa phương A được xem là dân số trẻ vì số người
trong độ tuổi 60 trở lên chiếm tỷ trọng thấp, đến năm 2008, kết cấu dân số thay đổi, tỷ
trọng 60 trở lên tăng cao hơn tỷ trọng dưới 15, bản chất dân số thay đổi.
- Biểu hiện mối liên hệ giữa các tiêu thức. Trong tổng thể nghiên cứu giữa các tiêu
thức thường có mối liên hệ. Sự thay đổi của tiêu thức này ảnh hưởng đến sự thay đổi
của tiêu thức kia.
Ví dụ: Mối liên hệ giữa lượng phân bón và năng suất thu hoạch
Mối liên hệ giữa tuổi nghề , trình độ lao động và NSLĐ
Mối liên hệ giữa sản phẩm sản xuất và giá thành đơn vị sản phẩm
Các tiêu thức có mối liên hệ với nhau đó là tiêu thức nguyên nhân và tiêu thức kết
quả
Khi vận dụng phương pháp phân tổ để nghiên cứu mối liên hệ giữa các tiêu thức,
trước tiên trong tổng thể nghỉên cứu được phân tổ theo tiêu thức nghuyên nhân, sau đó
trong mỗi tổ tiếp tục tính trị số trung bình của tiêu thức kết quả. Quan sát sự biến thiên
cuả tiêu thức giúp ta rút ra kết luận về mối liên hệ giữa chúng.
II. Các loại phân tổ thống kê: căn cứ vào nhiệm vụ của phân tổ ta chia thành các
loại sau:
1. Phân tổ phân loại:
Thực hiện nhiệm vụ phân chia tổng thể nghiên cứu ra các loại hình kinh tế xã hội
khác nhau, hiện tượng kinh tế xã hội mà thống kê nghiên cứu thường bao gồm nhiều
đơn vị thuộc các loại hình kinh tế xã hội khác nhau, các loại hình này có quy mô, đặc
điểm, xu hướng phát triển khác nhau, vì vậy phương pháp nghiên cứu khoa học trước
hết phải nêu rõ hiện tượng nghiên cứu gồm những loại hình nào, để giải quyết vấn đề
này người ta sử dụng phương pháp phân tổ phân loại. Phương pháp phân tổ phân loại
dựa vào lý luận kinh tế xã hội để phân biệt các bộ phận có tính chất khác nhau và tồn
tại khách quan trong hiện tượng, phương pháp phân tổ phân loại giúp ta nghiên cứu
các loại hình, mối liên hệ giữa chúng và xu hướng của toàn bộ hiện tượng.

Nguyên lý thống kê
- 17 -

2. Phân tổ kết cấu:


Tổng thể thống kê thường bao gồm nhiều bộ phận, nhiều nhóm đơn vị có tính chất
khác nhau hợp thành, các bộ phận này chiếm tỷ trọng khác nhau trong tổng thể và nói
lên vị trí của mình trong tổng thể đó, mặt khác tỉ trọng của các bộ phận còn nói lên kết
cấu của tổng thể theo một tiêu thức nào đó. Vì vậy muốn biểu hiện được kết cấu của
tổng thể, trước hết phải xác định chính xác các bộ phận có tính chất khác nhau trong
tổng thể, rồi sau đó tính toán các tỉ trọng của chúng, để thực hiện nhiệm vụ này thống
kê dùng phương pháp phân tổ kết cấu.
Trong nghiên cứu thống kê, phân tổ kết cấu được sử dụng rất phổ biến như phân tổ
dân số theo giới tính, phân tổ dân số theo nghề nghiệp.
Ví dụ: Có tài liệu phân tổ giá trị sản xuất nông nghiệp của một địa phương

Phân tổ theo ngành sx Giá trị sản xuất nông tỷ trọng(%)


nghiệp (triệuđồng)
Trồng trọt 320 57.1
Chăn nuôi 150 26.8
Dịch vụ nông nghiệp 90 16
Tổng 560 100

Kết luận: ngành trồng trọt chiếm tỷ trọng cao nhất trong tổng giá trị sản xuất
3. Phân tổ liên hệ:
Các hiện tượng kinh tế xã hội thường có mối quan hệ với nhau, mặt khác giữa các
tiêu thức mà thống kê nghiên cứu cũng có mối quan hệ với nhau, sự thay đổi của tiêu
thức này dẫn đến sự thay đổi của tiêu thức khác theo một quy luật nhất định. Vì vậy để
nghiên cứu được tính chất và trình độ của mối liên hệ giữa các hiện tượng, giữa các
tiêu thức đó là nhiệm vụ của nghiên cứu thống kê, để giải quyết nhiệm vụ này, thống
kê dùng phương pháp phân tổ liên hệ.
Khi tiến hành phân tổ liên hệ giữa các tiêu thức có mối liên hệ với nhau, người ta
chia thành hai loại: tiêu thức nguyên nhân và tiêu thức kết quả
- Tiêu thức nguyên nhân: là tiêu thức gây ảnh hưởng, dùng để phân biệt các tổ của
các tiêu thức khác, là căn cứ để phân tổ
- Tiêu thức kết quả là tiêu thức chịu ảnh hưởng của tiêu thức nguyên nhân
Ví dụ:
Tiêu thức nguyên nhân Tiêu thức kết quả

NSLĐ Giá thành


Tuổi nghề NSLĐ
NSLĐ Tiền lương
Nói tóm lại: Phân tổ liên hệ là dùng phương pháp phân tổ để biểu hiện mối liên hệ
giữa các tiêu thức.
Có hai trường hợp phân tổ liên hệ:
a. Phân tổ liên hệ giữa hai tiêu thức (1 nguyên nhân và 1 kết quả) hay còn gọi là
phân tổ giản đơn.

Nguyên lý thống kê
- 18 -

Phân tổ liên hệ giữa hai tiêu thức tức là nghiên cứu mối liên hệ giữa hai tiêu thức
do đó tổng thể được chia thành nhiều tổ theo tiêu thức nguyên nhân sau đó trong mỗi
tổ tính trị số bình quân của tiêu thức kết quả.
Ví dụ 1: Nghiên cứu mối liên hệ giữa mức bón phân hữu cơ và năng suất lúa là
phân tổ liên hệ giản đơn
Có tài liệu phân tổ diện tích canh tác của một vùng sản xuất theo mức phân hoá học
bón trung bình trên 1 ha lúa vụ hè thu như sau:
Phân tổ diện tích theo mức Diện tích tổng sản lượng thu Năng suất bình
phân hoá học bón trung (ha) hoạch (tạ) quân (tạ/ha)
bình 1 ha (kg)
200-250 10 530 53
250-270 7 420 60
270-300 10 700 70
300-340 11 770 70
Kết quả trên cho thấy: ảnh hưởng của lượng phân hoá học bón trên một đơn vị diện
tích đối với năng suất thu hoạch : trong những điều kiện như nhau về giống, đất đai,
nước… thì diện tích gieo cấy nào có lượng phân hoá học bón càng nhiều thì năng suất
lúa thu hoạch càng cao.
Ví dụ 2: Nghiên cứu mối liên hệ giữa bậc thợ, tuổi nghề và năng suất lao động
ngày (NSLĐ) của 30 công nhân trong xí nghiệp sản xuất (XNSX). Có 3 bậc thợ: 2, 3,
4, tuổi nghề phân 3 tổ: 2-4, 5-7, 8-10 (tính theo năm), NSLĐ ngày là số sản phẩm làm
ra trong mỗi ngày của mỗi công nhân. NSLĐ của công nhân chịu ảnh hưởng bởi bậc
thợ và tuổi nghề.
Ở đây ta sẽ nghiên cứu từng tiêu thức, trước hết ta nghiên cứu tiêu thức tuổi nghề
có ảnh hưởng đến năng suất lao động.
Phân tổ CN Số công tổng sản phẩm Bậc thợ bình NSLĐ bình
theo tuổi nhân sản xuất(tr. Đ) quân quân mỗi
nghề(năm) CN(tr.
đ/CN)
2-4 13 2.5 300
5-7 17 3 370
8-10 9 3.7 400
Kết luận: Bảng phân tổ nêu rõ ảnh hưởng của tuổi nghề đến NSLĐ, tuổi nghề càng
tăng, NSLĐ càng tăng, đồng thời ta cũng thấy tuổi nghề tăng thì bậc thợ bình quân
cũng tăng và như vậy NSLĐ của công nhân trong trường hợp này cũng chịu ảnh
hưởng của bậc thợ.
b. Phân tổ liên hệ giữa nhiều tiêu thức (phân tổ kết hợp)
Phân tổ liên hệ giữa nhiều tiêu thức tức là nghiên cứu mối liên hệ giữa nhiều tiêu
thức, chẳng hạn nghiên cứu mối liên hệ giữa NSLĐ với tuổi nghề, bậc thợ, mức trang
thiết bị hoặc nghiên cứu giữa năng suất lúa với loại giống, mật độ cấy, lượng phân
bón…
Trong trường hợp này tài liệu được phân tổ theo tiêu thức nguyên nhân thứ 1 sau
đó trong mỗi tổ lại tiếp tục phân thành các tiểu tổ theo tiêu thức nguyên nhân thứ 2 …
Cuối cùng tính trị số bình quân của tiêu thức kết quả cho từng tổ và tiểu tổ

Nguyên lý thống kê
- 19 -

Ví dụ: Nghiên cứu mối liên hệ giữa sản lượng sản xuất bình quân 1 công nhân với
giới tính và tuổi nghề, giữa giới tính và tuổi nghề tính bình quân cho 1 công nhân ta có
kết quả phân tổ sau:
Phân tổ công nhân Số CN (người) Tổng sản SL bquân (sản
Theo Theo tuổi nghề lượng phẩm/1 CN)
gtính (năm) ( chiếc)
Nam 2-4 15 100 6,66
5-7 17 250 14,7
8-10 10 240 24
Cả tổ 42 590 14
Nữ 2-4 17 105 6,17
5-7 14 117 8,35
8-10 15 230 15,3
cả tổ 46 452 9,8
Chung cả 88 1042 11,8
XN
Nhận xét: Bảng phân tổ kết hợp trên cho thấy ảnh hưởng của giới tính đến NSLĐ
bình quân, NSLĐ bình quân của công nhân nam cao hơn nữ, trong mỗi tổ được phân
theo giới tính có nhiều tiểu tổ được phân theo tuổi nghề và tuổi nghề càng cao thì
NSLĐ càng cao. Như vậy NSLĐ của nam công nhân có tuổi nghề càng cao sẽ càng
cao
III. Những vấn đề cần giải quyết khi tiến hành phân tổ thống kê:
1. Chọn tiêu thức phân tổ:
a. Khái niệm, ý nghĩa:
- Khái niệm: tiêu thức phân tổ là tiêu thức được chọn làm căn cứ để tiến hành phân
tổ thống kê.
Ví dụ: Phân tổ nhân khẩu theo giới tính (giới tính là tiêu thức phân tổ)
- Ý nghĩa: Trên thực tế có rất nhiều tiêu thức phân tổ, có những tiêu thức phản ánh
được bản chất của hiện tượng, có những tiêu thức không phản ánh được bản chất của
hiện tượng. Vì vậy nếu chọn nó làm căn cứ để tiến hành phân tổ thì không đáp ứng
được mục đích nghiên cứu, thậm chí làm chúng ta hiểu sai lệch về bản chất của hiện
tượng, do đó để phân tổ 1 cách chính xác và khoa học thì phải lựa chọn chính xác tiêu
thức phân tổ
b. Nguyên tắc lựa chọn tiêu thức phân tổ: Để lựa chọn chính xác tiêu thức phân tổ
thì phải tuân thủ một số nguyên tắc sau:
- Dựa trên cơ sở phân tích lý luận để lựa chọn tiêu thức bản chất phù hợp với mục
đích nghiên cứu.
Ví dụ: Nghiên cứu về quy mô của các xí nghiệp thuộc thành phố X: ta phải nghiên
cứu:
o Số công nhân
o Giá trị máy móc thiết bị
o Giá trị tổng sản lượng
Như vậy trong từng trường hợp cụ thể ta sẽ chọn một tiêu thức cụ thể trong số các
tiêu thức đó để nghiên cứu, chẳng hạn căn cứ vào mục đích nghiên cứu cũng như tài
liệu thu thập được để chọn một tiêu thức phù hợp.
Nguyên lý thống kê
- 20 -

- Phải căn cứ vào điều kiện lịch sử cụ thể của hiện tượng để lựa chọn tiêu thức
phù hợp nhất.
Ví dụ: Nghiên cứu về quy mô của các XN: trước đây dùng giá trị tổng sản lượng,
bây giờ dùng giá trị sản xuất
2. Xác định số tổ và khoảng cách tổ:
Sau khi lựa chọn được tiêu thức phân tổ thích hợp, vấn đề tiếp theo là phải phân
chia tổng thể thành bao nhiêu tổ với khoảng cách tổ như thế nào. Thông thường số tổ
cần thiết được xác định dựa vào tính chất của tiêu thức phân tổ và mục đích nghiên
cứu
a. Phân tổ theo tiêu thức thuộc tính:
Khi phân tổ theo tiêu thức thuộc tính, số tổ hình thành không phải do sự khác nhau
về mặt lượng, mà do tính chất khác nhau, hoặc thuộc các loại hình kinh tế xã hội khác
nhau, tồn tại trong bản thân hiện tượng.
Phân tổ theo tiêu thức thuộc tính có hai trường hợp:
+ Trường hợp giản đơn: khi tiêu thức thuộc tính có số biểu hiện ít.
Ví dụ: Phân tổ nhân khẩu theo giới tính (có hai biểu hiện: nam và nữ).
Phân tổ các xí nghiệp công nghiệp theo thành phần kinh tế (có hai biểu hiện: quốc
doanh và ngoài quốc doanh).
Trong trường hợp này thì cứ mỗi biểu hiện của tiêu thức thuộc tính có thể hình
thành một tổ và số tổ đã hình thành từ trước
+ Trường hợp phức tạp: khi tiêu thức thuộc tính có quá nhiều biểu hiện.
Ví dụ: Phân tổ nhân khẩu theo nghề nghiệp, phân tổ các sản phẩm công nghiệp
theo giá trị sử dụng, phân tổ các sản phẩm nông nghiệp, phân tổ các ngành kinh tế
quốc dân.....trong trường hợp này người ta thường ghép nhiều biểu hiện thành một tổ
hoặc nhiều tổ nhỏ thành tổ lớn theo nguyên tắc các biểu hiện các tổ phải giống nhau
hoặc gần giống nhau một tính chất nào đó hay về giá trị sử dụng.
Trên thực tế, việc phân loại nhân khẩu theo nghề nghiệp, phân loại hàng hoá theo
công dụng, người ta thường căn cứ vào bảng phân loại hay bảng danh mục do nhà
nước quy định thống nhất và cố định trong thời gian dài để đảm bảo tính chất so sánh
được của tài liệu thống kê.
b. Phân tổ theo tiêu thức số lượng:
Khi phân tổ theo tiêu thức này phải căn cứ vào sự khác biệt về lượng biến của tiêu
thức phân tổ (lượng biến) để xác định số tổ khác nhau về tính chất.
Tuỳ theo lượng biến của tiêu thức phân tổ thay đổi nhiều hay ít mà cách phân tổ
được giải quyết khác nhau. người ta chia thành 2 trường hợp:
- Trường hợp giản đơn: (nếu lượng biến là rời rạc không liên tục): tiêu thức số
lượng chỉ có vài biểu hiện tức là sự thay đổi về lượng giữa các đơn vị không nhiều
như: bậc thợ của công nhân, số người trong một hộ, số máy công nhân phụ trách…
Trong trường hợp này thì cứ mỗi biểu hiện của tiêu thức số lượng có thể hình thành
nên 1 tổ
Ví dụ: Số máy công nhân phụ trách hoặc số người, trong trường hợp này số tổ có 1
giới hạn nhất định vì vậy mỗi mức lượng biến hình thành nên 1 tổ
Ví dụ: Phân tổ số hộ gia đình theo số nhân khẩu trong một hộ tại địa phương X:
Số nhân khẩu trong 1 Số hộ gia đình
hộ

Nguyên lý thống kê
- 21 -

2 20
3 30
4 40
5 50
6 30
7 20
8 25
9 10
10 5

- Trường hợp phức tạp: khi lượng biến giữa các đơn vị biến thiên nhiều: tức là sự
biến thiên về lượng giữa các đơn vị rất lớn như tuổi đời, tuổi nghề, giá trị tài sản cố
định của xí nghiệp..Trường hợp này cần chú ý đến mối liên hệ giữa lượng và chất, tức
cần xem xét lượng biến tích luỹ đến một mức độ nào thì chất thay đổi và lúc đó nên
hình thành tổ mới.
Ví dụ: Điểm trung bình học tập của sinh viên, tuổi đời của nhân khẩu, trong trường
hợp này người ta áp dụng quy luật lượng biến và chất biến để nối kết các mức lượng
biến thành 1 tổ, như vậy mỗi tổ bao gồm 1 phạm vi lượng biến với 2 giới hạn rõ rệt:
giới hạn trên và giới hạn dưới
+ Giới hạn dưới là lượng biến nhỏ nhất làm cho tổ hình thành
+ Giới hạn trên là lượng biến lớn nhất của tổ nếu vượt qua giới hạn này thì chất
của hiện tượng thay đổi và lúc đó hình thành nên tổ mới.
+ Chênh lệch giữa giới hạn trên và giới hạn dưới gọi là khoảng cách tổ
- Nếu trị số khoảng cách tổ của các tổ bằng nhau thì người ta gọi là phân tổ với
khoảng cách tổ đều và ngược lại người ta gọi là phân tổ với khoảng cách tổ không đều.
- Trị số của khoảng cách tổ khi phân tổ có khoảng cách tổ đều nhau được xác
định:
+ Áp dụng được cho lượng biến liên tục và lượng biến không liên tục:
xmax  xmin
h
k
h: trị số của khoảng cách tổ
xmax: lượng biến lớn nhất của tiêu thức phân tổ
xmin: lượng biến nhỏ nhất của tiêu thức phân tổ
k: số tổ định chia
 Việc phân tổ khoảng cách tổ đều hoặc không đều là tuỳ thuộc vào đặc điểm của
hiện tượng nghiên cứu nhưng làm sao số đơn vị được phân phối vào 1 tổ phải giống
nhau về tính chất và sự khác nhau về lượng giữa các tổ phải phản ánh được sự khác
nhau về chất giữa các tổ đó.
Ví dụ: Phân tổ các xí nghiệp theo số công nhân thành 4 tổ có khoảng cách tổ đều:
203, 270, 290, 400, 455, 600, 780, 840, 1040, 1100, 1315, 1403
x max  x min 1403  203
h   300
k 4
- Tiến hành phân tổ:
Nguyên lý thống kê
- 22 -

Số công nhân Số xí nghiệp


203-503 5
503-803 2
803-1103 3
1103-1403 2
+ Áp dụng cho trường hợp lượng biến không liên tục có thể tính theo công
thức:
x max  x min  (k  1)
h
k
3. Xác định các chỉ tiêu giải thích
Trong phân tổ ngoài việc xác định tiêu thức phân tổ và số tổ người ta còn xác định
các chỉ tiêu giải thích, nó giúp ta thấy được đặc trưng của mỗi tổ cũng như của cả tổng
thể đồng thời làm cơ sở để so sánh giữa các tổ với nhau cũng như để tính các chỉ tiêu
phân tích thống kê khác
Ví dụ: Phân tổ các xí nghiệp theo thành phần kinh tế, với mục đích là nghiên cứu
quy mô của các xí nghiệp , tổng thể nghiên cứu là các xí nghiệp trong cả nước, ta có
thể đề ra một số chỉ tiêu giải thích như:

Ptổ các XNCN theo Các chỉ tiêu giải thích


tpktế SXN SCN GTTSCĐ
- Tư nhân
- Tập thể
- Liên doanh
- Nhà nước
- Mỗi chỉ tiêu giải thích có ý nghĩa riêng giúp ta thấy rõ đặc trưng về lượng của
mỗi tổ và chung của tổng thể, làm căn cứ so sánh các tổ với nhau và để tính toán 1 số
chỉ tiêu phân tích khác.
- Khi lựa chọn các chỉ tiêu giải thích cần chú ý:
+ Phải căn cứ vào mục đích nghiên cứu để lựa chọn các chỉ tiêu giải thích cho
phù hợp.
+ Các chỉ tiêu giải thích phải có mối quan hệ ràng buộc lẫn nhau để tạo thành 1
hệ thống các chỉ tiêu nhằm phản ánh hiện tượng 1 cách sâu sắc và toàn diện
+ Các chỉ tiêu giải thích có ý nghĩa trong việc so sánh thì cần được bố trí gần
nhau. chẳng hạn chỉ tiêu kế hoạch và thực hiện, chỉ tiêu tương đối và tuyệt đối.
IV. Dãy số phân phối:
1. Định nghĩa:
Sau khi phân tổ tổng thể theo một tiêu thức nào đó, các đơn vị tổng thể được phân
phối vào trong các tổ và ta sẽ có một dãy số phân phối
Ví dụ: Phân phối công nhân trong doanh nghiệp theo mức lương
2. Ý nghĩa:
Dãy số phân phối giúp ta nghiên cứu được kết cấu của tổng thể và sự biến động của
kết cấu, mặt khác còn là cơ sở để tính 1 số chỉ tiêu phân tích thống kê khác

Nguyên lý thống kê
- 23 -

3. Các loại dãy số phân phối:


a. Dãy số phân phối theo tiêu thức thuộc tính (dãy số thuộc tính) hình thành do
việc phân tổ tổng thể theo tiêu thức thuộc tính
Ví dụ: phân tổ nhân khẩu theo giới tính
b. Dãy số phân phối theo tiêu thức số lượng: (dãy số lượng biến)
Dãy số này được hình thành do việc phân tổ tổng thể theo tiêu thức số lượng
Dãy số lượng biến có dạng tổng quát:
Lượng biến (xi) tần số (fi)
X1 F1
X2 F2
. .
. .
.
xn fn
Lượng biến (xi): là các biểu hiện cụ thể của tiêu thức số lượng
Tần số (fi): là số lần lặp lại của mỗi mức lượng biến trong tổng thể
Khi tần số biểu hiện bằng số tương đối thì người ta gọi là tần suất (di)
Tần số tích luỹ :là tần số được cộng dồn theo thứ tự của các mức lượng biến trong
dãy số
 Chú ý:
- Đối với lượng biến không liên tục thì dãy số phân phối có thể có khoảng cách tổ
hoặc không có khoảng cách tổ
- Đối với lượng biến liên tục thì dãy số phân phối phải có khoảng cách tổ
- Đối với dãy số phân phối theo tiêu thức số lượng có khoảng cách tổ không bằng
nhau thì tần số giữa các tổ không thể trực tiếp so sánh với nhau được vì phụ thuộc vào
khoảng cách tổ, do đó để so sánh được ta phải tính mật độ phân phối
Tan so (tan suat )
Mat do phan phoi 
Tri so khoang cach
Ví dụ: Tính các cột còn thiếu cho bảng thống kê sau:

Tiền Khoảng cách Số công nhân Tần số tích Mật độ
lương(trd/cn) tổ lũy phân phối
Tuyệt đối %
5-7 60
7-10 54
10-15 78
15-20 92
20-30 40
30-35 30
35-40 24

Nguyên lý thống kê
- 24 -

Giải:

Tiền Khoảng Số công nhân Tần số Mật độ


lương(trd/cn)(xi) cách tổ(h) tích lũy phân phối
Tuyệt đối(fi) Tần
suất(di)%
5-7 2 60 15.9 60 60/2=30
7-10 3 54 14.3 114 54/3
10-15 5 78 20.6 192 78/5
15-20 5 92 24.3
284 92/5
20-30 10 40 324 40/10
10.6
30-35 5 30 354 30/5
35-40 5 24 7.9 378 24/5
Tổng 378 6.3
100.0

V. Ứng dụng phần mềm SPSS trong phân tổ thống kê (phần 2)


5.1. Mã hóa lại dữ liệu (phân tổ thống kê)
Thủ tục Recode into Different Variables gán lại các trị số của các biến có sẵn hoặc
các phạm vi của các trị số có sẵn vào các trị số mới của một biến mới. Ví dụ bạn có thể
mã hoá lương năm của đối tượng điều tra vào một biến mới có các trị số là lương năm
nhưng chia theo khoảng.
5.1.1. Recode into Different Variables (Để mã hoá lại dữ liệu sang biến mới)
 Từ thanh menu chọn
Transform
Recode
Into Different Variables...
 Chọn các biến mà bạn muốn mã hoá, Nếu bạn chọn nhiều biến, chúng phải có
cùng dạng (chuỗi hoặc số)
 Nhập một tên biến mới cho từng biến và nhắp Change.
 Nhắp Old and New Values và định rõ cách mã hoá lại trị số.
Một cách tuỳ chọn, bạn có thể chọn một nhóm các đối tượng để mã hoá
Hình 6-10: Hộp thoại Old and New Values

Nguyên lý thống kê
- 25 -

( bài tập ví dụ tổng kết chương)


5.1.2. Hộp thoại Recode into Same Variables: Old and NewValues
Bạn có thể xác định các trị số để mã hoá trong hộp thoại này. Mọi chỉ định về trị số
phải cùng loại dữ liệu (dạng số hay dạng chuỗi) giống như của các biến đã được chọn
trong hộp thoại chính.
Sau khi mã hóa lại dữ liệu biến mới sẽ thay thế cho biến cũ
Để mã hóa ta thực hiện như sau:
Vào Transform/Recode Into same Variables..., hộp thoại xuất hiện, trong hộp thoại
chọn biến cần mã hóa đưa vào danh sách biến đích, chọn old and new values, sẽ
xuất hiện hộp thoại sau

Mã hóa lại dữ liệu sau đó bấm continue/OK sẽ được kết quả.

Nguyên lý thống kê
- 26 -

5.2. Lập bảng tần số


Bảng tần số có thể được thực hiện với tất cả các biến kiểu số (định tính và định
lượng). Trong trường hợp biến định lượng liên tục có quá nhiều giá trị, bảng tần số sẽ
rất dài, chúng ta có thể phân tổ (bằng lệnh recode) trước khi lập bảng tần số.
Sau khi mở file data thực hành, vào Analyze>Descriptive statistics>Frequencies…
Hộp thoại Frequencies xuất hiện:

Chọn biến muốn lập bảng tần số (nhấp chuột vào tên biến). Ví dụ ta lần lượt chọn
hai biến bactho (bậc thợ) và tuoinghe (tuổi nghề) rồi bấm phím mũi tên qua phải để
đưa biến đang chọn vào ô variable

Sau đó nhấn nút Ok, ta được 2 bảng tần số kết quả cho 2 biến đã chọn như sau:
Statistics
Nguyên lý thống kê
- 27 -

tuoi
bac tho nghe
N Valid 50 50
Missin
0 0
g

Dòng Valid cho biết số quan sát hợp lệ (số người có trả lời)
Dòng Mising cho biết số quan sát bị thiếu dữ liệu (số người không trả lời)
Trong 2 bảng tần số bên dưới , mỗi bảng có 4 cột số liệu:
Cột Frequency: tần số
Cột Percent: tần suất/ phần trăm
Cột Valid percent : phần trăm hợp lệ, tính trên số quan sát có thông tin trả lời. Sử
dụng khi có Missing value
Cột Cumulative percent : phần trăm tích lũy, cộng dồn các phần trăm hợp lệ.
bac tho

Frequen Valid Cumulativ


cy Percent Percent e Percent
Vali 2 13 26,0 26,0 26,0
d 3 24 48,0 48,0 74,0
4 13 26,0 26,0 100,0
Tota
50 100,0 100,0
l

tuoi nghe

Frequen Valid Cumulativ


cy Percent Percent e Percent
Vali 2 11 22,0 22,0 22,0
d 3 11 22,0 22,0 44,0
4 10 20,0 20,0 64,0
5 6 12,0 12,0 76,0
6 4 8,0 8,0 84,0
7 2 4,0 4,0 88,0
8 3 6,0 6,0 94,0
9 1 2,0 2,0 96,0
10 2 4,0 4,0 100,0
Tota
50 100,0 100,0
l

Nguyên lý thống kê
- 28 -

5.3. Lập bảng tổng hợp nhiều biến


5.3.1. Bảng 2 biến định tính:
Để lập bảng 2 biến định tính ta vào Custom tables như sau:

Colums: ô chứa biến cột, tạo nên các cột của bảng
Row: ô chứa biến dòng, tạo nên các dòng của bảng.
Summary statistic: chọn hàm để tính các đại lượng thống kê cần thiết. Đối với biến
định tính, hàm thường dùng là: count (tần số), row%(phần trăm theo dòng), col%
(phần trăm theo cột).
Categories and totals: tính dòng cộng và cột cộng
Nhấp chuột vào biến cần chọn, kéo vào ô cột và ô dòng. Chọn các hàm thống kê, ví
dụ chọn hàm count và hàm col%, kết quả như sau:
bac tho
2 3 4
Count Column N Count Column N Count Column N
Nguyên lý thống kê
- 29 -

% % %
tuoi 2-4 12 92,3% 16 66,7% 4 30,8%
nghe 5-7 1 7,7% 7 29,2% 4 30,8%
to 8-10 0 ,0% 1 4,2% 5 38,5%
Kích chuột vào Totals, kết quả xuất hiện như sau:
bac tho
2 3 4 Total
Count % Count % Count % Count %
Tuoi 2-4 12 92,3% 16 66,7% 4 30,8% 32 64,0%
nghe 5-7 1 7,7% 7 29,2% 4 30,8% 12 24,0%
to 8-10 0 ,0% 1 4,2% 5 38,5% 6 12,0%
Tota
13 100,0% 24 100,0% 13 100,0% 50 100,0%
l
5.3.2. Bảng 2 biến định tính và một biến định lượng
Ví dụ nghiên cứu mối liên hệ giữa bậc thợ, tuổi nghề và năng suất lao động:
Vào Analyze/Tables/custom tables xuất hiện hộp thoại:

Nguyên lý thống kê
- 30 -

Nhấp chuột vào biến cần chọn: nhấp chuột vào biến bactho kéo vào ô cột, nhấp
chuột vào biến tngheto kéo vào ô dòng, nhấp chuột vào nsld kéo vào ô cột. Chọn các
hàm thống kê, ví dụ chọn hàm count và hàm mean, nhấp vào Categories and totals:
tính dòng cộng và cột cộng, kết quả như sau:
nng suat lao dong
bac tho
2 3 4 Total
scn nsld scn nsld scn nsld scn nsld
To 2-4 12 3,9 16 5,1 4 5,8 32 4,7
5-7 1 5,2 7 5,8 4 5,1 12 5,5
8-10 0 . 1 6,1 5 5,2 6 5,3
Tota
13 4,0 24 5,4 13 5,3 50 5,0
l
Ví dụ tổng kết chương:
Ví dụ 1:
Có tài liệu thu thập được về số nhân viên bán hàng của 40 cửa hàng thương mại thuộc
một thành phố trong kỳ báo cáo như sau:
25 24 15 20 19 10 5 24 18 14
7 4 5 9 13 17 1 23 8 3
16 12 7 11 22 6 20 4 10 12
21 15 5 19 13 9 14 18 10 15
Yêu cầu:
1. Hãy căn cứ theo số nhân viên bán hàng, phân tổ các cửa hàng nói trên thành 5
tổ có khoảng cách đều nhau.
2. Hãy tính tần suất phân phối, tần số tích lũy của dãy số đã xây dựng ở câu 1.
3. Hãy dùng SPSS để phân tổ cho tổng thể trên.
Giải:
1. Xác định trị số khoảng cách tổ theo công thức:
xmax  xmin  (k  1) 25  1  (5  1)
h  4
k 5
Bảng phân tổ như sau:

Nguyên lý thống kê
- 31 -

2.

Số nhân viên Số cửa Tần suất Tần số


hàng (d=fi/  fi tích lũy

1-5 7 17,5 7
6-10 9 22,5 16
11-15 10 25 26
16-20 8 20 34
21-25 6 15 40

3.Dùng SPSS:
- Bước 1: Khai báo biến: số nhân viên bán hàng
- Bước 2: Nhập dữ liệu
- Bước 3: Xử lý dữ liệu

Để phân tổ có khoảng cách tổ ta vào:

Kích vào ô Old and new values, hộp thoại sau xuất hiện:

Nguyên lý thống kê
- 32 -

Sau đó Continue/change/Ok.
Tiếp tục thực hiện như sau : Vào Analyze/Descriptive statistics/Frequencies
Hộp thoại xuất hiện :

Nhấn Ok và đọc kết quả


phan to nhan vien

Frequen Valid Cumulativ


cy Percent Percent e Percent
Vali 1-5 7 17.5 17.5 17.5
d 11-
10 25.0 25.0 42.5
15
16-
8 20.0 20.0 62.5
20
21-
6 15.0 15.0 77.5
25
6-10 9 22.5 22.5 100.0
Total 40 100.0 100.0

Ví dụ 2:Hãy phân tổ công nhân để nghiên cứu mối liên hệ


STT Bậc thợ Tuổi nghề Năng suất lao
(năm) động ngày (m3)
1 2 2 3.0
2 3 3 6.5
3 3 2 4.8
4 3 4 5.7
5 2 2 2.8
6 3 3 4.7
7 2 3 4.2
8 4 3 5.3

Nguyên lý thống kê
- 33 -

9 3 2 2.0
10 3 5 6.5

1. Giữa năng suất lao động và bậc thợ (3 tổ).


2. Phân tổ công nhân để nghiên cứu mối liên hệ giữa năng suất lao động với
tuổi nghề, bậc thợ. (3 tổ)
Giải:
1. Nghiên cứu mối liên hệ giữa NSLD với Bậc thợ:
Lập bảng phân tổ:
Bậc thợ Số công nhân NSLD
2 3 3,333
3 6 5,03
4 1 5,3
Chọn tiêu thức nguyên nhân làm căn cứ phân tổ đó là tuổi nghề, sau đó đếm
số công nhân từng tổ rồi tính năng suất lao động bình quân của từng tổ bằng
cách cộng NSLD của những người có tuổi nghề từ 2 đến 4 rồi chia cho số
người để được NSLD bình quân, sau đó nhân xét mối liên hệ.
 Sử dụng SPSS:
Sau khi khai báo và nhập liệu vào Analyze/Tables/custom tables
Hộp thoại xuất hiện
Kích chuột vào biến tuoinghe kéo qua cột, kích chuột vào biến NSLD kéo qua
hàng, tính toán thống kê băng lệch summary statistícs, sau đó ok sẽ được kết
quả.
Ví dụ 3:
Có tài liệu về lợi nhuận của các doanh nghiệp
STT Lợi nhuận giá bán Năng lực nhân viên
1 24 200 Khá
2 20 380 Khá
3 27 380 Khá
4 40 500 Tốt
5 18 200 TB
6 26 380 TB
7 32 500 Khá
8 35 200 TB
9 42 380 Tốt
10 25 500 TB
11 27 500 TB
12 34 380 Tốt
1. Phân tổ để nghiên cứu mối liên hệ giữa lợi nhuận, năng lực nhân viên (3 tổ)
2. Phân tổ để nghiên cứu mối liên hệ giữa lợi nhuận, giá bán, năng lực nhân viên
(3 tổ)
Giải:
1. Nghiên cứu mối liên hệ giữa lợi nhuận và năng lực nhân viên:
Lập bảng phân tổ:
Năng lực nhân viên Số doanh nghiệp Lợi nhuận mỗi doanh

Nguyên lý thống kê
- 34 -

nghiệp
Tốt 3 38,67
Khá 4 25,75
Trung bình 5 26,2
Chọn tiêu thức nguyên nhân làm căn cứ phân tổ đó là năng lực nhân viên,
sau đó đếm số doanh nghiệp từng tổ rồi tính lợi nhuận bình quân của từng tổ
sau đó nhân xét mối liên hệ.

2. Nghiên cứu mối liên hệ giữa lợi nhuân, giá bán và năng lực nhân viên
Lập bảng phân tổ:

Phân tổ doanh nghiệp Số doanh Tổng lợi nhuận Lợi nhuận mỗi
Theo Theo giá bán nghiệp doanh nghiệp
NLNV
Tốt 200
380
500
Cả tổ
Khá 200
380
500
cả tổ
Trung 200
bình 380
500
Chung cả
XN

BÀI TẬP CUỐI CHƯƠNG


I. Trắc nghiệm
Câu 1: Trong phân tổ thống kê, mỗi tổ chỉ có 1 lượng biến gọi là:
a. phân tổ có khoảng cách tổ đều
b. Phân tổ có khoảng cách tổ không đều
c. Phân tổ không có khoảng cách tổ
Nguyên lý thống kê
- 35 -

d. Cả 3 câu a, b, c đều sai


Câu 2: Công thức tính trị số khoảng cách tổ

xmax  xmin  (k  1)
h
k
được áp dụng cho trường hợp:
a. Tiêu thức số lượng liên tục
b. Tiêu thức số lượng liên tục và không liên tục
c. Tiêu thức số lượng không liên tục
d. Cả 3 câu a, b, c đều đúng
Câu 3: Tổ mở là tổ:
a. không có giới hạn dưới và không có giới hạn trên
b. có giới hạn dưới và có giới hạn trên
c. không có giới hạn dưới hoặc không có giới hạn trên
d. Cả 3 câu a, b, c đều sai
Câu 4 : Tần số là :
a. số lần lặp lại của mỗi mức lượng biên trong tổng thể
b. là số đơn vị được phân phối vào trong mỗi tổ
c. cả a, b đều đúng
Câu 5 : Tần số tích lũy là :
a. các biểu hiện của tiêu thức số lượng
b. tần số được cộng dồn theo thứ tự các mức lượng biến
c. tần số được biểu hiện bằng số tương đối
d. Cả 3 câu a, b, c đều sai
Câu 6 : Không tính được mật độ phân phối trong trường hợp :
a. Tài liệu phân tổ không có khoảng cách tổ
b. Tài liệu phân tổ có khoảng cách tổ đều
c. Tài liệu phân tổ có khoảng cách tổ không đều
d. Cả 3 câu a, b, c đều đúng
Câu 7: Điều tra ……………tạo ra khả năng theo dõi tỷ mỉ tình hình biến động của
hiện tượng theo thời gian
a. Toàn bộ
b. Không toàn bộ
c. Không Thường xuyên
d. thường xuyên
Câu 8: Điều tra thời gian hoàn thành một sản phẩmcủa 20 công nhân, người ta thu
được mẫu số liệu sau (thời gian tính bằng phút).
10 12 13 15 11 13 16 18 19 21
23 21 15 17 16 15 20 13 16 11
Có bao nhiêu giá trị khác nhau trong mẫu số liệu trên
a. 10 b. 12 c. 20 d. 23
Câu 9. Căn cứ để xác định tiêu thức phân tổ thống kê:

Nguyên lý thống kê
- 36 -

a. Quy mô của hiện tượng


b. Thời gian của hiện tượng
c. Mục đích nghiên cứu và điều kiện lịch sử của hiện tượng
d. Không gian của hiện tượng
II. Bài tập
Bài 1:
Có tài liệu thu thập được về bậc thợ của 98 công nhân trong một xí nghiệp như
sau:
1 3 2 4 3 1 2 7 1 3 4 3 2 4
2 4 3 5 6 2 6 3 3 4 3 2 4 3
1 4 3 1 2 3 1 3 4 2 3 4 1 6
2 4 3 5 1 4 2 6 3 5 4 2 1 3
1 7 6 5 4 6 3 1 2 4 5 3 6 2
3 4 5 1 3 3 5 3 2 4 3 5 4 1
5 4 3 5 2 3 6 4 5 6 7 1 4 1
Yêu cầu:
1. Hãy xây dựng dãy số phân phối nhằm phán ánh tình hình phân phối công nhân
của xí nghiệp theo bậc thợ.
2. Tính tần số tích luỹ.
3. Biểu diễn kết quả lên đồ thị.
4. Hãy dùng SPSS để phân tổ cho tổng thể trên.
Bài 2:
Tại một xí nghiệp, ta thu thập thông tin về thời gian cần thiết để hoàn thành một
loại sản phẩm của 50 công nhân như sau: (đơn vị: phút)
20.8 22.8 21.9 22.0 20.7 20.9 25.0 22.2 22.8 20.1
25.3 20.7 22.5 21.2 23.8 23.3 20.9 22.9 23.5 19.5
23.7 20.3 23.6 19.0 25.1 25.0 19.5 24.1 24.2 21.8
21.3 21.5 23.1 19.9 24.2 24.1 19.8 23.9 22.8 23.9
19.7 24.2 23.8 20.7 23.8 24.3 21.1 20.9 21.6 22.7
Yêu cầu:
1. Phân tài liệu thành 7 tổ với khoảng cách tổ đều nhau.
2. Tính tần suất và tần số tích luỹ, tính mật độ phân phối của các tổ.
3. Vẽ đồ thị tần số.

Bài 3
Có tài liệu cho trong bảng sau:

Tuổi Số công nhân Tần số tích luỹ Tần suất (%) Tần suất tích
nghề tiến luỹ
2 20
3 15
4 45
5 80
6 90
7 30
Nguyên lý thống kê
- 37 -

8 25
9 10
1. Tính các số liệu còn thiếu cho trong bảng.
2. Cho biết ý nghĩa của mỗi số liệu tính được.
Bài 4
Có 80 học sinh tham dự kì thi học sinh giỏi toán (thang điểm là 20) với kết quả sau:
Điểm 8 9 10 11 12 13 14 15 16 17 Tổng
Tần số 4 5 * 14 8 *** 6 10 2 3 N =
80
Tần suất (%) 5 6,25 15 ** 10 20 7,5 **** 2,5 3,75 100
Hãy điền số thích hợp vào các ô còn trống trong bảng số liệu trên
Bài 5. Có tài liệu về lợi nhuận của các doanh nghiệp
STT Lợi nhuận Chi phí quảng cáo Năng lực nhân
viên
1 24 200 Khá
2 20 220 Khá
3 27 300 Khá
4 40 448 Tốt
5 18 250 TB
6 26 380 TB
7 32 400 Khá
8 35 365 TB
9 42 390 Tốt
10 25 280 TB
11 27 270 TB
12 34 362 Tốt

1. Phân tổ để nghiên cứu mối liên hệ giữa lợi nhuận và chi phí quảng cáo (3tổ)
2. Phân tổ để nghiên cứu mối liên hệ giữa lợi nhuận và năng lực nhân viên (3 tổ)
3. Phân tổ để nghiên cứu mối liên hệ giữa lợi nhuận, chi phí quảng cáo và năng lực
nhân viên(3 tổ)

CHƯƠNG III: CÁC MỨC ĐỘ CỦA HIỆN TƯỢNG KINH TẾ - XÃ HỘI


 Mục tiêu của chương:
Sau khi nghiên cứu chương này, sinh viên cần nắm các vấn đề sau:
- Nắm vững số tuyệt đối là gì, phân biệt được các loại số tuyệt đối.
- Nắm vững số tương đối là gì, cách xác định các loại số tương đối, nêu được ý
nghĩa của từng loại số tương đối và biết cách vận dụng các loại số tương đối đó
để giải các bài tập cụ thể.
- Hiểu rõ nội dung, ý nghĩa của số bình quân, cách tính các loại số bình quân,
phân biệt được các công thức tính bình quân để áp dụng đúng vào từng trường
hợp bài tập cụ thể.
Nguyên lý thống kê
- 38 -

- Hiểu rõ nội dung và ý nghĩa của các chỉ tiêu đánh giá độ biến thiên tiêu thức,
cách xác định các chỉ tiêu đánh giá độ biến thiên tiêu thức.
I. Số tuyệt đối
1. Khái niệm, đặc điểm và ý nghĩa số tuyệt đối trong thống kê
a. Khái niệm: Số tuyệt đối là loại chỉ tiêu biểu hiện quy mô, khối lượng của hiện
tượng kinh tế-xã hội trong điều kiện thời gian và địa điểm cụ thể.
Ví dụ: Giá trị sản xuất của công ty A vào năm 2013 là 300 triệu đồng
Tổng số sinh viên của 1 lớp học B trong năm 2012 là 50 sv
Số tuyệt đối nói lên số đơn vị của tổng thể hay bộ phận hoặc trị số của một chỉ tiêu
nào đó.
b. Đặc điểm:
Khác với đại lượng trong toán học, số tuyệt đối trong thống kê bao giờ cũng bao
hàm một nội dung kinh tế -xã hội cụ thể gắn liền với điều kiện thời gian và không gian
nhất định. Vì vậy, điều kiện để tính số tuyệt đối trong thống kê được chính xác là phải
hiểu rõ khái niệm, nội dung kinh tế của chỉ tiêu nghiên cứu, phải xác định chính xác
nội dung kinh tế xã hội cụ thể của chỉ tiêu và tiến hành điều tra tổng hợp một cách
khoa học
Ví dụ: Muốn xác định chỉ tiêu giá trị tổng sản lượng công nghiệp của một xí
nghiệp, trước tiên phải hiểu rõ khái niệm, nội dung của chỉ tiêu giá trị tổng sản lượng
và phương pháp tính chỉ tiêu đó, bởi vì trong nền kinh tế giá trị tổng sản lượng có
nhiều loại: giá trị sản lượng công nghiệp, giá trị sản lượng nông nghiệp...
c. Ý nghĩa:
- Nó được sử dụng rộng rãi trong mọi công tác nghiên cứu kinh tế - xã hội
- Thông qua nó, giúp ta nhận thức cụ thể về quy mô, khối lượng thực tế của hiện
tượng nghiên cứu : nó cho thấy nguồn tài nguyên từng vùng, cả nước... phản ánh kết
quả phát triển kinh tế và văn hoá, thành quả lao động sản xuất trong từng thời kỳ.
- STĐ là căn cứ đầu tiên để tiến hành phân tích thống kê, là cơ sở để tính các chỉ
tiêu khác.
- Là căn cứ trong việc xây dựng, chỉ đạo và kiểm tra tình hình thực hiện kế hoạch
2. Các loại số tuyệt đối trong thống kê;
Tuỳ theo đặc điểm của hiện tượng mà người ta chia số tuyệt đối làm 2 loại là: STĐ
thời kỳ và STĐ thời điểm.
a. STĐ thời kỳ: Nó phản ánh về quy mô, khối lượng của hiện tượng trong một độ
dài thời gian nhất định, nó hình thành thông qua việc tích luỹ về mặt lượng của hiện
tượng trong suốt thời gian nghiên cứu, vì vậy, STĐ thời kỳ của cùng chỉ tiêu có thể
cộng lại được với nhau để có một trị số ở thời kỳ dài hơn
Thời kỳ càng dài thì trị số chỉ tiêu càng lớn
Ví dụ: Lợi nhuận từng tháng là tất cả lợi nhuận thu được từ các hoạt động xảy ra
trong tháng, lợi nhuận của một quý là tổng lợi nhuận của cả 3 tháng cộng lại
b. STĐ thời điểm:
Phản ánh quy mô khối lượng của hiện tượng nghiên cứu tại một thời điểm nhất
định, loại số tuyệt đối này chỉ phản ánh quy mô, khối lượng tại một thời điểm nào đó,
trước và sau thời điểm đó có thể khác. Vì vậy muốn có số tuyệt đối thời điểm chính
xác và có ý nghĩa kinh tế cần phải xác định thời điểm nghiên cứu hợp lý và phải tổ

Nguyên lý thống kê
- 39 -

chức điều tra kịp thời, mặt khác cần chú ý việc cộng dồn các số tuyệt đối thời điểm
không có ý nghĩa kinh tế
Ví dụ: Giá trị tài sản cố định của công ty A vào 1.1.02 là 100 triệu đồng
3. Đơn vị tính của STĐ trong thống kê:
Bất kỳ số tuyệt đối nào trong thống kê cũng có đơn vị tính và tuỳ theo đặc điểm
của hiện tượng và mục đích nghiên cứu mà người ta sử dụng các đơn vị tính khác nhau
a. Đơn vị hiện vật: dùng để đo lường phù hợp với đặc điểm vật lý của hiện tượng
Người ta chia ra:
+ Đơn vị hiện vật tự nhiên : cái, chiếc, con, người...
+ Đơn vị hiện vật quy ước: tấn, tạ, yến, lít, met, km...
b. Đơn vị hiện vật quy đổi: là đơn vị đo lường dùng để tính toán tất cả các hiện
tượng giống nhau về đặc điểm vật lý hoặc giá trị sử dụng nhưng khác nhau một khía
cạnh nào đó
c. Đơn vị thời gian lao động: là đơn vị đo lường thời gian hao phí trong quá trình
sản xuất: ngày công, tháng công
d. Đơn vị tiền tệ: được sử dung rộng rãi trong kinh tế và trong thống kê vì nó giúp
ta tổng hợp và so sánh giữa các sản phẩm có giá trị sử dụng và đơn vị đo lường khác
nhau.
Tuy nhiên do giá cả biến động làm cho đơn vị tiền tệ không thể trực tiếp so sánh
được với nhau qua thời gian. Vì vậy, người ta thường dùng giá cố định ở một thời kỳ
nào đó.
Ví dụ: So sánh doanh số bán được của công ty A năm 2007 và 2008, ta lấy giá cố
định ở năm 2000 để làm gốc so sánh
II. Số tương đối trong thống kê
1. Khái niệm, đặc điểm, ý nghĩa của số tương đối trong thống kê:
a. Khái nịêm: Số tương đối là chỉ tiêu biểu hiện quan hệ so sánh giữa hai mức độ
của hiện tượng trong điều kiện thời gian và không gian nhất định.
Trường hợp sử dụng:
+ So sánh 2 chỉ tiêu thống kê cùng loại nhưng khác nhau về điều kiện thời gian
hoặc không gian
Ví dụ: - Giá trị sản xuất của công ty A năm 2008 là 100 triệu đồng
- Giá trị sản xuất của công ty B năm 2008 là 200 triệu đồng
Ta nói giá trị sản xuất của công ty A bằng 50 % so với công ty B
+ So sánh giữa hai chỉ tiêu thống kê khác nhau nhưng có mối quan hệ với nhau
Ví dụ: Mật độ dân số của địa phương A vào năm 2007 là 102 người/km
b. Đặc điểm:
Số tương đối trong thống kê là kết quả so sánh giữa hai chỉ tiêu thống kê đã có từ
trước và bất kỳ số tương đối nào cũng đều có gốc so sánh, do đó tuỳ theo đặc điểm của
hiện tưọng nghiên cứu và mục đích nghiên cứu mà ta chọn gốc so sánh khác nhau. Vì
vậy việc tính số tương đối trong thống kê khá phong phú
Ví dụ: So sánh mức độ thực tế với mức độ kế hoạch, so sánh mức độ thực tế kỳ
này với mức độ thực tế của kỳ trước, so sánh mức độ của mỗi bộ phận với mức độ của
cả tổng thể.
 Hình thức biểu hiện: số lần, %, phần nghìn, đơn vị kép.
c. Ý nghĩa:

Nguyên lý thống kê
- 40 -

STĐ được sử dụng rộng rãi để nêu lên mọi quan hệ so sánh
STĐ là chỉ tiêu không thể thiếu trong công tác xây dựng kế hoạch và kiểm tra tình
hình thực hiện kế hoạch ( Ví dụ: dựa vào lợi nhuận thu được năm 2008 là 30 triệu, xây
dựng kế hoạch cho năm 2009 và kiểm tra tình hình thực hiện bằng cách so sánh giá trị
thực tế với kế hoạch đặt ra)
STĐ được tính bằng phép so sánh cho nên nó phản ánh tình hình kinh tế xã hội
một cách có phê phán, trong khi đó số tuyệt đối mới đủ khái quát về quy mô khối
lượng của hiện tượng.
Ví dụ: Tình hình phát triển kinh tế của một quốc gia có thể thấy được thông qua cơ
cấu của các ngành công nghiệp, nông nghiệp, cơ cấu các mặt hàng xuất khẩu trong
tổng kinh ngạch xuất khẩu
STĐ thường được dùng để phản ánh tình hình thực tế khi cần đảm bảo tính chất bí
mật của số tuyệt đối.
2. Các loại số tương đối trong thống kê:
Tuỳ theo nội dung phản ánh mà người ta chia số tương đối thành 5 loại:
a. STĐ động thái: (thường tính chỉ tiêu tốc độ phát triển, chỉ số phát triển)
STĐ động thái phản ánh sự biến động của các mức độ của hiện tượng qua thời
gian. Chỉ tiêu này được tính bằng cách so sánh hai mức độ cùng loại của hiện tượng ở
hai thời kỳ (hay 2 thời điểm) khác nhau đó là giữa mức độ kỳ nghiên cứu hoặc mức độ
kỳ báo cáo so với kỳ gốc
trong đó: tdt: số tương đối động thái
y1: mức độ kỳ nghiên cứu hoặc kỳ báo cáo
y0: mức độ kỳ gốc
Ví dụ: Doanh số bán của công ty A vào năm 2017 là 100 triệu
Doanh số bán của công ty A vào năm 2018 là 200 triệu
y18 200
tdt    2  200%
y17 100
Nhận xét: Doanh số bán của công ty A năm 2018 bằng 200% so với năm 2017 tức
là tăng 100% so với năm 2017
 Khi có một dãy số về 1 chỉ tiêu nào đó qua thời gian, tuỳ theo cách so sánh ta
có các loại số tượng đối động thái khác nhau:
- STĐ động thái tính với kỳ gốc liên hoàn (tốc độ phát triển liên hoàn)
- Tốc độ phát triển định gốc: lấy một năm nào đó làm gốc so sánh thường là năm
đầu tiên trong dãy số
b. STĐ kế hoạch:
Dùng để lập các kế hoạch phát triển kinh tế xã hội và kiểm tra tình hình thực hiện
kế hoạch. Có 2 loại:
+ STĐ nhiệm vụ kế hoạch: nó phản ánh mức cần phải phấn đấu trong kỳ kế hoạch
và được tính bằng cách so sánh giữa mức độ kỳ kế hoạch đặt ra so với mức độ kỳ gốc
y kh
t kh 
y0
tkh: Số tương đối nhiệm vụ kế hoạch
ykh: mức độ kỳ kế hoạch

Nguyên lý thống kê
- 41 -

y0: mức độ kỳ gốc


Ví dụ: giá trị thực tế năm 2020 là 5 tỷ đồng, công ty đặt ra kế hoạch năm 2021 phải
đạt 10 tỷ đồng. Vậy STĐ nhiệm vụ kế hoạch là: 10/5 x 100% = 200%, vậy nhiệm
vụ đặt ra là phải tăng 100% so với năm 2020
+ STĐ hoàn thành kế hoạch: nó phản ánh mức đã đạt được trong kỳ kế hoạch và
được tính bằng cách so sánh giữa mức độ thực tế đã đạt được so với mức độ kỳ kế
hoạch đã đặt ra.
y1
t ht 
y kh
trong đó: tht: số tương đối hoàn thành kế hoạch
y1: mức độ thực tế kỳ báo cáo
 Chú ý:
- Các chỉ tiêu mà kế hoạch tăng lên mới là chiều hướng tốt thì STĐ hoàn thành kế
hoạch tính ra lớn hơn 100% thì gọi là vượt kế hoạch, còn nhỏ hơn 100% gọi là không
hoàn thành kế hoạch
- Đối với các chỉ tiêu mà kế hoạch giảm đi mới là chiều hướng tốt thì vượt kế
hoạch là nhỏ hơn 100%, lớn hơn 100% là không hoàn thành kế hoạch
Ví dụ: chỉ tiêu giá thành, lượng thời gian hao phí để sản xuất ra một đơn vị sản
phẩm giảm xuống mới là chiều hướng tốt
 Mối quan hệ giữa STĐ động thái và STĐ kế hoạch:
STĐ động thái = STĐ kế hoạch x STĐ hoàn thành kế hoạch
y1 y kh y1
 
y0 y 0 y kh
Ý nghĩa của mối liên hệ:
- Kiểm tra tính chính xác của số liệu
- Để tính một số tương đối nào đó khi biết các số tương đối còn lại trong hệ
thống
Ví dụ: Giá trị sản xuất của XNCN X năm 2019 là 688 triệu đồng, theo dự kiến kế
hoạch thì trong năm 2020 XN đạt được giá trị sản xuất là 1032 triệu, thực tế XN đã
đạt được 1250 triệu. Hãy tính STĐ động thái, STĐ kế hoạch và STĐ hoàn thành kế
hoạch
Gọi y1 là giá trị sản xuất của XNCN X ở kỳ báo cáo
y0 là giá trị sx ở kỳ gốc
yk là giá trị sx ở kỳ kế hoạch
y1 1250
t dt  
y0 688
y k 1032
t nv  
Ta có: y0 688
y1 1250
t ht  
y k 1032

Nguyên lý thống kê
- 42 -

c. STĐ kết cấu: Chỉ tiêu này được dùng để xác định tỷ trọng của mỗi bộ phận cấu
thành trong một tổng thể. Nó tính được bằng cách so sánh giữa mức độ của từng bộ
phận so với mức độ của tổng thể.
Ký hiệu: Ti =(1,2,3,.....n): mức độ của từng bộ phận
 Ti : mức độ của cả tổng thể
di (i=1,2,....n): kết cẩu của từng bộ phận
Ti
di  x100%
i
T
Ví dụ: Doanh số bán của công ty A trong năm 2020 là 120 triệu đồng, trong đó
doanh số bán của cửa hàng X là 40 triệu đồng, cửa hàng Y là 80 triệu đồng
Vậy doanh số của cửa hàng X chiếm 40/120 x 100% = 33.3%
Doanh số của cửa hàng Y chiếm 80/120 x 100% = 66.6%
d. STĐ không gian: (STĐ so sánh)
Nó biểu hiện quan hệ so sánh giữa 2 mức độ của 2 bộ phận trong tổng thể hoặc
giữa hai mức độ của một hiện tượng nhưng khác nhau về điều kiện không gian
Ví dụ: so sánh số học sinh nam và nữ trong 1 lớp học
Lợi nhuận của 2 công ty năm 2019
So sánh một số chỉ tiêu cùng tên ở các nước khác nhau.
e. STĐ cường độ: Nó biểu hiện quan hệ so sánh giữa hai mức độ của hai hiện
tượng khác nhau nhưng có mối quan hệ với nhau.
Nó dùng để biểu hiện trình độ phổ biến của hiện tượng nghiên cứu trong điều kiện
thời gian và không gian nhất định.
Ví dụ: Mật độ dân số của địa phương A năm 2019 là 102 người/ km2
Tong so dan
Mat do dan so 
Tong dien tich
STĐ này dùng để phản ánh trình độ đảm bảo vật chất văn hoá của người dân tính
theo từng vùng, từng khu vực của cả nước
Các số trương đối cường độ:
 Thu nhập bình quân đầu người
 Mật độ dân số
 Sản phẩm chủ yếu tính trên đầu người
3. Hình thức biểu hiện số tương đối:
4 hình thức biểu hiện: %, %, số lần, đơn vị kép.
Về bản chất thì cả 3 hình thức này đều như nhau, nhưng hình thức khác nhau.
4. Điều kiện chung để vận dụng số tuyệt đối và số tương đối một cách khoa học và
chính xác
a. Phải xét đến đặc điểm của đối tượng nghiên cứu
Các hiện tượng kinh tế xã hội nó tồn tại và phát triển ở điều kiện khác nhau, do đó
có đặc điểm về chất và biểu hiện về lượng khác nhau vì vậy có nhiều hiện tượng cùng
biểu hiện về lượng nhưng ý nghĩa hoàn toàn khác nhau, cũng có nhiều hiện tượng cùng
một thể chất nhưng về mặt lượng khác nhau. Do đó khi vận dụng số tuyệt đối và số
tương đối phải xét đến đặc điểm của hiện tượng nghiên cứu, có như thế mới phải ảnh
được bản chất của hiện tượng

Nguyên lý thống kê
- 43 -

b. Phải vận dụng kết hợp giữa số tương đối và số tuyệt đối: có như thế mới phản
ảnh đầy đủ và chính xác đặc điểm của hiện tượng nghiên cứu.
Số tương đối tính từ số tuyệt đối do đó mức độ chính xác của số tương đối phụ
thuộc vào số tuyệt đối.
Trên giác độ phân tích thì ngoài việc dựa vào số tuyệt đối người ta còn vận dụng số
tương đối để phản ánh quan hệ so sánh, tốc độ phát triển. Vì vậy cần phải vận dụng kết
hợp số tương đối và số tuyệt đối mới phản ánh được đặc điểm của đối tượng nghiên
cứu một cách sâu sắc.
Ví dụ 1: Tiền lương bình quân của công nhân của công ty A năm 2019 là
8.000.000đ
Tiền lương bình quân của công nhân của công ty A năm 2020 là
10.000.000đ
Như vậy, Lương CN tăng 25% (số tương đối) , tương ứng với 2.000.000đ (số tuyệt
đối), ta biết được tốc độ tăng và cụ thể số tiền là bao nhiêu.
Ví dụ 2
Giá trị sản xuất của 1 doanh nghiệp X năm 2019 là 600 triệu đồng. Năm 2020 thực
hiện kế hoạch giá trị sản xuất tăng được 80 triệu đồng. Nhiệm vụ kế hoạch đề ra trong
năm 2020 tăng giá trị sản xuất 10% so với năm 2019. Tính các số tương đối: tdt, tnv,
tht và nhận xét.
Giải:
Y0=600
Y1 – yk = 80
Tnv = 110%
Suy ra: yk = y0 x tnv = 600 x 1,1 = 660
Suy ra : y1 = 660 + 80 = 740
Tht = 740/660 = 112%
Tdt = 740/600 = 123,3%
Giá trị sản xuất của doanh nghiệp năm 2020 tăng 23,3% so với 2019
Doanh nghiệp đã hoàn thành vượt kế hoạch về giá trị sản xuất cho năm 2020 12%

III. Số bình quân trong thống kê:


1. Khái niệm, đặc điểm, ý nghĩa của SBQ:
a. Khái niệm: SBQ là loại chỉ tiêu biểu hiện mức độ đại biểu của một tiêu thức nào
đó trong tổng thể bao gồm các đơn vị cùng loại
Ví dụ: Tiền lương bình quân của công nhân trong doanh nghiệp A là 2.000.000đ,
thể hiện mức thu nhập điển hình của công nhân trong doanh nghiệp đó.
b. Đặc điểm:
- SBQ có tính tổng hợp rất cao, chỉ cần một trị số đã nêu lên được mức độ điển
hình chung cho cả hiện tượng số lớn. đặc điểm cơ bản của số bình quân là nó san bằng,
bù trừ mọi chênh lệch của các đơn vị về trị số của tiêu thức nghiên cứu
Ví dụ: số sinh viên trong các lớp học của một trường đại học như sau: 30, 45, 37,
40. Tính số sinh viên trung bình mỗi lớp của trường ĐH đó.
30  45  37  40
x
4

Nguyên lý thống kê
- 44 -

 Tính chất toán học: Tổng đại số sai lệch giữa các lượng biến xi với giá trị trung
bình tính ra từ các lượng biến đó bằng không.
xi (i:1,2.....n): lượng biến của các đơn vị
n: số đơn vị tổng thể
x : số trung bình số học
Tính chất trên có thể viết thành công thức:
 (x i  x)  0
Trường hợp tài liệu phân tổ: xi (i: 1,2,.....k)
fi (i: 1,2,.....k)

x
x f i i

f i

Ta cũng có:  ( xi  x) f i  0
c. ý nghĩa:
- SBQ được sử dụng khá rộng rãi trong mọi công tác nghiên cứu xã hội nhằm nói
lên được đặc trưng cho cả hiện tượng số lớn trong điều kiện thời gian và không gian
nhất định, chẳng hạn trong thực tế ta thường gặp 1 số chỉ tiêu như sau: giá thành bình
quân, năng suất lao động bình quân
- SBQ được sử dụng để so sánh các hiện tượng không có cùng quy mô trong khi đó
số tuyệt đối, số tương đối không thực hiện được hoặc không có ý nghĩa thực tế
Ví dụ: Có hai xí nghiệp A và B cùng xản suất ra một loại sản phẩm.
XN A bỏ ra chi phí là X
XN B bỏ ra chi phí là Y
Chúng ta không so sánh được X và Y vì không có cùng quy mô, ta phải sử dụng:
C
Z dv 
q
Zdv: giá thành đơn vị sản phẩm
C: chi phí sản xuất
q: khối lượng sản phẩm
- SBQ được sử dụng để nghiên cứu các quá trình biến động qua thời gian. Nó giúp ta
thấy được xu hướng phát triển cơ bản của hiện tượng số lớn trong khi các đơn vị cá
biệt không thực hiện được.
- SBQ không những được sử dụng trong công tác thống kê mà còn được sử dụng
nhiều trong công tác kế hoạch
- SBQ còn là cơ sở để vận dụng 1 số phương pháp phân tích thống kê như phân tích
biến động, phân tích mối liên hệ, điều tra chọn mẫu, dự đoán thống kê.
2. Các loại SBQ:
Trong toán học có rất nhiều loại số bình quân và được chia thành 2 nhóm:
- Nhóm 1: SBQ lượng biến: là các SBQ được tính dựa trên cơ sở toàn bộ lượng
biến. Có 3 loại SBQ: số bình quân cộng, SBQ điều hoà, SBQ nhân
- Nhóm 2: SBQ vị trí: đó là các SBQ được tính dựa vào sự phân phối các đơn vị
trong tổng thể hay dựa vào sự sắp xếp các mức lượng biến theo một trật tự nào đó: số
mod, số trung vị (med)
Nguyên lý thống kê
- 45 -

2.1. Số bình quân cộng: được tính bằng cách cộng lượng biến của tất cả các đơn vị
trong tổng thể, sau đó đem chia cho số đơn vị của tổng thể nghiên cứu.
Tong luong bien tieu thuc
So binh quan cong 
So don vi tong the
 SBQ cộng giản đơn:
Tổng quát: Ký hiệu: xi (1,2,....n): lượng biến của các đơn vị theo biểu thức nghiên
cứu
n: số đơn vị của tổng thể
x: số trung bình số học
n

x1  x 2  ... x n 
xi
x  i 1
n n
Ví dụ: Có tài liệu về năng suất lao động của công nhân trong 1 phân xưởng (đvt:
tấn):95, 97, 102, 79, 100. Xác định NSLĐ trung bình mỗi công nhân
95  97  ...  100
x 
5
 SBQ số học có quyền số (gia quyền): nó được áp dụng trong trường hợp mỗi
mức lượng biến được lặp lại nhiều lần trong tổng thể, tức là ứng với 1 lượng
biến xi thì có 1 lượng fi tương ứng và nó được tính bằng phương thức sau:
Tổng quát: Ký hiệu: xi (i: 1,2,....,k): lượng biến của các đơn vị theo tiêu thức nghiên
cứu
fi (i: 1,2....k): tần số còn gọi là quyền số
x : số trung bình số học
k

x f  x 2f 2  ...  x k f k x f i i
x 11  i 1
f 1  f 2  ...  f k f i
Trong công thức trên việc nhân lượng biến xi với tần số fi người ta gọi là gia
quyền, còn các tần số fi người ta gọi là quyền số của số bình quân.
Mục đích: duy trì vai trò của mỗi mức lượng biến trong tổng thể
Ví dụ: Có tài liệu về tình hình thu hoạch lúa trong năm báo cáo của 3 HTX thuộc 1
xã như sau:
HTX Năng suất (tạ/ha) Diện tích (ha)
A 33 150
B 35 120
C 37 170
Tính năng suất lúa bình quân của xã đó:
k

x f i i
x i 1

f i

Nguyên lý thống kê
- 46 -

trong đó: x : là năng suất lúa bình quân chung của toàn xã
xi: năng suất lúa từng HTX
fi: diện tích từng HTX
33  150  35  120  37  170
x
150  120  170
 Chú ý: SBQ cộng giản đơn là trường hợp đặc biệt của SBQ cộng gia quyền khi
các tần số bằng nhau
k

x f i i
x1 f1  x2 f 2  ....  xn f n f ( x1  x2  ...  xn ) x
x i 1
   i

f i f1  f 2  ....  f n nf n
 Khi tính số bình quân cộng cần chú ý một số trường hợp sau đây:
- Đối với dãy số lượng biến có khoảng cách tổ, trong trường hợp này mỗi tổ có
một phạm vi lượng biến nhất định. Do đó ta cần 1 trị số làm đại diện cho việc tính toán
Muốn vậy ta thay trị số khoảng cách tổ bằng trị số giữa
Gioi han duoi  Gioi han tren
Tri so giua 
2
- Đối với dãy số lượng biến có khoảng cách tổ mở (tức là giới hạn dưới cuả tổ
đầu tiên và giới hạn trên của tổ cuối cùng không có), trong trường hợp này để tính
trị số giữa ta căn cứ vào trị số khoảng cách tổ của tổ gần nhất.
Ví dụ: Có tình hình phân tổ về NSLĐ của 200 công nhân trong XN in như sau:
NSLĐ (tạ/ người) số công nhân trị số giữa xifi
Dưới 500 10 450 4500
500-600 30 550 16500
600-800 15 700 10500
800-900 80 850 68000
900-950 30 925 27750
Trên 950 5 975 4875
cộng 170
Tính NSLĐ bình quân chung cho toàn XN
- Khi tính SBQ chung từ SBQ tổ. Giả sử ta có tổng thể n đơn vị chia thành t tổ, số
bình quân tổ, số đơn vị của mỗi tổ nj
k

x n j j
x i 1

n j
Ví dụ: Có tài liệu về tiền lương của hai xí nghiệp như sau:
- XN A: số công nhân là 50, tiền lương bình quân của XN là 1500.000đ/cn
- XN B: số công nhân là 20, tiền lương bình quân của XN là 1700.000đ/cn
Tính tiền lương bình quân cho cả hai xí nghiệp

Nguyên lý thống kê
- 47 -

x n
i 1
j j
1500.000  50  1700.000  20
x 
n j 50  20
- Khi quyền số được biểu hiện bằng số tương đối nghĩa là ta chỉ biết tỷ trọng của
các bộ phận cấu thành trong tổng thể
Lúc này số bình quân được tính:
k

xd i i
x i 1

d i
Ví dụ: Có tài liệu về tình hình thu hoạch lúa vụ đông xuân năm 2008 ở một huyện
như sau:

HTX Năng suất thu hoạch (tạ/ha) tỷ trọng % về diện tích của HTX
A 33 25
B 35 30
C 37 45

Tính NSTH bình quân chung cho vụ động xuân của 3 HTX
k

xd i i
x i 1

d i
trong đó: xi: NSTH của từng HTX
di: tỷ trọng diện tích của từng HTX
x : NSTH bình quân chung của vụ đông xuân tính cho toàn HTX
33  25  35  30  37  45
x
100
2.2. Số bình quân điều hoà:
Về thực chất SBQ điều hoà cũng có nội dung kinh tế như số bình quân cộng tức là
cũng bằng tổng mức lượng biến chia cho số đơn vị tổng thể nhưng ta không có tài liệu
để tính như số bình quân cộng
 SBQ điều hoà có quyền số (gia quyền): SBQ này được áp dụng khi ta có tài
liệu:
- Lượng biến (xi)
- Tổng mức lượng biến Mi=xifi
Tổng quát: Ký hiệu: xi (i: 1,2.....n): lượng biến của các đơn vị theo tiêu thức nghiên
cứu
Mi (i: 1,2....n): quyền số của SBQ điều hoà gia quyền
x : số trung bình điều hoà

Nguyên lý thống kê
- 48 -

x
M 1  M 2  ...  M n

Mi
M1 M 2 Mn M
x1

x2
 ... 
xn
 xi
i
Minh hoạ:
lượng biến xi tổng mức lượng biến (Mi) số đơn vị tổng thể fi=Mi/xi
x1 M1 f1
x2 M2 f2

. . .
xn Mn fn
* Chú ý: khi vận dụng công thức số trung bình điều hoà, quyền số Mi có
những nội dung khác nhau, tuỳ trường hợp cụ thể và việc đem chia Mi cho các
lượng biến xi phải đảm bảo ý nghĩa kinh tế.
Ví dụ:
San luong
So luong cong nhan 
Nang suat lao dong
Tong san luong
Dien tich canh tac 
Nang suat thu hoach
Muc do thuc hien
Muc do ke hoach 
Ty le hoan thanh ke hoach
Ví dụ: Có tài liệu về NSLĐ và sản lượng của 3 PX trong 1 xí nghiệp:

Tên PX NSLĐ (tấn/1CN) Sản lượng (tấn)


A 12 360
B 14 280
C 15 375
Tính NSLĐ trung bình mỗi công nhân tính chung cho cả 3 PX
x : NSLĐ trung bình của công nhân tính chung cho cả 3 PX
Tong san luong
x
Tong so cong nhan
360  280  375
x
360 280 375
 
12 14 15
 SBQ điều hoà giản đơn:
Tổng quát: Ký hiệu: xi (i: 1,2....n): lượng biến theo tiêu thức nghiên cứu
Mi (i: 1,2.....n): quyền số
M1=M2=.....=Mn
n n
Ta có: x 
1 1 1 1

x1 x 2
 ... 
xn
x
i
2. 3. Số trung bình nhân:

Nguyên lý thống kê
- 49 -

Trong thực tế ta thường gặp sự thay đổi của hiện tượng trong khoảng thời gian nào
đó, trong trường hợp này cần phải biết sự thay đổi trung bình, chẳng hạn tỷ lệ thay đổi
trung bình trong khoảng thời gian vài năm. Vậy sẽ tính tỷ lệ trung bình đó như thế
nào?
Vì các tỷ lệ tăng này có quan hệ tích số với nhau, khi tính trung bình của các lượng
biến có mối quan hệ tích số với nhau ta phải dùng trung bình nhân
Nói tóm lại, số bình quân nhân được áp dụng khi các mức lượng biến có mối quan
hệ tích số với nhau và được sử dụng để tính tốc độ phát triển bình quân
 SBQ nhân đơn giản:
Tổng quát: Ký hiệu: xi (i: 1,2....n): các tốc độ phát triển liên hoàn
x : tốc độ phát triển trung bình
x  n x1 x2 ...xn
x  n  xi
 SBQ nhân có quyền số: khi các mức lượng biến có các tần số khác nhau thì ta
áp dụng công thức số bình quân nhân gia quyền
Tổng quát: Ký hiệu: xi (i:1,2.....k): các tốc độ phát triển
fi (i: 1,2,....k): tần số (quyền số)
n

 fi
n

 fi n
x   xi
i 1 f1 f2 fn fi
x1 x 2 .......x n i 1

i 1
Ví dụ: Trong thời gian 10 năm, tốc độ phát triển sản xuất của 1 xí nghiệp như sau:
- 5 năm đầu, mỗi năm phát triển 115%
- 3 năm tiếp theo, mỗi năm phát triển là 130%
- 2 năm cuối mỗi năm phát triển là 125%
Tính tốc độ phát triển sản lượng bình quân năm trong thời kỳ 10 năm nói trên
Áp dụng công thức số bình quân nhân gia quyền:
n
 fi n
x x  10 1,155  1,33  1,252
fi
i 1
i
i 1
4. Số mod:
 Khái niệm, ý nghĩa:
- Khái niệm: Mod là biểu hiện của lượng biến về tiêu thức nghiên cứu được gặp
nhiều nhất trong một tổng thể hay trong dãy số phân phối.
Ví dụ: Có tài liệu phân tổ về bậc thợ của công nhân trong một xí nghiệp như sau:
Bậc thợ 1 2 3 4 5
Số CN 20 10 15 5 1
Vậy mod = 1 (số công nhân có bậc 1 chiếm nhiều nhất trong tổng thể)
- Ý nghĩa:
- Mod biểu hiện mức độ phổ biến nhất của hiện tượng, đồng thời bản thân nó lại
không san bằng bù trừ chênh lệch giữa các lượng biến, cho nên có thể dùng để bổ sung
hoặc thay thế số bình quân trong trường hợp tính số bình quân gặp khó khăn.

Nguyên lý thống kê
- 50 -

Ví dụ: Khi đăng ký giá cả của mặt hàng nào đó trên thị trường không thể đăng ký
đầy đủ rồi tính bình quân cộng mà chỉ giá phổ biến của mặt hàng trong thời gian đó.
- Mod được sử dụng trong công tác nghiên cứu nhu cầu thị trường như cỡ số giày
dép, cớ kiểu quần áo
- Trong thực tế trong nhiều trường hợp việc tính mod đảm bảo ý nghĩa kinh tế
hơn vì nó không chịu ảnh hưởng của các lượng biến đột xuất (quá lớn hay quá nhỏ)
Nhược kém nhạy bén với sự biến thiên của tiêu thức
- Mod còn là một trong các mức độ để nêu lên đặc trưng phân phối của dãy số
(chẳng hạn nếu ta tính được số bình quân, số med, số mod có giá trị bằng nhau thì dãy
số có phân phối chuẩn)
 Cách tính số mod:
Ta phân biệt 4 trường hợp:
- Trường hợp 1: dãy số phân phối rời rạc không có khoảng cách tổ, nghĩa là chỉ cần
tìm trong dãy số phân phối ứng với lượng biến nào có tần số lớn nhất thì lượng biến đó
là mod.
- Trường hợp 2: Đối với tài liệu phân tổ có khoảng cách tổ đều nhau, muốn tìm số
mod trước hết phải xác định tổ nào là tổ chứa mod. Từ định nghĩa của mod tổ chứa
mod là tổ có tần số lớn nhất. Sau đó trị số gần đúng của mod được xác định theo công
thức:
f M  fM o1
M 0  x Mo (min)  hM . o
o (f  fM )  ( fM  fM )
Mo o 1 o o 1
trong đó: M0: ký hiệu của mod
xM0(min): giới hạn dưới của tổ chứa mod
hM0: trị số khoảng cách tổ của tổ chức mod
fM0: Tần số của tổ chứa mod
fM0-1: Tần số của tổ đúng trước tổ chứa mod
fM0+1: tần số của tổ đứng sau tổ chứa mod
Ví dụ: Có tài liệu về tiền lương tháng của công nhân trong 1 doanh nghiệp như sau:
Tiền lương tháng(1000đ) Số công nhân trị số khoảng cách tổ
500-600 20 100
600-750 25 150
750-900 15 150
Tổ có tiền lương là 600-750 là tổ chứa mod vì tổ này có tần số lớn nhất
Xác định trị số gần đúng của mod:
f M o  fM o 1
M 0  x Mo (min)  hM o .
( f M o  f M o 1 )  ( f M o  f M o 1 )
25  20
M 0  600  150x  650
(25  20)  (25  15)
- Trường hợp 3: tài liệu phân tổ có khoảng cách tổ không đèu nhau, mod vẫn được
tính theo công thức trong trường hợp 2 nhưng việc xác định tổ chứa mod không căn cứ
vào trị số khoảng cách tổ mà căn cứ vào mật độ phân phối

Nguyên lý thống kê
- 51 -

fi
mi 
hi
mi: mật độ phân phối
fi: tần số
hi: trị số khoảng cách tổ
- Trường hợp 4: Số đơn vị tổng thể tập trung vào một vài lượng biến nhất định ta
có đa mod
5. Số trung vị :
- Khái niệm: Số trung vị là lượng biến của tiêu thức đứng ở vị trí giữa trong dãy số
phân phối, chia dãy số phân phối thành 2 phần, mỗi phần có số đơn vị bằng nhau
- Ý nghĩa:
- Số med là chỉ tiêu được dùng để thay thế hoặc bổ sung số bình quân cộng khi ta
không có chính xác các mức lượng biến để tính
- Số med có tác dụng loại trừ các mức lượng biến do ảnh hưởng đột xuất khi ta
cần nêu lên mưc lượng biến đại biểu
- Số med là một trong các chỉ tiêu được dùng để phản ánh đặc trưng của dãy số
phân phối
- Số med được sử dụng rộng rãi trong công tác kỹ thụât và phục vụ công cộng
chẳng hạn như việc bố trí lại các câu lạc bộ, trạm đỗ xe buýt siêu thị … sao cho ở vị trí
thuận lợi nhất phục vụ được nhiều người nhất và tiết kiệm nhất
 Cách xác định số med:
- Đối với tài liệu không phân tổ
Nếu số đơn vị lẽ (n=2m+1), trứoc tiên ta phải sắp xếp các mức lượng biến theo
một trật tự nào đó tăng dần hoặc giảm dần, số med nằm ở lượng biến có vị trí thứ m+1
Ví dụ: Có tài liệu về bậc thợ của một phân xưởng như sau:
1 3 5 2 6
Ta sắp xếp lại: 1 2 3 5 6
Số med = 3
Nếu số đơn vị chẳn (n=2m): trong trường hợp này số med nằm giữa hai lượng biến
có vị trí thứ m và m+1 và người ta tính số med là trung bình cộng của hai lượng biến
đó
x M  x M 1
Me 
2
+ Đối với tài liệu phân tổ nhưng không có khoảng cách tổ trong trường hợp này số
med nằm ở tổ có tần số tích luỹ bằng hoặc vượt nửa tổng các tần số
+ Đối với tài liệu phân tổ có khoảng cách tổ trong trường hợp này để xác định
được số med ta cần tiến hành qua 2 bước sau:
Xác định tổ có chứa số med: là tổ có tần số tích luỹ bằng hoặc vượt một nửa tổng
các tần số
- Xác định số med: số med được xác định bởi công thức gần đúng sau:

Nguyên lý thống kê
- 52 -

 fi  S
M e 1
M e  xM  hM . 2
e (min) e fM
e
trong đó: Me: số trung vị
xMe(min): giới hạn dưới của tổ chứa số trung vị
 f : tổng số các tần số
SMe-1: tần số tích luỹ của tổ đứng trước tổ chứa số trung vị
fMe: tần số của tổ chứa số trung vị
Ví dụ:
Tiền lương tháng(1000đ) Số công nhân Tần số tích luỹ
450-600 20 20
600-750 10 30
750-900 15 45
900-10000 25 70
Tính số med về tiền lương của công nhân trong DN
Dựa vào tần số tích luỹ ta có tổ chứa med là tổ 750-900
f i
 SM e1
70
 30
M e  x M e (min)  hM e . 2  750  150 2
f Me 15
6. Điều kiện vận dụng số bình quân:
Đk1: Tính số bình quân phải tính từ tổng thể đồng chất, tổng thể đồng chất thì các
mức độ cá biệt trong tổng thể chênh lệch rất ít. Vì do bản chất của nó giống nhau. Do
đó khi tính số bình quân nó sẽ san bằng và bù trừ mọi chênh lệch, vì vậy số bình quân
có mức độ đại biểu cao.
Ví dụ: Có hai xí nghiệp:
XN A, tính mức lương bình quân của tất cả các cán bộ trong xí nghiệp bao gồm cả
trưởng, phó phòng, cán bộ quản lý và công nhân là 2.200.000đ/ tháng, con số này thể
hiện tính chất đại biểu không cao bởi vì lương của trưởng phòng và lương của công
nhân chênh lệch rất lớn (không đồng chất).
XN B, tính mức lương bình quân của công nhân trong xí nghiệp là 1.800.000đ, con
số này có tính chất đại biểu cao vì những công nhân này bản chất giống nhau về trình
độ, điều kiện làm việc, tính chất công việc…
Đk2: Trong phân tích thống kê, số bình quân chung phải kết hợp với số bình quân
tổ hay dãy số phân phối
Ví dụ:
Có tài liệu về tình hình thu hoạch lúa trong 2 năm 2009, 2010 của huyện X như sau:
HTX Năm 2013 Năm 2014
NSTH(tạ/ha) Tỷ trọng về sản NSTH(tạ/ha) Diện tích (ha)
lượng sản xuất của
từng HTX (%)
A 55 8 52 100
B 62 35 59 120

Nguyên lý thống kê
- 53 -

C 60 37 63 90
D 53 20 53 85

(NSTH: Năng suất thu hoạch)


Yêu cầu: Tính Năng suất thu hoạch bình quân mỗi ha tính chung cho cả 4 HTX
trên trong từng năm (2013, 2014)
Giải:
1. Năng suất thu hoạc bình quân mỗi ha
 Năm 2013

x
d i
d
x i

i
trong đó: x : là năng suất thu hoạch bình quân mỗi ha chung cho 4 HTX.
xi: NSTH của từng HTX
di: tỷ trọng về sản lượng sản xuất của từng HTX.
100
x  58,69
8 35 37 20
  
55 62 60 53
 Năm 2014:
k

x f i i
x i 1

f i
trong đó: x : NSTH bình quân mỗi ha chung cho 4 HTX
xi: NSTH của từng HTX
fi: Diện tích của từng HTX
52  100  59  120  63  90  53  85
x  56,85
100  120  90  85

IV. Các chỉ tiêu đánh giá độ biến thiên tiêu thức (các đặc trưng đo lường độ phân
tán)
Giữa các đơn vị trong tổng thể nghiên cứu thường có sự khác biệt nhau về mức độ
(theo một tiêu thức nào đó), sự sai lệch về lượng giữa các đơn vị thống kê có thể xác
định được và gọi đó là độ biến thiên tiêu thức.
Ví dụ: Có tài liệu về NSLĐ của hai nhóm công nhân trong 1 phân xưởng
Nhóm I: 52 58 60 64 66
Nhóm II: 58 59 60 61 62
X1 = 60 tấn/CN
X2 = 60 tấn/CN
Giá trị trung bình của hai nhóm trên bằng nhau, nhưng trình độ thành thạo của công
nhân hai nhóm không đều nhau, NSLĐ của công nhân nhóm 1 chênh lệch khá nhiều so

Nguyên lý thống kê
- 54 -

với nhóm hai. Tuy nhiên việc đánh giá trình độ đồng đều của tổng thể thông qua quan
sát các lượng biến trên từng đơn vị sẽ kém chính xác và không đủ sức thuyết phục.
Cho nên trong phân tích thống kê, bên cạnh việc sử dụng chỉ tiêu trung bình để thấy
được mức độ điển hình của hiện tượng nghiên cứu, ta cần tính toán các chỉ tiêu đánh
giá độ biến thiên của tiêu thức.
1. Ý nghĩa của các chỉ tiêu đánh giá độ biến thiên tiêu thức
- Giúp ta xem xét trình độ đại biểu của số bình quân.
Nếu trị số của chỉ tiêu này tính ra càng lớn thì độ biến thiên của tiêu thức càng
nhiều, tổng thể càng kém đồng đều và do đó tính chất đại biểu của số bình quân càng
thấp và ngược lại.
- Dựa vào các chỉ tiêu đánh giá độ biến thiên tiêu thức ta có thể thấy được nhiều
đặc trưng của dãy số như đặc trưng về phân phối, kết cấu, độ phân tán…
- Trong phân tích hoàn thành kế hoạch các chỉ tiêu này giúp ta thấy được chất
lượng và nhịp độ hoàn thành kế hoạch chung cũng như từng đơn vị, phát hiện khả
năng tiềm tàng trong sản xuất kinh doanh.
- Các chỉ tiêu đánh giá độ biến thiên tiêu thức được sử dụng nhiều trong nghiên
cứu thống kê như phân tích mối liên hệ, độ biến động, điều tra chọn mẫu, dự đoán
thống kê…
2. Các chỉ tiêu đánh giá độ biến thiên tiêu thức:
a. Khoảng biến thiên:
Là sự chênh lệch giữa lượng biến lớn nhất và lượng biến nhỏ nhất của tiêu thức
nghiên cứu
R = Xmax - Xmin
Khoảng biến thiên là chỉ tiêu đơn giản nhất nhưng nó có hạn chế là chỉ xét ở hai
lượng biến lớn nhất và nhỏ nhất
b. Độ lệch tuyệt đối trung bình: (khắc phục khoảng biến thiên)
Là bình quân cộng của các độ lệch tuyệt đối giữa lượng biến với số bình quân cộng
của các lượng biến đó.
Công thức tính:

d
x i x
n
Độ lệch tuyệt đối bình quân phản ánh độ biến thiên của tiêu thức chặt chẽ hơn
khoảng biến thiên vì nó có lưu ý đến tất cả các mức lượng biến trong dãy số tuy nhiên
do việc làm mất đi tính chênh lệch bằng cách lấy giá trị tuyệt đối nên việc vận dụng
các chỉ tiêu này vào các phương pháp phân tích bằng toán học vẫn gặp nhiều khó
khăn.
c. Phương sai: là số bình quân cộng của bình phương các độ lệch giữa lương biến
với số bình quân cộng của các lượng biến đó.
Công thức tính:

 2

 (x i  x) 2
n
Đối với tài liệu phân tổ

Nguyên lý thống kê
- 55 -

 2

 (x  x )
i
2
fi
f i
: phương sai
xi: các mức lượng biến
x : số bình quân cộng của các lượng biến
fi: tần số
Phương sai là chỉ tiêu được dùng khá phổ biến để đánh giá độ biến thiên của tiêu
thức, nó khắc phục được dấu của độ lệch tuyệt đối bình quân và được sử dụng nhiều
trên thực tế như tính hệ số tương quan điều tra chọn mẫu, … Tuy nhiên đơn vị đo của
phương sai không phù hợp với thực tế. Vì vậy, khi cần đánh giá độ biến thiên tiêu thức
theo đơn vị đo của phương sai thì người ta dùng độ lệch chuẩn.
d. Độ lệch chuẩn: là căn bậc hai của phương sai

   2  (x i  x) 2
n
* Phương sai và độ lệch tiêu chuẩn là chỉ tiêu tốt nhất để đánh giá độ biến thiên
của tiêu thức. Các chỉ tiêu này được sử dụng để nghiên cứu tính ổn định về chất lượng
sản phẩm, độ đồng đều về năng suất thu hoạch của một loại cây trồng nào đó, độ đồng
đều về trọng lượng của các con gia súc trong chăn nuôi…
e. Hệ số biến thiên: là số tương đối so sánh giữa độ lệch tuyệt đối bình quân hoặc
độ lệch chuẩn so với số bình quân
d
v  100%
x

v  100%
x
Hệ số biến thiên là số tương đối do đó có thể dùng nó để so sánh độ biến thiên giữa
các tiêu thức khác nhau chẳng hạn như NSLĐ, tuổi nghề, tiền lương… còn 4 chỉ tiêu
trên không thực hiện được.
3. Phương sai của tiêu thức thay phiên:
Tiêu thức thay phiên là những tiêu thức chỉ có hai biểu hiện đối lập, có hoặc không.
Có nghĩa là ở một số đơn vị này có biểu hiện của tiêu thức đó, ở một số đơn vị khác lại
không có.
 Các ký hiệu quy ước:
x1 = 1 khi dơn vị điều tra có biểu hiện của tiêu thức nghiên cứu
x0 = 0 khi đơn vị điều tra không có biểu hiện của tieu thức nghiên cứu
p: tỷ trọng của các bộ phận có biểu hiện của tiêu thức nghiên cứu
q: tỷ trọng của các bộ phận không có biểu hiện của tiêu thức nghiên cứu
p+q=1
- Ta tính số trung bình của tiêu thức thay phiên theo công thức tỷ trọng:
x=  xidi
x = 1.p + 0.q = p
Nguyên lý thống kê
- 56 -

- Phương sai:

 2

 ( xi  x) 2
fi
 fi
(1  p) 2 f1  (0  p) 2 f 2 (1  p) 2 f1 (0  p) 2 f 2
 
2
 
f1  f 2 f1  f 2 f1  f 2
Ta để ý:
Ví dụ: Trong một đợt sản xuất bóng đèn gồm có 10.000 sản phẩm, trong đó người
ta kiểm tra thấy có 200 bóng đèn phế phẩm, hãy tính phương sai của tiêu thức phẩm
chất bóng đèn.
4. Quy tắc cộng phương sai:
Giả sử ta có tổng thể n đơn vị được chia thành nhiều tổ thì ngoài việc tính phương
sai chung, ta còn tính phương sai tổ. Giả sử một tổng thể được chia thành k tổ, số đơn
vị của mỗi tổ là n1, n2, n3...nk
n: số đơn vị của tổng thể
Ta tính:
- Số trung bình chung và phương sai chung:

x
x ni i

n i

 2

 ( x  x) i
2
ni
n i
Phương sai chung phản ánh sự biến động của tiêu thức do ảnh hưởng bởi tất cả các
nguyên nhân.
- Số trung bình tổ và phương sai tổ:

xi 
x i

ni

i 2

 (x i  xi )2
n
Phản ánh sự biến động của tiêu thức do ảnh hưởng bởi tiêu thức nghiên cứu trong
nội bộ mỗi tổ.
Trung bình của các phương sai tổ (phương sai tổ bình quân)

i 2

 n i
2
i

n i
Phản ánh sự biến động của tiêu thức do ảnh hưởng các nguyên nhân ngẫu nhiên,
không nghiên cứu (nguyên nhân khác)
- Phương sai giữa các số bình quân tổ:
Nguyên lý thống kê
- 57 -

 2

 ( x  x)
i
2
ni
n i
Chỉ tiêu này phản ánh biến thiên do ảnh hưởng bởi bản thân tiêu thức nghiên cứu
(nguyên nhân chủ yếu cũng chính là tiêu thức được chọn làm phân tổ)
 Toán học đã chứng minh:
Phương sai chung bằng trung bình của các phương sai tổ cộng với phương sai của
các số trung bình tổ:
 2   i2  i2
Quy tắc cộng phương sai được áp dụng để đánh giá trình độ chặt chẽ giữa các tiêu
thức khi nghiên cứu mối liên hệ tương quan.
Nó được sử dụng nhiều trong nghiên cứu thống kê như nghiên cứu mối liên hệ điều
tra chọn mẫu...
Ví dụ: Có tài liệu dưới đây về NSLĐ của đội sản xuất:
NSLĐ số người lao Trong đó
(giờ/cái) động số công nhân số học sinh nghề
6 1 - 1
7 4 - 4
8 6 3 3
9 7 5 2
10 6 6 -
11 5 5 -
12 1 1 10

- SBQ chung và phương sai chung

x
 x n  6x1  7x 4  ....... 12x1  9,066
i i

n i 1  4  6...  1

 2

 (x  x ) n  (6  9,066) x1  (7  9,066) x 4  ...... (12  9,066)
i
2
i
2 2 2
x1
 2,195
n i 1  4  6  ....  1
Số trung bình tổ và phương sai tổ:

x cn 
x f i i

8 x3  9 x5  ...  12 x1
 9,8
f i
20

 cn 2

 (x i  x cn ) 2 f i

(8  9,8) 2 x3  (9  9,8) 2 x5  ....  (12  9,8) 2 x1
 1,26
f i 20
Tương tự ta tính cho tổ học sinh
x hs  7,6
 2 hs  0,84
Trung bình của các phương sai tổ (phương sai tổ bình quân)
Nguyên lý thống kê
- 58 -

i 2

 n i
2
i

1,26 x 20  0,84 x10
 1,12
n i 30
- Phương sai giữa các số bình quân tổ:

 2

 ( x  x)
i
2
ni

(9,8  9,066) 2 x20  (7,6  9,066) 2 x10
 1,0755
n i 30
Ta c ó:    i   i  2,1955  1,12  1,0755
2 2 2

V. Ứng dụng SPSS để xử lý số liệu (phần 2)


Các đại lượng thống kê mô tả
Các đại lượng thống kê mô tả chỉ được tính đối với các biến định lượng. Nếu ta
tính các đại lượng này đối với các biến định tính thì các kết quả sẽ không có ý nghĩa.
Đối với trường hợp tài liệu phân tổ (tức là có quyền số) thì trước khi tính số bình
quân, mod, med, phương sai, độ lệch chuẩn… ta phải gia quyền cho từng mức lượng
biến
Để gia quyền ta thực hiện như sau:
Vào Data/Weight cases hộp thoại xuất hiện:

Sau đó bấm OK máy sẽ gia quyền với quyền số là scn
Sau khi gia quyền ta tính các đại lượng thống kê mô tả như sau:
Vào menu Analyze>Descriptive Statistics> Descriptive… hộp thoại sau sẽ xuất
hiện:

Nguyên lý thống kê
- 59 -

1. Chọn một (hay nhiều biến định lượng) trong danh sách biến ở phía bên trái hộp
thoại bằng cách nhấp chuột vào biến đó. Sau đó nhấp vào mũi tên qua phải để
đưa các biến này vào ô Variable
2. Bấm vào nút Option… và hộp thoại kế tiếp sẽ xuất hiện:

Hộp thoại này cho phép chọn các đại lượng thống kê cần tính để mô tả các biến đã
chọn ở phần trước bằng cách nhấp chuột vào các ô vuông cần thiết. Các đại lượng
thống kê mô tả thường dùng là:
o Mean: Trung bình cộng
o Sum: tổng cộng (sử dụng khi điều tra toàn bộ)
o Std. Deviation: độ lẹch chuẩn
o Minimum: giá trị nhỏ nhất
o Maximum: giá trị lớn nhất
o SE mean: sai số chuẩn khi ước lượng trung bình tổng thể.
Sau đó bấm vào nút Continue để trở lại hộp thoại trước, rồi nhấn nút Ok. Bảng kết
quả sau sẽ xuất hiện:
Descriptive Statistics

Minimu Maximu Std.


N m m Mean Deviation
nng suat lao
50 2,0 7,9 5,000 1,3398
dong
Valid N
50
(listwise)

Để vẽ biểu đồ tần số, bấm vào nút Charts…hộp thoại dưới đây sẽ xuất hiện:

Nguyên lý thống kê
- 60 -

Trong hộp thoại charts này, nhấp chuột vào các ô để lựa chọn loại biểu đồ cần vẽ.
Có thể chọn 1 trong 3 loại biểu đồ sau:
1. Bar: biểu đồ dạng thanh (dùng cho biến có các giá trị rời rạc
2. Pie: biểu đồ hình tròn
3. Histograms: biểu đồ phân phối tần số (dùng cho biến có các giá trị liên tục)
Sau khi chọn loại biểu đồ, nhấp chuột vào nút Continue để trở về hộp thoại
Frequencies, và nhấp ok, kết quả hiện ra như sau
tuoi nghe

Cumulati
Frequen Valid ve
cy Percent Percent Percent
Vali 2 11 22,0 22,0 22,0
d 3 11 22,0 22,0 44,0
4 10 20,0 20,0 64,0
5 6 12,0 12,0 76,0
6 4 8,0 8,0 84,0
7 2 4,0 4,0 88,0
8 3 6,0 6,0 94,0
9 1 2,0 2,0 96,0
10 2 4,0 4,0 100,0
Tota
50 100,0 100,0
l

Nguyên lý thống kê
- 61 -

tuoi nghe

25

20
Percent

15

10

0
Ví dụ tổng quát
2 của3 chương:
4 5 6 7 8 9 10

Ví dụ 1: tuoi nghe
Doanh thu của công ty H năm 2018 là 4200 triệu đồng. Năm 2019 so với 2018 doanh
thu của công ty giảm 6%. Thực tế năm 2019 doanh thu giảm 12% so với kế hoạch đặt
ra.
Yêu cầu:
Xác định các số tương đối và tuyệt đối có thể tính và nhận xét.
Giải:

Y0=4200
Tdt=94%
Tht=88%
Y1=y0xtdt=4200x0,94=3948
Yk=y1/tht = 3948/88% = 4486,4
Tnv = yk/y0 = 4486,4/4200 = 106,8%
Công ty đặt ra nhiệm vụ năm 2019 doanh thu phải tăng 6,8% so với 2018
Công ty không hoàn thành kế hoạch về doanh thu cho năm 2019 12%

Ví dụ 2:
Có tài liệu sau tại 1 công ty có các phân xưởng
PX Năng suất lao động (trd/cn) Tổng giá trị sản lượng (trd)
1 15 300
2 21 294
3 16 480
4 13 312
5 25 250
1. Tính năng suất lao động bình quân 1 công nhân tính chung cho tổng thể trên
Nguyên lý thống kê
- 62 -

2. Tính mod, med về năng suất lao động


Giải:

1. Năng suất lao động bình quân 1 công nhân


∑Gia tri san luong ∑Giatri sanluong 1636
NSLDBQ = = = = 16,69
∑ So cong nhan ∑ Giatri / sanluong 98
nang suat lao dong

2. Mod về năng suất lao động


Mod = 16 vì có số công nhân lớn nhất =30

3. Med về năng suất lao động: Sắp xếp các lượng biến thiên theo trật tự
tăng dần
Med = 16 vì có tần số tích lũy vượt nữa tổng các tần số s = 74

Ví dụ 3:
Có tài liệu về tình hình sản xuất của 1 công ty:

XN Năm 2019 Năm 2020


Giá CPSX(ngd) Giá thành Tỷ trọng về sản
thành(1000d/sp) lượng(%)
A 1500 33000 1550 10
B 1800 41400 1780 25
C 2000 50000 2140 35
D 2100 63000 2200 30
Yêu cầu:
1. Tính giá thành bình quân 1 công nhân tính chung cho cả 4 xí nghiệp trong từng
năm
2. Hãy cho biết giá thành bình quân chung của công ty biến động như thế nào qua
hai năm?
3. Tính mod, med, phương sai, độ lệch chuẩn về giá thành.
4. Sử dụng SPSS để kiểm tra kết quả
Giải:
1. Giá thành bình quân một sản phẩm chung cho 4 xí nghiệp:
 Năm 2019

x
M i
M
x i

trong đó: x : là giá thành bình quân mỗi sản phẩm chung cho 4 xí nghiệp.
Nguyên lý thống kê
- 63 -

xi: giá thành bình quân của từng xí nghiệp


Mi:Tổng CPSX của từng xí nghiệp.
33000  41400  50000  63000 187400
x   1874
33000 41400 50000 63000 100
  
1500 1800 2000 2100
 Năm 2020:
k

xd i i
x i 1

d i

trong đó: x : là Giá thành bình quân mỗi sản phẩm chung cho 4 XN
xi: giá thành của từng XN
di: tỷ trọng về sản lượng của từng XN
1550 10  1780  25  2140  35  2200  30 200900
x   2009
100 100
2. Giá thành bình quân biến động như thế nào qua hai năm:
Dùng số tương đối động thái để xác định như sau:
y1 2009
tdt    1,072
y0 1874
Giá thành bình quân năm 2020 tăng 7,2% so với năm 2019.
3. Mod về giá thành
Tần
số
Giá S tích
thành CPSX lượng lũy
1500 33000 22 22
1800 41400 23 45
2000 50000 25 70
2100 63000 30 100
Mod =2100 vì có tần số (sản lượng) lớn nhất là 30 sản phẩm .
4. Med về giá thành:
Med = 2000 vì có tần số tích luỹ vượt nửa tổng các tần số, tần số tích luỹ là
70.
5. Phương sai về giá thành:

Giá S
thành CPSX lượng xifi (xi-x) (xi-x)2 (xi-x)2fi
1500 33000 22 33000 -374 139876 3077272
1800 41400 23 41400 -74 5476 125948

Nguyên lý thống kê
- 64 -

2000 50000 25 50000 126 15876 396900


2100 63000 30 63000 226 51076 1532280
tổng 100 5132400

 2

 ( x  x)
i
2
fi

5132400
 51324
f i 100
5. Sử dụng SPSS
- Bước 1: khai báo biến
- Bước 2: Nhập dữ liệu
- Bước 3: xử lý số liệu
 Tính cho năm 2019:
Sau khi nhập dữ liệu theo đề, ta tính thêm cột sản lượng như sau:
Vào: Transform/compute variable/ hộp thoại xuất hiện

Chọn cột sản lượng làm quyền số như sau:


Vào Data/Weight cases hộp thoại sau xuất hiện/ Chọn sluong làm quyền số / ok

Để tính toán giá thành bình quân, mod, med, phương sai, độ lệch chuẩn về giá thành,
ta vào:

Nguyên lý thống kê
- 65 -

Hộp thoại sau xuất hiện:

Nhấn continue/Ok, sau đó đọc kết quả


Ví dụ 4:
Có tài liệu sau của một công ty
PX Năm 2019 Năm 2020
Giá Tỷ trọng sản Giá thành Chi phí sản % thực hiện kế
thành(trd/sp) lượng sản (trd/sp) xuất (trd) hoạch chi phí
xuất(%) sản xuất
A 25 18 18 270 98
B 27 24 24 480 93
C 32 32 30 540 97
D 40 26 42 420 90
1. Tính giá thành bình quân 1 sản phẩm tính chung toàn công ty năm 2019, 2020
2. Tính tỷ lệ hoàn thành kế hoạch về chi phí sản xuất năm 2020 cho toàn công ty

Giải:

Nguyên lý thống kê
- 66 -

1. Tính giá thành bình quân


- Năm 2019

GTBQ 
∑ CPSX   gia thành  ty trong san luong  3162  31,62
∑ san luong ∑ty trong san luong 100
- Năm 2020

GT BQ 
∑CPSX  ∑CPSX 
1710
 27,14
∑ sanluong ∑ CPSX 63
giathanh
2. Tỷ lệ hoàn thành kế hoạch 2020

tht 
∑Chi phí thuc te  ∑Chiphíthucte 
1710
 94,2%
∑Chiphí ke hoach ∑ Chiphíthucte 1815
% thuc hienke hoach
Công ty đã hoàn thành vượt kế hoạch chi phí 2013 là 5,8%
Ví dụ 5:
Có tài liệu sau tại 1 công ty có các phân xưởng
PX Tiền lương (trđ/người) Tỷ trọng về số công nhân
(%)
1 25 20
2 16 23
3 20 16
4 30 12
5 18 29
1. Tính tiền lương bình quân 1 người tính chung cho tổng thể trên
2. Tính mod, med về tiền lương, biết tổng số công nhân của công ty là 50 người.
3. Tính phương sai và độ lệch chuẩn về tiền lương
Giải:
1. Tiền lương bình quân 1 người

TLBQ 
 quyluong   x d i i

2070
 20,70tr / cn
 sôcngnhan  d i 100
2. Mod về tiền lương
Mod = 18 vì có tủ trọng số công nhân lớn nhất =29

3. Med về tiền lương: Sắp xếp các lượng biến thiên theo trật tự tăng dần
Med = 18 vì có tần suất tích lũy vượt nữa tổng các tần suất s = 52

4. Phương sai

 2

∑ ( x - x) .d
i
2
i

(25 -20,70) 2  20  ...  (18 -20,70) 2  29
 di 100
Độ lệch chuẩn

Nguyên lý thống kê
- 67 -

Ví dụ 6:
Có tài liệu sau của 1 doanh nghiệp có các phân xưởng
PX 2016 2017
Tổng NVL Mức hao phí NVL Tỷ trọng nvl Mức hao phí NVL
hao cho 1 sản hao phí cho 1 sản
phí(kg)(Mi) phẩm(kg/sp)(xi) (%)(Di) phẩm(kg/sp)(xi)

A 500 2,4 10 5,5


B 700 5,7 35 3,2
C 400 6 27 6
D 300 4 28 8
Tổng

1. Tính mức hao phí nguyên vật liệu bình quân cho 1 sản phẩm tính chung cho
doanh nghiệp ở từng năm.
2. Tính mod, med về mức hao phí nguyên vật liệu cho 1 sản phẩm ở năm 2016,
2017.
3. Tính phương sai, độ lệch chuẩn về mức hao phí NVL cho 1 sp ở năm 2016, 2017
4. Cho biết sản lượng sản xuất của công ty biến động như thế nào qua 2 năm biết
tổng NVL hao phí năm 2017 là 2300 kg.
Giải:
1. mức hao phí nguyên vật liệu bình quân cho 1 sản phẩm
2016:
NVL bình quân 1 sp= Tổng NVL/ tổng sản phẩm=Tổng NVL/ Tổng (NVL/NVL 1 sp)

x
M i

1900
4
M
x i 472,8
i
2017
NVL bình quân 1 sp= Tổng NVL/ tổng sản phẩm=Tổng NVL/ Tổng (NVL/NVL 1 sp)

x
D i

100
D 10 35 27 28
x i
 
5,5 3,2 6

8
i
2. Mod, med năm 2016

Nguyên lý thống kê
- 68 -

Tổng NVL hao Mức hao phí NVL Sản lượng (fi)
phí(kg)(Mi) cho 1 sản
phẩm(kg/sp)(xi)

500 2,4 208,3


700 5,7 122,8
400 6 66,7
300 4 75

Mod =2,4 vì có fmax=208,3


Med
Mức hao phí NVL cho Sản lượng (fi) Tần số tích lũy
1 sản phẩm(kg/sp)(xi)

2,4 208,3 208,3


4 75 283,3
5,7 122,8 406,1
6 66,7 472,8

Vị trí giữa là
472,8/2= 236,4
Med =4 vì có tần số tích lũy vượt ½ tổng tần số (S=283,3)
3. Tính phương sai năm 2016
(xi-x
NVL1sp(xi) Sp(fi) xi*fi ngang)^2*fi
2.4 208.3 499.92 533.248
5.7 122.8 699.96 354.892
6 66.7 400.2 266.8
4 75.0 300 0
472.8 1900.1 1154.94

 2

 ( x  x)
i
2
fi

1154,94
 2,44
f i 472,8

BÀI TẬP CUỐI CHƯƠNG


I. Trắc nghiệm:
Câu 1: ……….là chỉ tiêu biểu hiện quan hệ so sánh giữa 2 mức độ.
Nguyên lý thống kê
- 69 -

a. Số tuyệt đối


b. Số tương đối
c. Số bình quân
d. Phương sai
Câu 2: Số tương đối kết cấu phản ánh:
a. Tỷ trọng của mỗi bộ phận cấu thành trong tổng thể
b. Sự biến động của hiện tượng qua thời gian
c. Tình hình thực hiện kế hoạch
d. Cả a, b, c đều sai
Câu 3 : Giả sử có số liệu trong bảng thống kê như sau:
Tên sản Kết cấu doanh thu quí Số tương đối nhiệm vụ kế hoạch
phẩm I (%) doanh thu quí II (%)
A 55 120
B 45 110

Cho biết thêm: Doanh thu thực tế chung quí I là 400 triệu, quí II là 500 triệu đồng.
Vậy, tỷ lệ nhiệm vụ kế hoạch về doanh thu của cả 2 loại sản phẩm ở quí II.
a. 108,22% b. 125% c. 115,5% d. khác
Câu 4: Giả sử có số liệu trong bảng thống kê như sau:
Tên sản Kết cấu doanh thu quí Số tương đối nhiệm vụ kế hoạch
phẩm I (%) doanh thu quí II (%)
A 55 120
B 45 110

Cho biết thêm: Doanh thu thực tế chung quí I là 400 triệu, quí II là 500 triệu đồng.
Vậy, Tỷ lệ thực hiện kế hoạch về doanh thu của cả 3 loại sản phẩm ở quí II.
a. 108,22% b. 125% c. 115,5% d. khác
Câu 5: Giả sử có số liệu trong bảng thống kê như sau:
Tên sản Kết cấu doanh thu quí Số tương đối nhiệm vụ kế hoạch
phẩm I (%) doanh thu quí II (%)
A 55 120
B 45 110

Cho biết thêm: Doanh thu thực tế chung quí I là 400 triệu, quí II là 500 triệu đồng.
Vậy, Tốc độ phát triển về doanh thu của doanh nghiệp
a. 108,22% b. 125% c. 115,5% d. khác
Câu 6: Chỉ tiêu đo lường khuynh hướng tập trung đó là:
a. Số trung bình
b. Số mod
c. Số med
d. Cả a,b, c đều đúng
Câu 7: Chỉ tiêu được tính bằng cách cộng lượng biến của tất cả các đơn vị sau đó đem
chia cho số đơn vị tổng thể là:
a. số bình quân cộng
b. số bình quân điều hòa
Nguyên lý thống kê
- 70 -

c. số bình quân nhân


d. cả a và b đều đúng
Câu 8: Một nhóm công nhân gồm 3 người cùng sản xuất 1 loại sản phẩm trong thời
gian như nhau. Thời gian hao phí để sản xuất một sản phẩm A của công nhân thứ nhất
là 12 phút, của người thứ 2 là 15 phút và của người thứ 3 là 20 phút. Vậy, thời gian
hao phí bình quân để sản xuất một sản phẩm A tính chung cho cả 3 công nhân là:
a. 15,66p/sp b. 15p/sp c. 15,8p/sp d. khác
Câu 9: Tại một của hàng lương thực bán 3 loại gạo A, B, C. Trong kỳ cửa hàng thu về
tiền bán 3 loại gạo như nhau. Giá bán 1 Kg gạo từng loại như sau: Loại A 9000 đồng,
loại B 11000 đồng, loại C 14000 đồng. Vậy, giá bán bình quân 1 Kg gạo chung cho cả
3 loại gạo bán ra là:
a. 11333,3d/kg b. 12030,4d/kg c. 10972,9d/kg d. khác
Câu 10 : Theo thống kê về tình hình tiêu thụ hàng hoá A tại các thị trường như
sau:

Thị trường Giá đơn vị hàng hoá Tỷ trọng doanh


(1000đ/sp) thu(%)

X 80 20
Y 87 35
Z 90 45
Giá bán trung bình 1 sp của hàng hóa A chung cho các thị trường là
a. 86,78ngd/sp b. 86,95ngd/sp c. 86,62ngd/sp d. khác
Câu 11: Theo thống kê về tình hình tiêu thụ hàng hoá A tại các thị trường như
sau:

Thị trường Giá đơn vị hàng hoá Sản lượng tiêu


(1000đ/sp) thụ(sp)

X 80 400
Y 87 350
Z 90 950
Med về giá bán đơn vị là:
a. 87 b. 350 c. 90 d. khác
Câu 12: "Điểm thi học kỳ I của lớp 10A" được ghi lại trong bảng sau:
8 6,5 7 5 5,5 8 4 5 7
8 4,5 10 7 8 6 9 6 8
6 6 2,5 8 8 7 4 10 6
9 6,5 9 7,5 7 6 6 3 6
6 9 5,5 7 8 6 5 6 4

Nguyên lý thống kê
- 71 -

Mốt về điểm thi của tài liệu trên là:


a. 6 b.7 c.8 d. 9
Câu 13: Thống kê về điểm thi môn toán trong một kì thi của 450 em học sinh. Người
ta thấy có 99 bài được điểm 7. Hỏi tần suất của giá trị xi= 7 là bao nhiêu?
a. 7% b. 22% c. 45% d. 50%
Câu 14. Có 41 học sinh của một lớp kiểm tra chất lượng đầu năm (thang điểm 30). Kết
quả như sau:
Số lượng(Tần 3 6 4 4 6 7 3 4 2 2
số)
Điểm 9 11 14 16 17 18 20 21 23 25
Điểm trung bình của lớp :
a.16,61 b.17,4 c.22 d.Một giá trị khác
Câu 15: Mốt của mẫu số liệu trên :
a.17 b.18 c.19 d.20
Câu 16: Trung vị là:
a.15 b.16 c.17 d.18
Câu 17: Giá trị sản xuất của 1 doanh nghiệp X năm 2012 là 400 triệu đồng. Năm
2013 thực hiện kế hoạch giá trị sản xuất tăng được 120 triệu đồng. Nhiệm vụ kế hoạch
đề ra trong năm 2013 tăng giá trị sản xuất 10% so với 2012.
Ta có kết luận như sau:
a. Doanh nghiệp X đã hoàn thành vượt kế hoạch về giá trị sản xuất năm 2013
27,2%
b. Doanh nghiệp X đã hoàn thành vượt kế hoạch về giá trị sản xuất năm 2013
18,18%
c. Doanh nghiệp X đã hoàn thành vượt kế hoạch về giá trị sản xuất năm 2013 30%
Câu 18: Tại một doanh nghiệp, trong kỳ thực hiện giảm chi phí thời gian lao động cho
1 đơn vị sản phẩm là 8,8 % so với kỳ gốc. Thực hiện kế hoạch giảm chi phí thời gian
lao động cho 1 đơn vị sản phẩm đạt 96%.Từ đó tính được số tương đối động thái là:
d. a. 108,8% b. 91,2% c. 95% d. khác
Câu 19. Tính số trung vị về năng suất lao động theo tài liệu sau:
NSLĐ (Kg/Người) 20-30 30-40 40-50 50-60 60-70
Số công nhân 20 30 45 80 25
a. 51,23kg b.53,18kg c.50,63kg d.54,12kg
Câu 20: chỉ tiêu dùng để so sánh độ biến thiên của các tiêu thức có tính chất khác
nhau là:
a. số mod b. số med c. số bình quân d. Cả a,b,c đều sai

II. Bài tập


Bài 1:
Có tài liệu về tình hình thực hiện kế hoạch mức tiêu thụ hàng hoá trong quý I và II
năm 2008 của các cửa hàng thuộc công ty Z như sau:
Tên thực tế kế hoạch quý II Thực tế % hoàn thực tế quý

Nguyên lý thống kê
- 72 -

cửa quý I (tr. số tuyệt % so quý II thành KH II so với


hàng đ) đối(tr. Đ) với (tr. đ) quý II thực tế quý
tổng số I(%)
A ? 100 ? 100 ? 111,1
B ? 150 ? 180 ? 138,46
C ? 250 ? 207.5 ? 129,68
Tổng ? 500 ? 487.5 ? 128,28
Yêu cầu:
1. Hãy tính các số liệu còn thiếu trong bảng thống kê trên.
2. Hãy phân tích vì sao công ty này không hoàn thành kế hoạch mức tiêu thụ
hàng hoá quý II?
3. Nếu cửa hàng C hoàn thành đúng kế hoạch quý II, thì tỷ lệ hoàn thành kế
hoạch mức tiêu thụ hàng hoá của công ty sẽ là bao nhiêu?
Bài 2:
1. Năm 2009 một nông trường sản xuất được 2300 tấn cà phê. Kế hoạch năm
2010 sản xuất cà phê của nông trường tăng 45% so với năm 2009. Thực tế năm 2010
sản lượng đạt 3427 tấn. Hãy xác định số tương đối hoàn thành kế hoạch năm 2010 của
nông trường về chỉ tiêu trên?
2. kế hoạch của xí gnhiệp dự kiến giảm lượng thời gian hao phí để sản xuất 1 đơn
vị sản phẩm là 5 % so với kỳ trước. Thực tế so với kỳ trước lượng thời gian hao phí để
sản xuất một đơn vị sản phẩm giảm 6%. Hãy tính số tương đối hoàn thành kế hoạch về
chỉ tiêu này.
4. Trong kỳ đã đề ra kế hoạch tăng giá trị lượng sản phẩm 6% so với kỳ gốc. Thực
tế giá trị sản lượng sản phẩm tăng 8 % so với kế hoạch.
Yêu cầu:
Tính các số tương đối có thể tính và nhận xét mức độ hoàn thành kế hoạch về chỉ tiêu
trên.
5. Tại một doanh nghiệp, trong kỳ thực hiện giảm chi phí thời gian lao động cho 1
đơn vị sản phẩm là 8,8 % so với kỳ gốc. Thực hiện kế hoạch giảm chi phí thời gian lao
động cho 1 đơn vị sản phẩm đạt 96%.
Yêu cầu:
Tính các số tương đối có thể tính và nhận xét mức độ hoàn thành kế hoạch về chỉ tiêu
trên.
6. Mức tiêu hao nguyên vật liệu sản xuất 1 đơn vị sản phẩm kỳ báo cáo là 196Kg
và so với kỳ gốc giảm được 2%. Nhiệm vụ kế hoạch đặt ra trong kỳ báo cáo phải giảm
5% mức tiêu hao nguyên vật liệu cho 1 đơn vị sản phẩm so với kỳ gốc.
Yêu cầu:
Xác định trình độ hoàn thành kế hoạch giảm mức tiêu hao nguyên vật liệu cho 1 đơn
vị sản phẩm (bằng số tương đối và số tuyệt đối) và nhận xét mức độ hoàn thành kế
hoạch về chỉ tiêu trên.
7. Chi phí nguyên vật liệu chủ yếu sản xuất 1 đơn vị sản phẩm kỳ gốc là 200 000
đồng. Kỳ báo cáo so với kỳ gốc cho phí nguyên vật liệu chủ yếu sản xuất 1 đơn vị sản
phẩm giảm đựơc 5%. Kết quả thực hiện kế hoạch giảm chi phí nguyên vật liệu chủ yếu
1 đơn vị sản phẩm giảm được 6 000 đồng.
Yêu cầu:
Nguyên lý thống kê
- 73 -

Xác định các số tương đối và tuyệt đối có thể tính và nhận xét mức độ hoàn thành kế
hoạch về chỉ tiêu trên.
8. Giá trị sản xuất của 1 doanh nghiệp X năm 2006 là 400 triệu đồng. Năm 2007
thực hiện kế hoạch giá trị sản xuất tăng được 120 triệu đồng. Nhiệm vụ kế hoạch đề ra
trong năm 2007 tăng giá trị sản xuất 10%
Yêu cầu: Xác định các số tương đối và tuyệt đối có thể tính và nhận xét mức độ hoàn
thành kế hoạch về chỉ tiêu trên.
9. Có số liệu về tỷ trọng giá trị sản xuất ngàng trồng trọt trong toàn bộ giá trị sản
xuất ngành nông nghiệp của doanh nghiệp A năm 2008 là 80,4%; còn số tương đối
phát triển (năm 2009 so với 2008) của giá trị sản xuất ngành trồng trọt, ngành chăn
nuôi và tòan bộ ngành nông nghiệp lần lượt là 108,6%; 119,8%; 110,8%.
Yêu cầu/ xác định cơ cấu giá trị sản xuất nông nhgiệp của doanh nghiệp A trong năm
2009.
10. Giả sử công ty M và công ty N kinhdoanh trong một ngành công nghiệp. Năm
2000 thị phần sản lượng sản phẩm của công ty M là 70%. Năm 2009 thị phần sản
lượng sản phẩm của công ty M là 60%, của công ty N là 40%. Biết thêm giá trị sản
lượng sản phẩm của ngành công nghiệp trên năm 2009 đạt gấp đôi so với năm 2000.
Yêu cầu: Tính tốc độ phát triển sản lượng sản phẩm năm 2009 so với năm 2000 của
từng công ty.
Bài 5. Giả sử có số liệu trong bảng thống kê như sau:

Tên sản Kết cấu doanh thu quí Số tươngđối nhiệm vụ kế hoạch
phẩm I (%) doanh thu quí II (%)
A 25 120
B 35 110
C 40 115
Cho biết thêm: Doanh thu thực tế quí I là 400 triệu, quí II là 572,5 triệu đồng
Yêu cầu tính:
1/ Tỷ lệ nhiệm vụ kế hoạch về doanh thu của cả 3 loại sản phẩm ở quí II.
2/ Tỷ lệ thực hiện kế hoạch về doanh thu của cả 3 loại sản phẩm ở quí II.
3/ Tốc độ phát triển về doanh thu của doanh nghiệp.
Bài 6. Có tài liệu về kết quả kinh doanh của 2 doanh nghiệp thuộc công ty N như sau:

Doanh Quí III Quí IV


nghiệp Kế hoach doanh % thực hiện kế Kế hoach doanh % thực hiện kế
thu (Tr. đ) hoạch doanh thu thu (Tr. đ) hoạch doanh thu
X 1 800 105 2 090 110
Y 1 200 110 1 380 115
Yêu cầu tính:
1/ Tỷ lệ % thực hiện kế hoạch về doanh thu của cả 2 doanh nghiệp ở quí III, quí IV và
6 tháng cuối năm.
2/ Số tương đối kết cấu doanh thu của mỗi doanh nghiệp ở quí III, quí IV và 6 tháng
cuối năm.

Nguyên lý thống kê
- 74 -

3/ Tính số tương đối động thái doanh thu của quí IV so với quí III của từng doanh
nghiệp và chung 2 doanh nghiệp.
Bài 7. Có tài liệu trong bảng thống kê sau:

Tên sản Kỳ gốc Kỳ báo cáo


phẩm Sản lượng kế Tỷ lệ hoàn thành Sản lượng kế Tỷ lệ hoàn thành
hoạch (Tr. Đ) kế hoạch (%) hoạch (Tr. Đ) kế hoạch (%)
A 3 600 108 4 900 98
B 2 400 95 3 120 120
Yêu cầu tính:
1/ Tỷ lệ hoàn thành kế hoạch về sản lượng sản phẩm của cả 2 loại sản phẩm ở kỳ gốc,
kỳ báo cáo.
2/ Số tương đối động thái kỳ báo coá so với kỳ gốc về sản lượng sản phẩm của từng
loại sản phẩm và của chung 2 loại sản phẩm.
Bài 8:Có tình hình thu hoạch luá trong năm báo cáo của 3 hợp tác xã thuộc một xã như
sau:
Tên Vụ hè thu Vụ đông xuân
HTX Năng Diện tích(ha) Năng Sản lượng
suất(tạ/ha) suất(tạ/ha) (Tạ)
A 33 100 40 6000
B 35 120 38 5700
C 37 180 36 7200
Hãy tính:
1. Năng suất lúa bình quân vụ hè thu, vụ đông xuân của toàn xã?
2. Năng suất lúa bình quân vụ trong năm của toàn xã?
3. Tính Mod, Med về năng suất của từng vụ mùa
Bài 9:
Có tài liệu về tình hình lao động của một xí nghiệp như sau:
Năng suất lao động (tạ/người) Số công nhân(người)
Dưới 200 50
200-450 70
450-600 75
600-900 40
900 trở lên 10
1. Tính năng suất lao động bình quân của cả xí nghiệp.
2. Xác định Mod, Med về năng suất lao động của xí nghiệp trên
Bài 10
Có hai xí nghiệp chế biến thuộc công ty H cùng sản xuất một loại sản phẩm, trong
kỳ nghiên cứu như sau:
Thời kỳ Xí nghiệp A Xí nghiệp B
sản Giá thành đơn Chi phí Giá thành đơn Tỉ trọng sản
xuất(quý) vị sản phẩm sản xuất(tr. vị sản phẩm lượng của từng
(1000đ) đ) (1000đ) thời kỳ so với cả
năm(%)

Nguyên lý thống kê
- 75 -

I 20 10 000 19.5 16
II 21.4 13 910 20.2 35
III 19.2 13 824 20.4 30
IV 18.5 15 355 19.8 19
Theo kế hoạch sản xuất của hai xí nghiệp về chỉ tiêu giá thành đơn vị sản phẩm
bình quân năm của xí nghiệp A là 17.4 nghìn đồng, còn của xí nghiệp B là 17.5 nghìn
đồng.
Yêu cầu:
1. Tính giá thành bình quân một đơn vị sản phẩm của từng xí nghiệp.
2. Cho biết hai xí nghiệp có hoàn thành kế hoạch về chỉ tiêu giá thành bình
quân trong kỳ nghiên cứu hay không?
Bài 11
Có tài liệu về tình hình sản xuất lúa vụ mùa năm báo cáo của 3 HTX trong cùng một
huyện sau:
HTX Diện tích gieo Lượng phân hoá Năng suất lúa Giá thành 1
cấy (ha) học bón cho 1 bình quân tạ lúa
ha (kg) (tạ/ha) (1000đ)
số 1 120 180 46 500
số2 180 160 45 550
số3 250 200 50 570

Hãy tính chung cho toàn xã:


1. Lượng phân hóa học bình quân cho 1 ha?
2. Năng suất thu hoạch lúa bình quân?
3. Giá thành bình quân một tạ lúa?
Bài 12
Có tài liệu sau đây về hai tổ công nhân cùng sản xuất một loại sản phẩm:
Tổ công Số CN trong Thời gian sản Thời gian hao phí để
nhân tổ(người) xuất của tổ (giờ) sản xuất 1 sản phẩm
của mỗi CN(phút)
I 10 6 12
II 12 7 10
Hãy tính thời gian hao phí bình quân để sản xuất một sản phẩm của mỗi công
nhân của hai tổ?
Bài 13
Có tài liệu về năng suất, diện tích và sản lượng của nông sản A tại tỉnh H trong 2
năm ở 6 huyện thuộc tỉnh này như sau:
Năm 2008 Năm 2009
Huyện Năng suất thu Tỉ trọng diện Năng suất thu Sản lượng
hoạch bình tích của từng hoạch bình (tạ)
quân (tạ/ha) huyện (%) quân (tạ/ha)
A 65 20 70 7000
B 80 15 82 6560

Nguyên lý thống kê
- 76 -

C 94 25 92 11040
D 71 10 78 4680
E 72 16 85 6800
F 84 14 90 6300
100 42380
Biết thêm: Sản lượng thu hoạch loại cây trồng này của các huyện trong năm 2009
đều không đạt mức kế hoạch:
Huyện A đạt 95% mức kế hoạch
B 92%
C 90%
D 88%
E 94%
F 86%
Yêu cầu:
1. Tính năng suất bình quân 1 ha đối với toàn tỉnh trong từng năm.
2. Tính tỷ lệ hoàn thành kế hoạch bình quân về chỉ tiêu sản lượng cho toàn tỉnh
trong năm 2009.
Bài 16:
Tốc độ phát triển mức tiêu thụ hàng hoá của một công ty công nghệ phẩm như sau:
Năm 2005 so với năm 2004 bằng 110%
Năm 2006 so với năm 2005 bằng 112%
Năm 2007 so với năm 2006 bằng 115%
Năm 2008 so với năm 2007 bằng 116%
Năm 2009 so với năm 2008 bằng 119%
Hãy tính tốc độ phát triển bình quân năm về mức tiêu thụ hàng hoá của công ty
công nghệ phẩm trên?
Bài 17
Trong năm 2009, doanh nghiệp A giao cho 2 phân xưởng cùng sử dụng khối lượng
nguyên vật liệu B như nhau để sản xuất thử 1 loại sản phẩm mới. Tình hình tiêu hao
nguyên vật liệu B sản xuất 1 đơn vị sản phẩm của phân xưởng số 1 là 125 Kg, của
phân xưởng 2 là 128 Kg.
Yêu cầu: Tính mức tiêu hao nguyên liệu B bình quân cho 1 đơn vị sản phẩm chung
cả 2 phân xưởng.
Bài 18:
Có tài liệu về tình hình phát triển sản xuất lương thực của huyện N như sau:
- Trong giai đoạn đầu (1990-1995) phát triển mỗi năm 115%
- Trong giai đoạn tiếp theo (1996-2002) phát triển mỗi năm 112%
- Trong giai đoạn cuối (2003-2009) phát triển mỗi năm 120%
Hãy xác định tốc độ phát triển bình quân năm về sản xuất lương thực của địa
phương trên?
Bài 20: Có tài liệu về tuổi nghề (TN) của các công nhân trong một xí nghiệp như sau:
Tuổi nghề (năm) 2 3 4 5 6 7 8 9 10
Số CN 5 8 12 20 31 43 32 25 13
Yêu cầu:
1. Tính tuổi nghề bình quân của công nhân trong xí nghiệp?
Nguyên lý thống kê
- 77 -

2. Mốt (mod) về tuổi nghề


3. Số trung vị (med) về tuổi nghề
Bài 22:
Có tài liệu về năng suất lao động của 75 công nhân trong một mỏ than như sau:

Phân tổ công nhân theo


Số công nhân
năng suất lao động ngày (kg)
400-450 10
450-500 15
500-600 15
600-800 30
800-1200 5
Hãy tính:
1. Năng suất lao động bình quân
2. Mốt (mod) về năng suất lao động ngày của công nhân
3. Không tính nhưng hãy chỉ ra giới hạn của số trung vị
4. Số trung vị med về năng suất lao động ngày của công nhân
Bài 23
Có tài liệu phân tổ 100 công nhân dệt theo năng suất lao động như sau:
Năng suất lao động ngày (met) Số công nhân
Dưới 40 10
40-50 30
50-75 40
75-100 15
100 trở lên 5
Hãy tính:
1. Năng suất lao động bình quân.
2. Độ lệch tuyệt đối bình quân.
3. Độ lệch chuẩn về năng suất lao động bằng các công thức khác nhau.
4. Hệ số biến thiên về năng suất lao động ngày của công nhân.
5. Sử dụng SPSS để xử lý các yêu cầu trên.
Bài 24
Có tài liệu về tuổi nghề (TN) và tiền lương (TL) của một tổ công nhân như sau

TN (năm) 2 2 5 7 9 9 10 11 12
TL (trđ) 3,33 3,55 4,80 5,10 5,20 5,15 5,50 6,00 6,40
Tính khoảng biến thiên, độ lệch tuyệt đối bình quân, phương sai độ lệch chuẩn của
từng tiêu thức?
Bài 25
Có tài liệu phân tổ công nhân về mức lương tại một xí nghiệp như sau:
Mức lương (1000đ) Tỷ trọng công nhân so với tổng số (%)
4000-5000 12
5000-6000 21
6000-7000 32
Nguyên lý thống kê
- 78 -

7000-8000 21
8000-9000 14
Yêu cầu:
1. Tính mức lương bình quân một công nhân của xí nghiệp?
2. Tính độ lệch tuyệt đối bình quân, phương sai và độ lệch chuẩn về tiền lương.
Bài 26
Có tài liệu về tiền luơng của công nhân trong một xí nghiệp như sau:
Loại công nhân số công nhân Mức lương tháng mỗi công nhân
(1000đ)
Thợ rèn 2 1700, 1800
Thợ nguội 3 1600, 1800, 2000
Thợ tiện 5 1700, 1900, 2000, 2100, 2300
Hãy tính:
1. Tiền lương bình quân của công nhân mỗi loại và toàn thể công nhân.
2. Phương sai chung về tiền lương
Bài 27 Có tài liệu về tình hình hoạt động của một công ty như sau:
Cửa Năm 2010 Năm 2011
hàng Quỹ lương Tiền lương 1 nhân Tiền lương 1 Tỷ trọng số nhân
(trd) viên (trd/nv) nhân viên viên (%)
(trd/nv)
1 2850 25 28 15
2 3248 28 30 20
3 7004 34 35 33
4 8995 35 40 32
Biết thêm: Tổng số nhân viên công ty năm 2011 là 200 nhân viên
Yêu cầu: 1/ Tính tiền lương bình quân 1 nhân viên tính chung cho công ty ở từng năm
(2010, 2011)
2/ Tính Mod, med về tiền lương 1 nhân viên năm 2011
Bài 28. Có tài liệu về công ty X có 3 PX: A, B, C sản xuất như sau:
Tỷ trọng chi phí sản xuất (CPSX) của phân xưởng A trong toàn bộ CPSX của công ty
năm 2009 là 40%, tỷ trọng CPSX của phân xưởng B năm 2009 là 25% .
CPSX năm 2010 so với năm 2009 của phân xưởng A là 103%,
CPSX năm 2010 so với năm 2009 của phân xưởng B là 110%,
CPSX năm 2010 so với năm 2009 của phân xưởng C là 109,4%,
CPSX năm 2010 so với năm 2009 của cả công ty là 107%.
Xác định cơ cấu về CPSX của công ty trong năm 2010.
Bài 29: Có tài liệu sau của 1 doanh nghiệp có các phân xưởng
PX 2012 2013
Tổng NVL Mức hao phí Tỷ trọng Mức hao phí
hao phí(kg) NVL cho 1 sản NVL hao phí NVL cho 1 sản
phẩm(kg/sp) (%) phẩm(kg/sp)

Nguyên lý thống kê
- 79 -

A 500 2,4 10 5,5


B 700 5,7 35 3,2
C 400 6 27 6
D
300 4 28 8
1. Tính mức hao phí nguyên vật liệu bình quân cho 1 sản phẩm tính chung cho doanh
nghiệp ở từng năm và chung cho 2 năm.
2. Tính mod, med về mức hao phí nguyên vật liệu cho 1 sản phẩm ở năm 2012, 2013.
3. Tính phương sai, độ lệch chuẩn về mức hao phí NVL cho 1 sp ở năm 2012, 2013
4.Cho biết sản lượng sản xuất của công ty biến động như thế nào qua 2 năm biết tổng
NVL hao phí năm 2013 là 2300 kg.
Bài 30. Một công ty có các cửa hàng
Cửa hàng 2010 2011
Doanh thu (trd) Sản lượng tiêu Giá bán(trd/tấn) Tỷ trọng doanh
thụ(tấn) thu(%)
A 60 12 6 18
B 210 30 9 25
C 180 18 12 30
D
80 20 5 27

1. Tính giá bán bình quân 1 tấn tính chung cho công ty năm 2010,2011
2. Tính mod, med về giá bán năm 2010, 2011, biết doanh thu 2011 là 600 trd
3. Tính phương sai và độ lệch chuẩn về giá bán 2010, 2011

CHƯƠNG IV: DÃY SỐ THỜI GIAN


 Mục tiêu của chương:
Sau khi nghiên cứu chương này, sinh viên cần nắm vững các vấn đề sau:
- Nắm được dãy số thời gian là gì, phân biệt được các loại dãy số thời gian.
- Biết cách xác định và nắm rõ được ý nghĩa của các chỉ tiêu phân tích dãy số thời
gian.
- Nắm được các phương pháp biểu hiện xu hướng phát triển cơ bản của hiện tượng.
- Biết cách dự đoán thống kê với những phương pháp cơ bản nhất.
Đây là phương pháp phân tích biến động của hiện tượng qua thời gian, các giá trị
quan sát ở phân tích dãy số thời gian thường là không độc lập với nhau, chẳng hạn, sự
liên hệ phụ thuộc giữa doanh số bán các tháng kế tiếp nhau của một sản phẩm, hoặc
tính thời vụ của doanh số bán nhiều sản phẩm: doanh số tăng cao hoặc giảm thấp ở
một số tháng nào đó được lặp lại qua nhiều năm.
Có thể nói rằng sự phụ thuộc của các giá trị quan sát trong dãy số là đặc điểm, cơ
sở cho việc xây dựng các phương pháp nghiên cứu và dự đoán về dãy số thời gian.

Nguyên lý thống kê
- 80 -

I. Khái niệm, đặc điểm và ý nghĩa của dãy số thời gian:


 Dãy số thời gian là dãy các trị số của một chỉ tiêu thống kê được sắp xếp theo
thứ tự thời gian.
Ví dụ: Có số liệu về sản lượng sản phẩm A của công ty X sản xuất được qua các
năm từ 2014-2019:
Năm 2014 2015 2016 2017 2018 2019
Sản lượng 20 25 27 17 15 10
(cái)
 Đặc điểm:
- Một dãy số thời gian có hai thành phần:
+ Thời gian: thời gian của dãy số có thể là này tuần, tháng, quý, năm, độ dài
của hai thời gian liền nhau gọi là khoảng cách thời gian
+ Chỉ tiêu về hiện tưọng nghiên cứu: trị số của chỉ tiêu có thể là số tương
đối, số tuyệt đối, số trung bình, các trị số đó gọi là các mức độ của dãy số.
 Ý nghĩa của việc nghiên cứu dãy số thời gian:
- Quan sát dãy số cho ta thấy tình hình biến động của hiện tượng nghiên cứu qua
thời gian.
- Tính toán các chỉ tiêu phân tích cho dãy số.
- Dãy số thời gian còn giúp ta nghiên cứu tính quy luật phát triển của hiện tượng
và căn cứ vào đó có thể dự đoán các mức độ của hiện tượng trong tương lai
II. Các loại dãy số thời gian:
Căn cứ vào đặc điểm của hiện tượng nghiên cứu qua thời gian người ta chia dãy số
thời gian thành hai loại: dãy số thời kỳ và dãy số thời điểm.
1. Dãy số thời điểm:
Là loại dãy số biểu hiện mặt lượng của hiện tượng qua các thời điểm nhất định.
Trong dãy số thời điểm, các mức độ của dãy số không phụ thuộc vào khoảng cách
thời gian dài hay ngắn, các mức độ trong dãy số thời điểm chỉ phản ánh tại một thời
điểm nào đó, trước và sau thời điểm đó có thể khác, do đó việc cộng dồn các mức độ
không có ý nghĩa thực tế.
Ví dụ: - Giá trị hàng tồn kho của các ngày trong tháng
- Điều tra dân số được tổng số dân của địa phương X trong từng thời điểm cụ
thể
- Dãy số thời điểm được phân thành hai loại: dãy số thời điểm có khoảng cách
thời gian đều nhau, dãy số thời điểm có khoảng cách thời gian không đều nhau
2. Dãy số thời kỳ:
Biểu hiện quy mô, khối lượng của hiện tượng trong từng khoảng thời gian nhất
định. Trong dãy số thời kỳ các mức độ nếu là số tuyệt đối thì có thể cộng dồn các mức
độ kế tiếp nhau để phản ánh hiện tượng ở một thời kỳ dài hơn
Ví dụ: sản lượng thu hoạch của một địa phương ở các năm
Số lượng sinh viên ở các khoá của một trường đại học
 Yêu cầu cơ bản khi xây dựng 1 dãy số thời gian là phải đảm bảo tính chất có thể so
sánh được giữa các mức độ trong dãy số. Muốn vậy thì nội dung và phương pháp tính
toán chỉ tiêu qua thời gian phải thống nhất, phạm vi của hiện tượng nghiên cứu trước
sau phải nhất trí (nhất là thời kỳ)

Nguyên lý thống kê
- 81 -

III. Các chỉ tiêu phân tích dãy số thời gian:


Để phản ánh đặc điểm biến động của hiện tượng qua thời gian ta sử dụng các chỉ
tiêu:
1. Mức độ trung bình theo thời gian:
Là số trung bình số học của các mức độ khác nhau trong dãy số. Chỉ tiêu này phản
ánh mức độ đại diện (điển hình) về mặt lượng của hiện tượng trong một thời gian
nghiên cứu.
Tuỳ theo tính chất thời gian (dãy số thời kỳ hay dãy số thời điểm) mà ta có công
thức áp dụng khác nhau
- Đối với dãy số thời kỳ:
n

y1  y 2 ....  y n 
yi
y  i 1

n n
y : mức độ bình quân theo thời gian
yi : các mức độ trong dãy số (i=1,n)
n: số mức độ
Ví dụ: Có tài liệu về doanh số bán hàng hoá của một công ty X trong 3 tháng đầu
năm 2018 như sau:
Tháng 1 2 3
Doanh số (triệu đồng) 159 172 113

Tính mức tiêu thụ bình quân hàng tháng của quý I năm 2008
y1  y 2  y 3 159  172  113
y   174,66 tr
n 3
- Đối với dãy số thời điểm: chia 2 trường hợp
+ Đối với dãy số thời điểm có khoảng cách thời gian bằng nhau
Công thức tính:
y1 y
 y 2  y 3 ...  y n 1  n
y 2 2
n 1
Trong đó: yi (i=1....n): các mức độ của dãy số thời điểm
n: số mức độ của dãy số
Ví dụ: Có tình hình về giá trị hàng tồn kho của công ty A trong quý I/2018

Tháng 1/1 1/2 1/3 ¼


Giá trị hàng hoá tồn 700 650 800 750
kho (triệu đồng)

Tính giá trị hàng tồn kho bình quân trong quý I /2008 của công ty

Nguyên lý thống kê
- 82 -

700 750
 650  800 
y 2 2
4 -1
+ Đối với dãy số thời điểm có khoảng cách thời gian không bằng nhau.
Trong trường hợp này ta phải lấy khoảng cách thời gian làm quyền số của số bình
quân
n

y t + y 2 t 2 + ....yn t n y t
i 1
i i
y= 1 1 =
t 1 + t 2 + .... + t n t i
Trong đó: yi: các mức độ trong dãy số
ti: độ dài thời gian ở mức độ yi
y : mức độ bình quân theo thời gian
Ví dụ: Có tài liệu về số dư tiền vay ngân hàng của công ty Z trong quý I/2019 như
sau:
Thời điểm 1.1 15.1 25.2 9.3
Số dư tiền vay 500 400 600 700
ngân hàng (trđ)
Tính số dư tiền vay bình quân của quý I
Ta lập bảng:

Số dư tiền vay (yi) số ngày (ti) yiti


500 14 (từ 1/1-14/1) 7000
400 41 16400
600 12 7200
700 23 16100
t i  90 y t i i  46700

y
y t
i i

46700
 519 tr
t i 90
Kết quả trên nói lên số dư tiền vay ngân hàng trung bình của quý I là 519 triệu
đồng
2. Lượng tăng giảm tuyệt đối:
Chỉ tiêu này phản ánh sự thay đổi về trị số tuyệt đối của hiện tượng nghiên cứu
giữa hai thời gian, tuỳ theo việc chọn gốc so sánh mà người ta chia thành hai trường
hợp đó là lượng tăng giảm tuyệt đối liên hoàn và lượng tăng giảm tuyệt đối định gốc
- Lượng tăng giảm tuyệt đối liên hoàn (từng kỳ):
Là hiệu số giữa mức độ kỳ nghiên cứu bất kỳ (yi) với mức độ kỳ đứng liền trước
nó (yi-1)
 i  yi  yi 1 (i  2, n)
Trong đó: yi mức độ của kỳ nghiên cứu (i=2, 3…n)
Nguyên lý thống kê
- 83 -

yi-1 mức độ của kỳ đứng liền trước đó


Chỉ tiêu này phản ánh sự chênh lệch về tuyệt đối giữa hai thời gian liền nhau
Dãy số có n mức độ thì chỉ tính được n-1 lượng tăng giảm tuyệt đối từng kỳ
Ví dụ: Có tài liệu về tổng sản lượng sản xuất của một xí nghiệp như sau:

Năm 2015 2016 2017 2018 2019


Tổng sản lượng sản xuất (tr) 15 20 17 25 18
Lượng tăng giảm tuyệt đối liên hoàn(tr) - 5 -3 8 -7
Lượng tăng giảm tuyệt đối định gốc 5 2 10 3
Lượng tăng giảm tuyệt đối bình quân
Tốc độ phát triển liên hoàn(%) 133 85 147 72
Tốc độ phát triển định gốc(%) 133 113 167 120
Tốc độ tăng giảm liên hoàn(%) 33 -15 47 -28
Tốc độ tăng giảm định gốc(%) 33 13 67 20
Chỉ tiêu tuyệt đối của 1% tăng giảm

- Lượng tăng giảm tuyệt đối định gốc: là hiệu số giữa mức độ của kỳ nghiên cứu
bất kỳ (yi) với mức độ của một kỳ nào đó được chọn làm gốc so sánh thường là
mức độ đầu tiên trong dãy số (y1)
y  yi  y1
Trong đó: yi: mức độ kỳ nghiên cứu (y=2,3......n)
y1: mức độ được chọn làm gốc so sánh (mức độ đầu tiên)
 Mối quan hệ giữa lượng tăng giảm tuyệt đối định gốc và lượng tăng giảm tuyệt
đối liên hoàn
n
y    i
i 2
Lượng tăng giảm tuyệt đối định gốc bằng tổng đại số của lượng tăng giảm tuyệt
đối liên hoàn
- Lượng tăng giảm tuyệt đối trung bình:
Là số bình quân cộng của các lượng tăng giảm tuyệt đối liên hoàn
Chỉ tiêu này phản ánh về mặt lượng tăng giảm bình quân của hiện tượng qua thời
gian
n

 i
y y  y1
i  i 2
  n
n 1 n 1 n 1
Áp dụng Ví dụ trên:
L ượng tăng giảm tuyệt đối bình quân:
5387
   0,75
4
y - y1 18 - 15 3
Hoặc  n  
n -1 5 -1 4
Nguyên lý thống kê
- 84 -

Bình quân một năm tổng sản lượng sản xuất tăng 0,75 đvt
2. Tốc độ phát triển:
Là số tương đối động thái phản ánh sự biến động của hiện tượng kinh tế xã hội qua
thời gian và được tính bằng cách so sánh các mức độ trong dãy số, tuỳ theo việc chọn
gốc so sánh mà người ta chia thành hai trường hợp
- Tốc độ phát triển liên hoàn: là kết quả so sánh giữa mức độ của kỳ nghiên cứu
bất kỳ (yi) với mức độ của kỳ đứng liền trước nó yi-1
yi
ti =
y i -1
i=2, 3, 4 .....n
- Tốc độ phát triển định gốc: là kết quả so sánh giữa mức độ của kỳ nghiên cứu bất
kỳ yi với mức độ nào đó được chọn làm gốc so sánh thường là mức độ đầu tiên y1
yi
Ti 
y1
y1: mức độ đầu tiên (mức độ được chọn làm gốc so sánh)
Mối quan hệ giữa tốc độ phát triển định gốc và tốc độ phát triển liên hoàn
Tốc độ phát triển định gốc:
n
Tn  t 2 .t 3 .....t n   t i
i 2

yi
Ti y1 y i y1 yi
    ti
Ti 1 y i 1 y i 1y1 y i 1
y1
- Tốc độ phát triển bình quân: là số bình quân nhân của các tốc độ phát triển liên
hoàn, nó phản ánh tốc độ phát triển bình quân của hiện tượng trong suốt thời gian
nghiên cứu
n
yn
t  n1 t 2 .t3 ....t n  n1  ti  n1 Tn  n1
i 2 y1
Ví dụ: (trên)
Tốc độ phát triển bình quân:
t  n1 t 2 .t3 ....t n  4 1,33x0,85 x1,47 x0,72  4 1,1965  1,045  104,5%
-
18
Hoặc t4
15
Nguyên lý thống kê
- 85 -

KL: Bình quân hàng năm giá trị tổng sản lượng phát triển với tốc độ 104,5% tức
tăng 4,5%
3. Tốc độ tăng hoặc giảm:
Là số tương đối phản ánh mức độ của hiện tượng nghiên cứu giữa hai thời gian đã
tăng thêm hoặc giảm đi bao nhiêu lần hoặc bao nhiêu %, tuỳ theo việc chọn gốc so
sánh mà người ta chia hai trường hợp:
- Tốc độ tăng, giảm liên hoàn: là tỷ số so sánh giữa lượng tăng giảm tuyệt đối
liên hoàn với mức độ kỳ gốc liên hoàn
yi  yi 1 i
ai    ti 1
yi 1 yi 1
ai=ti-100 (nếu ti tính bằng %)
- Tốc độ tăng giảm định gốc: là tỷ số so sánh giữa lượng tăng giảm tuyệt đối định
gốc với mức độ kỳ gốc cố định
yi  y1 yi
Ai    Ti  1
y1 y1
Ai =Ti – 100 (nếu Ti tính bằng %)
- Tốc độ tăng giảm bình quân:
ai  t  1
a  t  100 (nếu tính bằng %)
Áp dụng Ví dụ trên:
Tốc độ tăng giảm bình quân:
a  t  100  104,5  100  4,5%
4. Giá trị tuyệt đối của 1 % tăng giảm:
Chỉ tiêu này phản ánh cứ 1% tăng hoặc giảm của tốc độ tăng hoặc giảm liên hoàn
thì ứng với một lượng tuyệt đối là bằng bao nhiêu
i y i  y i 1 y
Ci    i 1
ai y i  y i 1 100
x100
y i 1
Ví dụ chung:
Có tài liệu sau về tình hình sản xuất tại một địa phương
Năm 2006 2007 2008 2009
Lợi nhuận (trd) 240
Tốc độ phát triển liên hoàn 117%
(%)
Tốc độ tăng liên hoàn (%) 12
Lượng tuyệt đối giảm liên -8
hoàn (trd)
1. Tính mức lợi nhuận bình quân hàng năm trong thời kỳ trên
2. Tính tốc độ tăng (giảm) bình quân hàng năm về lợi nhuận trong thời kỳ trên

Nguyên lý thống kê
- 86 -

3. Tính lượng tăng (giảm) tuyệt đối bình quân hàng năm về lợi nhuận trong thời
kỳ trên.
Giải:
240
y07   214,3
1,12

214,3
y06   183,16
1,17

y09  240  8  232


1. Lợi nhuận bình quân hàng năm
k

y i
183,16  214,3  240  232
y i 1
  217,36
n 4
2. Tốc độ tăng giảm bình quân:

232
t3  108,2%
183,16
Tốc độ tăng bình quân: 108,2 – 100 = 8,2%
Bình quân hàng năm lợi nhuận tăng 8,2%

3. Lượng tuyệt đối tăng giảm bình quân


232  183,16
y  16,28
3
Bình quân hàng năm lợi nhuận tăng 16,28 trd
IV. Các phương pháp biểu hiện xu hướng phát triển cơ bản của hiện tượng:
Khi nghiên cứu một hiện tượng, các mức độ theo thời gian chịu tác động của nhiều
nhân tố, trong đó có nhân tố ngẫu nhiên làm cho hiện tượng sai lệch khỏi xu hướng.
Với những phương pháp thống kê thích hợp, giúp ta loại bỏ tác động của những
nhân tố ngẫu nhiên.
Khi sử dụng các phương pháp để biểu hiện xu hướng phát triển của hiện tượng cần
phải đảm bảo tính chất có thể so sánh được giữa các mức độ trong dãy số: như phải
thống nhất về đơn vị đo tính, phương pháp và phạm vi tính toán các mức độ trong dãy
số...
1. Phương pháp mở rộng khoảng cách thời gian:
Phương pháp này được áp dụng đối với dãy số có quá nhiều mức độ hoặc khoảng
cách thời gian quá ngắn làm ta khó thấy được xu hướng phát triển cơ bản của hiện
tượng. Để thấy được xu hướng ta phải tiến hành mở rộng khoảng cách thưòi gian tức
là chuyển các mức độ từ tuần sang tháng, từ tháng sang quý, từ quý sang năm...
Ví dụ: Có số liệu về sản lượng hàng quý của 1 công ty qua 4 năm:
Nguyên lý thống kê
- 87 -

Năm /quý 2017 2018 2019 2020


I 2000 3500 1540 1000
II 3000 1000 1700 900
III 1050 2700 2900 500
IV 1500 980 - 100

Qua bảng ta thấy sản lượng hàng hoá tiêu thụ của các quý trong năm tăng, giảm
thất thường. Ta có thể mở rộng khoảng cách thời gian từ quý sang 6 tháng để thấy
được xu hướng phát triển
Mở rộng khoảng cách sang 6 tháng:
Năm 2017 2018 2019 2020
6 tháng đầu năm 5000 4500 3240 1900
6 tháng cuối năm 2550 3680 2900 600
Sản lượng của công ty giảm xuống vào sáu tháng cuối năm
 Do khoảng cách thời gian được mở rộng (từ 3 tháng sang 6 tháng) nên trong
mỗi mức độ của dãy số mới thì sự tác động của nhân tố ngẫu nhiên (với chiều hướng
khác nhau) phần nào đã được bù trừ (triệt tiêu) và do đó cho ta thấy rõ xu hướng biến
động cơ bản
2. Phương pháp số trung bình trượt:
Trong một số trường hợp, biến động của hiện tượng tỏ ra bất thường, không thể
hiện xu hướng một cách rõ rệt do ảnh hưởng của các yếu tố ngẫu nhiên quá lớn,
phương pháp số trung bình trượt nhằm giảm bớt hoặc triệt tiêu các ảnh hưởng ngẫu
nhiên, thể hiện xu hướng biến động của hiện tượng.
Ý tưởng ở đây là ảnh hưởng của yếu tố ngẫu nhiên ở 1 thời điểm nào đó sẽ bị hạn
chế, loại trừ nếu giá trị quan sát ở thời điểm đó được tính trung bình với các giá trị
quan sát lân cận.
Trường hợp áp dụng: đối với dãy số có nhiều mức độ và có giao động ngẫu nhiên
không lớn lắm.
- STB di động là số trung bình cộng của một nhóm nhất định các mức độ của dãy
số. STB trượt thứ 1 được tính từ một nhóm mức độ nhất định (3, 4 hoặc 5) sau đó ta di
động đến mức độ kế tiếp, đồng thời loại trừ mức độ đầu tiên và tính số trung bình trượt
thứ 2, 3...sao cho tổng số các mức độ tham gia tính số trung bình không thay đổi.
Một cách tổng quát, giả sử ta có dãy số thời gian Y1, Y2, ......Yn. Gọi Y* là số trung
bình di động ứng với thời điểm t được tính từ nhóm (2m+1) mức độ. Ta có:
Yt m  Yt m1  Yt  .......  Yt  m1  Yt  m 1 m
Y 
*

2m  1
 
2m  1 j   m
Yt  j
(t=m+1, m+2, ....n-m)

Giả sử có dãy số thời gian gồm n mức độ: y1, y2, ......yn-1, yn
Nếu tính số trung bình trượt từ nhóm 3 mức độ ta có:
y1  y 2  y 3
y2 
3
Nguyên lý thống kê
- 88 -

y 2  y3  y 4
y3 
3
Cho ta một dãy số mới: y 2 , y 3 , y 4 ,....y n 1
Vấn đề đặt ra là nên tính số trung bình di động từ một nhóm bao nhiêu mức độ.
Nếu tính STB di động từ một nhóm ít mức độ thì ảnh hưởng ngẫu nhiên ít được loại
trừ, nếu tính từ nhiều mức độ thì không thể hiện được xu hướng.
Đối với những hiện tượng biến động không lớn và số mức độ thực tế không nhiều
lắm thì tính từ 3 mức độ. Nếu biến động lớn thì nên tính từ nhiều mức độ hơn (5, 7
mức độ)
Nếu hiện tượng biến động theo chu kỳ thì STB di động nên tính với số lượng mức
độ bằng độ dài thời gian của chu kỳ hoặc bội số của chu kỳ
Với dãy số biến động thời vụ tháng hoặc quý, thì nên tính số trung bình di động từ
nhóm 12, 4 mức độ (nếu mức độ của hiện tượng sắp xếp theo quý thì STB di động nên
tính từ 1 nhóm 4 mức độ vì 1 năm có 4 quý)
Trong trường hợp số tổng cộng của từng nhóm mức độ và số trung bình di động
tính từ nhóm mức độ đó rơi vào giữa 2 thời gian nghiên cứu (2 tháng , 2 quý), ta tiếp
tục tính STB di động lần 2 sao cho STB di động mới rơi vào đúng dòng có mức độ
thực tế, để giúp ta tính chỉ số thời vụ theo phương pháp 2.
3. Phương pháp hồi quy: (phương pháp thể hiện xu hướng bằng hàm số) (phương
pháp hàm xu thế)
- Trường hợp áp dụng: áp dụng đối với dãy số có mức độ giao động ngẫu nhiên
khá lớn
Hiện tượng nghiên cứu, biến động do ảnh hưởng các yếu tố ngẫu nhiên làm ta khó
thấy được xu hướng phát triển cơ bản của hiện tượng, để có thể thấy được rõ hơn ta
dùng phương pháp hồi quy.
Nội dung cơ bản của phương pháp này là:
Khái quát hoá chiều hướng biến động của hiện tượng nghiên cứu bằng 1 hàm số
toán học, nhằm mô tả một cách gần đúng nhất biến động thực tế cuả hiện tượng.
Nói cách khác, vấn đề đặt ra là: thông qua việc xem xét đồ thị biến động thực tế
của hiện tượng kết hợp với kinh nghiệm, sự hiểu biết thực tế về hiện tượng, ta chọn 1
hàm số có tính chất lý thuyết để thể hiện một cách tốt nhất xu hướng phát triển của
hiện tượng.
Dạng tổng quát cuả một hàm số theo thời gian t như sau:
yˆ t  f (t , a0 , a1 ,...an )
trong đó:
yˆ t : mức độ lý thuyết
a0, a1, ...an: các tham số của mô hình
Các tham số của phương trình hồi quy được xác định bằng phương pháp bình
phương bé nhất:
(y i  yˆ t ) 2  min
Sau đây là một số dạng hàm số thường được sử dụng:

Nguyên lý thống kê
- 89 -

a. Trường hợp 1: Các mức độ cuả hiện tượng biến động hay phát triển theo quy luật
gần với cấp số cộng tức là các lượng tăng giảm gần đều nhau thì ta dùng phương trình
hồi quy tuyến tính
có dạng:
yˆ t  a  bt
ŷt : trị số lý thuyết
a, b: tham số của mô hình
t: thứ tự thời gian
ŷt được coi là thích hợp nhất đối với dãy số khi:
n n

( y
i 1
i  yˆti )   ( yi  a  bt ) 2  min
i 1
Từ đó ta có hệ phương trình chuẩn sau:
n n

 yi  na  b ti
i 1 i 1
n n n

 yi t i  a  t i  b  t i
i 1 i 1 i 1
2

Từ hệ phương trình trên, ta sẽ tính được a,b:


n yi ti   ti  yi
b
n t i  ( t i ) 2
2

a  y i  bt i
b. Trường hợp 2: nếu các mức độ của hiện tượng nghiên cứu ngày càng tăng
nhanh và sau đó giảm dần thì người ta dùng phương trình parapol (hàm số bậc 2)
Dạng tổng quát của phương trình như sau:
yˆt  a  bt  ct 2
Các tham số a, b, c có thể được xác định thông qua hệ phương trình:
 y  na  b t  c t 2

 yt  a t  b t  c t 2 3

 yt  a t  b t  c t
2 2 3 4

c. Trường hợp 3: Nếu các mức độ của dãy số giảm với tốc độ ngày càng giảm dần thì
ta dùng phương trình hyperbol:
b
yˆ t  a 
t
Dùng phương pháp bình phương bé nhất ta có hệ phương trình sau:

Nguyên lý thống kê
- 90 -

1
 y  na  b x
1 1 1
 y x  a  x  b x 2

d. Trường hợp 4: Nếu các mức độ của dãy số tăng với tốc độ ngày càng tăng nhanh
theo thời gian thì ta dùng hàm mủ để mô tả
ˆ t  abt
y
Phương trình hàm mủ thường được sử dụng cho những hiện tượng có nhịp độ phát
triển tương đối ổn định.
Lấy log 2 vế ta có:
Lgy=lga+tlgb
Với phương pháp bình phương nhỏ nhất ta được hệ phương trình để xác định a, b:
 lg y  n lg a  lg b t
 t lg y  lg a  t  lg b t 2

Ngoài ra, tuỳ theo đặc điểm và tính chất biến động của các dãy số thời gian, ta có
thể sử dụng các phương trình khác: phương trình bậc 3,...
Chú ý: trên thực tế người ta thường lựa chọn các mô hình xấp xỉ gần giống nhau
sau đó người ta chọn mô hình tốt nhất thông qua sai số của mô hình:

Sy 
 ( yˆ t
 y) 2
n p
Sy: sai số của mô hình
P: số tham số của mô hình
ŷt : trị số điều chỉnh ( trị số lý thuyết)
n: số quan sát (số mức độ thời gian)
y: giá trị thực tế trong dãy số
4. Phương pháp biểu hiện biến động thời vụ:
Một số hiện tượng kinh tế xã hội biến động có tính chất thời vụ, biểu hiện của biến
động này là năm nào cứ đến 1 thời điểm nhất định thì hiện tượng sẽ tăng lên hoặc giảm
đi một cách rõ rệt, nguyên nhân của biến động này chủ yếu do ảnh hưởng thời tiết khí
hậu, tập quán của dân cư...
Ví dụ: Các sản phẩm của ngành nông nghiệp phụ thuộc vào từng mùa vụ, các
ngành công nghiệp chế biến từ sản phẩm của ngành nông nghiệp, hoạt động thương
nghiệp đều chịu ảnh hưởng ít nhiều bởi biến động thời vụ.
Biến động thời vụ thường gây nên tình trạng khi thì quá căng thẳng khi thì quá
nhàn rỗi, do đó ảnh hưởng đến hoạt động sản xuất của ngành và một số ngành khác có
liên quan.
Vì vậy nắm được quy luật biến động thời vụ giúp ta chủ động được trong công tác
quản lý.
Nhiệm vụ của nghiên cứu thống kê là dựa vào số liệu của nhiều năm (ít nhất là 3
năm) để xác định tính chất và mức độ của biến động thời vụ. Phương pháp thường
được sử dụng là tính các chỉ số thời vụ. Có hai trường hợp:
Nguyên lý thống kê
- 91 -

- Đối với dãy số có các mức độ tương đối ổn định tức là dãy số qua các năm cùng
1 thời kỳ không có biểu hiện tăng giảm rõ rệt thì ta dùng chỉ số thời vụ như sau:
yi
I TV (i )   100%
y
Trong đó: ITV(i): chỉ số thời vụ ở thời kỳ i
y i : mức độ bình quân qua các năm ở thời kỳ i
y : mức độ bình quân của tất cả các mức độ trong dãy số
Chỉ số thời vụ tính bằng cách so sánh số trung bình của các mức độ của các thời
gian cùng tên (tháng, quý) với số trung bình chung của tất cả các mức độ trong dãy số.
Ví dụ: Có tài liệu về tình hình tiêu thụ mặt hàng A ở 1 địa phương qua 4 năm
Năm Quý I II III IV
2004 67 61 68 72
2005 69 59 66 70
2006 70 62 67 73
2007 71 63 69 75
 yi 277 245 270 290
(cộng các năm
có cùng quý)
yi 
y i
69,25 61,25 67,5 72,5
4
yi 1,024 0,9 0,998 1,072
IS  100
y

y
 y  1080  67,625
n 16

Ý nghĩa: Nếu coi mức trung bình của mỗi quý là 100% thì mức tiêu thụ hàng hoá
quý I bằng 102,4%, quý II bằng 90%...
Kết quả cho thấy sản phẩm của công ty tiêu thụ mạnh vào quý I và quý IV
- Đối với dãy số có các mức độ biến động khá mạnh: biến động thời vụ qua những
thời gian nhất định của các năm có sự tăng giảm rõ rệt, tức là các mức độ cùng kỳ của
hiện tượng từ năm này qua năm khác có biểu hiện tăng giảm rõ rệt thì phải dùng
phương pháp điều chỉnh bằng phương trình hồi quy để tính ra các mức độ lý thuyết,
rồi sau đó dùng các mức độ đó làm căn cứ so sánh. Chỉ số thời vụ trong trường hợp
này được tính theo công thức:
n yij
I TV  (  100)  N
j 1 y ij
yi j: là các mức độ thực tế của thời gian i của năm j
y ij : là trị số lý thuyết theo hồi quy tuyến tính
N: số năm nghiên cứu
Nguyên lý thống kê
- 92 -

V. Phương pháp dự đoán thống kê


Phương pháp dự đoán thống kê là tiến hành xây dựng các mô hình căn cứ vào sự
phân tích các nhân tố ảnh hưởng đến sự biến động của hiện tượng và trên cơ sở thừa
nhận rằng những yếu tố đã và đang tác động sẽ vẫn còn tiếp tục diễn ra trong tương lai.
1. Dự đoán dựa vào tốc độ phát triển trung bình:
Trường hợp sử dụng: hiện tượng nghiên cứu có nhịp độ phát triển ổn định

Mô hình dự đoán: y n L  y n ( t ) L

yn: mức độ cuối cùng của dãy số


t : tốc độ phát triển trung bình
L: tầm xa dự đoán
2. Ngoại suy hàm xu thế:
Căn cứ vào chiều hướng biến động của hiện tượng ta xác định phương trình hồi
quy lý thuyết để biểu hiện sự biến động đó
yˆ t  f (t )
Ta có thể dự đoán mức độ của hiện tượng trong tương lai
Mô hình dự đoán:
yˆ t  L  f (t  L)
3. Dự đoán dựa vào lượng tăng giảm tuyệt đối bình quân
Phương pháp này được áp dụng đối với hiện tượng có các lượng tăng giảm tuyệt
đối liên hoàn xấp xỉ bằng nhau.
Mô hình dự đoán như sau:
y n  L  y n  L
Trong đó:
yn: mức độ cuối cùng của dãy số
L: tầm xa dự đoán
 : lượng tăng giảm tuyệt đối bình quân
VI. Ứng dụng SPSS để xử lý số liệu (phần 2)
Để dự đoán dựa vào mô hình hồi quy ta thực hiện như sau:
Dữ liệu cần có là một dãy số thời gian:
Năm 2003 2004 2005 2006 2007 2008 2009 2010
Lợi 12 13 15 18 20 24 26 30
nhuận
Ta chỉ nhập liệu phần các giá trị của hiện tượng trên 1 biến. Phần thời gian ta chỉ định
máy thực hiện như sau: Bấm chọn: Data/Define để vào cửa sổ sau:

Nguyên lý thống kê
- 93 -

Sau khi thao tác như hình trên, bấm chọn OK để kết thúc nhập liệu. Sau đó bấm
chọn: Analyze/ Regression/ Curve Estimation
Ta có cửa sổ Curve Estimation như sau :

Trong đó trước hết cần chọn biến cần dự đoán cho ô dependent, tiếp đến chọn
biến thời gian cho ô Independent variable, sau đó bấm chọn ô Time kế dưới để chỉ
định thời gian cho mô hình. Sau cùng chọn mô hình dự đoán trông ô Model và chỉ
định dự đoan bằng cách bấm chọn ô Save

Predicted values : chỉ định dự đoán điểm


Prediction intervals: chỉ định dự đoán khoảng
Predict through: chỉ định thời gian dự đoán xa nhất.
Các kết quả dự đoán được kết xuất trên cửa sổ dữ liệu.

Ví dụ tổng kết chương:


Ví dụ 1: Có tài liệu về tổng sản lượng sản xuất của một xí nghiệp như sau:

Năm 2015 2016 2017 2018 2019

Tổng sản lượng sản xuất (tr) 15 20 17 25 18

Lượng tăng giảm tuyệt đối liên hoàn(tr) - 5 -3 8 -7

Nguyên lý thống kê
- 94 -

Lượng tăng giảm tuyệt đối định gốc 5 2 10 3


Lượng tăng giảm tuyệt đối bình quân
Tốc độ phát triển liên hoàn(%) 133 85 147 72
Tốc độ phát triển định gốc(%) 133 113 167 120
Tốc độ tăng giảm liên hoàn(%) 33 -15 47 -28
Tốc độ tăng giảm định gốc(%) 33 13 67 20
Chỉ tiêu tuyệt đối của 1% tăng giảm

L ượng tăng giảm tuyệt đối bình quân:

5387
   0,75
4
y n - y1 18 - 15 3
Hoặc   
n -1 5 -1 4
Bình quân một năm tổng sản lượng sản xuất tăng 0,75 đvt

n
yn
t  n1 t 2 .t3 ....t n  n1  ti  n1 Tn  n1
i 2 y1
Tốc độ phát triển bình quân:

t  n1 t 2 .t3 ....t n  4 1,33x0,85 x1,47 x0,72  4 1,1965  1,045  104,5%


-

18
Hoặc t4
15
KL: Bình quân hàng năm giá trị tổng sản lượng phát triển với tốc độ 104,5% tức
tăng 4,5%
Tốc độ tăng giảm bình quân:

Nguyên lý thống kê
- 95 -

a  t  100  104,5  100  4,5%

Ví dụ 2:
Tốc độ phát triển lợi nhuận của công ty M và công ty N trong thời gian 2000-
2010 là 145% và 136%. Hãy tính tốc độ phát triển bình quân hàng năm về lợi nhuận
của chung 2 công ty trong thời gian đó, biết rằng lợi nhuận năm 2000 của công ty M
là 800 trd và công ty N là 650 trd.
Giải:
y10 M
 1,45
y00 M
y10 N
 1,36
y00 N

y10 10 800  1,45  650  1,36 10 2044


t  10    103,48%
y00 800  650 1450
Ví dụ 3
Có tài liệu về chỉ tiêu lợi nhuận của một doanh nghiệp X như sau:
Năm 2016 2017 2018 2019 2020
Doanh thu 5000 5200 5442 5700 5900
(trđ)
Hãy tính:
1/ Tính doanh thu bình quân hàng năm trong thời kỳ trên.
2. Xác định sự biến động bình quân hàng năm về doanh thu trong thời kỳ trên
2/ Dự đoán doanh thu năm 2024 dựa vào lượng tăng giảm tuyệt đối bình quân.
Giải:

1. Doanh thu bình quân:


5000 + 5200 + 5442 + 5700 + 5900
y= = 5448,4
5

Sự biến động;
- Về tương đối:

Nguyên lý thống kê
- 96 -

5900
t= =104,22%
4
5000
Bình quân hàng năm doanh thu tăng 4,22%
- Về tuyệt đối:
5900 5000
a= = 225trd
4
Bình quân hàng năm doanh thu tăng 225 trd
Dự đoán doanh thu 1
5900 5000
a= = 225trd
4
Y14=5900 + 225x4=6800 trd
Ví dụ 4:
Có tài liệu về tình hình sản xuất của xí nghiệp X trong quý II/2019 như sau:
Chỉ tiêu Tháng 4 Tháng 5 Tháng 6
1. Sản lượng sản xuất thực tế (chiếc) 1200 1500 2050
2. Tỷ lệ % hoàn thành kế hoạch sản lượng (%) 108 112 119
1. Tính sản lượng sản xuất bình quân hàng tháng trong quý II.
2. Tính sản lượng kế hoạch của quý II và tỷ lệ % hoàn thành kế hoạch quý II
Giải:

1. Sản lượng sản xuất bình quân hàng tháng trong quý II:

y i
1200  1500  2050 4750
y i 1
   1583,3
n 3 3

2. Sản lượng kế hoạch quý II:

yttê y
t ht   ykh  ttê
ykh t ht

1200 1500 2050


ykhII  ykh4  ykh5  ykh6     4173
1,08 1,12 1,19

Nguyên lý thống kê
- 97 -

 Tỷ lệ % hoàn thành kế hoạch quý II

tht   yttê 1200  1500  2050


  1,138  113,8%
 ykh 1200

1500

2050
1,08 1,12 1,19

Ví dụ 5:
Có tài liệu về lợi nhuận và lao động của doanh nghiệp Y trong quý III năm báo cáo
như sau:
Chỉ tiêu Tháng 7 Tháng 8 Tháng 9 Tháng 10
1. Lợi nhuận (1000đ) 800 000 870 000 730 000 900 000
2. Số nhân viên có vào ngày đầu 226 236 246 250
tháng
1/ Tính lợi nhuận bình quân hàng tháng trong quí III
2/ Số nhân viên bình quân từng tháng, cả quí
3/ Tính lợi nhuận bình quân mỗi nhân viên từng tháng.
Giải:

1. Lợi nhuận bình quân hàng tháng


800000  870000  730000 2400000
y   800000
3 3
2. Số nhân viên bình quân từng tháng:

226  236
y7   231
2

236  246
y8   241
2
246  250
y9   248
2

Số nhân viên bình quân cả quý:


226 250
 236  246 
y 2 2  240
3

3. Lợi nhuân bình quân mỗi nhân viên từng tháng:

Nguyên lý thống kê
- 98 -

Linhu 7 800000
y7    3463
sonhanvienthang7 231

LN 7 870000
y8    3609,9
sonhanvienthang7 241

LN 7 730000
y9    2943,5
sonhanvienthang7 248

Ví dụ 6:
Có tài liệu về tình hình kinh doanh của doanh nghiệp X qua các năm
Chỉ tiêu 2018 2019 2020
Lợi nhuân (trd) 340 460 500
Tỷ suất lợi nhuận trên 5 10 7
doanh thu(%)
Số lao động 120 140 150
1. Tính lợi nhuận bình quân hàng năm trong thời kỳ trên
2. Tính mức lợi nhuận bình quân cho mỗi lao động của từng năm
3. Tính tỷ suất lợi nhuận trên doanh thu tính chung cho 3 năm
Giải:
Lợi nhuận bình quân hàng năm
∑ yi 340 + 460 + 500
LNBQ = = = 433,3trd
n 3

Lợi nhuận bình quân mỗi lao động từng năm


340
LNBQ 08 = = 2,83
120
460
LNBQ 09 = 3,28
140
500
LNBQ10 = = 3,33
150
Tỷ suất lợi nhuân trên doanh thu tính chung cho 3 năm
∑loinhuan ∑loinhuan 340 + 460 + 500
t= = = = 0,07 = 7%
∑ doanhthu ∑ loinhuan 340 460 500
+ +
týuatloinhua 0,05 0,1 0,07

Nguyên lý thống kê
- 99 -

Ví dụ 7:
Có tài liệu về chỉ tiêu sản lượng sản xuất của một doanh nghiệp X như sau:
Năm 2015 2016 2017 2018 2019
Sản lượng sản 300 360 450 470 500
xuất(tấn)
Hãy tính:
1/ Tính sản lượng sản xuất bình quân hàng năm trong thời kỳ trên
2. Tính lượng tăng giảm tuyệt đối bình quân hàng năm về sản lượng
3. Tính tốc độ tăng giảm bình quân hàng năm về sản lượng
4. Dự đoán sản lượng sản xuất cho năm 2023 dựa vào tốc độ phát triển bình quân.
Giải:
1. sản lượng sản xuất bình quân

y
 y i

300  360  450  470  500
n 5

2. Lượng tăng giảm tuyệt đối bình quân

yn  y1 500  300
a   50
n 1 4
Bình quân hàng năm sản lượng tăng 50 tấn
3. Tốc độ tăng

500
t4  113,6%
300
Bình quân hàng năm sản lượng tăng 13,6%
4. Dự đoán
Y12 = 500 x1,1364 = 832,7 tấn

BÀI TẬP CUỐI CHƯƠNG


I. Chọn câu trả lời đúng nhất
Câu 1: Tốc độ phát triển lợi nhuận của 1 công ty năm 2018 so với 2013 là 3,2 lần.
Vậy, t ốc độ phát triển bình quân hàng năm của lợi nhuận trong thời kỳ trên là:
a. 133,7% b. 126% c. 121,3% d. khác
Câu 2
Có tài liệu về tình hình biến động sản lượng qua các năm như sau
- năm 2016 so với năm 2015 tăng 11%
- năm 2017 so với năm 2016 tăng 13%
- năm 2018 so với năm 2017 tăng 10%
Nguyên lý thống kê
- 100 -

- Năm 2019 so với 2018 tăng 14%


Tốc độ phát triển bình quân hàng năm về sản lượng trong thời kỳ trên là:
a. 11,99% b. 11,89% c. 111,99% d. khác
Câu 3: Có tài liệu về tình hình biến động doanh thu qua các năm như sau
- năm 2016 so với năm 2015 phát triển 119%
- năm 2017 so với năm 2016 phát triển 115%
- năm 2018 so với năm 2017 phát triển 117%
Tốc độ tăng bình quân hàng năm về doanh thu trong thời kỳ trên là:
a. 117% b. 126,5% c. 116,98% d. khác
Câu 5: Dân số của địa phương A năm 2011 là 602150 người, năm 2019 là 711068
người. Như vậy tốc độ tăng dân số bình quân hàng năm thời kì 2011-2019 là (%)
a. 1,68
b. 1,31
c. 2,1
d. Khác
Câu 6 Tốc độ phát triển mức tiêu thụ hàng hoá của một công ty công nghệ phẩm như
sau:
Năm 2013 2014 2015 2016 2017
Tốc độ phát triển (%) 110 112 115 116 119
Tốc độ phát triển bình quân năm về mức tiêu thụ hàng hoá của công ty công
nghệ phẩm trên (%)
a. 112,35 b.114,35 c.115,35 d.116,35
Câu 7. Tốc độ phát triển sản xuất của 1 xí nghiệp năm 2012 so với năm 2011 là 104%
năm 2011 so với năm 2010 là 114%. Tính tốc độ phát triển bình quân hàng năm vể sản
xuất của xí nghiệp.
A. 108,88%
B. 112,30
C. 106,25
D. 109,73
Câu 8 có số liệu về sản lượng của một xí nghiệp X như sau:
Năm 2010 2011 2012 2013 2014
Sản lượng 100 120 160 180 200
(1.000 tấn)
Tính mức độ trung bình theo thời gian:
A. 135
B. 145
C. 150
D. 152
II. Bài tập
Bài 1
Tốc độ phát triển doanh thu của 1 công ty năm 2018 so với 2012 là 2,6 lần. Nhiệm vụ
kế hoạch năm 2012 so với năm 2012 phải phát triển doanh thu 3,4 lần. Tính tốc độ
phát triển bình quân hàng năm từ 2018 đến 2022 phải là bao nhiêu để hoàn thành kế
hoạch đó.
Bài 2
Nguyên lý thống kê
- 101 -

Có tài liệu về tình hình kinh doanh của doanh nghiệp X trong quý 3 năm báo cáo như
sau:
Chỉ tiêu Tháng Tháng Tháng Tháng
7 8 9 10
1. Doanh thu tiêu thụ sản phẩm (triệu đồng) 1 520 1 848 1 672
2. Tỷ lệ doanh thu tiêu thụ sản phẩm trong toàn 80 92,4 95
bộ sản phẩm sản xuất (%)
3. Số nhân viên bán hàng ở ngày đầu tháng 151 153 155 149
Yêu cầu 1/ Tính doanh thu bình quân hàng tháng trong quí 3
2/ Số nhân viên bình quân mỗi tháng và cả quí
3/ Mức doanh thu bình quân mỗi nhân viên trong từng tháng; quí
4/ Tỷ lệ doanh thu tiêu thụ sản phẩm trong toàn bộ sản phẩm sản xuất bình quân hàng
thnág ở quí III
Bài 3
Có số liệu giá trị hàng hoá tồn kho của công ty X vào những ngày dầu tháng trong
năm 2007 như sau:
Thời điểm 1/1 ½ 1/3 1/4 1/5 1/6 1/7

Hàng hoá tồn kho 200 240 204 180 206 198 190
(trđ)
Hãy tính giá trị hàng hoá tồn kho trung bình cho các thời gian sau:
a. Từng tháng
b. Từng quý
c. Sáu tháng đầu năm
Bài 4
Có tài liệu về số dư tiền vay ngân hàng của công ty X trong quý I/N
Thời điểm 1/1 15/1 20/2 8/3 31/3
Số dư tiền vay(trđ) 100 80 60 90 94
Hãy tính số dư tiền vay trung bình trong quý I của công ty
Bài 5
Có tài liệu về chỉ tiêu giá trị sản xuất (GTSX) của một xí nghiệp chế biến X như
sau:

Năm 2013 2014 2015 2016 2017


GTSX (trđ) 2000 2200 2442 1714 3040
Hãy tính:
1. Lượng tăng giảm tuyệt đối liên hoàn, định gốc qua các năm.
2. Tốc độ phát triển qua các năm.
3. Tốc độ tăng (giảm) qua các năm.
4. Giá trị tuyệt đối của 1 % tăng (giảm) qua các năm.
Bài 6
Có tài liệu về tình hình nhập và xuất kho tại kho của một công ty trong tháng 1 như
sau: (ĐVT: Tr. đ)

Nguyên lý thống kê
- 102 -

- Tồn kho đầu tháng 320


- Ngày 5 nhập thêm 50
- Ngày 7 xuất kho 40
- Ngày 10 xuất kho 60
- Ngày 15 xuất 55
- Ngày 20 nhập kho 100
- Ngày 25 xuất kho 64
- Ngày 29 xuất kho 43
Đến cuối tháng không có gì thay đổi
Hãy tính giá trị hàng tồn kho bình quân tại kho trong tháng 1.
Bài 7
Có tài liệu về số công nhân trong danh sách của một xí nghiệp năm báo cáo như
sau:
- Ngày 1.1 xí nghiệp có 146 công nhân
- Ngày 14.1 xí nghiệp có bổ sung thêm 3 công nhân
- Ngày 28.2 xí nghiệp có bổ sung thêm 7 công nhân
- Ngày 16.4 xí nghiệp có bổ sung thêm 5 công nhân
- Ngày 17.8 xí nghiệp cho thôi việc 2 công nhân
- Ngày 21.10 xí nghiệp có bổ sung thêm 3 công nhân
Từ đó đến cuối năm số công nhân không thay đổi
Yêu cầu:
1. Thành lập dãy số thời gian. Dãy số này là dãy số gì
2. Xác định số công nhân bình quân trong danh sách của xí nghiệp.
Bài 8
Có tài liệu về tình hình sản xuất của một xí nghiệp như sau:
2016 2017 2018 2019 2020 202 2022
1
1. Sản lượng (tr.đ) 78
2. Lượng tuyệt đối tăng (tr.đ) 12,5 8,8
3. Tốc độ phát triển liên
hoàn(%) 105,8 105,3
4. Tốc độ tăng liên hoàn(%)
5. Giá trị tuyệt đối của 1% tăng 16,5
(tr.đ)
1,139
Yêu cầu:
1. Chỉ tiêu lượng tuyệt đối như trên là lượng tuyệt đối liên hoàn hay định gốc?
(Nếu biết thêm rằng sản lượng qua các năm đều tăng)
2. Tính số liệu còn thiếu trong bảng thống kê trên.
3. Tính tốc độ phát triển hàng năm chỉ tiêu sản lượng của xí nghiệp.
Bài 10
Có tài liệu điều tra về chỉ tiêu giá trị sản xuất (GTSX) của xí nghiệp qua các tháng
ở năm 2007 như sau (đvt:tr.đ)
Tháng 1 2 3 4 5 6 7 8 9 10 11 12

Nguyên lý thống kê
- 103 -

GTSX 35 36 34 40 37 38 41 38 43 40 45 50
Yêu cầu:
1. Biểu thị số liệu lên đồ thị.
2. Điều chỉnh dãy số trên bằng số bình quân di động với khoảng san bằng là 3.
3. Biểu thị kết quả lên cùng đồ thị trong câu 1. Nhận xét.
Bài 11
Có tài liệu về lượng tiêu thụ một loại hàng tại thành phố X như sau: (ĐVT: 1000 tấn)
Tháng Năm
2017 2018 2019
1 1,20 1,3 1,24
2 1,18 1,5 1,2
3 1,50 1,6 1,45
4 1,80 1,9 1,78
5 2,7 2,6 2,63
6 3,4 3,3 3,0
7 4,4 4,5 4,3
8 5,00 4,9 4,8
9 4,0 3,8 3,9
10 2,1 2,05 1,8
11 1,5 1,4 1,45
12 1,0 1,1 1,07

Hãy dùng phương pháp điều chỉnh thích hợp để nêu lên biến động thời vụ về lượng
hàng này. Trình bày kết quả lên đồ thị.
Bài 12
Có tài liệu về sản lượng từng quý của một xí nghiệp như sau: (đvt: tr.đ)

Quý Năm
2017 2018 2019
I 175 247 400
II 263 298 441
III 326 366 420
IV 297 341 420

Yêu cầu:
1. xây dựng mô hình phản ánh xu thế phát triển của chỉ tiêu sản lượng.
2. Tính chỉ số thời vụ .
3. Biểu diễn kết quả lên đồ thị.
Bài 14 Có tài liệu về năng suất lao động (NSLĐ) và giá trị sản xuất (GTSX) một xí
nghiệp qua các năm như sau (ĐVT: Tr. đ)

Năm 2006 2007 2008 2009 2010

Nguyên lý thống kê
- 104 -

NSLĐ 62 63 64 65 66
GTSX 18 600 19 530 19 968 21 775 22 968
Yêu cầu:
1/ Lập dãy số thời gian mới về số công nhân bình quân trong danh sách?
2/ Tính các chỉ tiêu kinh tế liên hoàn để phân tích dãy số thời gian mới thành
lập ở câu 1
3/ Tính tốc độ tăng (giảm) bình quân về số công nhân trong thời kỳ trên
4/ Tính lượng tăng giảm tuyệt đối bình quân hàng năm về số công nhân trong
thời kỳ trên
5. Dự đoán công nhân cho năm 2013 dựa vào lượng tăng giảm tuyệt đối bình
quân.
6.
CHƯƠNG V: CHỈ SỐ
 Mục tiêu của chương:
Sau khi nghiên cứu chương này, sinh viên cần nắm vững các vấn đề sau đây:
- Nắm được chỉ số là gì, phân biệt được các loại chỉ số.
- Nắm được phương pháp tính chỉ số, xác định được ý nghĩa của từng loại chỉ số.
- Biết cách vận dụng các hệ thống chỉ số để phân tích sự biến động của hiện tượng
phức tạp do ảnh hưởng của các nhân tố khác nhau.
 Giới thiệu: Chỉ số là một công cụ ngày càng được chấp nhận và sử dụng một
cách rộng rãi trong quản lý và nghiên cứu kinh tế, chúng được xem như là những chỉ
báo cho thấy sự thay đổi của nền kinh tế hay trong hoạt động sản xuất kinh doanh. Một
cách tổng quát, chỉ số đo lường sự thay đổi của hiện tượng kinh tế qua hai kỳ nghiên
cứu và thường được biểu thị bằng %.
I. Khái niệm, đặc điểm, ý nghĩa về chỉ số:
1. Khái niệm:
Chỉ số là chỉ tiêu tương đối biểu hiện quan hệ so sánh giữa hai mức độ của một
hiện tượng kinh tế xã hội trong điều kiện thời gian và không gian nhất định.
Ví dụ: Có tổng sản lượng của công ty A:
Năm 2017: 300 cái
Năm 2018: 500 cái
Nếu so sánh tổng sản lượng của công ty A năm 2018 so với năm 2017 ta được tốc
độ phát triển còn gọi là chỉ số phát triển:
50000
x x 100  166%
30000
Vậy chỉ số phát triển trên tính được bằng cách so sánh hai mức độ của hiện tượng
qua hai thời gian khác nhau. Thực chất đó là số tương đối động thái, đây là dạng đơn
giản của chỉ số.
Phương pháp chỉ số: là phương pháp tính toán và biểu hiện quan hệ so sánh giữa
hai mức độ của hiện tượng kinh tế, nhằm nghiên cứu biến động của hiện tượng qua
thời gian và không gian.

Nguyên lý thống kê
- 105 -

Như vậy, chỉ số là kết quả cụ thể của việc vận dụng phương pháp chỉ số để so sánh
hai mức độ cụ thể của hiện tượng kinh tế.
2. Ý nghĩa:
- Chỉ số được sử dụng rộng rãi trong công tác nghiên cứu kinh tế xã hội, nó được
dùng để nghiên cứu sự biến động của hiện tượng qua thời gian, để giải quyết được yêu
cầu này, thống kê sử dụng chỉ số phát triển (chỉ số thời gian, chỉ số động thái) nhằm so
sánh mức độ của hiện tượng ở kỳ sau so với kỳ trước.
- Nó được dùng để phản ánh sự biến động của hiện tượng qua không gian, để thực
hiện được yêu cầu này thống kê sử dụng chỉ số không gian hay còn gọi là chỉ số địa
phương: biểu hiện biến động của hiện tượng giữa hai nước, hai địa phương, hai xí
nghiệp.
- Nó được dùng để phân tích tình hình thực hiện kế hoạch, để giải quyết được yêu
cầu này thống kê sử dụng chỉ số kế hoạch.
- Nó được dùng để phân tích vai trò và mức độ ảnh hưởng của từng nhân tố đối
với sự biến động của toàn bộ hiện tượng phức tạp.
3. Đặc điểm:
- Khi muốn so sánh các mức độ của hiện tượng phức tạp, bao gồm nhiều đơn vị,
nhiều phần tử có tính chất khác nhau: về tên gọi, về giá trị sử dụng, về đơn vị tính, về
hình thức biểu hiện…và do đó, chúng không trực tiếp cộng lại được với nhau, trước
hết phải chuyển các đơn vị hoặc phần tử có tính chất khác nhau thành dạng giống
nhau, để có thể trực tiếp cộng lại được với nhau.
- Khi có nhiều nhân tố cùng tham gia vào việc tính chỉ số, phải giả định chỉ số có
một nhân tố thay đổi, còn các nhân tố khác không thay đổi.
II. Phân loại chỉ số:
Tuỳ theo mục đích nghiên cứu mà người ta chia chỉ số thành nhiều loại khác nhau:
1. Căn cứ theo phạm vi tính toán chia hai loại:
- Chỉ số cá thể: (i) được sử dụng để đo lường sự thay đổi của từng phần tử, từng
đơn vị, từng yếu tố của hiện tượng phức tạp hoặc của tổng thể không phức tạp.
Ví dụ: Chỉ số giá về từng mặt hàng
Chỉ số về lượng hàng hoá tiêu thụ của từng mặt hàng
Chỉ số cá thể được dùng để nghiên cứu sự biến động của những sản phẩm chủ yếu
của nền kinh tế quốc dân, nó được tính theo phương pháp số tương đối.
- Chỉ số chung (tổng hợp) (I): được sử dụng để đo lường sự thay đổi của một số
phần tử hoặc của tất cả các phần tử thuộc tổng thể nghiên cứu.
Ví dụ: chỉ số tổng hợp khối lượng sản phẩm của một xí nghiệp, chỉ số giá cả của
các mặt hàng vật liệu xây dựng bán ra trên thị trường…
Chỉ số chung này được tính theo phương pháp chỉ số liên hợp hay chỉ số bình quân.
2. Theo tính chất của chỉ tiêu nghiên cứu:
Căn cứ theo tính chất của chỉ tiêu nghiên cứu chỉ số thường được chia thành hai
loại:
- Chỉ số chỉ tiêu chất lượng: Nó phản ánh sự biến động của các chỉ tiêu chất
lượng như: chỉ số giá cả, chỉ số giá thành, chỉ số NSLĐ, chỉ số NSTH, chỉ số về
tiền lương.

Nguyên lý thống kê
- 106 -

- Chỉ số chỉ tiêu khối lượng: nó phản ánh sự biến động của chỉ tiêu khối lượng
như: chỉ số về lượng hàng hoá tiêu thụ, chỉ số về sản lượng, chỉ số về diện tích
gieo trồng.....
III. Phương pháp tính chỉ số:
Để thuận tiện cho việc phân tích phương pháp tính chỉ số, ta sẽ áp dụng luôn Ví dụ
vào các bước của phương pháp này.
Ví dụ: Có tài liệu về giá cả và lượng hàng hoá tiêu thụ của 1 tỉnh A như sau:

Tên ĐVT Giá bán Lượng hàng tiêu thụ


hàng Kỳ gốc Kỳ báo cáo Kỳ gốc Kỳ báo cáo
A L 500 450 2000 2250
B it 1000 1200 1000 950
C K 400 500 6000 7200
g
c
ái

Bây giờ ta sẽ lần lượt tính các loại chỉ số khác nhau:
1. Chỉ số đơn: (chỉ số cá thể) (tính cho từng mặt hàng)
a. Chỉ số cá thể về chỉ tiêu chất lượng (giá bán theo Ví dụ trên)
p1
ip 
p0
 p  p1  p0
Áp dụng cho Ví dụ trên, ta xác định chỉ số giá cả của từng mặt hàng:
450
i p( A )   0.9 hay 90%
500
Có nghĩa là giá bán lẽ của mặt hàng A kỳ báo cáo bằng 90% so với kỳ gốc, tức là
giảm 10%
Tính theo số tuyệt đối: p1-p0 = 450 - 500 = -50 đồng (giảm 50 đồng/1 met)
Tương tự ta tính chỉ số giá bán lẻ của hai mặt hàng còn lại
b. Chỉ số cá thể về chỉ tiêu khối lượng (lượng hàng tiêu thụ)
q1
iq 
q0
q  q1  q0
2. Chỉ số tổng hợp: (chỉ số chung) (I)
Vì nghiên cứu tổng hợp nhiều sản phẩm có đơn vị tính khác nhau. Do đó ta dùng
một quyền số để quy đổi thành đơn vị tính chung và cộng lại được với nhau, quyền số
này được cố định ở tử số và mẫu số trong khi tính toán.
Thường một chỉ tiêu chất lượng hay khối lượng có nhiều chỉ tiêu khối lượng hay
chất lượng có liên quan, việc chọn chỉ tiêu nào để nghiên cứu là tuỳ thuộc vào mục
đích nghiên cứu. Chẳng hạn, nếu muốn nghiên cứu về chi phí thì khối lượng sản phẩm
Nguyên lý thống kê
- 107 -

có liên quan đến giá thành sản phẩm, còn nghiên cứu về doanh số thì khối lượng hàng
hoá tiêu thụ có liên quan đến giá bán của sản phẩm.
2.1. Chỉ số phát triển:
Có hai phương pháp tính chỉ số chung:
a. Tính chỉ số chung theo phương pháp chỉ số liên hợp:
Trước hết ta chuyển từ tổng thể không đồng nhất thành tổng thể đồng nhất để cộng
lại được với nhau thông qua một nhân tố chung.
Nếu tính chỉ số chung của giá cả thì nhân với lượng hàng tiêu thụ để có mức tiêu
thụ
Nếu tính chỉ số chung của giá thành đơn vị sản phẩm thì nhân với khối lượng sản
xuất để có chi phí sản xuất.
Nếu tính chỉ số chung của lượng hàng tiêu thụ thì nhân với giá cả tiêu thụ
Những nhân tố đó được gọi là quyền số của chỉ số
Quyền số giúp chúng ta tổng hợp được tất cả các phần tử khác nhau
Duy trì vai trò của mỗi phần tử trong quá trình tổng hợp
Quyền số của chỉ số là đại lượng đựơc dùng trong công thức chỉ số chung và được
cố định giống nhau ở tử số và mẫu số của chỉ số.
a1. Chỉ số chung chỉ tiêu chất lượng:
Nghiên cứu sự biến động về giá chung cho 3 mặt hàng:
Để thấy được sự thay đổi về giá bán lẻ chung cho 3 mặt hàng ta tính chỉ số tổng
hợp về giá (hay chỉ số chung về giá). Trường hợp này ta không thể cộng giá bán lẻ của
3 mặt hàng ở hai thời kỳ nghiên cứu rồi so sánh, mặc dù thông qua đơn vị tiền tệ giá cả
của từng mặt hàng có thể cộng lại nhưng cách tổng hợp đơn giản như vậy kém ý nghĩa
kinh tế. Như vậy để việc tổng hợp có ý nghĩa ta dùng nhân tố q (lượng hàng hoá tiêu
thụ) để chuyển từ một tổng thể bao gồm nhiều phần tử không thể trực tiếp cộng lại
được thành dạng đồng nhất.
Với pq = mức tiêu thụ hàng hoá
 pq : tổng thể mức tiêu thụ hàng hoá
Sau khi đã chuyển tổng thể nghiên cứu thành dạng đồng nhất ta có thể so sánh. Tuy
nhiên, như đã có dịp đề cập để nghiên cứu sự biến động của một nhân tố nào đó, thì
các nhân tố có liên quan ta giả định không thay đổi. Ở đây ta chỉ nghiên cứu sự biến
động về giá cả, cho nên nhân tố q được cố định ở một kỳ nào đó.

Chỉ số chung chỉ tiêu chất lượng: Ip 


p q 1

p q 0

+ Nếu cố định ở kỳ báo cáo : Ip  p q1 1


sẽ có ý nghĩa kinh tế hơn
p q0 1

Thật vậy
- Nếu nhân tố q được cố định ở kỳ báo cáo
 p1q1   p0 q1 là dương nói lên số tiền người tiêu thụ phải chi thêm do giá cả
tăng.
 p1q1   p0 q1 là âm thì phản ánh số tiền người tiêu thụ thực tế tiết kiệm được do
giá cả giảm đi.
- Nếu nhân tố q được cố định ở kỳ gốc:
Nguyên lý thống kê
- 108 -

 p q  p q
1 0 0 0 là dương thì phản ánh số tiền người tiêu thụ đáng lẽ phải chi
thêm do giá cả tăng lên
 p1q0   p0 q0 là âm thìphản ánh số tiền người tiêu thụ có thể tiết kiệm được do
giá cả giảm đi.
Như vậy, khi nghiên cứu sự thay đổi về giá chung cho nhiều mặt hàng ta tính chỉ
số tổng hợp về giá theo công thức:

Ip 
pq 1 1

p q 0 1
Trong đó: po: giá bán kỳ gốc
p1: giá bán kỳ báo cáo
q1: lượng hàng hoá tiêu thụ kỳ báo cáo

 pq   p1q1   p0 q1
Áp dụng cho Ví dụ trên:
Chỉ số giá:

Ip 
 p1q1  450  2250  1200 950  500  7200
 p0 q1 500  2250  1000 950  4000 7200
Số tuyệt đối:
 pq( p)   p1q1   p0 q1
Giá kỳ báo cáo tăng so với kỳ gốc tức làm cho mức tiêu thụ tăng

a2. Chỉ số chung chỉ tiêu khối lượng:


Nghiên cứu sự biến động lượng hàng hoá tiêu thụ chung cho 3 mặt hàng
Để nêu lên sự biến động về lượng hàng hoá tiệu thụ chung cho 3 mặt hàng ta tính
chỉ số tổng hợp khối lượng hàng hoá tiêu thụ. Nhận thấy rằng lượng hàng hoá tiêu thụ
không thể trực tiếp cộng lại, vì lẽ chúng khác nhau về đơn vị đo tính và về giá trị sử
dụng. Do đó để có thể nêu lên sự thay đổi lượng hàng hoá tiêu thụ qua hai kỳ vấn đề
được đặt ra để giải quyết cũng như khi tính chỉ số tổng hợp giá cả. Trường hợp này có
thể sử dụng yếu tố giá cả để chuyển từ các mặt hàng không cộng lại được thành dạng
đồng nhất.
Sau khi đã chuyển thành dạng đồng nhất, có thể cộng lại và so sánh. Ở đây ta chỉ
muốn nghiên cứu sự thay đổi lượng hàng hoá tiêu thụ, cho nên nhân tố có liên quan
phải được cố định ở một kỳ nào đó.
Chỉ số chung chỉ tiêu khối lượng:

Iq 
 pq 1

 pq 0
Khi dùng chỉ số tổng hợp phát triển để phản ánh sự biến động của chỉ tiêu khối
lượng thì quyền số là chỉ tiêu chất lượng có liên quan được chọn cố định ở một kỳ nào
đó (kỳ gốc hoặc kỳ báo cáo )

Nguyên lý thống kê
- 109 -

Người ta thường chọn chỉ tiêu chất lượng ở kỳ gốc vì nó có ý nghĩa kinh tế hơn và
nó sẽ rất thuận lợi khi cần xây dựng hệ thống chỉ số.
Ý nghĩa kinh tế:
 p0 q1   p0 q0 : nếu (+) nói lên số tiền người tiêu thụ phải chi thêm do mua
thêm hàng hoá
 p0 q1   p0 q0 : nếu (-) nói lên số tiền người tiêu thụ tiết kiệm được do mua
hàng ít đi
Như vậy ta sẽ dùng công thức cố định giá ở kỳ gốc:

Iq 
p q
0 1

p q
0 0
Số tuyệt đối:
 q   p0 q1   p0 q0
Áp dụng cho Ví dụ trên:

Iq 
 p0 q1  500  2250  1000 950  400  7200
 p0 q0 500  2000  1000 1000  400  6000
 q   p0 q1   p0 q0

Như vậy ta kết luận vài nét về quyền số của chỉ số tổn hợp:
- Nhân tố được giữ cố định giống nhau ở tử số và mẫu số trong các chỉ số tổng
hợp là quyền số của chỉ số
- Quyền số của chỉ số có hai chức năng:
+ Làm cho các phần tử không trực tiếp cộng lại được với nhau được chuyển
thành dạng đồng nhất
+ Quyền số còn biểu hiện vai trò quan trọng của mỗi phần tử hay bộ phận trong
tổng thể nghiên cứu
 Nguyên tắc chọn quyền số:
- Quyền số trong các chỉ số chỉ tiêu chất lượng là nhân tố khối lượng có liên quan
thường được cố định ở kỳ báo cáo
- Quyền số trong các chỉ số chỉ tiêu khối lượng là nhân tố chất lượng có liên quan
thường được cố định ở kỳ gốc
 Dựa vào nguyên tắc chọn quyền số, ta có thể xây dựng chỉ số tổng hợp cho từng
nhóm chỉ tiêu giống nhau về tính chất như sau:

Chỉ số chỉ tiêu chất lượng


1. Chỉ số tổng hợp giá thành sản IW 
WT 1 1

phẩm W T 0 1

Iz 
Z q1 1
T1: số công nhân kỳ báo cáo
Z q0 1
2. Chỉ số tổng hợp năng suất lao
động
Nguyên lý thống kê
- 110 -

3. Chỉ số tổng hợp năng suất thu

hoạch IN 
 N1D1
IT 
W T 0 1
 N 0 D1 W T 0 0

Chỉ số chỉ tiêu khối lượng


3. Chỉ số tổng hợp diện tích
1. Chỉ số tổng hợp KLSP
Z q ID  N D 0 1
 N D
0 1
Iq
Z q 0 0
0 0

2. Chỉ số tổng hợp SLCN


D1: Diện tích kỳ báo cáo

Ví dụ tính chỉ số chung:


Tại 1 công ty năm 2010 so với năm 2009: Số công nhân tăng 8%, năng suất lao động
tăng 4%, giá thành tăng 10%. Hãy tính xem tổng sản lượng và tổng chi phí của công ty
thay đổi như thế nào qua 2 năm.
Giải:
IT = 1,08
IW = 1,04
IZ = 1,1
Chỉ số vể tổng sản lượng
IQ = IT x IW = 1,08 x 1,04 =1,123

Chỉ số về chi phí sản xuất


IZQ = IZ x IQ = 1,1 x 1,123 = 1,235

b. Tính chỉ số chung theo phương pháp chỉ số bình quân


Dạng chỉ số chung tính theo phương pháp chỉ số bình quân về mặt nội dung thì nó
là một chỉ số tổng hợp vì nó dùng để biểu hiện sự biến động của các hiện tượng kinh tế
phức tạp, tuỳ theo mục đích nghiên cứu và nguồn tài liệu mà ta lựa chọn phương pháp
này, nó cũng là một hình thức biểu hiện của phương pháp chỉ số liên hợp, điểm khác
biệt giữa hai phương pháp này là chỉ số liên hợp được tính từ tài liệu ban đầu đầy đủ
còn chỉ số bình quân được tính từ tài liệu chỉ số cá thể
Có hai loại chỉ số:
b1. Chỉ số bình quân cộng (bình quân số học)
Được dùng để tính chỉ số chung cho chỉ tiêu khối lượng:
Trở lại công thức tính chỉ số chung lượng hàng hoá tiêu thụ

Iq 
p q 0 1

p q 0 0
Biến đổi công thức trên:
Nguyên lý thống kê
- 111 -

q0
q0
 p0 q1 p q i
Iq  
0 0 q

 0 0
p q p q 0 0

q1
iq  : chỉ số cá thể về chỉ tiêu khối lượng hàng hoá
q0
p0q0: mức tiêu thụ hàng hoá kỳ gốc (đóng vai trò là quyền số)
Iq: chỉ số chung (tổng hợp) khối lượng hàng hoá
 Lưu ý: vận dụng công thức này khi giữa hai kỳ so sánh các mặt hàng tiêu thụ
không thay đổi vì nếu có sự thay đổi về mặt hàng, ta không thể xác định được tất cả
các chỉ số cá thể lượng hàng hoá tiêu thụ.
Ví dụ: Có số liệu sau đây của một xí nghiệp:

Tên sp Chi phí sản xuất kỳ Tỷ lệ tăng (+), giảm (-)
trước (trđ) sản lượng (%)
A 720 +5
B 350 +3
C 530 -2

Tính chỉ số chung về sản lượng


Ta có: iqA = 1.05
iqB = 1.03
iqC = 0.98
Chỉ số tổng hợp sản lượng sản xuất được xác định theo công thức:

Iq 
p q i0 0 q

1.05  720  1.03  350  0.98  530
p q 0 0 720  350  530
Số tuyệt đối:
q   p0 q0 iq   p0 q0

 Từ công thức trên có thể tiếp tục biến đổi bằng cách chia tử số và mẫu số cho
 p0 q0 ta có:
p0 q0iq
 pq
Iq 
 pqi

 0 0 q 0 0

d i  d i
0 q

p q  p q d
0 q
0 0 0 0 0

p q 0 0
p0 q0
d0  : tỷ trọng mức tiêu thụ hàng hoá kỳ gốc
 p0 q0

111
- 112 -

b2. Chỉ số trung bình điều hoà: được dùng để tính chỉ số chung về chỉ tiêu chất
lượng.
Trở lại công thức chỉ số tổng hợp giá cả:

Ip 
p q  p q  p q
1 1 1 1 1 1

p q p q p  p q
0 1
0 1
1 1 1
p i 1 p

p1
ip  : chỉ số cá thể về chỉ tiêu chất lượng
p0
p1q1: mức tiêu thụ hàng hoá kỳ báo cáo (đóng vai trò là quyền số)
Khi vận dụng công thức này cũng cần lưu ý là giữa hai kỳ so sánh các mặt hàng
tiêu thụ không thay đổi
Ví dụ: Có tài liệu về giá cả và mức tiêu thụ hàng hoá tại một thị trường

Tên hàng Mức tiêu thụ hàng hoá (trđ) Tỷ lệ tăng, giảm giá cả (%)
Kỳ gốc Kỳ báo cáo
A 300 360 +12.5
B 250 270 -10
C 450 500 +25

Tính chỉ số chung về giá cả

Ip 
p q 1 1
pq
 i 1 1

p
ipA = 1.125
ipB = 0.9
ipC = 1.25

Ip 
pq 1 1

360  270  500
pq 360 270 500
 i 1 1
 
1.125 0.9 1.25
p
Số tuyệt đối:
p1q1
   p1q1  
ip
- Từ công thức trên có thể biến đổi bằng cách chia tử số và mẫu số cho p q 1 1 ,
cuối cùng ta có:

112
- 113 -

p1q1
 pq
Ip 
 p1q1

 11  d i
pq pq d
 i1 1  i 1 p1 q i i

p p 1 1 p
p1q1
d1  : tỷ trọng mức tiêu thụ hàng hoá kỳ báo cáo
 p1q1
Như vậy khi dùng chỉ số bình quân có thể lấy quyền số là số tương đối.
Ví dụ: Có số liệu sau đây về mức tiêu thụ hàng hoá của một công ty như sau:
Mặt hàng A: giá cả hàng hoá tiêu thụ của năm 2008 so với năm 2007 giảm 5%
Mặt hàng B: giá cả hàng hoá tiêu thụ của năm 2008 so với năm 2007 tăng 2
Mặt hàng C: giá cả hàng hoá tiêu thụ của năm 2008 so với năm 2007 tăng 4%
Mặt hàng D: giá cả hàng hoá tiêu thụ của năm 2008 so với năm 2007 tăng 6%
Được biết tỷ trọng về doanh thu của các mặt hàng nói trên năm 2008 theo thứ tự
lần lượt như sau: 20%, 10%, 30%, 40%
Hãy tính chỉ số chung về giá cả hàng hoá tiêu thụ của 4 mặt hàng trên
ip: chỉ số cá thể về giá cả hàng hoá tiêu thụ của từng mặt hàng
d1: tỷ trọng về doanh thu của từng mặt hàng ở năm 2008
Ta có:

Ip 
d i

20  10  30  40
d 20 10 30 40
i i
 
0.95 1.02 1.04 1.06

p

2.2. Chỉ số không gian (chỉ số địa phương)


Được dùng để so sánh mức độ của hiện tượng kinh tế qua điều kiện không gian
khác nhau, Ví dụ so sánh giá cả của hai địa phương.....
Nguyên tắc xây dựng chỉ số này cũng như chỉ số phát triển chỉ khác nhau ở vấn đề
chọn quyền số sao cho kết quả tính toán phản ánh đúng tình hình thực tế khách quan
của hiện tượng nghiên cứu
+ Đối với chỉ số khối lượng sản phẩm:
Quyền số có thể chọn là giá cố định do nhà nước quy định hoặc giá trung bình kỳ
gốc của hai xí nghiệp.

I q( A / B ) 
 p q N A

p q N B
pN: giá do nhà nước quy định
+ Đối với chỉ số giá cả:
Quyền số là lượng hàng hoá chung của từng mặt hàng ở cả hai khu vực

I p( A / B) 
p Q A

p Q B
Q = qA+qB

113
- 114 -

Ví dụ: Ta cần so sánh giá thành tổng hợp của hai sản phẩm X, Y giữa hai xí
nghiệp, ta có số liệu giả định cho trong bảng:

sản Đvt XN A XNB


phẩm KLSP GTĐV KLSP GTĐV
(1000đ) (1000đ)
X met 3000 30 2000 32
Y bộ 4500 20 5000 19

So sánh giá thành chung cho hai sản phẩm của XNA và XNB

I p( A / B) 
p A 32  5000  19  9500 340500
Q
=   100,14%
p BQ 30  5000  20  9500 340000
Giá thành chung cho hai sản phẩm của xí nghiệp B cao hơn xí nghiệp A 0,14%
2.3. Chỉ số kế hoạch:
Nhằm để nghiên cứu cho việc xây dựng kế hoạch và kiểm tra tình hình thực hiện
kế hoạch
Nguyên tắc xây dựng chỉ số này cũng như chỉ số phát triển, chỉ khác nhau ở vấn đề
chọn quyền số (dựa vào mục đích nghiên cứu và tình hình thực tế)
+ Chỉ số nhiệm vụ kế hoạch: chẳng hạn về nhiệm vụ kế hoạch giá thành quyền số
được chọn là khối lượng sản phẩm kế hoạch

I znv 
Z q k k

Z q 0 k
Zk, Z0: giá thành đơn vị sản phẩm kỳ kế hoạch, kỳ gốc
qk: khối lượng sản phẩm kế hoạch
+ Chỉ số hoàn thành kế hoạch:
Tuỳ theo mục đích nghiên cứu ta có các quyền số khác nhau:

I zht 
Z q 1 1

Z q k 1
Công thức này nhằm phản ánh đầy đủ chi phí sản xuất thực tế thì khối lượng sản
phẩm thực hiện được chọn làm quyền số

I zht 
Z q
1 k

Z q
k k
Nhằm đánh giá trong điều kiện cần thực hiện đúng kế hoạch sản lượng của các mặt
hàng
IV. Hệ thống chỉ số:
1. Khái niệm và tác dụng:
Tập hợp 3 chỉ số trở lên có mối liên hệ mật thiết với nhau (thể hiện được ở dạng
phương trình, tức là có dấu =) gọi là hệ thống chỉ số.
Cơ sở để hình thành hệ thống chỉ số là mối liên hệ thực tế giữa các chỉ tiêu, thường
được thể hiện ở dạng công thức như:
114
- 115 -

Mức tiêu thụ hàng hoá = giá bán lẻ x lượng hàng tiêu thụ
Từ đó có thể lập hệ thống chỉ số:
Chỉ số mức tiêu thụ hàng hoá (IM) = chỉ số giá (Ip) x chỉ số lượng hàng hoá (Iq)
 Tác dụng của hệ thống chỉ số:
- Trong một hệ thống gồm n chỉ số, khi biết n-1 chỉ số ta dể dàng tính được chỉ số
còn lại
Chẳng hạn: biết Ip, Iq ta tính được IM=Ip x Iq
- Xác định được vai trò và ảnh hưởng biến động của mỗi nhân tố đối với biến
động của hiện tượng gồm nhiều nhân tố, qua đó đánh giá được nhân tố nào có tác dụng
chủ yếu đối với biến động chung, nhằm phân tích mối liên hệ giữa các hiện tượng
trong quá trình biến động, giải thích một cách đúng đắn các nguyên nhân làm cho hiện
tượng phát triển.
Tóm lại: Hệ thống chỉ số xây dựng trên cơ sở phân tích mối liên hệ giữa các nhân
tố cấu thành một chỉ tiêu kinh tế tổng hợp nào đó.
Hệ thống chỉ số bao gồm hai loại chỉ số:
- Chỉ số nhân tố (bộ phận)
Ví dụ: chỉ số chung về giá cả Ip
chỉ số chung về sản lượng Iq
- Chỉ số toàn bộ: chỉ số về mức tiêu thụ
2. Các trường hợp hình thành hệ thống chỉ số:
a. Khi cần kết hợp các chỉ số nhân tố:
Khi biết Iq, Ip suy ra Ipq
Ip x Iq = Ipq
pq p q
1 1 0 1
 pq 1 1

p q p q
0 1 0 0 p q0 0
Phương trình tuyệt đối:
( p1q1   p0 q1 )  ( p0 q1   p0 q0 )   p1q1   p0 q0
b. Khi cần phân tích chỉ số toàn bộ thành các chỉ số nhân tố:
 Phương pháp liên hoàn: phương pháp này nêu lên ảnh hưởng của các nhân tố
cấu thành hiện tượng phức tạp trong quá trình biến động và tác động lẫn nhau, phương
pháp này có đặc điểm sau:
- Nếu hiện tượng chịu ảnh hưởng n nhân tố thì trong hệ thống chỉ số có n chỉ số
nhân tố
- Phương pháp liên hoàn coi các nhân tố có các ý nghĩa khác nhau trong quá trình
biến động hiện tượng do đó các chỉ số nhân tố được xây dựng với các quyền số khác
nhau
Thông thường chỉ số chỉ tiêu chất lượng có quyền số ở kỳ báo cáo, còn chỉ số chỉ
tiêu khối lượng có quyền số ở kỳ gốc
- Trong hệ thống chỉ số nếu chỉ số nhân tố chất lượng xếp trước, chỉ số nhân tố
khối lượng xếp sau thì mẫu của chỉ số đứng trước trùng với tử của chỉ số đứng sau và
do đó chúng hình thành 1 hệ thống khép kín
Ví dụ: Nghiên cứu sự biến động về chi phí sản xuất của 3 sản phẩm
Izq = Iz x Iq
115
- 116 -

z q 1 1

z q 1 1

z q 0 1

z q 0 0 z q 0 1 z q 0 0
Số tuyệt đối:
 z q   z q ( z q   z q )  ( z q   z q )
1 1 0 0 1 1 0 1 0 1 0 0
Qua hệ thống chỉ số trên, giúp ta xác định được cụ thể ảnh hưởng của từng nhân tố
đến sự biến động tổng chi phí sản xuất của xí nghiệp
+ Từ mối quan hệ giữa 3 chỉ tiêu: giá cả, lượng hàng hoá tiêu thụ, tổng mức tiêu
thụ hàng hoá, có thể xây dựng hệ thống chỉ số:
Tổng doanh thu tiêu thụ hàng hóa = Giá bán lẻ đơn vị xlượng hàng hóa tiêu thụ
Chỉ số tổng hợp dthu Chỉ số tổng hợp Chỉ số tổng hợp
tiêu thụ hàng hoá = giá cả hàng hoá x khối lượng tiêu thụ
(Ipq) = (Ip) x (Iq)
pq 1 1

pq 1 1

p q 0 1

p q 0 0 p q 0 1 p q 0 0
Số tuyệt đối
 p q   p q ( p q   p q )  ( p q   p q )
1 1 0 0 1 1 0 1 0 1 0 0
Ví dụ: Ta xây dựng hệ thống chỉ số:
Tổng sản lượng = NSLĐ x Số lượng công nhân
I WT  I W  I T
WT 1 1
 WT 1 1
 W T 0 1

W T 0 0 W T 0 1 W T 0 0
Số tuyệt đối:
WT  W T
1 1 0 0 ( W1T1   W0T1 )  ( W0T1   W0T0 )
Hệ thống chỉ số trên giúp ta phân tích sự thay đổi chỉ tiêu tổng sản lượng qua hai
kỳ nghiên cứu do ảnh hưởng bởi hai nhân tố: NSLĐ và số lượng công nhân
Ví dụ: Có tài liệu về giá cả và lượng hàng tiêu thụ tại một thị trường:

Tên hàng Đvt Giá bán lẻ đơn vị (1000đ) lượng hàng hoá tiêu thụ
kỳ gốc kỳ báo báo kỳ gốc kỳ báo cáo
A met 500 450 2000 2250
B lit 1000 1200 1000 950
C Kg 400 500 6000 7200

Vận dụng hệ thống chỉ số để phân tích:


Áp dụng hệ thống chỉ số: Ipq=Ip x Iq
pq 1 1

pq 1 1

p q 0 1

p q 0 0 p q 0 1 p q 0 0

116
- 117 -

pq 1 1  5752500

Với: p q 0 0  4400000
p q 0 1  4955000
Thay số liệu vào HTCS trên:
5752500 5752500 4955000
 
4400000 4955000 4400000
1.307=1.161 x 1.126
130.7% = 116.1% x 112.6%
Số tuyệt đối: 5752500-4400000=(5752500-4955000) + (4955000-4400000)
+1352500 = +797500 + 555000
Có nghĩa là: tổng mức tiêu thụ hàng hoá kỳ báo cáo bằng 130.7% so với kỳ gốc
(tăng 30.7%), mức tăng tuyệt đối 1352500 đ, do ảnh hưởng bởi 2 nhân tố:
- Do giá cả chung kỳ báo cáo so với kỳ gốc bằng 116.1% tăng 16.1% đã làm cho
tổng mức tiêu thụ hàng hoá tăng 797500đ
- Khối lượng hàng hoá tiêu thụ kỳ báo cáo so với kỳ gốc bằng 112.6% (tăng
12.6%) làm cho tổng mức tiêu thụ hàng hoá tăng 555000đ
 Phương pháp ảnh hưởng biến động riêng biệt:
Phương pháp này nêu lên ảnh hưởng biến động riêng biệt của từng nhân tố cấu
thành hiện tượng phức tạp đồng thời các ảnh hưởng cùng biến động cùng tác động lẫn
nhau giữa các nhân tố đã biết
Phương pháp này có đặc điểm :
Nếu hiện tượng cấu thành bởi n nhân tố thì trong hệ thống có n chỉ số nhân tố và
một chỉ số liên hệ
Phương pháp này coi các nhân tố cấu thành hiện tượng có ý nghĩa như nhau nên
quyền số của các chỉ số nhân tố được chọn cùng một thời kỳ thông thường là kỳ gốc.
 Nhận xét: 2 phương pháp liên hoàn và phương pháp riêng biệt nhằm giải quyết
2 yêu cầu nghiên cứu khác nhau nên kết quả cũng khác nhau tuy nhiên chúng không
hề mâu thuẩn với nhau mà còn tác dụng bổ sung nhằm giúp cho việc nghiên cứu được
sâu sắc. Trên thực tế phương pháp liên hoàn được xem là phương pháp chủ yếu vì nó
đơn giản và phù hợp với việc tính toán.
V. Vận dụng phương pháp chỉ số để nghiên cứu sự biến động của chỉ tiêu bình
quân và tổng lượng biến tiêu thức
1. Phân tích chỉ tiêu bình quân:
Từ:

x
 xi f i
 fi
Chỉ tiêu bình quân cũng có thể được xác định theo công thức tỷ trọng:
x   xi d i
fi
Với: di 
f i

117
- 118 -

Như vậy chỉ tiêu trung bình x chịu ảnh hưởng bởi hai nhân tố:
Lượng biến của tiêu thức (xi)
Kết cấu của tổng thể (di)
Ví dụ: Tiền lương bình quân của công nhân biến động do ảnh hưởng của 2 nhân tố :
Do biến động của bản thân các mức lương và kết cấu của công nhân có các mức
lương khác nhau.
Vận dụng phương pháp chỉ số để phân tích sự biến động của chỉ tiêu bình quân ta
sử dụng các ký hiệu sau đây:
x1, x0: lượng biến của tiêu thức kỳ nghiên cứu và kỳ gốc
x1 , x 0 : số bình quân kỳ nghiên cứu và kỳ gốc
f1, f0: số đơn vị tổng thể kỳ nghiên cứu và kỳ gốc (tần số ở kỳ báo cáo và kỳ
gốc)
x 01 : số bình quân ở kỳ gốc nhưng kết cấu ở kỳ báo cáo

x1 
x f 1 1

f 1

x0 
x f 0 0

f 0

x 01 
x f
0 1

f 1

Ta có thể xây dựng các chỉ số sau:


Chỉ số cấu thành khả biến: biến động của chỉ tiêu bình quân giữa hai kỳ nghiên
cứu. Dùng so sánh 2 số bình quân của kỳ nghiên cứu và kỳ gốc
 x1 f1
Ix 
x1

f 1

x0 x f 0 0

f 0

Chỉ số này chịu ảnh hưởng của hai nhân tố: tiêu thức nghiên cứu (x 0, x1); kết cấu
f1 f
của tổng thể ( , 0 )
 f1  f 0
Chỉ số cấu thành cố định: nêu lên biến động của chỉ tiêu bình quân do ảnh hưởng
của riêng tiêu thức nghiên cứu
x f 1 1

Ix 
x1

f 1

x 01 x f 0 1

f 1
Chỉ số này có ý nghĩa phân tích quan trọng, bởi vì nó nói lên chất lượng của công
tác kinh tế, giúp cho lãnh đạo nắm được đúng đắn bản chất của hiện tượng.

118
- 119 -

Chỉ số ảnh hưởng kết cấu: nêu lên biến động của chỉ tiêu bình quân do ảnh hưởng
biến động của riêng kết cấu tổng thể, còn bản thân tiêu thức nghiên cứu được coi như
không đổi (thường được cố định ở kỳ gốc)
x f 0 1

Id 
x 01

f 1

x0 x f0 0

f 0
Có thể kết hợp 3 chỉ số nói trên thành hệ thống chỉ số
Mối quan hệ:
Chỉ số cấu thành khả biến = chỉ số cố định kết cấu x chỉ số thay đổi kết cấu
I x  I x  Id
x1 x1 x 01
 
x0 x 01 x0
Các lượng tăng giảm tuyệt đối:
( x1  x 0 )  ( x1  x 01 )  ( x 01  x 0 )
Ví dụ: Có tài liệu về giá thành và sản lượng sản xuất của 1 xí nghiệp như sau:

PX Kỳ gốc kỳ báo cáo


sản lượng (cái) Giá thành sản lượng (cái) Giá thành
(1000đ) (1000đ)
A 2000 150 6000 105
B 5000 175 4000 300
C 3000 140 2000 70
cộn 10000 12000
g

Yêu cầu: Hãy phân tích sự thay đổi giá thành bình quân của XN do ảnh hưởng của
2 nhân tố: giá thành, kết cấu về sản lượng
I x  I x  Id
x1 x1 x 01
 
x0 x 01 x0
Ta có:

x1 
 x f  6000 105  4000 300  2000 70  164,1
1 1

f 1 12000

x0 
 x0 f 0  2000 150  5000 175  3000 140  159,5
 f0 10000

119
- 120 -

x 01 
x f
0 1

150  6000  175  4000  140  2000
 156,66
f 1 12000

Thế vào công thức trên ta có:


164,1 164,1 156,66
 
159,5 156,66 159,5
1,028 = 1,047 x 0,98
Số tuyệt đối:
(164,1-159,5) = (164,1 - 156,66) + (156,66 - 159,5)
4,6 = 7,44 – 2,84
Kết luận: Giá thành bình quân 1 sản phẩm của xí nghiệp ở kỳ báo cáo tăng so với
kỳ gốc là 2,8% tức là tăng 4,6 đvt, do ảnh hưởng của hai nhân tố:
- Do giá thành cá biệt trong các phân xưởng tăng 4,7% làm cho giá thành bình
quân tăng 7,44 Dvt.
- Do sự thay đổi kết cấu về sản lượng làm cho giá thành bình quân giảm là 2%
tức giảm đi 2,84 Dvt
2. Phân tích sự biến động của tổng lượng biến tiêu thức :
Trong 1 số trường hợp chỉ tiêu bình quân được tính từ tổng lượng biến tiêu thức do
đó chỉ tiêu bình quân có quan hệ với tổng lượng biến tiêu thức và nó được xem như là
1 nhân tố cấu thành nên tổng lượng biến tiêu thức
Ví dụ: Tổng sản lượng = NSLĐ bình quân 1 CN x tổng số công nhân
Tổng chi phí sản xuất = giá thành bình quân đơn vị sản phẩm x tổng sản
lượng
Tức là:  M x f 
Trên cơ sở này ta có thể vận dụng phương pháp chỉ số để phân tích sự biến động
của tổng lượng biến tiêu thức do ảnh hưởng các nhân tố:
Nếu phân tích thành hai nhân tố thì:
M 1 x1  f1 x1  f1 x 0  f1
  
M 0 x 0  f 0 x 0  f1 x 0  f 0
Lượng tuyệt đối:
( x1  f1  x 0  f 0 )  ( x1  f1  x 0  f1 )  ( x 0  f1  x 0  f 0 )
Để phân tích sâu hơn, ta tách chỉ số chỉ tiêu bình quân thành hai chỉ số ta sẽ được
hệ thống phân tích thành 3 nhân tố:

M 1 x1  f 1 x1 f x 01  f 1 x 0  f1
 
1
 
M 0 x 0  f 0 x 01 f 1 x 0  f1 x0  f0

Biến động về sự biến động về sự biến động sự biến động
Chi phí sản xuất = giá thành cá biệt x kết cấu Sl x tổng SL spsx
ảhưởng đến ảhưởng đến
CPSX CPSX
120
- 121 -

Lượng tuyệt đối:


( x1  f1  x 0  f 0 )  ( x1  f1  x 01  f1 )  ( x 01  f1  x 0  f1 )  ( x 0  f1  x 0  f 0 )
Với Ví dụ trên hãy phân tích sự biến động về chi phí của 3 nhân tố:
 Bản thân giá thành
 Kết cấu sản lượng
 Bản thân sản lượng
x1  f 1 x 01  f 1 x 0  f1
 
x 01  f 1 x 0  f1 x0  f0
Thay vào công thức ta có:
164,1  12000 164,1  12000 156,66  12000 159,5  12000
   
159,5  10000 156,66  12000 159,5  12000 159,5  10000
123%  104,8% x98,2% x120%
Số tuyệt đối:
(164,1x12000 - 159,5x10000) = (164,1 - 156,66)x12000 + (156,66 - 159,5)x12000
+ 159,5x(12000 - 10000)
374200 = 89280 - 34080 + 319000

KL: Chi phí kỳ báo cáo tăng so với kỳ gốc 23% tức tăng 374200 đồng do ảnh
hưởng của 3 nhân tố:
- Do giá thành cá biệt trong các phân xưởng tăng 4,8% làm cho chi phí sản xuất
tăng 89280 đồng
- Do sự thay đổi về kết cấu sản lượng làm cho chi phí giảm 1,8 % tức giảm
34080 đ
Do sản lượng sản xuất ở kỳ báo cáo tăng so với kỳ gốc là 20 % tức làm chi phí
tăng 319000 đ
Bài tập ví dụ tổng kết chương
Ví dụ 1:
Có tài liệu ở 1 doanh nghiệp sản xuất các loại sản phẩm như sau:
Sản Chi phí sản xuất năm Giá thành đơn vị sản
phẩm 2012 (tr. đ) phẩm(1000đ)
Năm 2011 Năm 2012
A 860 8 800 8 264
B 774,2 1 050 997,5
C 263,3 750 765
Biết thêm rằng tổng mức chi phí sản xuất năm 2011 là 1750,5 triệu đồng.

Yêu cầu:
1. Tính chỉ số giá thành từng loại sản phẩm.
2. Tính chỉ số chung về giá thành, chỉ số chung về sản lượng.
121
- 122 -

3. Phân tích sự biến động của tổng chi phí sản xuất năm 2012 so với 2011 do
hai nhân tố ảnh hưởng: giá thành và sản lượng.
Giải:
1. Chỉ số giá thành từng loại sản phẩm 1 đ)
p1 8264
ip    0,94
p0 8800
p1 997,5
ip    0,95
p0 1050
p 765
ip  1   1,02
p0 750
2. Chỉ số chung về giá thành: (1 đ)

Ip 
pq 1 1

860  774,2  263,3
 0,95
pq 860 774,2 263,3
 i 1 1
0,94

0,95

1,02
p

3. Chỉ số chung về sản lượng (1 đ)

I pq 
pq 1 1

860  774,2  263,3
 1,083
p q 0 0
1750,5
I pq 1,083
Iq    1,14
Ip 0,95
4. phân tích sự biến động tổng chi phí sản xuất (1 đ)
Hệ thống chỉ số
pq 1 1

pq 1 1

p q 0 1

p q 0 0 p q 0 1 p q 0 0
108,30% = 95% x 114%
Về tuyệt đối:
 p q   p q ( p q   p q )  ( p q   p q )
1 1 0 0 1 1 0 1 0 1 0 0
147 = -90,4 + 237,4
Tổng chi phí chung cho 3 sp năm 2012 tăng 8,3% so với năm 2011, tức là
tăng 147trđ do ảnh hưởng của giá thành chung cho 3 sp giảm 5% làm cho chi phí
giảm 90,4 trdd, sản lượng tăng 14% làm chi phí tăng 237,4trd.
Ví dụ 2:
Có tài liệu về hình hình sử dụng nguyên liệu của 1 công ty có 2 phân xưởng
PX Mức nguyên vật liệu dùng Khối lượng sản phẩm
cho 1 tấn sản phẩm (Kg/tấn (Tấn)
sp)

122
- 123 -

Kỳ gốc Kỳ báo cáo Kỳ gốc Kỳ báo


cáo
A 650 663 375 405
B 550 545 640 540

1/ Tính mức hao phí nguyên vật liệu bình quân cho 1 tấn sản phẩn tính chung cho cả 2
phân xưởng ở từng kỳ.
2/ Phân tích sự biến động của tổng mức nguyên vật liệu chi dùng để sản xuất sản phẩm
do ảnh hưởng của 2 nhân tố: mức hao phí nguyên vật liệu bình quân cho 1 tấn sản
phẩm và tổng khối lượng sản phẩm..
Giải:
1. Mức hao phí NVL bình quân
Kỳ gốc:

Muchaophibinhquan   MNVLhaophi  650x375  550x640  586,9


 sanluong 375  640
Kỳ báo cáo

Muchaophibinhquan
 MNVLhaophi  663x405  545x540  595,57
 sanluong 405  540
2. Phân tích sự biến động
Hệ thống chỉ số
M 1 x1  f1 x1  f1 x 0  f1
  
M 0 x 0  f 0 x 0  f1 x 0  f 0
562815 562815 554620,5
 
595750 554620,5 595750
94,47% = 101,47% x 93,1
Về tuyệt đối:

-32935 = 8195 - 41130


Tổng nguyên vật liệu (NVL) chi dùng chung cho 2 PX kỳ báo cáo giảm 5,53% so
với kỳ gốc, tức là giảm 32935 ngđ do 2 nhân tố ảnh hưởng
Do mức hao phí NVL bình quân tăng 1,47% làm tổng NVL tăng 8195 ngđ
Do sản lượng giảm 6,9% làm tổng NVL giảm 41130 ngđ
Ví dụ 3. Có tài liệu sau:
Tên hàng Doanh thu tiêu thụ năm tỷ lệ % giảm giá bán năm
2009 (trđ) 2009 so vớI 2008 (%)
A 47.050 -2
B 30.488 -5
C 28.940 -7
Biết thêm tổng doanh thu tiêu thụ năm 2008 là 108.500trđ
1. Tính chỉ số chung về giá bán

123
- 124 -

2. Tính chỉ số chung về lượng hàng tiêu thụ.


3. Phân tích sự biến động doanh thu tiêu thụ qua 2 năm do 2 nhân tố ảnh hưởng:
giá bán và lượng hàng tiêu thụ.
Giải:
1. Chỉ số chung về giá bán

Ip  pq 1 1

106478

106478
 0,957
pq 47050 30488 28940 111221
 i 1 1
0,98

0,95

0,93
p
2. Chỉ số chung về lượng hàng tiêu thụ

106478
I pq 0,98
Iq   108500   1,024
Ip 0,957 0,957
3. Phân tích sự biến động
pq 1 1

pq 1 1

p q 0 1

p q 0 0 p q 0 1 p q 0 0

106478 106478 111221


 
108500 111221 108500
98%= 95,7% x 102,4%
Về tuyệt đối:
 p q   p q ( p q   p q )  ( p q   p q )
1 1 0 0 1 1 0 1 0 1 0 0
-2022 = -4743 + 2721
Doanh thu tiệu thụ năm 2009 giảm 2% so với 2008 tức giảm 2022 trd do 2
nhân tố ảnh hưởng:
- Do giá bán chung năm 2009 giảm 4,3% làm cho doanh thu giảm 4743 trd
- Do khối lượng tiêu thụ tăng 2,4% làm cho doanh thu tăng 2721 trd.
Ví dụ 4:
Có tài liệu sau về tình hình sản xuất tại một Xí nghiệp như sau:
Chi phí sản xuất kỳ Giá thành đơn vị sản phẩm
Tên sản đ
nghiên cứu (1000 ) (1000đ)
phẩm
Kỳ gốc Kỳ nghiên cứu
A 20000 500 460
B 18900 450 430
C 49000 700 720
Cho biết tổng chi phí sản xuất (chung cho 3 sản phẩm) kỳ gốc là 84500 nghìn
đồng.
124
- 125 -

1. Tính các chỉ số cá thể về giá thành


2. Tính chỉ số chung về giá thành, chỉ số chung về sản lượng
Giải:
1. Chỉ số cá thể về giá thành:
p1 460
ip    0,92
p0 500
p 430
ip  1   0,955
p0 450
p 720
ip  1   1,028
p0 700

Chỉ số chung về giá thành

Ip  pq1 1

20000 18900 49000
 0,99
pq 20000 18900 49000
 i1 1
0,92
 
0,955 1,028
p

2. Chỉ số chung về sản lượng

I pq 
pq 1 1

20000  18900  49000
 1,04
p q 0 0
84500
I pq 1,04
Iq    1,1
Ip 0,99

BÀI TẬP CUỐI CHƯƠNG


I. Chọn câu trả lời đúng nhất
Câu 1: Để nghiên cứu sự biến động của hiện tượng qua thời gian, ta dùng:
a. chỉ số nhiệm vụ kế hoạch
b. chỉ số hoàn thành kế hoạch
c. chỉ số không gian
d. chỉ số phát triển
Câu 2: Để so sánh mức độ của hiện tượng qua không gian khác nhau ta dùng:
a. chỉ số nhiệm vụ kế hoạch
b. chỉ số hoàn thành kế hoạch
c. chỉ số không gian
d. chỉ số phát triển

125
- 126 -

Câu 3: Có tài liệu ở 1 doanh nghiệp sau:

Sản Chi phí sản xuất kỳ Giá thành đơn vị sản


phẩm báo cáo (tr. đ) phẩm(1000đ)
Kỳ gốc Kỳ nghiên cứu
A 860 8 800 8 264
B 774 1 050 1240

Biết thêm rằng tổng chi phí sản xuất kỳ gốc là 1750 triệu đồng.
Chỉ số chung về giá thành:
a. 1,053 b. 1,04 c. 0,933 d. khác
Câu 4: Có tài liệu sau đây:

Mặt hàng Tỷ trọng doanh thu tiêu Tỷ lệ % tăng giá so với


thụ hàng hoá kỳ báo cáo kỳ gốc
(%)

A 54 8
B 18 2
C 28 5

Chỉ số chung về giá:


a. 1,06 b. 1,061 c. 1,08 d. khác
Câu 5:
Có tài liệu về lượng hàng hoá và mức tiêu thụ hàng hoá như sau:
Hàng chỉ số cá thể về lượng Doanh thu tiêu thụ hàng hoá (trđ)
hoá hàng hoá (%) Kỳ gốc Kỳ nghiên cứu
A 105 20 26
B 112 24 34
C 98 16 25
Chỉ số chung về giá:
a. 1,054 b. 1,06 c. 1,416 d. khác
Câu 6. Thí dụ 2 loại hàng hoá trên thị trường như sau:
Kỳ gốc Kỳ nghiên cứu
Loại hàng Giá Lượng tiêu thụ Giá Lượng tiêu thụ
(1.000đ) (Cái) (1.000đ) (Cái)
A 10 200 14 220
B 20(po) 300(qo) 22(p1) 340(q1)

Tính chỉ số tổng hợp số lượng theo công thức lấy quyền số kỳ gốc:
a. 1,232
126
- 127 -

b. 1,183
c. 1,125
d. 1,215
Câu 7. Chỉ số doanh thu bằng 108%, chỉ số tổng hợp về giá bằng 90%, chỉ số tổng hợp
khối lượng bằng:
a. 120%
b. 115%
c. 130%
d. 125%
Câu 8. Chỉ số tổng hợp về giá bằng 0,95, chỉ số tổng hợp khối lượng sản phẩm bằng
1,1. kết quả nào dưới đây đúng về chỉ số doanh thu:
A. 1,25
B. 1,045
C. 1,36
D. 1,17
Câu 9: Po – giá kỳ gốc và P1 – giá kỳ báo cáo
qo – lượng hàng hoá kỳ gốc và q1 – lượng hàng hoá kỳ báo cáo
Công thức: Ip =  p1.q1 Tính
 po.q1
a. Chỉ số đơn về giá
b. Chỉ số tổng hợp về giá
c. Chỉ số tổng hợp về khối lượng hàng hoá
d. Chỉ số đơn giá về khối lượng hàng hoá
Câu 10:
Có tài liệu về lượng hàng hoá và mức tiêu thụ hàng hoá như sau:
Hàng chỉ số cá thể về lượng Doanh thu tiêu thụ hàng hoá (trđ)
hoá hàng hoá (%) Kỳ gốc Kỳ nghiên cứu
A 105 20 26
B 112 24 34
C 98 16 25
Chỉ số chung về doanh thu:
a. 1,054 b. 1,12 c. 1,416 d. 1,7
II. Bài tập
Bài 1:
Có tài liệu về tình hình sản suất của một xí nghiệp:
Sản ĐVT Giá thành đơn vị (1000đ) sản lượng
phẩm Kỳ gốc kỳ báo cáo Kỳ gốc kỳ báo cáo
A Bộ 200 206 2000 2400
B cái 36 30 10.000 11.000
a. Tính các chỉ số cá thể về giá thành và sản lượng
b. Chỉ số chung về giá thành và sản lượng
c. Phân tích sự thay đổi tổng chi phí sản xuất của xí nghiệp qua hai kỳ do ảnh
hưởng của hai nhân tố: giá thành và sản lượng.
Bài 2:
127
- 128 -

Có số liệu về năng suất lúa vụ mùa và diện tích gieo trồng của 3 địa phương:

Tên địa Năng suất thu hoạch(tạ/ha) Diện tích gieo trồng(ha)
phương Năm trước Năm nay Năm trước Năm nay
A 40 36 10.000 9000
B 40 45 6000 7200
C 35 42 5000 5500
a. Tính chỉ số cá thể về năng suất và diện tích gieo trồng
b. Tính chỉ số chung về năng suất thu hoạch và diện tích gieo trồng.
c. Phân tích sản lượng lúa thu hoạch chung cho 3 địa phương trên do ảnh
hưởng của hai nhân tố: năng suất và diện tích gieo trồng.
Bài 3:
Có tài liệu về tình hình sản xuất của một xí nghiệp như sau:
sản phẩm Giá thành đơn vị (1000đ) Sản lượng (chiếc)
Kỳ gốc kỳ báo cáo kỳ gốc kỳ báo cáo
A 320 300 4000 4200
B 180 175 3100 3120
C 140 135 200 210
Yêu cầu:
1. Hãy tính các chỉ số cần thiết để phản ánh tình hình biến động về giá thành
và sản lượng riêng cho từng loại sản phẩm?
2. Trình bày kết quả tính toán trên bảng thống kê?
Bài 4:
Có tài liệu về diện tích, năng suất và sản lượng lúa ở một địa phương qua hai năm
như sau:
Loại lúa 2012 2013
Năng suất Diện sản lượng Năng suất Diện sản
bình quân 1 tích (tạ) bình quân 1 tích lượng
ha (tạ/ha) (ha) ha (tạ/ha) (ha) (tạ)
Hè thu 32 400 12800 34 410 13940
Mùa 26 300 7800 25 270 6750

Yêu cầu tính:


1. Chỉ số cá thể về năng suất và về diện tích?
2. Chỉ số liên hợp về năng suất và về diện tích?
3. Chỉ số chung về sản lượng?
Bài 5:
Có tài liệu dưới đây của một tổ chức thương nghiệp:
Hàng ĐVT kỳ gốc Kỳ nghiên cứu
hoá Giá đơn lượng hàng Giá đơn lượng hàng
vị(1000đ) tiêu thụ vị(1000đ) tiêu thụ
A Lit 4 2000 5.4 3200
B Met 16 4000 22 3600
C kg 5 6400 6 6000
128
- 129 -

Yêu cầu tính:


1. Chỉ số cá thể về giá cả và lượng hàng hoá tiêu thụ
2. Chỉ số liên hợp về giá và lượng hàng hoá tiêu thụ
3. Chỉ số chung về doanh thu tiêu thụ hàng hóa
Bài 6
Có số liệu sau đây của một xí nghiệp:
Tên sản phẩm Chi phí sản xuất kỳ Tỷ lệ tăng, giảm sản
trước(trđ) lượng(%)
A 720 +5
B 350 +3
C 530 -2
a. Tính chỉ số chung về sản lượng
b. Chỉ số chung về giá thành. Biết thêm rằng tổng chi phí sản xuất kỳ báo cáo
của 3 sản phẩm trên là 1850 triệu đồng.
Bài 7
Có số liệu về giá cả và mức tiêu thụ hàng hoá tại một thị trường:

Tên hàng Doanh thu tiêu thụ hàng hoá (trđ) Tỷ lệ tăng, giảm giá
Kỳ gốc Kỳ báo cáo cả(%)

 300 360 +12,5


B 250 270 -10.0
C 450 500 +25.0
Yêu cầu:
1. Tính chỉ số chung về giá cả.
2. Chỉ số chung về lượng hàng tiêu thụ.
Bài 8
Một xí nghiệp sản xuất 4 loại sản phẩm A, B, C, D. Giá thành đơn vị sản phẩm
theo kế hoạch của bốn sản phẩm trên lần lượt là 500 đồng, 650 đồng, 350 đồng và 800
đồng. thực tế giá thành của sản phẩm A tăng 100 đồng, sản phẩm B giảm 50 đồng, sản
phẩm C tăng 50 đồng và sản phẩm D giảm 100 đồng.
Khối lượng sản phẩm sản xuất thực tế của 4 sản phẩm như sau:
- Sản phẩm A: 10.000 kg
- sản phẩm B: 7000 mét
- sản phẩm C: 8.200 cái
- sản phẩm D: 5000 Kg
a. Tính chỉ số hoàn thành kế hoạch giá thành
b. Tính chỉ số hoàn thành kế hoạch sản lượng
Được biết tổng chi phí sản xuất thực tế so với kế hoạch giảm 1,77 %.
Bài 9
Có tài liệu về tình hình sản xuất một số mặt hàng tại hai xí nghiệp trong cùng một
công ty qua 2 tháng như sau:
Tên sản phẩm A Sản phẩm B
XN Giá thành đơn sản lượng(kg) Giá thành đơn sản lượng(kg)
vị(1000đ) vị(1000đ)
129
- 130 -

Tháng Tháng Tháng1 Thán Tháng1 Tháng2 Tháng Thán


1 2 g2 1 g2
X 20 19 5000 6000 210 205 80 100
Y 21 19 7000 8000 220 210 50 60
Yêu cầu: Hãy tính các chỉ số thích hợp để nêu lên biến động trong tháng 2 so với
tháng 1 về các chỉ tiêu sau đây:
1. Về giá thành đơn vị sản phẩm:
a. Của toàn bộ sản phẩm của mỗi xí nghiệp?
b. Của toàn bộ sản phẩm của cả công ty
c. Của mỗi sản phẩm của cả công ty
2. Về sản lượng sản phẩm:
a. Của toàn bộ sản phẩm của mỗi xí nghiệp
b. Của toàn bộ sản phẩm của cả công ty
c. Của mỗi sản phẩm của cả công ty
3. Phân tích các nhân tố ảnh hưởng đến sự biến động tổng chi phí sản xuất cảu
toàn bộ sản phẩm của công ty?
Bài 10
Có tài liệu về lượng hàng hoá và mức tiêu thụ hàng hoá như sau:
Hàng chỉ số cá thể về lượng Doanh thu tiêu thụ hàng hoá (trđ)
hoá hàng hoá (%) Kỳ gốc Kỳ nghiên cứu
A 105 20 26
B 112 24 34
C 98 16 25
Yêu cầu tính:
1. Chỉ số bình quân cộng về khối lượng hàng hoá tiêu thụ
2. Chỉ số liên hợp về giá
3. Chỉ số chung về doanh thu tiêu thụ hàng hoá
Bài11
Có tài liệu về tình hình mức tiêu thụ hàng hoá và lượng hàng hoá tiêu thụ tại một
thị trường như sau:
Tên hàng tỷ trọng doanh thu tiêu thụ tỷ lệ tăng lượng hàng tiêu thụ
hàng hoá kỳ gốc(%) so kỳ gốc(%)
A 30 5.0
B 25 4.0
C 23 4.5
D 15 8.0
E 7 12.0
Hãy tính:
1. Chỉ số chung về lượng hàng hoá tiêu thụ?
2. Chỉ số chung về giá cả, biết thêm rằng doanh thu tiêu thụ hàng hoá chung kỳ
báo cáo tăng so với kỳ gốc 10%?
Bài 12
Có tình hình sản xuất của một xí nghiệp;
 Khối lượng sản phẩm A kỳ báo cáo tăng 5 % so với kỳ gốc, sản phẩm B giảm
4%, sản phẩm C giảm 6% và sản phẩm D tăng 5%.
130
- 131 -

 Tỷ trọng chi phí sản xuất ở kỳ gốc của các sản phẩm A,B,C,D lần lượt là 38%,
25%, 23%, 14%.
Hãy xác định:
1. Chỉ số chung về khối lượng sản phẩm
2. Chỉ số chung về giá thành
Biết thêm rằng tổng chi phí sản xuất kỳ báo cáo so với kỳ gốc tăng 20%
Bài 13:
Có số liệu của hai phân xưởng trong một xí nghiệp:
- Năm 2012:
Phân xưởng số 1: Số công nhân của phân xưởng này chiếm tỉ lệ 40 % trong tổng
số, năng suất lao động mỗi công nhân 30 tấn sản phẩm.
Phân xưởng số 2: Năng suất lao động mỗi công nhân là 40 tấn.
- Năm 2013:
Năng suất lao động mỗi công nhân của phân xưởng số 1 là 32 tấn sản phẩm.
Năng suất lao động mỗi công nhân của phân xưởng số 2 là 44 tấn, số công nhân
của phân xưởng số 2 chiếm tỉ lệ 50% trong tổng số.
a. Xác định năng suất lao động trung bình tính chung cho cả xí nghiệp trong
năm 2012, 2013.
b. Phân tích sự thay đổi năng suất lao động trung bình tính chung cho cả xí
nghiệp năm 2013 so với năm 2012 do ảnh hưởng của hai nhân tố: năng suất lao
động của công nhân từng phân xưởng và kết cấu lao động.
c. Phân tích sự thay đổi tổng sản lượng của xí nghiệp qua hai năm do ảnh hưởng
của các nhân tố có liên quan. Biết thêm rằng tổng số công nhân của xí nghiệp
năm 2012 là 100 người và năm 2013 là 120 người.

Bài 14
Có tài liệu về 1 xí nghiệp như sau:
Sản phẩm Chi phí sản xuất (tr.đ) Tốc độ tăng sản lượng quý II so
Quý I Quý II với quý I (%)
A 105 110 15
B 620 650 5

1. Tính các chỉ số chung theo thứ tự: chỉ số sản lượng, chỉ số tổng chi phí sản xuất,
chỉ số giá thành.
2. Tính các chỉ số chung theo thứ tự: chỉ số tổng chi phí sản xuất, chỉ số giá thành,
chỉ số sản lượng.
Bài 15
Một xí nghiệp sản xuất 3 loại sản phẩm (A, B, C). Tổng chi phí sản xuất kỳ gốc của
3 sản phẩm như sau: sản phẩm A chiếm 27%, sản phẩm B chiếm 15%, sản phẩm C
chiếm 58%. Kỳ báo cáo so với kỳ gốc sản lượng sản phẩm A tăng 5%, sản phẩm B
tăng 7%, sản phẩm C tăng 20%. Tổng chi phí sản xuất kỳ báo cáo là 956 triệu
đồng, tăng 8% so với kỳ gốc.
Hãy tính:
1. Chỉ số chung về khối lượng sản phẩm.

131
- 132 -

2. Chỉ số chung về giá thành.


3. Phân tích các nhân tố ảnh hưởng đến sự thay đổi của tổng chi phí sản xuất.
Bài 16
1. Tại một nông trường năm nay so với năm trước: diện tích gieo trồng lúa tăng
5%, năng suất bình quân tăng 4%, giá thành tăng 2%. Hãy tính xem tổng sản lượng
lúa và tổng chi phí sản xuất lúa của nông trường thay đổi như thế nào?
2. Diện tích gieo trồng mía của nông trường kỳ báo cáo so với kỳ gốc tăng 12%,
chi phí tăng 15% sản lượng mía giảm 10%. Hãy tính xem năng suất thu hoạch mía
và giá thành sản phẩm mía thay đổi như thế nào?

Bài 17
Có tài liệu về tình hình tiêu thụ một loại hàng hoá của một công ty như sau:
Tháng 6/2013 Tháng 7/2013
Khu vực Giá bán Lượng hàng bán ra Giá bán Lượng hàng
(1000đ) (kg) (1000đ) bán ra (kg)
I 23 5.000 23 7.000
II 21 5.000 21 3.000
Yêu cầu:
1. Tính giá bán bình quân một ký hàng hoá nói trên cho từng tháng.
2. lập hệ thống chỉ số phân tích sự biến động giá bán bình quân nói trên.
3. Phân tích sự biến động của doanh số bán ra theo các nhân tố: giá bán, kết cấu
lượng hàng tiêu thụ, khối lượng hàng bán ra.
Bài 18
Có tài liệu về tình hình sản xuất kinh doanh của một xí nghiệp như sau:
Phân Giá trị sản lượng (1000đ) Số công nhân (người)
xưởng Tháng 7 Tháng 8 Tháng 7 Tháng 8
A 15.000 11.000 200 140
B 8.000 24.000 200 317
Yêu cầu:
1. Phân tích các nhân tố ảnh hưởng đến sự biến động năng suất lao động bình
quân toàn xí nghiệp.
2. Phân tích sự biến động giá trị sản lượng của xí nghiệp theo các nhân tố:
năng suất lao động, kết cấu công nhân, số lượng công nhân.
Bài 19. Có tài liệu về hình hình sử dụng nguyên liệu chủ yếu M để sản xuất sản phẩm
A và B của doanh nghiệp Z như sau:
Tên sản Mức nguyên vật liệu dùng Khối lượng sản phẩm
phẩm cho 1 đơn vị sản phẩm (Kg) (Tấn)
Kỳ gốc Kỳ báo cáo Kỳ gốc Kỳ báo
cáo
A 650 663 375 405
B 550 545,6 640 540

132
- 133 -

1/ Tính mức hao phí nguyên vật liệu bình quân cho 1 Kg sản phẩn chung cả 2 loại sản
phẩm qua từng kỳ
2/ Phân tích sự biến động củắmc hao phí nguyên vật liệi bình quân do ảnh hưởng của
các nhân tố.
3/ Phân tích sự biến động của tổng mức nguyên vật liệu tiêu dùng để sản xuất 2 loại
sản phẩn do ảnh hưởng của 2 nhân tố.

133
- 134 -

CHƯƠNG VI. HỒI QUY VÀ TƯƠNG QUAN


 Mục tiêu của chương:
Sau khi nghiên cứu chương này, sinh viên cần nắm các vấn đề sau:
- Hiểu và phân biệt được liên hệ hàm số và liên hệ tương quan.
- Xây dựng được phương trình hồi quy tuyến tính, hồi quy phi tuyến, hồi quy bội.
- Đánh giá được trình độ chặt chẽ của mối liên hệ giữa các tiêu thức nghiên cứu.
 Phần giới thiệu: nhận định giữa sản lượng hàng hoá tiêu thụ hàng năm và chi
phí quảng cáo có mối quan hệ với nhau, dựa vào số liệu thu thập được, tổng hợp và
lưọng hoá mối quan hệ giữa hai chỉ tiêu trên bằng các phương pháp hồi quy tương
quan
I. Ý nghĩa nghiên cứu mối liên hệ tương quan giữa các hiện tượng kinh tế xã hội:
1. Mối liên hệ giữa các hiện tượng kinh tế xã hội:
Bất kỳ sự vật và hiện tượng nào cũng đều có liên hệ hữu cơ với nhau, tác động và
ràng buộc lẫn nhau, không có sự vật và hiện tượng nào phát sinh và phát triển một
cách độc lập, tách rời với các sự vật và hiện tượng khác.
Các hiện tượng kinh tế xã hội cũng phát sinh và phát triển theo nguyên lý đó.
Chẳng hạn trong nền kinh tế, mức năng suất lao động có quan hệ với sản lượng thu
được, giữa mức đầu tư hàng năm có liên hệ đến nhịp độ phát triển của tổng sản lượng
quốc gia và lợi tức quốc gia …
2. Liên hệ hàm số và liên hệ tương quan:
Xét theo mức độ phụ thuộc giữa hiện tượng này và hiện tượng khác có thể phân
biệt hai loại:
 Liên hệ hàm số: là liên hệ hoàn toàn chặt chẽ giữa các hiện tượng nghiên cứu,
không những biểu hiện trên cả tổng thể nghiên cứu mà còn biểu hiện trên từng đơn vị
cá biệt, khi hiện tượng này thay đổi thì hiện tượng có liên quan sẽ thay đổi theo một tỷ
lệ nhất định
Mối liên hệ hàm số chỉ phổ biến trong toán học, vật lý
Ví dụ: S = R2; Q = 0.24 RI2 (calo)
 Liên hệ tương quan: là liên hệ không hoàn toàn chặt chẽ giữa các hiện tượng
nghiên cứu: khi hiện tượng này thay đổi thì có thể làm hiện tượng có liên quan thay
đổi theo nhưng không có ảnh hưởng hoàn toàn quyết định. Liên hệ này chỉ biểu hiện
trên cả tổng thể nghiên cứu chứ không biểu hiện trên từng đơn vị cá biệt.
Ví dụ: Giữa sản lượng và giá thành đơn vị sản phẩm có mối liên hệ: số lượng sản
xuất ra tăng lên thì giá thành có khuynh hướng giảm đi nhưng quan hệ tăng giảm này
diễn ra không giống nhau ở tất cả các đơn vị vì còn các nguyên nhân khác
3. Phương pháp hồi quy và tương quan:
- Người đầu tiên dùng phương pháp này: Gan ton: nghiên cứu tương quan giữa
chiều cao thân hình con cái với chiều cao bố mẹ.
- Phương pháp này được sử dụng để nghiên cứu mối liên hệ tương quan giữa các
hiện tượng kinh tế xã hội. Cụ thể là trị số của một tiêu thức nào đó thay đổi do ảnh
hưởng của nhiều tiêu thức khác nhau, trong đó có một tiêu thức ảnh hưởng đáng kể,
dựa vào mục đích nghiên cứu mà lựa chọn một trong số các tiêu thức ảnh hưởng.

134
- 135 -

- Tiêu thức được chọn ra để nghiên cứu bao giờ cũng có một tiêu thức kết quả, còn
lại là các tiêu thức nguyên nhân.
Ví dụ: Sản lượng hàng hoá tiêu thụ thay đổi do chất lượng sản phẩm, giá cả, chi
phí quảng cáo…
Phương pháp này giải quyết những nhiệm vụ sau đây:
+ Xác định tính chất và hình thức của mối liên hệ giữa các hiện tượng kinh tế xã
hội
- Tính chất : giữa các tiêu thức nghiên cứu tồn tại mối liên hệ thuận hoặc liên hệ
ngịch.
- Hình thức mối liên hệ: là xem mối liên hệ được thể hiện dưới dạng mô hình
nào, tuyến tính hay phi tuyến.
Tuyến tính là tuân theo quy luật bình đẳng
Phi tuyến không tuân theo quy luật bình đẳng mà có tính chu kỳ, lúc này tăng, lúc
kia giảm.
Để giải quyết nhiệm vụ này ta qua các bước sau:
- Dựa trên cơ sở phân tích định tính để giải thích sự tồn tại thực tế và bản chất của
mối liên hệ giữa các hiện tượng kinh tế xã hội.
- Kết hợp việc phân tích lý luận với việc thăm dò mối liên hệ bằng các phương
pháp như đồ thị, phân tổ thống kê, phương pháp số bình quân.
+ Xây dựng đồ thị để xác định rõ hơn tính chất và hình thức mối liên hệ giữa các
tiêu thức nghiên cứu
+ Lập phương trình hồi quy, tính các tham số của phương trình và giải thích ý
nghĩa của các tham số
+ Đánh giá trình độ chặt chẽ của mối liên hệ thông qua các chỉ tiêu: hệ số tương
quan, tỷ số tương quan
II. Liên hệ tương quan tuyến tính giữa hai tiêu thức số lượng:
1. Phương trình hồi quy:
Ví dụ: Có tài liêu về sản lượng sản xuất và năng suất lao động của công nhân như
sau:
NSLĐ
Sản lượng
- Vẽ đường hồi quy thực nghiệm dựa vào số liệu thực tế.
+ Những cặp trị số thực tế (x,y) tạo thành các điểm, nối chúng lại ta được 1
đường gọi là hồi quy thực nghiệm.
- Đường hồi quy thực nghiệm biểu thị mối liên hệ tương quan thuận hay ngịch
giữa hai tiêu thức nghiên cứu.
- Trên cơ sở quan sát đường hồi quy thực nghiệm giúp ta phán đoán, tìm phương
trình đường thẳng có cùng hướng, thay thế cho đường hồi quy thực nghiệm, gọi là
đường hồi quy lý thuyết.
ŷ x : trị số điều chỉnh hay trị số lý thuyết của tiêu thức kết quả
x: trị số của tiêu thức nguyên nhân
a, b: các tham số xác định vị trí của đường hồi quy lý thuyết
yˆ  a  bx
Giữa các trị số thực tế và trị số lý thuyết luôn có sự sai lệch gọi là e

135
- 136 -

e  ( yi  yˆ )
Theo hướng đường thực nghiệm sẽ có rất nhiều đường hồi quy lý thuyết, đường hồi
quy lý thuyết nào có tổng sai lệch bình phương bé nhất thì đó là đường hồi quy lý
thuyết tốt nhất
n n

(y
i 1
i  yˆ )   ( yi  a  bx ) 2  min
i 1
Từ đó ta có hệ phương trình chuẩn sau:
n n

y
i 1
i  na  b xi
i 1
n n n

y x
i 1
i i  a  xi  b xi
i 1 i 1
2

Từ hệ phương trình trên, ta sẽ tính được a,b:


n y i xi   xi  y i
b
n  xi  ( xi ) 2
2

a  yi  bxi
 Giải thích các tham số a và b: yˆ  a  bx
a: đây là tham số không phụ thuộc vào x, nói lên ảnh hưởng của các nguyên
nhân khác đối với tiêu thức kết quả y
b: xác định độ dốc của đường hồi quy lý thuyết, tham số này nói lên mức độ
ảnh hưởng cụ thể của tiêu thức nguyên nhân x. Cụ thể là khi tiêu thức x tăng lên 1
đơn vị thì tiêu thức y tằng lên b đơn vị.
2. Hệ số tương quan (mức độ chặt chẽ của mối liên hệ):
Trong trường hợp giữa hai tiêu thức có mối liên hệ tương quan tuyến tính, chỉ tiêu
xác định mức độ chặt chẽ của mối liên hệ là hệ số tương quan
 Ý nghĩa của hệ số tương quan:
- Giúp ta xác định được cường độ của mối liên hệ, xem xét giữa tiêu thức nguyên
nhân và tiêu thức kết quả có liên hệ với nhau đến chừng mực nào.
- Giúp ta xác định được phương hướng cụ thể của mối liên hệ
- Được sử dụng nhiều trong dự đoán thống kê.
- Trong những điều kiện thời gian và không gian khác nhau, mối liên hệ tương
quan giữa cùng 1 số hiện tượng cũng có thể có trình độ chặt chẽ khác nhau.
Chẳng hạn, trong các cuộc điều tra về ngân sách gia đình ở các nước kinh tế
kém phát triển thì giữa mức thu nhập của dân cư và số chi tiêu mua hàng lương
thực thực phẩm có mối quan hệ khá chặt chẽ, trong khi đó cường độ của mối
liên hệ này lại rất yếu ở các nước công nghiệp phát triển. Cho nên qua việc
đánh giá này giúp ta có thể chọn ra được tiêu thức nguyên nhân có tác động chủ
yếu hay thứ yếu đối với hiện tượng nghiên cứu
- Ngoài ra hệ số tương qua còn cho thấy tính chất của mối liên hệ (tương quan
thuận hay tương quan nghịch)
136
- 137 -

 Công thức tính hệ số tương quan:

r
 (x  x )(y  y)
 (x  x )  ( y  y )
2 2 (hệ số tương quan person)

Biến đổi ta được:


xy  x y
r
 x  y (khai triển rồi chia tử và mẫu cho n)
Tiếp tục nhân tử và mẫu số cho  x
Ta có:
x
rb
y
Hoặc biến đổi để có:
n xy   x  y
r
((n x 2  ( x ) 2 )(n y 2  ( y ) 2
 Tính chất của hệ số tương quan:
+ Hệ số tương quan:
1  r  1
Nếu r=1 thì giữa x và y có quan hệ hàm số chặt chẽ.
r=0 giữa x và y không có mối liên hệ tuyến tính
r < 0: giữa x và y có mối liên hệ nghịch, nghĩa là khi 1 biến x hoặc y tăng
lên, biến kia sẽ giảm đi hoặc ngược lại khi 1 biến giảm đi biến còn lại sẽ tăng lên.
r > 0: giữa x và y có mối liên hệ thuận, nghĩa là khi 1 biến x hoặc y tăng lên,
biến kia cũng sẽ tăng lên, hoặc ngược lại đối với trường hợp giảm đi.
r  1 thì giữa x và y có quan hệ khá chặt chẽ
r  0 thì giữa x và y có quan hệ khá lỏng lẽo
 Tất nhiên trong thực tế, ta không biết r và phải ước lượng nó từ dữ liệu mẫu thu
thập được.
Ví dụ: Có số liệu về thời gian quảng cáo trên truyền hình và lượng sản phẩm tiêu
thụ ở một công ty sản xuất đồ chơi trẻ em:

Thời gian (phút) 28 37 44 35 47 26 33


Lượng tiêu thụ (sp) 41 31 49 42 33 38 25
Gọi x và y lần lượt là thời gian quảng cáo và lượng tiêu thụ
Ta có:

r
 ( x  x)( y  y)
 ( x  x) 2  ( y  y ) 2
137
- 138 -

Tính ra r và kết luận


Chẳng hạn: r = 0,638 cho thấy mối liên hệ tương quan thuận ở mức trung bình giữa
thời gian quảng cáo và lượng sản phẩm tiêu thụ
3. Kiểm định giả thuyết về mối liên hệ tương quan:
Vấn đề ở đây là dùng r để xét xem có hay không mối liên hệ tương quan giữa hai
biến x, y, tức là kiểm định giả thuyết H0 cho rằng hệ số tương quan của tổng thể p
bằng 0.
Giả sử có mẫu n cặp quan sát chọn ngẫu nhiên từ x, y có phân phối chuẩn. Gọi r là
hệ số tương uan mẫu, kiểm định giả thuyết về hệ số tương quan của tổng thể, p như
sau:
Giả thuyết: H0 : p = 0 (không có liên hệ giữa x và y)
H1: p  0 (có liên hệ giữa x và y)
r
Tiêu chuẩn kiểm định:
(1  r 2 ) /( n  2)
Quy tắc quyết định: Ở mức ý nghĩa  , bác bỏ H0 nếu
r r
 t n  2, / 2 hay  t n  2, / 2
(1  r ) /( n  2)
2
(1  r ) /( n  2)
2

Với tn-2 có phân phối student với n-2 bậc tự do


Kiểm định hai đuôi trên được sử dụng khi không biết trước chiều hướng của mối
liên hệ. Nếu biết trước chiều hướng ấy, ta thực hiện kiểm định 1 đuôi, bên trái hoặc
bên phải: H1: p>0 hoặc p<0
III. Nghiên cứu mối liên hệ tương quan phi tuyến tính giữa hai tiêu thức số lượng.
1. Phương trình hồi quy:
Trong nhiều trường hợp, hình thức của mối liên hệ giữa các tiêu thức là 1 dạng
đường cong nào đó. Ta gọi đó là tương quan phi tuyến tính.
Tuỳ theo hình thức của mối liên hệ tương quan phi tuyến mà ta sử dụng các
phương trình hồi quy thích hợp
1.1. Phương trình parabol:
yx = a+bx+cx2
Dùng phương pháp bình phương bé nhất ta có hệ phương trình chuẩn sau:
 y  na  b x  c x 2

 yx  a x  b x  c x 2 3

 yx  a x  b x  c x
2 2 3 4

1.2. Phương trình hyperbol:


b
y a
x
Hai tham số a, b được xác định từ hệ phương trình sau:

138
- 139 -

1
 y  na  b x
1 1 1
 y x  a  x  b x 2

1.3. Phương trình 3:


y  ax b
lg y  b lg x  lg a
đặt y=lgy, x=lgx
y=bx+a
 lg y  n lg a  b lg x
 lg x. lg y  lg a lg x  b (lg x) 2

1.4. Phương trình hàm mũ:


y  ab x
 lg y  n lg a  lg b x
 x. lg y  lg a x  lg b x 2

 Chú ý trên thực tế nếu tồn tại nhiều mô hình xấp xỉ gần giống nhau để lựa chọn
mô hình tốt nhất thì ta phải thông qua mô hình nào có sai số nhỏ nhất mà chọn

Sy 
(y  y x )2
sai số:
n p
Sy: sai số của mô hình
y x : trị số điều chỉnh (trị số lý thuyết)
p: số tham số của mô hình
n: số quan sát
y: giá trị thực tế
2. Xác định mức độ chặt chẽ của mối liên hệ:
Để xác định mức độ chặt chẽ của mối liên hệ tương quan phi tuyến giữa hai tiêu
thức y và x trước tiên ta xét đến nguyên nhân ảnh hưởng đến độ sai lệch (độ biến
thiên) của tiêu thức kết quả (y).
- Độ lệch của y do ảnh hưởng của tiêu thứuc nguyên nhân x:
 ( yˆ x
 y)
- Độ lêch của y do ảnh hưởng bởi các nguyên nhân khác ngoài x:
 ( y  yˆ x
)
Xuất phát từ phân tích trên ta tính các phương sai sau:
a. Phương sai chung phản ánh độ lệch (biến thiên) của tiêu thức y do ảnh hưởng
của tất cả các nguyên nhân:

139
- 140 -

 2
y 
 ( y  y) 2

n
b. Phương sai phản ánh độ lệch của tiêu thức y do ảnh hưởng của riêng tiêu thức x:

 yx 
2  ( yˆ  y ) 2
n
c. Phương sai phản ánh độ lệch của tiêu thức y do ảnh hưởng của các nguyên nhân
khác, trừ tiêu thức x:

 y( x) 
2  ( y  yˆ ) 2
n
Ta có mối quan hệ giữa 3 phương sai nói trên:

 2
y 
 ( y  y) 2

= 
2
yx 
 ( yˆ  y) 2

+ 
2
y( x) 
 ( y  yˆ ) 2

n n n
Như vậy nếu tiêu thức x có ảnh hưởng mạnh đối với y thì  2
yx 
 ( yˆ  y) 2

càng
n
chiếm phần lớn trong phương sai chung. Cho nên, tỷ số của hai phương sai này có thể
đo lường mức độ chặt chẽ của mối liên hệ giữa hai tiêu thức x và y. Tỷ số này sau khi
khai căn được gọi là tỷ số tương quan
 2 yx  2 y   2 y( x)  2 y( x)
   1 2
 2y  2y  y
 Tính chất của tỷ số tương quan:
0    1 :  tính ra càng gần 1 cho thấy mối liên hệ tương quan càng chặt chẽ
y=1: giữa x và y có quan hệ hàm số
y=0: giữa x và y không có quan hệ
y→1: giữa x và y có quan hệ chặt chẽ
y→0: giữa x và y có quan hệ lỏng lẽo
Ví dụ: Có số liệu về khối lượng sản phẩm sản xuất và giá thành đơn vị sản phẩm qua 5
năm:

Năm sản lượng (1000 tấn) Giá thành đơn vị sp


2004 2 8
2005 3 7,3
2006 3,5 6,5
2007 3,7 6,1
2008 4 5

Tổng chi phí sản xuất = chi phí bất biến + chi phí khả biến
Chi phí bất biến: chi phí phân xưởng, chi phí quản lý doanh nghiệp
Chi phí khả biến: chi phí nguyên vật liệu, tiền lương công nhân trực tiếp sản xuất
Ký hiệu:
a: chi phí khả biến
b: chi phí bất biến
140
- 141 -

x: khối lượng sản phẩm


Tổng chi phí: ax + b
ax  b
Chi phí sản xuất cho 1 sản phẩm:
x
b
Giá thành: y  a 
x
Như vậy có liên hệ tương quan: phương trình:
b
y a
x
Ta có:
1
 y  na  b x
1 1 1
 y x  a  x  b x 2

Giải ra ta được:
a= 3,326
b=1,579
1,579
y  3,326 
x
 Xác định mức độ chặt chẽ của mối liên hệ:

 y2 y
2

 y2  y2  y2   
n  n 
 

 y( x) 2

 ( y  yˆ ) 2

n
 2 y( x)
  1
y
IV. Tương quan bội (tương quan giữa nhiều tiêu thức)
Trong thực tế bất kỳ 1 hiện tượng kinh tế xã hội nào cũng chịu tác động bởi nhiều
nhân tố khác nhau, phương pháp tương quan có thể giúp nghiên cứu mối liên hệ giữa
nhiều tiêu thức, trong đó 1 tiêu thức kết quả chịu ảnh hưởng của nhiều tiêu thức
nguyên nhân.
- Chọn những tiêu thức có ý nghĩa nhất, có ảnh hưởng lớn nhất đối với tiêu thức kết
quả, sau đó xây dựng 1 phương trình tương quan để biểu thị mối liên hệ giữa các tiêu
thức đó.
1. Phương trình tương quan: thông thường dùng phương trình tuyến tính
yˆ  a0  a1 x1  a2 x2  .....  an xn
Trong đó: x1, x2, ….xn: các nhân tố ảnh hưởng đến y
a0, a1….an: tham số của phương trình
Áp dụng phương pháp bình phương bé nhất:
141
- 142 -

 y  na  a  x  a  x  ....  a  x
0 1 1 2 2 n n

 x y  a  x  a  x  a  x x  ....  a  x x
1 0 1 1 1
2
2 1 2 n 1 n

 x y  a  x  a  x x  a  x ....  a  x x
2 0 2 1 1 2 2 2
2
n 2 n

.............................................................................................
2. Đánh giá mức độ chặt chẽ của mối liên hệ giữa nhiều tiêu thức:

R yx1x2 ....xn  1
 ( y  yˆ ) 2

 ( y  y) 2

Hoặc

ryx1  ryx2  2ryx1 ryx2 rx1x2


2 2

R yx1x2 ....xn 
1  rx1x2
2

BÀI TẬP CUỐI CHƯƠNG


Bài 1 : Thu thập số liệu của 10 cửa hàng bán lẻ hàng hó tại trung tâm thành phố C
về hai tiêu thức: diện tích kinh doanh của cửa hàng và doanh số bán trung bình 1
ngày (triệu đồng)
Diện tích (m2) 7 10 8 5 11 3 7 11 12 6
Doanh số bán 2 3 2,4 1,8 3,2 1,5 2,1 3,8 4 2,2
(trđ)
Giả sử hai tiêu thức trên có tương quan tuyến tính:
a. Vẽ đường hồi quy thực nghiệm
b. Tìm đường hồi quy lý thuyết
c. Dự đoán Y với x=4, x=10, x=12
d. Ứng dụng SPSS để xử lý các yêu cầu trên.
Bài2: Trưởng phòng kinh doanh của công ty sản xuất đồ chơi trẻ em quan tâm đến
thời gian quảng cáo trên vô tuyến truyền hình và số lượng sản phẩm tiêu thụ. Sau
đây là số liệu của 7 tuần của những tháng cuối năm 2004:
Thời gian quảng cáo trong1 tuần (phút) 25 18 32 21 35 28 30
Sản phẩm tiêu thụ trong 1 tuần(1000sp) 16 11 20 15 26 32 20
Giả sử hai tiêu thức trên có mối tương quan tuyến tính:
a. Vẽ đường hồi quy thực nghiệm
b. Xác định đường hồi quy lý thuyết
c. Dự đoán Y với x=20 và x=27
d. Hệ số tương quan
e. Ứng dụng SPSS để xử lý các yêu cầu trên
Bài3: Có số liệu về sản lượng hàng tháng và giá thành trung bình đơn vị sản phẩm
của 4 xí nghiệp trong cùng một ngành như sau:
Tên xí nghiệp Sản lượng mỗi tháng (1000tấn) Giá thành 1 tấn (trđ)
A 5 19
142
- 143 -

B 1 21
C 10 14
D 15 9
Giả sử giữa giá thành đơn vị sản phẩm và sản lượng có mối tương quan phi
tuyến.
a. Xác định phương trình hồi quy lý thuyết phù hợp với mối tươg quan trên.
b. Dự đoán Y với x= 4 và x=12
c. Tính tỷ số tương quan
d. Ứng dụng SPSS để xử lý các yêu cầu trên
Bài4 : Một xí nghiệp chăn nuôi muốn xác định mối quan hệ giữa độ tuổi của một
loại gia súc khi bắt đầu chuyển qua giai đoạn vỗ béo với một loại thức ăn mới, trọng
lượng của con gia súc vào thời gian đó và trọng lượng tăng lên sau một tuần khi
được nuôi bằng loại thức ăn mới. Sau đây là số liệu thí nghiệm trên 8 con gia súc:
Số thứ tự con trọng lượng khởi Độ tuổi (tuần) trọng lượng tăng
gia súc điểm (kg) (kg)
1 39 8 7
2 52 6 6
3 48 7 7
4 46 12 10
5 61 9 9
6 34 6 4
7 25 10 3
8 55 4 4
a. Xác định phương trình tương quan biểu hiện mối tương quan giữa ba tiêu
thức trên.
b. Trọng lượng tăng lên cho một con gia súc trên sẽ là bao nhiêu nếu trọng
lượng lúc bắt đầu vỗ béo là 40kg với độ tuổi là 8 tuần.
Bài 5
Có số liệu về sản lượng hàng hoá tiêu thụ , chi phí đầu tư cho nghiên cứu cải
tiến sản phẩm và chi phí quảng cáo hàng tháng của 6 xí nghiệp cùng một ngành
sản xuất:
Sản lượng tiêu thụ Chi phí nghiên cứu Chi phí quảng cáo
2 1 0
8 3 4
5 2 1
6 3 3
12 5 3
19 8 8
a. Xác định phương trình tương quan tuyến tính biểu hiện mối liên hệ giữa ba
chỉ tiêu trên.
b. Dự đoán y với x1=4 và x2=2
c. Tính các hệ số tương quan tuyến tính, đánh giá trình độ chặt chẽ giữa y, x 1;
y, x2 và x1, x2
d. Tính hệ số tương quan bội đánh giá trình độ chăt chẽ giữa ba chỉ tiêu trên.

143
- 144 -

CHƯƠNG VII ĐIỀU TRA CHỌN MẪU


 Mục tiêu của chương:
- Nắm được những vấn đề lý luận về điều tra chọn mẫu như: điều tra chọn mẫu là
gì, các trường hợp vận dụng điều tra chọn mẫu, nắm được tổng thể chung, tổng
thể mẫu, các tham số đặc trưng của tổng thể chung, tổng thể mẫu, sai số trong
điều tra chọn mẫu, xác định số đơn vị mẫu, suy rộng kết quả điều tra chọn mẫu.
- Nắm được các phương pháp chọn mẫu ngẫu nhiên thường dùng trong thống kê.
I. Nội dung 1: Khái niệm, ý nghĩa về điều tra chọn mẫu:
1.1. Khái niệm:
Điều ta chọn mẫu là loại điều tra không toàn bộ trong đó người ta chỉ chọn ra 1 số
đơn vị nhất định từ toàn bộ số đơn vị của tổng thể nghiên cứu để điều tra thực tế rồi
dùng kết quả thu thập được để tính toán và suy rộng ra các đặc trưng chung cho cả
tổng thể nghiên cứu.
Ví dụ: Muốn cung cấp tài liệu kịp thời về chất lượng sản phẩm của 1 xí nghiệp sản
xuất, người ta sẽ điều tra bằng cách chọn một số sản phẩm trong tổng số sản phẩm sản
xuất ra để điều tra. Sau đó căn cứ vào kết quả thu được suy ra chất lượng sản phẩm
cho toàn bộ xí nghiệp.
1.2. Ý nghĩa:
Điều tra chọn mẫu thường nhanh hơn rất nhiều so với điều tra toàn bộ, vì điều tra ít
đơn vị, nên các công việc chuẩn bị sẽ gọn, số lượng tài liệu ghi chép giảm đi, thời gian
điều tra, thời gian tổng hợp , phân tích sẽ được rút ngắn. Điều này làm cho điều tra
chọn mẫu có tính kịp thời cao.
Do số đơn vị điều tra thực tế ít, số nhân viên điều tra và mọi chi phí sẽ giảm, cho
nên điều tra chọn mẫu tiết kiệm được khá nhiều sức người và tiền của.
Do số đơn vị điều tra thực tế ít có thể mở rộng nội dung điều tra, đi sâu nghiên cứu
nhiều mặt của hiện tượng.
Tài liệu thu thập được trong điều tra chọn mẫu có trình độ chính xác cao, bởi vì số
nhân viên điều tra cần ít nên có thể chọn những người có kinh nghiệm, có trình độ
nghiệp vụ cao, đồng thời việc kiểm tra số liệu có thể tiến hành tỉ mỉ và tập trung khiến
cho sai số do ghi chép giảm đi nhiều.
Điều tra chọn mẫu không đòi hỏi một tổ chức lớn như điều tra toàn bộ
 Tuy nhiên điều tra chọn mẫu không hoàn toàn thay thế điều tra toàn bộ vì kết
quả suy rộng của điều tra chọn mẫu không chính xác như kết quả điều tra toàn bộ.
Điều tra chọn mẫu chỉ dung trong những trường hợp nhất định và kết quả suy rộng của
nó bao giờ cũng mang một sai số nhất định so với kết quả của điều tra toàn bộ.
1.3. Các trường hợp vận dụng điều tra chọn mẫu:
- Dùng để thay thế điều tra toàn bộ, khi hiện tượng nghiên cứu không cho phép
tiến hành điều tra toàn bộ hoặc không xác định được tổng thể nghiên cứu .
- Khi hiện tượng nghiên cứu vừa cho phép tiến hành điều tra toàn bộ và điều tra
chọn mẫu thì người ta sẽ chọn điều tra chọn mẫu vì nó nhanh hơn và tiết kiệm hơn
- Dùng để kết hợp với điều tra toàn bộ để mở rộng nội dung điều tra hoặc để kiểm
tra lại tài liệu của điều tra toàn bộ

144
- 145 -

II. Nội dung 2: Những vấn đề lý luận chung về điều tra chọn mẫu ngẫu nhiên
1. Tổng thể chung và tổng thể mẫu:
Tổng thể chung: là tổng thể bao gồm toàn bộ các đơn vị thuộc đối tượng điều tra.
Số đơn vị tổng thể chung thường ký hiệu bằng chữ N
Tổng thể mẫu: là tổng thể bao gồm một số đơn vị nhất định được chọn ra từ tổng
thể chung để điều tra thực tế. Số đơn vị tổng thể mẫu thường được ký hiệu bằng chữ n.
Ví dụ: Trong 1 huyện có 5000 hộ gia đình, người ta chọn ra 100 hộ để điều tra về
mức sống. Như vậy, số đơn vị tổng thể chung là N = 5000, mẫu n =100.
Tổng thể chung cũng như tổng thể mẫu đều có những tham số đặc trưng như: số
bình quân, tỷ lệ, phương sai…
2. Các chỉ tiêu (tham số đặc trưng của tổng thể chung và tổng thể mẫu):
- Số bình quân chung X được ước lượng bởi số bình quân mẫu ~ x
- Tỷ lệ chung p được ước lượng bởi tỷ lệ mẫu w
- Để ước lượng phương sai chung  2 ta không dùng phương sai mẫu  2 0 mà dùng
phương sai mẫu điều chỉnh  2' 0 làm ước lượng
3. Cách chọn 1 lần và chọn nhiều lần:
3.1. Chọn 1 lần: (chọn không lặp lại hoặc chọn không hoàn lại)
Là khi mỗi đơn vị đã được chọn để đăng ký rồi sẽ được xếp riêng ra không trả về
tổng thể chung, do đó không có khả năng được chọn lại.
 Đặc điểm:
- Số đơn vị tổng thể chung sẽ giảm dần đi trong quá trình chọn từng đơn vị.
Ví dụ: N=50, giảm dần còn 49, 48,….
Xác suất được chọn của mỗi đơn vị không bằng nhau, đồng thời việc chọn thứ tự
từng đơn vị mẫu cho đủ n đơn vị cũng giống như lấy 1 lần n đơn vị ra để điều tra.
Gọi k là khả năng thiết lập được tổng thể mẫu. Số khả năng đó trong chọn 1 lần
được xác định theo công thức:
N!
K  CN 
n

n!( N  n)!
3.2. Chọn nhiều lần:(chọn lặp hoặc chọn có hoàn lại)
Là khi mỗi đơn vị được chọn ra đăng ký rồi lại được trả về tổng thể chung. Như
vậy số đơn vị tổng thể chung không thay đổi trong suốt quá trình lựa chọn. Mỗi đơn vị
đều có khả năng được chọn như nhau (xác suất được chọn của mỗi đơn vị bằng nhau),
đơn vị được chọn ra rồi vẫn có khả năng được chọn lại.
Để thiết lập mẫu chỉ có thể chọn nhiều lần bằng cách chọn lần lượt từng phần tử 1
có trả lại
Trong chọn nhiều lần, số khả năng thiết lập tổng thể mẫu tính bằng công thức:
K= Nn
Lý do phân biệt chọn 1 lần và chọn nhiều lần:
- Khả năng thiết lập tổng thể mẫu khác nhau
- Sai số ở mỗi cách chọn khác nhau, chọn 1 lần thì sai số nhỏ hơn chọn nhiều
lần
Ví dụ: Giả sử có tổng thể gồm 4 nhân viên đánh máy như sau:
Nhân viên: A B C D
Số kiểu 3 2 1 4
145
- 146 -

Chọn 2 người để nghiên cứu


- Chọn 1 lần: K  C4 2  6
- Chọn nhiều lần: K  4 2  16
4. Sai số trong điều tra chọn mẫu:
Là sự chênh lệch giữa giá trị của tổng thể mẫu và giá trị thực của tổng thể chung
Nguyên nhân dẫn đến sai số:
- Sai số do ghi chép:
+ Nếu là sai số ngẫu nhiên (khi nhiều hơn khi ít hơn) thì nó sẽ bù trừ cho nhau
khi điều tra một số lớn đơn vị
+ Nếu là sai số có hệ thống (sai số về một phía) thì rất nguy hiểm vì càng điều
tra nhiều đơn vị, sai số càng nhiều ( thường xảy ra trong trường hợp dụng cụ đo lường
sai).
- Sai số do tính chất đại biểu: là sai số xảy ra do chỉ điều tra một số ít đơn vị mà
kết quả lại suy cho cả tổng thể, có hai loại:
+ Sai số có hệ thống xảy ra do vi phạm nguyên tắc chọn, nghĩa là không đảm
bảo tính khách quan khi chọn đơn vị điều tra. Điều này thường xảy ra đối với những
người muốn giấu giếm sự thật hoặc ngại khó vô trách nhiệm.
+ Sai số ngẫu nhiên là sai số chỉ xuất hiện trọng trường hợp các đơn vị của
tổng thể mẫu được chọn theo quy tắc ngẫu nhiên. Đã gọi là ngẫu nhiên thì không thể
biết trước sẽ lệch về phía nào, sai số này sẽ giảm khi tăng số đơn vị điều tra.
Sai số chọn mẫu là một trị số không cố định, phụ thuộc vào số đơn vị mẫu điều tra
(n), vào trình độ đồng đều của tổng thể nghiên cứu (  2 ) và vào các phương pháp chọn
mẫu khác nhau. Nếu ký hiệu sai số chọn mẫu là d thì ứng với mỗi mẫu cụ thể ta có
một sai số
d   ' 
Vì ứng với mỗi mẫu có một sai số nhất định nên cần phải tính sai số bình quân
chọn mẫu (ký hiệu  ) để đánh giá độ chính xác của ước lượng, từ đó xây dựng khoảng
tin cậy của ước lượng.
Thống kê toán đã chứng minh cách xác định sai số bình quân chọn mẫu theo các
công thức:
- Khi nhiệm vụ điều tra chọn mẫu là để suy rộng số bình quân về một tiêu thức số
lượng nào đó, sai số bình quân chọn mẫu sẽ là:
+ Trường hợp chọn nhiều lần:
2
x 
n
+ Trường hợp chọn 1 lần:
2 n
x  (1 
)
n N
- Khi nhiệm vụ điều tra chọn mẫu là để suy rộng tỷ lệ theo một tiêu thức nào đó,
sai số bình quân chọn mẫu sẽ là:
+ Trường hợp chọn nhiều lần:

146
- 147 -

pq p(1  p)
p  
n n
Trong đó: pq: phương sai chung của tiêu thức thay phiên
+ Trường hợp chọn 1 lần:
pq n
p  (1  )
n N
Chú ý: Nếu số đơn vị mẫu chiếm tỷ lệ không đáng kể so với số đơn vị tổng thể
n
chung thì 1   1 do đó sai số bình quân chọn mẫu trong hai cách chọn 1 lần và
N
nhiều không lệch nhau nhiều. Vì vậy mặc dù chọn theo cách chọn 1 lần nhưng vẫn áp
dụng công thức tính nhiều lần để việc tính toán dể dàng hơn mà kết quả không khác
nhau nhiều.
Trong thực tế, khi tính sai số bình quân chọn mẫu thường không có tài liệu về
phương sai chung nên phải thay thế bằng phương sai mẫu điều chỉnh  2' 0
n
n  30     0 (  1)
2 2
+ Nếu
n 1
n 2
n  30   2   2' 0 và  0   0
2'
+ Nếu
n 1
 Phạm vi sai số: Các công thức sai số bình quân chọn mẫu trên đây biểu hiện trị
số bình quân của các sai số chọn mẫu có thể gặp phải khi suy rộng tài liệu. Nhưng do
tiến hành chọn ngẫu nhiên nên sai số này không phải là một trị số được xác định trước
về dấu (+ hoặc -) mà phản ánh một phạm vi chênh lậch có thể nhiều hơn hoặc ít hơn so
với tham số của tổng thể chung. Như vậy có nghĩa là chênh lệch giữa X và ~ x , giữa p
và w không phải hoàn toàn bằng  mà nằm trong phạm vi  
Để hạn chế sự lệch nhau quá nhiều giữa  và  ’ ta xác định phạm vi sai số. Càng
mở rộng phạm vi sai số chọn mẫu trình độ tin cậy của việc suy rộng càng tăng, đồng
thời sai số chọn mẫu cũng tăng theo. Hệ só dùng để mở rộng đó được gọi là hệ số tin
cậy (t), nó ứng với hàm xác suất đã được Lia-pu-nop lập bảng tính sẳn.
Vậy có thể xác định phạm vi sai số chọn mẫu theo công thức:   t
  '  
 : phạm vi sai số
t: hệ số tin cậy
 : sai số bình quân chọn mẫu
( t ) : trình độ tin cậy
 : tham số chung
 ’: tham số mẫu
'    '
 ( ', '  ) sẽ chứa giá trị cần ước lượng, đó được gọi là khoảng tin cậy của
ước lượng
' 
là hai cận tin cậy
' 

147
- 148 -

Xác suất:
P(    '   )    2 ( t ) : trình độ tin cậy
lưu ý:
-   t càng nhỏ suy ra khoảng tin cậy càng nhỏ, trình độ tin cậy càng thấp
- Số mẫu càng lớn thì sai số chọn mẫu càng giảm.
6. Xác định số đơn vị mẫu:
Trước khi tiến hành điều tra chọn mẫu phải xác định số đơn vị cần điều tra. Xác
định số đơn vị mẫu điều tra phải đáp ứng hai yêu cầu:
- Bảo đảm sai số chọn mẫu nhỏ nhất.
- Làm cho chi phí thấp nhất
Thông thường người ta căn cứ vào yêu cầu của độ chính xác (phạm vi sai số chọn
mẫu) để tính số đơn vị mẫu cần điều tra.
6.1. Xác định số đơn vị tổng thể mẫu khi cần ước lượng số bình quân:
Căn cứ vào công thức tính phạm vi sai số chọn mẫu
  t
Nếu dự định chọn đơn vị tổng thể mẫu theo cách chọn nhiều lần (chọn có trả lại)
thì:

t 2 2
t n 2
n 
Nếu dự định chọn đơn vị tổng thể mẫu theo cách chọn 1 lần (chọn không trả lại)
thì:
2 n Nt 2 2
t (1  )n
n N N2  t 2 2
6.2. Xác định số đơn vị tổng thể mẫu khi cần ước lượng tỷ lệ theo tiêu thức nghiên
cứu:
- Theo cách chọn nhiều lần:
pq t 2 pq
t n 2 với q=1-p
n 
- Theo cách chọn 1 lần:
pq n Nt 2 pq
t (1  )  n 
n N N2  t 2 pq
 Kích thước mẫu phụ thuộc vào các nhân tố sau đây:
- Số đơn vị mẫu (n) phụ thuộc vào phạm vi sai số chọn mẫu:  tỷ lệ nghịch
với n
- Số đơn vị mẫu phụ thuộc vào hệ số tin cậy (t): t tỷ lệ thuận với n
- Số đơn vị mẫu còn phụ thuộc vào tính chất đồng đều của hiện tượng nghiên
cứu (phương sai):  2 tỷ lệ thuận với n
 Trước khi xác định về kích thước mẫu chúng ta chưa có tài liệu về phương sai
chung thì trong thực tế người ta thường giải quyết như sau:
- Căn cứ vào phương sai điều tra lần trước để thay cho phương sai lần này.

148
- 149 -

- Nếu trước đây đã tiến hành điều tra nhiều lần đối với hiện tượng này thì người ta
chọn mẫu có phương sai lớn nhất.
- Có thể căn cứ vào phương sai của các điều tra chọn mẫu ở những nơi khác nếu
như hiện tượng nghiên cứu ở những nơi đó cũng có những điểm và điều kiện tương tự.
- Nếu như tất cả các trường hợp trên đều không có, có thể tiến hành điều tra chọn
mẫu thí điểm trong phạm vi nhỏ để tính toán gần đúng các chỉ tiêu cần thiết, cũng có
khi người ta tính toán theo 1 giả thiết nào đó nhưng phải đảm bảo số mẫu chọn ra khá
đầy đủ
- Có thể ước lượng phương sai theo khoảng biến thiên (R) tuỳ theo đặc điểm phân
phối của hiện tượng nghiên cứu…Nếu là phân phối chuẩn thì:
x max  x min

6
Ví dụ: Để nghiên cứu nhu cầu tiêu dùng vải của nhân dân huyện X người ta tiến
hành điều tra chọn mẫu, biết rằng độ lệch chuẩn về mức tiêu dùng vải là 25,5 m. Yêu
cầu sai số không vượt quá 1,5 m đối với mỗi hộ gia đình và trình độ tin cậy là 95,45%.
Vậy cần phải điều tra trên bao nhiêu hộ gia đình để đạt được các yêu cầu trên.
Cho biết:  =25,5 m,  =1,5m, ( t ) =95,45% →t=2, n=?
Theo cách chọn nhiều lần:
t 2  2 2 2 (25,5) 2
n 2   1156 hộ
 1,5 2
KL: Vậy với trình độ tin cậy là 95,45% và phạm vi sai số 1,5 m thì ta cần phải điều
tra tối thiểu 1156 hộ.
 Kiểm tra tính chất đại biểu của tổng thể mẫu: so sánh một số chỉ tiêu bình quân
hoặc chỉ tiêu tương đối của tổng thể mẫu đã chọn với các chỉ tiêu tương ứng của tổng
thể chung. Đương nhiên là giữa các chỉ tiêu này thường có chênh lệch, nhưng nếu mức
độ chênh lệch không vượt quá phạm vi cho phép (thường là ±5%) thì tổng thể mẫu
được coi như đủ tính chất đại biểu.
7. Suy rộng kết quả điều tra chọn mẫu:
7.1. Phương pháp tính đổi trực tiếp:
Áp dụng khi người ta dùng các số bình quân hay số tương đối của tổng thể mẫu để
tính ra các tham số tương ứng của tổng thể chung. Cách tính như sau:
  '  
 '     '
x~
x  x  ~
x  x  x  ~
x  x
wp  p  w p
Ví dụ 1: NSLĐ bình quân của một công nhân tính được trong điều tra tổng thể
mẫu của 1 XN A là 20 sản phẩm / 1người/ 1 ngày. Với xác suất 0,9545, tính ra phạm
vi sai số chọn mẫu là 0,2 sp/người/ngày.
Cho biết: ( t ) =95,45% →t=2
Giải:
Ta có:

149
- 150 -

~
x  x  x  ~
x  x
 20  0,2  x  20  0,2
 19,8  x  20,2
Kl: Với độ tin cậy 95,45% thì năng suất bình quân của 1 công nhân thuộc khoảng
(19,8-20,2).
Ví dụ 2: Giả sử sau khi điều tra chọn mẫu số đồ hộp (200 hộp) tính được tỷ lệ đồ
hộp không đúng quy cách là 10%. Với xác suất 0,9545 tính ra phạm vi sai số chọn
mẫu là 0,02. Như vậy, suy ra tỷ lệ đồ hộp không đúng quy cách của cả đợt sản xuất
(của xí nghiệp) sẽ nằm trong phạm vi:
w  p  p  w  p
 0,1  0,02  p  0,1  0,02
 0,08  p  0,12
7.2. Phương pháp hệ số điều chỉnh:
Phương pháp này thường dùng để kiểm tra lại kết quả của điều tra toàn bộ, nội
dung chủ yếu của phương pháp này là dựa vào sự đối chiếu số liệu của điều tra chọn
mẫu và của điều tra toàn bộ, tính ra tỷ lệ chênh lệch rồi dùng tỷ lệ này làm hệ số điều
chỉnh số liệu của điều tra toàn bộ.
Ví dụ: Trong điều tra dân số ở Tỉnh X ngày 12/12/2004 người ta đồng thời tiến
hành điều tra chọn mẫu 5% số địa bàn điều tra với mục đích nghiên cứu thêm 1 số tiêu
thức, đồng thời kiểm tra kết quả tổng điều tra dân số. Giả sử theo kết quả của tổng điều
tra dân số thì tổng số dân của tỉnh X vào thời điểm đó là 2.000.000 người, trong đó chỉ
tính riêng 5% địa bàn điều tra (là những địa bàn chọn làm mẫu) là 92.000 người.
Trong khi đó kết quả điều tra chọn mẫu trên 5% số địa bàn đã bỏ sót mất 56 người
trong các địa bàn đó.
56
Tỷ lệ bỏ sót là:  0,0006
92.000
Có thể dùng tỷ lệ này làm hệ số để điều chỉnh lại kết quả của điều tra toàn bộ. Như
vậy trong toàn tỉnh số người bị bỏ sót có thể lên tới :
0,0006 x 2.000.000 = 1200 người
Và số dân thực tế của tỉnh vào thời điểm đó là:
2.000.000 + 1200 = 2001200 người.
III. Nội dung 3 : Các phương pháp chọn mẫu ngẫu nhiên thường dùng trong
thống kê
Chọn các đơn vị mẫu từ tổng thể chung có thể tiến hành theo nhiều cách khác
nhau. Hệ thống tổ chức chọn các đơn vị mẫu từ tổng thể chung gọi là phương pháp tổ
chức chọn mẫu.
1. Phương pháp chọn mẫu ngẫu nhiên đơn thuần:
Là phương pháp tổ chức chọn các đơn vị mẫu hoàn toàn ngẫu nhiên không qua một
sự sắp xếp nào trước, phương pháp này được tiến hành qua các cách sau đây:
- Rút thăm
- Quay số
- Dùng máy tính bỏ túi
- Chọn theo bảng số ngẫu nhiên.

150
- 151 -

Khi tính sai số bình quân chọn mẫu có thể dùng các công thức đã được trình bày ở
phần trên
Ưu điểm: phương pháp này đơn giản, dể thực hiện và cho kết quả tốt, nếu như
tổng thể khá đồng đều hoặc đồng nhất về 1 loại hình
Nhược điểm: Nếu tổng thể có kết cấu phức tạp thì ta khó có thể chọn ra được số
đơn vị mẫu có tính chất đại biểu cao hoặc tổng thể quá lớn thì việc chọn số đơn vị mẫu
sẽ gặp khó khăn, nhiều khi không thực hiện được.
2. Phương pháp chọn máy móc:
Là phương pháp tổ chức chọn mẫu trong đó mỗi đơn vị được chọn căn cứ vào từng
khoảng cách nhất định. Trước hết, người ta sắp xếp các đơn vị tổng thể chung theo
một thứ tự nào đó như sắp xếp theo vần A, B, C.. của tên gọi, theo thứ tự địa dư, theo
quy mô từ nhỏ đến lớn… Sau đó lần lượt chọn các đơn vị theo thứ tự một cách máy
móc, tức là cứ sau mỗi khoảng cách nhất định lại chọn ra một đơn vị. Khoảng cách này
được xác định bằng cách lấy số đơn vị tổng thể chung chia cho số đơn vị tổng thể mẫu.
N
d
n
Như vậy, cứ d đơn vị chọn ra 1 đơn vị, còn đơn vị đầu tiên được chọn từ khoảng
cách đầu tiên theo phương pháp ngẫu nhiên đơn thuần
Ví dụ: Cần chọn 100 công nhân từ 2000 công nhân để nghiên cứu về năng suất lao
động. Ta thực hiện như sau:
Lập danh sách của 2000 công nhân theo vần A, B, C…
Xác định khoảng cách chọn
N 2000
d   20
n 100
Giả sử chọn người đầu tiên là 8, thì người thứ 2 là 28, 48….
Chú ý: Số đơn vị của tổng thể chung không được sắp xếp theo một tiêu thức nào
đó có liên quan đến mục đích nghiên cứu, nếu tiến hành như vậy thì ngoài việc xuất
hiện sai số ngẫu nhiên còn xuất hiện thêm sai số có hệ thống. Sai số có hệ thống lớn
hay nhỏ phụ thuộc vào đơn vị đầu tiên.
Trong trường hợp chọn máy móc việc xác định sai số bình quân chọn mẫu cũng
như phạm vi sai số chọn mẫu giống như phương pháp chọn ngẫu nhiên đơn thuần
3. Phương pháp chọn phân loại:
Trước hết phải căn cứ vào một tiêu thức liên quan đến mục đích nghiên cứu để tiến
hành phân chia tổng thể thành các tổ sau đó tiến hành lựa chọn đơn vị trong từng tổ
theo phương pháp ngẫu nhiên đơn thuần hoặc theo phương pháp chọn máy móc. Số
đơn vị được chọn trong mỗi tổ có thể không tương ứng hoặc tương ứng với tỷ trọng
của mỗi tổ trong tổng thể, nếu số đơn vị được chọn trong mỗi tổ tương ứng với tỷ
trọng mỗi tổ chiếm trong tổng thể thì người ta gọi là chọn phân loại theo tỷ lệ, ngược
lại người ta gọi là chọn phân loại không theo tỷ lệ. Trong chọn tỷ lệ, số đơn vị chọn
trong mỗi tổ sẽ được tính theo công thức:
Ni
ni  n
N
Ví dụ: Tổng thể N có 100 người trong đó có 2 tổ: A: 30 người, B: 70 người

151
- 152 -

chọn n = 10 người trong đó: A: 3 người, B: 7 người: gọi là chọn theo tỷ lệ
A: 5 người, B: 5 người: gọi là chọn không theo tỷ
lệ
Sai số bình quân chọn mẫu trong chọn phân loại tỷ lệ không phụ thuộc vào phương
sai chung mà phụ thuộc vào bình quân các phương sai tổ. Vì vậy trong trường hợp
chọn phân loại theo tỷ lệ ta có các công thức tính sau:
Nhiệm vụ suy rộng Chọn nhiều lần Chọn 1 lần
i i
2 2
n
Suy rộng số x  x  (1  )
n n N
bình quân
p(1  p) p(1  p) n
Suy rộng p  p  (1  )
n n N
số tương đối
Trong các công thức trên:

  2 N i
2
i

N
i
i

p(1  p) 
 p(1  p) N i

N i

 i : phương sai bình quân tổ


2

 i : phương sai mẫu của tổ i


2

ni: số đơn vị mẫu của tổ i


Trong trường hợp chọn phân loại không theo tỷ lệ, sai số bình quân chọn mẫu được
tính theo công thức:
1

N
 i
2
Ni

 i : sai số bình quân chọn mẫu trong từng tổ


Ni: số đơn vị trong từng tổ của tổng thể chung
Ví dụ: Người ta cần tổ chức 1 cuộc điều tra chọn mẫu để xác định tỷ lệ cán bộ
công nhân viên trong các xí nghiệp đang theo học tại chức, tất cả các xí nghiệp trong
khu vực được chia làm 3 tổ theo số công nhân viên

CNV Mẫu
<1000 9000 900
1001-3000 15000 1500
3001> 8000 800

Dùng phương pháp chọn máy móc 10% số người trong mỗi tổ người ta đã xác định
được tỷ lệ công nhân viên đang theo học tại chức như sau: 2%, 5%, 8%
Với xác suất 0,683 hãy xác định tỷ lệ CNV của XN đang theo học các lớp đại học
tại chức.

152
- 153 -

w  p  p  w  p
 p  t p
( t )  0,683  t  1

p(1  p) 
 p(1  p)N i
=0,04617
N i

p(1  p) n 0,04617 3200


p  (1  ) = (1  )  0,0037
n N 3200 32000

p
pn i i

0,02x900  0,05x1500  0,08x800
 0,049
n i 3200
0,049  0,0037  P  0,049  0,0037
4,53%  P  5,27%
4. Phương pháp chọn cả khối:
Là phương pháp chọn những đơn vị tổng thể mẫu từ tổng thể chung bằng cách
chọn từng khối đơn vị mẫu cùng 1 lúc theo cách chọn ngẫu nhiên đơn thuần hay chọn
máy móc, như vậy tổng thể chung chia thành nhiều khối và chọn ra một số khối mẫu
để điều tra toàn bộ các đơn vị trong khối mẫu đó.
Ví dụ: Có 200 kiện hàng trong kho, mỗi kiện là 100 sản phẩm. Yêu cầu hãy kiểm
tra chất lượng khối hàng này
Xem 200 kiện hàng là 200 khối
Chọn ngẫu nhiên 10 khối để điều tra. Vậy số sản phẩm thực tế cần phải điều tra là
1000 sản phẩm.
Trong chọn cả khối, sai số bình quân chọn mẫu không phụ thuộc vào phương sai
chung mà phụ thuộc vào sự chênh lệch giữa các số bình quân khối hay còn gọi là
phương sai các số bình quân khối. Vì vậy sai số bình quân chọn mẫu trong chọn cả
khối được tính như sau:
Suy rộng chỉ tiêu bình quân:
 ~x R  r
2

x  ( )
r R 1
Suy rộng chỉ tiêu tương đối:
w r (1  w r ) R  r
p  ( )
r R 1
 ~x : phương sai của các số bình quân tổ
2

 ~x
2

 (~
x ~
x )n
i i

n i
~
x : số bình quân mẫu của tất cả các khối
x~ : số bình quân của khối i
i

ni: số đơn vị của khối i


153
- 154 -

R: số khối của tổng thể chung


r: số khối của tổng thể mẫu
wr: tỷ lệ bình quân của tất cả các khối mẫu

wr 
w n i i

n i
5. Phương pháp chọn kết hợp:
Chọn kết hợp là sử dụng kết hợp một số phương pháp chọn với nhau. Nếu kết hợp
chọn cả khối với chọn ngẫu nhiên đơn thuần thì trước hết tổng thể chung được chia
thành các khối, chọn một số khối cần thiết, sau đó chọn ngẫu nhiên các đơn vị trong
các khối đã chọn để điều tra. Với cách chọn này, sai số bình quân chọn mẫu được tính
theo công thức:
2 2
 
2
 trường hợp chọn nhiều lần
n r

2 n 2 r
  (1  )  (1  ) trường hợp chọn 1 lần
2

n N r R
Trong đó: n là số đơn vị mẫu chọn từ các khối./.
BÀI TẬP CUỐI CHƯƠNG
Bài 1
Trong một xí nghiệp cơ khí người ta chọn ra 25 công nhân để điều tra năng suất lao
động. Kết quả điều tra cho thấy thời gian hao phí bình quân để sản xuất 1 sản phẩm là
32 phút, độ lệch tiêu chuẩn là 6 phút.
1. Với yêu cầu trình độ đáng tin cậy là 0,954 hãy suy rộng thời gian hao phí bình
quân để sản xuất 1 sản phẩm của công nhân cả xí nghiệp.
2. Cũng với những số liệu trên, nhưng nếu chỉ chọn ra 100 công nhân để điều tra
thì kết quả suy rộng sẽ là bao nhiêu?
Bài 2
Trong một xí nghiệp dệt gồm 1000 công nhân, người ta chọn ra 100 người theo
phương pháp chọn ngẫu nhiên đơn thuần (không trả lại). Kết quả điều tra năng suất lao
động trên tổng thể mẫu như sau:
Năng suất lao động (m) Số công nhân
30-40 30
40-50 33
50-60 24
60-70 13
Hãy tính:
1. Năng suất lao động bình quân chung của công nhân trong xí nghiệp, với độ
tin cậy 0,683.
2. Xác suất để cho năng suất lao động bình quân chung không chênh lệch quá
1,94 m so với năng suất lao động bình quân của số công nhân được điều tra.

154
- 155 -

3. Số công nhân cần chọn để điều tra, sáo cho với xác suất là 0,954, phạm vi
sai số chọn mẫu khi suy rộng năng suất lao động bình quân chung không
vượt quá 2 met.
4. Tỷ lệ chung về số công nhân dệt trong cả xí nghiệp có năng suất lao động
bình quân từ 60 met trở lên, với trình độ tin cậy là 0,683.
5. Xác suất để cho tỷ lệ chung về số công nhân dệt trong cả xí nghiệp có năng
suất lao động bình quân từ 60 m trở lên (vừa tính được ở câu 4 không chênh
lệch quá 9,6% so với tỷ lệ đã điều tra được
PHẦN II: ỨNG DỤNG PHẦN MỀM SPSS TRONG XỬ LÝ DỮ LIỆU THỐNG

Tổng quan
SPSS for Windows cung cấp một hệ thống quản lý dữ liệu và phân tích thống kê
trong một môi trường đồ hoạ, sử dụng các trình đơn mô tả {menu} và các hộp thoại
{dialogue box} đơn giản để thực hiện hầu hết các công việc cho bạn. Phần lớn các
nhiệm vụ có thể được hoàn thành chỉ bằng cách rê và nhắp chuột.
Bên cạnh giao diện rê-nhắp chuột để phân tích thống kê, SPSS for Windows cung
cấp:
Data Editor {Cửa sổ Hiệu đính dữ liệu}. Một hệ thống dạng bảng tính
{worksheet} uyển chuyển để định nghĩa, nhập, hiệu đính, và thể hiện dữ liệu.
Viewer {Cửa sổ Viewer}. Cửa sổ Viewer cho phép dễ dàng duyệt các kết quả của
bạn, thể hiện và che giấu có thể chọn lọc các kết xuất {output}, thay đổi trật tự của các
kết quả, và di chuyển các bảng và đồ thị giữa SPSS for Windows và các trình ứng
dụng khác
High-revolution graphics {Đồ thị có độ phân giải/độ nét cao}. Các biểu đồ hình
tròn, đồ thị cột, biểu đồ tần suất, đồ thị phân tán có độ phân giải cao, màu sắc sống
động, các đồ thị ba chiều, và hơn thế nữa được bao gồm như là các tính năng chuẩn
trong SPSS.
Data transformation {Biến đổi dữ liệu}. Tính năng biến đổi dữ liệu giúp bạn có
được dữ liệu sẵn sàng cho các bước phân tích. Bạn có thể dễ dàng nhóm, bổ sung, tổng
hợp, trộn, chia và chuyển đổi file, và hơn thế nữa.
1. Các cửa sổ trong SPSS
Có một số loại cửa sổ khác nhau trong SPSS:
Data Editor. Cửa sổ này thể hiện nội dung của file dữ liệu. Bạn có thể lập một file
dữ liệu mới hoặc hiệu chỉnh thay đổi một file đã có sẵn với cửa sổ Data Editor. Cửa sổ
Data Editor tự động mở ra khi bạn kích hoạt/khởi động SPSS. Bạn chỉ có thể một file
dữ liệu tại một thời điểm mà thôi (không thể mở hơn một file dữ liệu vào cùng một
thời điểm).
Viewer. Mọi kết quả thống kê, bảng, biểu đồ được thể hiện trong cửa sổ Viewer.
Bạn có thể hiệu đính kết xuất và lưu nó để sử dụng sau này. Một cửa sổ Viewer tự
động mở ra khi bạn chạy một thủ tục đầu tiên tạo nên kết xuất.
2. Thanh menu {Menu}
Rất nhiều nhiệm vụ bạn muốn tiến hành với SPSS bắt đầu với việc lựa chọn các
menu {trình đơn}. Từng cửa sổ trong SPSS có các menu riêng của nó với các lựa chọn
menu thích hợp cho loại cửa sổ đó.

155
- 156 -

Hai menu Analysis và Graphs là có sẵn đối với mọi loại cửa sổ, làm cho việc tạo
các kết xuất mới rất nhanh chóng mà không phải chuyển đổi giữa các cửa sổ.
3. Thanh công cụ {Toolbars}
Từng cửa sổ SPSS có các thanh công cụ riêng của nó cho phép truy cập nhanh đến
các nhiệm vụ thông dụng. Có một số cửa sổ có hơn một thanh công cụ.
Hình 1-2: Thanh công cụ với trợ giúp chỉ dẫn công cụ {ToolTip Help}

4. Thanh tình trạng {Status Bar}


Thanh tình trạng {status bar} nằm ở đáy của từng cửa sổ SPSS cung cấp các thông
tin dưới đây:
Command status {Tình trạng lệnh}. Đối với từng lệnh hoặc thủ tục mà bạn chạy,
một số đếm các đối tượng/trường hợp {case} chỉ ra số lượng các đối tượng được xử lý.
Đối với các thủ tục đòi hỏi phải xử lý lặp, số lần lặp được thể hiện.
Filter status {Tình trạng lọc}. Nếu bạn chọn một mẫu ngẫu nhiên hoặc một tập
hợp phụ các đối tượng để phân tích, thông tin Filter on chỉ ra rằng một vài nhóm đối
tượng nào đó đang được lọc và không phải mọi đối tượng trong tệp tin dữ liệu được
đưa vào phân tích.
Weight status {Tình trạng gia quyền}. Thông tin Weight on chỉ ra rằng một biến
gia quyền đang được sử dụng để gia quyền các đối tượng cho phân tích.
Split status {Tình trạng chia tách}. Thông tin Split on chỉ ra rằng file dữ liệu
đang được chia tách thành một số nhóm để phân tích, được dựa vào các trị số của một
hoặc một số biến lập nhóm/phân tổ.
5. Hộp thoại {Dialogue box}
Hầu hết các lựa chọn menu mở ra các hộp thoại. Bạn sử dụng hộp thoại để lựa chọn
các biến và các tuỳ chọn cho phân tích
Từng hộp thoại chính cho các thủ tục thống kê và đồ thị có một số các bộ phận cơ
bản
Danh sách biến nguồn. Một danh sách các biến trong file dữ liệu làm việc. Chỉ có
các loại biến được phép bởi các thủ tục được chọn mới được thể hiện trong danh sách
nguồn. Việc ding các biến chuỗi dạng ngắn hay dài bị hạn chế bởi rất nhiều thủ tục.
Danh sách (hoặc các danh sách) biến đích. Một hoặc một vài danh sách thể hiện
các biến bạn vừa chọn cho phân tích, chẳng hạn như danh sách biến độc lập và phụ
thuộc.
Nút ấn điều khiển {Command pushbutton}. Các nút chỉ dẫn chương trình thực
hiện một tác vụ, chẳng hạn như chạy một thủ tục, thể hiện phần thông tin Trợ giúp,
hoặc mở ra một hộp thoại con để tiến hành các lựa chọn cụ thể bổ sung.
Để có được thông tin về các nút điều khiển trong một hộp thoại, nhắp chuột phải lên
nút đó.
Hình 1-5: Các bộ phận điều khiển hộp thoại
Danh sách
Danh sách biến biến đích
nguồn

Các núm
nhấn câu
156 lệnh
- 157 -

6. Tên biến và nhãn biến trong các danh sách của hộp thoại
Bạn có thể thể hiện hoặc là tên biến hoặc là nhãn biến trong danh sách của hộp
thoại. Do tên biến bị hạn chế bởi 8 ký tự, nhãn biến thường cung cấp nhiều thông tin
mô tả biến hơn.
 Để điều khiển sự thể hiện tên biến hay nhãn biến trong danh sách của hộp thoại,
trong Options trong menu Edit ở bất kỳ loại cửa sổ nào của SPSS.
 Để định nghĩa hoặc chỉnh sửa nhãn biến, hãy nhắp đúp tên biến trong cửa sổ
Data Editor và sau đó nhắp Labels.
 Đối với dữ liệu nhập từ các nguồn cơ sở dữ liệu, tên các trường được sử dụng
làm nhãn biến.
 Đối với nhãn biến quá dài, chỉ con trỏ lên nhãn trong danh sách để xem toàn bộ
nhãn biến đó.
 Nếu không có nhãn biến nào được xác định thì tên biến sẽ được thể hiện.
Hình 1-6: Các nhãn biến được thể hiện trong một hộp thoại

7. Lựa chọn biến


Để lựa chọn một biến, bạn chỉ đơn giản nhắp chuột vào nó trong danh sách các
biến nguồn và nhắp núm mũi tên phải nằm bên cạnh danh sách các biến nguồn. Nếu
chỉ có một danh sách các biến nguồn, bạn có thể nhắp đúp các biến đơn để chuyển
chúng từ danh sách nguồn sang danh sách tới.
Bạn có thể chọn nhiều biến một lúc:
 Để chọn nhiều biến nằm kề nhau liên tục trong danh sách các biến nguồn, nhắp
vào biến đầu tiên và giữ phím Shift và nhắp vào biến cuối cùng.
 Để chọn các biến không nằm kề nhau liên tục (nằm cách quãng) trong danh
sách các biến nguồn, hãy sử dụng phương pháp nhắp+Ctrl. Chọn biến đầu tiên,
sau đó giữ phím Ctrl và nhắp biến tiếp theo, và cứ thế tiếp tục cho đến biến cuối
cùng.
 Để chọn mọi biến trong danh sách, nhấn Ctrl+A
Hình 1-7: Lựa chọn nhiều biến với kỹ thuật Shif t cùng với nhắp chuột

157
- 158 -

Hình 1-8: Chọn nhiều biến kế tiếp nhau với kỹ thuật Ctrl cùng với nhắp chuột

Để có được thông tin về một biến trong một danh sách trong một hộp thoại
 Nhắp chuột trái lên một biến trong một danh sách để chọn nó
 Nhắp chuột phải bất kể nơi nào trong danh sách
 Chọn Variable Information trong menu pop-up
Hình 1-9: Xem thông tin về biến dùng phím chuột phải

158
- 159 -

Bài 1. Mở Các tệp tin dữ liệu


1. Khởi động SPSS

Trên màn hình desktop của Widows nhắp vàop biểu tượng
Hoặc mở phím Start, All programs, SPSS for WIndows, SPSS 12.0.1 for Windows

Sẽ xuất hiện cửa sổ SPSS Data


Editor và một hộp thoại như sau:
 Run the tutorial: Chạy chương
trình trợ giúp
 Type in data: Nhập dữ liệu mới
 Run an existing query: Chạy một
truy vấn dữ liệu đã có sẵn
 Create new query using
Database Wizard: Lập một truy vấn
dữ liệu sử dụng Database Wizard

159
- 160 -

 Open an existing data source: Mở file dữ liệu đã có sẵn


(Chú ý: Hộp thoại này chỉ xuất hiện một lần khi bạn khởi động SPSS)
2. Mở một file
Nếu đã có sẵn một file dữ liệu, bạn có thể mở nó bằng lựa chọn  Open an
existing data source và nhăp vào More Files;
Nếu đang ở trong cửa sổ SPSS Data Editor:
Từ thanh menu chọn
File
Open
Data…
Trong hộp thoại Open File, chọn file mà bạn muốn mở
Nhắp Open
Bài 2: Cửa sổ Data Editor
Cửa sổ Data Editor cung cấp một phương pháp giống như bảng tính, thuận tiện để
lập và hiệu đính các file dữ liệu. Cửa sổ Data Editor tự động mở khi bạn bắt đầu khởi
động SPSS.
Cửa sổ Data Editor cung cấp hai loại bảng xem dữ liệu:
Data view. Thể hiện trị số dữ liệu thực hoặc các nhãn trị số được xác định
Variable view. Thể hiện các thông tin định nghĩa về biến, bao gồm các nhãn biến
và nhãn trị số biến được xác định, loại dữ liệu (ví dụ như dạng chuỗi, dạng ngày tháng,
và dạng số), thang đo (định danh, định hạng, hoặc tỷ lệ)
Trong cả hai bảng, bạn có thể bổ sung, và xoá các thông tin được lưu chứa trong
file dữ liệu.
1. Data View
Hình 5-1: Data view

160
- 161 -

Rất nhiều thuộc tính của Data View cũng giống như những gì được tìm thấy trong
các phần mềm sử dụng bảng tính, (ví dụ như Excel). Tuy nhiên cũng có một số sự
khác biệt quan trọng:
 Các hàng là các bản ghi/đối tượng/trường hợp {case}. Từng hàng địa diện cho
một đối tượng hoặc một quan sát. Ví dụ từng người trả lời đối với một bảng
hỏi/phiếu điều tra là một đối tượng.
 Các cột là các biến. Từng cột đại diện cho một biến hoặc thuộc tính được đo
đạc. Ví dụ từng mục trong một bảng hỏi là một biến.
 Các ô chứa các trị số. Từng ô chứa một trị số của một biến cho một đối tượng.
Ô là sự kết hợp của đối tượng và biến. Các ô chỉ chứa các trị số biến. Không
giống như các phần mềm sử dụng bảng tính, các ô trong Data Editor không thể
chứa đựng các công thức.
 File dữ liệu có hình chữ nhật. Hai hướng của file dữ liệu được xác định bởi số
lượng các đối tượng và số lượng các biến. Bạn có thể nhập dữ liệu trong bất kể
ô nào. Nếu bạn nhập dữ liệu vào một ô nằm bên ngoài các đường biên của file
dữ liệu được xác định, hình chữ nhật dữ liệu sẽ được mở rộng để bao gồm bất
kỳ mọi hàng và mọi cột nằm giữa ô đó và các đường biên của file. Không có
các ô “trống rỗng” trong các đường biên của file dữ liệu. Đối với các biến dạng
số, các ô rỗng được chuyển thành trị số khuyết thiếu hệ thống. Đối với các biến
dạng chuỗi, một dấu cách vẫn được coi là một trị số.
2. Variable View
Hình 5-2: Cửa sổ Variable View

161
- 162 -

Bảng Variable View chứa đựng các thông tin về các thuộc tính của từng biến trong
file dữ liệu. Trong một bảng Data view:
 Các hàng là các biến.
 Các cột là các thuộc tính của biến
Bạn có thể bổ sung hoặc xoá các biến và thay đổi thuộc tính của các biến, bao gồm:
 Tên biến {Name}
 Loại dữ liệu {Type}
 Số lượng con số hoặc chữ {With}
 Số lượng chữ số thập phân {Decimals}
 Mô tả biến/nhãn biến {Lable} và nhãn trị số biến {Values}
 Các trị số khuyết thiếu do người sử dụng thiết lập {Missing}
 Độ rộng của cột {Width}
 Căn lề {Align}
 Thang đo {Measure}
Để thể hiện hoặc định nghĩa các thuộc tính của biến
 Làm cho cửa sổ Data Editor trở thành cửa sổ hoạt động
 Nhắp đúp một tên biến ở đỉnh của cột trong bảng Data View, hoặc nhắp bảng
Variable View.
 Để định nghĩa một biến mới, nhập một tên biến trong bất kỳ hàng rỗng nào
 Chọn thuộc tính mà bạn muốn định nghĩa hoặc hiệu chỉnh.
3. Tên biến
Các qui tắc dưới đây được áp dụng cho tên biến:
 Tên phải bắt đầu bằng một chữ. Các ký tự còn lại có thể là bất kỳ chữ nào, bất
kỳ số nào, hoặc các biểu tượng như @, #, _, hoặc $.
 Tên biến không được kết thúc bằng một dấu chấm.
 Tránh dùng các tên biến mà kết thúc với một dấu gạch dưới cần (để tránh xung
đột với các biến được tự động lập bởi một vài thủ tục)
 Độ dài của tên biến không vượt quá 8 ký tự.
 Dấu cách và các ký tự đặc biệt (ví dụ như !, ?, ‘, và *) không được sử dụng

162
- 163 -

 Từng tên biến phải đơn chiếc/duy nhất; không được phép trùng lặp. Không
được dùng chữ hoa để đặt tên biến. Các tên NEWVAR, NewVar, và newvar
được xem là giống nhau.
4. Các thang đo
Bạn có thể xác định thang đo dưới dạng tỷ lệ (dữ liệu dạng số trên một thang đó
khoảng hoặc thang đo tỷ lệ), thứ bậc hoặc định danh. Dữ liệu định danh hoặc thứ bậc
có thể có dạng chuỗi (chữ a, b, c…) hoặc dạng số.
5. Loại biến
Variable Type xác định loại dữ liệu đối với từng biến. Theo mặc định, mọi biến
mới được giả sử là dạng số. Bạn sử dụng Define Variable để thay đổi loại dữ liệu. Nội
dung của hộp thoại Variable Type phụ thuộc vào loại dữ liệu đã được thu thập. Đối với
một số loại dữ liệu, có những ô cho độ rộng và số thập phân (Xem ví dụ Hình 5-4); đối
với loại khác bạn chỉ đơn giản chọn một định dạng từ một danh sách cuốn (xem ví dụ
hình 5.4b) các loại dữ liệu cho trước.
Hình 5-4: Hộp thoại Variable Type

Các loại dữ liệu là dạng số {numeric}, dấu phải {comma}, dấu chấm. {dot}, ghi
chú khoa học {Scientific notation}, ngày tháng {Date}, đô-la {Dollar}, tiền tuỳ biến
{custom currency} và chuỗi {string}.
Hình 5-4: Hộp thoại Variable Type với dạng dữ liệu là ngày tháng

Để định nghĩa loại dữ liệu


 Nhắp núm trong ô Type đối với biến bạn muốn định nghĩa
 Chọn loại dữ liệu trong hộp thoại Data Type.
6. Nhãn biến {Variable Labels}
Do tên biến chỉ có thể dài 8 ký tự, các nhãn biến có thể dài đến 256 ký tự, và
những nhãn mô tả này được thể hiện trong các kết xuất.
7. Nhãn trị số của biến {Value Labels}
Bạn có thể chỉ định các nhãn mô tả đối với từng trị số của biến. Điều này cực kỳ
hữu ích nếu dữ liệu của bạn sử dụng các mã dạng số để đại diện cho các nhóm/tổ
không phải dạng số (ví dụ mã 1 và 2 cho nam và nữ). Nhã trị số của biến có thể dài
163
- 164 -

đến 60 ký tự. Nhãn trị số của biến không có sẵn đối với các biến dạng chuỗi dài (các
biến dạng chuỗi dài hơn 8 ký tự).
Hình 5-5: Hộp thoại Value Labels

Để định nghĩa nhãn trị số của dữ liệu


 Nhắp núm trong ô Values đối với biến bạn muốn định nghĩa
 Đối với từng trị số, nhập trị số và nhập một nhãn
 Nhắp Add để nhập nhãn trị số.
8. Hiệu đính dữ liệu trong bảng Data View
Với Data Editor, bạn có thể hiệu đính trị số của dữ liệu trong bảng Data View theo
nhiều cách. Bạn có thể:
 Thay đổi trị số của dữ liệu
 Cắt, sao chép, và dán các trị số của dữ liệu
 Thêm vào hoặc xoá các đối tượng
 Thêm vào hoặc xoá các biến
 Thay đổi trật tự của các biến
Để thay thế hoặc hiệu đính một trị số của dữ liệu
Để xoá trị số cũ và nhập một trị số mới:
 Trong bảng Data View, nhắp đúp vào ô. Trị số được thể hiện trong khoang hiệu
đính dữ liệu.
 Hiệu đính trị số trực tiếp từ ô hoặc trong khoang hiệu đính dữ liệu.
 Nhấn Enter (hoặc chuyển sang ô khác) để ghi trị số mới.
9. Cắt, sao chép và dán các trị số của dữ liệu
Bạn có thể cắt, sao chép và dán các trị số của từng ô hoặc một nhóm các trị số
trong Data Editor. Bạn có thể:
 Chuyển hoặc sao chép trị số của một ô sang một ô khác.
 Chuyển hoặc sao chép trị số của một ô sang một nhóm các ô.
 Chuyển hoặc sao chép trị số của một đối tượng sang cho một nhóm các đối
tượng.
 Chuyển hoặc sao chép trị số của một biến sang cho một nhóm các biến.
 Chuyển hoặc sao chép trị số của một nhóm các ô sang cho một nhóm các ô
khác.
10. Chèn thêm các đối tượng mới
Nhập dữ liệu vào một ô trong một hàng rỗng sẽ tự động tạo ra một đối tượng mới.
Data Editor sẽ chèn các trị số khuyết thiếu đối với mọi biến khác cho đối tượng đó.
Nếu có bất kể hàng rỗng nào nằm giữa đối tượng mới và các đối tượng đã có sẵn, các

164
- 165 -

hàng rỗng đó cũng trở thành các đối tượng mới với các trị số khuyết thiếu hệ thống đối
với mọi biến.
Bạn có thể chèn các đối tượng mới vào giữa các đối tượng đã có sẵn.
Để chèn một đối tượng mới giữa các đối tượng đã có sẵn
 Trong Data View, chọn bất kỳ ô nào trong đối tượng (hàng) nằm dưới vị trí nơi
mà bạn muốn chèn đối tượng mới.
 Từ thanh menu chọn
Data
Insert Case
Một hàng mới được chèn vào và mọi mọi biến của đối tượng mới này đều nhận
được trị số khuyết thiếu hệ thống.
11. Chèn một biến mới
Nhập dữ liệu vào một cột rỗng trong bảng Data View hoặc trong một hàng rỗng
trong bảng Variable View sẽ tự động tạo ra một biến mới với một tên biến mặc định
(tiền tố var và một chuỗi số tuần tự) và một định dạng dữ liệu mặc định (dạng số).
Data Editor chèn trị số khuyết thiếu hệ thống cho mọi đối tượng đối với biến mới này.
Nếu có bất kỳ cột rỗng nào trong bảng Data View hoặc hàng rỗng nào trong bảng
Variable View giữa biến mới và các biến đã có sẵn, thì những cột này (trong bảng
Data View) hoặc hàng này (trong bảng Variable View) cũng trở thành biến mới với trị
số khuyết thiếu hệ thống cho mọi đối tượng.
Để chèn một biến mới giữa các biến đã có sẵn
 Chọn bất kỳ ô nào trong biến bên phải của (bảng Data View) hoặc dưới (của
bảng Variable View) vị trí mà bạn muốn chèn biến mới vào.
 Từ thanh menu chọn
Data
Insert Variable
Một hàng mới được chèn vào với trị số khuyết thiếu hệ thống cho mọi đối tượng.
Để chuyển một biến trong Data Editor
Nếu bạn muốn đặt vị trí biến giữa hai biến đã có sẵn, hãy chèn một biến vào vị trí
nơi bạn muốn di chuyển biến đến đó
 Đối với biến bạn muốn chuyển, nhắp tên biến ở đỉnh của cột trong bảng Data
View hoặc số hàng trong bảng Variable View. Toàn bộ biến sẽ được làm nổi
bật/tô sáng.
 Từ thanh menu chọn
Edit
Cut
 Nhắp vào tên biến (trong bảng Data View) hoặc số hàng (trong bảng Variable
View) nơi bạn muốn di chuyển biến đến. Toàn bộ biến này sẽ được mà nổi bật
 Từ thanh menu chọn
Edit
Paste
12. Tình trạng lọc đối tượng trong Data Editor
Hình 5-9: Các đối tượng được lọc trong Data Editor

165
- 166 -

Nếu bạn chọn một tập hợp phụ các đối tượng nhưng không loại bỏ những đối
tượng không được chọn, những đối tượng không được chọn được đánh dấu trong Data
Editor với một đoạn thẳng nằm chéo trong các ô số hàng.
Bài 3: Các phép biến đổi dữ liệu
Bạn có thể thực hiện các phép biến đổi từ những nhiệm vụ đơn giản, chẳng hạn
như thu nhỏ số nhóm/tổ để tiến hành phân tích, hoặc phức tạp hơn như tạo các biến
mới dựa trên các phương trình phức tạp và các câu lệnh/khai báo có điều kiện
1. Tính toán biến {Compute Variable}
Thủ tục Compute Variable tính toán các trị số của một biến được dựa trên sự biến
đổi của một biến khác
 Bạn có thể tính các trị số cho các biến dạng số hoặc dạng chuỗi (các ký tự chuỗi
có dạng số)
 Bạn có thể lập các biến mới hoặc thay thế các trị số của biến đã có. Đối với biến
mới, bạn cũng có thể chỉ định loại biến và nhãn biến.
 Bạn có thể tính toán các trị số một cách có chọn lọc đối với các tập hợp con của
dữ liệu dựa trên các điều kiện lô-gic.
Để tính toán biến
 Từ thanh menu chọn
Transform
Compute…
 Đánh tên của biến đích {target variable}. Nó có thể là một biến đã có hoặc một
biến mới sẽ được bổ sung vào file dữ liệu làm việc.
 Xây dựng một biểu thức, hoặc dán các bộ phận vào Numeric Expression hoặc
gõ trực tiếp vào đó.
 Dán các hàm từ danh sách các hàm {Functions} và nhập các tham số được
biểu thị bằng các dấu hỏi
 Các hằng số dạng chuỗi phải được để trong dấu mở đóng ngoặc đơn hoặc
ngoặc kép
 Các hằng số dạng số phải được nhập theo định dạng kiểu Hoa Kỳ với dấu
chấm (.) là dấu thập phân.
Hình 6-1: Hộp thoại Compute Variable

166
- 167 -

2. Tính toán biến với tuỳ chọn If Cases


Hộp thoại If Cases cho phép bạn áp dụng phép chuyển đổi dữ liệu đối với các
nhóm các đối tượng được chọn lọc, có sử dụng các biểu thức điều kiện. Một biểu thức
điều kiện trả lại một trị số đúng hay sai hoặc khuyết thiếu cho từng đối tượng.
 Nếu kết quả của một biểu thức điều kiện là true {đúng}, phép biến đổi được áp
dụng cho đối tượng
 Nếu kết quả của một biểu thức điều kiện là false {sai} hoặc missing {khuyết
thiếu}, phép biến đổi không được áp dụng cho đối tượng
 Hầu hết các biểu thức điều kiện sử dụng một hoặc một số trong 6 dấu quan hệ
(<, >, <= (nhỏ hơn và bằng), >= (bằng và lớn hơn), = và ~= (khác)) trên bảng
tính toán.
 Các biểu thức điều kiện có thể bao hàm các tên biến, các hằng số, các phép toán
số học, các hàm số và hàm khác.
3. Mã hoá lại dữ liệu
Bạn có thể biến đổi trị số dữ liệu bằng cách mã hoá lại chúng
4. Mã hoá thành biến khác
Thủ tục Recode into Different Variables gán lại các trị số của các biến có sẵn hoặc
các phạm vi của các trị số có sẵn vào các trị số mới của một biến mới. Ví dụ bạn có thể
mã hoá lương năm của đối tượng điều tra vào một biến mới có các trị số là lương năm
nhưng chia theo khoảng.
 Bạn có thể mã hoá các biến dạng số và dạng chuỗi
 Bạn có thể mã hoá các biến dạng số sang dạng chuỗi và ngược lại
 Nếu bạn chọn nhiều biến, chúng phải có cùng loại biến. Bạn không thể cùng
một lúc mã hoá lại cả biến dạng số lẫn biến dạng chuỗi được.
Hình 6-9: Hộp thoại Recode into Different Variables

167
- 168 -

Để mã hoá lại dữ liệu sang biến mới


 Từ thanh menu chọn
Transform
Recode
Into Different Variables...
 Chọn các biến mà bạn muốn mã hoá, Nếu bạn chọn nhiều biến, chúng phải có
cùng dạng (chuỗi hoặc số)
 Nhập một tên biến mới cho từng biến và nhắp Change.
 Nhắp Old and New Values và định rõ cách mã hoá lại trị số.
Một cách tuỳ chọn, bạn có thể chọn một nhóm các đối tượng để mã hoá
Hộp thoại Recode into Same Values: Old and NewValues
Bạn có thể xác định các trị số để mã hoá trong hộp thoại này. Mọi chỉ định về trị số
phải cùng loại dữ liệu (dạng số hay dạng chuỗi) giống như của các biến đã được chọn
trong hộp thoại chính.
Old Value. Trị số (hoặc các trị số) bị mã hoá. Bạn có thể mã hoá các trị số đơn,
một phạm vi các trị số và các trị số khuyết thiếu. Các trị số khuyết thiếu hệ thống và
các phạm vi không thể được chọn đối với các biến dạng chuỗi bởi vì không có khái
niệm nào áp dụng cho các biến dạng chuỗi. Các phạm vi bao gồm các điểm cuối của
chúng và mọi trị số khuyết thiếu của người sử dụng nằm trong phạm vi này.
New Value. Trị số đơn mà trong nó từng trị số cũ hoặc phạm vi của các trị số được
mã hoá. Bạn có thể nhập một trị số hoặc chỉ định trị số khuyết thiếu hệ thống.
Old->New. Danh sách các trị số sẽ được sử dụng để mã hoá biến (hoặc các biến).
Bạn có thể bổ sung, thay đổi hoặc loại bỏ các trị số này ra khỏi danh sách. Danh sách
được tự động sắp xếp, dựa trên các trị số cũ, sử dụng trật tự sau: các trị số đơn, các trị
số khuyết thiếu, các phạm vi và mọi trị số khác. Nếu bạn thay đổi một trị số trong danh
sách, thủ tục sẽ tự động sắp xếp lại danh sách, nếu cần thiết, để duy trì trật tự này.
Hình 6-10: Hộp thoại Old and New Values

168
- 169 -

Bài 4: Điều khiển file và biến đổi file


1. Sắp xếp các đối tượng
Hộp thoại này sắp xếp các đối tượng (các hàng) của file dữ liệu dựa vào các trị số
của một hoặc một số biến sắp xếp. Bạn cửa sổ thể sắp xếp các đối tượng theo trật tự
tăng dần hoặc giảm dần.
 Nếu bạn chọn nhiều biến sắp xếp, các đối tượng được sắp xếp theo từng biến
trong vòng từng nhóm của biến đứng trước trong danh sách Short by. Ví dụ nếu
bạn chọn biến gender {giới tính} là biến sắp xếp thứ nhất và minority {thiểu
số}là biến sắp xếp thứ hai, các đối tượng sẽ được sắp xếp theo phân loại thiểu
số trong từng loại giới tính.
 Đối với các biến, các chữ in đứng trước các chữ thường giống nó trong trật tự
sắp xếp.
Hình 7-1: Hộp thoại Sort Cases

Để sắp xếp các đối tượng


Từ thanh menu chọn
Data
Sort Cases ...
Chọn một hoặc một số biến sắp xếp.
2. Chọn các đối tượng {Select Cases}
Thủ tục Select Cases cung cấp một số phương pháp khác nhau để chọn một nhóm
các đối tượng dựa vào các tiêu chí bao gồm các biến và các biểu thức phức. Bạn cũng
có thể chọn một mẫu ngẫu nhiên các đối tượng.

169
- 170 -

selected Cases. Bạn có thể lọc hoặc xoá bỏ các đối tượng không đáp ứng tiêu
chuẩn lựa chọn. Các đối tượng được lọc vẫn duy trì trong file dữ liệu nhưng bị loại ra
khỏi phép phân tích. Thủ tục Select Cases tạo ra một biến lọc, filter_$, để chỉ rõ tình
trạng lọc. Các đối tượng được chọn có trị số 1; các đối tượng không được chọn (bị lọc)
có trị số 0. Các đối tượng bị lọc cũng được đánh dấu bằng một dấu gạch chéo qua số
hàng trong cửa sổ Data Editor. Để đóng tình trạng lọc và bao gồm mọi đối tượng trong
phép phân tích của ban, hãy chọn All Cases.
Các đối tượng bị xoá bỏ bị loại ra khỏi file dữ liệu và không thể phục hồi lại được
nếu bạn lưu file dữ liệu sau khi xoá bỏ các đối tượng.
Hình 7-9: Hộp thoại Select Cases

Để chọn một nhóm các đối tượng


 Từ thanh menu chọn:
Data
Select Cases...
 Chọn một trong những phương pháp lựa chọn các đối tượng.
 Định rõ các tiêu chí chọn các đối tượng.
3. Select Cases: If
Hộp thoại này cho phép bạn chọn các nhóm đối tượng có sử dụng các biểu thức
điều kiện. Một biểu thức điều kiện trả lại một trị số true {đúng}, false {sai}, hoặc
missing {khuyết thiếu} cho từng đối tượng.
Hình 7-10: Hộp thoại Select Cases: If

170
- 171 -

 Nếu kết quả của một biểu thức điều kiện là true, đối tượng sẽ được chọn
 Nếu kết quả của một biểu thức điều kiện là false hoặc missing, đối tượng sẽ
không được chọn
 Hầu hết các biểu thức điều kiện sử dụng một hoặc một vài trong số 6 phép tính
điều kiện (<, >, =, <=, >=, và ~=) trên bảng tính toán.
 Các biểu thức điều kiện có thể bao gồm các tên biến, hằng số, các phép tính số
học, các hàm số và các hàm khác, các biến lô-gic, và các phép tính điều kiện.
4. Select Cases: Random Sample
Hộp thoại này cho phép bạn chọn một mẫu ngẫu nhiên dự trên một tỷ lệ thích hợp
hoặc một lượng chính xác các đối tượng.
Approximately. Tạo ra một mẫu ngẫu nhiên các các đối tượng gần đúng với một
tỷ lệ được xác định trước. Do cách làm này tạo ra một quyết định ngẫu nhiêu giả định
độc lập cho từng đối tượng, tỷ lệ các đối tượng được chọn chỉ có thể gần đúng với tỷ lệ
được xác định trước. Càng có nhiều đối tượng trong file dữ liệu, tỷ lệ các đối tượng
được chọn càng gần đúng với tỷ lệ được xác định trước.
Exactly. Một số lượng đối tượng được xác định bởi người sử dụng. Bạn cũng phải
chỉ rõ số các đối tượng để từ đó tạo ra mẫu. Con số thứ hai cần phải nhỏ hơn hoặc
bằng tổng số đối tượng có trong file dữ liệu. Nếu con số này vượt quá tổng số đối
tượng có trong file dữ liệu, mẫu sẽ bao gồm một cách tỷ lệ ít đối tượng hơn con số yêu
cầu.
Hình 7-11: Hộp thoại Select Cases: Random Sample

5. Select Cases: Range


Hộp thoại này chọn các đối tượng dự vào một phạm vi số đối tượng hoặc một
phạm vi các ngày hoặc thời gian
171
- 172 -

 Các phạm vi đối tượng được dựa vào số hàng được thể hiện trong cửa sổ Data
Editor
 Các phạm vi ngày tháng hoặc thời gian chỉ có sẵn đối với dữ liệu chuỗi thời
gian {time series data} với các biến ngày tháng được xác định (menu Data,
Define Data).
Hình 7-12: Hộp thoại Select Cases: Range đối với phạm vi các đối tượng (không
có các biến ngày tháng được định nghĩa)

Bài 5: Lập bảng tần số và tính toáncác đại lượng thống kê


1. Lập bảng tần số
Bảng tần số có thể được thực hiện với tất cả các biến kiểu số (định tính và định
lượng). Trong trường hợp biến định lượng liên tục có quá nhiều giá trị, bảng tần số sẽ
rất dài, chúng ta có thể phân tổ (bằng lệnh recode, sẽ được trình bày trong phần sau)
trước khi lập bảng tần số.
Sau khi mở file data thưc hành, vào menu Analyze>Descriptive
statistics>Frequencies… Hộp thoại Frequencies xuất hiện:
BẢNG

172
- 173 -

Chọn biến muốn lập bảng tần số (nhấp chuột vào tên biến). Ví dụ ta lần lượt chọn
hai biến bactho (bậc thợ) và tuoinghe (tuổi nghề) rồi bấm phím mũi tên qua phải để
đưa biến đang chọn vào ô variable

Sau đó nhấn nút Ok, ta được 2 bảng tần số kết quả cho 2 biến đã chọn như sau:
Statistics

tuoi
bac tho nghe
N Valid 50 50
Missin
0 0
g

Dòng Valid cho biết số quan sát hợp lệ (số người có trả lời)
Dòng Mising cho biết số quan sát bị thiếu dữ liệu (số người không trả lời)
Trong 2 bảng tần số bên dưới , mỗi bảng có 4 cột số liệu:
Cột Frequency: tần số
Cột Percent: tần suất/ phần trăm
Cột Valid percent : phần trăm hợp lệ, tính trên số quan sát có thông tin trả lời. Sử
dụng khi có Missing value
Cột Cumulative percent : phần trăm tích lũy, cộng dồn các phần trăm hợp lệ.
bac tho

Frequen Valid Cumulativ


cy Percent Percent e Percent
Vali 2 13 26,0 26,0 26,0
d 3 24 48,0 48,0 74,0
4 13 26,0 26,0 100,0
Tota
50 100,0 100,0
l

tuoi nghe
173
- 174 -

Frequen Valid Cumulativ


cy Percent Percent e Percent
Vali 2 11 22,0 22,0 22,0
d 3 11 22,0 22,0 44,0
4 10 20,0 20,0 64,0
5 6 12,0 12,0 76,0
6 4 8,0 8,0 84,0
7 2 4,0 4,0 88,0
8 3 6,0 6,0 94,0
9 1 2,0 2,0 96,0
10 2 4,0 4,0 100,0
Tota
50 100,0 100,0
l

2. Các đại lượng thống kê mô tả


Các đại lượng thống kê mô tả chỉ được tính đối với các biến định lượng. Nếu ta
tính các đại lượng này đối với các biến định tính thì các kết quả sẽ không có ý nghĩa.
Vào menu Analyze>Descriptive Statistics> Descriptive… hộp thoại sau sẽ xuất
hiện:

3. Chọn một (hay nhiều biến định lượng) trong danh sách biến ở phía bên trái hộp
thoại bằng cách nhấp chuột vào biến đó. Sau đó nhấp vào mũi tên qua phải để
đưa các biến này vào ô Variable
174
- 175 -

4. Bấm vào nút Option… và hộp thoại kế tiếp sẽ xuất hiện:

Hộp thoại này cho phép chọn các đại lượng thống kê cần tính để mô tả các biến đã
chọn ở phần trước bằng cách nhấp chuột vào các ô vuông cần thiết. Các đại lượng
thống kê mô tả thường dùng là:
o Mean: Trung bình cộng
o Sum: tổng cộng (sử dụng khi điều tra toàn bộ)
o Std. Deviation: độ lẹch chuẩn
o Minimum: giá trị nhỏ nhất
o Maximum: giá trị lớn nhất
o SE mean: sai số chuẩn khi ước lượng trung bình tổng thể.
Sau đó bấm vào nút Continue để trở lại hộp thoại trước, rồi nhấn nút Ok. Bảng kết
quả sau sẽ xuất hiện:
Descriptive Statistics

Minimu Maximu Std.


N m m Mean Deviation
nng suat lao
50 2,0 7,9 5,000 1,3398
dong
Valid N
50
(listwise)

Để vẽ biểu đồ tần số, bấm vào nút Charts…hộp thoại dưới đây sẽ xuất hiện:

Trong hộp thoại charts này, nhấp chuột vào các ô để lựa chọn loại biểu đồ cần vẽ.
Có thể chọn 1 trong 3 loại biểu đồ sau:
4. Bar: biểu đồ dạng thanh (dùng cho biến có các giá trị rời rạc

175
- 176 -

5. Pie: biểu đồ hình tròn


6. Histograms: biểu đồ phân phối tần số (dùng cho biến có các giá trị liên tục)
Sau khi chọn loại biểu đồ, nhấp chuột vào nút Continue để trở về hộp thoại
Frequencies, và nhấp ok, kết quả hiện ra như sau
tuoi nghe

Cumulati
Frequen Valid ve
cy Percent Percent Percent
Vali 2 11 22,0 22,0 22,0
d 3 11 22,0 22,0 44,0
4 10 20,0 20,0 64,0
5 6 12,0 12,0 76,0
6 4 8,0 8,0 84,0
7 2 4,0 4,0 88,0
8 3 6,0 6,0 94,0
9 1 2,0 2,0 96,0
10 2 4,0 4,0 100,0
Tota
50 100,0 100,0
l

tuoi nghe

25

20
Percent

15

10

3. Lập bảng tổng hợp nhiều0


biến
Bảng 2 biến định tính: 2 3 4 5 6 7 8 9 10

Để lập bảng 2 biến định tính ta vào Custom tables như sau:
tuoi nghe

176
- 177 -

Colums: ô chứa biến cột, tạo nên các cột của bảng
Row: ô chứa biến dòng, tạo nên các dòng của bảng.
Summary statistic: chọn hàm để tính các đại lượng thống kê cần thiết. Đối với biến
định tính, hàm thường dùng là: count (tần số), row%(phần trăm theo dòng), col%
(phần trăm theo cột).
Categories and totals: tính dòng cộng và cột cộng
Nhấp chuột vào biến cần chọn, kéo vào ô cột và ô dòng. Chọn các hàm thống kê, ví
dụ chọn hàm count và hàm col%, kết quả như sau:
bac tho
2 3 4
Column N Column N Column N
Count % Count % Count %
tuoi 2-4 12 92,3% 16 66,7% 4 30,8%
nghe 5-7 1 7,7% 7 29,2% 4 30,8%
to 8-10 0 ,0% 1 4,2% 5 38,5%
Kích chuột vào Totals, kết quả xuất hiện như sau:
bac tho
2 3 4 Total

177
- 178 -

Count % Count % Count % Count %


tuoi 2-4 12 92,3% 16 66,7% 4 30,8% 32 64,0%
nghe 5-7 1 7,7% 7 29,2% 4 30,8% 12 24,0%
to 8-10 0 ,0% 1 4,2% 5 38,5% 6 12,0%
Tota
13 100,0% 24 100,0% 13 100,0% 50 100,0%
l

7. Hồi quy tuyến tính


Thủ tục hồi quy tuyến tính có tới 5 phương pháp xây dựng phương trình: đưa vào
dần, rút ra dần, lựa chọn từng bước, đưa vào một lượt, rút ra một lượt. SPSS có thể
thực hiện nhiều phân tích phần dư để giúp chúng ta tìm ra các điểm dữ liệu có tác động
ảnh hưởng lớn, và các vi phạm các giả thiết của mô hình. Chúng ta có thể lưu lại các
giá trị dự đoán (giá trị lý thuyết theo mô hình), các phần dư, các thông số có liên quan
khác.
Để thực hiện một phân tích hồi quy tuyến tính chọn: Analyze> Regression> Linear
như trong hình sau:

Lệnh này sẽ mở hộp thoại hồi quy tuyến tính như trong hình sau

Các biến số trong file dữ liệu của chúng ta sẽ xuất hiện trong ô danh sách biến
nguồn bên tay trái. Chúng ta hãy chọn một biến phụ thuộc đưa vào ô Dependentbvaf
một khối gồm một hay nhiều hơn một biến độc lập đưa vào ô Independent. Sau đó hãy

178
- 179 -

nhấp chuột vào nút Ok để SPSS thực hiện phân tích hồi quy tuyến tính mặc định sử
dụng phương pháp đưa các biến vào bắt buộc.
Chúng ta có thể nhấp chuột vào các nút bên dưới để chọn các nội dung sau:
Method: chọn các phương pháp khác nhau để xây dựng mô hình hồi quy
Statistics: các thông số thống kê hồi quy tuyến tính
Ví dụ xây dựng phương trình hồi quy tuyến tính với biến phụ thuộc là năng suất lao
động, biến độc lập là bậc thợ, két quả như sau:
Descriptive Statistics

Std.
Mean Deviation N
nng suat lao
5,000 1,3398 50
dong
bac tho 3,00 ,728 50

Correlations

nng suat
lao
dong bac tho
Pearson nng suat lao
1,000 ,360
Correlation dong
bac tho ,360 1,000
Sig. (1-tailed) nng suat lao
. ,005
dong
bac tho ,005 .
N nng suat lao
50 50
dong
bac tho 50 50

Variables Entered/Removed(b)

Variable
s
Mod Variable Remove
el s Entered d Method
1 bac
. Enter
tho(a)
a All requested variables entered.
b Dependent Variable: nng suat lao dong

Model Summary

Mod R R Adjusted Std. Error


179
- 180 -

el Square R of the
Square Estimate
1 ,360(a) ,129 ,111 1,2631
a Predictors: (Constant), bac tho

ANOVA(b)

Mod Sum of Mean


el Squares df Square F Sig.
1 Regressio
11,378 1 11,378 7,132 ,010(a)
n
Residual 76,582 48 1,595
Total 87,960 49
a Predictors: (Constant), bac tho
b Dependent Variable: nng suat lao dong

Coefficients(a)

Standardize
d
Unstandardized Coefficient
Coefficients s t Sig.
Mod Std. Std.
el B Error Beta B Error
1 (Constan
3,015 ,764 3,945 ,000
t)
bac tho ,662 ,248 ,360 2,671 ,010

a Dependent Variable: nng suat lao dong


8. Phân tích dữ liệu định tính
Kiểm định Chi-square: được sử dụng để kiểm định xem có tồn tại mối quan hệ giữa
2 yếu tố đang nghiên cứu trong tổng thể hay không. Kiểm định này còn gọi là kiểm
định tính độc lập. Kiểm định này phù hợp khi 2 yếu tố này là biến định tính hay biến
định lượng rời rạc có ít giá trị
Cơ sở lý thuyết: Giả thiết Ho: 2 biến độc lập với nhau
Giả thiết H1: 2 biến có liên hệ với nhau
Ví dụ: Nghiên cứu mối liên hệ giữa tuổi nghề và nsld. Ta lập bảng chéo để tìm hiểu
mối quan hệ này
Từ menu chọn Analyze/Descriptive statistics/Crosstabs. Hộp thoại xuất hiện:

180
- 181 -

Trong hộp thoại này đưa biến NSLD tô vào ô cột và biến Tnghe to vào ô dòng/ OK
được bảng kết quả:
tuoi nghe to * nang suat to Crosstabulation

Count
nang suat to Total
2-3,9 4-5,9 6-7,9 2-3,9
tuoi 2-4 9 18 5 32
nghe 5-7 0 8 4 12
to 8-10 1 2 3 6
Total 10 28 12 50

Trong bảng kết quả có vẽ như tuổi nghề càng cao thì nsld càng cao. Để kiểm định
giả thuyết này ta đặt giả thiết: Ho: NSLD không có liên hệ với tuổi nghề
Từ hộp thoại Crosstabs, nhấn nút Statistics, hộp thoại xuất hiện:

Đánh dấu chọn Chi-square, nhấn continue để về hộp thoại trước. OK kết quả sẽ
hiện ra sau:

tuoi nghe to * nang suat to Crosstabulation

Count
nang suat to Total
2-3,9 4-5,9 6-7,9 2-3,9
tuoi 2-4 9 18 5 32
nghe 5-7 0 8 4 12
181
- 182 -

to 8-10 1 2 3 6
Total 10 28 12 50

Chi-Square Tests

Asymp.
Sig. (2-
Value df sided)
Pearson Chi-
7,345(a) 4 ,119
Square
Likelihood Ratio 9,387 4 ,052
N of Valid Cases 50
a 5 cells (55,6%) have expected count less than 5. The minimum expected count is
1,20.

Trong ví dụ này, sig.=0,119>0,05, ta chưa có cơ sở để bác bỏ giả thiết Ho. Ta chưa
có đủ bằng chứng để nói rằng tuổi nghề có liên hệ với năng suất lao động.
Kiểm định trong trường hợp dữ liệu thứ tự
Trong trường hợp 2 yếu tố nghiên cứu là 2 biến thu thập từ thang đo thứ bậc, thay
vì dùng đại lượng chi square, chúng ta có thể dùng 1 trong các đại lượng: tau cuuar
kendall, d của Somer, gama của Gôdman và Kruskal. Các đại lượng này giúp phát
hiện ra mối liên hệ tốt hơn chi square
Trở lại ví dụ trước, Giả thiết Ho: NSLD không có liên hệ với tuổi nghề.
Để kiểm định giả thiết này, mở lại hộp thoại Crosstabs, chọn statistics, chọn các đại
lượng kiểm định như hình dưới

Kết quả kiểm định xuất hiện:


Chi-Square Tests

Asymp.
Sig. (2-
Value df sided)
Pearson Chi-
7,345(a) 4 ,119
Square
Likelihood Ratio 9,387 4 ,052
N of Valid Cases 50

182
- 183 -

a 5 cells (55,6%) have expected count less than 5. The minimum expected count is
1,20.

Directional Measures

Asymp.
Std. Approx. Approx.
Value Error(a) T(b) Sig.
Ordinal by Somers' Symmetric ,303 ,123 2,375 ,018
Ordinal d to
,285 ,116 2,375 ,018
Dependent
to1
,324 ,134 2,375 ,018
Dependent
a Not assuming the null hypothesis.
b Using the asymptotic standard error assuming the null hypothesis.

Symmetric Measures

Asymp.
Std. Approx. Approx.
Value Error(a) T(b) Sig.
Ordinal by Kendall's tau-
,304 ,123 2,375 ,018
Ordinal b
Kendall's tau-
,252 ,106 2,375 ,018
c
Gamma ,530 ,200 2,375 ,018
N of Valid Cases 50
a Not assuming the null hypothesis.
b Using the asymptotic standard error assuming the null hypothesis.

Trong bảng kết quả, nếu sử dụng chi square thì chưa thể bác bỏ giả thiết Ho, nhưng
nếu dùng d, tau, gama thì có thể kết luận rằng có bằng chứng thống kê cho thấy
NSLD có liên quan đến tuổi nghề vì sig. = 0,018<0,05.

183
- 184 -

MỤC LỤC
PHẦN I: NGUYÊN LÝ THỐNG KÊ .............................................................................1
CHƯƠNG I. NHỮNG VẤN ĐỀ CHUNG VỀ THỐNG KÊ HỌC ................................1
I. Nội dung 1: Lịch sử ra đời và quá trình phát triển của thống kê học ....................... 1
II. Nội dung 2: Đối tượng nghiên cứu của thống kê học: ............................................ 1
III. Nội dung 3: Quy luật số lớn và tính quy luật thống kê: ........................................ 2
IV. Nội dung 4: Một số khái niệm thường dùng trong thống kê học .......................... 3
V. Nội dung 5: Quá trình nghiên cứu thống kê: bao gồm 3 giai đoạn: ....................... 6
1. Điều tra thống kê: .................................................................................................6
2. Tổng hợp thống kê: ..............................................................................................9
3. Phân tích thống kê và dự đoán thống kê: ...........................................................12
CHƯƠNG II: PHÂN TỔ THỐNG KÊ .........................................................................15
I. Nội dung 1: Khái niệm, ý nghĩa, nhiệm vụ của phân tổ thống kê: ......................... 15
II. Nội dung 2: Các loại phân tổ thống kê: căn cứ vào nhiệm vụ của phân tổ ta chia
thành các loại sau: ...................................................................................................... 16
1. Phân tổ phân loại: ...............................................................................................16
2. Phân tổ kết cấu: ..................................................................................................17
3. Phân tổ liên hệ: ...................................................................................................17
III.Nội dung 3:Những vấn đề cần giải quyết khi tiến hành phân tổ thống kê: .......... 19
1. Chọn tiêu thức phân tổ: ......................................................................................19
2. Xác định số tổ và khoảng cách tổ: .....................................................................20
3. Xác định các chỉ tiêu giải thích ..........................................................................22
IV. Nội dung 4: Dãy số phân phối: ............................................................................ 22
1. Định nghĩa: .........................................................................................................22
2. Ý nghĩa: ..............................................................................................................22
3. Các loại dãy số phân phối: .................................................................................23
CHƯƠNG III: CÁC MỨC ĐỘ CỦA HIỆN TƯỢNG KINH TẾ - XÃ HỘI ................37
I. Nội dung 1: Số tuyệt đối:........................................ Error! Bookmark not defined.
1. Khái niệm, đặc điểm và ý nghĩa số tuyệt đối trong thống kê .............................37
2. Các loại số tuyệt đối trong thống kê; .................................................................38
3. Đơn vị tính của STĐ trong thống kê: .............................................................39
II. Nội dung 2: Số tương đối trong thống kê ............................................................. 39
1. Khái niệm, đặc điểm, ý nghĩa của số tương đối trong thống kê: .......................39
2. Các loại số tương đối trong thống kê: ................................................................40
3. Hình thức biểu hiện số tương đối: ......................................................................42
4. Điều kiện chung để vận dụng số tuyệt đối và số tương đối một cách khoa học
và chính xác............................................................................................................42
III. Nội dung 3: Số bình quân trong thống kê: ........................................................... 43
1. Khái niệm, đặc điểm, ý nghĩa của SBQ: ............................................................43
2. Các loại SBQ: .....................................................................................................44
4. Số mod: ..............................................................................................................49
5. Số trung vị : ........................................................................................................51
6. Điều kiện vận dụng số bình quân: ......................................................................52
IV. Nội dung 4: Các chỉ tiêu đánh giá độ biến thiên tiêu thức (các đặc trưng đo
lường độ phân tán) ..................................................................................................... 53

184
- 185 -

1. Ý nghĩa của các chỉ tiêu đánh giá độ biến thiên tiêu thức .................................54
2. Các chỉ tiêu đánh giá độ biến thiên tiêu thức: ....................................................54
3. Phương sai của tiêu thức thay phiên: .................................................................55
4. Quy tắc cộng phương sai:...................................................................................56
CHƯƠNG IV: DÃY SỐ THỜI GIAN .....................................................................79
I. Nội dung 1: Khái niệm, đặc điểm và ý nghĩa của dãy số thời gian: ....................... 80
II. Nội dung 2: Các loại dãy số thời gian: .................................................................. 80
1. Dãy số thời điểm: ...............................................................................................80
2. Dãy số thời kỳ: ...................................................................................................80
III. Nội dung 3: Các chỉ tiêu phân tích dãy số thời gian: ........................................... 81
1. Mức độ trung bình theo thời gian: .....................................................................81
2. Lượng tăng giảm tuyệt đối: ................................................................................82
2. Tốc độ phát triển: ...............................................................................................84
3. Tốc độ tăng hoặc giảm: ......................................................................................85
4. Giá trị tuyệt đối của 1 % tăng giảm: ..................................................................85
IV. Nội dung 4: Các phương pháp biểu hiện xu hướng phát triển cơ bản của hiện
tượng: ......................................................................................................................... 86
1. Phương pháp mở rộng khoảng cách thời gian: ..................................................86
2. Phương pháp số trung bình trượt: ......................................................................87
3. Phương pháp hồi quy: (phương pháp thể hiện xu hướng bằng hàm số) (phương
pháp hàm xu thế) ....................................................................................................88
4. Phương pháp biểu hiện biến động thời vụ: ........................................................90
V. Nội dung 5: Phương pháp dự đoán thống kê ........................................................ 92
1. Dự đoán dựa vào tốc độ phát triển trung bình: ..................................................92
2. Ngoại suy hàm xu thế:........................................................................................92
3. Dự đoán dựa vào lượng tăng giảm tuyệt đối bình quân .....................................92
CHƯƠNG V: CHỈ SỐ .................................................................................................104
I. Nội dung 1: Khái niệm, đặc điểm, ý nghĩa về chỉ số: .......................................... 104
1. Khái niệm: ........................................................................................................104
2. Ý nghĩa: ............................................................................................................105
3. Đặc điểm: .........................................................................................................105
II. Nội dung 2: Phân loại chỉ số: .............................................................................. 105
1. Căn cứ theo phạm vi tính toán chia hai loại:....................................................105
2. Theo tính chất của chỉ tiêu nghiên cứu: ...........................................................105
III. Nội dung 3: Phương pháp tính chỉ số: ............................................................... 106
1. Chỉ số đơn: (chỉ số cá thể) (tính cho từng mặt hàng) .......................................106
2. Chỉ số tổng hợp: (chỉ số chung) (I) ..................................................................106
IV. Nội dung 4: Hệ thống chỉ số: ............................................................................. 114
1. Khái niệm và tác dụng: ....................................................................................114
2. Các trường hợp hình thành hệ thống chỉ số: ....................................................115
V. Nội dung 5: Vận dụng phương pháp chỉ số để nghiên cứu sự biến động của chỉ
tiêu bình quân và tổng lượng biến tiêu thức ............................................................ 117
1. Phân tích chỉ tiêu bình quân: ............................................................................117
2. Phân tích sự biến động của tổng lượng biến tiêu thức : ...................................120
CHƯƠNG VI. HỒI QUY VÀ TƯƠNG QUAN .........................................................134

185
- 186 -

I. Nội dung 1: Ý nghĩa nghiên cứu mối liên hệ tương quan giữa các hiện tượng kinh
tế xã hội: ................................................................................................................... 134
1. Mối liên hệ giữa các hiện tượng kinh tế xã hội: ..............................................134
2. Liên hệ hàm số và liên hệ tương quan: ............................................................134
3. Phương pháp hồi quy và tương quan: ..............................................................134
II. Nội dung 2: Liên hệ tương quan tuyến tính giữa hai tiêu thức số lượng: ........... 135
1. Phương trình hồi quy: ......................................................................................135
2. Hệ số tương quan (mức độ chặt chẽ của mối liên hệ): .....................................136
3. Kiểm định giả thuyết về mối liên hệ tương quan: ............................................138
III. Nội dung 3: Nghiên cứu mối liên hệ tương quan phi tuyến tính giữa hai tiêu thức
số lượng.................................................................................................................... 138
1. Phương trình hồi quy: ......................................................................................138
2. Xác định mức độ chặt chẽ của mối liên hệ: .....................................................139
IV. Nội dung 4: Tương quan bội (tương quan giữa nhiều tiêu thức) ...................... 141
1. Phương trình tương quan: thông thường dùng phương trình tuyến tính ..........141
2. Đánh giá mức độ chặt chẽ của mối liên hệ giữa nhiều tiêu thức: ....................142
CHƯƠNG VII ĐIỀU TRA CHỌN MẪU .............................................................144
I. Nội dung 1: Khái niệm, ý nghĩa về điều tra chọn mẫu: ....................................144
II. Nội dung 2: Những vấn đề lý luận chung về điều tra chọn mẫu ngẫu nhiên ...... 145
1. Tổng thể chung và tổng thể mẫu: .....................................................................145
2. Các chỉ tiêu (tham số đặc trưng của tổng thể chung và tổng thể mẫu): ...........145
3. Cách chọn 1 lần và chọn nhiều lần: .................................................................145
4. Sai số trong điều tra chọn mẫu: ........................................................................146
6. Xác định số đơn vị mẫu: ..................................................................................148
7. Suy rộng kết quả điều tra chọn mẫu:................................................................149
III. Nội dung 3 : Các phương pháp chọn mẫu ngẫu nhiên thường dùng trong thống
kê .............................................................................................................................. 150
1. Phương pháp chọn mẫu ngẫu nhiên đơn thuần: ...............................................150
2. Phương pháp chọn máy móc: ...........................................................................151
3. Phương pháp chọn phân loại: ...........................................................................151
4. Phương pháp chọn cả khối: ..............................................................................153
5. Phương pháp chọn kết hợp:..............................................................................154
PHẦN II: ỨNG DỤNG PHẦN MỀM SPSS TRONG XỬ LÝ DỮ LIỆU THỐNG KÊ
.....................................................................................................................................155
Tổng quan ....................................................................................................................155
1. Các cửa sổ trong SPSS .....................................................................................155
2. Thanh menu {Menu} .......................................................................................155
3. Thanh công cụ {Toolbars} ...............................................................................156
4. Thanh tình trạng {Status Bar} ..........................................................................156
5. Hộp thoại {Dialogue box} ...............................................................................156
6. Tên biến và nhãn biến trong các danh sách của hộp thoại ...............................157
7. Lựa chọn biến ...................................................................................................157
Bài 1. Mở Các tệp tin dữ liệu ......................................................................................159
1. Khởi động SPSS ...............................................................................................159
2. Mở một file.......................................................................................................160

186
- 187 -

Bài 2: Cửa sổ Data Editor ............................................................................................160


1. Data View.........................................................................................................160
2. Variable View ..................................................................................................161
3. Tên biến ............................................................................................................162
4. Các thang đo .....................................................................................................163
5. Loại biến...........................................................................................................163
6. Nhãn biến {Variable Labels} ...........................................................................163
7. Nhãn trị số của biến {Value Labels} ...............................................................163
8. Hiệu đính dữ liệu trong bảng Data View .........................................................164
9. Cắt, sao chép và dán các trị số của dữ liệu ......................................................164
10. Chèn thêm các đối tượng mới ........................................................................164
11. Chèn một biến mới .........................................................................................165
12. Tình trạng lọc đối tượng trong Data Editor ...................................................165
Bài 3: Các phép biến đổi dữ liệu .................................................................................166
1. Tính toán biến {Compute Variable} ................................................................166
2. Tính toán biến với tuỳ chọn If Cases ...............................................................167
3. Mã hoá lại dữ liệu ............................................................................................167
4. Mã hoá thành biến khác ...................................................................................167
Bài 4: Điều khiển file và biến đổi file .........................................................................169
1. Sắp xếp các đối tượng ......................................................................................169
2. Chọn các đối tượng {Select Cases} .................................................................169
3. Select Cases: If .................................................................................................170
4. Select Cases: Random Sample .........................................................................171
5. Select Cases: Range .........................................................................................171
Bài 5: Lập bảng tần số và tính toáncác đại lượng thống kê ........................................172
1. Lập bảng tần số ................................................................................................172
2. Các đại lượng thống kê mô tả ..........................................................................174
3. Lập bảng tổng hợp nhiều biến ..........................................................................176
4. Hồi quy tuyến tính………………………………………………………….149
5. Phân tích dữ liệu định tính………………………………………………….151

187
- 188 -

TÀI LIỆU THAM KHẢO

1. PGS.TS Đinh Phi Hổ (2018), Thống kê ứng dụng trong kinh doanh, Nhà
xuất bản Tài chính
2. Hà Văn Sơn (2012), Giáo trình Lý thuyết thống kê (Ứng dụng trong Quản
trị và Kinh tế), Nhà xuất bản thống kê.
3. PGS. TS. Nguyễn Thị Kim Thúy (2012), Nguyên lý thống kê ứng dụng trong
quản lý kinh tế và kinh doanh sản xuất dịch vụ, NXB văn hóa Sài Gòn
4. PGS. TS. Trần Ngọc Phác, TS. Trần Thị Kim Thu (2006), Giáo trình lý
thuyết thống kê, NXB thống kê Hà Nội.
5. Hoàng Trọng (2012), Xử lý dữ liệu nghiên cứu với SPSS FOR WINDOWS,
Nhà xuất bản thống kê.
6. Nguyễn Văn Cang (2017), Xử lý dữ liệu thống kê trên SPSS, Đại học kinh tế
Đà Nẵng.

188
- 189 -

189

You might also like