Professional Documents
Culture Documents
03 NEU STA302 Bai3 v1.0013109210
03 NEU STA302 Bai3 v1.0013109210
03 NEU STA302 Bai3 v1.0013109210
STA302_Bai2_v1.0013109206 27
Bài 3: Trình bày dữ liệu thống kê
1. Làm thế nào để nêu lên được những đặc trưng cơ bản của hiện tượng?
2. Trình bày dữ liệu sao cho có hiệu quả nhất?
28 STA302_Bai2_v1.0013109206
Bài 3: Trình bày dữ liệu thống kê
STA302_Bai2_v1.0013109206 29
Bài 3: Trình bày dữ liệu thống kê
khác nhau hợp thành. Các bộ phận hay nhóm này chiếm những tỷ trọng khác nhau
trong tổng thể và nói lên tầm quan trọng của nó trong tổng thể đó.
Thứ ba, phân tổ được dùng để biểu hiện mối liên hệ giữa các tiêu thức. Các hiện tượng
kinh tế xã hội luôn phát sinh, phát triển và tồn tại trong mối liên hệ tác động qua lại
với các hiện tượng có liên quan nhau theo những quy luật nhất định. Giữa các tiêu
thức mà thống kê nghiên cứu cũng thường có mối liên hệ với nhau: sự thay đổi của
tiêu thức này sẽ đưa đến sự thay đổi của tiêu thức kia theo một quy luật nào đó.
30 STA302_Bai2_v1.0013109206
Bài 3: Trình bày dữ liệu thống kê
thức thống kê (từ hai tiêu thức trở lên). Tuỳ thuộc vào mục đích nghiên cứu, đặc
điểm của hiện tượng và các tiêu thức phân tổ mà phân tổ theo nhiều tiêu thức được
chia thành hai loại: Phân tổ kết hợp (là tiến hành phân tổ lần lượt theo từng tiêu
thức) và phân tổ nhiều chiều (là cùng một lúc phân tổ theo nhiều tiêu thức khác
nhau nhưng có vai trò như nhau trong việc đánh giá hiện tượng).
STA302_Bai2_v1.0013109206 31
Bài 3: Trình bày dữ liệu thống kê
phần kinh tế, ta có thể chia tổng thể các doanh nghiệp thành 5 tổ (kinh tế nhà nước, kinh
tế tập thể, kinh tế cá thể, kinh tế tư nhân và kinh tế có vốn đầu tư nước ngoài)...
Trường hợp số loại hình thực tế nhiều, nếu coi mỗi loại hình là một tổ thì số tổ sẽ
quá nhiều, không thể khái quát chung được và cũng không nêu rõ được sự khác
nhau giữa các tổ, cần ghép những loại hình gần giống nhau vào cùng một tổ.
Chẳng hạn khi phân tổ tổng thể nhân khẩu theo nghề nghiệp, phân tổ các loại sản
phẩm công, nông nghiệp, phân tổ các mặt hàng theo giá trị sử dụng, phân tổ các
ngành của nền Kinh tế quốc dân... trong những trường hợp này phải giải quyết
bằng cách ghép nhiều tổ nhỏ lại thành một số tổ lớn, theo nguyên tắc các tổ nhỏ
ghép lại với nhau phải gần giống nhau.
Phân tổ theo tiêu thức số lượng
Khi phân tổ theo tiêu thức số lượng tuỳ theo lượng biến của tiêu thức thay đổi
nhiều hay ít mà cách phân tổ được giải quyết khác nhau. Mặt khác, cũng cần chú ý
đến số lượng đơn vị tổng thể nhiều hay ít mà xác định số tổ thích hợp.
Trường hợp lượng biến của tiêu thức thay đổi ít, tức là sự biến thiên về mặt
lượng giữa các đơn vị không chênh lệch nhiều, biến động rời rạc và số các lượng
biến không nhiều, như số nhân khẩu trong gia đình, số máy do một công nhân
phụ trách... thì ở đây, số tổ có một giới hạn nhất định và thường cứ mỗi lượng
biến là cơ sở để hình thành một tổ, trường hợp này được gọi là phân tổ không có
khoảng cách tổ.
Trường hợp lượng biến của tiêu thức biến thiên lớn, cần chú ý mối liên hệ giữa
lượng và chất trong phân tổ, xét cụ thể xem lượng biến tích luỹ đến một mức độ
nào đó thì chất của hiện tượng mới thay đổi và làm nảy sinh ra một tổ khác. Như
vậy, mỗi tổ sẽ bao gồm một phạm vi lượng biến, với hai giới hạn: giới hạn dưới là
lượng biến nhỏ nhất để làm cho tổ đó được hình thành và giới hạn trên là lượng
biến lớn nhất của tổ đó, nếu vượt quá giới hạn đó thì chất của tổ thay đổi và
chuyển thành tổ khác. Trị số chênh lệch giữa giới hạn trên và giới hạn dưới của
mỗi tổ gọi là khoảng cách tổ. Việc phân tổ theo các giới hạn như vậy gọi là phân
tổ có khoảng cách tổ. Các khoảng cách tổ có thể đều nhau hoặc không đều nhau.
o Phân tổ với khoảng cách tổ đều nhau: được thực hiện đối với các hiện tượng
tương đối đồng nhất về mặt loại hình kinh tế xã hội và lượng biến trên các đơn vị
thay đổi một cách tương đối đều đặn hoặc khi ta không biết gì về quy luật thay đổi
về lượng của các đơn vị. Trị số khoảng cách tổ được xác định theo công thức:
x max x min
h
n
Trong đó: h - trị số khoảng cách tổ
xmax - lượng biến lớn nhất của tiêu thức phân tổ
xmin - lượng biến nhỏ nhất của tiêu thức phân tổ
n - số tổ định chia
o Phân tổ với khoảng cách tổ không đều nhau: được thực hiện đối với các hiện
tượng mà lượng biến trên các đơn vị thay đổi không đều. Trong trường hợp này,
cần phải tuyệt đối tuân theo quy luật của mối quan hệ lượng - chất. Tức là khi
lượng biến thay đổi làm cho chất thay đổi thì phải chuyển chúng sang tổ khác,
còn khi lượng biến thay đổi mà chất chưa thay đổi thì ghép chúng vào một tổ.
32 STA302_Bai2_v1.0013109206
Bài 3: Trình bày dữ liệu thống kê
Bảng 3.1. Bảng biểu diễn các thành phần của một dãy số lượng biến
STA302_Bai2_v1.0013109206 33
Bài 3: Trình bày dữ liệu thống kê
34 STA302_Bai2_v1.0013109206
Bài 3: Trình bày dữ liệu thống kê
đáp vấn đề: đối tượng nghiên cứu của bảng thống kê là những đơn vị nào, những loại
hình gì? Có khi phần chủ đề phản ánh các địa phương hoặc các thời gian nghiên cứu
khác nhau của một hiện tượng nào đó.
Phần giải thích (còn gọi là phần tân từ) gồm các chỉ tiêu giải thích các đặc điểm của
đối tượng nghiên cứu, tức là giải thích phần chủ đề của bảng.
Phần chủ đề thường được đặt ở vị trí bên trái của bảng thống kê, còn phần giải thích
được đặt ở phía trên của bảng. Cũng có trường hợp người ta thay đổi vị trí của các
phần chủ đề và phần giải thích, tức là phần giải thích ở bên trái còn phần chủ đề ở phía
trên của bảng.
Cấu thành của bảng thống kê có thể biểu hiện bằng sơ đồ sau:
Bảng 3.2. ………(Tiêu đề chung của bảng)
Phần giải thích Tên chỉ tiêu 1 Tên chỉ tiêu 2 Tên chỉ tiêu 3 Tổng
...
Phần chủ đề (tên cột 1) (tên cột 2) (tên cột 3) số
(A) (1) (2) (3) ... (n)
Tên chủ đề 1 (tên hàng 1) ... ... ... ... ...
Tên chủ đề 2 (tên hàng 2) ... ... ... ... ...
... ... ... ... ... ...
Tổng số (chung) ... ... ... ... ...
3.2.4. Yêu cầu chung của việc xây dựng bảng thống kê
Một bảng thống kê được xây dựng một cách khoa học sẽ trở nên gọn, rõ, đáp ứng được
mục đích nghiên cứu. Việc xây dựng bảng thống kê cần đảm bảo những yêu cầu sau:
Thứ nhất, quy mô của bảng thống kê không nên quá lớn, tức là quá nhiều hàng, cột và
nhiều phân tổ kết hợp. Nếu thấy cần thiết nên xây dựng hai, ba... bảng thống kê nhỏ
thay cho một bảng quá lớn.
Thứ hai, các tiêu đề và tiêu mục trong bảng thống kê cần được ghi chính xác, gọn và
dễ hiểu. Tiêu đề chung không những nói rõ nội dung chủ yếu của bảng thống kê, mà
còn phải chỉ rõ thời gian và địa điểm mà các con số trong bảng phản ánh. Ngoài ra,
STA302_Bai2_v1.0013109206 35
Bài 3: Trình bày dữ liệu thống kê
phần này còn chỉ rõ đơn vị tính toán chung cho các số liệu trong bảng thống kê - nếu
tất cả các con số trong bảng đều thống nhất một đơn vị tính. Trường hợp đơn vị tính
toán không thống nhất cho tất cả các số liệu, thì cần quy định riêng cho hoặc từng
hàng, hoặc từng cột.
Thứ ba, các hàng và cột thường được ký hiệu bằng chữ hoặc bằng số để tiện cho việc
trình bày hoặc giải thích nội dung. Các cột của phần chủ đề thường được ký hiệu bằng
các chữ A, B, C... còn các cột của phần giải thích được ký hiệu bằng các số 1, 2, 3...
Tuy nhiên, nếu một bảng thống kê chỉ có ít hàng và cột và nội dung các hàng cột đã rõ
ràng, dễ hiểu thì không nhất thiết phải dùng ký hiệu.
Thứ tư, các chỉ tiêu giải thích trong bảng thống kê cần được sắp xếp theo thứ tự hợp
lý, phù hợp với mục đích nghiên cứu.
Thứ năm, cách ghi các số liệu vào bảng thống kê: các ô trong bảng thống kê đều có
ghi số liệu hoặc bằng các ký hiệu quy ước thay thế. Thực tế, người ta thường dùng các
ký hiệu quy ước sau:
Nếu hiện tượng không có số liệu đó, thì trong ô sẽ ghi một dấu gạch ngang (-).
Nếu số liệu còn thiếu, sau này có thể bổ sung, thì trong ô có ký hiệu dấu 3 chấm (...).
Nếu hiện tượng không có liên quan đến chỉ tiêu đó, số liệu viết vào ô sẽ vô nghĩa
thì dùng ký hiệu gạch chéo (x).
Các số liệu trong cùng một cột hoặc một hàng, có đơn vị tính toán giống nhau, phải
ghi theo độ chính xác như nhau (số lẻ đến 0,1 hay 0,01...) đơn vị tính phải ghi thống
nhất theo quy định.
Các số cộng và tổng cộng có thể được ghi ở đầu hoặc ở cuối hàng, cuối cột tuỳ theo
mục đích nghiên cứu. Các số này được ghi ở đầu hàng, đầu cột khi ta cần nghiên cứu
chủ yếu các đặc trưng của hiện tượng, còn các đặc trưng từng bộ phận chỉ có tác dụng
phân tích thêm. Các số cộng và tổng cộng được ghi ở cuối hàng, cuối cột là khi ta
nghiên cứu đi sâu từng tổ, từng bộ phận là chủ yếu.
Thứ sáu, phần ghi chú ở cuối bảng thống kê được dùng để giải thích rõ nội dung của
một số chỉ tiêu trong bảng, để nói rõ nguồn số liệu đã được sử dụng trong bảng hoặc
các chi tiết cần thiết khác.
36 STA302_Bai2_v1.0013109206
Bài 3: Trình bày dữ liệu thống kê
120.0
116.8 116.8
116.0 113.9 114.0
Tốc độ phát triển (%)
112.0
107.9
108.0
104.0
100.0
2006 2007 2008 2009 2010
Năm
Hình 3.1. Tốc độ phát triển giá trị sản xuất công nghiệp Việt Nam
giai đoạn 2006-2010 (theo giá cố định năm 1994)
Để biểu hiện sự phát triển của hiện tượng theo thời gian, đồ thị đường gấp khúc
cũng có thể được sử dụng. Theo số liệu trong ví dụ trên, ta có đồ thị sau:
STA302_Bai2_v1.0013109206 37
Bài 3: Trình bày dữ liệu thống kê
120.0
116.8
116.8
116.0
108.0 107.9
104.0
2005 2006 2007 2008 2009 2010
Năm
Hình 3.2. Tốc độ phát triển giá trị sản xuất công nghiệp Việt Nam
giai đoạn 2006-2010 (theo giá cố định 1994)
Trên đồ thị đường gấp khúc, trục hoành được dùng để biểu thị thời gian, còn trục
tung biểu thị các mức độ của chỉ tiêu nghiên cứu. So với đồ thị hình cột, loại đồ thị
này cho phép hình dung rõ ràng, trực tiếp hơn xu hướng phát triển của hiện tượng
theo thời gian. Đây chính là căn cứ trực quan để xác định phương trình toán học
biểu diễn xu hướng phát triển của hiện tượng theo thời gian (hàm xu thế). Một chú
ý quan trọng khi vẽ loại đồ thị này là phải xác định độ khắc trên các trục toạ độ cho
thích hợp, vì độ khắc có ảnh hưởng trực tiếp đến độ dốc của đường gấp khúc. Nếu
độ khắc trên trục tung quá nhỏ so với độ khắc trên trục hoành, đường gấp khúc sẽ
vươn dài một cách quá mức, độ dốc của đường sẽ không thấy rõ, ngược lại, nếu độ
khắc trên trục tung quá lớn so với độ khắc trên trục hoành, đường gấp khúc sẽ vươn
cao quá mức, độ dốc quá lớn gây cho người xem ấn tượng phóng đại sự phát triển
của hiện tượng.
Đồ thị kết cấu
Để biểu hiện kết cấu và biến động kết cấu của hiện tượng, thường dùng các loại
biểu đồ hình cột và hình tròn.
100%
60%
Công
36.72 41.48 39.84 40.24 41.09 nghiệp
40%
Nông,
20% lâm
24.54 20.34 22.21 20.91 20.58 nghiệp
0%
2000 2007 2008 2009 2010
Hình 3.3. Kết cấu Tổng sản phẩm trong nước theo
nhóm ngành kinh tế giai đoạn 2000-2010
38 STA302_Bai2_v1.0013109206
Bài 3: Trình bày dữ liệu thống kê
24.54 20.58
38.74 38.33
36.72
41.09
Hình 3.4. Kết cấu Tổng sản phẩm trong nước theo
nhóm ngành kinh tế năm 2000 và 2010
Trong đồ thị hình cột, không những chiều ngang của các cột bằng nhau, mà cả
chiều cao các cột cũng phải bằng nhau, biểu thị tổng của các số tương đối kết cấu
bao giờ cũng phải bằng 1 (hoặc bằng 100%). Trên toàn bộ chiều cao của từng cột
đều được chia thành các phần, độ cao của mỗi phần ứng với tỷ trọng của bộ phận
trong tổng thể mà nhờ đó ta có thể đánh giá được tầm quan trọng của bản thân bộ
phận đó cũng như kết cấu của toàn bộ tổng thể. Một ưu điểm khác của đồ thị
hình cột là cùng lúc có thể biểu thị kết cấu theo tiêu thức nghiên cứu của nhiều
tổng thể, nhiều địa phương, nhiều năm khác nhau.
Đồ thị hình tròn cho ta cái nhìn trực quan rõ hơn về kết cấu của một tổng thể, từ đó
so sánh tốt hơn sự khác biệt về kết cấu theo một tiêu thức nào đó giữa các tổng thể,
sự biến động về kết cấu này theo thời gian, không gian. Một ưu điểm khác của
biểu đồ hình tròn là có thể tách một bộ phận nào đó khi cần nhấn mạnh nó trong
tổng thể. Chẳng hạn như trong tiến trình thực hiện Công nghiệp hóa - Hiện đại hóa
đất nước, khu vực công nghiệp - xây dựng được tập trung đầu tư nhiều và hiện
đang ngày càng đóng vai trò quan trọng hơn trong nền Kinh tế quốc dân.
Đồ thị liên hệ
Để biểu hiện mối liên hệ giữa 2 tiêu thức, người ta thường dùng đồ thị đường gấp
khúc. Trục hoành của đồ thị được dùng để biểu hiện trị số của tiêu thức nguyên
nhân (tiêu thức gây ảnh hưởng, ký hiệu là x); trục tung của đồ thị được dùng để
biểu hiện trị số của tiêu thức kết quả (tiêu thức chịu ảnh hưởng, ký hiệu là y).
2.5
2.3
TFR
2.1
1.9
1.7
0.7 0.72 0.74 0.76 0.78 0.8 0.82 0.84
HDI
Hình 3.5. Mối liên hệ giữa HDI và TFR các tỉnh Đồng bằng sông Hồng năm 2004
Đồ thị ra đa
Đồ thị mạng nhện (biểu đồ ra đa) có thể được sử dụng để biểu thị tình hình hoàn thành
kế hoạch về chỉ tiêu nghiên cứu của một đơn vị qua các tháng trong năm (12 tháng).
STA302_Bai2_v1.0013109206 39
Bài 3: Trình bày dữ liệu thống kê
Trong biểu đồ mạng nhện, đường tròn được chia thành các phần bằng nhau. Nếu
để biểu diễn cho các tháng trong năm thì nó được chia thành 12 phần bằng nhau
tương ứng với 12 tháng trong năm. Các đa giác đều đồng tâm biểu thị thang đo.
Trong trường hợp này, đường thang đo 100 biểu thị mức hoàn thành kế hoạch.
Quan sát hình dạng của đồ thị, dễ dàng nhận thấy các điểm nằm ngoài đường
thang đo 100 là các tháng hoàn thành vượt mức kế hoạch và khoảng cách giữa đồ
thị với đường này càng xa, mức vượt kế hoạch càng lớn. Ngược lại, các điểm
nằm trong đường thang đo 100 là các tháng không hoàn thành kế hoạch. Ưu điểm
lớn của biểu đồ ra đa biểu thị tình hình thực hiện kế hoạch còn ở chỗ nó có thể
được sử dụng để biểu thị mức độ kế hoạch và mức độ thực tế đạt được về trị số
của một chỉ tiêu nào đó.
80
12 2
GO kế hoạch
60
GO thực hiện
11 40 3
20
10 0 4
9 5
8 6
Hình 3.6. Giá trị sản xuất kế hoạch và Giá trị sản xuất
thực tế (tỷ đồng)trong năm 2010 của công ty M
Cũng nhờ tác dụng như trên, nên biểu đồ ra đa còn được dùng để đánh giá tính thời
vụ của một chỉ tiêu nào đó.
1.2
12 2
0.9
11 0.6 3
0.3
Năm 2008
10 0 4
Năm 2009
Năm 2010
9 5
8 6
40 STA302_Bai2_v1.0013109206
Bài 3: Trình bày dữ liệu thống kê
Ngoài ra, thống kê còn sử dụng một số loại đồ thị để thực hiện các nhiệm vụ khác,
như đồ thị diện tích, đồ thị cành lá để mô tả đặc trưng phân phối của một dãy số.
Một biến dạng đặc biệt của đồ thị là bản đồ thống kê cũng thường được dùng để
biểu thị các cường độ phân bố khác nhau theo vùng địa lý của một chỉ tiêu nào đó
(như mật độ dân số của các vùng…).
SRB ≥ 115
(Rất bất thường)
Hình 3.8. Bản đồ tỷ số giới tính khi sinh (SRB) của Việt Nam năm 2009
3.3.3. Yêu cầu chung của việc xây dựng đồ thị thống kê
Một đồ thị thống kê phải bảo đảm các yêu cầu: chính xác, dễ xem, dễ hiểu và nếu có
thể trình bày mỹ thuật. Để đảm bảo những yêu cầu này, ta phải chú ý đến các yếu tố
chính của đồ thị, quy mô, các ký hiệu hình học hoặc các hình vẽ, hệ tọa độ, thang và
tỷ lệ xích, phần giải thích.
Quy mô của đồ thị được quyết định bởi chiều dài, chiều cao và quan hệ tỷ lệ giữa
hai chiều đó. Quy mô của đồ thị to hay nhỏ còn phải căn cứ vào mục đích sử dụng.
Trong các báo cáo phân tích không nên vẽ các đồ thị quá lớn. Quan hệ tỷ lệ giữa
chiều cao và chiều dài của đồ thị, thông thường được dùng từ 1:1,33 đến 1:1,5.
Các ký hiệu hình học hoặc hình vẽ quyết định hình dáng của đồ thị. Các ký hiệu
hình học có nhiều loại như: các chấm, các đường thẳng hoặc cong, các hình cột,
hình vuông, hình chữ nhật, hình tròn... các hình vẽ khác trên đồ thị cũng có thể
thay đổi nhiều loại tùy tính chất của hiện tượng nghiên cứu. Việc lựa chọn các ký
hiệu hình học hoặc hình vẽ của đồ thị là vấn đề quan trọng, vì mỗi hình có khả
năng diễn tả riêng.
Hệ tọa độ giúp cho việc xác định chính xác vị trí các ký hiệu hình học trên đồ thị.
Các đồ thị thống kê thường dùng hệ tọa độ vuông góc. Trong các bản đồ thống kê,
người ta dùng các đường cong để làm căn cứ xác định vị trí các ký hiệu hình học.
Các đường cong này có thể là đường biên giới, đường bờ biển, các con sông lớn...
Trên hệ tọa độ vuông góc, trục hoành thường được dùng để biểu thị thời gian, trục
tung biểu thị trị số của chỉ tiêu. Trong trường hợp phân tích mối liên hệ giữa hai
STA302_Bai2_v1.0013109206 41
Bài 3: Trình bày dữ liệu thống kê
biểu thức, thì biểu thức nguyên nhân được để ở trục hoành, biểu thức kết quả được
ghi trên trục tung.
Thang và tỷ lệ xích giúp cho việc tính chuyển các đại lượng lên đồ thị theo các
khoảng cách thích hợp. Người ta thường dùng các thang đường thẳng, được phân bố
theo các trục tọa độ, cũng có khi dùng thang đường cong, ví dụ thang tròn (ở đồ thị
hình tròn) được chia thành 3600. Các thang tỷ lệ có thể có khoảng cách bằng nhau
hoặc không bằng nhau. Các thang tỷ lệ có các khoảng cách không bằng nhau (ví dụ
thang lôgarit) chỉ dùng để biểu hiện các tốc độ khi khoảng biến thiên của các mức
độ quá lớn mà người ta chỉ chú ý đến biến động tương đối của chúng.
Phần giải thích bao gồm tên đồ thị, các con số và ghi chú đọc theo thang tỷ lệ, các
con số bên cạnh từng bộ phận của đồ thị, giải thích các ký hiệu quy ước... cần
được ghi rõ, gọn, dễ hiểu.
Trong thực tế, nhiều trường hợp đồ thị thống kê bị lạm dụng, nhất là trên các
phương tiện truyền thông. Khi đó, nó khó có thể giúp khám phá những điều mà dữ
liệu truyền đạt theo đúng tính chất vốn có của nó. Để tránh rơi vào tình trạng này,
khi xây dựng đồ thị thống kê cần lưu ý mấy điểm sau:
o Đồ thị phản ánh chính xác dữ liệu.
o Đồ thị cần có tên chung, tên của hai trục và phải được đặt chính xác.
42 STA302_Bai2_v1.0013109206
Bài 3: Trình bày dữ liệu thống kê
STA302_Bai2_v1.0013109206 43
Bài 3: Trình bày dữ liệu thống kê
44 STA302_Bai2_v1.0013109206