Do Van Duc Thanh

You might also like

Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 22

TRƯỜNG ĐẠI HỌC BÁCH KHOA ĐÀ NẴNG

KHOA CÔNG NGHỆ TIÊN TIẾN


~~~~~~*~~~~~~

BÀI THI CUỐI KÌ:


PHƯƠNG PHÁP THỐNG KÊ VÀ PHÂN TÍCH DỮ LIỆU

Sinh viên thực hiện : ĐỖ VĂN ĐỨC THÀNH


Lớp : 18PFIEV3
Mã sinh viên : 122180037
Giáo viên hướng : LÊ DÂN
dẫn
1. Down dữ liệu từ trang web vào Excel:

Lấy dữ liệu từ trang web:


https://databank.worldbank.org/source/jobs/preview/on#

BẢNG DỮ LIỆU VỀ VIỆC LÀM CÁC NƯỚC Ở CHÂU Á

 Chọn các nước Châu Á, các biến, và chọn trong vòng 10 năm (2007-2016)
 Nhấp chuột vào Tùy chọn tải xuống, nhấn chọn excel, ta sẽ tải được dữ liệu
về:
 Đây là bảng dữ liệu khi mới Download về, ta sẽ làm sạch dữ liệu và tổ chức
lại dữ liệu.

 Chúng ta tạo một bảng COUNTRY ID để lưu ID của các nước theo chuẩn
quốc tế:
 Tiếp theo, chúng ta tạo bảng mã code cho các biến có trong dữ liệu:

 Sau khi tổ chức tại dữ liệu ta được bảng dữ liệu Data:


2. POWER PIVORT:
a. Tạo mối quan hệ giữa các dữ liệu:

 Bôi đen dữ liệu bảng Data1 , sau đó chọn Power Pivot, chọn Thêm vào
mô hình dữ liệu

 Ta được bảng data như hình bên dưới:


 Tương tự ta có bảng ID:

 Tại bảng COUNTRYID ta chọn create relationship để tạo mối quan hệ của
dữ liệu COUNTRYID ở bảng COUNTRYID và bảng Data:
b.Mô tả dữ liệu bằng vẽ đồ thị:

+ Bôi đen dữ liệu, vào Chèn chọn PivotTable :

+Tiếp theo, ta chọn các hàng, giá trị…v..v thích hợp để vẽ biểu đồ. Ta
vào Chèn -> Slicer để chọn biến thể hiện cho biểu đồ:
3. Import dữ liệu vào spss từ file đã lưu:
 Mở phần mềm IBM SPSS Statistic 20. Chọn open data document trên
thanh công cụ, chỉnh sửa đuôi cảu file dữ liệu và chọn file dữ liệu cần
imprort.

 Chọn open, sẽ hiện ra 2 bảng:


+ Data view:

+ Variable view:

 Thao tác cuối cùng ta lưu file: Chọn File > Save đặt tên với đuôi .sav
a. Làm sạch dữ liệu: Dữ liệu trong quá trình thu thập có thể bị các sai số do
người nhập.Ta sẽ quan sát dữ liệu có sạch hay không bằng cách lập bảng tần
số:

Thủ tục: Analyze -> Descriptive Statistics -> Frequencies.


Kéo các biến muốn kiểm tra sang ô Variables, nhấn OK
Trong cửa sổ Output sẽ xuất hiện Bảng tần số

Ta quan sát xem High technology exports, tổng số quan sát đã thực hiện, so với
thực tế đã đúng hay chưa.

Thực hiện kiểm tra các biến numeric bằng cách lập bảng mô tả.
Thủ tục: Analyze > Descriptive Statistics > Descriptives
Kéo các biến muốn kiểm tra sang ô Descriptives, nhấn OK

Ta quan sát xem Giá trị nhỏ nhất và lớn nhất của biến để loại bỏ các trường hợp số
âm. Ở đây từ 1.688 đến 117.000, vậy là hợp lý.
Ở đây, dữ liệu được tải từ trang Web, đã được làm sạch từ trước.

Phần 2
Mô tả dữ liệu bằng Bảng, Đồ thị và một số đại lượng thống kê. Phân tích kết
quả.
Mô tả dữ liệu bằng bảng:
a. Mô tả một biến

Thủ tục: Analyze > Descriptive Statistics > Frequencies

Chọn biến cần mô tả.


Cửa sổ Output xuất hiện bảng:

Bảng trên mô tả các thông số của biến. Bảng dưới là bảng mô tả các giá trị của
biến được sắp xếp theo thứ tự (tương tự với các biến còn lại).

b. Mô tả tương quan các biến


Thủ tục: Analyze > Descriptive Statistics > Crosstabs

Xem xét sự tương quan giữa Contributing family workers, female (% of female
employment) (modeled ILO estimate) và Contributing family workers, male (% of
male employment) (modeled ILO estimate)

Cửa sổ Output xuất hiện các bảng:

Phân tích: Dựa vào bảng Crosstabulation ta thấy được sự phân bố các giá trị của
các biến Contributing family workers, female (% of female employment) (modeled
ILO estimate) và Contributing family workers, male (% of male employment)
(modeled ILO estimate) (tương tự với các biến còn lại).

Mô tả dữ liệu bằng Đồ thị:


Thủ tục: Graphs > Chart Builder, nhấn OK.
Tiến hành chọn Đồ thị phù hợp cho từng trường hợp biến cần vẽ:
 Đồ thị cột:
Phân tích: Từ biểu đồ trên ta có thể thấy đối với biến Access to electricity (% of
population) các nước ở châu Á tương đối đồng đều ngoại trừ một số nước.

Mô tả dữ liệu bằng Đại lượng thống kê


 Sử dụng cho Biến numeric Tuổi.
 Đại lượng sử dụng: Mean(), Std.deviation(), Minimum, Maximum,Variance
Thủ tục: Analyze > Descriptive Statistics > Descriptives

Chọn Options, tích chọn các đại lượng thống kê cần sử dụng.

Nhấn Continue, OK.


2.2. Kiểm định
Kiểm định Trung bình:

Thủ tục: Analyze > Compare Means > Means


Cửa sổ Output xuất hiện:

Ở đây chỉ lấy trị trung bình của biến có kiểu dữ liệu numeric (tương tự với các
biến còn lại).

Kiểm định 1 mẫu:


Giả thuyết: Access to electricity (% of population) là 500

Thủ tục: Analyze > Compare Means > One-Sample T Test

 Kéo biến vào Test Variable.


 Nhập Test Value là 500.
 Nhấn OK.
Tương tự với các biến còn lại.
Phân tích: Quan sát trong bảng One-Sample Test, ta thấy giá trị Sig.(2-
tailed) bằng 0.00 nhỏ hơn 0.05. Vậy ta bác bỏ giả thuyết ban đầu, biến
Access to electricity (% of population) giá trị không phải 500.

Kiểm định 2 mẫu độc lập

Bấm Analyze -> Compare Means -> Independent-samples T-test

Giả thuyết: Access to electricity (% of population) phụ thuộc vào Year


Phân tích: Dựa vào kết quả kiểm định sự bằng nhau của 2 phương sai tổng thể
(kiểm định Lavene). Phương sai diễn tả mức độ đồng đều hoặc phân tán của dữ
liệu.
Quan sát bảng Independent Samples Test, ta thấy giá trị Sig. bằng 0.015 nhỏ hơn
0.05, vậy phương sai của hai tổng thể khác nhau nên giả thuyết không được chấp
nhận.

Kiểm định mẫu cặp


Giả thuyết: Age dependency ratio (% of working-age population) (Tỷ số phụ
thuộc tuổi (% dân số trong độ tuổi lao động)) có sự khác biệt qua các năm.

Thủ tục: Analyze > Compare Means > Paired Sample T Test.

Bấm Opitions ,Thực hiện kiểm định với độ chính xác 95%(mức ý nghĩa 5%)
Phân tích: Quan sát bảng Paired Samples Test. Giá trị Sig bằng 0.08 lớn hơn 0.05.
Vậy ta chấp nhận giả thuyết.

You might also like