Download as pdf or txt
Download as pdf or txt
You are on page 1of 49

TRƯỜNG ĐẠI HỌC KINH TẾ - LUẬT

KHOA TOÁN KINH TẾ

KINH TẾ LƯỢNG
BÀI 1. TRỰC QUAN DỮ LIỆU VỚI STATA

Võ Thị Lệ Uyển

Thành phố Hồ Chí Minh, Ngày 28 tháng 1 năm 2024

VTLU KTL 1 / 49
NỘI DUNG
1 THIẾT LẬP BẢNG MÀU CHO ĐỒ THỊ
2 CÚ PHÁP CỦA LỆNH VẼ ĐỒ THỊ TRONG STATA
3 CHỈNH SỬA ĐỒ THỊ
4 TRỰC QUAN BIẾN RỜI RẠC
Hiển thị phân phối của một biến rời rạc
Hiển thị phân phối theo nhóm của một biến rời rạc
5 TRỰC QUAN BIẾN LIÊN TỤC
Biểu đồ chấm
Biểu đồ thân và lá
Đồ thị hộp râu
Biểu đồ tần suất
Đồ thị phân tán
Đồ thị ma trận

VTLU KTL 2 / 49
THIẾT LẬP BẢNG MÀU CHO ĐỒ THỊ

Nhập dữ liệu

Sử dụng lệnh sysuse để nhập bộ dữ auto có sẵn trong Stata


. clear
. sysuse auto

Trong Stata, có thể sử dụng lệnh scheme để chỉ định bảng màu
(hay còn gọi là diện mạo chung) cho các biểu đồ.

Để yêu cầu Stata hiển thị bảng màu sẵn có, ở cửa sổ lệnh, nhập lệnh:

. graph query, scheme

VTLU KTL 3 / 49
THIẾT LẬP BẢNG MÀU CHO ĐỒ THỊ

Các phương pháp thiết lập bảng màu

Có hai cách để thiết lập bảng màu đồ thị:


1 Phương pháp 1. Sử dụng lệnh scheme thiết lập bảng màu trước khi
vẽ biểu đồ theo câu lệnh:
. set scheme schemename
Ví dụ: . set scheme lean1

2 Phương pháp 2. Sử dụng tùy chọn của scheme( ) trong cú pháp


của lệnh vẽ đồ thị như sau:
scheme(schemename)

VTLU KTL 4 / 49
THIẾT LẬP BẢNG MÀU CHO ĐỒ THỊ

Bảng màu sẵn có của Stata


Ví dụ

VTLU KTL 5 / 49
THIẾT LẬP BẢNG MÀU CHO ĐỒ THỊ

Bảng màu mặc định của Stata


Bảng màu mặc định của Stata là: s2color
Ví dụ
. scatter mpg weight, title("DEFAULT") xlabel(1500(500)5000) ylabel(10(10)50)
msymbol(0)

VTLU KTL 6 / 49
THIẾT LẬP BẢNG MÀU CHO ĐỒ THỊ

Bảng màu "s1color"


Ví dụ
. set scheme s1color
. scatter mpg weight, title("s1color") xlabel(1500(500)5000) ylabel(10(10)50)
msymbol(0)

VTLU KTL 7 / 49
THIẾT LẬP BẢNG MÀU CHO ĐỒ THỊ

Bảng màu "s1mono"

Ví dụ
. set scheme s1mono
. scatter mpg weight, title("s1mono SCHEME") xlabel(1500(500)5000)

VTLU KTL 8 / 49
THIẾT LẬP BẢNG MÀU CHO ĐỒ THỊ

Bảng màu "lean1"

Ví dụ
. set scheme lean1
. scatter mpg weight, title("lean1 SCHEME") xlabel(1500(500)5000)

VTLU KTL 9 / 49
THIẾT LẬP BẢNG MÀU CHO ĐỒ THỊ

Bảng màu "lean2"

Ví dụ
. set scheme lean2
. scatter mpg weight, title("lean2 SCHEME") xlabel(1500(500)5000)

VTLU KTL 10 / 49
THIẾT LẬP BẢNG MÀU CHO ĐỒ THỊ

Chỉ định một bảng màu làm mặc định

Lưu ý
Để chỉ định bảng màu lean1 là bảng màu mặc định cho tất cả biểu đồ
sắp được vẽ, thực hiện như sau:

Nhập câu lệnh sau vào cửa sổ lệnh:

. set scheme lean1, permanently

VTLU KTL 11 / 49
CÚ PHÁP CỦA LỆNH VẼ ĐỒ THỊ TRONG STATA

Giới thiệu

Cú pháp của lệnh scatter để vẽ biểu đồ phân tán của Y theo X .


Trong đó:
Y = là biến mpg trong bộ dữ liệu "auto".
X = là biến weight trong bộ dữ liệu "auto".

Để chỉ định cú pháp cho lệnh scatter , ta thực hiện các bước sau:
1 Bước 1. Xác định giá trị tổi thiểu và tối đa của mỗi biến để đặt "các
mốc giá trị" trên mỗi trục một cách chính xác theo câu lệnh:

. tabstat mpg weight, stat(min max)

2 Bước 2. Vẽ biểu đồ phân tán theo cú pháp có khai báo các đặc điểm
kỹ thuật như: tiêu đề, nhãn trục, . . .

VTLU KTL 12 / 49
CÚ PHÁP CỦA LỆNH VẼ ĐỒ THỊ TRONG STATA

Cú pháp của lệnh scatter

Cú pháp
. scatter mpg weight, title("Title here") subtitle("Subtitle here") xtitle("X
axis title here") ytitle("Y axis title here") xlabel(1500(500)5000)
ylabel(10(10)50) msymbol(o)

Trong đó,
title("title in quotes") – Chỉ định tiêu đề của đồ thị
subtitle("subtitle in quotes") – Chỉ định tiêu đề phụ của đồ thị
ytitle("Y-axis title in quotes") – Chỉ định tiêu đề của trục Y
xtitle("X-axis title in quotes") – Chỉ định tiêu đề của trục X
legend ("legend in quotes") – Chỉ định nội dung chú giải
caption ("caption in quotes") – Chú thích cho đồ thị
note("note in quotes") – Ghi chú cho đồ thị
Lưu ý: dấu phẩy trong cú pháp
VTLU KTL 13 / 49
CÚ PHÁP CỦA LỆNH VẼ ĐỒ THỊ TRONG STATA

Cú pháp cơ bản của lệnh graph twoway

Ví dụ
. graph twoway (scatter mpg weight, msymbol(d)), title(“Scatterplot of MPG by
Weight”)

VTLU KTL 14 / 49
CÚ PHÁP CỦA LỆNH VẼ ĐỒ THỊ TRONG STATA

Cú pháp cơ bản của lệnh graph twoway

Cú pháp
.graph twoway (scatter mpg weight, msymbol(d)),
title(“Scatterplot of MPG by Weight")

Lưu ý
Chú ý: "các khoảng trắng" trong cú pháp
1 PHẢI có khoảng trắng giữa "twoway" và dấu ngoặc đơn phía sau
2 KHÔNG được có khoảng trắng giữa "title" và dấu mở ngoặc đơn
theo sau để chỉ định tiêu đề của đồ thị, . . . . . .

VTLU KTL 15 / 49
CÚ PHÁP CỦA LỆNH VẼ ĐỒ THỊ TRONG STATA

Chọn biểu tượng cho đồ thị


Để yêu cầu Stata hiển thị các ký hiệu sẵn có cho biểu tượng của các điểm
dữ liệu trên đồ thị, ta làm như sau:
. palette symbolpalette

Ví dụ

VTLU KTL 16 / 49
CÚ PHÁP CỦA LỆNH VẼ ĐỒ THỊ TRONG STATA

Chọn kích thước biểu tương


Để yêu cầu Stata hiển thị các kích thước sẵn có cho biểu tượng
. showmarkers, over(msize)
Ví dụ

VTLU KTL 17 / 49
CÚ PHÁP CỦA LỆNH VẼ ĐỒ THỊ TRONG STATA

Chọn màu cho các biểu tượng


Để yêu cầu Stata hiển thị các màu sắc sẵn có cho biểu tượng
. showmarkers, over(mcolor)
Ví dụ

VTLU KTL 18 / 49
CHỈNH SỬA ĐỒ THỊ

Phương pháp chỉnh sửa


Có 2 cách để thực hiện chỉnh sửa cho các biểu đồ
1 Ở cửa số Graph , thực hiện như sau:

Ví dụ

VTLU KTL 19 / 49
CHỈNH SỬA ĐỒ THỊ

Phương pháp chỉnh sửa


Khi đó, xuất hiện cửa sổ sau:

Ví dụ

VTLU KTL 20 / 49
CHỈNH SỬA ĐỒ THỊ

Phương pháp 1
Chỉnh sửa bằng các phím công cụ nằm bên trái của cửa sổ:

Ví dụ

VTLU KTL 21 / 49
CHỈNH SỬA ĐỒ THỊ

Phương pháp 2
Click chuột vào đối tượng muốn chỉnh sửa trong menu thả xuống
bên phải ở cửa sổ Graph:

Ví dụ

VTLU KTL 22 / 49
TRỰC QUAN BIẾN RỜI RẠC Hiển thị phân phối của một biến rời rạc

Lệnh histogram

Cú pháp như sau:


. histogram variablename, discrete graph_options
Với các tùy chọn:
frequency – chiều cao của thanh bằng với tần số của thuộc tính tương ứng.
fraction – chiều cao thanh là tỷ lệ (tổng chiều cao các thanh là 1).
percent – chiều cao thanh là tần suất (tổng chiều cao các thanh thanh là 100).
addlabels – hiển thị giá trị của chiều cao thanh (tần số, tỉ lệ hoặc phần trăm).
gap(percent) – Giảm bề rộng thanh theo tỷ lệ phần trăm được chỉ định.

Lưu ý:
Lệnh graph bar không tạo ra một biểu đồ thanh tóm tắt phân phối của
biến rời rạc.
Lệnh graph bar thường được sử dụng để tạo ra một biểu đồ thanh cho
các trị thống kê của một biến liên tục (chẳng hạn, giá trị trung bình).

VTLU KTL 23 / 49
TRỰC QUAN BIẾN RỜI RẠC Hiển thị phân phối của một biến rời rạc

Hiển thị phân phối với lệnh histogram


Biểu đồ thanh cơ bản
Ví dụ
. histogram foreign, discrete

VTLU KTL 24 / 49
TRỰC QUAN BIẾN RỜI RẠC Hiển thị phân phối của một biến rời rạc

Hiển thị phân phối với lệnh histogram


Biểu đồ thanh với các tùy chọn

Ví dụ
. histogram foreign, discrete frequency addlabels xlabel(0 "Domestic" 1
"Foreign") gap(50) title("Bar Graph Summary of Foreign")

VTLU KTL 25 / 49
TRỰC QUAN BIẾN RỜI RẠC Hiển thị phân phối theo nhóm của một biến rời rạc

Lệnh histogram
Cú pháp cơ bản:
. sort groupingvar
. histogram variablename, discrete by(groupingvar)
Ví dụ
. sort foreign
. histogram rep78, discrete by(foreign)

VTLU KTL 26 / 49
TRỰC QUAN BIẾN RỜI RẠC Hiển thị phân phối theo nhóm của một biến rời rạc

Lệnh histogram
Biểu đồ thanh, theo (nhóm) với một số tùy chọn.
Ví dụ
. sort foreign
. histogram rep78, discrete by(foreign) percent addlabels xlabel(1 "1" 2 " 2 " 3
" 3 " 4 " 4 " 5 "5") gap(25) title("Repair Record in 1978") xtitle(" ")

VTLU KTL 27 / 49
TRỰC QUAN BIẾN RỜI RẠC Hiển thị phân phối theo nhóm của một biến rời rạc

Lệnh catplot

Ở cửa sổ lệnh, install gói lệnh mới bằng cách nhập


. help catplot
hoặc
. findit catplot

Cú pháp
. catplot variablename groupingvar
. catplot variablename groupingvar, recast(bar)
. catplot variablename groupingvar, recast(dot)

Các tùy chọn của catplot tương tự các đồ thị khác.

VTLU KTL 28 / 49
TRỰC QUAN BIẾN RỜI RẠC Hiển thị phân phối theo nhóm của một biến rời rạc

Lệnh catplot
Vẽ đồ thị theo mặc định của Stata

Ví dụ
. catplot rep78 foreign

VTLU KTL 29 / 49
TRỰC QUAN BIẾN RỜI RẠC Hiển thị phân phối theo nhóm của một biến rời rạc

Lệnh catplot
Vẽ đồ thị với các tùy chọn

Ví dụ
. catplot rep78 foreign

VTLU KTL 30 / 49
TRỰC QUAN BIẾN RỜI RẠC Hiển thị phân phối theo nhóm của một biến rời rạc

Lệnh graph combine

Biểu đồ thanh "grouped" được gọi là biểu đồ thanh "phân tầng".


Biến xác định các nhóm được gọi là
biến nhóm hoặc biến phân tầng .
Lệnh graph combine được thực hiện theo các bước sau:

1 Tạo các biểu đồ riêng lẻ.


Trong mỗi biểu đồ riêng lẻ, đặt các mốc giá trị trên trục Y giống nhau .
Đặt tên cho từng biểu đồ riêng lẻ bằng lệnh name với cú pháp:
. name (yourchoice, replace)
2 Kết hợp các biểu đồ bằng cách nhập lệnh:
. graph combine yourchoice1, yourchoice2, . . .
3 Lưu biểu đồ vừa được tạo

VTLU KTL 31 / 49
TRỰC QUAN BIẾN RỜI RẠC Hiển thị phân phối theo nhóm của một biến rời rạc

Lệnh graph combine


. label define foreignname 1 Foreign 0 Domestic
. label values foreign foreignname
Vẽ đồ thị thứ 1 và đặt tên là foreigncb1
Ví dụ
. sort foreign
. histogram rep78 if foreign==1, discrete title("Foreign") name(foreigncb1,
replace)

VTLU KTL 32 / 49
TRỰC QUAN BIẾN RỜI RẠC Hiển thị phân phối theo nhóm của một biến rời rạc

Lệnh graph combine


Vẽ đồ thị thứ 2 và đặt tên là foreigncb2

Ví dụ
. histogram rep78 if foreign==0, discrete title("Domestic") name(foreigncb2,
replace)

VTLU KTL 33 / 49
TRỰC QUAN BIẾN RỜI RẠC Hiển thị phân phối theo nhóm của một biến rời rạc

Lệnh graph combine


Kết hợp hai đồ thị trên một biểu đồ

Ví dụ
. graph combine foreigncb1 foreigncb2, name(foreigncb12, replace)

VTLU KTL 34 / 49
TRỰC QUAN BIẾN LIÊN TỤC Biểu đồ chấm

Biểu đồ chấm bằng lệnh Dotplot

Cung cấp một đồ họa cho phân phối các giá trị của một biến.

Cú pháp
Vẽ đồ thị cho một biến
. dotplot variablename, graph_options
Vẽ đồ thị theo nhóm
. sort groupingvar
. dotplot variablename, over(groupingvar) graph_options

Các tùy chọn của đồ thị này tương tự các tùy chọn chung cho đồ
thị trên Stata.

VTLU KTL 35 / 49
TRỰC QUAN BIẾN LIÊN TỤC Biểu đồ chấm

Biểu đồ chấm cho một biến liên tục

Ví dụ
. dotplot weight, title("Dot Plot of Weight") msymbol(o)

VTLU KTL 36 / 49
TRỰC QUAN BIẾN LIÊN TỤC Biểu đồ chấm

Biểu đồ chấm phân nhóm

Ví dụ
. sort foreign
. dotplot weight, over(foreign) title("Dot Plot of Weight") msymbol(o)

VTLU KTL 37 / 49
TRỰC QUAN BIẾN LIÊN TỤC Biểu đồ thân và lá

Lệnh stem và stemplot

Cú pháp
Vẽ đồ thị thân lá cho một biến liên tục:
.stem continuousvariable, graph_options
Vẽ đồ thị thân lá theo nhóm:
. sort groupingvar
. stemplot continuousvariable, by(groupingvar) graph_options

Tùy chọn đồ thị của stemplot:


back – tạo đồ thị thân và lá "back-to-back"
lines(#) – Số lượng thân trên mỗi khoảng 10 chữ số
digits(#) – số chữ số trên một lá; mặc định là 1
Các tùy chon đồ thi chung của 2 đồ thị này tương tự như các đồ thị
khác.
VTLU KTL 38 / 49
TRỰC QUAN BIẾN LIÊN TỤC Biểu đồ thân và lá

Lệnh stem
Đồ thị thân lá của một biến liên tục

Ví dụ
. stem mpg

VTLU KTL 39 / 49
TRỰC QUAN BIẾN LIÊN TỤC Biểu đồ thân và lá

Lệnh stemplot

Ví dụ
. sort foreign
. stemplot mpg, by(foreign) back digits(2)

VTLU KTL 40 / 49
TRỰC QUAN BIẾN LIÊN TỤC Đồ thị hộp râu

Cú pháp cơ bản

Cú pháp
Đồ thị hộp râu cho một biến
Dạng đứng:
. graph box continuousvariable, graph_options
Dạng ngang:
. graph hbox continuousvariable, graph_options
Đồ thị hộp râu theo nhóm
. sort groupingvar
Dạng đứng:
. graph box variablename, over(groupingvar)
Dạng ngang:
. graph hbox variablename, over(groupingvar)

VTLU KTL 41 / 49
TRỰC QUAN BIẾN LIÊN TỤC Đồ thị hộp râu

Cho một biến liên tục

Ví dụ
. graph box weight, title("Đồ thị hộp râu dạng đứng")

VTLU KTL 42 / 49
TRỰC QUAN BIẾN LIÊN TỤC Đồ thị hộp râu

Đồ thị hộp râu theo nhóm

Ví dụ
. sort foreign
. graph box weight, over(foreign) title("Đồ thị hộp râu dạng đứng theo nhóm")

VTLU KTL 43 / 49
TRỰC QUAN BIẾN LIÊN TỤC Biểu đồ tần suất

Lệnh Histogram

Cú pháp
. histogram continuousvariable, graph_options

Ví dụ
. histogram weight

VTLU KTL 44 / 49
TRỰC QUAN BIẾN LIÊN TỤC Biểu đồ tần suất

Hiển thị cho một biến

Ví dụ
. histogram weight, width(1000) start(1500) frequency addlabels title("Histogram
of weight)

VTLU KTL 45 / 49
TRỰC QUAN BIẾN LIÊN TỤC Đồ thị phân tán

Lệnh grap twoway

Cú pháp
graph twoway (scatter yvar xvar, plot_options) (plot_choice,
plot_options), graph_options

Ví dụ
. graph twoway (scatter mpg weight, msymbol(o)), title("Đồ thị phân tán")

VTLU KTL 46 / 49
TRỰC QUAN BIẾN LIÊN TỤC Đồ thị phân tán

Lệnh graph twoway

Ví dụ
. graph twoway (scatter mpg weight, msymbol(o)) (lfit mpg weight), title("Đồ thị
phân tán") subtitle("với đường ước lượng tuyến tính")

VTLU KTL 47 / 49
TRỰC QUAN BIẾN LIÊN TỤC Đồ thị phân tán

Lệnh graph twoway


Ví dụ
. graph twoway (scatter mpg weight, msymbol(o)) (lfitci mpg weight), title("Đồ
thị phân tán") subtitle("với đường ước lượng tuyến tính và khoảng ước lượng
95%")

VTLU KTL 48 / 49
TRỰC QUAN BIẾN LIÊN TỤC Đồ thị ma trận

Lệnh graph matrix

Cú pháp
. graph matrix variable1 variable2 variable3, graph_options

Ví dụ
. graph matrix mpg weight length, msymbol(p) title("Matrix Plot")

VTLU KTL 49 / 49

You might also like