T NG H P Đánh Giá Tác Đ NG

You might also like

Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 46

BỘ GIÁO DỤC VÀ ĐÀO TẠO

ĐẠI HỌC UEH

TRƯỜNG KINH TẾ, LUẬT VÀ QUẢN LÝ NHÀ NƯỚC

KHOA KINH TẾ
----------

DỰ ÁN CUỐI KỲ

ĐÁNH GIÁ TÁC ĐỘNG


CÁC CHƯƠNG TRÌNH PHÁT TRIỂN

Giảng viên hướng dẫn : ThS.Lương Vinh Quốc Duy

Mã lớp học phần : 23D1ECO50101501


Sinh viên thực hiện : Nguyễn Dương
: Trần Thị Thanh Thảo
: Dương Nữ Khánh Thương

Thành phố Hồ Chí Minh, 6/2023


ĐÓNG GÓP CỦA THÀNH VIÊN

Các bài tập Bài thi kết


Họ và tên Mã sinh viên
trên lớp thúc học phần
Nguyễn Dương 31201020228 10 10
Trần Thị Thanh Thảo 31201020543 10 10
Dương Nữ Khánh Thương 31201020565 10 10
Câu 1: Đọc 2 bài báo bên dưới và xác định target population tương ứng cho từng bài:

Bài 1 – “Assessing the microeconomic effects of public subsidies on the performance of


firms in the czech food processing industry: A counterfactual impact evaluation”

Target population: Các doanh nghiệp trong ngành chế biến thực phẩm tại Cộng hòa Séc.

Bài 2 – “The Impact of Extension Services on Farm-level Income: An Instrumental


Variable Approach to Combat Endogeneity Concerns”

Target population: Các trang trại của hộ nông dân tại Ireland

Câu 2: Dựa vào bối cảnh trong 2 bài báo ở Câu 1, hãy cho biết phương pháp định lượng
nào trong 4 phương pháp đã học có thể thay thế/bổ sung cho phương pháp mà các tác giả
đã sử dụng. Giải thích dựa vào đặc điểm của phương pháp và bối cảnh của bài báo đó.

Bài 1 – “Assessing the microeconomic effects of public subsidies on the performance of


firms in the czech food processing industry: A counterfactual impact evaluation”

Phương pháp đang sử dụng: Phương pháp khác biệt trong khác biệt (Diffence in
Diffences) và Phương pháp So sánh điểm xu hướng (Propensity Score Matching)

Đề xuất: Phương pháp Biến công cụ (Instrumental Variables):

Giải thích:

 Dữ liệu: Trang 11 của bài báo có đề cập rằng “Nói chung, các đề xuất phải đáp ứng
một số tiêu chí để được phê duyệt. Các doanh nghiệp không thể có bất kỳ khoản nợ
nào đối với các cơ quan công quyền, và không phải vật lộn với bất kỳ vấn đề tài chính
nào. Các hồ sơ đáp ứng yêu cầu về mặt hình thức sẽ được đánh giá bởi Hội đồng thẩm
định do Bộ Công Thương giám sát”. Có thể thấy, các dự án tham gia chương trình
OPEI sẽ phải thông qua đánh giá và thẩm định của cơ quan chuyên môn, vì vậy khó
có thể đảm bảo được yêu cầu về tính ngẫu nhiên của phương pháp ngẫu nhiên
(Randomization). Điều này có thể dẫn đến sự đánh giá sai lệch của tác động nếu sử
dụng phương pháp ngẫu nhiên, vì vậy nhóm không chọn phương pháp này để thay
thế/bổ sung.
 Trong bối cảnh bài nghiên cứu, phương pháp biến công cụ (IV) có thể cung cấp kết
quả đáng tin cậy khi dữ liệu quan sát có sẵn mà không yêu cầu việc tiến hành thử
nghiệm ngẫu nhiên và cho phép xác định mối quan hệ nhân quả giữa OPEI và hiệu
quả tài chính của các doanh nghiệp được hỗ trợ. Biến công cụ phải đảm bảo rằng: chỉ
ảnh hưởng đến yếu tố lựa chọn tham gia chương trình OPEI nhưng không có liên hệ
với những yếu tố ảnh hưởng đến hiệu quả tài chính của doanh nghiệp.

Bài 2 – “The Impact of Extension Services on Farm-level Income: An Instrumental


Variable Approach to Combat Endogeneity Concerns”

Phương pháp đang sử dụng: Phương pháp Biến công cụ (IV) để thực hiện đánh giá tác
động của dịch vụ khuyến nông.

Đề xuất: Phương pháp Khác biệt trong khác biệt (DID)

Giải thích:

Dựa vào bối cảnh của bài báo ta có thể thấy “Các thành kiến lựa chọn tiềm ẩn trong
nghiên cứu này với động cơ tham gia mở rộng là một yếu tố quan trọng trong việc ước
tính tác động (Nordin and Ho ̈jga ̊rd 2016). Ví dụ, những nông dân có năng lực hơn có thể
có động cơ tham gia nhiều hơn vào các dịch vụ khuyến nông để nâng cao hiệu quả hoạt
động của họ, trong khi những nông dân yếu hơn có thể ít tham gia hơn.” (Trang 2) và
“Mẫu được gộp lại để tập trung vào những nông dân đã tham gia mẫu Khảo sát Trang trại
Quốc gia Teagasc (NFS) trước khi thay đổi chính sách nhưng chỉ trở thành khách hàng
của Teagasc sau đó. Điều này làm tăng khả năng so sánh của những khách hàng này vì họ
có nhiều khả năng được thúc đẩy tham gia vào một chương trình mở rộng do chính sách
thay đổi, trái ngược với các động cơ “truyền thống” đa dạng khác (L€apple, Hennessy, và
Newman 2013). Điều này làm rõ trọng tâm của nghiên cứu bằng cách đảm bảo phân tích
được tiến hành trên một nhóm khách hàng mở rộng tương tự.” (Trang 4)

 Từ 2 dẫn chứng trên thì bài nghiên cứu lựa chọn địa điểm triển khai dự án là có
chủ ý ngay từ ban đầu, và người dân tự quyết định mình thuộc nhóm tham gia hay
không tham gia do đó không thể thực hiện phương pháp Ngẫu nhiên để đánh giá
tác động của dịch vụ khuyến nông.

Bên cạnh đó, “Nghiên cứu trước sử dụng mô hình chuyển đổi nội sinh, trong khi nghiên
cứu sau sử dụng các phương pháp so khớp điểm xu hướng để giải quyết vấn đề nội sinh
bằng cách sử dụng bộ dữ liệu bảng. Davis và cộng sự (2012) cũng tìm thấy một tác động
tích cực khi sử dụng phương pháp đối sánh điểm xu hướng xác định mức tăng thu nhập
từ 21% đến 104% ở các quốc gia châu Phi được chọn. Những nghiên cứu này chấp nhận
sự tham gia mở rộng như một biến nhị phân dựa trên sự tham gia. Phương pháp mô hình
chuyển đổi dựa trên kỳ vọng có điều kiện về tác động dựa trên việc không tham gia
chương trình khuyến nông so với kết quả thực tế. Ưu điểm chính của mô hình chuyển đổi
là nó chống lại các khuynh hướng tự lựa chọn nhưng nó dựa trên trường hợp giả định của
một kết quả. Phương pháp so sánh điểm xu hướng có hiệu quả nhưng dựa trên một số
bước quyết định dựa trên chất lượng dữ liệu và các giả định cơ bản thường liên quan đến
sự đánh đổi giữa sai lệch và hiệu quả (Caliendo và Kopeinig 2008).” (Trang 5) và
Teagasc NFS là nguồn dữ liệu bảng hàng năm được thu thập như một phần của Mạng Dữ
liệu Kế toán Trang trại (FADN) theo yêu cầu của Liên minh Châu Âu. NFS bao gồm
khoảng 1.100 trang trại mỗi năm đại diện cho khoảng 110.000 trang trại của người dân ở
Ireland (L€apple và Hennessy 2015) (Trang 9).

 Từ trích dẫn trong bài nghiên cứu ta có thể thấy rằng có sự hạn chế trong việc sử
dụng phương pháp so sánh điểm xu hướng có thể dẫn đến sự sai lệch về kết quả
đánh giá và nguồn dữ liệu của bài nghiên cứu thì không đủ lớn để bù đắp số quan
sát bị hao hụt trong quá trình so sánh điểm xu hướng.

Từ đó, phương pháp khác biệt trong khác biệt có thể được bổ sung vào để làm nghiên cứu
có độ cậy cao hơn.
Câu 3:

Câu chuyện xảy ra tại một quốc gia B thuộc nhóm quốc gia có mức thu nhập dưới trung
bình của thế giới. Năm 2014, Bộ Sức Khỏe và Bộ Xã Hội thảo luận về việc triển khai dự
án khuyến khích người dân tham gia mua bảo hiểm y tế cho cả gia đình (gọi tắt là “Dự án
BHYT”). Dự án BHYT sẽ hoàn trả một phần chi phí dịch vụ y tế phát sinh trong năm của
hộ có mua BHYT. Các nhà hoạch định chính sách của chính phủ cho rằng dự án này là
cần thiết bởi vì việc tham gia vào Dự án BHYT có thể giúp người dân giảm bớt gánh
nặng chi tiêu cho y tế khi các hộ dân có nhu cầu chăm sóc sức khỏe cho các thành viên
trong gia đình.

Hiện tại, BHYT chỉ có hiệu lực tại các bệnh viện và cơ sở y tế của nhà nước. Trong khi
đó, bệnh nhân đến khám và chữa bệnh tại bệnh viện và các cơ sở y tế của nhà nước
thường phải chờ đợi lâu hơn so với lựa chọn đến khám tại các cơ sở y tế tư nhân. Đây là
một trong những lý do khiến người dân cân nhắc giữa quyết định mua hay không mua
BHYT.

 Các nội dung của Dự án BHYT như sau:

(1) Tuyên truyền rộng rãi trên các phương tiện thông tin đại chúng về lợi ích của việc
tham gia mua BHYT cho cả gia đình.

(2) Đưa các nhân viên y tế đến tận khu dân cư để vận động các hộ dân tham gia mua
BHYT cho cả gia đình.

(3) Thiết lập và vận hành đường dây nóng giải đáp thắc mắc của người dân về BHYT.

Dự án bắt đầu triển khai vào đầu năm 2015. Đến quý 3 năm 2019 Ban quản lý dự án
(gồm nhân viên từ cả hai Bộ) nhận được công văn của chính phủ yêu cầu tiến hành đánh
giá tác động của dự án BHYT. Một cuộc họp giữa các chuyên viên của hai Bộ diễn ra
ngay lập tức để bàn về việc lựa chọn phương pháp và cách tiến hành đánh giá tác động
Dự án BHYT đối với các hộ có tham gia BHYT. Trong tay các chuyên viên có bộ dữ liệu
được chọn mẫu khảo sát vào quý 4 năm 2019. Bộ dữ liệu 2019 này có thông tin về các hộ
có BHYT và các hộ không có BHYT, cụ thể gồm các biến trong bảng bên dưới:
Bảng 1. Mô tả các biến

Tên biến Giải thích ý nghĩa

id Mã số của hộ

income Tổng thu nhập của hộ trong năm 2019 (ngàn ĐVT)

Tổng chi tiêu cho sức khỏe trong năm 2019 của hộ (ngàn ĐVT).
exptot_health
Đây là giá trị ròng (net value).

agehead Tuổi của chủ hộ

Tình trạng hôn nhân của chủ hộ (1: đang có vợ/chồng, 2: độc thân,
married
3: khác)

Tham gia hoạt động xã hội (1: hộ có tham gia một hội/nhóm xã hội
network (ví dụ như hội nông dân, hội từ thiện, hội doanh nghiệp nhỏ…), 0:
hộ không tham gia bất kỳ tổ chức xã hội nào)

Bằng cấp cao nhất của chủ hộ (0: không được đi học, 1: tương
educhead đương tiểu học 1, 2: tương đương trung học cơ sở, 3: tương đương
trung học phổ thông, 4: cao đẳng/đại học)

genderhead Giới tính của chủ hộ (1: Nữ, 0: Nam)

famsize Tổng số người trong hộ

house_size Diện tích nơi cư trú của hộ (m2)

internet Hộ có thuê bao đường truyền internet hay không (0: không, 1: có)

Hộ có mua bảo hiểm y tế cho tất cả các thành viên hay không (0:
insurance
không, 1: có)
Tình hình sức khỏe của các thành viên trong hộ (0: trong năm 2019
không có thành viên phải đi thăm khám tại các sơ sở y tế, 1: trong
sickness
năm 2019 có ít nhất một thành viên phải đi thăm khám tại các sơ sở
y tế)

Tình trạng nghề nghiệp của chủ hộ (0: đang thất nghiệp, 1: đang có
job nguồn thu từ một việc làm, 2: đang có nguồn thu từ hai việc làm, 3:
đang có nguồn thu từ ba việc làm)

water Hộ có tiếp cận nguồn nước máy hay không (0: không, 1: có)

urban Nơi sinh sống của hộ (0: nông thôn, 1: thành thị)

saving Hộ có gửi tiết kiệm tại ngân hàng hay không (0: không, 1: có)

Thời gian di chuyển từ nơi cư trú đến bệnh viện hoặc cơ sở y tế của
distance
nhà nước gần nhất (phút)

free_day Số ngày rảnh bình quân/tháng của chủ hộ

a.     Phương pháp định lượng nào trong môn học nên được sử dụng để đánh giá tác
động (có thể chọn nhiều hơn một phương pháp)? Thuyết minh sự lựa chọn dựa vào
đặc điểm của phương pháp và bối cảnh được cung cấp.

Dựa vào bối cảnh đề tài và dữ liệu được cung cấp, nhóm quyết định sử dụng Phương
pháp Biến công cụ (IV) và Phương pháp So sánh điểm xu hướng (PSM) để đánh giá
tác động của dự án BHYT:

PHƯƠNG PHÁP BIẾN CÔNG CỤ (IV)

Theo như bài báo The Impact of Health Insurance Programs on Out-of-Pocket
Expenditures in Indonesia: An Increase or a Decrease? (Trang 3)

Cho đến nay, nhiều nghiên cứu đã sử dụng các phương pháp kinh tế lượng để giải quyết
các vấn đề này. Wagstaff đã sử dụng phương pháp so sánh khác biệt để đo lường tác
động của quỹ chăm sóc sức khỏe cho người nghèo tại Việt Nam và phát hiện ra rằng
chương trình này đã giảm chi tiêu tự túc. Shaefer và cộng sự đã sử dụng phương pháp
biến công cụ (IV) để nghiên cứu tác động của việc chuyển từ bảo hiểm y tế tư nhân sang
bảo hiểm y tế công cộng đối với trẻ em đến chi phí tự túc và phí bảo hiểm tại Mỹ, và phát
hiện ra rằng những sự chuyển đổi này mang lại một khoản chuyển nhượng tương đương
tiền mặt hàng năm gần 1.500 đô la Mỹ dưới hình thức giảm chi tiêu. Hơn nữa, Sepehri và
cộng sự kết luận rằng việc không xác định được tình thể nguyên nhân dẫn đến kết quả
nghiên cứu khác nhau so với luận điểm cơ bản rằng bảo hiểm y tế loại bỏ chi tiêu quá
mức của hộ gia đình cho chăm sóc sức khỏe. (Trang 3)

Đề xuất theo bối cảnh: Vì dữ liệu không được thu thập ở năm gốc nên phương pháp
ngẫu nhiên và Phương pháp khác biệt trong khác biệt là không khả thi.

Theo như bài báo Assessing the Impact of Health Insurance and Other Socioeconomic
Factors on Inequality in Health Care Expenditures among Farm Households: “Những
nghi ngờ về tính nội sinh phát sinh do các yếu tố không quan sát được nắm bắt trong
thuật ngữ sai số của từng mô hình có khả năng tương quan với các yếu tố quyết định
được quan sát của chúng. Biến giải thích đầu tiên như vậy trong phần đầu tiên của mô
hình về việc hộ nông dân có chi tiêu cho chăm sóc sức khỏe hay không (Pr(HC > 0 | x))
là một biến giả, di cho biết tình trạng bao phủ bảo hiểm y tế (di = 1 khi hộ gia đình có bảo
hiểm y tế; di = 0 nếu không có bảo hiểm y tế). Để kiểm tra khả năng di là nội sinh trong
mô hình hồi quy nhị phân và, nếu vậy, để giải thích cho nó, chúng tôi sử dụng quy trình
ước tính biến công cụ (IV) hai bước do Vella (1993) đề xuất.” (Trang 13)

Tương tự như trong bối cảnh của việc đánh giá tác động chương trình BHYT này, người
dân có quyền tự quyết định mình có nên mua bảo hiểm hay không. Lý do này dẫn đến sự
lựa chọn có thể quan sát hoặc không quan sát được. Bên cạnh đó, chúng ta cũng có thể
nghi ngờ mối quan hệ đồng thời giữa các biến, khi mà thời gian di chuyển từ nơi cư trú
đến bệnh viện hoặc cơ sở y tế của nhà nước gần nhất (distance) và quyết định tham gia
chương trình BHYT có thể tồn tại mối quan hệ chặt chẽ với nhau; chúng ta có thể xem
xét mối quan hệ đồng thời giữa số ngày rảnh bình quân/ tháng của chủ hộ (free_day), hộ
có thuê bao đường truyền internet hay không (internet), hộ có tham gia hoạt động xã hội
hay không (network),... Từ đó, có thể xuất hiện hiện tượng nội sinh (endogeneity) trong
mô hình và cần phương pháp Biến công cụ để kiểm tra điều đó.

Đề xuất theo đặc điểm của phương pháp: Phương pháp IV giúp giải quyết vấn đề lẫn
tác động (endogeneity), tức là sự tương quan giữa biến can thiệp và biến kết quả. Trong
trường hợp của bạn, khi xem xét tác động của việc tham gia BHYT đối với các hộ gia
đình, có thể có những yếu tố khác có thể ảnh hưởng đến cả việc tham gia BHYT và kết
quả sức khỏe. Phương pháp IV có thể giúp loại bỏ sự tác động của những yếu tố này và
đánh giá tác động của việc tham gia BHYT một cách cân nhắc hơn.

Đáng tin cậy với giả định hợp lý: phương pháp IV có thể mang lại kết quả đáng tin cậy và
tạo ra sự phân biệt giữa tác động gây ra bởi việc tham gia BHYT và các yếu tố khác có
thể ảnh hưởng đến kết quả sức khỏe. Và cho phép bạn xem xét tác động gây ra bởi việc
tham gia BHYT thông qua biến công cụ, khi mà biến công cụ Z chỉ ảnh hưởng đến các
yếu tố lựa chọn tham gia chương trình nhưng không có liên hệ với những yếu tố ảnh
hưởng đến kết quả Y.

Mục tiêu của Biến công cụ là làm sạch tương quan giữa các biến độc lập trong mô hình.
Để làm được điều này, ta cần tìm được một biến công cụ thoả mã điều kiện: ảnh hưởng
đến yếu tố lựa chọn tham gia chương trình nhưng không có liên hệ với những yếu tố ảnh
hưởng đến kết quả Y. Từ đó, ta để xuất được 3 khả năng được xem xét như biến công cụ
là: distance, network, free_day.

PHƯƠNG PHÁP SO SÁNH ĐIỂM XU HƯỚNG (PSM)

Theo như bài báo Participating in health insurance and health improvements for the
relatively poor population: A propensity score analysis. (Trang 4)

PSM được đề xuất bởi Rosenbaum và Rubin (28), và người ta cho rằng điểm xu hướng là
xác suất có điều kiện bị ảnh hưởng bởi một biến giải thích dưới sự kiểm soát của nhiều
biến gây nhiễu có thể quan sát được.

Phương pháp so sánh điểm xu hướng là một phương pháp thống kê mới phổ biến cho
khoa học xã hội. Phương pháp này cho phép các nhà nghiên cứu tập trung vào việc thực
hiện can thiệp biến độc lập phân bổ ngẫu nhiên, có thể khắc phục vấn đề lựa chọn; đồng
thời, nó có thể tối đa hóa giới hạn cho các biến gây nhiễu và làm cho xác suất xảy ra sự
kiện ở nhóm can thiệp và nhóm đối chứng gần nhau để đạt được mục đích của thí nghiệm
mô phỏng.

Ngoài ra, vai trò của việc đối sánh điểm xu hướng nằm ở việc xây dựng một “khuôn khổ
phản thực”. Các sự xuất hiện của một sự kiện mà một cá nhân trải qua có thể phụ thuộc
vào hai trạng thái trái ngược nhau. Chúng ta có thể sử dụng PSM để xây dựng một “phản
thực của việc sử dụng internet, tình trạng hút thuốc, tình trạng uống rượu, thời gian làm
việc nhà, thời gian xem TV, quy mô gia đình, tình trạng trả nợ ngân hàng và mức thu
nhập gia đình được chọn làm biến kiểm soát. PSM được đề xuất bởi Rosenbaum và
Rubin (28), và người ta cho rằng điểm xu hướng là xác suất có điều kiện bị ảnh hưởng
bởi một biến giải thích dưới sự kiểm soát của nhiều biến gây nhiễu có thể quan sát được.

 Do đó, phương pháp PSM có thể đưa các biến gây nhiễu này vào mô hình logit để
dự đoán giá trị xu hướng và sau đó kiểm soát giá trị xu hướng để giảm thiểu suy
luận nhân quả sai lệch do sai lệch lựa chọn gây ra.

Đề xuất theo bối cảnh: Dữ liệu không được thu thập ở năm gốc, nên việc đánh giá tác
động theo phương pháp Ngẫu nhiên và Khác biệt trong khác biệt hoàn toàn là không khả
thi. Ngoài phương pháp biến công cụ đã được chọn ở phần trên, nghiên cứu có thể được
bổ sung bởi phương pháp so sánh điểm xu hướng (PSM).

Đề xuất theo đặc điểm của phương pháp: Phương pháp So sánh điểm xu hướng (PSM)
cho phép xác định nhóm không tham gia (comparison group) tương đồng với nhóm tham
gia (treatment group) để tiến hành thực hiện so sánh. Phương pháp ngẫu nhiên được cho
là phương pháp đánh giá tác động hoàn thiện. Tuy nhiên, trong bối cảnh không có dữ liệu
ở năm gốc, thì giải pháp tốt nhất kế tiếp là phương pháp So sánh điểm xu hướng bằng
cách tạo ra hai nhóm tương đồng để so sánh và dựa vào mô hình logit.

Lập luận các biến trong mô hình:


Việc lựa chọn các biến độc lập được dựa vào các lập luận, lý thuyết đã được trình bày
trong các nghiên cứu trước đây. Chúng tôi đã trích dẫn một vài lập luận, lý thuyết trong
các bài báo sau:

 educhead: Theo như bài báo Assessing the Impact of Health Insurance and Other
Socioeconomic Factors on Inequality in Health Care Expenditures among Farm
Households – Việc xem xét giáo dục như một yếu tố góp phần vào sự bất bình đẳng
trong chi tiêu chăm sóc sức khỏe phù hợp với báo cáo của Liên Hợp Quốc năm 2002
lưu ý rằng các hộ gia đình có trình độ học vấn hạn chế dễ bị ốm yếu và khuyết tật
giữa các thành viên trong gia đình, biến động giá cả và tín dụng cũng như thiên tai.
Hơn nữa, khái niệm về mối liên hệ tích cực này giữa kết quả sức khỏe và việc học
hành cũng như tác động bất lợi của nó đối với chi phí chăm sóc sức khỏe đã được
kiểm tra và luôn được xác nhận trong một số nghiên cứu (ví dụ: Clark và Royer
2010, Conti, Heckman và Urzua 2010, Altindag, Cannonier và Mocan 2011). (Trang
6)
Theo một bài báo khác Participating in health insurance and health improvements
for the relatively poor population: A propensity score analysis – Trình độ học vấn,
tình trạng hôn nhân, tình trạng làm việc, tình trạng hút thuốc, tình trạng uống rượu,
thời gian xem TV, thời gian làm việc nhà, quy mô gia đình, tình trạng trả nợ ngân
hàng, mức thu nhập gia đình và các biến số khác có tác động đáng kể đến xác suất
tham gia BHYT. (Trang 5)
 income: Theo như bài báo Assessing the Impact of Health Insurance and Other
Socioeconomic Factors on Inequality in Health Care Expenditures among Farm
Households – Mối liên hệ tích cực giữa chi phí chăm sóc sức khỏe cao và thu nhập
cao giữa các bang không có gì đáng ngạc nhiên vì mối liên hệ tương tự đã được tìm
thấy ở nhiều quốc gia khác nhau (Fosler 2012). (Trang 7)
Cũng theo bài báo này, tỷ lệ mắc bệnh và tử vong sớm tăng lên có thể là do mối
tương quan thuận giữa tình trạng nghèo về thu nhập và các hành vi không lành mạnh
(ví dụ: béo phì do tiêu thụ thực phẩm tương đối kém lành mạnh, lười vận động, hút
thuốc và/hoặc uống rượu ), đã được tìm thấy trong một số nghiên cứu trong tài liệu
liên quan đến sức khỏe (Meara, Seth và Cutler 2008), hoặc khó tiếp cận dịch vụ chăm
sóc sức khỏe và/hoặc thiếu bảo hiểm y tế. (Trang 7)
Theo bài báo Participating in health insurance and health improvements for the
relatively poor population: A propensity score analysis – So với những người có tình
trạng kinh tế xã hội cao hơn và trung bình, những người có tình trạng kinh tế xã hội
thấp hơn có thể bị sức khỏe thể chất kém hơn do căng thẳng xã hội gia đình cao hơn
và khả năng kiểm soát căng thẳng thấp hơn. (Trang 6)
 sickness: Theo như bài báo Assessing the Impact of Health Insurance and Other
Socioeconomic Factors on Inequality in Health Care Expenditures among Farm
Households – Chi phí chăm sóc sức khỏe của các cá nhân có thể tương quan với tình
trạng sức khỏe hiện tại của họ, điều này cho thấy rằng những người khỏe mạnh sẽ có
xu hướng chi ít hoặc không chi tiền cho các lần khám bác sĩ để điều trị bệnh. điều
kiện liên quan đến bệnh tật. (Seshamani, Lambrew và Antos 2008). (Trang 9)
Theo như bài báo The Impact of Health Insurance Programs on Out-of-Pocket
Expenditures in Indonesia: An Increase or a Decrease? – Tình trạng sức khỏe là một
trong những yếu tố quyết định kết thúc hành động tìm kiếm sức khỏe. Những người
bị bệnh có nhiều khả năng tìm kiếm các dịch vụ chăm sóc sức khỏe từ các nhà cung
cấp truyền thống hoặc hiện đại hơn những người khỏe mạnh. Gotsadzeet al xác nhận
rằng mức độ nghiêm trọng của bệnh tật được nhận thức là một yếu tố quan trọng làm
tăng khả năng tìm kiếm sự chăm sóc sức khỏe. Những bệnh nhân có mức độ cảm
nhận về bệnh tật cao có nhiều khả năng tìm kiếm dịch vụ chăm sóc sức khỏe hơn
những người có mức độ nhận thức về bệnh tật thấp, điều này cho thấy rằng những
bệnh nhân có mức độ cảm nhận nhận về bệnh tật cao hơn sẽ chi tiêu nhiều hơn hoặc
có chi phí y tế cao hơn so với những người có mức độ cảm nhận về bệnh tật thấp
hơn. (Trang 7)
 agehead: Theo như bài báo Assessing the Impact of Health Insurance and Other
Socioeconomic Factors on Inequality in Health Care Expenditures among Farm
Households – Những người điều hành trang trại lớn tuổi hơn, bao gồm cả những
người thuộc thế hệ bùng nổ trẻ em (50–64 tuổi), dường như chi tiêu nhiều hơn cho
chăm sóc sức khỏe so với những người điều hành trang trại dưới 35 tuổi, có thể là do
vị trí kinh tế thuận lợi (El-Osta và Morehart 2009). Kết quả này phù hợp với các mẫu
cho dân số Hoa Kỳ nói chung (Foster và Kreisler 2011, Cohen và Yu 2012, Health
Care Cost Institute 2012) và được hỗ trợ bởi bằng chứng từ mẫu ARMS. (Trang 21)
 married: Theo như bài báo Assessing the Impact of Health Insurance and Other
Socioeconomic Factors on Inequality in Health Care Expenditures among Farm
Households – Các chủ hộ gia đình nông dân là người da trắng và chưa lập gia đình
(dự kiến đối với các cá nhân độc thân (Hawk 2011)) có xu hướng chi tiêu ít hơn cho
chăm sóc sức khỏe ($558 và ít hơn khoảng $1.700 mỗi năm, tương ứng, dựa trên các
tác động cận biên ước tính ) so với những người không phải là người da trắng và đã
kết hôn. (Trang 21)
 insurance: Theo như bài báo Assessing the Impact of Health Insurance and Other
Socioeconomic Factors on Inequality in Health Care Expenditures among Farm
Households – Sự hiện diện của bảo hiểm y tế ngay cả khi hộ gia đình chi trả toàn bộ,
đồng ý với quan điểm thường được chấp nhận rằng thiếu bảo hiểm y tế là một trong
những nguyên nhân chính dẫn đến chênh lệch cả về kết quả chăm sóc sức khỏe và chi
phí y tế. Những người không có bảo hiểm có nhiều khả năng trì hoãn và/hoặc không
được chăm sóc y tế, chăm sóc phòng ngừa và dùng thuốc theo toa (Tu 2004, Kaiser
Commission on Medicaid and the Uninsured 2011). (Trang 25)
Theo như bài báo Participating in health insurance and health improvements for the
relatively poor population: A propensity score analysis – Những người tham gia
BHYT chi tiêu ít hơn cho chăm sóc sức khỏe dự phòng, từ đó làm nổi bật các cơ chế
khả thi mà qua đó tình trạng sức khỏe được thay đổi bằng bảo hiểm y tế. (Trang 9)
 genderhead: Theo như bài báo Assessing the Impact of Health Insurance and Other
Socioeconomic Factors on Inequality in Health Care Expenditures among Farm
Households – Tỷ lệ đóng góp kết hợp của các đặc điểm nhân khẩu học và cấu trúc gia
đình được đại diện bởi những người điều hành trong nhóm tuổi bùng nổ dân số,
những người có trình độ học vấn cao và chủ hộ nam chưa lập gia đình là 23 phần
trăm. (Trang 23)
 exptot_health: Theo như bài báo Heterogeneous Impacts of Basic Social Health
Insurance on Medical Expenditure: Evidence from China’s New Cooperative
Medical Scheme – Kết quả trong bảng 4 cho thấy, ở mức tin cậy 90%, các biến độc
lập như: income, agehead, sickness và insurance đều có ý nghĩa thống kê và tác động
đến chi phí y tế nên đây được xem là yếu tố để đánh giá tác động giữa đối tượng
tham gia và không tham gia chương trình Dự án BHYT. (Trang 7)

Theo như bài báo The Impact of Health Insurance Programs on Out-of-Pocket
Expenditures in Indonesia: An Increase or a Decrease? – Các biến độc lập khác bao gồm
các biến nhân khẩu học như đã kết hôn (một biến giả cho chủ hộ biết đã kết hôn), nam
(một biến giả cho chủ hộ biết là nam), các thành viên gia đình (một biến giả để biết các
thành viên trong gia đình có nhiều hơn bốn người), thành thị (một biến giả để biết các
thành viên trong gia đình có nhiều hơn bốn người) cho biết nơi cư trú tại khu vực thành
thị), trình độ học vấn của chủ hộ (hình nộm cho biết dưới cấp trung học cơ sở (đối chiếu),
trung học phổ thông và cao đẳng và đại học), và dân cư tộc (context for known Java
people). (Trang 8)

Bên cạnh đó, các dẫn chứng từ các bài báo trên đều chọn chi tiêu cho sức khoẻ là biến
phụ thuộc để đánh giá tác động sự thay đổi của các biến độc lập.

Từ đó, Mô hình hồi quy được cho như sau:

exptot_health = b1 + b2 income + b3 agehead + b4 married + b5 genderhead + b6


famsize + b7 sickness + b8 urban + b9 educhead +b10 insurance + b11 job

b.     Tiến hành đánh giá tác động bằng cách sử dụng (các) phương pháp định lượng
đã lựa chọn trong Câu a ở trên.

ĐÁNH GIÁ TÁC ĐỘNG BẰNG PHƯƠNG PHÁP BIẾN CÔNG CỤ (IV)

Viết phương trình hồi quy với phương pháp Biến công cụ (IV):

Y: chi tiêu cho sức khoẻ


X: các biến độc lập bao gồm: tổng thu nhập của hộ trong năm 2019, tuổi của chủ hộ, tình
trạng hôn nhân của chủ hộ, giới tính của chủ hộ, tổng số người trong hộ, tình trạng sức
khoẻ của các thành viên trong hộ, nơi sống của hộ, bằng cấp cao nhất của chủ hộ, tình
trạng nghề nghiệp của chủ hộ.

T: hộ có tham gia chương trình BHYT hay không

Z: được xem xét bằng các biến có khả năng như: thời gian di chuyển từ nơi cư trú đến
bệnh viện hoặc cơ sở y tế của nhà nước gần nhất (distance), hộ có tham gia hoạt ođọng xã
hội hay không (network), số ngày rảnh bình quân/ tháng của chủ hộ.

Kiểm định Wu Hausman.

Giả thuyết Ho: không có hiện tượng nội sinh trong mô hình đánh giá tác động của
chương trình BHYT.

Bảng 2. Kết quả kiểm định Wu Hausman

Biến công cụ được xem xét P-Value Kết quả

distance 0.823 Không là biến công cụ

free_day 2.02e-06 Là biến công cụ

network 0.0047 Là biến công cụ

Sau quá trình thực hiện kiểm định Wu Hausman, chúng tôi xác định được free_day và
network là biến công cụ phù hợp. Với giá trị P-value < 10%  Bác bỏ giả thuyết Ho ở
mức ý nghĩa 10%. Từ đó, kết luận là có hiện tượng nội sinh trong mô hình gốc và việc
lựa chọn biến công cụ là sô ngày rãnh bình quân/ tháng của chủ hộ (free_day), hộ có
tham gia hoạt động xã hội hay không (network) là phù hợp.

Từ việc xác định được biến công cụ phù hợp, chúng tôi tiếp tục đi xem xét kết quả hồi
quy của các biến độc lập trong mô hình.
Bảng 3. Kết quả kiểm định mô hình hồi quy.

Biến Hệ số hồi quy Sai số chuẩn t-value P-value


Hằng số 3.413682 0.359817 9.487 < 2e-16
insurance 0.858866 0.434854 1.975 0.0483
agehead 0.010409 0.002297 4.531 6.00e-06
educhead -0.003609 0.025733 -0.140 0.8885
ln_incomebq 0.175647 0.018826 9.330 < 2e-16
married -0.189031 0.030463 -6.205 5.89e-10
genderhead 0.062958 0.054467 1.156 0.2478
famsize -0.111936 0.011416 -9.805 < 2e-16
sickness 1.169495 0.052418 22.311 < 2e-16
urban 0.098873 0.038488 2.569 0.0102
job -0.067181 0.029627 -2.268 0.0234

Từ kết quả hồi quy, dựa vào hệ số P-value chúng tôi xác định được các biến độc lập có ý
nghĩa thống kê ở mức ý nghĩa 10% là: insurance, agehead, ln_incomebq, married,
famsize, sickness, urban, job. Qua đó, chúng tôi xác định được mô hình hồi quy như sau:

ln_expbq = 3.41 + 0.86 insurance + 0.01 agehead + 0.18 ln_incomebq – 0.19


married – 0.11 famsize + 1.17 sickness + 0.1 urban – 0.07 job.

Kiểm định kết quả hồi quy.

Giả thuyết H0: không có sự khác biệt trong giá trị chi tiêu cho sức khoẻ bình quân đầu
người giữa nhóm hộ có tham gia chương trình Dự án BHYT và nhóm hộ không tham gia
chương trình Dự án BHYT.
Kết quả tập trung vào biến insurance, với giá trị P-value < 10%  bác bỏ giả thuyết H0,
có thể nhận xét là có sự khác biệt trong giá trị chi tiêu cho sức khoẻ bình quân đầu người
giữa nhóm hộ có tham gia chương trình Dự án BHYT và nhóm hộ không tham gia
chương trình Dự án BHYT.

Giải thích kết quả mô hình hồi quy:

 Hộ có mua bảo hiểm y tế cho tất cả thành viên hay không (insurance) có ý
nghĩa thống kê. Cụ thể, khi hộ mua bảo hiểm y tế cho tất cả các thành viên thì
chi tiêu cho sức khoẻ bình quân đầu người tăng 0.86 (ngàn ĐVT).
 Tuổi của chủ hộ (agehead) có tác động thuận chiều đến chi tiêu cho sức khoẻ
bình quân đầu người. Cụ thể, khi tuổi của chủ hộ tăng 1 (tuổi) sẽ làm tăng chi
tiêu cho sức khoẻ bình quân đầu người là 0.01 (ngàn ĐVT)
 Thu nhập bình quân đầu người (ln_incomebq) có tác động thuận chiều đến chi
tiêu cho sức khoẻ bình quân đầu người. Cụ thể, khi thu nhập bình quân đầu
người tăng 1 (ngàn ĐVT) thì chi tiêu cho sức khoẻ bình quân tăng 0.18 (ngàn
ĐVT).
 Tình trạng hôn nhân của chủ hộ (married) có ý nghĩa thống kê, cho thấy khi
chủ hộ kết hôn sẽ làm giảm chi tiêu cho sức khoẻ bình quân đầu người 0.19
(ngàn ĐVT).
 Tổng số người trong hộ (famsize) có tác động ngược chiều đến chi tiêu cho sức
khoẻ bình quân đầu người. Cụ thể, khi tổng số người trong hộ tăng thêm 1 thì
chi tiêu cho sức khoẻ bình quân đầu người giảm 0.11 (ngàn ĐVT).
 Tình hình sức khoẻ của các thành viên trong hộ (sickness) có ý nghĩa thống kê,
cho thấy khi hộ có ít nhất một thành viên thăm khám tại các cơ sở y tế thì chi
tiêu cho sức khoẻ bình quân đầu người sẽ cao hơn 1.11 (ngàn ĐVT) so với hộ
không có thành viên thăm khác tại các cơ sở y tế.
 Nơi sinh sống của hộ (urban) có ý nghĩa thống kê, cho thấy khi hộ sống ở
thành thị thì chi tiêu cho sức khoẻ bình quân đầu người của hộ cao hơn 0.1
(ngàn ĐVT) so với hộ sinh sống tại nông thôn.
 Tình trạng nghề nghiệp của chủ hộ (job) có ý nghĩa thống kê, cho thấy khi chủ
hộ có thu nhập từ một công việc thì chi tiêu cho sức khoẻ bình quân đầu người
sẽ giảm 0.07 so với chủ hộ đang thất nghiệp.

ĐÁNH GIÁ TÁC ĐỘNG BẰNG PHƯƠNG PHÁP SO SÁNH ĐIỂM XU HƯỚNG
(PSM)

Y: chi tiêu cho sức khoẻ bình quân đầu người của hộ.

T: hộ có tham gia chương trình Dự án BHYT và không tham gia (insurance).

Z: thu nhập bình quân đầu người của hộ năm 2019 (ln_incomebq), tuổi của chủ hộ
(agehead), tình trạng hôn nhân của chủ hộ (married), bằng cấp cao nhất của chủ hộ
(educhead), giới tính của chủ hộ (genderhead), tổng số người trong hộ (famsize), tình
hình sức khoẻ của các thành viên trong hộ (sickness), tình trạng nghề nghiệp của chủ hộ
(job), nơi sinh sống của hộ (urban).

Kiểm định phương sai (Variances test)

Giả thuyết H0: không có hiện tượng phương sai xảy ra trong mô hình.

Kết quả kiểm định Variances test cho thấy phương sai của hai nhóm bằng nhau, kết luận
là không có hiện tượng phương sai xảy ra trong mô hình (chấp nhận H0).

Kiểm định sự khác biệt (T-test)

Giả thuyết H0: không có sự khác biệt trong giá trị trung bình chi tiêu cho sức khoẻ bình
quân đầu người giữa nhóm hộ tham gia và nhóm hộ không tham gia chương trình Dự án
BHYT.

Kiểm định T-test cho kết quả P-value < 10%  bác bỏ H0  có sự khác biệt trong giá
trị trung bình chi tiêu cho sức khoẻ bình quân đầu người giữa nhóm hộ tham gia và nhóm
hộ không tham gia chương trình Dự án BHYT. Cụ thể, nhóm hộ không tham gia chương
trình Dự án BHYT thì có giá trị trung bình chi tiêu cho sức khoẻ bình quân đầu người là
6.28 (ngàn ĐVT) so với nhóm hộ tham gia chương trình Dự án BHYT thì có giá trị trung
bình chi tiêu cho sức khoẻ bình quân đầu người là 7.18 (ngàn ĐVT).

Hồi quy OLS

Sau khi tạo được nhóm tương đồng bằng phương pháp So sánh điểm xu hướng (PSM) và
thực hiện các kiểm định cần thiết, chúng tôi tiến hành đánh tác động của các yếu tố ảnh
hưởng đến chi tiêu cho sức khoẻ bình quân đầu người.

ln_expbq: chi tiêu cho sức khoẻ bình quân đầu người - được xác dịnh là chỉ tiêu cần so
sánh giữa hai nhóm hộ tham gia và không tham gia chương trình Dự án BHYT.

insurance: 1-nhóm có tham gia chương trình Dự án BHYT ; 0-nhóm không tham gia
chương trình Dự án BHYT.

Các biến độc lập được xác định là: tuổi của chủ hộ (agehead), bằng cấp cao nhất của chủ
hộ (educhead), thu nhập bình quân đầu người (ln_incomebq), tình trạng hôn nhân của chủ
hộ (married), giới tính của chủ hộ (genderhead), tổng số người trong hộ (famsize), tình
hình sức khoẻ của các thành viên trong hộ (sickness), nơi sinh sống của hộ (urban), trình
trạng nghề nghiệp của chủ hộ (job).

Bảng 4. Kết quả kiểm định mô hình hồi quy.

Biến Hệ số hồi quy Sai số chuẩn t-value P-value


Hằng số 4.711747 0.440388 10.699 < 2e-16
insurance 0.470390 0.108967 4.317 1.68e-05
agehead 0.002671 0.003235 0.826 0.409075
educhead -0.069279 0.030513 -2.270 0.023316
ln_incomebq 0.157379 0.033393 4.713 2.66e-06
married -0.210762 0.051045 -4.129 3.84e-05
genderhead 0.052430 0.085679 0.612 0.540667
famsize -0.139140 0.019259 -7.225 7.80e-13
sickness 1.251386 0.087351 14.326 < 2e-16
urban 0.237694 0.070805 3.357 0.000807
job -0.064900 0.055064 -1.179 0.238726

Từ kết quả hồi quy, dựa vào hệ số P-value chúng tôi xác định được các biến độc lập có ý
nghĩa thống kê ở mức ý nghĩa 10% là: insurance, educhead, ln_incomebq, married,
famsize, sickness, urban. Qua đó, chúng tôi xác định được mô hình hồi quy như sau:

ln_expbq = 4.71 + 0.47 insurance – 0.07 educhead + 0.16 ln_incomebq – 0.21


married – 0.14 famsize + 1.25 sickness + 0.24 urban.

Kiểm định kết quả hồi quy

Giả thuyết H0: không có sự khác biệt trong giá trị chi tiêu cho sức khoẻ bình quân đầu
người giữa nhóm hộ có tham gia chương trình Dự án BHYT và nhóm hộ không tham gia
chương trình Dự án BHYT.

Kết quả tập trung vào biến insurance, với giá trị P-value < 10%  bác bỏ giả thuyết H0,
có thể nhận xét là có sự khác biệt trong giá trị chi tiêu cho sức khoẻ bình quân đầu người
giữa nhóm hộ có tham gia chương trình Dự án BHYT và nhóm hộ không tham gia
chương trình Dự án BHYT.

Giải thích kết quả mô hình hồi quy:

 Hộ có mua bảo hiểm y tế cho tất cả thành viên hay không (insurance) có ý
nghĩa thống kê. Cụ thể, khi hộ mua bảo hiểm y tế cho tất cả các thành viên thì
chi tiêu cho sức khoẻ bình quân đầu người tăng 0.47 (ngàn ĐVT).
 Bằng cấp cao nhất của chủ hộ (educhead) có ý nghĩa thống kê, cho thấy khi
bằng cấp cao nhất của chủ hộ tăng 1 bậc thì chi tiêu cho sức khoẻ bình quân
giảm 0.07 (ngàn ĐVT).
 Thu nhập bình quân đầu người (ln_incomebq) có tác động thuận chiều đến chi
tiêu cho sức khoẻ bình quân đầu người. Cụ thể, khi thu nhập bình quân đầu
người tăng 1 (ngàn ĐVT) thì chi tiêu cho sức khoẻ bình quân tăng 0.16 (ngàn
ĐVT).
 Tình trạng hôn nhân của chủ hộ (married) có ý nghĩa thống kê, cho thấy khi
chủ hộ kết hôn sẽ làm giảm chi tiêu cho sức khoẻ bình quân đầu người 0.21
(ngàn ĐVT).
 Tổng số người trong hộ (famsize) có tác động ngược chiều đến chi tiêu cho sức
khoẻ bình quân đầu người. Cụ thể, khi tổng số người trong hộ tăng thêm 1 thì
chi tiêu cho sức khoẻ bình quân đầu người giảm 0.14 (ngàn ĐVT).
 Tình hình sức khoẻ của các thành viên trong hộ (sickness) có ý nghĩa thống kê,
cho thấy khi hộ có ít nhất một thành viên thăm khám tại các cơ sở y tế thì chi
tiêu cho sức khoẻ bình quân đầu người sẽ cao hơn 1.25 (ngàn ĐVT) so với hộ
không có thành viên thăm khác tại các cơ sở y tế.
 Nơi sinh sống của hộ (urban) có ý nghĩa thống kê, cho thấy khi hộ sống ở
thành thị thì chi tiêu cho sức khoẻ bình quân đầu người của hộ cao hơn 0.24
(ngàn ĐVT) so với hộ sinh sống tại nông thôn.

KẾT LUẬN CHUNG: Cả hai phương pháp đánh giá tác động là Phương pháp biến
công cụ (IV) và Phương pháp so sánh điểm xu hướng (PSM) đều cho ra kết quả tương
đồng về tác động của Dự án Bảo hiểm y tế (BHYT) đến chi tiêu cho y tế của hộ gia đình,
cụ thể là khi hộ mua bảo hiểm y tế cho tất cả các thành viên thì chi tiêu cho sức khoẻ bình
quân đầu người sẽ tăng lên. Ngay cả khi hộ có nhu cầu chăm sóc sức khỏe cho các thành
viên trong gia đình (biến sickness) thì chi tiêu cho sức khoẻ bình quân đầu người cũng
tăng lên. Điều này có nghĩa là kết quả đánh giá tác động đang ngược lại với giả thuyết mà
các nhà hoạch định đưa ra rằng: “Các nhà hoạch định chính sách của chính phủ cho rằng
dự án này là cần thiết bởi vì việc tham gia vào Dự án BHYT có thể giúp người dân giảm
bớt gánh nặng chi tiêu cho y tế khi các hộ dân có nhu cầu chăm sóc sức khỏe cho các
thành viên trong gia đình.” Kết quả này có thể xuất phát từ việc người dân không quyết
định thăm khám tại các cơ sở y tế nhà nước vì quy trình phức tạp và thời gian chờ đợi
lâu. Tuy nhiên trong thực tế, người dân vẫn nên cân nhắc mua BHYT cho các thành viên
trong gia đình. Khi không mua bảo hiểm y tế người dân sẽ phải đối mặt với rất nhiều các
rủi ro về bệnh tật, tai nạn, thậm chí là rủi ro về tinh thần như: Bệnh nhân phải tự chi trả
toàn bộ chi phí khi đi khám chữa bệnh tại các cơ sở y tế khi bị ốm đau, tai nạn; Khó có
khả năng tiếp cận các dịch vụ y tế kỹ thuật cao và thuốc đắt tiền; Kinh tế gia đình bị ảnh
hưởng, thậm chí sa sút khi không may mắc bệnh hiểm nghèo… Do đó, nếu nhìn về góc
độ lâu dài thì tích cực tham gia bảo hiểm y tế có thể giúp hộ gia đình phòng ngừa rủi ro
bệnh tật, được chăm sóc y tế tốt hơn, sức khỏe từ đó cũng được cải thiện và nâng cao rõ
rệt.

Câu 4: Dữ liệu cho câu hỏi này đến từ một cuộc khảo sát các doanh nghiệp ở quốc gia B.
Vào năm 2011, cơ quan quản lý đã triển khai một chương trình đào tạo tay nghề/chuyên
môn miễn phí cho nhân viên làm việc trong các doanh nghiệp. Tuy nhiên, không phải tất
cả các doanh nghiệp đều quyết định cử nhân viên của mình tham gia chương trình đào tạo
được trợ cấp. Có lẽ nhiều doanh nghiệp nghĩ rằng chương trình đó có thể không có lợi
cho họ. Do đó, vào năm 2015, cơ quan quản lý tiến hành đánh giá tác động của chương
trình đào tạo được trợ cấp. Chi tiết về các biến từ tập dữ liệu sử dụng cho đánh giá tác
động được trình bày trong bảng dưới đây.

Bảng 5. Mô tả các biến

Tên biến Giải thích ý nghĩa

firm_id Mã số của doanh nghiệp

year Năm khảo sát dữ liệu

1: Doanh nghiệp có thuê bao đường truyền internet

internet 0: Doanh nghiệp không thuê bao đường truyền internet

gender Giới tính của chủ/giám đốc doanh nghiệp (1: Nam, 0: Nữ)

location 1: Doanh nghiệp hoạt động tại thành phố có dân số từ 5 triệu người trở lên
0: Doanh nghiệp hoạt động tại thành phố có dân số ít hơn 5 triệu người

age Tuổi của chủ/giám đốc doanh nghiệp (năm)

age_firm Số năm doanh nghiệp hoạt động tính đến thời điểm khảo sát dữ liệu (năm)

1: Doanh nghiệp gia đình

hh_firm 0: Doanh nghiệp thuộc nhóm khác

1: Doanh nghiệp tọa lạc tại đường lớn

main_road 0: Doanh nghiệp không tọa lạc tại đường lớn

1: Doanh nghiệp tọa lạc tại vị trí gần cảng biển hoặc ga đường sắt

port_rail 0: Doanh nghiệp không tọa lạc tại vị trí gần cảng biển hoặc ga đường sắt

firm_size Số lượng nhân viên làm việc chính thức tại doanh nghiệp (người)

1: Doanh nghiệp cung cấp nhiều hơn một sản phẩm/dịch vụ

diverse 0: Doanh nghiệp cung cấp một sản phẩm/dịch vụ

1: Doanh nghiệp có chi tiêu cho quảng cáo

advertise 0: Doanh nghiệp không chi tiêu cho quảng cáo

Trình độ học vấn của chủ/giám đốc doanh nghiệp

0: Không đi học

1: Hoàn thành chương trình tiểu học

2: Hoàn thành chương trình trung học

edu 3: Hoàn thành chương trình đại học

new_equip Tỷ lệ giá trị thiết bị mới trong tổng hiện giá thiết bị của doanh nghiệp (%)
1: Doanh nghiệp có xuất khẩu trực tiếp

export 0: Doanh nghiệp không xuất khẩu trực tiếp

1: Doanh nghiệp có tham gia hiệp hội

network 0: Doanh nghiệp không tham gia hiệp hội

Khoảng cách đến nhà cung cấp đầu vào quan trọng nhất của doanh nghiệp
distance_sup (km)

1: Doanh nghiệp có gửi nhân viên tham gia chương trình đào tạo tay
nghề/chuyên môn miễn phí

0: Doanh nghiệp không gửi nhân viên tham gia chương trình đào tạo tay
training nghề/chuyên môn miễn phí

profit Lợi nhuận gộp của doanh nghiệp (ĐVT)

revenue Doanh thu từ bán hàng/dịch vụ của doanh nghiệp (ĐVT)

a. Phương pháp định lượng nào trong môn học nên được sử dụng để đánh giá tác
động (có thể chọn nhiều hơn một phương pháp)? Thuyết minh sự lựa chọn dựa vào
đặc điểm của phương pháp và bối cảnh được cung cấp.

Sau khi tham khảo các nghiên cứu liên quan về đề tài cũng như tìm hiểu về thông tin và
dữ liệu, nhóm quyết định kết hợp Phương pháp so sánh điểm xu hướng (PSM) và
Khác biệt trong khác biệt (DID) để đánh giá tác động của chương trình đào tạo được
trợ cấp . Trước tiên là sử dụng phương pháp PSM để tiến hành tạo ra hai nhóm tương
đồng (nhóm doanh nghiệp có và nhóm doanh nghiệp không gửi nhân viên tham
gia chương trình đào tạo tay nghề/chuyên môn miễn phí), sau đó tính toán kết quả trên dữ
liệu vừa tạo bằng phương pháp DID.

Giải thích:
Phương pháp PSM được sử dụng để tạo ra hai nhóm tương đồng cho dữ liệu có sẵn, giải
quyết vấn đề sai lệch lựa chọn mẫu (selection bias). Vấn đề này xảy ra khi sự khác biệt về
doanh thu hay hiệu suất giữa doanh nghiệp tham gia và doanh nghiệp không tham gia là
do sự khác biệt các đặc điểm ban đầu của doanh nghiệp hơn là tác động của chương trình
đào tạo. Nói một cách dễ hiểu, sự gia tăng doanh thu của một số doanh nghiệp chủ yếu là
vì các yếu tố như quy mô lớn hoặc lâu đời, chứ không phải vì doanh nghiệp gửi nhân
viên tham gia chương trình đào tạo tay nghề/chuyên môn miễn phí. Do đó, nhóm quyết
định tạo ra hai nhóm tương đồng bằng phương pháp PSM để gia tăng tính tương đồng
giữa hai nhóm so sánh, giảm thiểu vấn đề sai lệch và các yếu tố có thể gây nhiễu đến kết
quả.

Sau đó, nhóm tiến hành đánh giá tác động bằng phương pháp Khác biệt trong Khác biệt
(DID) dựa trên dữ liệu về hai nhóm tương đồng vừa thu được. Bởi vì trong bối cảnh của
dữ liệu có bao gồm dữ liệu năm gốc (2011) và năm đánh giá (2015), điều này sẽ thuận lợi
cho nhóm tác giả trong việc đánh giá tác động bằng phương pháp DID. Phương pháp này
cũng đã được Pedro S. Martins (2021) sử dụng để đánh giá tác động của chương trình
FIG – chương trình công cung cấp các khoản tài trợ đào tạo cho các công ty tại Bồ Đào
Nha – đến một số kết quả ở cấp độ doanh nghiệp. Trong bài báo “The impact of manager
training on strategic reorientation and growth in small firms” của Torben Bager & Kent
Adsbøll Wickstrøm (2018), hai tác giả cũng đã kết hợp phương pháp PSM và DID để
đánh giá tác động của chương trình đào tạo cấp quản lý đến hoạt động của các doanh
nghiệp nhỏ. Từ đó, có thể thấy trong bối cảnh của đề tài, DID là một phương pháp hiệu
quả để đánh giá tác động của chương trình đào tạo có trợ cấp. Phương pháp DID giúp
giảm thiểu yếu tố không xuyên qua bằng cách so sánh sự thay đổi trước và sau can thiệp
giữa nhóm tham gia và nhóm không tham gia. Bằng cách so sánh sự thay đổi này, DID
cho phép ước tính tác động của chương trình đào tạo mà không bị ảnh hưởng bởi những
yếu tố ngoại vi có thể thay đổi theo thời gian. Ngoài ra, việc kết hợp phương pháp PSM
giúp gia tăng tính tương đồng giữa hai nhóm so sánh trước khi tiến hành phân tích DID
cũng sẽ mang lại kết quả có độ tin cậy cao.
Lập luận các biến trong mô hình:

Biến phụ thuộc: Để đánh giá tác động của chương trình đào tạo được trợ cấp, nhóm
nghiên cứu lựa chọn biến phụ thuộc là “revenue”. Doanh thu là một thước đo tương đối
tổng quát cho hiệu quả tài chính cũng như hiệu suất của doanh nghiệp, từ đó đánh giá
xem chương trình đào tạo được trợ cấp có thật sự tác động đến các hoạt động bên trong
doanh nghiệp hay không. Bài báo “Employee training and firm performance: Evidence
from ESF grant applications” của Pedro S. Martins (2021) đã sử dụng biến “Nhật ký
doanh thu hàng năm của mỗi công ty” để đánh giá tác động của các khoản tài trợ đào tạo
do FIG cung cấp (Trang 10).

Biến độc lập: training, firm_size, age_firm, export, profit.

 training: Để đánh giá tác động của chương trình đào tạo có trợ cấp thì biến
“training” - Doanh nghiệp có/không gửi nhân viên tham gia chương trình đào tạo tay
nghề/chuyên môn miễn phí là biến chắc chắn phải có trong mô hình. Theo bài báo
“Employee training and firm performance: Evidence from ESF grant applications”
của Pedro S. Martins (2021), kết quả phân tích DID kết luận rằng: “chúng tôi thấy
rằng các khoản tài trợ đào tạo do FIG cung cấp đã dẫn đến cả mức độ đào tạo cao hơn
và mức độ hiệu quả hoạt động của công ty cao hơn, được đo lường bằng nhiều biến
số bổ sung. Bên cạnh doanh số bán hàng và giá trị gia tăng, việc đào tạo bổ sung
cũng cải thiện xuất khẩu, năng suất và lợi nhuận” (Trang 10)
 firm_size: Kết quả nghiên cứu của bài báo “Employee training and firm
performance: Evidence from ESF grant applications” của Pedro S. Martins (2021) đã
nhận định có sự khác biệt trong tác động của chương trình đào tạo đối với các doanh
nghiệp có quy mô khác nhau. Cụ thể, “Hình A23 chỉ ra rằng, phù hợp với vai trò của
hạn chế tài chính, tác động của việc tài trợ FIG… đối với hoạt động của công ty cũng
lớn hơn ở các công ty nhỏ hơn.” (Trang 15)
 age_firm: Theo kết quả nghiên cứu của bài báo “Determinants of employee training
impact on organizational legitimacy and organizational performance” của Nuria N.
Esteban-Lloret, Antonio Aragón-Sánchez & Antonio Carrasco-Hernández (2016),
tuổi của công ty (age_firm) và Quy mô của công ty (firm_size) có tác động đến hiệu
suất của doanh nghiệp khi tham gia chương trình đào tạo. Với Bảng 3, Trang 12 cho
thấy hai biến này đều có ý nghĩa với giá trị p-value < 0.1
 export: Nghiên cứu của Pedro S. Martins (2021) cũng đưa xuất khẩu vào một trong
những yếu tố để đánh giá tác động. Cụ thể, trang 15 của bài báo “Employee training
and firm performance: Evidence from ESF grant applications” có đề cập rằng:
“Chúng tôi cũng xem xét trường hợp xuất khẩu, so sánh các doanh nghiệp xuất khẩu
trong năm áp dụng FIG và những doanh nghiệp không xuất khẩu vào thời điểm đó”.
 profit: Lợi nhuận là một trong những thước đo tổng quát về hiệu suất hoạt động của
công ty. Bài báo “Determinants of employee training impact on organizational
legitimacy and organizational performance” của Nuria N. Esteban-Lloret, Antonio
Aragón-Sánchez & Antonio Carrasco-Hernández (2016) có đề cập: “Một chỉ số toàn
cầu về hiệu quả hoạt động (lợi nhuận bán hàng, lợi nhuận tổng thể và hiệu quả tài
chính) đã được sử dụng để đo lường hiệu quả hoạt động của công ty.”

b.     Tiến hành đánh giá tác động bằng cách sử dụng (các) phương pháp định lượng
đã lựa chọn trong Câu a ở trên.

Kết quả đánh giá tác động:

Bảng 6. Thống kê mô tả các biến trong mô hình

Mean SD Min Max SE


training 0.79 0.41 0 1 0.01
revenue 10,131,537.91 155,110,362.58 0 7,400,000,000 2,860,665.96

firm_size 14.32 33.41 1 700 0.62


age_firm 15.10 9.39 2.0 61 0.17
export 0.07 0.25 0.0 1 0.00
profit 1,184,961.84 11,166,740.92 0.0 450,000,000 205,945.72

Bảng 6 thể hiện những thống kê cơ bản của các biến được chọn trong mô hình được đánh
giá tác động. Có thể thấy giá trị của biến revenue và profit rất lớn và có giá trị nhỏ nhất là
0, nên nhóm nghiên cứu tiến hành loại bỏ những giá trị lỗi khi lấy logarit bình quân của
doanh thu từ bán hàng/dịch vụ của doanh nghiệp mà lợi nhuận gộp của doanh nghiệp.

Bảng 7. Thống kê mô tả giữa nhóm tham gia và nhóm đối chứng

Không tham gia Tham gia


(N = 627) (N = 2297)

Variables Mean St.dev Mean St.dev

ln_revenueb 11.9 0.872 12.1 0.928


q

firm_size 6.09 19.6 16.4 35.7

age_firm 15.6 9.10 15.0 9.48

export 0.02 0.131 0.08 0.269

ln_profitbq 10.4 0.849 10.5 0.924

Bảng 7 cho thấy sự khác biệt giữa những doanh nghiệp cử nhân viên tham gia chương
trình đào tạo được trợ cấp (N = 2297) và những doanh nghiệp không cử nhân viên tham
gia chương trình đào tạo được trợ cấp (N = 627). Nhóm doanh nghiệp tham gia chương
trình đào tạo được trợ cấp là những doanh nghiệp có số lượng nhân viên lớn cũng như có
doanh thu bán hàng bình quân hay doanh nghiệp xuất khẩu trực tiếp lớn hơn nhóm doanh
nghiệp không tham gia chương trình đào tạo được trợ cấp. Những quan sát này củng cố
sự nghi ngờ về sự thiên vị lựa chọn, tức là một số doanh nghiệp có nhiều khả năng tham
gia chương trình đào tạo có trợ cấp hơn những doanh nghiệp khác một cách có hệ thống.
Để đối phó với khuynh hướng lựa chọn tiềm năng này, có thể sử dụng các kỹ thuật so
sánh điểm xu hướng trong đó các doanh nghiệp trong nhóm tham gia được so khớp với
các doanh nghiệp trong nhóm đối chứng, có các đặc điểm tương tự (Rosenbaum &
Rubin, 1983). Trong thực tế, việc đối sánh được thực hiện dựa trên điểm số xu hướng bắt
nguồn từ hồi quy logit hoặc probit của các yêu tố gây nhiễu tiềm ẩn đối với nhóm tham
gia và nhóm đối chứng. Nhóm nghiên cứu sẽ tiến hành tạo hai nhóm tương đồng để giải
quyết vấn đề trên.

Bảng 8. Đặc điểm của các biến độc lập trước và sau khi tạo hai nhóm tương đồng

Trước PSM Sau PSM


Không Tham gia p-value Không Tham gia p-value
tham gia (N = 2297) tham gia (N = 627)
(N = 627) (N = 627)

firm_size 6.09 19.6 <0.001 6.09 47.33 <0.001


age_firm 15.6 9.10 0.188 15.6 12.92 <0.001
export 0.0175 0.131 <0.001 0.0175 0.2887 <0.001
ln_profitbq 10.4 0.849 0.071 10.4 10.62 <0.001

Bảng 8 cho thấy sự khác biệt giá trị trung bình về các đặc điểm của doanh nghiệp trước
và sau khi thực hiện quy trình so khớp, từ kết quả của Bảng 8 thì giá trị p-value của các
biến đều < 0.001, điều này biểu thị rằng các quy trình đối sánh mang lại sự cân bằng tốt
hơn giữa nhóm tham gia và nhóm đối chứng.

Bảng 9. Kết quả hồi quy của phương pháp khác biệt trong khác biệt

Estimate Std.Error t-value p-value


time1 0.1695 0.0542 3.1268 0.0019
ln_profitbq 0.6054 0.0255 23.7507 < 2e-16
firm_size -0.0024 0.0007 -3.1064 0.0019
age_firm 0.0016 0.0007 0.2418 0.8091
export 0.1582 0.1216 1.3013 0.1937
training:time 0.0168 0.0607 0.2766 0.7822
R2=0.6059
N = 1254
p-value < 2.22e-16

Kiểm định giả thuyết

Giả thuyết H0: Không có sự khác biệt giữa doanh thu bán hàng/dịch vụ bình quân giữa
nhóm doanh nghiệp cử nhân viên tham gia chương trình đào tạo chuyên môn/tay nghề
được trợ cấp và nhóm doanh nghiệp không cử nhân viên tham gia chương trình đào tạo
chuyên môn/tay nghề được trợ cấp.

Bảng 9 là kết quả của quá trình hồi quy fixed effects bằng Phương pháp Khác biệt trong
khác biệt (DID). Từ kết quả của Bảng 9 ta có thể thấy P-value > 10%  chấp nhận H0
 Không có sự khác biệt giữa doanh thu bán hàng/dịch vụ bình quân giữa nhóm doanh
nghiệp cử nhân viên tham gia chương trình đào tạo chuyên môn/tay nghề được trợ cấp và
nhóm doanh nghiệp không cử nhân viên tham gia chương trình đào tạo chuyên môn/tay
nghề được trợ cấp.

Bởi vì đặc điểm của Phương pháp Khác biệt trong khác biệt (DID) là quan tâm đến tích
chéo, vì thế, nếu tích chéo của chúng ta không có ý nghĩa thống kê thì các biến độc lập
trong mô hình sẽ không được quan tâm mặc dù chúng có ý nghĩa thống kê. Từ đó, kết
luận rằng việc doanh nghiệp cử nhân viên tham gia chương trình đào tạo được trợ cấp
không có tác động đến doanh thu bình quân của doanh nghiệp. Vì vậy, không có sự khác
biệt về doanh thu bán hàng/dịch vụ bình quân của doanh nghiệp giữa nhóm doanh nghiệp
cử nhân viên tham gia chương trình đào tạo chuyên môn/tay nghề được trợ cấp và nhóm
doanh nghiệp không cử nhân viên tham gia chương trình đào tạo chuyên môn/tay nghề
được trợ cấp.
TÀI LIỆU THAM KHẢO

Aji, B., De Allegri, M., Souares, A., & Sauerborn, R. (2013). The impact of health
insurance programs on out-of-pocket expenditures in Indonesia: an increase or a
decrease?. International journal of environmental research and public health, 10(7),
2995-3013.

Bager, T., & Wickstrøm Jensen, K. (2018). The impact of manager training on
strategic reorientation and growth in small firms. In Paper to EURAM Conference 2018.

Dauth, C., & Toomet, O. (2016). On government‐subsidized training programs for


older workers. Labour, 30(4), 371-392.

El-Osta, H. S. (2015). Assessing the impact of health insurance and other


socioeconomic factors on inequality in health care expenditures among farm
households. Agricultural and Resource Economics Review, 44(1), 35-64.

Esteban-Lloret, N. N., Aragón-Sánchez, A., & Carrasco-Hernández, A. (2018).


Determinants of employee training: impact on organizational legitimacy and
organizational performance. The International Journal of Human Resource
Management, 29(6), 1208-1229.

Garavan, T. N., McCarthy, A., Lai, Y., Clarke, N., Carbery, R., Gubbins, C., ... &
Saunders, M. N. (2021). Putting the system back into training and firm performance
research: A review and research agenda. Human Resource Management Journal, 31(4),
870-903.

Hou, B., Wu, Y., & Huang, S. (2022). Participating in health insurance and health
improvements for the relatively poor population: A propensity score analysis. Frontiers
in Public Health, 10.

Martins, P. S. (2021). Employee training and firm performance: Evidence from ESF
grant applications. Labour Economics, 72, 102056.

Zhao, Y., Kang, B., Liu, Y., Li, Y., Shi, G., Shen, T., ... & Wang, L. (2014). Health
insurance coverage and its impact on medical cost: observations from the floating
population in China. PloS one, 9(11), e111555.
PHỤ LỤC

CÂU 3

PHƯƠNG PHÁP BIẾN CÔNG CỤ (IV)


> library(readxl)
> datacau3 <- read_excel("H:/desktop/STUDY_document_ofUEH/Hoc_ky_6/DANH-GIA-TAC-DONG/
Final_Course/Data exam/Cau 3/data_6.xls", sheet = "Q3")
> View(datacau3)
> dataq3 <- datacau3
> View(dataq3)

Xem xét tính phân phối chuẩn của dữ liệu:


> hist(dataq3$exptot_health)
> dataq3$expbq <- dataq3$exptot_health/dataq3$famsize
> dataq3$ln_expbq <- log(dataq3$expbq)
> hist(dataq3$ln_expbq)
> hist(dataq3$income)
> dataq3$incomebq <- dataq3$income/dataq3$famsize
> dataq3$ln_incomebq <- log(dataq3$incomebq)
> hist(dataq3$ln_incomebq)

Làm sạch dữ liệu:


> cleandataq3 <- na.omit(dataq3)
> cleandataq3 <- cleandataq3[is.finite(cleandataq3$ln_expbq), ]
> cleandataq3 <- cleandataq3[is.finite(cleandataq3$ln_incomebq), ]

Xem xét distance là biến công cụ


> model <-
ivreg(ln_expbq~agehead+educhead+ln_incomebq+married+genderhead+famsize+sickness+urban+
job | insurance | distance, data = cleandataq3)
> summary(model)

Call:
ivreg(formula = ln_expbq ~ agehead + educhead + ln_incomebq +
married + genderhead + famsize + sickness + urban + job |
insurance | distance, data = cleandataq3)

Residuals:
Min 1Q Median 3Q Max
-5.111967 -0.704150 -0.001266 0.731068 5.985576

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 3.500724 1.900675 1.842 0.065557
insurance 0.725910 2.884063 0.252 0.801285
agehead 0.010949 0.011815 0.927 0.354102
educhead 0.003029 0.144635 0.021 0.983293
ln_incomebq 0.173549 0.048724 3.562 0.000372
married -0.191654 0.063871 -3.001 0.002707
genderhead 0.070583 0.172238 0.410 0.681971
famsize -0.112362 0.014544 -7.726 1.33e-14
sickness 1.180038 0.232028 5.086 3.79e-07
urban 0.098705 0.038342 2.574 0.010070
job -0.066048 0.038127 -1.732 0.083272

(Intercept) .
insurance
agehead
educhead
ln_incomebq ***
married **
genderhead
famsize ***
sickness ***
urban *
job .

Diagnostic tests:
df1 df2 statistic p-value
Weak instruments 1 5161 1.347 0.246
Wu-Hausman 1 5160 0.050 0.823
Sargan 0 NA NA NA

Residual standard error: 1.163 on 5161 degrees of freedom


Multiple R-Squared: 0.2024, Adjusted R-squared: 0.2009
Wald test: 149.1 on 10 and 5161 DF, p-value: < 2.2e-16

Xem xét network là biến công cụ


> model <-
ivreg(ln_expbq~agehead+educhead+ln_incomebq+married+genderhead+famsize+sickness+urban+
job | insurance | network, data = cleandataq3)
> summary(model)
Call:
ivreg(formula = ln_expbq ~ agehead + educhead + ln_incomebq +
married + genderhead + famsize + sickness + urban + job |
insurance | network, data = cleandataq3)

Residuals:
Min 1Q Median 3Q Max
-5.10496 -0.74873 -0.02837 0.74627 5.90846

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 3.122074 0.377950 8.261 < 2e-16
insurance 1.304295 0.459959 2.836 0.004591
agehead 0.008598 0.002411 3.566 0.000366
educhead -0.025847 0.027073 -0.955 0.339774
ln_incomebq 0.182677 0.019591 9.324 < 2e-16
married -0.180241 0.031669 -5.691 1.33e-08
genderhead 0.037411 0.056764 0.659 0.509883
famsize -0.110510 0.011853 -9.323 < 2e-16
sickness 1.134173 0.054859 20.674 < 2e-16
urban 0.099436 0.039951 2.489 0.012842
job -0.070976 0.030762 -2.307 0.021079

(Intercept) ***
insurance **
agehead ***
educhead
ln_incomebq ***
married ***
genderhead
famsize ***
sickness ***
urban *
job *

Diagnostic tests:
df1 df2 statistic p-value
Weak instruments 1 5161 58.665 2.22e-14 ***
Wu-Hausman 1 5160 7.999 0.0047 **
Sargan 0 NA NA NA
---
Signif. codes:
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.217 on 5161 degrees of freedom


Multiple R-Squared: 0.1264, Adjusted R-squared: 0.1247
Wald test: 137 on 10 and 5161 DF, p-value: < 2.2e-16

Xem xét free_day là biến công cụ


> model <-
ivreg(ln_expbq~agehead+educhead+ln_incomebq+married+genderhead+famsize+sickness+urban+
job | insurance | free_day, data = cleandataq3)
> summary(model)

Call:
ivreg(formula = ln_expbq ~ agehead + educhead + ln_incomebq +
married + genderhead + famsize + sickness + urban + job |
insurance | free_day, data = cleandataq3)

Residuals:
Min 1Q Median 3Q Max
-11.1682 -0.3914 0.8619 1.8661 7.2704

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 9.184412 2.990476 3.071 0.00214
insurance -7.955880 4.485135 -1.774 0.07615
agehead 0.046244 0.018621 2.483 0.01304
educhead 0.436461 0.226727 1.925 0.05428
ln_incomebq 0.036533 0.083960 0.435 0.66349
married -0.362977 0.116197 -3.124 0.00180
genderhead 0.568504 0.285874 1.989 0.04679
famsize -0.140154 0.032525 -4.309 1.67e-05
sickness 1.868488 0.369913 5.051 4.54e-07
urban 0.087729 0.099285 0.884 0.37695
job 0.007918 0.084807 0.093 0.92562

(Intercept) **
insurance .
agehead *
educhead .
ln_incomebq
married **
genderhead *
famsize ***
sickness ***
urban
job

Diagnostic tests:
df1 df2 statistic p-value
Weak instruments 1 5161 3.759 0.0526 .
Wu-Hausman 1 5160 22.632 2.02e-06 ***
Sargan 0 NA NA NA
---
Signif. codes:
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 3.021 on 5161 degrees of freedom


Multiple R-Squared: -4.379, Adjusted R-squared: -4.39
Wald test: 22.43 on 10 and 5161 DF, p-value: < 2.2e-16

Xem xét free_day và network là biến công cụ


> model <-
ivreg(ln_expbq~agehead+educhead+ln_incomebq+married+genderhead+famsize+sickness+urban+
job | insurance | free_day+network, data = cleandataq3)
> summary(model)

Call:
ivreg(formula = ln_expbq ~ agehead + educhead + ln_incomebq +
married + genderhead + famsize + sickness + urban + job |
insurance | free_day + network, data = cleandataq3)

Residuals:
Min 1Q Median 3Q Max
-5.110357 -0.713726 -0.001616 0.729766 5.965899

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 3.413682 0.359817 9.487 < 2e-16
insurance 0.858866 0.434854 1.975 0.0483
agehead 0.010409 0.002297 4.531 6.00e-06
educhead -0.003609 0.025733 -0.140 0.8885
ln_incomebq 0.175647 0.018826 9.330 < 2e-16
married -0.189031 0.030463 -6.205 5.89e-10
genderhead 0.062958 0.054467 1.156 0.2478
famsize -0.111936 0.011416 -9.805 < 2e-16
sickness 1.169495 0.052418 22.311 < 2e-16
urban 0.098873 0.038488 2.569 0.0102
job -0.067181 0.029627 -2.268 0.0234

(Intercept) ***
insurance *
agehead ***
educhead
ln_incomebq ***
married ***
genderhead
famsize ***
sickness ***
urban *
job *

Diagnostic tests:
df1 df2 statistic p-value
Weak instruments 2 5160 30.466 7.02e-14 ***
Wu-Hausman 1 5160 3.324 0.0683 .
Sargan 1 NA 27.387 1.67e-07 ***
---
Signif. codes:
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.173 on 5161 degrees of freedom


Multiple R-Squared: 0.1892, Adjusted R-squared: 0.1876
Wald test: 147.1 on 10 and 5161 DF, p-value: < 2.2e-16

PHƯƠNG PHÁP SO SÁNH ĐIỂM XU HƯỚNG (PSM)


> library(MatchIt)
> model <-
matchit(insurance~agehead+educhead+income+married+genderhead+famsize+sickness+urban+jo
b, data=dataq3, method="nearest", distance = "glm", ratio=1)
> summary(model)

Call:
matchit(formula = insurance ~ agehead + educhead + income + married +
genderhead + famsize + sickness + urban + job, data = dataq3,
method = "nearest", distance = "glm", ratio = 1)

Summary of Balance for All Data:


Means Treated Means Control
distance 0.8544 0.8096
agehead 53.1577 47.8778
educhead 1.8959 1.5454
income 78931.2409 69964.1920
married 1.3897 1.3377
genderhead 0.2606 0.2042
famsize 3.7307 3.7845
sickness 0.7746 0.6510
urban 0.3012 0.2984
job 1.0865 1.1998
Std. Mean Diff. Var. Ratio eCDF Mean
distance 0.5858 0.9138 0.1729
agehead 0.3806 1.5483 0.0653
educhead 0.2756 1.3966 0.0701
income 0.0834 1.5549 0.0203
married 0.0670 1.1432 0.0173
genderhead 0.1284 . 0.0564
famsize -0.0333 1.1876 0.0116
sickness 0.2959 . 0.1236
urban 0.0061 . 0.0028
job -0.1725 1.3531 0.0309
eCDF Max
distance 0.2764
agehead 0.1814
educhead 0.1296
income 0.0446
married 0.0309
genderhead 0.0564
famsize 0.0580
sickness 0.1236
urban 0.0028
job 0.0918

Summary of Balance for Matched Data:


Means Treated Means Control
distance 0.9410 0.8096
agehead 67.3333 47.8778
educhead 2.8578 1.5454
income 105237.1736 69964.1920
married 1.5960 1.3377
genderhead 0.4267 0.2042
famsize 3.4817 3.7845
sickness 0.9616 0.6510
urban 0.3106 0.2984
job 0.6728 1.1998
Std. Mean Diff. Var. Ratio eCDF Mean
distance 1.7198 0.0354 0.5653
agehead 1.4024 1.1504 0.2401
educhead 1.0319 1.1928 0.2625
income 0.3281 2.8542 0.0569
married 0.3325 1.5322 0.0861
genderhead 0.5069 . 0.2225
famsize -0.1872 1.6544 0.0437
sickness 0.7435 . 0.3106
urban 0.0266 . 0.0122
job -0.8022 1.3260 0.1322
eCDF Max Std. Pair Dist.
distance 0.9485 1.7198
agehead 0.6065 1.4543
educhead 0.4773 1.2734
income 0.1187 1.0136
married 0.1318 0.8673
genderhead 0.2225 1.0636
famsize 0.2234 1.2016
sickness 0.3106 0.8562
urban 0.0122 0.9206
job 0.3482 1.0998

Sample Sizes:
Control Treated
All 1146 6371
Matched 1146 1146
Unmatched 0 5225
Discarded 0 0

> q3.data <- match.data(model)


> View(q3.data)
> hist(q3.data$exptot_health)
> q3.data$ln_expbq <- log(q3.data$exptot_health/q3.data$famsize)
> q3.data$ln_incomebq <- log(q3.data$income/q3.data$famsize)
> q3data <- na.omit(q3.data)
> q3data <- q3data[is.finite(q3data$ln_expbq), ]
> q3data <- q3data[is.finite(q3data$ln_incomebq), ]
Kiểm định phương sai (Variances test)
> var.test(ln_expbq~insurance, data=q3data)
F test to compare two variances

data: ln_expbq by insurance


F = 0.67755, num df = 778, denom df = 806,
p-value = 5.002e-08
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.5894313 0.7789755
sample estimates:
ratio of variances
0.677549
Kiểm định T test
> t.test(ln_expbq~insurance, data=q3data, var.equal=FALSE)

Welch Two Sample t-test

data: ln_expbq by insurance


t = -13.525, df = 1545.7, p-value < 2.2e-16
alternative hypothesis: true difference in means between group 0 and group 1 is not
equal to 0
95 percent confidence interval:
-1.0225423 -0.7635078
sample estimates:
mean in group 0 mean in group 1
6.288015 7.181040
Hồi quy OLS
> model <- lm(ln_expbq ~
insurance+agehead+educhead+ln_incomebq+married+genderhead+famsize+sickness+urban+job,
data=q3data)
> summary(model)

Call:
lm(formula = ln_expbq ~ insurance + agehead + educhead + ln_incomebq +
married + genderhead + famsize + sickness + urban + job,
data = q3data)

Residuals:
Min 1Q Median 3Q Max
-5.1216 -0.7881 -0.0150 0.7589 6.1029

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 4.711747 0.440388 10.699 < 2e-16
insurance 0.470390 0.108967 4.317 1.68e-05
agehead 0.002671 0.003235 0.826 0.409075
educhead -0.069279 0.030513 -2.270 0.023316
ln_incomebq 0.157379 0.033393 4.713 2.66e-06
married -0.210762 0.051045 -4.129 3.84e-05
genderhead 0.052430 0.085679 0.612 0.540667
famsize -0.139140 0.019259 -7.225 7.80e-13
sickness 1.251386 0.087351 14.326 < 2e-16
urban 0.237694 0.070805 3.357 0.000807
job -0.064900 0.055064 -1.179 0.238726

(Intercept) ***
insurance ***
agehead
educhead *
ln_incomebq ***
married ***
genderhead
famsize ***
sickness ***
urban ***
job
---
Signif. codes:
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.205 on 1575 degrees of freedom


Multiple R-squared: 0.255, Adjusted R-squared: 0.2503
F-statistic: 53.91 on 10 and 1575 DF, p-value: < 2.2e-16
CÂU 4

Thống kê mô tả các biến trong mô hình


> library(psych)
> describe(data, skew=F)
vars n mean sd min max range
se
firm_id 1 2940 5848.13 4345.02 2436.0 86011 8.3575e+04
80.13
year 2 2940 2013.00 2.00 2011.0 2015 4.0000e+00
0.04
internet 3 2940 0.37 0.48 0.0 1 1.0000e+00
0.01
gender 4 2940 0.40 0.49 0.0 1 1.0000e+00
0.01
location 5 2940 0.50 0.50 0.0 1 1.0000e+00
0.01
age 6 2940 46.52 10.73 17.0 92 7.5000e+01
0.20
age_firm 7 2940 15.10 9.39 2.0 61 5.9000e+01
0.17
hh_firm 8 2940 0.66 0.47 0.0 1 1.0000e+00
0.01
main_road 9 2940 0.81 0.39 0.0 1 1.0000e+00
0.01
port_rail 10 2940 0.57 0.50 0.0 1 1.0000e+00
0.01
firm_size 11 2940 14.32 33.41 1.0 700 6.9900e+02
0.62
diverse 12 2940 0.12 0.32 0.0 1 1.0000e+00
0.01
advertise 13 2940 0.14 0.35 0.0 1 1.0000e+00
0.01
edu 14 2940 2.57 0.69 0.0 3 3.0000e+00
0.01
new_equip 15 2940 76.56 36.04 0.0 100 1.0000e+02
0.66
export 16 2940 0.07 0.25 0.0 1 1.0000e+00
0.00
network 17 2940 0.07 0.25 0.0 1 1.0000e+00
0.00
distance_sup 18 2940 46.34 188.16 0.1 6000 5.9999e+03
3.47
training 19 2940 0.79 0.41 0.0 1 1.0000e+00
0.01
revenue 20 2940 10131537.91 155110362.58 0.0 7400000000 7.4000e+09
2860665.96
profit 21 2940 1184961.84 11166740.92 0.0 450000000 4.5000e+08
205945.72

Loại bỏ các giá trị lỗi của biến profit và revenue


> data <- data[data$revenue!=0]
> data <- data[data$profit!=0]

Lấy logarit doanh thu bán hàng bình quân và lợi nhuận bình quân
> data$ln_revenuebq <- log(data$revenue/data$firm_size)
> data$ln_profitbq <- log(data$profit/data$firm_size)

Tạo hai nhóm tương đồng


> modelling <- matchit(training~firm_size + age_firm + ln_profitbq + export,data =
data, method = "nearest",distance ="glm", ratio = 1)
> summary(modelling)

Call:
matchit(formula = training ~ firm_size + age_firm + ln_profitbq +
export, data = data, method = "nearest", distance = "glm",
ratio = 1)

Summary of Balance for All Data:


Means Treated Means Control Std. Mean Diff. Var. Ratio eCDF Mean eCDF Max
distance 0.7940 0.7547 0.5200 2.7505 0.1901 0.3209
firm_size 16.3731 6.0909 0.2884 3.3141 0.0643 0.3067
age_firm 15.0065 15.5518 -0.0575 1.0840 0.0141 0.0628
ln_profitbq 10.4580 10.3875 0.0763 1.1843 0.0209 0.0529
export 0.0788 0.0175 0.2274 . 0.0613 0.0613

Summary of Balance for Matched Data:


Means Treated Means Control Std. Mean Diff. Var. Ratio eCDF Mean eCDF Max
distance 0.8994 0.7547 1.9150 2.0218 0.5357 0.9155
firm_size 47.3317 6.0909 1.1567 8.6421 0.2500 0.8549
age_firm 12.9282 15.5518 -0.2768 0.7670 0.0496 0.1962
ln_profitbq 10.6241 10.3875 0.2561 1.8971 0.0713 0.1404
export 0.2887 0.0175 1.0063 . 0.2711 0.2711
Std. Pair Dist.
distance 1.9150
firm_size 1.1568
age_firm 0.9523
ln_profitbq 1.2609
export 1.0419

Sample Sizes:
Control Treated
All 627 2297
Matched 627 627
Unmatched 0 1670
Discarded 0 0

Thống kê mô tả trước PSM


> createTable(compareGroups(training ~
firm_size+age_firm+ln_profitbq+export+ln_revenuebq, data=data))

--------Summary descriptives table by 'training'---------

______________________________________________
0 1 p.overall
N=627 N=2297
¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯
firm_size 6.09 (19.6) 16.4 (35.7) <0.001
age_firm 15.6 (9.10) 15.0 (9.48) 0.188
ln_profitbq 10.4 (0.85) 10.5 (0.92) 0.071
export 0.02 (0.13) 0.08 (0.27) <0.001
ln_revenuebq 11.9 (0.87) 12.1 (0.93) <0.001
¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯

Thống kê mô tả sau PSM


> createTable(compareGroups(training ~ firm_size+age_firm+ln_profitbq+export,
data=mdata))

--------Summary descriptives table by 'training'---------

_____________________________________________
0 1 p.overall
N=627 N=627
¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯
firm_size 6.09 (19.6) 47.3 (57.6) <0.001
age_firm 15.6 (9.10) 12.9 (7.97) <0.001
ln_profitbq 10.4 (0.85) 10.6 (1.17) <0.001
export 0.02 (0.13) 0.29 (0.45) <0.001
¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯
Warning messages:
1: glm.fit: algorithm did not converge
2: glm.fit: fitted probabilities numerically 0 or 1 occurred

Tạo biến dummy cho nhóm thời gian (year)


> mdata$time <- ifelse(mdata$year > 2011, 1, 0)
Xây dựng mô hình DID
> model_did<-plm(ln_revenuebq ~ training*time + training + time + ln_profitbq +
firm_size + age_firm + export, data=mdata, index=c("firm_id","time"), model="within")
> summary(model_did)
Oneway (individual) effect Within Model

Call:
plm(formula = ln_revenuebq ~ training * time + training + time +
ln_profitbq + firm_size + age_firm + export, data = mdata,
model = "within", index = c("firm_id", "time"))

Unbalanced Panel: n = 692, T = 1-2, N = 1254

Residuals:
Min. 1st Qu. Median 3rd Qu. Max.
-1.90635 -0.16808 0.00000 0.16808 1.90635

Coefficients:
Estimate Std. Error t-value Pr(>|t|)
time1 0.16952213 0.05421567 3.1268 0.00186 **
ln_profitbq 0.60540907 0.02549017 23.7507 < 2e-16 ***
firm_size -0.00244629 0.00078749 -3.1064 0.00199 **
age_firm 0.00169019 0.00699090 0.2418 0.80905
export 0.15817364 0.12155429 1.3013 0.19371
training:time1 0.01679595 0.06071572 0.2766 0.78216
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Total Sum of Squares: 338.81


Residual Sum of Squares: 133.52
R-Squared: 0.60593
Adj. R-Squared: 0.11192
F-statistic: 142.484 on 6 and 556 DF, p-value: < 2.22e-16

You might also like