Download as pdf or txt
Download as pdf or txt
You are on page 1of 18

Topik 2: Spesifikasi Model dan Ujian Diagnostik

Semester 2, Sesi 2020/2021

2.1 Spesifikasi Model: Model Regresi Polinomial

Bentuk umum: Y   0   1 X   2 X 2   3 X 3  .....   k X k  u

Pertimbangkan model kuadratik , Y   0   1 X   2 X 2  u

Walaupun pemboleh ubah tak bersandar, X 2 bukan berbentuk linear, tetapi model ini masih
dianggap sebagai model regresi linear dan boleh dianggar dengan kaedah OLS kerana parameter
 2 yang berhubung dengan pemboleh ubah X 2 berbentuk linear.

Walaupun korelasi antara pemboleh ubah X dan X 2 adalah kuat, tetapi ia tidak menunjukkan
multicollineariti yang serius kerana X 2 bukan fungsi linear bagi X.

Model kuadratik dibentuk untuk mengkaji kesan pertambahan atau pengurangan marginal bagi
suatu pemboleh ubah tak bersandar ke atas pemboleh ubah bersandar.

Berdasarkan teori matematik,

i) Bentuk fungsi ditentukan oleh tanda bagi  2


ii) Kecerunan, Y X   1  2 2 X
iii) Titik pegun (turning point) tercapai apabila X    1 2 2

Rajah berikut menunjukkan corak perubahan purata nilai Y bagi peningkatan nilai X.

Page 1 of 18
Topik 2: Spesifikasi Model dan Ujian Diagnostik
Semester 2, Sesi 2020/2021

Contoh 1: Gujarati & Porter, Table 7.9, ms. 221 (Output Eviews diberi dalam Lampiran 4)

Diberi model permintaan per kapita bagi daging ayam adalah seperti berikut:

Y   1   2 X 2   3 X 3   4 X 6   5 X 62  v 2

X 6 ialah harga komposit benar barang pengganti bagi daging ayam (dalam sen per paun).

Keputusan penganggaran model kuadratik

Dependent Variable: Y
Included observations: 23

Variable Coefficient Std. Error t-Statistic Prob.

X2 0.019110 0.002398 7.967858 0.0000


X3 -0.350000 0.064915 -5.391663 0.0000
X6 0.364657 0.048582 7.505966 0.0000
X6SQ -0.001607 0.000206 -7.788353 0.0000
C 18.49035 2.662748 6.944083 0.0000

R-squared 0.981666 Adjusted R-squared 0.977592


S.E. of regression 1.103690 Sum squared resid 21.92636
F-statistic 240.9433 Prob(F-statistic) 0.000000

Persamaan teranggar ialah Yˆ  18.49  0.0191 X 2  0.35 X 3  0.3647 X 6  0.0016 X 62 .

Keputusan ujian t ke atas H 0 :  5  0 yang signifikan menunjukkan wujud hubungan kuadratik


antara permintaan per kapita ayam dan harga komposit benar barang pengganti.

Kesan sut harga komposit benar barang pengganti ke atas permintaan per kapita ayam diberi oleh
Yˆ X 6  0.3647  0.0032 X 6 . Dapat diperhatikan bahawa kesan sut bukan lagi konstan tetapi
bergantung kepada nilai X 6 . Dalam konteks ini, pekali teranggar α̂4 dan α̂5 tidak dapat ditafsir
secara berasingan.

Dengan mengandaikan faktor lain konstan, permintaan per kapita ayam adalah maksimum pada
harga komposit benar barang pengganti bagi ayam sama dengan 113.97 sen per paun.

Oleh itu, pada paras X 6 < 113.97 sen per paun, peningkatan harga komposit benar dalam barang
pengganti bagi ayam akan menyebabkan purata permintaan per kapita ayam bertambah pada
kadar yang semakin berkurangan.

Sebagai contoh, pada nilai X 6 = 65.8, kesan sut harga komposit benar barang pengganti ke atas
permintaan per kapita ayam ialah 0.1541 paun manakala kesan sut harga komposit benar barang
pengganti ke atas permintaan per kapita ayam pada nilai X 6 = 100 ialah sebanyak 0.0447 paun.

Page 2 of 18
Topik 2: Spesifikasi Model dan Ujian Diagnostik
Semester 2, Sesi 2020/2021

2.2 Model Regresi Dengan Interaksi Dua Pemboleh ubah Kuantitatif

Pertimbangkan model regresi , Y   0   1 X 1   2 X 2   3 X 1 X 2  u

Berdasarkan contoh di atas, pemboleh ubah interaksi X 1 X 2 dimasukkan dalam model regresi
jika didapati bahawa

i) hubungan antara Y dan X 1 adalah berbeza pada nilai X 2 yang berlainan dan

ii) hubungan antara Y dan X 2 adalah berbeza pada nilai X 1 yang berlainan

Y
Kesan separa X 1 ke atas Y diberi oleh   1   3 X 2 dan ia bergantung pada X 2
X 1

Y
Kesan separa X 2 ke atas Y diberi oleh   2   3 X 1 dan ia bergantung pada X 1
X 2

Contoh 2:

Katakan PR   0   1 BR   2 SF   3 ( BRSF )  u

PR = harga rumah (dalam RM ribu), BR = bilangan bilik tidur, SF = saiz rumah (dalam kaki
persegi), BRSF = BR  SF (interaksi antara bilangan bilik tidur dan saiz rumah)

Berdasarkan data house.wf1, keputusan penganggaran model diberi seperti berikut.

Dependent Variable: PR
Included observations: 88

Variable Coefficient Std. Error t-Statistic Prob.

BR -35.95534 24.01237 -1.497367 0.1380


SF 0.032621 0.043642 0.747464 0.4569
BRSF 0.023448 0.010157 2.308490 0.0234
C 181.6908 92.18885 1.970855 0.0520

R-squared 0.653877 Mean dependent var 293.5460


Adjusted R-squared 0.641516 S.D. dependent var 102.7134
S.E. of regression 61.49820 Akaike info criterion 11.12028
Sum squared resid 317690.4 Schwarz criterion 11.23289
Log likelihood -485.2924 Hannan-Quinn criter. 11.16565
F-statistic 52.89613 Durbin-Watson stat 1.859264
Prob(F-statistic) 0.000000

Dengan menggunakan ujian satu sisi, keputusan ujian t ke atas parameter yang berhubung
dengan pemboleh ubah interaksi (BRSF) menunjukkan keputusan yang signifikan pada α = 0.05.

Page 3 of 18
Topik 2: Spesifikasi Model dan Ujian Diagnostik
Semester 2, Sesi 2020/2021

Kesan separa SF ke atas PR diberi oleh

Pˆ R
 0.032621  0.023448 BR
SF

Pˆ R
Didapati ̂ 3 > 0 dan 0
SF

Ini bermakna tambahan saiz rumah (SF) akan menyebabkan peningkatan yang lebih tinggi dalam
harga rumah (PR) bagi bilangan bilik tidur (BR) yang semakin banyak.

Sebagai contoh, jika bilangan bilik tidur, BR = 1, tambahan satu kaki persegi saiz rumah akan
meningkatkan harga rumah sebanyak RM56 secara puratanya. Jika BR = 4, tambahan satu kaki
persegi saiz rumah akan meningkatkan harga rumah sebanyak RM126.4 secara puratanya. Oleh
itu, kesan tambahan saiz rumah ke atas harga rumah bukan lagi konstan pada bilangan bilik tidur
yang berlainan.

Akan tetapi, pekali regresi teranggar bagi pemboleh ubah SF tidak boleh ditafsirkan kerana ia
mengukur kesan tambahan saiz rumah pada bilangan bilik tidur (BR) sama dengan 0. Begitu juga
untuk pekali regresi teranggar bagi pemboleh ubah BR kerana ia mengukur kesan tambahan
bilangan bilik tidur pada saiz rumah sama dengan 0 kaki persegi. Oleh itu,

i) saiz rumah mempengaruhi harga rumah melalui kesan interaksinya dengan bilangan bilik
tidur

ii) bilangan bilik tidur mempengaruhi harga rumah melalui kesan interaksinya dengan saiz
rumah

2.3 Model Regresi Dengan Interaksi Dua Pemboleh ubah Dami

Rujuk data fail upahindia.wf1.

Pemboleh ubah taraf pendidikan pekerja (educ) terbahagi kepada 4 kategori iaitu tiada
pendidikan formal (educ = 1), pendidikan rendah (educ = 2), pendidikan menengah (educ = 3),
pendidikan tertiari (educ = 4).

Pertimbangkan model regresi dengan pemboleh ubah dami yang berikut untuk mengkaji upah
mingguan pekerja.

WI  1   2 AGE   3 DS   4 DT  u

WI = upah mingguan (dalam rupees), AGE = umur (dalam tahun), DS = pemboleh ubah dami
bagi jantina (1 – lelaki dan 0 – wanita), DT = pemboleh ubah dami bagi taraf pendidikan tertiari
(1 – tertiari, 0 – selainnya)

Page 4 of 18
Topik 2: Spesifikasi Model dan Ujian Diagnostik
Semester 2, Sesi 2020/2021

Dalam model di atas, dengan mengandaikan umur pekerja malar,  3 mengukur perbezaan upah
mingguan pekerja lelaki berbanding pekerja wanita tanpa mengambil kira taraf pendidikan
pekerja manakala  4 mengukur perbezaan upah mingguan pekerja berpendidikan tertiari
berbanding pekerja tidak berpendidikan tertiari tanpa mengambil kira jantina pekerja.

Jika kita ingin mengkaji perbezaan upah mingguan dengan mengambil kira jantina dan taraf
pendidikan pekerja secara bersama, pemboleh ubah dami interaksi (DSDT = DS  DT) perlu
dimasukkan ke dalam model seperti berikut

WI  1   2 AGE   3 DS   4 DT   5 ( DSDT )  u

Kategori rujukan dalam model di atas ialah pekerja wanita tidak berpendidikan tertiari. Oleh itu,
fungsi upah mingguan pekerja lelaki berpendidikan tertiari (DS = 1 & DT = 1) diberi oleh:

WI  (  1   3   4   5 )   2 AGE

dengan  3 = kesan pembeza (differential effect) sebagai pekerja lelaki


 4 = kesan pembeza sebagai pekerja berpendidikan tertiari
 5 = kesan pembeza sebagai pekerja lelaki berpendidikan tertiari

Base group: pekerja wanita tidak berpendidikan tertiari (DS = 0 & DT = 0) - WI  1   2 AGE

Oleh itu, dengan mengandaikan umur pekerja malar,

i)  3 mengukur perbezaan upah mingguan antara pekerja lelaki dan wanita yang tidak
berpendidikan tertiari manakala (  3 +  5 ) mengukur perbezaan upah mingguan antara
pekerja lelaki dan wanita yang berpendidikan tertiari.

ii)  4 mengukur perbezaan upah mingguan antara pekerja wanita berpendidikan tertiari dan
tidak berpendidikan tertiari manakala (  4 +  5 ) mengukur perbezaan upah mingguan
antara pekerja lelaki berpendidikan tertiari dan tidak berpendidikan tertiari.

iii) (  3 +  4 +  5 ) pula mengukur perbezaan upah mingguan antara pekerja lelaki


berpendidikan tertiari berbanding pekerja wanita yang tidak berpendidikan tertiari.

Contoh 3: Rujuk data fail upahindia.wf1

Keputusan penganggaran model WI  1   2 AGE   3 DS   4 DT   5 ( DSDT )  u bagi pekerja


yang mempunyai status pekerjaan tetap (DP = 1) diberi seperti berikut.

Page 5 of 18
Topik 2: Spesifikasi Model dan Ujian Diagnostik
Semester 2, Sesi 2020/2021

Dependent Variable: WI
Sample: 1 114 IF DP=1
Included observations: 42

Variable Coefficient Std. Error t-Statistic Prob.

AGE 5.618130 1.126566 4.986949 0.0000


DS -96.06755 35.00603 -2.744314 0.0093
DT -88.91799 65.12940 -1.365251 0.1804
DSDT 155.4473 88.00076 1.766431 0.0856
C 13.66560 45.71893 0.298905 0.7667

R-squared 0.530507 Mean dependent var 188.1857


Adjusted R-squared 0.479751 S.D. dependent var 123.1089
S.E. of regression 88.79630 Akaike info criterion 11.92191
Sum squared resid 291737.0 Schwarz criterion 12.12878
Log likelihood -245.3601 Hannan-Quinn criter. 11.99773
F-statistic 10.45211 Durbin-Watson stat 1.929677
Prob(F-statistic) 0.000009

Dengan mengandaikan umur pekerja konstan, purata upah mingguan pekerja lelaki yang tidak
berpendidikan tertiari adalah 96.1 rupees lebih rendah berbanding pekerja wanita yang tidak
berpendidikan tertiari; purata upah mingguan pekerja lelaki yang berpendidikan tertiari adalah
66.5 rupees lebih tinggi berbanding pekerja lelaki yang tidak berpendidikan tertiari; purata upah
mingguan pekerja lelaki berpendidikan tertiari pula adalah 29.5 rupees lebih rendah berbanding
pekerja wanita tidak berpendidikan tertiari.

Keputusan ujian t ke atas H 0 :  5  0 menunjukkan kesan interaksi antara jantina dan taraf
pendidikan adalah signifikan pada  = 0.10.

2.4 Jenis-jenis Ralat Spesifikasi dan Kesan Ralat Spesifikasi Model

Salah satu andaian klasik model regresi linear ialah model perlu dispesifikasi dengan betul. Jika
andaian ini gagal dipenuhi, ia akan menimbulkan masalah ralat spesifikasi.

Pada umumnya, ralat spesifikasi (specification errors) terdiri daripada 4 jenis iaitu:

- menyingkirkan pemboleh ubah yang relevan (omission of a relevant variable)

- menyertakan pemboleh ubah yang tidak relevan (inclusion of an irrelevant variable)

- bentuk fungsi yang salah (wrong functional form)

- ralat pengukuran dalam pemboleh ubah (errors of measurement)

2.4.1 Ralat Pengukuran Dalam Pemboleh ubah

Data bagi pemboleh ubah bersandar, Y dan pemboleh ubah tak bersandar X yang digunakan
dalam analisis regresi secara implisitnya diandaikan diukur tanpa sebarang ralat. Akan tetapi,

Page 6 of 18
Topik 2: Spesifikasi Model dan Ujian Diagnostik
Semester 2, Sesi 2020/2021

andaian tersebut tidak realistik kerana pengumpulan data biasanya melibatkan nonresponse
errors sementara pemprosesan data pula mungkin melibatkan rounded off errors, reporting
errors dan computing errors. Di samping itu, missing values bagi sesuatu data mungkin
ditangani dengan cara interpolation atau extrapolation.

i) Ralat pengukuran dalam pemboleh ubah bersandar

Penganggar yang terhasil masih saksama tetapi tidak cekap kerana mempunyai nilai
varian dan ralat piawai yang relatifnya lebih besar berbanding model tanpa ralat
pengukuran.

ii) Ralat pengukuran dalam pemboleh ubah tak bersandar

Sebutan ralat bagi model dengan ralat pengukuran akan berkorelasi dengan pemboleh
ubah tak bersandar. Oleh kerana ia tidak memenuhi andaian klasik model regresi linear
yang menyatakan bahawa pemboleh ubah tak bersandar dan sebutan ralat adalah tidak
berkorelasi, penganggar OLS yang terhasil bukan sahaja bias tetapi juga tidak konsisten
iaitu kesan bias tersebut tidak akan hilang walaupun saiz sampel besar.

2.4.2 Penyingkiran Pemboleh ubah yang Relevan

Katakan model yang betul ialah Y  1   2 X 2   3 X 3  v --- (2.1)

Jika model dispesifikasi sebagai Y  1   2 X 2  u --- (2.2)

Kesan penyingkiran pemboleh ubah X 3 adalah seperti berikut.

i) Jika X 3 berkorelasi dengan X 2 , ̂1 dan ̂ 2 adalah penganggar yang bias iaitu
E (ˆ1 )   1 dan E (ˆ 2 )   2 serta tidak konsisten. Kesan bias tidak akan hilang
walaupun saiz sampel besar. Nilai dijangka bagi penganggar ̂ 2 diberi oleh

E (ˆ 2 )   2   3b32

dengan b32 ialah pekali cerun teranggar bagi regresi X 3 ke atas X 2 .

Kesan bias bergantung kepada  3b32 . Katakan  3  0 ,

E (ˆ 2 )   2 jika b32  0  bias positif iaitu ̂ 2 overestimate nilai sebenar  2

E (ˆ 2 )   2 jika b32  0  bias negatif iaitu ̂ 2 underestimate nilai sebenar  2

Page 7 of 18
Topik 2: Spesifikasi Model dan Ujian Diagnostik
Semester 2, Sesi 2020/2021

ii) Anggaran bagi varian sebutan ralat, u adalah salah

iii) Varian bagi ̂ 2 ialah penganggar yang bias bagi varian bagi ̂ 2 . Akibatnya, ujian t dan
ujian F ke atas parameter akan menghasilkan keputusan yang tidak tepat.

Sekiranya dua pemboleh ubah tak bersandar menunjukkan korelasi yang tinggi, salah satu
kaedah mengurangkan masalah multicollineariti yang serius ialah dengan menggugurkan salah
satu pemboleh ubah tersebut.

Akan tetapi tindakan ini akan menyebabkan berlakunya ralat spesifikasi yang dibincangkan di
atas. Selain itu, penyingkiran pemboleh ubah tak bersandar yang relevan dan bentuk fungsi yang
salah juga merupakan dua punca berlakunya masalah heteroskedastisiti dan autokorelasi.

Mengesan Penyingkiran Pemboleh ubah Relevan dan Bentuk Fungsi yang Salah

Ujian Lagrange Multiplier (LM)

Langkah 1: Anggarkan model terbatas (2.2) di atas dan dapatkan nilai residuals, û .

Langkah 2: Jika model tak terbatas (2.1) ialah model yang betul, residuals yang diperoleh
sepatutnya berkorelasi dengan X 3 . Seterusnya, jalankan regresi auxiliary berikut

uˆ  1   2 X 2  3 X 3  v --- (2.3)

Langkah 3: Dapatkan pekali penentuan auxiliary R 2 daripada model (2.3)

Statistik ujian = nR 2

Statistik ujian secara asimptot (i.e. dalam keadaan saiz sampel besar) bertaburan
khi kuasa dua dengan darjah kebebasan = bilangan batasan.

Langkah 4: Jika statistik ujian khi kuasa dua melebihi nilai kritikal atau nilai-p bagi ujian khi
kuasa dua kurang daripada aras keertian α, kita boleh menyimpulkan bahawa
model (2.2) tersalah spesifikasi.

Contoh 4: Gujarati & Porter, Table 7.9, ms. 221

Diberi model permintaan per kapita bagi ayam yang betul ialah

Y   1   2 X 2   3 X 3   4 X 22   5 X 32  v --- (A)

Katakan model dispesifikasi sebagai

Y  1   2 X 2   3 X 3  u --- (B)

Page 8 of 18
Topik 2: Spesifikasi Model dan Ujian Diagnostik
Semester 2, Sesi 2020/2021

Keputusan penganggaran Model A

Dependent Variable: Y

Variable Coefficient Std. Error t-Statistic Prob.

X2 0.034030 0.003039 11.19952 0.0000


X3 -1.325999 0.539914 -2.455946 0.0244
X2SQ -6.96E-06 1.15E-06 -6.079862 0.0000
X3SQ 0.010291 0.005515 1.865951 0.0784
C 53.16707 12.09534 4.395667 0.0003

R-squared 0.977373 Mean dependent var 39.66957


Adjusted R-squared 0.972345 Akaike info criterion 3.435217
S.E. of regression 1.226102 Schwarz criterion 3.682064
Sum squared resid 27.05986 Durbin-Watson stat 1.701069
F-statistic 194.3805 Prob(F-statistic) 0.000000

Keputusan penganggaran Model B

Dependent Variable: Y

Variable Coefficient Std. Error t-Statistic Prob.

X2 0.014884 0.002193 6.785304 0.0000


X3 -0.213592 0.121905 -1.752115 0.0951
C 34.51561 3.855779 8.951655 0.0000

R-squared 0.910821 Mean dependent var 39.66957


Adjusted R-squared 0.901903 Akaike info criterion 4.632821
S.E. of regression 2.309239 Schwarz criterion 4.780929
Sum squared resid 106.6517 Durbin-Watson stat 0.432741
F-statistic 102.1340 Prob(F-statistic) 0.000000

Perbandingan keputusan penganggaran

Pekali cerun teranggar Ralat piawai teranggar


Pemboleh ubah
Model A Model B Model A Model B
X2 0.03403 0.01488 0.00304 0.00219
X3 -1.32600 -0.21359 0.53991 0.12191

Keputusan penganggaran menunjukkan kesan pendapatan boleh guna benar per kapita ( X 2 ) dan
harga runcit benar ayam ( X 3 ) ke atas permintaan per kapita ayam terkurang anggar beberapa
kali ganda dalam model yang tersalah spesifikasi.

Seperti yang dijangkakan, ralat piawai bagi pekali cerun teranggar dalam model yang tersalah
spesifikasi adalah lebih rendah berbanding dengan model yang betul. Dalam konteks ini, wujud
trade-off antara ketidaksaksamaan (biased) dan kecekapan (efficiency) penganggar.

Page 9 of 18
Topik 2: Spesifikasi Model dan Ujian Diagnostik
Semester 2, Sesi 2020/2021

Di samping itu, hipotesis H 0 :  3  0 gagal ditolak pada aras keertian 5% tetapi H 0 :  3  0


berjaya ditolak pada  = 0.05 dalam model yang benar.

Pada aras keertian 1%, statistik DW bagi model yang salah (Model B) menunjukkan ralat
berautokorelasi positif pada order pertama, d = 0.4327 < d L  0.938 . Statistik DW bagi model
yang betul (Model A) pula menunjukkan ralat tidak berautokorelasi pada order pertama, d U =
1.534 < d = 1.701 < 4  d U = 2.466. Oleh itu, masalah autokorelasi order pertama yang wujud
besar kemungkinan disebabkan oleh masalah ralat spesifikasi.

Keputusan ujian Lagrange Multiplier (LM)

Dependent Variable: RES

Variable Coefficient Std. Error t-Statistic Prob.

X2 0.019146 0.003039 6.301236 0.0000


X3 -1.112407 0.539914 -2.060342 0.0541
X2SQ -6.96E-06 1.15E-06 -6.079862 0.0000
X3SQ 0.010291 0.005515 1.865951 0.0784
C 18.65147 12.09534 1.542038 0.1405

R-squared 0.746278

Statistik ujian = nR 2  23(0.746278)  17.164

Semasa menjalankan ujian LM, Model A ialah model tak terbatas manakala Model B ialah
model terbatas. Statistik ujian melebihi nilai kritikal  02.05 , 2  5.991 . Oleh itu, boleh disimpulkan
bahawa Model B tersalah spesifikasi.

Page 10 of 18
Topik 2: Spesifikasi Model dan Ujian Diagnostik
Semester 2, Sesi 2020/2021

2.4.3 Penyertaan Pemboleh ubah yang Tidak Relevan

Katakan model yang betul ialah Y   1   2 X 2  u

Jika model dispesifikasi sebagai Y   1   2 X 2   3 X 3  v

Kesan penyertaan pemboleh ubah X 3 adalah seperti berikut.

i) Penganggar OLS adalah saksama dan konsisten iaitu E (ˆ1 )   1 , E (ˆ 2 )   2 dan
E (ˆ 3 )   3  0 .

ii) Anggaran bagi varian sebutan ralat, v adalah betul

iii) Penganggar OLS adalah tidak cekap kerana varian bagi ̂1 dan ̂ 2 adalah lebih besar
berbanding varian bagi ̂ 1 dan ̂ 2 .

Penyertaan pemboleh ubah tak bersandar yang tidak relevan bukan sahaja menjejaskan
kecekapan penganggar dan mungkin menimbulkan masalah multicollineariti yang serius.

Mengesan Penyertaan Pemboleh ubah yang Tidak Relevan

Jika kita ingin mengetahui kesesuaian menyertakan pemboleh ubah X 3 ke dalam model, ujian t
ke atas parameter  3 boleh dijalankan. Bagi kesesuaian menyertakan satu set pemboleh ubah,
katakan X 3 dan X 4 ke dalam model, ujian F bagi batasan linear boleh digunakan untuk menguji
hipotesis H 0 :  3   4  0 .

Perlu diingatkan bahawa

i) sebelum ujian keberertian dijalankan, kita seharusnya mempunyai satu model tentatif

ii) ujian t dan ujian F tidak boleh digunakan untuk membentuk model regresi secara iteratif.

Contoh 5: Gujarati & Porter, Table 7.9, ms. 221

Diberi model permintaan per kapita bagi ayam yang betul ialah

Y   1   2 X 2   3 X 3   4 X 22   5 X 32  v --- (A)

Katakan model dispesifikasi sebagai

Y   1   2 X 2   3 X 3   4 X 22   5 X 32   6 X 7   7 X 8  u --- (C)

Page 11 of 18
Topik 2: Spesifikasi Model dan Ujian Diagnostik
Semester 2, Sesi 2020/2021

dengan X 7 dan X 8 ialah dua pemboleh ubah yang tidak relevan di mana nilainya dijana dengan
menggunakan nombor rawak normal piawai.

Keputusan penganggaran Model C

Dependent Variable: Y

Variable Coefficient Std. Error t-Statistic Prob.

X2 0.033481 0.003177 10.53733 0.0000


X3 -1.344909 0.578058 -2.326600 0.0334
X2SQ -7.07E-06 1.16E-06 -6.107767 0.0000
X3SQ 0.010863 0.005808 1.870254 0.0799
X7 0.285357 0.320463 0.890453 0.3864
X8 -0.337977 0.304470 -1.110049 0.2834
C 53.30640 13.04794 4.085426 0.0009

R-squared 0.979631 Mean dependent var 39.66957


Adjusted R-squared 0.971992 S.D. dependent var 7.372950
S.E. of regression 1.233898 Akaike info criterion 3.504024
Sum squared resid 24.36007 Schwarz criterion 3.849609
Log likelihood -33.29627 Hannan-Quinn criter. 3.590938
F-statistic 128.2502 Durbin-Watson stat 1.661110
Prob(F-statistic) 0.000000

Jika dibandingkan dengan keputusan penganggaran Model A dalam ms.9, nilai anggaran pekali
cerun dan pintasan tidak menunjukkan perbezaan yang besar, tetapi nilai ralat piawai teranggar
bagi pintasan dan pekali cerun yang terhasil daripada Model C didapati lebih besar daripada
Model A. Oleh itu, penambahan kedua-dua pemboleh ubah yang tidak relevan telah menjejaskan
kecekapan penganggar OLS.

Seperti yang dijangkakan, ujian t ke atas parameter  6 dan  7 secara individu menunjukkan
keputusan yang tidak signifikan. Selain itu, keputusan ujian F yang berikut juga tidak
menyokong penyertaan dua pemboleh ubah yang tidak relevan ke dalam model.

Keputusan ujian F
Null Hypothesis : C(5)=C(6)=0

Test Statistic Value df Probability

F-statistic 0.886628 (2, 16) 0.4313


Chi-square 1.773257 2 0.4120

Page 12 of 18
Topik 2: Spesifikasi Model dan Ujian Diagnostik
Semester 2, Sesi 2020/2021

2.5 Kriteria Pemilihan Model: Aspek Statistik

a) Pekali penentuan R 2 dan varian teranggar, ˆ 2

Kesan penambahan pemboleh ubah tak bersandar ke dalam model regresi

i) TSS tidak berubah; ESS menjadi besar; RSS menjadi kecil (TSS = ESS + RSS)

Oleh itu, semakin banyak pemboleh ubah tak bersandar ditambahkan ke dalam
ESS
model, R 2  akan semakin meningkat. Maka, pemilihan model berdasarkan
TSS
R 2 yang tinggi adalah tidak sesuai.

ii) bilangan parameter dalam model (k) akan meningkat

iii) darjah kebebasan yang berhubung dengan RSS iaitu (n – k) menjadi kecil

Oleh itu, penambahan lebih banyak pemboleh ubah tak bersandar ke dalam model
RSS
mungkin meningkatkan nilai varian teranggar, ˆ 2  jika pengurangan
nk
dalam RSS tidak cukup untuk offset pengurangan dalam (n – k).

Masalah dengan penggunaan R 2

i) Perbandingan model dengan R 2 hanya boleh dijalankan jika pemboleh ubah


bersandar kedua-dua model adalah sama, tetapi pemboleh ubah tak bersandar
boleh berbeza.

ii) R 2 mengukur kebagusan padanan dalam sampel (in-sample) data yang digunakan,
tetapi ia tidak semestinya meramal cerapan yang berada di luar sampel (out-of-
sample) dengan baik.

b) Pekali penentuan terlaras, R 2

Sebagai penalti kepada penambahan pemboleh ubah tak bersandar secara berterusan, R 2
merupakan statistik kebagusan padanan yang lebih sesuai digunakan untuk perbandingan
model (dalam keadaan di mana pemboleh ubah bersandar adalah sama).

Ini disebabkan R 2 menyelaraskan darjah kebebasan yang berhubung dengan RSS dan
RSS /( n  k )
TSS seperti yang ditunjukkan oleh rumus R 2  1 
TSS /( n  1)

Page 13 of 18
Topik 2: Spesifikasi Model dan Ujian Diagnostik
Semester 2, Sesi 2020/2021

Ciri-ciri pekali penentuan terlaras R 2

i) daripada rumus di atas, didapati bahawa R 2 < R 2

ii) R 2 boleh mengambil nilai negatif walaupun R 2 adalah sentiasa positif

iii) Penambahan pemboleh ubah tak bersandar ke dalam model akan meningkatkan
R 2 jika nilai mutlak statistik ujian t bagi parameter yang berhubung dengan
pemboleh ubah tak bersandar tersebut melebihi 1

iv) Nilai bagi varian teranggar ˆ 2 akan berkurangan jika dan hanya jika R 2
meningkat.

ˆ 2  (1  R 2 ) S y2

dengan S y2 ialah varian sampel bagi pemboleh ubah bersandar, Y

c) Akaike Information Criterion (AIC) dan Schwarz’s Information Criterion (SIC)

Selain R 2 , statistik AIC dan SIC juga memberi penalti kepada penambahan pemboleh
ubah tak bersandar secara berterusan ke dalam model.

2k
 RSS   2k   RSS 
i) AIC = e  n
 atau ln AIC =   + ln  
 n   n   n 

k
 RSS  k   RSS 
ii) SIC = n n   atau ln SIC =   ln (n) + ln  
 n  n  n 

 2k  k 
Faktor penalti bagi AIC ialah   manakala bagi SIC ialah   ln (n)
 n  n

Semasa perbandingan model dibuat, model yang melaporkan nilai AIC atau SIC yang
lebih kecil akan dipilih.

Kedua-dua AIC dan SIC boleh digunakan untuk menilai prestasi peramalan dalam sampel
dan luar sampel bagi sesuatu model.

Page 14 of 18
Topik 2: Spesifikasi Model dan Ujian Diagnostik
Semester 2, Sesi 2020/2021

Rujuk kepada keputusan penganggaran Model A dan Model B dalam Contoh 4.

Model A Model B
R-squared 0.9774 0.9108
Adjusted R-squared 0.9723 0.9019
S.E. of regression 1.2261 2.3092
Akaike info criterion 3.4352 4.6328
Schwarz criterion 3.6821 4.7809

Berdasarkan kriteria pemilihan model yang diringkaskan dalam jadual di atas, spesifikasi Model
A (dengan memasukkan sebutan kuadratik) adalah lebih baik kerana mempunyai nilai R 2 yang
lebih besar, nilai ralat piawai teranggar, AIC dan SIC yang lebih kecil berbanding Model B.

2.6 Pemilihan Antara Dua Model Tersarang (Nested)

Pertimbangkan dua model berikut:

Y   0   1 X 1   2 X 2   3 X 3   4 X 4   5 X 5  u --- (2.5)
Y   0  1 X 1   2 X 2   3 X 3  u --- (2.6)

Berdasarkan contoh di atas, model (2.6) dikatakan tersarang (nested) dalam model (2.5) kerana ia
adalah subset atau kes khas bagi model (2.5).

Untuk menentukan sama ada model (2.5) lebih baik berbanding model (2.6), batasan
 4   5  0 boleh diuji dengan ujian F. Sekiranya batasan ini gagal ditolak, ini bermakna
spesifikasi model (2.6) adalah lebih baik. Selain ujian F, ujian Lagrange Multiplier (LM) yang
dibincangkan sebelum ini juga boleh digunakan untuk memilih antara dua model tersarang.

2.7 Pemilihan Antara Dua Model Tak Tersarang (Non-nested): Discriminant Approach

Pertimbangkan dua model berikut:

Y   0  1 X 1   2 X 2  u --- (2.7)
Y   0  1 Z 1   2 Z 2  v --- (2.8)

Berdasarkan contoh di atas, model (2.7) dan model (2.8) adalah model tak tersarang (non-nested)
kerana model (2.7) bukan satu kes khas bagi model (2.8) dan sebaliknya.

Walaupun kedua-dua model mempunyai pemboleh ubah tak bersandar yang sepunya (katakan
Z1 dimasukkan ke dalam model (2.7) dan X 2 dimasukkan ke dalam model (2.8), tetapi ia masih
dianggap model tak tersarang kerana model (2.7) tidak mengandungi Z 2 dan model (2.8) tidak
mengandungi X 1 .

Page 15 of 18
Topik 2: Spesifikasi Model dan Ujian Diagnostik
Semester 2, Sesi 2020/2021

Sekiranya kedua-dua model mempunyai pemboleh ubah tak bersandar yang sama tetapi dalam
bentuk fungsi yang berlainan, model tersebut juga dianggap tak tersarang. Sebagai contoh,
bandingkan model (2.8) dengan model (2.9) yang berikut:

Y   0   1 ln Z1   2 ln Z 2  w --- (2.9)

Berdasarkan discriminant approach, pemilihan antara dua model yang tak tersarang dilakukan
berdasarkan statistik kebagusan padanan seperti R 2 atau R 2 dan kriteria pemilihan model yang
lain seperti varian teranggar ( ˆ 2 ), AIC dan SIC yang dibincangkan sebelum ini.

Contoh 6: Rujuk data fail upahindia.wf1


Pertimbangkan dua model yang berikut.

Model A : WI  1   2 AGE   3 DR   4 DM   5 DT   6 DS  u

Model B : WI  1   2 AGE   3 DS   4 DT   5 ( DSDT )  v

WI = upah mingguan (dalam rupees), AGE = umur pekerja, DR = pemboleh ubah dami taraf
pendidikan rendah (1 – rendah, 0 – selainnya), DM = pemboleh ubah dami taraf pendidikan
menengah (1 – menengah, 0 – selainnya), DT = pemboleh ubah dami taraf pendidikan tertiari
(1 – tertiari, 0 – selainnya), DS = pemboleh ubah dami jantina (1 – lelaki dan 0 – wanita).

Ringkasan keputusan penganggaran dari segi kriteria statistik adalah seperti berikut. (Output
Eviews diberi dalam Lampiran 4)

R2 Ralat piawai teranggar AIC SIC


Model A 0.3036 114.3347 12.3673 12.5113
Model B 0.2940 115.1230 12.3728 12.4928

Model A dan Model B ialah model tak tersarang. Berdasarkan discriminant approach, Model A
dipilih kerana mempunyai nilai R 2 yang lebih besar serta nilai ralat piawai teranggar dan AIC
yang lebih kecil. Akan tetapi, kesemua statistik tidak menunjukkan perbezaan yang besar.

2.8 Pemilihan Antara Dua Model Tak Tersarang (Non-nested): Discerning Approach

Prosedur Ujian Davidson-MacKinnon J

Langkah 1: Anggar model (2.8) dan dapatkan nilai teranggar bagi Y, katakan Yˆ *

Langkah 2: Tambahkan Yˆ * sebagai pemboleh ubah penerang tambahan ke dalam model (2.7)
dan anggarkan model berikut

Y   0   1 X 1   2 X 2   3Yˆ *  u

Langkah 3: Uji hipotesis  3  0 dengan ujian t

Page 16 of 18
Topik 2: Spesifikasi Model dan Ujian Diagnostik
Semester 2, Sesi 2020/2021

Yˆ * mewakili pengaruh pemboleh ubah penerang yang tiada dalam model (2.7)

Jika  3  0 gagal ditolak, pengaruh tersebut tidak signifikan, model (2.7) dipilih

Jika  3  0 ditolak, pengaruh tersebut signifikan, model (2.8) dipilih

Langkah 4: Anggar model (2.7) dan dapatkan nilai teranggar bagi Y, katakan Ŷ **

Langkah 5: Tambahkan Ŷ ** sebagai pemboleh ubah penerang tambahan ke dalam model (2.8)
dan anggarkan model berikut

Y   0   1 Z 1   2 Z 2   3Yˆ **  v

Langkah 6: Uji hipotesis  3  0 dengan ujian t

Ŷ ** mewakili pengaruh pemboleh ubah penerang yang tiada dalam model (2.8)

Jika  3  0 gagal ditolak, pengaruh tersebut tidak signifikan, model (2.8) dipilih

Jika  3  0 ditolak, pengaruh tersebut signifikan, model (2.7) dipilih

Keputusan Ujian Davidson-MacKinnon J boleh diringkaskan seperti berikut

Hipotesis  3  0
Hipotesis  3  0
Gagal ditolak Ditolak
Gagal ditolak terima kedua-dua model terima model (2.8)
Ditolak terima model (2.7) tolak kedua-dua model

Daripada jadual di atas, dapat diperhatikan bahawa i) jika kedua-dua model ditolak, apakah
model yang sesuai untuk menerangkan gelagat pemboleh ubah bersandar? ii) jika kedua-dua
model diterima, ini bermakna data yang digunakan tidak memadai untuk membezakan antara dua
hipotesis yang diuji. Tambahan lagi, ujian J hanya sesuai digunakan dalam keadaan saiz sampel
yang besar.

Rujuk kepada Contoh 6.

Keputusan penganggaran Model B dengan tambahan pemboleh ubah WIFA


Dependent Variable: WI

Variable Coefficient Std. Error t-Statistic Prob.

AGE -0.183755 2.107675 -0.087184 0.9307


DS 12.80117 48.49948 0.263945 0.7923
DT 66.70642 96.53576 0.691002 0.4910
DSDT -145.1884 96.59176 -1.503114 0.1357
WIFA 1.020946 0.465025 2.195467 0.0303
C 0.229028 32.08370 0.007138 0.9943

Page 17 of 18
Topik 2: Spesifikasi Model dan Ujian Diagnostik
Semester 2, Sesi 2020/2021

WIFA ialah nilai teranggar bagi WI daripada Model A.

Keputusan penganggaran Model A dengan tambahan pemboleh ubah WIFB

Dependent Variable: WI

Variable Coefficient Std. Error t-Statistic Prob.

AGE -0.042435 3.019767 -0.014052 0.9888


DR 25.25467 30.91533 0.816898 0.4158
DM 66.29075 30.83110 2.150126 0.0338
DT 4.264238 116.9424 0.036464 0.9710
DS 11.67525 65.78127 0.177486 0.8595
WIFB 1.045996 0.699054 1.496302 0.1375
C -21.83272 36.97261 -0.590511 0.5561

WIFB ialah nilai teranggar bagi WI daripada Model B.

H 0 :  6  0 ditolak pada aras keertian 5%. Ini bermakna pengaruh pemboleh ubah penerang
yang tiada dalam Model B adalah signifikan. Maka Model A dipilih.

H 0 :  7  0 gagal ditolak pada aras keertian 5%. Ini bermakna pengaruh pemboleh ubah
penerang yang tiada dalam Model A adalah tidak signifikan. Maka Model A dipilih.

Oleh itu, spesifikasi Model A adalah lebih baik. Kesimpulan ujian Davidson-MacKinnon J
didapati sama dengan kesimpulan yang diperoleh dengan menggunakan discriminant approach.

2.9 When Use Logarithmic Transformations of Variables?

i) Logarithmically transforming variables in a regression model is a very common way to


handle situations where a non-linear relationship exists between the independent and
dependent variables. Using the logarithm of one or more variables makes the effective
relationship non-linear, while still preserving the linear model.

ii) Logarithmic transformations are also a convenient means of transforming a highly


skewed variable into one that is more approximately normal.

iii) In the scatter plot, when the residuals grow as the predicted values of the dependent
variable grow, consider using the logarithm of the dependent variable. This is an instance
of what’s known as heteroscedasticity which refers to any situation where the residuals
vary systematically with the size of the dependent variable.

Page 18 of 18

You might also like