Download as pdf or txt
Download as pdf or txt
You are on page 1of 8

Prosiding Statistika ISSN: 2460-6456

Pengujian Kesamaan Distribusi Multivariat dengan Menggunakan Uji


Nonparametrik Data Depth pada Nilai UNBK Sekolah Menengah Atas
Kota Sukabumi
Similarity Test for Multiple Multivariate Distributions Using Nonparametric test with
Data Depth Applied in UNBK Score In Senior High School of Sukabumi
1
Siti Sarah Sobariah Lestari, 2.Suwanda, , 3Abdul Kudus
1,2,3
Prodi Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Islam Bandung,
Jl. Tamansari No.1 Bandung 40116
email:1sobariahara11696@gmai.com 2idris100358@gmail.com 3 akudus69@unisba.ac.id

Abstract. A nonparametric test for multivariate analysis have been developed by using component wise
signs or rank. However these method give some lack of result or in other words it is not affine invariant.
Chenouri S and G.Christopher (2012) developed Kruskal-Wallis test by using statistical depth function
(Mahalanobis depth and halfspace) in determinig depth rank that computes the depth on distance of the
data to the data center that provides an affine invariant result in testing similarity of multivariate
distribution. In this paper we are going to apply Mahalanobis depth methods to compute rank of
multivariate data and nonparametric test (Kruskal-Wallis) based on data depth for testing the similarity of
some multivariate distribution between two samples of UNBK Score in one of senior high school in
Sukabumi city at 2015/2016 school year with 2017/2018 school year. The data sets contains by three
variables ( Bahasa, Math, and English). So that the value of statistic test is 123,50027
and after comparison with we can conclude that distribution of two samples are
different.
Keywords: Multivariat Nonparametric Test, Data Depth, Kruskal-Wallis Test.

Abstrak. Pengembangan terhadap pengujian nonparametrik pada analisis multivariat telah banyak
dikembangkan dengan menghitung component wise berdasarkan tanda atau ranking. Namun demikian
masih terdapat kekurangan pada metode yang telah ditawarkan, salah satunya hasil analisis yang tidak
affine invariant. Chenouri S dan G. Christopher (2012) mengembangkan pengujian Kruskal-Wallis dengan
memanfaatkan statistical depth function (Mahalanobis depth dan halfspace method) dalam penentuan
ranking yang menghitung kedalaman pada jarak data terhadap pusat data yang mampu memberikan hasil
pengujian yang affine invariant dalam melakukan pengujian kesamaan beberapa distribusi multivariat.
Dalam skripsi ini akan dilihat penerapan metode Mahalanobis depth untuk menentukan ranking dari data
multivariat dan uji statistik nonparametrik Kruskal-Wallis yang berdasarkan kepada data depth untuk
menguji apakah terdapat perbedaan distribusi pada nilai UNBK pada salah satu SMAN Kota Sukabumi
tahun pelajaran 2015/2016 dengan tahun pelajaran 2017/2018 dimana dari data nilai UNBK tersebut
diambil nilai siswa pada program IPA dengan membandingkan tiga mata pelajaran yang menjadi mata
pelajaran wajib dalam UNBK yakni Bahasa Indonesia, = Matematika, dan = Bahasa Inggris.
Sehingga diperoleh nilai statistik uji sebesar dengan nilai kritis , maka
disimpulkan bahwa dua buah distribusi mulrivariat nilai UNBK tersebut adalah berbeda.
Kata Kunci: Uji Multivariat Nonparametrik, Data Depth, Uji Kruskal-Wallis.

normal multivariat. Sedangkan pada


A. Pendahuluan
praktiknya asumsi ini cukup sulit
Analisis multivariat memiliki terpenuhi sehingga apabila asumsi
peran penting dalam perkembangan tersebut tidak terpenuhi harus
ilmu statistik. Analisis ini bertujuan dilakukan pengujian nonparametrik
untuk meminimalisir penggunaan pada data multivariat. Pengembangan
hanya satu variabel dalam melakukan terhadap pengujian nonparametrik
pengukuran. Akan tetapi, analisis ini pada data multivariat telah banyak
sangat bergantung kepada asumsi dikembangkan salah satunya dengan

16
Pengujian Kesamaan Distribusi Multivariat dengan Menggunakan Uji Nonparametrik Data ...| 17

menghitung rank dengan component- penentuan nilai rank pada data


wise. Namun demikian metode ini multivariat dengan
tidak memberikan hasil yang affine menggunakan perhitungan
invariant. Mahalanobis depth.
Chenouri S dan G. Christopher 2. Untuk mengetahui prosedur
(2012) mengembangkan pengujian perhiutngan statistik uji
nonparametrik pada data multivariat Kruskal-Wallis dengan
dengan menentukan ranking menggunakan nilai rank dari
berdasarkan data depth dengan Mahalanobis depth dan
perhitungan statistical depth function penerapannya pada data nilai
seperti Mahalanobis depth atau UNBK salah satu SMA di Kota
halfspace yang mana perhitungan Sukabumi.
tersebut memberikan hasil affine
B. Landasan Teori
invariant. Dalam makalah ini akan
digunakan perhitungan statistical depth Analisis multivariat muncul
function yakni Mahalanobis depth hal ketika peneliti memiliki buah amatan
ini berdasarkan penelitian yang dan setiap amatan dilakukan
dilakukan oleh Zuo (2000) bawasanya pengukuran buah peubah
Mahalanobis depth merupakan salah (Hajarisman, 2008). Gugus data dalam
satu statistical depth function yang multivariat berbentuk matriks dengan
memenuhi kriteria untuk digunakan baris ke- ( , sedangkan
dalam perhitungan nilai depth. kolom ke- merupakan peubah ke-
Pendekatan data depth dapat ( dengan struktur
mengidentifikasi letak data dengan titik matriks sebagai berikut :
pusat sehingga skala multivariat dapat
dikarakterisasi dengan baik oleh data
depth. Liu dan Singh menggunakan [ ]
konsep data depth untuk melakukan
perluasan uji Kruskal-Wallis univariat
ke model multivariat. Dengan Katakanlah dimana X
mengadaptasi konsep tersebut dalam mengikuti distribusi sehingga
kumpulan data multivariat, dapat penaksir untuk rata-rata dan variansnya
memperluas aplikasi analisis adalah sebagai berikut
multivariat, karena dapat membuka Penaksir rata-rata :
kemungkinan metode nonparametrik
yang akan digunakan dalam analisis ̅
data multivariat. ̅
̂ ∑ ( ) (1)
Berdasarkan latar belakang
yang telah diuraikan, maka perumusan ̅
masalah dalam penelitian ini sebagai
berikut: “Bagaimana prosedur Penaksir Varians :
penentuan nilai rank pada data
multivariat dan prosedur perhitungan ̂ ∑ ̅ ̅ (2)
statistik uji Kruskal-Wallis dengan
perhitungan Mahalanobis depth pada Chenouri dan Christopher
kasus data tertentu?”. Selanjutnya, (2012), membuat tes multivariat yang
tujuan dalam penelitian ini diuraikan asimtotik dengan distribusi bebas
dalam pokok-pokok sbb. bersyarat multivariat berdasarkan data
1. Untuk mengetahui prosedur depth. Selain itu, uji yang

Statistika
18 | Siti Sarah Sobariah Lestari, et al.

dikembangkan dibuat agar hasil yang Mahalanobis depth dirumuskan


diberikan affine equivalen. Dalam dengan :
pengaturan standar, statistik uji pada (4)
metode ini memiliki distribusi
asimtotik chi-square dengan derajat Apabila apabila vektor rata-rata dan
bebas . Dimana metode ini matiks kovarians tidak diketahui
dikombiasikan dengan Sebuah teknik maka ditaksir dari data sampel yaitu ̂
grafis untuk membandingkan dua dan ̂ . Sebuah titik pengamatan
distribusi yang dikenal sebagai depth- dengan nilai Mahalanobis depth
depth plot, atau DD-plot, mendekati 1 menunjukkan bahwa
diperkenalkan oleh Liu et al. (1999). pengamatan tersebut mendekati pusat
Metode ini memiliki beberapa data cloud ( ).
keuntungan. Diantaranya, Pada bahasan ini akan
memungkinkan peneliti untuk memilih dijelaskan perluasan metode Kruskal-
depth function dengan menggabungkan Wallis untuk pengujian kesamaan
konsep equivariant, robustness dan beberapa distribusi multivariat
komputasi. Dengan kata lain, dapat berdasarkan data depth yang rumusan
menyesuaikan berdasarkan hipotesisnya sebagai berikut :
konteksnya. Kedua, metode ini
didasarkan pada peringkat untuk semua (5)
multidimensi pada data dengan Secara umum, data sampel yang
menggunakan perhitungan kedalaman dibangun dengan konsep multivariat,
data ke dengan pusat data. Sehingga disajikan pada Tabel 2.1. Dibawah
Perankingan Statistik memberikan benar kita akan menentukan
keuntungan sebab mereka berdimensi distribusinya secara umum dengan .
tunggal. Penggunaan peringkat ini ̂ menunjukan distribusi empiris
sangat berguna jika data analisis diolah sampel yang berisi data ke- .
dengan teknik pereduksi dimensi { } maka, ̂ ∑ ̂
seperti PCA.
Fungsi depth menjadi fungsi dimana ∑ dan ⋃
nonnegatif debatasi dari bentuk sehingga, ( ̂ ) menunjukkan
untuk setiap vektor depth dari untuk dan
acak dimana menunjukkan dengan menggunakan
distribusi . Fungsi depth akan distribusi ̂ .
dikatakan affine invariant jika (
Tabel. 1 Data berasal dari distirbusi
) berlaku untuk
vektor acak sembarang dalam
untuk setiap merupakan Treatment
matriks nonsingular dan setiap
vektor dan di (Zuo, 2000).
Jarak Mahalanobis sebagai
fungsi depth merupakan fungsi yang
paling umum yang terkait dengan teori
normal multivariat. Mengikuti Rao
(1988), untuk matriks definit Kita tentukan sebagai
positif ∑, kita definisikan jarak ranking dari yang dihubungkan
Mahalanobis dari ke dengan : dengan fungsi depth ( ̂)
sehingga struktur rank nya sebagai
∑ (3) berikut : (3)
Volume 5, No. 1, Tahun 2019
Pengujian Kesamaan Distribusi Multivariat dengan Menggunakan Uji Nonparametrik Data ...| 19

, seperti yang dijelaskan di


Tabel. 2 Struktur Rank Dari Depth atas. Tabel 3 merangkum peringkat
Berdasarkan Sampel , untuk setiap .
Sampel ke-
Tabel. 3 Struktur Depth rank
berdasarkan k sample
Sampel ke-

Dari susunan data dalam Tabel


2 diperoleh nilai sebagai berikut
∑ (6)
dan Dengan demikian, akan lebih
̅ (7) masuk akal untuk membangun statistik
sehingga dapat ditunjukkan uji , sebab rank memiliki
dengan mudah bahwa kemampuan untuk membedakan
observasi sampel yang berada di
(8) sampel dimana . Katakanlah,
(9) berdasarkan peringkat dengan
cara yang mirip dengan konstruksi
(10) seperti dalam Persamaan (12) maka,
dikumpulkan statistik-statistik uji
Kita misalkan, bersama-sama sehingga
[̅ ( ̅ )] membentuk sebuah statistik uji
(̅ )
(11)
keseluruhan untuk hipotesis nol bahwa
Sama halnya dengan uji semua sampel memiliki distribusi yang
Kruskal-Wallis pada data univariat, sama. Maka dapat didefinisikan :
maka nilai dari rata-rata yang diboboti
dari yakni
(̅ )
∑ ( ) (12)
(13)
Perlu dicatat bahwa dibawah Berdasarkan pada persamaan
hipotesis nol benar statistik (13) maka,
merupakan variabel acak bebas
distribusi. Akan tetapi, distribusi ini ∑ ( ) (14)
tidak cukup sensitif dalam hal
mendeteksi pergeseran lokasi (lihat Persamaan (14) dapat
Chenouri (2004), Liu dan Singh (2006) dipertimbangkan sebagai statistik uji
dan Chenouri et al (2011)). Untuk namun tentu hal ini bergantung pada
mengatasi hal tersebut, Chenouri dan pemilihan k. Untuk mengatasi hal
Christopher (2012) mengubah metode tersebut maka statistik uji yang sejenis
perankingan yang lebih sensitif melalui dengan statistik uji K adalah
sampel yang dipisah berdasarkan
distribusi empiris masing-masing ∑ (15)
sampel. Perhatikan fungsi depth
( ̂ ) dan peringkat Berdasarkan statistik uji H
untuk dan , Perasamaan (15), diperoleh kriteria uji

Statistika
20 | Siti Sarah Sobariah Lestari, et al.

yaitu tolak H0 jika nilai statistik uji H adalah kelompok nilai UNBK tahun
sangat besar. ajaran 2017/2018. Hasil output dari
Untuk menentukan nilai kritis, Matlab 2014 untuk perhitungan nilai
berdasarkan hasil simulasi Chenouri Mahalanobis depth disajikan pada
dan Christopher (2012) pada studi Tabel 4.
Monte Carlo diperoleh bahwa untuk
ukuran sampel pada kelompok sampel,
jika salah satu kelompok sampel Ranking Berdasarkan Nilai Data
memiliki ukuran sampel 50 maka Depth
nilai kritis diperoleh dengan uji Untuk menentukan ranking
permutasi. Sedangkan jika salah satu berdasarkan nilai mahalanobis depth,
kelompok sampel memiliki ukuran maka akan kita gabungkan nilai
sampel 50 menggunakan pendekatan mahalanobis depth dari kedua sampel
ke distribusi 2 dengan derajat bebas berdasarkan pendekatan distribusi
. ̂ nya, kemudian diurutkan.
Dimana, rank pertama merupakan nilai
depth yang paling kecil, menunjukkan
C. Hasil Penelitian dan
bahwa nilai depth tersebut merupakan
Pembahasan
titik yang paling jauh dari pusat dan
Menghitung Jarak Mahalanobis nilai rank terbesar merupakan nilai
Dengan bantuan Matlab 2014 depth yang paling besar, menunjukkan
diperoleh nilai jarak Mahalanobis dan nilai depth tersebut merupakan titik
Mahalanobis depth dari setiap yang paling mendekati pusat. Dengan
responden untuk kelompok nilai bantuan Matlab 2014 maka diperoleh
UNBK tahun ajaran 2015/2016 dan nilai ranking dari mahalanobis depth
kelompok nilai UNBK tahun ajaran pada Tabel 5.
2017/2018 terhadap distribusi ̂
dan ̂ . Selanjutnya akan ditulis
dengan ̂ . Dimana kelompok 1
adalah kelompok nilai UNBK tahun
ajaran 2015/2016 dan kelompok 2

Tabel. 4 Nilai Mahalanobis Depth

Mahalanobis depth berdasarkan distribusi Mahalanobis depth berdasarkan distribusi


𝐹̂ 𝐹̂
𝑘 𝑘
Kelompok Kelompok Kelompok Kelompok
No No No No
1 2 1 2
Res. Res. Res Res.
𝑗 𝑗 𝑗 𝑗
1 0,3144 1 0,2352 1 0,2228 1 0,5989
2 0,2965 2 0,1007 2 0,2741 2 0,3042
3 0,2592 3 0,0891 3 0,1604 3 0,2180

291 0,2217 291 0,2211 291 0,1780 291 0,7187

337 0,0674 337 0,1964

Volume 5, No. 1, Tahun 2019


Pengujian Kesamaan Distribusi Multivariat dengan Menggunakan Uji Nonparametrik Data ...| 21

Tabel. 5 Rank Mahalanobis Depth

Rank Mahalanobis depth berdasarkan Rank Mahalanobis depth berdasarkan


distribusi 𝐹̂ distribusi 𝐹̂
𝑘 𝑘
Kelompok Kelompok Kelompok Kelompok
No No No No
1 2 1 2
Res. Res. Res Res.
𝑗 𝑗 𝑗 𝑗
1 446 1 368 1 255 1 574
2 430 2 111 2 346 2 387
3 386 3 75 3 148 3 249

291 348 291 347 291 170 291 601

337 27 337 208


𝑹𝟏 𝟏 122464 𝑹𝟐 𝟏 75042 𝑹𝟏 𝟐 75361 𝑹𝟐 𝟐 122145
̅𝟏 𝟏
𝑹 420.8385 ̅𝟐 𝟏
𝑹 222.6766 ̅𝟏 𝟐
𝑹 258.9725 ̅𝟐 𝟐
𝑹 362.4481

Setelah dilakukan perankingan, mendapatkan nilai statistik uji


kemudian dihitung jumlah dan rata-rata akan dihitng terlebih dahulu nilai
rankingnya. Berdasarkan Tabel 5 di statistik uji dengan persamaan
atas, diperoleh nilai ̅ dan (19) sehingga akan diperoleh statistik
̅ terhadap distribusi ̂ uji dan untuk
sebesar 420.8385 dan 222.6766 memperoleh nilai statistik uji
kemudian untuk nilai ̅ dan yang didasarkan kepada jarak ke ̂
̅ terhadap distribusi ̂ dan statistik uji dan untuk
sebesar 258.9725 dan 362.4481. memperoleh nilai statistik uji
Kemudian akan digunakan dalam yang didasarkan kepada jarak ke ̂ .
perhitungan statistik . Dengan perhitungan menggunakan
Menghitung Statistik Uji Kruskal- Matlab 2014 diperoleh nilai statistik uji
Wallis Berdasarkan Data Depth , , , dan
:tidak terdapat seperti pada Tabel 6.
perbedaan distribusi antara nilai Tabel 6 Nilai statistik
UNBK tahun pelajaran 2015/2016 berdasarkan distribusi ̂ dan ̂
dengan nilai UNBK tahun pelajaran
2017/2018. Nilai statistik
:terdapat perbedaan Nilai statistik
distribusi antara nilai UNBK tahun Kelompok 1 dan 2
pelajaran 2015/2016 dengan nilai Kelompok 1 dan 2
thd distribusi
UNBK tahun pelajaran 2017/2018 thd distribusi ̂ ̂
Menghitung Statistik Uji
Dalam perhitungan statistik uji, 186.28365 50.79371
akan digunakan peramaan (21) untuk 186.28344 50.79375
memperoleh nilai statistik uji yang
kemudian akan dibandingkan dengan Berdasarkan nilai pada Tabel 6
nilai kritis. Namun sebelum maka kita dapat menghitung nilai
Statistika
22 | Siti Sarah Sobariah Lestari, et al.

statistik uji dan statistik uji Sehingga, ditolak.


dengan persamaan (20) sehingga
diperoleh nilai sebagai berikut : Kesimpulan
Terdapat perbedaan distribusi
∑( ) nilai UNBK tahun pelajaran 2015/2016
dengan distribusi nilai UNBK tahun
pelajaran 2017/2018.
D. Kesimpulan
∑( )
Berdasarkan hasil analisis dan
penelitian, perhitungan rank
Sehingga, nilai statistk uji berdasarkan Mahalanobis depth
dapat dihitung yakni disimpulkan bahwa,
1. Berdasarkan prosedur
penentuan nilai rank pada data
Menghitung Nilai Kritis multivariat dua sampel nilai
Mengkuti Chenouri dan UNBK SMAN XXX dengan
Christopher (2012) berdasarkan hasil menggunakan perhitungan
simulasi yang dilakukan, maka nilai Mahalanobis depth maka
kritis dibagi menjadi dua kriteria yakni diperoleh nilai ̅ dan
saat sampel lebih besar dari 50 maka, ̅ terhadap distribusi ̂
digunakan nilai kritis dengan chi- sebesar 420.8385 dan 222.6766
kuadrat. Sedangkan untuk sampel lebih kemudian untuk nilai ̅
kecil dari 50 maka, digunakan nilai dan ̅ terhadap distribusi
kritis dengan cara permutasi. Dalam ̂ sebesar 258.9725 dan
skripsi ini ukuran sampel lebih besar 362.4481. Prosedur perhitungan
dari 50. Sehingga nilai kritis yang rank berdasarkan Mahalanobis
digunakan adalah nilai Chi-kuadrat. depth untuk data multivariat
Dengan taraf nyata 0,05 maka, cukup membantu dan cenderung
lebih mudah dilakukan untuk
Kriteria Uji data multivariat. Selain itu hasil
Kriteria Pengujian adalah yang diberikan cukup
bentuk pembuatan keputusan dalam representatif atau invariant
menerima atau menolak hipotesis nol sebab, setiap obesrvasi dihitung
( ) dengan cara membandingkan nilai jaraknya terhadap pusat yang
kritis dengan nilai uji statistiknya, mana dilakukan berdasarkan
sesuai dengan bentuk pengujiannya. distribusi ̂ untuk
Dalam kasus ini Penolakan terjadi . Kemudahan
jika nilai uji statistiknya lebih besar perhitungan ini dapat dibantu
dari . Atau nilai statistik uji dengan beberapa software
seperti Matlab atau Excel.
berada di luar nilai kritis (Sudjana,
2. Berdasarkan prosedur
2008). Seperti diketahui nilai statistik
perhitungan statistik uji
uji sebesar dan nilai kritis
Kruskal-Wallis dengan
sebesar 3,8415.
menggunakan nilai rank dari
sehingga
perthitungan Mahalanobis depth
diperoleh nilai statistik uji
Atau dan statistik uji sebesar
dan dan

Volume 5, No. 1, Tahun 2019


Pengujian Kesamaan Distribusi Multivariat dengan Menggunakan Uji Nonparametrik Data ...| 23

nilai statistik uji sebesar 888


. Hasil ini Zuo, Y. and Serfling, R. (2000). General
menunjukkan terdapat notions of statistical depth
perbedaan distribusi dari dua function. Ann. Statist., 28:461–
sampel nilai UNBK pada SMA 482.
XXX.

Daftar Pustaka
Chenouri, S., Small, C. G., and Farrar,
T. J. (2011). Data depth-based
nonparametric scale tests.
Canad. J. Statist., 39:356–369
Chenouri, S. and Farrar, T. J. (2011) A
Two-sample Nonparametric
Multivariate Scale Test based on
Data Depth Canad. J. Statist.
Chenouri, S., and Small, C. G. (2012) A
nonparametric multivariate
multisample test based on data
depth Electronic Journal of
Statistics,. 06:760-782
Hajarisman Nusar (2008). Statistika
Multivariat. Seri buku Ajar
Universitas Islam Bandung
Junaidi (2010) Statistik Uji Kruskall-
Wallis Repository Fakultas
Ekonimo Universeitas Jambi
Karl Mosler (2010) Depth
Statistic.dalam C. Becker et al.
(eds.), Robustness and Complex
Data Structures, Springer-Verlag
Berlin Heidelberg
Liu, R. Y., Parelius, J. M., and Singh, K.
(1999). Multivariate analysis by
data depth: Descriptive statistics,
graphics and inference. Ann.
Statist., 27:783–858.
Yanti Tety Sofia (2010) Perluasan Uji
Kruskal Wallis untuk Data
Multivariat Statistika Unisba,
Vol. 10 No. 1, 43 – 49
Zhang C, Lin, and Wu J (2009)
Nonparametric tests for the
general multivariate multi-
sample problem Journal of
Nonparametric Statistics Vol.
21, No. 7, October 2009, 877–

Statistika

You might also like