Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 23

LAPORAN ANALISIS MULTIVARIAT Ke-I

“ ANALISIS DISKRIMINAN ”

Debby Lolita
155090501111014

Asisten :
1. Hasanah 145090500111022
2. Wulaida Zuhriana Alwi 145090501111012

PROGRAM STUDI SARJANA STATISTIKA


JURUSAN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN
ALAM
2018
BAB I
PENDAHULUAN

1.1. Latar Belakang


Dalam berbagai bidang kehidupan banyak sekali dijumpai
permasalahan – permasalahan atau penelitian yang
membutuhkan analisis statistika di dalamnya. Salah satu
penelitian yang banyak dijumpai adalah penelitian untuk
mengetahui hubungan antara variabel respon dan variabel
prediktor. Variabel respon maupun variabel prediktor dapat
berupa data kualitatif dan data kuantitatif. Pada kasus dimana
variabel respon berupa data kualitatif dan variabel prediktor
berupa data kuantitatif, salah satu analisis yang dapat dilakukan
adalah analisis diskriminan.
Analisis diskriminan (Discriminant Analysis) adalah salah
satu metode analisis multivariat yang bertujuan untuk
memisahkan beberapa kelompok data yang sudah
terkelompokkan dengan cara membentuk fungsi diskriminan
(Johnson & Wichern 1998). Analisis diskriminan dapat
digunakan pada hubungan dipendensi atau hubungan antar
variabel dimana dapat dibedakan mana variabel respon dan
mana variabel prediktor. Tujuan dari analisis diskriminan adalah
untuk mengklasifikasikan suatu individu atau observasi ke
dalam kelompok yang saling bebas (mutually exclusive/disjoint)
dan menyeluruh (exhaustive) berdasarkan beberapa variabel
prediktor. Untuk mempermudah dalam melakukan analisis data
dengan menggunakan analisis diskriminan dapat dilakukan
dengan beberapa software seperti Minitab, R, SPSS, SAS, dan
lainnya. Untuk lebih memahami bagaimana penggunaaan
analisis diskriminan pada suatu kasus, maka pada praktikum ini
analisis data dilakukan menggunakan Software SPSS.
1.2. Tujuan
 Untuk mengetahui perbedaan yang jelas antar grup pada
variabel respon.
 Untuk mengetahui variabel prediktor manakah yang
merupakan pembeda terkuat.
 Untuk mengetahui tepat atau tidaknya pengklasifikasian
suatu individu atau observasi dalam kelompok berdasarkan
beberapa variabel prediktor.
 Untuk mengetahui dan memahami bagaimana langkah –
langkah atau proses Ananlisis Diskriminan dengan
menggunakan Software SPSS.
BAB II
TINJAUAN PUSTAKA

2.1 Pengertian Analisis Diskriminan


Analisis diskriminan adalah suatu teknik analisa statistik
untuk mengklasifikasikan obyek ke dalam suatu kelompok
tertentu berdasarkan peubah bebasnya (Dillon and
Goldstein,1984). Pendapat yang sama dikemukakan oleh
Johnson & Wichern 1998 bahwa analisa diskriminan adalah
suatu metode yang dapat menghasilkan pemisahan yang terbaik
antara berbagai macam populasi, pemisahan dilakukan dengan
fungsi diskriminan ynag merupakan kombinasi linear dari
peubah-peubah bebasnya.
Analisis Diskriminan merupakan suatu analisis multivariat
yang digunakan untuk mengelompokkan suatu individu atau
objek ke dalam suatu kelompok yang telah ditentukan
sebelumnya berdasarkan variabel-variabel tertentu. Analisis
diskriman dapat digunakan jika variabel dependen terdiri dari
dua kelompok atau lebih kelompok. Pengelompokkan pada
analisis bersifat apriori, artinya seorang peneliti, sudah
mengetahui sebelumnya individu atau objek mana saja yang
masuk ke dalam kelompok 1, 2, dan 3.

2.2 Asumsi Analisis Diskriminan


Terdapat 3 asumsi dalam analisis diskriminan, yaitu:
1. Variabel independen berdistribusi normal multivariate.
Apabila plot antara jarak mahalanobis dan chi-kuadrat
mengikuti pola garis lurus maka data dikatakan
berdistribusi normal multivariate.
2. Homogenitas matrik varians kovarians dari variabel
independen dari tiap kelompok sama
Homogenitas matriks varians kovarians dari setiap variabel
independen sama mengindikasikan bahwa apabila matriks
varians kovarians-nya sama, maka error atau
penyimpangan dalam pengukuran oleh sejumlah indikator
sama. Selain itu juga, hal ini mengindikasikan bahwa
sebaran data untuk kedua kelompok sama.
3. Tidak terdapat multikolinieritas dalam kelompok variabel
independen
Maksud asumsi ini bahwa tidak boleh adanya korelasi
antara variabel independennya. Jika dua varaibel memiliki
korelasi yang kuat, maka dikatakan bahwa data kurang
efisien.

2.3 Model Matematik untuk Analisis Diskriminan

Di = b0 + b1Xi1 + b2Xi2 + b3Xi3 + .... + bkXik

Dimana :
 D merupakan nilai diskriminan dari responden ke i.
dengan i = 1, 2, 3, ... , k. D merupakan variabel bebas.
 Xij merupakan variabel ke j dari responden ke i
 bj merupakan koefisien dikriminan dari variabel ke-j

2.4 Algoritma Pokok Analisis Diskriminan


Secara ringkas, langkah-langkah dalam analisis diskriminan
adalah sebagai berikut:
1. Pengecekan adanya kemungkinan hubungan linier antara
variabel penjelas. Untuk point ini, dilakukan dengan
bantuan matriks korelasi (pembentukan matriks korelasi
sudah difasilitasi pada analisis diskriminan). Pada output
SPSS, matriks korelasi bisa dilihat pada Pooled Within-
Groups Matrices.
2. Uji Vektor Rata-rata Kedua Kelompok
Ho: µ1 =µ2
H1: µ1 ≠µ2
Diharapkan dari uji ini adalah hipotesis nol ditolak,
sehingga kita mempunyai informasi awal bahwa variabel
yang sedang diteliti memang membedakan kedua
kelompok. Pada SPSS, uji ini dilakukan secara univariate
(jadi yang diuji bukan berupa vektor), dengan bantuan tabel
Tests of Equality of Group Means.
3. Dilanjutkan pemeriksaan asumsi homoskedastisitas,
dengan uji Box’s M. Diharapkan dari uji ini hipotesisi nol
tidak ditolak ( Ho: Σ1= Σ2).
4. Pembentukan model diskriminan
a. Kriteria Fungsi Linier Fisher
 Pembentukan Fungsi Linier (teoritis)
Fisher mengelompokkan suatu observasi berdasarkan
nilai skor yang dihitung dari suatu fungsi linier Y =
λ' X dimana λ' menyatakan vektor yang berisi
koefisien-koefisien variabel penjelas yang
membentuk persamaan linier terhadap variabel
respon, λ' = [λ1 ,λ2 ,...,λp ].

Xk menyatakan matriks data pada kelompok ke-k

Xijk menyatakan observasi ke-i variabel ke-j pada


kelompok ke-k.

Di bawah asumsi Xk ~ N(µk , Σk ) maka


Fisher mentransformasikan observasi-observasi x yang
multivariate menjadi observasi y yang univariate. Dari
persamaan Y = λ' X diperoleh

µ ky = E(Yk ) = E(λ' X ) = λ' µk ;


σ 2Y = var(ℓ ' X)=ℓ ' Σ ℓ
σ
µ ky adalah rata-rata Y yang diperoleh dari X yang
termasuk dalam kelompok ke-k
σ Y adalah varians Y dan diasumsikan sama untuk kedua
2

kelompok.
Kombinasi linier yang terbaik menurut Fisher adalah
yang dapat memaksimumkan rasio antara jarak kuadrat
rata-rata Y yang diperoleh dari x dari kelompok 1 dan 2
dengan varians Y, atau dirumuskan sebagai berikut:
Jika 1  2   maka persamaan di atas menjadi

( ) 2
' 
Karena Σ adalah matriks definit positif, maka menurut
( ) 2
teori pertidaksamaan Cauchy-Schwartz, rasio
' 
dapat dimaksimumkan jika
λ' = cΣ−1δ = cΣ−1 (µ1 − µ2)
Dengan memilih c=1, menghasilkan kombinasi
linier yang disebut kombinasi linier Fisher
sebagai berikut:
Y = λ' X = (µ1−µ2)' Σ−1 X

 Pembentukan Model Linier dengan SPSS


Pada output SPSS, koefisien untuk tiap variabel yang
masuk dalam model dapat dilihat pada tabel
Canonical Discriminant Function Coefficient. Tabel
ini akan d ihasilkan pada output apabila
pilihan Function Coefficient bagian Unstandardized
diaktifkan.
 Menghitung Discriminant Score
Setelah dibentuk fungsi liniernya, maka dapat
dihitung skor diskriminan untuk tiap observasi
dengan memasukkan nilai-nilai variabel penjelasnya.
 Menghitung Cutting Score
Cutting score (CS) dapat dihitung dengan rumus
sebagai berikut:
n1 ( f 1 )  n2 ( f 2 )  ...  nk ( f k )
CS 
n1  n2  ...  nk
nk adalah jumlah sampel ada kelompok ke-k,
k=1,2,3…,p
Kemudian nilai-nilai discriminant score tiap observasi akan
dibandingkan dengan cutting score, sehingga dapat
diklasifikasikan suatu observasi akan termasuk ke dalam
kelompok yang mana. Suatu observasi dengan karakteristik
x akan diklasifikasikan sebagai anggota kelompok 1 jika
selain itu dimasukkan ke dalam kelompok 2. Penghitungan
CS dilakukan secara manual, karena SPSS tidak
mengeluarkan output CS . Namun, kita dapat menghitung
CS dengan bantuan tabel Function at Group Centroids dari
output SPSS.
BAB III
METODE PENELITIAN

1. Buka Software SPSS yang akan digunakan untuk menganalisis


data.

2. Input-kan data yang akan dianalisis ke dalam SPSS.

3. Ubah nama variabel dependen dan independen data, jumlah


desimal, dan skala pengukuran data.
4. Selanjutnya pada menu bar klik Analyze  Classify 
Discriminant… seperti gambar di bawah ini :

5. Lalu akan muncul kotak dialog Discriminant Analysis, kemudian


masukkan:
Grouping Variable : Y
Independents : X1, X2, X3, X4 dan X5
Pilih Use stepwise method
6. Kemudian klik Define Range, selanjutnya akan muncul kotak
dialog Discriminant Analysis Define Range, masukkan nilai :
Minimum : 1
Maximum : 3
Lalu klik Continue

7. Langkah berikutnya adalah klik Statistics… pada bagian kanan


kotak dialog Discriminant Analysis. Akan muncul kotak dialog
Discriminant Analysis: Statistics, lalu pilih :
 Means
 Univariate ANOVA’s
 Box’s M
 Fisher’s
 Unstandardized
Kamudian klik Continue.
8. Langkah selanjutnya adalah klik Classify… pada bagian kanan
kotak dialog Discriminant Analysis. Akan muncul kotak dialog
Discriminant Analysis: Classification, lalu pilih :
 All groups equal
 Summary table
 Within-groups
Kamudian klik Continue.

9. Kemudian klik OK pada kotak dialog Discriminant Analysis.


10. Selanjutnya hasil analisis akan muncul dalam Output.
BAB IV
HASIL DAN PEMBAHASAN

4.1. Soal
Seorang peneliti ingin mengetahui perbedaan antar grup
pada frekuensi liburan keluarga (Y) yang dipengaruhi oleh
variabel pendapatan keluarga (X1), sikap terhadap pekerjaan
(X2), tingkat kepentingan keluarga (X3), jumlah anggota
keluarga (X4) dan umur kepala keluarga (X5).

No Y X1 X2 X3 X4 X5
1 1 1.5 1 1 6 25
2 1 2 1 1 7 30
3 1 1.17 1 1 8 55
4 1 3.5 2 1 9 60
5 1 1.25 2 1 5 30
6 1 1.5 1 1 10 23
7 1 2.3 2 1 7 24
8 1 3.1 1 2 8 32
9 1 1.4 1 2 9 34
10 1 0.75 2 2 6 47
11 2 5.3 3 3 3 32
12 2 6.5 3 4 4 31
13 2 4.7 4 4 4 45
14 2 4.65 4 3 5 42
15 2 3.75 5 4 5 41
16 2 3.2 3 4 4 49
17 2 4.5 4 4 5 50
18 2 6.1 6 4 4 36
19 2 4.3 4 5 5 31
20 2 3.8 4 5 5 39
21 3 10 7 7 2 43
22 3 15 6 7 1 45
23 3 13 7 6 3 29
24 3 14 6 6 2 28
25 3 8 7 6 2 26
26 3 11 7 7 2 35
27 3 12 5 7 3 42
28 3 12.5 7 6 2 43
29 3 13.7 6 6 3 44
30 3 19 6 7 1 45

Keterangan : Y = Frekuensi liburan keluarga


1 = Rendah
2 = Sedang
3 = Tinggi

3.2 Hasil dan Interpretasi


3.2.1 Mengetahui Perbedaan yang Jelas Antar Grup Pada Variabel
Respon
𝐻0 ∶ 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4 = 𝜇5
𝐻1 ∶ 𝑃𝑎𝑙𝑖𝑛𝑔 𝑡𝑖𝑑𝑎𝑘 𝑎𝑑𝑎 𝑠𝑎𝑡𝑢 𝜇𝑘 𝑦𝑎𝑛𝑔 𝑏𝑒𝑟𝑏𝑒𝑑𝑎

Interpretasi :
 Pendapatan Keluarga
Keputusan : Tolak 𝐻0 , karena Sig. < 0.05
Kesimpulan : Dengan taraf nyata sebesar 0.05 data
menyediakan cukup bukti bahwa rata – rata pendapatan
keluarga di grup 1, grup 2 dan grup 3 berbeda secara
signifikan.
 Sikap Terhadap Pekerjaan
Keputusan : Tolak 𝐻0 , karena Sig. < 0.05
Kesimpulan : Dengan taraf nyata sebesar 0.05 data
menyediakan cukup bukti bahwa rata – rata sikap terhadap
pekerjaan di grup 1, grup 2 dan grup 3 berbeda secara
signifikan.
 Tingkat Kepentingan Keluarga
Keputusan : Tolak 𝐻0 , karena Sig. < 0.05
Kesimpulan : Dengan taraf nyata sebesar 0.05 data
menyediakan cukup bukti bahwa rata – rata tingkat
kepentingan keluarga di grup 1, grup 2 dan grup 3 berbeda
secara signifikan.
 Jumlah Anggota Keluarga
Keputusan : Tolak 𝐻0 , karena Sig. < 0.05
Kesimpulan : Dengan taraf nyata sebesar 0.05 data
menyediakan cukup bukti bahwa rata – rata jumlah anggota
keluarga di grup 1, grup 2 dan grup 3 berbeda secara
signifikan.
 Umur Kepala Keluarga
Keputusan : Tolak 𝐻0 , karena Sig. < 0.05
Kesimpulan : Dengan taraf nyata sebesar 0.05 data
menyediakan cukup bukti bahwa rata – rata umur kepala
keluarga di grup 1, grup 2 dan grup 3 tidak berbeda secara
signifikan.

3.2.2 Kebaikan Model

Interpretasi :
 Model 1
𝑅2 = 0.9862 = 0.9722
97.22% informasi yang terkandung pada frekuensi liburan
keluarga telah dijelaskan oleh pendapatan keluarga, sikap
terhadap pekerjaan, tingkat kepentingan keluarga, jumlah
anggota keluarga dan umur kepala keluarga sedangkan
sisanya dijelaskan oleh variabel lain diluar kelima variabel
tersebut.
 Model 2
𝑅2 = 0.5472 = 0.2992
29.92% informasi yang terkandung pada frekuensi liburan
keluarga telah dijelaskan oleh pendapatan keluarga, sikap
terhadap pekerjaan, tingkat kepentingan keluarga, jumlah
anggota keluarga dan umur kepala keluarga sedangkan
sisanya dijelaskan oleh variabel lain diluar kelima variabel
tersebut.

3.2.3 Mengetahui Variabel Prediktor yang merupakan Pembeda


Terkuat

Interpretasi :
 Model 1
Tingkat kepentingan keluarga merupakan pembeda terkuat
atau yang memberikan pengaruh terkuat terhadap frekuensi
liburan keluarga.
 Model 2
Pendapatan keluarga merupakan pembeda terkuat atau
yang memberikan pengaruh terkuat terhadap frekuensi
liburan keluarga.
3.2.4 Model atau Fungsi Diskriminan

Dari Output tersebut akan didapatkan fungsi diskriminan :


𝐷1 = −9.813 + 0.283𝑋1 + 0.831𝑋2 + 1.2𝑋3

𝐷2 = 0.931 + 0.458𝑋1 − 0.201𝑋2 − 0.786𝑋3

𝑋4 dan 𝑋5 hilang karena tidak signifikan.

3.2.5 Cutting Score

Berdasarkan rumus Cutting Score


n1 ( f 1 )  n2 ( f 2 )  ...  nk ( f k )
CS 
n1  n2  ...  nk
nk adalah jumlah sampel ada kelompok ke-k,
k=1,2,3…,p
Maka, dari Output tersebut akan didapatkan cutting score
sebesar :

10(−6.567)+10(−0.364)+10(6.931)
𝐶𝑆1 = 30
=0

10(0.473)+10(−0.875)+10(0.402)
𝐶𝑆2 = 30
=0
3.2.6 Hasil Klasifikasi

Interpretasi :
 Pada grup 1 yang tepat diduga menjadi grup 1 pada
fungsi diskriminan sebanyak 10, atau ketepatan
klasifikasi yang dapat dijelaskan oleh fungsi
diskriminan adalah sebesar 100%
 Pada grup 2 yang tepat diduga menjadi grup 2 pada
fungsi diskriminan sebanyak 10, atau ketepatan
klasifikasi yang dapat dijelaskan oleh fungsi
diskriminan adalah sebesar 100%
 Pada grup 3 yang tepat diduga menjadi grup 3 pada
fungsi diskriminan sebanyak 10, atau ketepatan
klasifikasi yang dapat dijelaskan oleh fungsi
diskriminan adalah sebesar 100%
BAB IV
PENUTUP

4.1 Kesimpulan
4.2 Saran
1. Dalam menganalisis kasus yang menggunakan analisis
diskriminan dapat menggunakan software SPSS, agar lebih
mudah dan cepat dalam proses menganalisis.
2. Dalam menginputkan data ke SPSS harus teliti dan masukkan
skala yang sesuai dengan variabel agar tidak terjadi
kesalahan analisis.
3. Dalam proses perhitungan dan perbandingan manual fungsi
atau model determinan dengan cutting score harus lebih teliti
pada saat memasukkan data untuk semua observasi, agar
tidak terjadi kesalahan perhitungan.

DAFTAR PUSTAKA

Johnson, A. R., and Wichern, W. D. 1998. Applied Multivarite


Statistical Analysis. Fourth Edision. USA: Prentice-Hall. Inc.

Dillon, William R., Matthew, Goldstein.. 1984. Multivariate


Analysis: Methods and Applications. Canada: John Wiley & Sons Inc

Sasmito A.W et all. 2011. Analisis Diskriminan. Jember. Universitas


Jember.

Rosy T. Analisis Diskriminan


.http://daps.bps.go.id/file_artikel/65/ANALISIS%20DISKRIMINAN
.pdf diakses pada Rabu, 25 April 2018

Laporan dicetak bolak balik (mirror)


Jangan lupa kasih nomor halaman

Dikumpul 26 April 2018

You might also like