Download as pdf or txt
Download as pdf or txt
You are on page 1of 39

ANALISIS DISKRIMINAN

DENGAN METODE FISHER

Halimatus Syahdia Hasibuan, S.P., M.Si


Prinsip dasar analisis diskriminan
• Ciri adanya variable dependen dan independent
• Data variable dependen ➔ data kategori ➔ kode group 0
atau kode group 1
• Data variable independent ➔ data rasio
• Ada variable yang hasilnya tergantung pada data variable
independent
• Secara teknis mirip analisis regresi,
• Analisis regresi ➔ Variabel dependen = data rasio
• Analisis diskriminan ➔ variable dependen = kategori
Kegunaan analisis diskriminan
1. Mampu memprediksi terjadinya variable dependen dengan
masukan data variable independent
2. Mampu memilih mana variable independent yang secara nyata
mempengaruhi variable denpenden dan mana yang tidak

Untuk membuat model prediksi keanggotaan kelompok didasarkan


pada karakteristik yang diobservasi ➔ menghasilkan fungsi
diskriminan dari kombinasi linier dari variable bebas ➔ menghasilkan
perbedaan paling baik antar kelompok yang dianalisis
Tujuan analisis diskriminan
1. Ingin mengetahui apakah ada perbedaan yang jelas antar grup pada
variabel dependen, atau bisa dikatakan apakah ada perbedaan antara
anggota grup 0 dengan anggota grup 1.
2. Jika ada perbedaan, variabel independen manakah pada fungsi
diskriminan yang membuat perbedaan tersebut.
3. Membuat fungsi atau model diskriminan, yang pada dasarnya mirip
dengan persamaan regresi.
4. Melakukan klasifikasi terhadap objek (dalam teminologi SPSS disebut
baris), apakah suatu objek (bisa nama orang, nama tumbuhan, benda
atau lainnya) termasuk grup 0 atau grup 1, atau lainnya.
Tujuan analisis diskriminan (Supranto, 2004)
1. Membuat suatu fungsi diskriminan atau kombinasi linear, dari prediktor atau
variabel bebas yang bisa mendiskriminasi atau membedakan kategori variabel
tak bebas atau criterion atau kelompok, artinya mampu membedakan suatu
objek masuk kelompok kategori yang mana.
2. Menguji apakah ada perbedaan signifikan antara kategori/ kelompok, dikaitkan
dengan variabel bebas atau prediktor.
3. Menentukan variabel bebas yang mana yang memberikan sumbangan terbesar
terhadap terjadinya perbedaan antar- kelompok.
4. Mengklarifikasi/ mengelompokkan objek/ kasus atau responden ke dalam suatu
kelompok/ kategori didasarkan pada nilai variabel bebas.
5. Mengevaluasi keakuratan klasifikasi.
Tujuan Analisis Diskriminan
• Mengetahui perbedaan yang jelas antar grup pada variabel
dependen.
• Jika ada perbedaan, variabel independen manakah pada fungsi
diskriminan yang membuat perbedaan tersebut.
• Membuat fungsi atau model diskriminan (yang mirip dengan
persamaan regresi).
• Melakukan klasifikasi terhadap obyek ke dalam kelompok (grup).
Asumsi analisis diskriminan
• Variabel bebas harus terdistribusi normal (adanya normalitas).
• Matriks kovarians semua variabel bebas harus sama (equal).
• Tidak terjadi multikolinearitas (tidak berkorelasi) antar variabel
bebas.
• Tidak terdapat data yang ekstrim (outlier).
Proses analisis diskriminan
• Memilah variabel-variabel menjadi Variabel terikat (Dependent) dan Variabel bebas
(Independent).
• Menentukan metode untuk membuat Fungsi Diskriminan, yaitu :
• Simultaneous Estimation; semua variabel dimasukkan secara bersamasama lalu
dilakukan proses Diskriminan.
• Step-Wise Estimation; variabel dimasukkan satu per satu ke dalam model Diskriminan.

• Menguji signifikansi Fungsi Diskriminan yang terbentuk, dengan


menggunakanWilk’sLambda,Pilai,Ftest,danlainnya.
• Menguji ketepatan klasifikasi dari fungsi diskriminan (secara individual dengan Casewise
Diagnotics).
• Melakukan interpretasi Fungsi Diskriminan.
• Melakukan uji validasi fungsi diskriminan.
Pendahuluan
• Pertama kali diperkenalkan oleh Fisher (1936)
• Digunakan untuk mengetahui variabel-variable penciri yang membedakan kelompok
populasi yg ada dan dapat dipergunakan sebagai kriteria pengelompokan
• Prinsipnya sama dengan Regression Analysis ➔ dependen variable (Y) dan independent
variable (X) yg mempengaruhi dependen variable
• Regression analysis
• Linier regression (2 variable)
• Multiple regression (>2 variable)

• Diskriminant analysis
• Diskriminan 2 group (2 variable penciri)
• Diskriminan 3 group (> 2 variable penciri)
Ananalisis diskriminan
Defenisi Cara kerja
• Teknik analisis statistic untuk • Maksimal variansi antar
menggolongkan populasi/ kelompok dan minimasi variansi
individu/ objek menjadi dalam kelompok
kelompok-kelompok sendiri • Menentukan nilai setiap
dalam sekumpulan variable individu dalam sampel, dimana
independent nilai setiap individu adalah rata-
rata bobot dari individu dalam
sejumlah variable independent
Tujuan
• Untuk mencari model yg sesuai untuk dapat menentukan objek-
objek pengamatan menjadi kelompok-kelompok yg lengkap
• Untuk menentukan kontribusi masing-masing variable yg terlibat
dalam pengklasifikasian
• Sebagai dasar penentuan apakah suatu variable tertentu perlu
dilibatkan dalam Analisa pengklasifikasian selanjutnya atau tidak
Prinsip dasar
• Variabel independent (1…p) mempunyai distribusi normal
• Matriks p x p atau matriks variant – covariant untuk setiap
kelompok (1….k) harus sama
• Pengamatan dari masing-masing group dipilih secara acak/random
Formula umum analisis diskriminan

Y = b’ X
Keterangan:
Y = vector nilai diskrimnan untuk individu (1 x n)
b’ = vector bobot diskriminan (1 x p)
X = matriks yg mengandung nilai-nilai untuk setiap n individu
pada p independent variabel
Analog dengan analisa regresi
• Dependen variable (Y) pada multiple regresi adalah suatu nilai kuantitatif,
sedangkan pada discriminant analysis, dependen variable adalah suatu
nilai kualitatif
• Pada analysis regresi, varibel dependen (Y) menjadi satu focus yg berubah
(prediktif) dan variable independent (X) relative tetap, sedangkan pada
analisis diskriminan, variable dependen relative tetap (kelompok) dan
variable independent berubah-ubah serta terdistribusi normal
• Analisis regresi menurunkan perkiraan parameter yg telah mempunyai
kelengkapan statistic, sedang analisis diskriminan merupakan strategi yg
teliti dalam menemukan mean dari pengelompokan
Permasalahan 2 group
• Misal kita memiliki dua kelompok populasi yg bebas
• Populasi 1
• Diambil sampel sebesar n1 serta dipelajari p karakter dari sampel
tersebut
• Populasi 2
• Diambil sampel sebesar n1 serta dipelajari p karakter dari sampel
tersebut
• Sehingga keseluruhan sampel dari populasi 1 dan populasi 2 adalah
n = n1 + n2
• P karakter yang dipelajari bila dinyatakan dalam variable melalui
vector x’ = (X1 , X2 , …..+ Xp)
• Sehingga vector nilai rata-rata dan matriks variance- kovariance
dirumuskan sbb:
• Asumsi populasi mempunyai peragam yg sama yaitu ∑ maka
matrik peragam S1 dan S2 dapat digabung sebagai penduga
bagi ∑ melalui rata-rata terbobot sbb:

• Diskriminan dibangun untuk menerangkan perbedaan diantara


populasi perlu diuji apakah ada perbedaan yg nyata secara
statistic
Uji hipotesisi pada analisis diskriminan
• H0 : U1 = U2 ➔vector nilai rata-rata dari populasi 1 sama dengan dari
populasi 2
• H1 : U1 ≠ U2 ➔ kedua vector nilai rata-rata itu berbeda

• Selanjutnya,
Uji hipotesis
• F adalah derajat kebebasan yg berdistribusi, dimana v1 =
p, dan v2 = n1 + n2 – p – 1
• Kaidah keputusan
• Terima H0 : u1 = u2, jika T2 – table ≤ T2 - hitung
• Alternatif lain
• Terima H0 : u1 =u2, jika F table ≤ Fhitung
• Tolak H0 : U1 ≠U2, jika F-table > F-hitung
Fungsi diskriminan linier Fisher

Keterangan:
B‘ : vector koefisien pembobot fungsi diskriminan
X : vector variable acak dalam discriminant
X1 : vector nilai rata-rata dari variable acak kelompok 1
X2 : vector nilai rata-rata dari variable acak kelompok 2
SG -1 : invers matriks gabungan
Aturan penggolongan
• Menurut Fisher untuk menetapkan individu dengan nilai x di p pada kelompok 1 :

• Pada kelompok 2 jika:

• Cara lain adalah metoda “mid point”

• bila ukuran sampel tidak sama (n1 ≠ n2), maka


Aturan penggolongan “mid point”
• Kelompok
1. Jika y0 >m
2. Jika y0 ≤ m
Y0 = skor diskriminan dari individu

• Metode lain adalah Wald Anderson Statistic “W”


• Alokasikan pada kelompok
1. jika W > 0
2. Jika W ≤ 0
Contoh
• Sebuah toko menduga ada dua kelompok pembeli yaitu yg
sering belanja dan jarang belanja
• Pihak toko ingin mengetahui factor yang mendorong konsumen
untuk sering atau jarang belanja di took
• Setiap responden diberikan kuesioner dengan pertanyaan
tentang pendapat responden terhadap atribut took dan
frekuensi belanja
Contoh pertanyaan
Bagaimana dengan fasilitas pendingin udara yg ada pada took
1 5
Sangat tidak Sangat sejuk
sejuk

• Angka 1 untuk penilaian negative, angka 5 untuk penilaian positif


• Hasil pengukuran adalah numerik
Variabel untuk 40 responden
1. Layout ➔ tata letak barang di took
2. Lengkap
3. Harga
4. Musik
5. AC
6. Lampu
7. Pelayanan karyawan
8. Pelayanan kasir
9. Promosi
10. Image ➔ citra toko
Variabel
• Selain itu kepada setiap konsumen ditanyakan apakah mereka:
• Kode 0 = sering membeli
• Kode 1 = jarang membeli

• Terdapat dua kelompok variable: sering beli dan jarang beli


• 10 variable independent yaitu atribut yg diduga membat
perbedaan perilaku konsumen yg menjadi sering membeli atau
jarang membeli
Variabel

Variabel dependen Variabel independen

Kode 0 = sering < ----------> X1 layout


X2 lengkap
Kode 1 = jarang
X3
Xn
Tujuan analisis
• Apakah prilaku konsumen berbeda
• Jika berbeda, variable bebas mana yg membedakan prilaku konsumen?
Semua variable atau sebagian?
• Jida ada variable bebas pemeda prilaku, variable yg paling penting yg
mana?
Langkah 1
• Defenisikan variable ➔ masukan data
• Analyze ➔ Classify ➔ Discriminant
Langkah 2
• Masukan variable ke group ➔ Minimum= 0, Maksimum = 1 ➔
Continue ➔ masukkan variable lainnya ke kotak independent
Langkah 3
• Statistics

• Continue
Langkah 4
• Stepwise method ➔ method
➔ Pilh mahalanobis distance
• Criteria of F ➔ tanpa
mengubah isi
• continue
Langkah 5
• Classfy ➔ display = aktifkan casewise results dan leave one out classification ➔
continue ➔ OK
Interpretasi 1
• Tidak ada data yg hilang:
• 22 orang sering belanja
• 18 orang jarang belanja
• Total = 40 orang
Interpretasi 2
• Wilks lamda:
• Semakin mendekati 0 semkain
berbeda
• Semakin mendekati satu semakin
sama
• Sig
• Sig>0.05 ➔ tidak ada perbedaan
• Sig<0.05 ➔ ada perbedaan

• Semakin tinggi angka F semakin ada


perbedaan
Interpretasi 3
• Variabel yg
membedakan adalah
pelayanan karyawan
• Perhatikan nilai
signifikannya
• 9 variable lainnya bukan
variable yg
membedakan prilaku
pembeli
Interpretasi 4
• Tingkat validitas >50% yaitu
60% ➔ tapi model diskriminan
yg ada tidak dapat digunakan
➔ karena hanya ada satu
variable yg mempengaruhi
perbedaan dan tidak cukup
signifikan
• Model ini belum dapat
digunakan sebagai bahan untuk
pengambilan keputusan secara
menyeluruh
Thank You

You might also like