Professional Documents
Culture Documents
PDF Laporan Praktikum Data Mining - Compress
PDF Laporan Praktikum Data Mining - Compress
DISUSUN OLEH:
KELOMPOK C.23
ARIF RAKHMANTO (08 522 200)
CATUR HERMAWANTO (08 522 210)
PENDAHULUAN
METODOLOGI PENELITIAN
Mulai
Rumusan Masalah
Input Data
Profilisasi Customer
Selesai
1 23 50 .000 0 0 17
2 25 49 .000 0 0 15
3 5 46 .000 0 0 42
4 43 45 .000 0 0 26
5 36 44 .000 0 0 25
6 39 40 .000 0 0 7
7 37 39 .000 0 6 8
8 34 37 .000 0 7 9
9 32 34 .000 0 8 11
10 24 33 .000 0 0 16
11 31 32 .000 0 9 12
12 10 31 .000 0 11 24
13 28 30 .000 0 0 14
14 13 28 .000 0 13 22
15 4 25 .000 0 2 32
16 8 24 .000 0 10 29
17 6 23 .000 0 1 33
18 16 21 .000 0 0 34
19 17 20 .000 0 0 20
20 14 17 .000 0 19 36
21 9 15 .000 0 0 38
22 11 13 .000 0 14 31
Cluster Combined Stage Cluster First Appears
Stage Coefficients Next Stage
Cluster 1 Cluster 2 Cluster 1 Cluster 2
23 3 12 .000 0 0 44
24 7 10 .000 0 12 37
25 36 48 1.000 5 0 29
26 42 43 1.000 0 4 27
27 1 42 1.000 0 26 42
28 29 38 1.000 0 0 31
29 8 36 1.000 16 25 36
30 26 35 1.000 0 0 33
31 11 29 1.000 22 28 37
32 4 27 1.000 15 0 41
33 6 26 1.000 17 30 40
34 16 19 1.000 18 0 35
35 16 18 1.000 34 0 48
36 8 14 1.000 29 20 38
37 7 11 1.000 24 31 39
38 8 9 1.000 36 21 39
39 7 8 1.000 37 38 40
40 6 7 1.000 33 39 41
41 4 6 1.000 32 40 43
42 1 5 1.000 27 3 43
43 1 4 1.000 42 41 44
44 1 3 1.000 43 23 45
45 1 47 2.000 44 0 46
46 1 41 2.000 45 0 47
47 1 22 2.000 46 0 48
Cluster Combined Stage Cluster First Appears
Stage Coefficients Next Stage
Cluster 1 Cluster 2 Cluster 1 Cluster 2
48 1 16 2.000 47 35 49
49 1 2 2.000 48 0 0
b. Dendogram
Dendrogram using Single Linkage
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
Adit 23 ─┐
Galih 50 ─┼───────────────────────┐
Fandi 6 ─┘ │
Trisno 26 ─────────────────────────┤
Rozaq 35 ─────────────────────────┤
Syarif 39 ─┐ │
Novi 40 ─┤ │
Nurul Lu 37 ─┤ │
Safri Ha 34 ─┤ │
Chanifa 32 ─┤ │
Ibnu Her 31 ─┤ │
Mabok 10 ─┼───────────────────────┤
Maro 7 ─┘ │
Himawan 28 ─┐ │
Laskar K 30 ─┤ │
Digdoyo 13 ─┼───────────────────────┤
Richo 11 ─┘ │
Omiyabi 29 ─────────────────────────┤
Abdul Ha 38 ─────────────────────────┤
Aya' 9 ─┬───────────────────────┤
Anestia 15 ─┘ │
Ryan 17 ─┐ │
Hendi 20 ─┼───────────────────────┤
Sigit 14 ─┘ │
Nunuk 24 ─┐ │
Tomy 33 ─┼───────────────────────┤
Ikhsan 8 ─┘ │
Lenny Oc 36 ─┬───────────────────────┤
Maya 44 ─┘ │
Tyas 48 ─────────────────────────┤
Wanda 25 ─┐ │
Jusman B 49 ─┼───────────────────────┤
Annisa 4 ─┘ │
Rizki D. 27 ─────────────────────────┤
Fitra 5 ─┬───────────────────────┼───────────────────────┐
Didit 46 ─┘ │ │
Arfiana 43 ─┬───────────────────────┤ │
Karen 45 ─┘ │ │
Vivialit 42 ─────────────────────────┤ │
Sekar 1 ─────────────────────────┤ │
Huda 3 ─┬───────────────────────┘ │
Atlit 12 ─┘ │
Tasya 47 ─────────────────────────────────────────────────┤
Kidhut 41 ─────────────────────────────────────────────────┤
Farikh 22 ─────────────────────────────────────────────────┤
Ayu 16 ─┬───────────────────────┐ │
Kristin 21 ─┘ │ │
Dika Oki 19 ─────────────────────────┼───────────────────────┤
Fauzi 18 ─────────────────────────┘ │
Hendia V 2 ─────────────────────────────────────────────────┘
5.1. Clustering
Teknik yang digunakan dalam penelitian in adalah Teknik hirarki
(hierarchical methods) adalah teknik clustering membentuk kontruksi hirarki atau
berdasarkan tingkatan tertentu seperti struktur pohon (struktur pertandingan).
Dengan demikian proses pengelompokkannya dilakukan secara bertingkat atau
bertahap. Hasil dari pengelompokan ini dapat disajikan dalam bentuk dendogram.
Metode dalam teknik hirarki yang digunakan dalam penelitian ini adalah
Agglomerative Methods.
Dari pengolahan data dengan menggunakan metode herarki maka terbentuklah
4 cluster yang dimana cluster 1 terdiri dari 42 responden, cluster 2 terdiri dari 3
responden, dan cluster 3 terdiri dari 4 responden. Cluster 4 tidak memiliki
kelompok yang relative homogen, sehingga cluster 4 dikatakan outlier. Cluster 4
terdiri dari 1 responden.
Angkatan
Cluster 1 Cluster 3
≤ 2007 : 8 ≤ 2007 : 1
2008 : 31 2008 : 3
2009 : 3 2009 : 0
Total : 42 Total : 4
Cluster 2 Cluster 4
≤ 2007 : 0 ≤ 2007 : 0
2008 : 2 2008 : 1
2009 : 1 2009 : 0
Total : 3 Total : 1
Intensitas
Cluster 1 Sedang : 1
Sangat Sering : 5 Jarang : 1
Sering : 10 Total : 3
Sedang : 13 Cluster 3
Jarang : 14 Sangat Sering : 3
Total : 42 Sering : 1
Cluster 2 Sedang : 0
Sangat Sering : 1 Jarang : 0
Sering : 0 Total : 4
Cluster 4 Sedang : 0
Sangat Sering : 0 Jarang : 0
Sering : 1 Total : 1
Durasi
Cluster 1 Cluster 3
≤ 15 menit : 9 ≤ 15 menit : 1
16 – 30 menit : 8 16 – 30 menit : 0
30 – 60 menit : 13 30 – 60 menit : 0
≥ 60 menit : 12 ≥ 60 menit : 3
Total : 42 Total : 4
Cluster 2 Cluster 4
≤ 15 menit : 2 ≤ 15 menit : 0
16 – 30 menit : 0 16 – 30 menit : 0
30 – 60 menit : 0 30 – 60 menit : 1
≥ 60 menit : 1 ≥ 60 menit : 0
Total : 3 Total : 1
BAB VI
KESIMPULAN DAN SARAN
6.1. Kesimpulan
Berdasarkan hasil dari pembahasan pada bab V, maka didapatkan beberapa
kesimpulan :
1. Cluster yang terbentuk sebanyak 3 cluster dan 1 outlier. Cluster 1 terdiri dari
42 responden, cluster 2 terdiri dari 3 responden, dan cluster 3 terdiri dari 4
responden. Cluster 4 tidak memiliki kelompok yang relative homogen,
sehingga cluster 4 dikatakan outlier. Cluster 4 terdiri dari 1 responden.
2. Mahasiswa Teknik Industri yang berkunjung ke laboratorium Data Mining
dominan berjenis kelamin laki-laki dengan rata-rata usia 20 – 22 tahun dan
merupakan angkatan 2008 dengan intensitas kunjungan yang jarang dan durasi
atau lama berkunjung responden ≥ 60 menit.
6.2. Saran
Berdasarkan kesimpulan diatas maka disarankan kepada Laboratorium Data
Mining agar lebih gencar dalam mempromosikan kepada mahasiswa Teknik
Industri dan mengadakan kegiatan yang bersifat rutin selain praktikum agar
intensitas kunjungan mahasiswa ke Laboratorium dapat bertambah.
DAFTAR PUSTAKA
Cluster
a,b
Case Processing Summary
Cases
50 100.0 0 .0 50 100.0
b. Single Linkage
Single Linkage
Agglomeration Schedule
1 23 50 .000 0 0 17
2 25 49 .000 0 0 15
3 5 46 .000 0 0 42
4 43 45 .000 0 0 26
5 36 44 .000 0 0 25
6 39 40 .000 0 0 7
7 37 39 .000 0 6 8
8 34 37 .000 0 7 9
9 32 34 .000 0 8 11
10 24 33 .000 0 0 16
11 31 32 .000 0 9 12
12 10 31 .000 0 11 24
13 28 30 .000 0 0 14
14 13 28 .000 0 13 22
15 4 25 .000 0 2 32
16 8 24 .000 0 10 29
Cluster Combined Stage Cluster First Appears
17 6 23 .000 0 1 33
18 16 21 .000 0 0 34
19 17 20 .000 0 0 20
20 14 17 .000 0 19 36
21 9 15 .000 0 0 38
22 11 13 .000 0 14 31
23 3 12 .000 0 0 44
24 7 10 .000 0 12 37
25 36 48 1.000 5 0 29
26 42 43 1.000 0 4 27
27 1 42 1.000 0 26 42
28 29 38 1.000 0 0 31
29 8 36 1.000 16 25 36
30 26 35 1.000 0 0 33
31 11 29 1.000 22 28 37
32 4 27 1.000 15 0 41
33 6 26 1.000 17 30 40
34 16 19 1.000 18 0 35
35 16 18 1.000 34 0 48
36 8 14 1.000 29 20 38
37 7 11 1.000 24 31 39
38 8 9 1.000 36 21 39
39 7 8 1.000 37 38 40
40 6 7 1.000 33 39 41
41 4 6 1.000 32 40 43
42 1 5 1.000 27 3 43
43 1 4 1.000 42 41 44
44 1 3 1.000 43 23 45
45 1 47 2.000 44 0 46
46 1 41 2.000 45 0 47
47 1 22 2.000 46 0 48
48 1 16 2.000 47 35 49
49 1 2 2.000 48 0 0
Dendrogram
* * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * *
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
Adit 23 ─┐
Galih 50 ─┼───────────────────────┐
Fandi 6 ─┘ │
Trisno 26 ─────────────────────────┤
Rozaq 35 ─────────────────────────┤
Syarif 39 ─┐ │
Novi 40 ─┤ │
Nurul Lu 37 ─┤ │
Safri Ha 34 ─┤ │
Chanifa 32 ─┤ │
Ibnu Her 31 ─┤ │
Mabok 10 ─┼───────────────────────┤
Maro 7 ─┘ │
Himawan 28 ─┐ │
Laskar K 30 ─┤ │
Digdoyo 13 ─┼───────────────────────┤
Richo 11 ─┘ │
Omiyabi 29 ─────────────────────────┤
Abdul Ha 38 ─────────────────────────┤
Aya' 9 ─┬───────────────────────┤
Anestia 15 ─┘ │
Ryan 17 ─┐ │
Hendi 20 ─┼───────────────────────┤
Sigit 14 ─┘ │
Nunuk 24 ─┐ │
Tomy 33 ─┼───────────────────────┤
Ikhsan 8 ─┘ │
Lenny Oc 36 ─┬───────────────────────┤
Maya 44 ─┘ │
Tyas 48 ─────────────────────────┤
Wanda 25 ─┐ │
Jusman B 49 ─┼───────────────────────┤
Annisa 4 ─┘ │
Rizki D. 27 ─────────────────────────┤
Fitra 5 ─┬───────────────────────┼───────────────────────┐
Didit 46 ─┘ │ │
Arfiana 43 ─┬───────────────────────┤ │
Karen 45 ─┘ │ │
Vivialit 42 ─────────────────────────┤ │
Sekar 1 ─────────────────────────┤ │
Huda 3 ─┬───────────────────────┘ │
Atlit 12 ─┘ │
Tasya 47 ─────────────────────────────────────────────────┤
Kidhut 41 ─────────────────────────────────────────────────┤
Farikh 22 ─────────────────────────────────────────────────┤
Ayu 16 ─┬───────────────────────┐ │
Kristin 21 ─┘ │ │
Dika Oki 19 ─────────────────────────┼───────────────────────┤
Fauzi 18 ─────────────────────────┘ │
Hendia V 2 ─────────────────────────────────────────────────┘
Crosstabs
Cases
Crosstab
Cluster Member
1 2 3 4 Total
Perempuan Count 15 1 2 1 19
Total Count 42 3 4 1 50
Symmetric Measures
Asymp. Std.
Value Errora Approx. Tb Approx. Sig.
c
Interval by Interval Pearson's R .159 .141 1.117 .270
c
Ordinal by Ordinal Spearman Correlation .121 .146 .844 .403
N of Valid Cases 50
Crosstab
Cluster Member
1 2 3 4 Total
Total Count 42 3 4 1 50
Symmetric Measures
N of Valid Cases 50
Crosstab
Cluster Member
1 2 3 4 Total
2008 Count 31 2 3 1 37
2009 Count 3 1 0 0 4
Total Count 42 3 4 1 50
Asymp. Std.
a b
Value Error Approx. T Approx. Sig.
c
Interval by Interval Pearson's R .023 .116 .160 .874
N of Valid Cases 50
Cluster Member
1 2 3 4 Total
Sering Count 10 0 1 1 12
Sedang Count 13 1 0 0 14
Jarang Count 14 1 0 0 15
Total Count 42 3 4 1 50
Symmetric Measures
Asymp. Std.
Value Errora Approx. Tb Approx. Sig.
N of Valid Cases 50
Crosstab
Cluster Member
1 2 3 4 Total
16 - 30 menit Count 8 0 0 0 8
30 - 60 menit Count 13 0 0 1 14
Total Count 42 3 4 1 50
Symmetric Measures
N of Valid Cases 50
DISUSUN OLEH:
KELOMPOK C.23
ARIF RAKHMANTO (08 522 200)
CATUR HERMAWANTO (08 522 210)
PENDAHULUAN
Mulai
Pengumpulan Data
MasaPengumpulal
ah TIDAK
TIDAK
Uji Normalitas
ya
TIDAK
Uji Linearitas Sig ≤ 0.05
atau Fhitung > Ftabel
ya
ya
Selesai
21. Klik OK
BAB II
LANDASAN TEORI
Dalam kehidupan sehari-hari kita sering melihat suatu peristiwa atau keadaan
yang terjadi akibat peristiwa yang lain. Untuk mengetahui hubungan antara kejadian
tersebut, terutama untuk menelusuri pola hubungan yang modelnya belum diketahui
maka analisis regresi dapat dijadikan alat untuk membantu menganalisis hubungan
tersebut. Analisis regresi memiliki 3 kegunaan yaitu, deskripsi, kendali, dan prediksi
(peramalan). Tetapi manfaat utama dari kebanyakan penyelidikan statistik dalam
dunia bisnis dan ekonomi adalah mengadakan prediksi atau peramalan.
Dalam analisis regresi dikenal dua macam variabel atau peubah yaitu variabel
bebas (independent variabel) adalah dan variabel tidak bebas (dependent variabel).
Variabel bebas (independent variabel) adalah suatau variabel yang nilainya telah
diketahui, sedangkan variabel tidak bebas (dependent variabel) adalah variabel yang
nialainya belum diketahui dan yang akan diramalkan. Suatu variabel dapat diramalkan
dari variabel lain apabila antara variabel yang diramalakan (dependent variabel)
dengan variabel yang nilainya diketahui (independent variabel) terdapat hubungan
atau korelasi yang signifikan. Misalnya, jika antara tinggi badan dan berat badan pada
umur-umur tertentu terdapat korelasi yang signifikan, maka berat badan orang pada
umur tersebut akan dapat diramalkan dari tinggi badannya. Korelasi antara
independent variable dengan dependent variabel dapat dilukiskan dalam suatu garis.
Garis ini disebut garis regresi. Garis regresi mungkin merupakan garis lurus (linier)
disebut regresi linier, mungkin juga merupakan garis lengkung (parabolik, hiperbolik,
dan sebagainya) yang disebut regresi non linier. Namun berdasarkan dari data yang
ada, maka analisis yang akan digunakan adalah analisis regresi linear berganda.
Regresi linier berganda mengamati pengaruh lebih dari satu variabel bebas
(independent variable) terhadap variabel tidak bebas (dependent variable), minimal
ada dua buah variabel bebas (independent variable).
Analisis Linier Berganda adalah suatu metode statistik umum yang digunakan
untuk meneliti hubungan antara sebuah variable dependent dengan beberapa variable
independent. Tujuan analisis regresi linier berganda adalah menggunakan variable
independent yang diketahui, untuk meramalkan variable dependent. Misalnya :
penjualan sebuah produk dapat dipengaruhi oleh biaya promosi, biaya produksi, biaya
transportasi, gaji karyawan dan lain-lain. Jumlah pengeluaran rumah tangga
dipengaruhi oleh pendapatan, jumlah keluarga.
Secara matematis regresi linier berganda dapat dituliskan dalam persamaan berikut :
dimana :
Y = variabel yang diramalkan (dependent variable)
X1, X2, X3, …, Xn = variabel yang diketahui (independent variable)
b1, b2, b3,…, bn = koefisien regresi
BAB III
PENGUMPULAN DAN PENGOLAHAN DATA
Laju
Biaya Luas
pertumbuhan Jumlah
NO Daerah Periklanan outlet
penduduk pesaing
(juta) (m2)
(%)
1 Purworejo 22 2.12 39 5
2 Purwodadi 27 1.91 78 3
3 Waykambas 17 1.88 37 6
4 Musi 19 1.69 49 3
5 Tarakan 23 2.23 72 4
3.2 Pengolahan Data
3.2.1 Uji Normalitas
Gambar 3.1
Gambar 3.2
3.2.2 Tabel Model Summary
Tabel 3.3 Model Summaryb
Total 278607.920 49
Laju Pertumbuhan
12.587 19.314 .079 .652 .518 .844 1.185
Penduduk
Laju
Biaya Pertumbuhan Luas Jumlah
Penjualan Periklanan Penduduk Outlet Pesaing
Laju Pertumbuhan
.326 .299 1.000 .301 -.101
Penduduk
Laju Pertumbuhan
.010 .017 . .017 .242
Penduduk
N Penjualan 50 50 50 50 50
Biaya Periklanan 50 50 50 50 50
Laju Pertumbuhan
50 50 50 50 50
Penduduk
Luas Outlet 50 50 50 50 50
Jumlah Pesaing 50 50 50 50 50
3.2.6 Prediksi
Berdasarkan table koefisien, maka dapat diperoleh informasi bahwa nilai :
a = 36,481
b1 = 3,52
b2 = 12,587
b3 = 1,765
b4 = -1,631
sehingga dapat diperoleh persamaan regresi sebagai berikut :
4.6 Prediksi
Dari hasil penghitungan dengan menggunakan persamaaan regeresi dapat
diketahui prediksi besar insentif karyawan yang akan diterima sebagai berikut:
1. Di kota Purworejo besar penjualan adalah 201.29
2. Di kota Purwodadi besar penjualan adalah 288.34
3. Di kota Waykambas besar penjualan adalah 175.5
4. Di kota Musi besar penjualan adalah 206.23
5. Di kota Tarakan besar penjualan adalah 266.07
BAB V
KESIMPULAN DAN SARAN
6.1. Kesimpulan
1. Berdasarkan hasil uji normalitas diketahui bahwa data bersifat normal
2. Berdasarkan hasil uji signifikansi persamaan regresi, maka :
Ftabel = 5,56
Fhitung = 8,825
F hitung > F table maka H0 ditolak sehingga persamaan signifikan (ada
pengauh yang signifikan antara variable independent terhadap variable
dependent.
3. Persamaan regresi yang terbentuk adalah sebagai berikut :
Y = 36,481 + 3,52 X1 + 12,587 X2 + 1,765 X3 - 1,631 X4
4. Berdasarkan uji multikolineritas, maka dapat disimpulkan bahwa variabel
biaya periklanan, laju pertumbuhan penduduk, luas outlet dan jumlah pesaing
tidak saling berkorelasi atau tidak terjadi multikolinieritas karena 4 nilai VIF <
2.
5. Yang memiliki hubungan positif kuat adalah : Y – X1
Yang memiliki hubungan positif lemah adalah : Y – X2, Y – X3, X1 – X2, X1 –
X3, X1 – X4, X2 – X3
Yang memiliki hubungan negatif lemah : Y – X4, X2 – X4, X3 – X4
6. Hasil prediksi penjualan pada lima kota :
1. Di kota Purworejo besar penjualan adalah 201.29
2. Di kota Purwodadi besar penjualan adalah 288.34
3. Di kota Waykambas besar penjualan adalah 175.5
4. Di kota Musi besar penjualan adalah 206.23
5. Di kota Tarakan besar penjualan adalah 266.07
6.2. Saran
1. Jumlah variabel independent hendaknya lebih banyak lagi untuk mendapatkan
hasil prediksi yang lebih akurat.
2. Berdasarkan dari hasil prediksi, maka disarankan pada Butik THE UNIQUE
CULTURE agar membuka outlet baru dengan prioritas sebagai berikut :
Di kota Purwodadi besar penjualan adalah 288.34
Di kota Tarakan besar penjualan adalah 266.07
Di kota Musi besar penjualan adalah 206.23
Di kota Purworejo besar penjualan adalah 201.29
Di kota Waykambas besar penjualan adalah 175.5
DAFTAR PUSTAKA
Regression
Descriptive Statistics
Laju Pertumbuhan
2,0694 ,47433 50
Penduduk
Correlations
Laju
Biaya Pertumbuhan Jumlah
Penjualan Periklanan Penduduk Luas Outlet Pesaing
Pearson Penjualan
1,000 ,513 ,326 ,467 -,193
Correlation
Laju Pertumbuhan
,326 ,299 1,000 ,301 -,101
Penduduk
Laju Pertumbuhan
,010 ,017 . ,017 ,242
Penduduk
N Penjualan 50 50 50 50 50
Biaya Periklanan 50 50 50 50 50
Laju Pertumbuhan
50 50 50 50 50
Penduduk
Luas Outlet 50 50 50 50 50
Jumlah Pesaing 50 50 50 50 50
Variables Entered/Removed(b)
Variables Variables
Model Entered Removed Method
1 Jumlah
Pesaing,
Laju
Pertumbuha
n
. Enter
Penduduk,
Luas Outlet,
Biaya
Periklanan(
a)
Model Summary(b)
a Predictors: (Constant), Jumlah Pesaing, Laju Pertumbuhan Penduduk, Luas Outlet, Biaya Periklanan
ANOVA(b)
Sum of
Model Squares df Mean Square F Sig.
1 Regression 122477,38
4 30619,345 8,825 ,000(a)
0
Residual 156130,54
45 3469,568
0
Total 278607,92
49
0
a Predictors: (Constant), Jumlah Pesaing, Laju Pertumbuhan Penduduk, Luas Outlet, Biaya Periklanan
Std. Std.
B Error Beta Tolerance VIF B Error
Laju Pertumbuhan
12,587 19,314 ,079 ,652 ,518 ,844 1,185
Penduduk
Collinearity Diagnostics(a)
Condition
Eigenvalue Index Variance Proportions-
Standard Error of
10,798 38,091 17,972 4,947 50
Predicted Value
Residual -
131,23038 ,00000 56,44765 50
139,44339
Deleted Residual -
146,55676 -,02123 63,74182 50
162,80220
Histogram
20
15
Frequency
10
Mean =-1.63E-16
Std. Dev. =0.958
0 N =50
-3 -2 -1 0 1 2 3
Regression Standardized Residual
Normal P-P Plot of Regression Standardized Residual
Bengkulu
Bandung
1.0
Martapura
Jayapura Manado
Padang
Pekalongan Cirebon
0.8 Belitung
Palangka Raya
Expected Cum Prob
Riau
Depok
Yogyakarta Bogor Denpasar
Bontang Banten Purwakarta
Banjarmasin
0.6 Bangka Dumai
Surabaya MetroBatam Lampung
Bukit Tinggi Aceh Jakarta Selatan
Sorong Kediri Tangerang
0.4 Jambi MalangMakasar
Jakarta Barat Pekanbaru
Mataram Jombang
Magelang
0.2 Tuban Madiun
Solo Jakarta Pusat
Medan CilegonPurwokerto
Ambon
Bekasi Gorontalo Semarang
0.0
0.0 0.2 0.4 0.6 0.8 1.0
Observed Cum Prob
Scatterplot
200
Regression Deleted (Press) Residual
Bengkulu
Bandung
Medan
-200
DISUSUN OLEH:
KELOMPOK C.23
ARIF RAKHMANTO (08 522 200)
CATUR HERMAWANTO (08 522 210)
Mulai
Input Data
Data Tabulasi
Association Rule
Activity Relationship
Chart
Selesai
g. Ok
BAB IV
PENGUMPULAN DAN PENGOLAHAN DATA
Keterangan :
1 = item terbeli
0 = item tidak terbeli
4.2.2 Association Rule
Tabel 4.5 Association Rules
Data
Input Data Tabular!$B$5:$J$55
Data Format Binary Matrix
Minimum Support 8
Minimum Confidence % 80
# Rules 11
Overall Time (secs) 1
Dept 1
Dept 2
Dept 3
Dept 4
Dept 5
Dept 6
Dept 7
Dept 8
Keterangan :
: Hubungan Kuat
4.2.4 Rekomendasi layout
D
D D D E
E E E P
D P P P
T
7
T T T
E
D
P 4 5 6 E
P
T
T 8
DEPT 3
D
2 E
P
T
DEPT 1 9
KASIR
Rule 2
Jika membeli {Dep2 dan Dep5} maka mungkin membeli {Dep3}, dengan nilai
(support = 8, confidence = 100%). Berarti seseorang yang membeli produk pada
Dep2 dan Dep5 memiliki kemungkinan sebesar 100% untuk membeli produk pada
Dep3. Jumlah transaksi yang memuat kejadian tersebut sebanyak 8.
Rule 3
Jika membeli {Dep2} maka mungkin membeli {Dep3}, dengan nilai (support
= 16, confidence = 94.12%). Berarti seseorang yang membeli produk pada Dep2
memiliki kemungkinan sebesar 94.12% untuk membeli produk pada Dep3. Jumlah
transaksi yang memuat kejadian tersebut sebanyak 16.
Rule 4
Jika membeli {Dep1 dan Dep6} maka mungkin membeli {Dep3}, dengan nilai
(support = 10, confidence = 90.91%) berarti seseorang yang membeli produk pada
Dep1 dan Dep6 memiliki kemungkinan sebesar 90.91% untuk membeli produk
pada Dep3. Jumlah transaksi yang memuat kejadian tersebut sebanyak 10.
Rule 5
Jika membeli {Dep1 dan Dep4} maka mungkin membeli {Dep3}, dengan nilai
(support = 8, confidence = 88.89%). Berarti seseorang yang membeli produk pada
Dep1 dan Dep4 memiliki kemungkinan sebesar 88.89% untuk membeli produk
pada Dep3. Jumlah transaksi yang memuat kejadian tersebut sebanyak 8.
Rule 6
Jika membeli {Dep4 dan Dep6} maka mungkin membeli {Dep3}, dengan nilai
(support = 8, confidence = 88.89%). Berarti seseorang yang membeli produk pada
Dep4 dan Dep6 memiliki kemungkinan sebesar 88.89% untuk membeli produk
pada Dep3. Jumlah transaksi yang memuat kejadian tersebut sebanyak 8.
Rule 7
Jika membeli {Dep1} maka mungkin membeli {Dep3}, dengan nilai (support
= 22, confidence = 84.62%). Berarti seseorang yang membeli produk pada Dep1
memiliki kemungkinan sebesar 84.62% untuk membeli produk pada Dep3. Jumlah
transaksi yang memuat kejadian tersebut sebanyak 22.
Rule 8
Jika membeli {Dep5} maka mungkin membeli {Dep3}, dengan nilai (support
= 16, confidence = 84.21%). Berarti seseorang yang membeli produk pada Dep5
memiliki kemungkinan sebesar 84.21% untuk membeli produk pada Dep3. Jumlah
transaksi yang memuat kejadian tersebut sebanyak 16.
Rule 9
Jika membeli {Dep6} maka mungkin membeli {Dep3}, dengan nilai (support
= 15, confidence = 83.33%). Berarti seseorang yang membeli produk pada Dep6
memiliki kemungkinan sebesar 83.33% untuk membeli produk pada Dep3. Jumlah
transaksi yang memuat kejadian tersebut sebanyak 15.
Rule 10
Jika membeli {Dep4 dan Dep5} maka mungkin membeli {Dep3}, dengan nilai
(support = 10, confidence = 83.33%). Berarti seseorang yang membeli produk
pada Dep4 dan Dep5 memiliki kemungkinan sebesar 83.33% untuk membeli
produk pada Dep3. Jumlah transaksi yang memuat kejadian tersebut sebanyak 10.
Rule 11
Jika membeli {Dep4} maka mungkin membeli {Dep3}, dengan nilai (support
= 16, confidence = 80%). Berarti seseorang yang membeli produk pada Dep4
memiliki kemungkinan sebesar 80% untuk membeli produk pada Dep3. Jumlah
transaksi yang memuat kejadian tersebut sebanyak 16.
6.1 Kesimpulan
Berdasarkan hasil pembahasan, maka dapat disimpulkan bahwa :
1. Melalui analisa Association Rule diperoleh 11 aturan yang merepresentasikan
hubungan antara masing-masing departemen.
2. Melalui Activity Relationship Chart (ARC) dapat diketahui prioritas
hubungan antara masing-masing departemen dimana departemen 1 dan
departemen 3 memiliki hubungan yang sangat kuat, sehingga dalam menata
ulang layout, departemen 1 dan departemen 3 menjadi prioritas dalam
penataan ulang.
3. Outlet Indomart/ 004 Nogotirto membutuhkan penataan ualng layout dengan
prioritas utama adalah mendekatkan Departemen 1 dengan Departemen 3.
Sedangkan Departemen 2, 4, 5, 6 dengan 3 memiliki hubungan yang bersifat
sedang.
6.2 Saran
Berdasarkan hasil pembahasan dan kesimpulan dari penelitian, maka disarankan
kepada Indomart/ 004 Nogotirto untuk melakukan penataan ulang layout outlet
untuk lebih mendukung aktivitas transaksi konsumen.
DAFTAR PUSTAKA
2. Marc Adamo Jean, “Datamining for Association Rules and Sequential Patterns”,
2003.
3. Han, Jiawei and Kamber, Micheline, “Datamining Concept and Techniques”, 2006.
LAMPIRAN
LAPORAN RESMI
PRAKTIKUM DATA MINING
KLASIFIKASI
DISUSUN OLEH:
KELOMPOK C.23
ARIF RAKHMANTO (08 522 200)
CATUR HERMAWANTO (08 522 210)
3.
4. Jika akurasi diterima, gunakan model untuk mengklasifikasikan data tuple
yang label kelasnya belum diketahui.
3. Simpul daun atau simpul akhir, masing-masing 1 masukan edge dan tidak
ada edge
Pada decision tree setiap simpul daun menandai label kelas. Simpul yang
bukan simpul akhir terdiri dari akar dan simpul internal yang terdiri dari
kondisi tes atribut pada sebagian record yang mempunyai karakteristik yang
berbeda. Simpul akar dan simpul internal ditandai dengan bentuk oval dan
simpul daun ditandai dengan bentuk segi empat.
Mulai
Training Data
Decision Tree
Classification Rule
Awal
Penyederhanaan Rule
(Chi-square)
Ho diterima/
Ditolak
Classification Rule
Akhir
Prediksi
Selesai
3.5. Langkah Software
Software yang digunakan dalam klasifikasi adalah Weka. Langkah
pengerjaannnya adalah sebagai berikut :
1. Menginput data training di Ms. Excel kemudian menyimpannya dalam format
.csv
2. Membuka Weka, kemudian explorer, Open file
3. File tersebut disave as dalam format .arrf
4. Pilih classify, pada classifier-choose-trees-j48
5. Test option dipilih use training set, kemudian klik start
6. Pada result list, klik kanan pilih visualize tree
BAB IV
PENGUMPULAN DAN PENGOLAHAN DATA
Dipilih atribut Jumlah Pembiayaan sebagai Root Node karena memiliki information
gain terbesar yaitu 0.64
Dipilih atribut Jumlah Anak sebagai Root Node karena memiliki information gain
terbesar yaitu 0.85
A. Hipotesis
HO : Atribut Jumlah Pembiayaan mempunyai hubungan dengan
keputusan
HI : Atribut Jumlah Pembiayaan tidak mempunyai hubungan
dengan keputusan
C. Kriteria Pengujian
X2(0,05;2) = 5.991464547
Ho diterima apabila X2 ≤ 5.991464547
Ho ditolak apabila X2 ≥ 5.991464547
Ditolak
5.991464547 20.6046107
Gambar 4.6 Kurva daerah penolakan atribut kondisi dan keadaan buku
D. Kesimpulan
Karena X2hitung X2(0,05;2) = 20.6046107 , 5.991464547maka Ho
ditolak yang berarti atribut Jumlah Pembiayaan hubungan dengan
keputusan.
Total 6 8 16 30
A. Hipotesis
HO : Atribut Jumlah Anak mempunyai hubungan dengan
keputusan
H1 : Atribut Jumlah Anak tidak mempunyai hubungan
dengan keputusan
C. Kriteria Pengujian
X2(0,05;2) = 5.991464547
Ho diterima apabila X2 ≤5.991464547
Ho ditolak apabila X2 ≥ 5.991464547
Ditolak
5.149521531 5.991464547
D. Kesimpulan
Karena X2hitung X2(0,05;2) , 5.149521531 5.991464547, maka Ho
diterima yang berarti atribut Jumlah Anak tidak mempunyai
hubungan dengan keputusan.
3. Uji Independensi Atribut Intensitas Dipinjam dengan Distribusi Chi
Square
Tabel 4.12 Frekuensi Jangka waktu Pembiayaan
Kredit Satu Tahun Dua Tahun total
Macet 13 6 19
Tidak Macet 3 8 11
total 16 14 30
A. Hipotesis
HO : Atribut Jangka Waktu Pembiayaan mempunyai hubungan
dengan keputusan
H1 : Atribut Jangka Waktu Pembiayaan tidak mempunyai
hubungan dengan keputusan
C. Kriteria Pengujian
X2(0,05;1) = 3.841459149
Ho diterima apabila X2 ≤ 3.841459149
Ho ditolak apabila X2 ≥ 3.841459149
Ditolak
3.841459149 4.739405332
D. Kesimpulan
Karena X2hitung X2(0,05;2) , 16.31054131 4.739405332, maka Ho
ditolak yang berarti atribut Jangka Waktu Pembiayaan mempunyai
hubungan dengan keputusan.
Jangka
Total Nilai Information
Waktu Status Kredit Jumlah Q Entropi
Instence Informasi Gain
Pembiayaan
Macet 7
Satu Tahun 7 0
Tidak Macet 0
0.29501 0.845351 0.55034071
Macet 1
Dua Tahun 4 0.811278124
Tidak Macet 3
Total 11
Jumlah
Pembiayaan
Jangka Waktu
Tidak Macet Macet
Pembiayaan
2 Tahun 1 Tahun
4.2.7 Prediksi
Tabel 4.15 Data Prediksi
JUMLAH JUMLAH JANGKA WAKTU STATUS
NO
PEMBIAYAAN ANAK PEMBIAYAAN KREDIT
1 Besar Sedang Satu Tahun Macet
6.1 Kesimpulan
1. Rule yang terbentuk
a. IF Jumlah Pembiayaannya = kecil THEN Status Kreditnya= TIDAK
MACET
b. IF Jumlah Pembiayaannya = besar THEN Status Kreditnya = MACET
c. IF Jumlah Pembiayaannya = sedang ^ Jumlah Anaknya = Banyak THEN
Status Kreditnya = MACET
d. IF Jumlah Pembiayaannya = sedang ^ Jumlah Anaknya = Sedang THEN
Status Kreditnya = TIDAK MACET
e. IF Jumlah Pembiayaannya = sedang ^ Jumlah Anaknya = Sedikit THEN
Status Kreditnya = TIDAK MACET
3. Hasil Prediksi
a. Subjek 1 yang akan menerima kredit dengan jumlah pembiayaanya
besar, jumlah anaknya sedang dan jangka waktu pembiayaan satu tahun
diprediksi status kreditnya akan Macet.
b. Subjek 2 yang akan menerima kredit dengan jumlah pembiayaanya
besar, jumlah anaknya Banyak dan jangka waktu pembiayaan dua tahun
diprediksi status kreditnya akan Macet
c. Subjek 3 yang akan menerima kredit dengan jumlah pembiayaanya
besar, jumlah anaknya Banyak dan jangka waktu pembiayaan satu tahun
diprediksi status kreditnya akan Macet
d. Subjek 4 yang akan menerima kredit dengan jumlah pembiayaanya
sedang, jumlah anaknya Sedikit dan jangka waktu pembiayaan dua tahun
diprediksi status kreditnya akan Tidak Macet
e. Subjek 5 yang akan menerima kredit dengan jumlah pembiayaanya kecil,
jumlah anaknya sedang dan jangka waktu pembiayaan dua tahun
diprediksi status kreditnya akan Tidak Macet
4.2 Saran
Mengingat berbagai keterbatasan yang dialami penulis dan berdasarkan
hasil praktikum yang telah dilakukan, maka penulis menyarankan untuk
pengembangan dimasa yang akan datang sebagai berikut:
1. Bagian bank sebaiknya melakukan identifikasi yang lebih baik lagi dalam
pemberian kredit
2. Tentukan hal – hal apa saja yang dibutuhkan oleh penerima kredit.
3. Menentukan hal – hal apa saja yang akan diberikan dan di bebankan
kepada penerima kredit.
DAFTAR PUSTAKA