Download as pdf or txt
Download as pdf or txt
You are on page 1of 15

INFORMATION

INFORMATION SYSTEM
SYSTEM DEVELOPMENT
DEVELOPMENT [ISD]
(ISD) [VOLUME [VOLUME
4 NO.2 JULI4 2019]
NO.2 JULI 2019]

Metode K-Means Untuk Pengelompokan


Masyarakat Miskin Dengan Menggunakan Jarak
Kedekatan Manhattan City Dan Euclidean (Studi
Kasus Kota Binjai)
S Ramadani1, I Ambarita2, A M H Pardede3

* Corresponding author : suci.ramadani23@gmail.com1, yesnovada@yahoo.com2, akimmhp@live.com3


1,2,3
STMIK Kaputama
Jl. Veteran No. 4A – 9A, Binjai, Sumatera Utara

Abstract-- The occurrence of poverty in the community is caused by the inability of the family
head economically to meet the primary needs of family members, namely clothing, food,
shelter, health, and education needs. The poor are almost present in every country, city,
and region, this becomes a common problem. The current poverty data obtained from
the Binjai City Central Bureau of Statistics is from 2012, and the number of poor people
has increased in 2016 by 17,800 people with a poverty line (Rp. /Cap/month) of Rp.
343,078 and the latest data obtained in 2017 were 18,230 people with Poverty Lines
(Rp. / Kap / Bulan) Rp. 371,387. In the database of the Binjai City Central Bureau of
Statistics there are very diverse data on the poor, with this data, researchers try to
explore data from the poor city of Binjai to obtain new information by grouping poverty
data using the k-means clustering data mining method using distance the closeness of
Manhattan City and Euclidean, so that groups of variables that are very influential in
the community of poverty can be identified. The observed variables such as the level of
education of the household head, education level of housewives, employment, number of
family members, and other observed variables affect poverty. And the results of the k-
means method for grouping poor people using proximity to Manhattan city and
euclidean that can provide additional information in optimizing poverty alleviation in
the city of Binjai..

Keywords: Data-Mining, K-Means, Poverty, Grouping

Abstrak-- Terjadinya kemiskinan pada masyarakat disebabkan oleh ketidak mampuan kepala
keluarga secara ekonomi untuk memenuhi kebutuhan primer anggota keluarganya, yaitu
kebutuhan sandang, pangan, papan, kesehatan dan pendidikan. Masyarakat miskin
hampir terdapat pada setiap negara, kota maupun daerah, hal ini menjadi permasalahan
bersama. Data kemiskinan untuk saat ini yang diperoleh dari Badan Pusat Statistik Kota
Binjai terdapat dari tahun 2012, dan semakin tahun jumlah penduduk miskin makin
bertambah pada tahun 2016 sebanyak 17.800 jiwa dengan Garis Kemiskinan
(Rp/Kap/Bulan) Rp. 343,078 dan data terakhir yang diperoleh pada tahun 2017
sebanyak 18.230 jiwa dengan Garis Kemiskinan (Rp/Kap/Bulan) Rp. 371,387. Pada
database Badan Pusat Statistik Kota Binjai terdapat data masyarakat miskin yang
sangat beragam, dengan adanya data ini, peneliti mencoba untuk menggali data
masyarakat miskin kota binjai untuk mendapatkan informasi baru dengan
15 mengelompokkan data-data kemiskinan menggunakan metode data mining k-means
| Metode K-Means Untuk Pengelompokan....
INFORMATION
INFORMATION SYSTEM
SYSTEM DEVELOPMENT
DEVELOPMENT [ISD]
(ISD) [VOLUME [VOLUME
4 NO.2 JULI4 2019]
NO.2 JULI 2019]

clustering dengan menggunakan jarak kedekatan manhattan city dan euclidean,


sehingga dapat diketahui kelompok variabel-variabel yang sangat berpengaruh pada
masyarakat kemiskinan.Variabel-variabel yang diamati seperti tingkat pendidikan
kepala keluarga, tingkat pendidikan ibu rumah tangga, pekerjaan, jumlah anggota
keluarga, dan variabel lainnya yang diamati mempengeruhi kemiskinan. Dan hasil dari
metode k-means untuk pengelompokan masyarakat miskin dengan menggunakan jarak
kedekatan manhattan city dan euclidean yang dapat memberikan informasi tambahan
dalam mengoptimalkan penanggulangan kemiskinan kota Binjai..

Kata kunci : Data-Mining, K-Means, Kemiskinan, Pengelompokan.

PENDAHULUAN
Kemiskinan yang terjadi pada masyarkat Tabel 1. Kemiskinan Kota Binjai Tahun 2012 –
merupakan masalah utama yang menjadi 2017
perhatian pemerintah di negara manapun di Persen Indeks Indeks
berbagai pemerintahan provinsi, kabupaten dan Garis tase Kedalam Kepara
kota. Berbagai cara penanggulangan Tah
Kemisk Pendu an han
kemiskinan telah dilakukan oleh pemerintah un
inan duk Kemiski Kemisk
seperti pemberian bantuan-bantuan masyarakat Miskin nan inan
miskin berupa tunjangan, Jaminan Kesehatan 2012 295 265 6.72 0.54 0.009
Masyarakat, Beras Miskin (Raskin), Bantuan
2013 305 596 6.75 0.88 0.21
Biaya Pendidikan Peningkatan Prestasi
Akademik (BBP-PPA), Bantuan Biaya 2014 310 384 6.38 0.88 0.21
Pendidikan yang hanya ditujukan untuk calon 2015 322 091 7.03 0.81 0.17
mahasiswa tidak mampu/miskin (BIDIKMISI),
2016 343 078 6.67 1.33 0.45
dan program-program lainnya, tetapi yang pada
kenyataannya masalah kemiskinan belum dapat 2017 371 387 6.75 1.11 0.34
ditangulangi.
Pemerintah telah melaksanakan Melihat permasalahan di atas, penulis tertarik untuk
penanggulangan kemiskinan melalui berbagai melakukan penelitian dengan
program dalam upaya pemenuhan kebutuhan mengimplementasikan Data Mining pada data
dasar warga negara secara layak, meningkatkan masyarakat miskin kota Binjai menggunakan
kesejahteraan sosial ekonomi masyarakat algoritma K-Means Clustering, sehingga dapat
miskin, penguatan kelembagaan sosial ekonomi diketahui kelompok variabel-variabel yang sangat
masyarakat serta melaksanakan percepatan berpengaruh pada data kemiskinan. Dan hasilnya
pembangunan daerah tertinggal dalam upaya dapat memberikan informasi tambahan dalam
mencapai masyarakat Indonesia yang sejahtera, mengoptimalkan penanggulangan kemiskinan kota
demokratis dan berkeadilan. Namun Binjai bagi para pemangku kepentingan khususnya
keseluruhan upaya tersebut belum maksimal bagi pemerintahan Kota Binjai, Pemerintahan Pusat
jika tanpa dukungan dari para pemangku dan Tim Nasional Percepatan Penanggulangan
kepentingan lainnya. Kemiskinan (TNP2K).
Data yang diperoleh dari Badan Pusat Statistik
Kota Binjai di jabarkan pada tabel dibawah ini PENELITIAN TERDAHULU
https://binjaikota.bps.go.id/ [1] : Penelitian terdahulu, diambil beberapa contoh
Penelitian terdahulu, diambil beberapa contoh
penelitian terdahulu sebagai panduan ataupun
contoh untuk penelitian yang dilakukan yang
nantinya akan menjadi acuan dan perbandingan
dalam melakukan penelitian ini. Dalam state of the
16 art ini terdapat empat jurnal yang merupakan jurnal
nasional, untuk lebih detailnya dijabarkan dalam
| Metode K-Means Untuk Pengelompokan....
INFORMATION
INFORMATION SYSTEM
SYSTEM DEVELOPMENT
DEVELOPMENT [ISD]
(ISD) [VOLUME 4[VOLUME
NO.2 JULI42019]
NO.2 JULI 2019]

bentuk tabel dibawah ini [2], [3],[4] : Persamaan Berbasis Sistem


Tabel 2. Penelitian Terdahulu Informasi Geografis
1. Judul Perancangan Sistem Perbedaan Menggunakan metode
Penelitian Identifikasi dan yang berbeda, dan
Pemetaan Potensi tidak berdasarkan
Kemiskinan untuk tingkat kemiskinan
Optimalisasi Program masyarakat
Kemiskinan 2. Judul Klasterisasi Data
Peneliti Sri Redjeki, Penelitian Kesehatan Penduduk
M.Guntara, dan Pius untuk Menentukan
Anggoro Rentang Derajat
Tahun 2014 Kesehatan Daerah
Variabel Data masyarakat dengan Metode K-
yang miskin Means
terkait Peneliti Nielza Atthina, dan
Tujuan Untuk mempercepat Lizda Iswari
Penelitian proses pengentasan Tahun 2014
kemiskinan melalui Variabel Tidak ada
penggunaan teknologi yang
informasi untuk terkait
identifikasi dan Tujuan Pemanfaatan
pemetaan (mapping) Penelitian algoritma K-Means
berdasarkan GIS ke untuk mengklaster
daerah-daerah yang atau mengelompokkan
berpotensi orang- kabupaten-kabupaten
orang miskin. Metode di Provinsi Jawa
Identifikasi dilakukan Tengah dan DIY
dengan menggunakan berdasarkan
AHP kemiripan nilai lima
Hasil Sistem pendukung buah ukuran indicator
Penelitian keputusan mortalitas derajat
pengelolaan data kesehatan daerah,
kemiskinan yang di yaitu angka kelahiran
hubungkan dengan kasar, angka kematian
sistem berbasis kasar, angka kematian
geografis dapat bayi, angka kematian
memberikan dampak balita, dan angka
terhadap pengelolaan kematian ibu.
program pengentasan Hasil Hasil klasterisasi
kemiskinan. Sistem Penelitian dapat digunakan
informasi geografis sebagai sebuah acuan
yang dibangun untuk
dengan data berbasis menggambarkan
dusun sangatlah distribusi
membantu masyarakat pengelompokkan
dan pengambil kabupaten
keputusan dalam berdasarkan kondisi
melihat profile profil kesehatan
kemiskinan dan daerah tersebut.
program yang ada Persamaan Penggunaan metode
dalam penangulangan cluster K-Means
kemiskinan. Perbedaan Menggunakan metode

17 | Metode K-Means Untuk Pengelompokan....


INFORMATION
INFORMATION SYSTEM
SYSTEM DEVELOPMENT
DEVELOPMENT [ISD]
(ISD) [VOLUME 4[VOLUME
NO.2 JULI42019]
NO.2 JULI 2019]

cluster K-Means pada Persamaan Menghasilkan


data masyarakat Informasi masyarakat
miskin miskin
3 Judul Rekayasa Perangkat Perbedaan Metode Application
Penelitian Lunak Informasi Deveopment (RAD)
Kemiskinan v.s metode K-Means
Peneliti Ahmad Haidar Mirza, 4 Judul Analisis Kinerja
Usman Ependi, Penelitian Algoritma Fuzzy C-
Febriyanti Panjaitan Means dan K-Means
Tahun 2016 pada Data Kemiskinan
Variabel Data masyarakat ".
yang miskin Peneliti Aniq Noviciatie
terkait Ulfah,dan Shofwatul
Tujuan Membuat sistem ‘Uyun
Penelitian informasi mengenai Tahun 2015
siapa yang miskin dan Variabel Data masyarakat
dimana mereka berada yang miskin
sebagai modal dasar terkait
dalam targeting rumah Tujuan Menganalisa kinerja
tangga miskin. Penelitian antara algoritma FCM
Dengan kata lain, agar dan K-means yang
program diimplementasikan
penanggulangan pada data kemiskinan
kemiskinan berhasil di Desa Girijati
dan tepat sasaran, Purwosari menjadi 3
maka ketersediaan cluster.Beberapa
data kemiskinan yang tahapan yang harus
terpercaya merupakan dilakukan sebelum
suatu keharusan. dilakukan clustering.
Hasil Perangkat lunak Hasil Data kemiskinan di
Penelitian kemiskinan mampu Penelitian Desa Girijati,
menghasilkan Purwosari,
informasi yang Gunungkidul,
dibutuhkan oleh Yogyakarta memiiki
pemerintah dan pihak data yang kurang
terkait yang bervariasi untuk
membutuhkan kelima belas
informasi data indikatornya, hal itu
kemiskinan terkait menyebabkan hasil
pelaksanaan program clustering menjadi
pengentasan sensitif terhadap
kemiskinan. Menjadi perubahan nilai
sebuah media parameter. Dari
informasi yang dapat percobaan yang
mewujutkan dilakukan, waktu
transparansi informasi clustering yang
mengenai data diperlukan algoritma
penduduk miskin dan FCM relatif lebih
indikator kemiskinan lama serta
penduduk miskin dari membutuhkan iterasi
suatu wilayah lebih banyak
kabupaten/kecamatan. dibandingkan dengan

18 | Metode K-Means Untuk Pengelompokan....


INFORMATION
INFORMATION SYSTEM
SYSTEM DEVELOPMENT
DEVELOPMENT [ISD]
(ISD) [VOLUME 4[VOLUME
NO.2 JULI42019]
NO.2 JULI 2019]

algoritma K-Means. 2. Alokasikan data ke dalam kelompok secara acak


Algoritma FCM lebih 3. Hitung pusat kelompok (sentroid/rata-rata) dari
cocok diterapkan pada data yang ada di masing-masing kelompok
data yang lebih 4. Alokasikan masing-masing data ke
variatif. sentroid/rata-rata terdekat
Persamaan Menggunakan Metode 5. Kembali ke langkah tiga, apabila masih ada data
K-Means yang berpindah-pindah kelompok, atau apabila
Perbedaan Penerapan pada data ada perubahan nilai sentroid diatas nilai ambang
masyarakat yang yang ditentukan, atau apabila perubahan nilai
berbeda, dan variable pada fungsi objektif yang digunakan masih di
yang diamati berbeda atas nilai ambang yang ditentukan.
. Lokasi sentroid (titik pusat) setiap kelompok yang
Dari keempat penelitian tersebut di atas perlu diambil dari rata-rata (mean) semua nilai data pada
disempurnakan, dalam pengelompokan data setiap fiturnya harus dihitung kembali. Jika M
masyarakat miskin dapat dipilih menggunakan menyatakan jumlah data dalam sebuah kelompok, I
Algoritma K-Means agar lebih baik lagi [4], dan menyatakan fitur ke-I dalam sebuah kelompok, dan
informasi yang diberikan lebih baik dan lengkap p menyatakan dimensi data, untuk menghitung
untuk mengoptimalkan penanggulangan
sentroid fitur ke-I digunakan formula
kemiskinan kota Binjai bagi para pemangku %
kepentingan khususnya bagi pemerintahan Kota 𝐶" = ∑&
& )*+ 𝑋) (1)
Binjai, Pemerintahan Pusat dan TNP2K. Formula tersebut dilakukan sebanyak p dimensi
sehingga I mulai dari 1 sampai p.
PROSES DATA MINING
Data mining adalah suatu rangkaian proses, Ada beberapa cara yang dapat digunakan untuk
maka data mining dapat dibagi menjadi mengukur jarak data ke pusat kelompok, di
beberapa tahap yaitu [5] : antaranya Euclidean, Manhattan/ City Block dan
1. Pembersihan data (membuang data yang Minkowsky. Masing-masing cara mempunyai
tidak konsisten dan noise) kelebihan dan kekurangan.
2. Integrasi data (penggabungan data dari Pengukuran jarak pada ruang jarak (distance space)
beberapa sumber) Euclidean menggunakan formula :
3. Transformasi data (mengubah data menjadi 𝐷(𝑋% , 𝑋/ ) = 1| 𝑋% − 𝑋/ |1 = 4∑5)*% |𝑋/) − 𝑋%) |/ (2)
bentuk lain)
D adalah jarak antara data x2 dan x1, dan |
4. Aplikasi teknik DM
. | adalah nilai mutlak. Pengukuran jarak pada ruang
5. Evaluasi dan Presentasi pengetahuan (dengan
jarak Manhattan menggunakan formula :
teknik visualisasi)
𝐷(𝑋/ , 𝑋% ) = ||𝑋/ − 𝑋% |1= ∑76*% |𝑋/6 − 𝑋%6 1 (3)
Algoritma K-Means adalah algoritma clustering
Pengukuran jarak pada ruang jarak
yang paling popular dan banyak digunakan
Minkowsky menggunakan formula
dalam dunia industri [6]. Sembarang obyek atau
𝐷(𝑋% , 𝑋/ ) = 1| 𝑋% − 𝑋/ |1 =
elemen pertama dalam cluster dapat dipilih
9 5
untuk dijadikan sebagai titik tengah (centroid 4∑)*% |𝑋/) − 𝑋+) |8 (4)
point) cluster. Algoritma K-Means selanjutnya λ adalah parameter jarak Minkowsky. Secara umum
akan melakukan pengulangan langkah-langkah λ merupakan parameter penentu dalam karakteristik
berikut sampai terjadi kestabilan (tidak ada jarak. Jika λ=1, ruang jarak Minkowsky sama
obyek yang dapat dipindahkan): dengan Mahattan. Jika λ=2, ruang jaraknya sama
1. Menentukan koordinat titik tengah setiap dengan Euclidean, jika λ = ∞, ruang jaraknya akan
cluster, sama dengan ruang jarak Chebyshev. Namun
2. Menentukan jarak setiap obyek terhadap demikian, cara yang paling banyak digunakan
koordinat titik tengah, adalah Eucludean dan Manhattan. Euclidean
3. Mengelompokkan obyek-obyek tersebut menjadi pilihan jika kita ingin memberikan jarak
berdasarkan pada jarak minimumnya. terpendek antara dua titik (jarak lurus), sedangkan
Mahattan membrikan jarak terjauh pada dua data.
Pengelompokan dengan K-Means : Mahattan juga sering digunakan karena
1. Tentukan jumlah kelompok kemampuannya dalam mendeteksi keadaan khusus,
seperti keberadaan outlier, dengan lebih baik [7].
19 | Metode K-Means Untuk Pengelompokan....
INFORMATION
INFORMATION SYSTEM
SYSTEM DEVELOPMENT
DEVELOPMENT [ISD]
(ISD) [VOLUME 4[VOLUME
NO.2 JULI42019]
NO.2 JULI 2019]

Pada persamaan ke 4, pengalokasian kembali 4 6-7


data ke dalam masing-masing kelompok dalam 5 >8
metode K-Means didasarkan pada perbandingan
jarak antara data dengan sentroid setiap Tabel 4. Ijazah Tertinggi Suami
kelompok yang ada. Data dialokasikan ulang
Kode Ijazah Tertinggi
secara tegas ke kelompok yang mempunyai
Suami
sentroid dengan jarak terdekat dari data tersebut.
Pengalokasian ini dapat dirumuskan sebagai 1 Tidak Punya Ijazah
berikut [8]: 2 SD/Sederajat
1 𝑑 = 𝑚𝑖𝑛{𝐷(𝑋+ , 𝐶% )} 3 SMP/Sederajat
𝑎+; = < (5)
0 𝑙𝑎𝑖𝑛𝑛𝑦𝑎 4 SMA/Sederajat
5 D1/D2/D3
aik adalah nilai keanggotaan titik Xi ke pusat
kelompok Cl, d adalah jarak terpendek dari data 6 D4/S1
Xi ke K kelompok setelah dibandingkan, dan Cl
adalah sentroid (pusat kelompok) ke-l. Tabel 5. Lapangan Usaha Dari Pekerjaan Utama
Fungsi objektif yang digunakan untuk K-Means Suami
ditentukan berdasarkan jarak dan nilai Lapangan Usaha Dari
keanggotaan data dan kelompok. Fungsi objektif Kode
Pekerjaan Utama Suami
yang digunakan adalah sebagai berikut [8] :
Pertanian tanaman padi &
𝐽 = ∑J I
+K% ∑;*; 𝑎+H 𝐷(𝑋+ , 𝐶; )
/
(6) 1
palawija
N adalah jumlah data, K adalah jumlah
kelompok, ail adalah nilai keanggotaan titik data
2 Holtikultura
Xi ke pusat kelompok Cl, Cl adalah pusat 3 Perkebunan
kelompok ke-l, dan D(Xi, Cl) adalah jarak titik Xi 4 Perikanan Tangkap
ke kelompok Cl yang diikuti. a mempunyai nilai Kehutanan & Pertanian
5
0 atau 1. Apabila suatu data merupakan anggota Lainnya
suatukelompok, nilai aij=1. Jika tidak, nilai 6 Pertambangan/Pertambangan
aij=0. 7 Industri Pengolahan
8 Listrik dan Gas
PROSES UNTUK PERHITUNGAN
9 Bangunan/Konstruksi
DENGAN METODE CLUSTERING
10 Perdaganan
Dalam penggunaan metode clustering, proses
awal yang dilakukan untuk pembentukan cluster 11 Hotel dan rumah makan
adalah mentransformasikan data ke dalam 12 Transportasi dan pergudangan
bentuk numerik dengan kode-kode yang telah 13 Informasi dan Kominikasi
ditentukan, lalu tentukan jumlah group (K), 14 Keuangan dan & Asuransi
hitung centroid, hitung jarak objek ke centroid 15 Jasa Pendidikan
dan kemudian grupkan berdasarkan jarak 16 Jasa Kesehatan
terdekat, jika tidak ada objek yang pindah grup
17 Jasa Kemasyarakatan
maka iterasi selesai.
18 Pemulung
Untuk menentukan group dari suatu objek,
pertama yang harus dilakukan adalah mengukur 19 Lainnya
jarak Euclidean antara dua titik onjek (X dan Y)
yang di definisikan sebagai berikut: Tabel 6. Data yang di Trasformasi
Na Lapa
Ijaz
Tabel 3. Jumlah Tanggungan ma ngan
Jumla ah
Kode Jumlah Tanggungan Ke Usah
h Tert
1 0-1 No pal a
Tangg inggi
2 2-3 a Dari
ungan Sua
3 4-5 Ru Peke
mi
ma rjaan
20 | Metode K-Means Untuk Pengelompokan....
INFORMATION
INFORMATION SYSTEM
SYSTEM DEVELOPMENT
DEVELOPMENT [ISD]
(ISD) [VOLUME 4[VOLUME
NO.2 JULI42019]
NO.2 JULI 2019]

h Utam Jarak dari C 3 (Z) =


Ta a L(2 − 5)/ + (3 − 2)/ + (4−4)/ = 3,16
ng Sua Bagian C (5;2;4)
ga mi K = 3, centroid1 = (3;1;6), centroid2 =
1 A 3 1 6 (2;3;4),centroid 3 = (5;2;4)
2 B 2 3 4 Jarak dari C 1 (X) =
3 C 5 2 4 L(5 − 3)/ + (2−1)/ + (4 − 6)/ = 3.01
4 D 4 4 2 Jarak dari C 2 (Y) =
5 E 2 1 5
L(5 − 2)/ + (2 − 3)/ + (4 − 4)/ = 3.32
6 F 1 5 1
Jarak dari C 3 (Z) =
7 G 1 3 5
8 H 3 2 6 L(5 − 5)/ + (2 − 2)/ + (4−4)/ = 0
9 I 1 1 6 Bagian D (4;4;2)
K = 3, centroid1 = (3;1;6), centroid2 =
10 J 2 3 4
(2;3;4),centroid 3 = (5;2;4)
11 K 4 3 3
Jarak dari C 1 (X) =
12 L 5 2 2
13 M 2 3 3 L(4 − 3)/ + (4 − 1)/ + (2 − 6)/ = 5.10
14 N 3 1 4 Jarak dari C 2 (Y) =
15 O 3 2 2 L(4 − 2)/ + (4 − 3)/ + (2 − 4)/ = 3.74
16 P 3 1 5 Jarak dari C 3 (Z) =
17 Q 5 5 1 L(4 − 5)/ + (4−2)/ + (2−4)/ = 3
18 R 2 3 2 Bagian E (2;1;5)
19 S 1 5 4 K = 3, centroid1 = (3;1;6), centroid2 =
20 T 1 4 1 (2;3;4),centroid 3 = (5;2;4)
Jarak dari C 1 (X) =
Penentu Centroid awal dilakukan secara L(2 − 3)/ + (1 − 1)/ + (5−6)/ = 1.41
acak untuk iterasi I Jarak dari C 2 (Y) =
Iterasi I
L(2 − 2)/ + (1−3)/ + (5−4)/ = 2
K = 3, centroid1 = (3;1;6), centroid2 =
Jarak dari C 3 (Z) =
(2;3;4),centroid 3 = (5;2;4)
Bagian A (3;1;6) L(2 − 5)/ + (1 − 2)/ + (5 − 4)/ =3.31
K = 3, centroid1 = (3;1;6), centroid2 = Bagian F (1;5;1)
(2;3;4),centroid 3 = (5;2;4) K = 3, centroid1 = (3;1;6), centroid2 =
Jarak dari C 1 (X) = (2;3;4),centroid 3 = (5;2;4)
Jarak dari C 1 (X) =
L(3 − 3)/ + (1−1)/ + (6 − 6)/ = 0
Jarak dari C 2 (Y) = L(1 − 3)/ + (5 − 1)/ + (1 − 6)/ = 6.71
Jarak dari C 2 (Y) =
L(3 − 2)/ + (1 − 3)/ + (6 − 4)/ = 3
Jarak dari C 3 (Z) = L(1 − 2)/ + (5 − 3)/ + (1 − 4)/ = 4.58
Jarak dari C 3 (Z) =
L(3 − 5)/ + (1 − 2)/ + (6−4)/ = 3
Bagian B (2;3;4) L(1 − 5)/ + (5 − 2)/ + (1 − 4)/ = 5.83
K = 3, centroid1 = (3;1;6), centroid2 = Bagian G (1;3;5)
(2;3;4),centroid 3 = (5;2;4) K = 3, centroid1 = (3;1;6), centroid2 =
Jarak dari C 1 (X) = (2;3;4),centroid 3 = (5;2;4)
Jarak dari C 1 (X) =
L(2 − 3)/ + (3−1)/ + (4 − 6)/ = 3
Jarak dari C 2 (Y) = L(1 − 3)/ + (3 − 1)/ + (5 − 6)/ = 3
Jarak dari C 2 (Y) =
L(2 − 2)/ + (3 − 3)/ + (4 − 4)/ = 0
21 | Metode K-Means Untuk Pengelompokan....
INFORMATION
INFORMATION SYSTEM
SYSTEM DEVELOPMENT
DEVELOPMENT [ISD]
(ISD) [VOLUME 4[VOLUME
NO.2 JULI42019]
NO.2 JULI 2019]

L(1 − 2)/ + (3 − 3)/ + (5 − 4)/ = 1.41 Jarak dari C 2 (Y) =


Jarak dari C 3 (Z) = L(5 − 2)/ + (2 − 3)/ + (2−4)/ = 4.35
L(1 − 5)/ + (3 − 2)/ + (5 − 4)/ = 4.24 Jarak dari C 3 (Z) =
Bagian H (3;2;6) L(5 − 5)/ + (2 − 2)/ + (2 − 4)/ = 2
K = 3, centroid1 = (3;1;6), centroid2 =
(2;3;4),centroid 3 = (5;2;4) Bagian M (2;3;3)
Jarak dari C 1 (X) = K = 3, centroid1 = (3;1;6), centroid2 =
L(3 − 3)/ + (2 − 1)/ + (6 − 6)/ = 1 (2;3;4),centroid 3 = (5;2;4)
Jarak dari C 2 (Y) = Jarak dari C 1 (X) =
L(3 − 2)/ + (2 − 3)/ + (6 − 4)/ = 1.73 L(2 − 3)/ + (3 − 1)/ + (3−6)/ = 3.74
Jarak dari C 3 (Z) = Jarak dari C 2 (Y) =
L(3 − 5)/ + (2 − 2)/ + (6 − 4)/ = 2.82 L(2 − 2)/ + (3 − 3)/ + (3 − 4)/ = 2
Bagian I (1;1;6) Jarak dari C 3 (Z) =
K = 3, centroid1 = (3;1;6), centroid2 = L(2 − 5)/ + (3−2)/ + (3−4)/ = 3.31
(2;3;4),centroid 3 = (5;2;4) Bagian N (3;1;4)
Jarak dari C 1 (X) = K = 3, centroid1 = (3;1;6), centroid2 =
L(1 − 3)/ + (1 − 1)/ + (6−6)/ = 2 (2;3;4),centroid 3 = (5;2;4)
Jarak dari C 2 (Y) = Jarak dari C 1 (X) =
L(1 − 2)/ + (1 − 3)/ + (6−4)/ = 2.45 L(3 − 3)/ + (1 − 1)/ + (4 − 6)/ = 2
Jarak dari C 3 (Z) = Jarak dari C 2 (Y) =
L(1 − 5)/ + (1 − 2)/ + (6−4)/ = 4.59 L(3 − 2)/ + (1 − 3)/ + (4 − 4)/ = 2.45
Bagian J (2;3;4) Jarak dari C 3 (Z) =
K = 3, centroid1 = (3;1;6), centroid2 = L(3 − 5)/ + (1 − 2)/ + (4 − 4)/ = 2.24
(2;3;4),centroid 3 = (5;2;4) Bagian O (3;2;2)
Jarak dari C 1 (X) = K = 3, centroid1 = (3;1;6), centroid2 =
L(2 − 3)/ + (3−1)/ + (4 − 6)/ = 4.58 (2;3;4),centroid 3 = (5;2;4)
Jarak dari C 2 (Y) = Jarak dari C 1 (X) =
L(2 − 2)/ + (3 − 3)/ + (4 − 4)/ = 3 L(3 − 3)/ + (2 − 1)/ + (2−6)/ = 4.12
Jarak dari C 3 (Z) = Jarak dari C 2 (Y) =
L(2 − 5)/ + (3 − 2)/ + (4 − 4)/ = 3.74 L(3 − 2)/ + (2 − 3)/ + (2 − 4)/ = 3.31
Bagian K (4;3;3) Jarak dari C 3 (Z) =
K = 3, centroid1 = (3;1;6), centroid2 = L(3 − 5)/ + (2−2)/ + (2−4)/ = 2.82
(2;3;4),centroid 3 = (5;2;4) Bagian P (3;1;5)
Jarak dari C 1 (X) = K = 3, centroid1 = (3;1;6), centroid2 =
L(4 − 3)/ + (3 − 1)/ + (3 − 6)/ = 3.74 (2;3;4),centroid 3 = (5;2;4)
Jarak dari C 2 (Y) = Jarak dari C 1 (X) =
L(4 − 2)/ + (3 − 3)/ + (3 − 4)/ = 2.82 L(3 − 3)/ + (1−1)/ + (5−6)/ = 1
Jarak dari C 3 (Z) = Jarak dari C 2 (Y) =
L(4 − 5)/ + (3 − 2)/ + (3 − 4)/ = 1.73 L(3 − 2)/ + (1−3)/ + (5 − 4)/ = 2.24
Bagian L (5;2;2) Jarak dari C 3 (Z) =
K = 3, centroid1 = (3;1;6), centroid2 = L(3 − 5)/ + (1 − 2)/ + (5 − 4)/ = 2.45
(2;3;4),centroid 3 = (5;2;4)
Jarak dari C 1 (X) =
L(5 − 3)/ + (2−1)/ + (2−6)/ = 4.58 Bagian Q (5;5;1)

22 | Metode K-Means Untuk Pengelompokan....


INFORMATION
INFORMATION SYSTEM
SYSTEM DEVELOPMENT
DEVELOPMENT [ISD]
(ISD) [VOLUME 4[VOLUME
NO.2 JULI42019]
NO.2 JULI 2019]

K = 3, centroid1 = (3;1;6), centroid2 = N


a
(2;3;4),centroid 3 = (5;2;4) m
a
Jarak dari C 1 (X) = J
u
L(5 − 3)/ + (5 − 1)/ + (1 − 6)/ = 6.71 K
m Lap
e
anga
Jarak dari C 2 (Y) = p l Ij
n
a a az
L(5 − 2)/ + (5 − 3)/ + (1 − 4)/ = 5.38 l h ah
Usa
ha
a Te
Jarak dari C 3 (Z) = Dari

Jarak Dari C2

Jarak Dari C3
Jarak Dari CI
T rti
a Peke

Group
L(5 − 5)/ + (5−2)/ + (1−4)/ = 4.24 N
o
R
u n
ng
gi
rjaa
n
Bagian R (2;3;2) m g Su
Uta
a g a
K = 3, centroid1 = (3;1;6), centroid2 = h u mi
ma
n Sua
(2;3;4),centroid 3 = (5;2;4) g mi
T
Jarak dari C 1 (X) = a a
n n
L(2 − 3)/ + (3 − 1)/ + (2−6)/ = 4.58 g
Jarak dari C 2 (Y) = g
a
L(2 − 2)/ + (3 − 3)/ + (2−4)/ = 3 X Y Z
Jarak dari C 3 (Z) = 1 A 3 1 6
0. 3. 3.
1
00 00 00
L(2 − 5)/ + (3 − 2)/ + (2 − 4)/
= 3.74 3. 0. 3.
2 B 2 3 4 2
Bagian S (1;5;4) 00 00 16
3. 3. 0.
3 C 5 2 4 3
K = 3, centroid1 = (3;1;6), centroid2 = 01 32 00
5. 3. 3.
(2;3;4),centroid 3 = (5;2;4) 4 D 4 4 2
10 74 00
3

Jarak dari C 1 (X) = 5 E 2 1 5


1. 2. 3.
1
41 00 31
L(1 − 3)/ + (5 − 1)/ + (4 − 6)/ = 4.90 6. 4. 5.
6 F 1 5 1 2
71 58 83
Jarak dari C 2 (Y) =
3. 1. 4.
7 G 1 3 5 2
L(1 − 2)/ + (5−3)/ + (4 − 4)/ = 2.45 00 41 24
1. 1. 2.
Jarak dari C 3 (Z) = 8 H 3 2 6
00 73 82
1

2. 2. 4.
L(1 − 5)/ + (5 − 2)/ + (4 − 4)/ = 5 9 I 1 1 6
00 45 59
1

Bagian T (1;4;1) 1
J 1 3 4
4. 3. 3.
2
0 58 00 74
K = 3, centroid1 = (3;1;6), centroid2 = 1 3. 2. 1.
K 4 3 3 3
(2;3;4),centroid 3 = (5;2;4) 1 74 82 73
1 4. 4. 2.
Jarak dari C 1 (X) = 2
L 5 2 2
58 35 00
3

1 3. 2. 3.
L(1 − 3)/ + (4−1)/ + (1 − 6)/ = 6.16 3
M 2 3 3
74 00 31
2

Jarak dari C 2 (Y) = 1


N 3 1 4
2. 2. 2.
1
4 00 45 24
L(1 − 2)/ + (4 − 3)/ + (1 − 4)/ = 4.24 1
O 3 2 2
4. 3. 2.
3
5 12 31 82
Jarak dari C 3 (Z) = 1 1. 2. 2.
P 3 1 5 1
6 00 24 45
L(1 − 5)/ + (4−2)/ + (1 − 4)/ = 5.38 1 6. 5. 4.
Q 5 5 1 3
7 71 38 24
1 4. 3. 3.
Hasil perhitungan iterasi pertama terdapat 6 8
R 2 3 2
58 00 74
2

data pada cluster 1, 8 data pada cluster 2, 1


S 1 5 4
4. 2. 5.
2
9 9 45 00
dan 6 data pada cluster 3. Untuk lebih 2 6. 4. 5.
T 1 4 1 2
jelasnya, hasil dapat dilihat pada tabel 0 16 24 38

sebagai berikut:
Group berdasarkan jarak minimal ke Centroid
terdekat yaitu :
Tabel 6. Hasil Menghitung Jarak ke Jika jarak terpendek berada di C1 maka
Centroid- Iterasi 1 Dan Penentuan Group dimasukan di kelompok 1
23 | Metode K-Means Untuk Pengelompokan....
INFORMATION
INFORMATION SYSTEM
SYSTEM DEVELOPMENT
DEVELOPMENT [ISD]
(ISD) [VOLUME 4[VOLUME
NO.2 JULI42019]
NO.2 JULI 2019]

Jika jarak terpendek berada di C2 maka 4,23


dimasukan di kelompok 2 Jarak dari C 3 (Z) =
Jika jarak terpendek berada di C3 maka L(3 − 4,33)/ + (1−3)/ + (6 − 2,33)/ =
dimasukan di kelompok 3 4.38
Group lama =
{0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0} Bagian B (2;3;4)
Group baru = K = 3, centroid 1 = (2,5 ; 1,17 ; 5,33),
{1,2,3,3,1,2,2,1,1,2,3,3,2,1,3,1,3,2,2,2} centroid 2 = (1,5 ; 3,5 ; 2,75), centroid 3 =
Terjadi perubahan group, dilanjutkan ke (4,33 ; 3 ; 2,33)
iterasi II. Jarak dari C 1 (X) =
L(2 − 2,5)/ + (3 − 1.77)/ + (4 − 5,33)/ =
Penetuan Centroid untuk Iterasi 2
2,31
Untuk Group 1 ada 6 data :
Jarak dari C 2 (Y) =
Centroid 1,1 = (3 + 2 + 3 + 1 + 3 + 3) /6=
15/6 = 2,5 L(2 − 1,37)/ + (3 − 3,5)/ + (4 − 3)/ =
Centroid 1,2 = (1 + 1 + 2 + 1 + 1 + 1) /6 = 1,28
7/6 = 1,17 Jarak dari C 3 (Z) =
Centroid 1,3 = (6 + 5 + 6 + 6 + 4 + 5) /6 = L(2 − 4,33)/ + (3 − 3)/ + (4 − 2,33)/ =
32/6 = 5,33 2,87
Untuk Group 2 ada 8 data : Bagian C (5;2;4)
Centroid 2,1 = (2 + 1 + 1 + 1 + 2 + 2 + 1 + K = 3, centroid 1 = (2,5 ; 1,17 ; 5,33),
1) / 8 = 12/8 = 1,37 centroid 2 = (1,37 ; 3,5 ; 3), centroid 3 =
Centroid 2,2 = (3 + 4 + 3 + 3 + 3 + 3 + 5 + (4,33 ; 3 ; 2,33)
4) / 8 = 28/8= 3.5 Jarak dari C 1 (X) =
Centroid 2,3 = (4 + 1+ 5 + 4 + 3 + 2 + 4 + L(5 − 2,5)/ + (2−1.77)/ + (4 − 5,33)/ =
1) / 8 = 24/8 = 3 2.95
Untuk Group 3 ada 6 data : Jarak dari C 2 (Y) =
Centroid 3,1 = ( 5 + 4 + 4 + 5 + 3 +5) / 6 =
L(5 − 1,37)/ + (2 − 3,5)/ + (4 − 3)/ =
26/6 = 4,33
4.05
Centroid 3,2 = (2 + 4 + 3 + 2 + 2 + 5) / 6 =
Jarak dari C 3 (Z) =
18/6 = 3
Centroid 3,3 = (4 + 2 + 3 + 2 + 2 + 1) / 6 = L(5 − 4,33)/ + (2 − 3)/ + (4−2,33)/ =
14/6 = 2,33 2.06
Bagian D (4;4;2)
Iterasi 2 K = 3, centroid 1 = (2,5 ; 1,17 ; 5,33),
K = 3, centroid 1 = (2,5 ; 1,17 ; 5,33), centroid 2 = (1,37 ; 3,5 ; 3), centroid 3 =
centroid 2 = (1,37 ; 3,5 ; 3), centroid 3 = (4,33 ; 3 ; 2,33)
(4,33 ; 3 ; 2,33) Jarak dari C 1 (X) =
Bagian A (3;1;6) L(4 − 2,5)/ + (4−1.77)/ + (2 − 5,33)/ =
K = 3, centroid 1 = (2,5 ; 1,17 ; 5,33), 4.62
centroid 2 = (1,37 ; 3,5 ; 3), centroid 3 = Jarak dari C 2 (Y) =
(4,33 ; 3 ; 2,33) L(4 − 1,37)/ + (4−3,5)/ + (2 − 3)/ = 2.85
Jarak dari C 1 (X) = Jarak dari C 3 (Z) =
L(3 − 2,5)/ + (1 − 1.77)/ + (6 − 5,33)/ L(4 − 4,33)/ + (4 − 3)/ + (2 − 2,33)/ =
= 0,85 1.10
Jarak dari C 2 (Y) = Bagian E (2;3;3)
L(3 − 1,37)/ + (1 − 3,5)/ + (6−3)/ = K = 3, centroid 1 = (2,5 ; 1,17 ; 5,33),

24 | Metode K-Means Untuk Pengelompokan....


INFORMATION
INFORMATION SYSTEM
SYSTEM DEVELOPMENT
DEVELOPMENT [ISD]
(ISD) [VOLUME 4[VOLUME
NO.2 JULI42019]
NO.2 JULI 2019]

centroid 2 = (1,37 ; 3,5 ; 3), centroid 3 = L(3 − 1,37)/ + (2 − 3,5)/ + (6−3)/ = 2.73
(4,33 ; 3 ; 2,33) Jarak dari C 3 (Z) =
Jarak dari C 1 (X) =
L(3 − 4,33)/ + (2 − 3)/ + (6−2,33)/ =
L(2 − 2,5)/ + (3−1.77)/ + (3 − 5,33)/ 4.03
= 0.62
Jarak dari C 2 (Y) = Bagian I (1;1;6)
L(2 − 1,37)/ + (3 − 3,5)/ + (3 − 3)/ = K = 3, centroid 1 = (2,5 ; 1,17 ; 5,33),
3.26 centroid 2 = (1,37 ; 3,5 ; 3), centroid 3 =
Jarak dari C 3 (Z) = (4,33 ; 3 ; 2,33)
L(2 − 4,33)/ + (3 − 3)/ + (3 − 2,33)/ = Jarak dari C 1 (X) =
4.07 L(1 − 2,5)/ + (1 − 1.77)/ + (6 − 5,33)/ =
Bagian F (1;5;1) 1.65
K = 3, centroid 1 = (2,5 ; 1,17 ; 5,33), Jarak dari C 2 (Y) =
centroid 2 = (1,37 ; 3,5 ; 3), centroid 3 = L(1 − 1,37)/ + (1 − 3,5)/ + (6−3)/ = 3.92
(4,33 ; 3 ; 2,33) Jarak dari C 3 (Z) =
Jarak dari C 1 (X) =
L(1 − 4,33)/ + (1 − 3)/ + (6−2,33)/ =
L(1 − 2,5)/ + (5 − 1.77)/ + (1 − 5,33)/ 5.43
= 5.97 Bagian J (2;3;4)
Jarak dari C 2 (Y) = K = 3, centroid 1 = (2,5 ; 1,17 ; 5,33),
L(1 − 1,37)/ + (5−3,5)/ + (1 − 3)/ = centroid 2 = (1,37 ; 3,5 ; 3), centroid 3 =
2.52 (4,33 ; 3 ; 2,33)
Jarak dari C 3 (Z) = Jarak dari C 1 (X) =
L(1 − 4,33)/ + (5 − 3)/ + (1 − 2,33)/ = L(2 − 2,5)/ + (3 − 1.77)/ + (4 − 5,33)/ =
4.11 3.83
Bagian G (1;3;5) Jarak dari C 2 (Y) =
K = 3, centroid 1 = (2,5 ; 1,17 ; 5,33), L(2 − 1,37)/ + (3 − 3,5)/ + (4−3)/ = 1.28
centroid 2 = (1,37 ; 3,5 ; 3), centroid 3 = Jarak dari C 3 (Z) =
(4,33 ; 3 ; 2,33)
L(2 − 4,33)/ + (3−3)/ + (4 − 2,33)/ =
Jarak dari C 1 (X) =
2.35
L(1 − 2,5)/ + (3−1.77)/ + (5−5,33)/ = Bagian K (4;3;3)
2.39 K = 3, centroid 1 = (2,5 ; 1,17 ; 5,33),
Jarak dari C 2 (Y) = centroid 2 = (1,37 ; 3,5 ; 3), centroid 3 =
L(1 − 1,37)/ + (3 − 3,5)/ + (5−3)/ = (4,33 ; 3 ; 2,33)
2.10 Jarak dari C 1 (X) =
Jarak dari C 3 (Z) = L(4 − 2,5)/ + (3 − 1.77)/ + (3 − 5,33)/ =
L(1 − 4,33)/ + (3 − 3)/ + (5 − 2,33)/ = 3.32
4.27 Jarak dari C 2 (Y) =
Bagian H (3;2;6) L(4 − 1,37)/ + (3 − 3,5)/ + (3−3)/ = 2.68
K = 3, centroid 1 = (2,5 ; 1,17 ; 5,33), Jarak dari C 3 (Z) =
centroid 2 = (1,37 ; 3,5 ; 3), centroid 3 =
L(4 − 4,33)/ + (3 − 3)/ + (3 − 2,33)/ =
(4,33 ; 3 ; 2,33)
0.75
Jarak dari C 1 (X) =
Bagian L (5;2;2)
L(3 − 2,5)/ + (2 − 1.77)/ + (6 − 5,33)/ K = 3, centroid 1 = (2,5 ; 1,17 ; 5,33),
= 1.18 centroid 2 = (1,37 ; 3,5 ; 3), centroid 3 =
Jarak dari C 2 (Y) = (4,33 ; 3 ; 2,33)
25 | Metode K-Means Untuk Pengelompokan....
INFORMATION
INFORMATION SYSTEM
SYSTEM DEVELOPMENT
DEVELOPMENT [ISD]
(ISD) [VOLUME 4[VOLUME
NO.2 JULI42019]
NO.2 JULI 2019]

Jarak dari C 1 (X) = Jarak dari C 3 (Z) =


L(5 − 2,5)/ + (2−1.77)/ + (2 − 5,33)/ L(3 − 4,33)/ + (2 − 3)/ + (2 − 2,33)/ =
= 4.24 1.70
Jarak dari C 2 (Y) =
L(5 − 1,37)/ + (2 − 3,5)/ + (2 − 3)/ = Bagian P (3;1;5)
4.04 K = 3, centroid 1 = (2,5 ; 1,17 ; 5,33),
Jarak dari C 3 (Z) = centroid 2 = (1,37 ; 3,5 ; 3), centroid 3 =
(4,33 ; 3 ; 2,33)
L(5 − 4,33)/ + (2 − 3)/ + (2 − 2,33)/ =
Jarak dari C 1 (X) =
1.25
Bagian M (2;3;3) L(3 − 2,5)/ + (1 − 1.77)/ + (5 − 5,33)/ =
K = 3, centroid 1 = (2,5 ; 1,17 ; 5,33), 0.62
centroid 2 = (1,37 ; 3,5 ; 3), centroid 3 = Jarak dari C 2 (Y) =
(4,33 ; 3 ; 2,33) L(3 − 1,37)/ + (1 − 3,5)/ + (5 − 3)/ =
Jarak dari C 1 (X) = 3.59
L(2 − 2,5)/ + (3 − 1.77)/ + (3 − 5,33)/ Jarak dari C 3 (Z) =
=3 L(3 − 4,33)/ + (1−3)/ + (5 − 2,33)/ =
Jarak dari C 2 (Y) = 3.60
L(2 − 1,37)/ + (3−3,5)/ + (3 − 3)/ = Bagian Q (5;5;1)
0.80 K = 3, centroid 1 = (2,5 ; 1,17 ; 5,33),
Jarak dari C 3 (Z) = centroid 2 = (1,37 ; 3,5 ; 3), centroid 3 =
(4,33 ; 3 ; 2,33)
L(2 − 4,33)/ + (3−3)/ + (3 − 2,33)/ =
Jarak dari C 1 (X) =
2.42
Bagian N (3;1;4) L(5 − 2,5)/ + (5 − 1.77)/ + (1−5,33)/ =
K = 3, centroid 1 = (2,5 ; 1,17 ; 5,33), 6.30
centroid 2 = (1,37 ; 3,5 ; 3), centroid 3 = Jarak dari C 2 (Y) =
(4,33 ; 3 ; 2,33) L(5 − 1,37)/ + (5 − 3,5)/ + (1 − 3)/ =
Jarak dari C 1 (X) = 4.41
L(3 − 2,5)/ + (1 − 1.77)/ + (4 − 5,33)/ Jarak dari C 3 (Z) =
= 1.43 L(5 − 4,33)/ + (5−3)/ + (1 − 2,33)/ =
Jarak dari C 2 (Y) = 2.50
L(3 − 1,37)/ + (1 − 3,5)/ + (4−3)/ = Bagian R (2;3;2)
3.15 K = 3, centroid 1 = (2,5 ; 1,17 ; 5,33),
Jarak dari C 3 (Z) = centroid 2 = (1,37 ; 3,5 ; 3), centroid 3 =
(4,33 ; 3 ; 2,33)
L(3 − 4,33)/ + (1 − 3)/ + (4 − 2,33)/ =
Jarak dari C 1 (X) =
2.92
Bagian O (3;2;2) L(2 − 2,5)/ + (3 − 1.77)/ + (2 − 5,33)/ =
K = 3, centroid 1 = (2,5 ; 1,17 ; 5,33), 3.83
centroid 2 = (1,37 ; 3,5 ; 3), centroid 3 = Jarak dari C 2 (Y) =
(4,33 ; 3 ; 2,33) L(2 − 1,37)/ + (3−3,5)/ + (2−3)/ = 1.28
Jarak dari C 1 (X) = Jarak dari C 3 (Z) =
L(3 − 2,5)/ + (2 − 1.77)/ + (2 − 5,33)/ L(2 − 4,33)/ + (3 − 3)/ + (2 − 2,33)/ =
= 3.47 2.35
Jarak dari C 2 (Y) = Bagian S (1;5;4)
L(3 − 1,37)/ + (2 − 3,5)/ + (2 − 3)/ = K = 3, centroid 1 = (2,5 ; 1,17 ; 5,33),
2.43 centroid 2 = (1,37 ; 3,5 ; 3), centroid 3 =

26 | Metode K-Means Untuk Pengelompokan....


INFORMATION
INFORMATION SYSTEM
SYSTEM DEVELOPMENT
DEVELOPMENT [ISD]
(ISD) [VOLUME 4[VOLUME
NO.2 JULI42019]
NO.2 JULI 2019]

(4,33 ; 3 ; 2,33) 4 2 1
. . .
Jarak dari C 1 (X) = 4 D 4 4 2
6 8 1
3

2 5 0
L(1 − 2,5)/ + (5 − 1.77)/ + (4 − 5,33)/ 0 3 4
= 4.32 5 E 2 1 5
. . .
1
6 2 0
Jarak dari C 2 (Y) = 2 6 7
5 2 4
L(1 − 1,37)/ + (5 − 3,5)/ + (4 − 3)/ = . . .
6 F 1 5 1 2
9 5 1
1.84 7 2 1
Jarak dari C 3 (Z) = 2 2 4
. . .
L(1 − 4,33)/ + (5 − 3)/ + (4 − 2,33)/ = 7 G 1 3 5
3 1 2
2
9 0 7
4.23 1 2 4
Bagian T (1;4;1) 8 H 3 2 6
. . .
1
1 7 0
K = 3, centroid 1 = (2,5 ; 1,17 ; 5,33), 8 3 3
centroid 2 = (1,37 ; 3,5 ; 3), centroid 3 = 1 3 5
. . .
(4,33 ; 3 ; 2,33) 9 I 1 1 6
6 9 3
1

Jarak dari C 1 (X) = 5 2 4


3 1 2
L(1 − 2,5)/ + (4 − 1.77)/ + (1−5,33)/ 1
J 1 3 4
. . .
2
0 8 2 3
= 5.38 3 8 5
Jarak dari C 2 (Y) = 3 2 0
1 . . .
K 4 3 3 3
L(1 − 1,37)/ + (4 − 3,5)/ + (1−3)/ = 1 3 6 7
2 8 5
2.09 4 4 1
Jarak dari C 3 (Z) = 1
L 5 2 2
. . .
3
2 2 0 2
L(1 − 4,33)/ + (4−3)/ + (1 − 2,33)/ = 4 5 5
3 0 2
3.72 1 . . .
M 2 3 3 2
3 0 8 4
0 0 2
Tabel 7. Hasil Menghitung Jarak ke 1 3 2
1 . . .
Centroid- Iterasi 2 Dan Penentuan Group 4
N 3 1 4
4 1 9
1

3 5 2
J 3 2 1
u 1 . . .
La O 3 2 2 3
m 5 4 4 7
pan 7 3 0
l
Na Ija gan 0 3 3
a
ma za Us 1 . . .
h P 3 1 5 1
Ke h aha 6 6 5 6
pal Te Dar
Jarak Dari C2

Jarak Dari C3

2 9 0
Jarak Dari CI

T
a rti i
Group

N a 6 4 2
Ru ng Pek
o n 1 . . .
ma gi erja Q 5 5 1 3
g 7 3 4 5
h Su an
g 0 1 0
Ta am Uta
u 3 1 2
ng i ma
n 1 . . .
ga Sua R 2 3 2 2
g 8 8 2 3
mi
a 3 8 5
n 4 1 4
X Y Z 1 . . .
S 1 5 4 2
0 4 4 9 3 8 2
. , . 2 4 3
1 A 3 1 6 1
8 2 3 5 2 3
5 3 8 2 . . .
T 1 4 1 2
2 1 2 0 3 0 7
. . . 8 9 2
2 B 2 3 4 2
3 2 8
1 8 7
2 4 2 Group berdasarkan jarak minimal ke Centroid
. . .
3 C 5 2 4
9 0 0
3 terdekat yaitu :
5 5 6

27 | Metode K-Means Untuk Pengelompokan....


INFORMATION
INFORMATION SYSTEM
SYSTEM DEVELOPMENT
DEVELOPMENT [ISD]
(ISD) [VOLUME 4[VOLUME
NO.2 JULI42019]
NO.2 JULI 2019]

1. Jika jarak terpendek berada di C1 maka Pekerjaan Utama Suami = 6 (Kehutanan


dimasukan di kelompok 1. & Pertanian Lainnya).
2. Jika jarak terpendek berada di C2 maka 2. Cluster 2 Terdapat 8 Data Kemiskinan
dimasukan di kelompok 2 1,37 ; 3,5; 3. Dapat diketahui bahwa
3. Jika jarak terpendek berada di C3 maka cluster 2 kemiskinan terbanyak berada di
dimasukan di kelompok 3 Jumlah Tanggungan = 1 (0-1) dengan
Ijazah Tertinggi Suami = 3
Group lama = (SMP/Sederajat), dan Lapangan Usaha
{1,2,3,3,1,2,2,1,1,2,3,3,2,1,3,1,3,2,2,2} Dari Pekerjaan Utama Suami = 4
Group baru = (Perikanan Tangkap).
{1,2,3,3,1,2,2,1,1,2,3,3,2,1,3,1,3,2,2,2} 3. Cluster 3 Terdapat 6 Data Penjualan
Tidak ada perubahan grup, operasi berhenti. 4,33; 3; 2,33. Dapat diketahui bahwa
Karena pada iterasi ke-2 posisi cluster tidak cluster = 3 kemiskinan terbanyak berada
berubah dengan posisi cluster pada iterasi di Jumlah Tanggungan = 5 (>8) dengan
pertama maka proses iterasi dihentikan dan Ijazah Tertinggi Suami = 2
mendapatkan hasil gambaran grafik sebagai (SD/Sederajat), dan Lapangan Usaha Dari
berikut: Pekerjaan Utama Suami 2 (Holtikultura).

UCAPAN TERIMA KASIH


Kami menyampaikan terima kasih yang
sebesar-besarnya kepada Direktorat Riset dan
Pengabdian Kepada Masyakat (DRPM) Ditjen
Penguatan Riset dan Pengembangan
Kementerian Riset, Teknologi, dan Pendidikan
Tinggi atas dukungan dana berupa hibah
Penelitian Dosen Pemula (PDP) tahun
anggaran 2019. Kami juga mengucapkan
terimakasih kepada STMIK Kaputama atas
dukungan dalam pelaksanaan kegiatan
Gambar 1. Grafik Hasil Clustering penelitian ini.

Cluster 1 : 2,5; 1,17; 5,33 DAFTAR PUSTAKA


Cluster 2 : 1,37; 3,5; 3 [1] P. BINJAI, “Jumlah Penduduk Miskin
Cluster 3 : 4,33; 3; 2,33 Menurut Kabupaten/Kota, 2016-2017,”
2017. .
KESIMPULAN [2] S. Redjeki, M. Guntara, P. Anggoro, J.
Dari 20 data diperoleh 3 group, Cluster 1 Teknik Informatika, and S. AKAKOM
terdapat 6 data penjualan, Cluster 2 terdapat Yogyakarta, “Perancangan Sistem
Identifikasi dan Pemetaan Potensi
8 data kemiskinan, Cluster 3 terdapat 6 data
Kemiskinan untuk Optimalisasi Program
kemiskinan. Dan diperoleh group terbanyak Kemiskinan,” J. Sist. Inf., 2014.
adalah cluster 2. [3] A. Haidar Mirza, U. Ependi, and F.
1. Cluster 1 Terdapat 6 Data Panjaitan, “REKAYASA PERANGKAT
Kemiskinan 2,5; 1,17; 5,33. Dapat LUNAK INFORMASI
diketahui bahwa cluster 1 kemiskinan KEMISKINAN,” J. Inform., 2016.
terbanyak berada di Jumlah [4] A. N. Ulfah and S. ‘Uyun, “Analisis
Kinerja Algoritma Fuzzy C-Means dan
Tanggungan = 3 (4-6) dengan Ijazah
K-Means pada Data Kemiskinan,” J.
Tertinggi Suami = 1 (Tidak Punya Tek. Inform. DAN Sist. Inf., 2015.
Ijazah), dan Lapangan Usaha Dari [5] A. M. H. Pardede, “ANALISIS
28 | Metode K-Means Untuk Pengelompokan....
INFORMATION
INFORMATION SYSTEM
SYSTEM DEVELOPMENT
DEVELOPMENT [ISD]
(ISD) [VOLUME 4[VOLUME
NO.2 JULI42019]
NO.2 JULI 2019]

PENGELOMPOKKAN
PERFORMANCE DOSEN
DENGAN METODE CLUSTERING
PADA STMIK KAPUTAMA
BINJAI,” J. Kaputama, vol. 5, no. 2,
pp. 41–59, 2012.
[6] K. Kameshwaran and K. Malarvizhi,
“Survey on Clustering Data Mining
Techniques in Data Mining,” 2014.
[Online]. Available:
people.revoledu.com%5Ckardi%5C
tutorial%5CkMean%5C. [Accessed:
10-Aug-2018].
[7] Y. Agusta, S. Bali, and B. Denpasar,
“K-Means – Penerapan,
Permasalahan dan Metode Terkait,”
J. Sist. dan Inform., 2007.
[8] J. MacQueen, “Some Methods for
classification and Analysis of
Multivariate Observations,” in 5th
Berkeley Symposium on
Mathematical Statistics and
Probability 1967, 1967.

29 | Metode K-Means Untuk Pengelompokan....

You might also like