Penerapan Metode Apriori Untuk Identifikasi Pola Data Transaksi Pada Customer Di Supermarket

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 7

PENERAPAN METODE APRIORI UNTUK IDENTIFIKASI POLA

DATA TRANSAKSI PADA CUSTOMER DI SUPERMARKET

Mochamad Al Hafizh Zachari1 Feri Sulianta2


Program Studi Informatika
Fakultas Teknik
Universitas Widyatama, Jl. Cikutra 204A Bandung 40125, Indonesia
mochamad.zachari@widyatama.ac.id, feri.sulianta@widyatama.ac.id

Abstrak Supermarket merpuakan tempat minimum tertentu saja yang dianggap sering
berbelanja dari seseorang terhadap suatu daerah muncul (frequent), sehingga dapat diketahui
masyarakat setempat. Dengan pelayanan yang item-set yang sering muncul.. Penghapusan ini
maksimal untuk mengetahui pola data berdasarkan pengamatan yaitu apakah item-set
pembelian yang diberikan dan mengantisipasi tersebut sering muncul atau tidak. Dari hasil
persediaan bahan pokok didaerah tertentu agar penelitian dengan menggunakan nilai minimum
tidak mengalami keterlambatan kesediaan support dan minimum confident tertinggi akan
barangt. Maka diperlukan pencarian pola atau membentuk nilai akhir, yaitu nilai paling besar
hubungan Association rule (aturan asosiatif). yang melebihi batas minimal support dan
Association rule merupakan salah satu teknik confidence. Dalam penelitian ini dengan
data mining yang sangat penting, dapat menggunakan kombinasi 2 item set dengan
diartikan bahwa hubungan antara sejumlah item minimum support 2 dan minimum confidence
dengan menentukan nilai support dan 35 pada super market di daerah tebet selatan
confidence pada basis data, penting tidaknya adalah “jika pembeli membeli Telur dan daging
aturan asosiasi dapat diketahui dengan nilai giling maka pembeli akan membeli air mineral
support atau nilai penunjang dan confidence ” dengan Support 7,333% dan confidence
(nilai kepastian) algoritma apriori menghitung 50,66%
seringnnya item-set yang muncul dalam Kata Kunci : super market, association rule,
database melalui beberapa iterasi, setiap iterasi algoritma apriori
tersebut memiliki dua tahapan yaitu
menentukan kandidat dan menghitung
kandidat. Tahap pertama pada iterasi pertama ,
himpunan yang dihasilkan dari kandidat item-
set berisikan seluruh 1-item-set. Tahap kedua
algoritma apriori menghitung support-nya
melalui seluruh item-set dengan batas
1. LANDASAN TEORI memprediksi nilai dari target variabel yang
diskrit dan regresi yang digunakan untuk
1.1 Data Mining
memprediksi nilai dari target variabel yang
Data mining merupakan suatu metode
kontinyu.
untuk menemukan pengetahuan dalam
1.1.2 Association analysis
suatu tumpukan data yang cukup besar.
Data mining adalah proses menggali dan Association analysis adalah penemuan
menganalisa sejumlah data yang sangat association rule yang menunjukan pola-
besar untuk memperoleh sesuatu yang pola yang sering muncul dalam data.
benar, baru dan bermanfaat dan akhirnya Terdapat nilai support dan confidence yang
dapat ditemukan suatu corak atau pola dapat menunjukan seberapa besar suatu
dalam data tersebut. (Han dan Kamber, rule dapat dipercaya. Support adalah
2006). Data mining adalah bagian integral ukuran dimana seberapa besar tingkat
dari knowledge discovery database (KDD) dominasi suatu item atau itemset terhadap
yang merupakan proses keseluruhan keseluruhan transaksi. Sedangkan
mengubah data mentah menjadi pola-pola confidence adalah ukuran yang
data yang menarik yang merupakan menunjukan hubungan antara dua item
informasi yang dibutuhkan oleh pengguna secara conditional. Association analysis
sebagai pengetahuan, seperti yang digunakan untuk menemukan aturan-
ditunjukan pada. aturan asosiasi yang memperlihatkan
kondisi-kondisi nilai atribut yang sering
Terdapat empat tugas utama data mining
muncul secara bersamaan dalam sebuah
yang terlihat pada gambar 3 yaitu :
himpunan data.

1.1.3 Cluster analysis


1.1.1 Predictive modelling

Tidak seperti klasifikasi yang menganalisa


Predictive modelling digunakan untuk
kelas data objek yang mengandung label.
membangun sebuah model untuk target
Clustering digunakan untuk menganalisa
variabel sebagai fungsi dari explanatory
objek dari data tanpa memeriksa kelas
variabel. Explanatory variabel dalam hal ini
label yang diketahui. Label-label kelas
merupakan semua atribut yang digunakan
dilibatkan di dalam data training karena
untuk melakukan prediksi, sedangkan
belun diketahui sebelumnya. Clustering
variable target merupakan atribut yang
merupakan proses mengelompokan
akan diprediksi nilainya. Predictive
sekumpulan objek yang sangat mirip.
modelling dibagi menjadi dua tipe yaitu :
Classification yang digunakan untuk
1.1.4 Anomaly detection/outlier menggunakan data latihan sehingga
mining diketahui item-item belanja yang sering
dibeli secara bersamaan dalam suatu waktu.
Sebuah database dapat mengandung data
Aturan asosiasi yang terbentuk “if...then...,
objek yang tidak sesuai atau menyimpang
atau, jika..., maka.”.
dari model data. Data objek ini disebut
outlier. Banyak metode data mining yang 1.3 Algoritma Apriori
menghilangkan outlier ini. Padahal, pada Algoritma apriori atau sering disebut juga
beberapa aplikasi seperti fraud detection, dengan analisis asosiasi (association rule
kejadian yang jarang terjadi tersebut justru mining) adalah teknik data mining untuk
lebih menarik untuk dianalisa daripada menemukan aturan asosiasi antara suatu
kejadian yang sering terjadi. Analisa dari kombinasi item. (Han & Kamber, 2006)
outlier data tersebut disebut sebagai Misalkan I={i1,i2,i3,.. in} merupakan himpunan
outlier mining. Outlier mining juga sering items dan D merupakan himpunan database
disebut dengan anomaly detection yang transaksi yang setiap transasi T merupakan
merupakan metode pendeteksian suatu himpunan item yang terkandung dalam
data dimana tujuannya adalah transaksi T. Setiap transaksi diasosiasikan
menemukan objek yang berbeda dari dengan identifier yang disebut TID. Aturan
sebagian besar objek lain. Anomaly dapat yang memenuhi minimum support (min_sup)
dideteksi dengan menggunakan uji statistik dan minimum confidence (min_conf) disebut
yang menerapkan model distribusi atau kandidat rule yang kuat. Berdasarkan konvensi,
probabilitas untuk data. nilai support dan nilai confidence adalah nilai

1.2 Asociation Rule antara 0% sampai 100% sebanding dengan 0

Menurut tempubulon, Association rule sampai 1,0 (Linof, 2004). Himpunan item
mining merupakan teknik data mining untuk disebut dengan itemset. Itemset yang
menemukan aturan asosiasi antar kombinasi mengandung k items disebut kitemsets.
item, salah satu contoh dari aturan asosiasi Sebagai contoh himpunan {kopi, gula}
disuatu pasar swalayan adalah dapat merupakan 2-itemset. Kecenderungan
diketahui berapa besar kemungkinan kemunculan itemset dalam sejumlah transaksi
seseorang membeli sikat gigi bersamaan disebut frequency, support count atau count
dengan pasta gigi. Dengan informasi itemset. Aturan asosiasi dilakukan dengan
tersebut pihak pasar swalayan dapat
melalui dua langkah, yaitu :
mengatur ketersediaan stok barang, supaya
1. Temukan semua frequent itemset. Hasil
tidak terjadi keterlambatan stok barang yang
dari proses ini adalah sejumlah itemset dengan
sering dibeli bersamaan. Aturan asosiasi
nilai support lebih besar atau sama dengan
minimum support yang diberikan. Nilai support 2. METODE PENELITIAN
dari itemset {A,B} dihitung dengan 2.1. Kerangka Penelitian
menggunakan persamaan 1.
PROBLEM ANALYSIS

DATA PREPARATION
2. Menentukan strong rule dari frequent
itemset. Hasil dari proses ini adalah semua
DATA MINING
rule yang memenuhi minimum support dan
minimum confidence. Nilai confidence dari
suatu kandidat rule A B dihitung dengan PATTERN GENERATION
menggunakan persamaan 2.

PATERN MONITORING

Gambar 2.1 Alur Metode Penelitian


2.2 Use Case Diagram
Dibawah ini adalah diagram usecase,
usecase akan menjelaskan bagaimana suatu
1.4 Pola Frekuensi Tinggi perilaku (behaviour) berlangsung dalam
Tahap ini akan mencari item yang memenuhi super market.
minimal support dari item-set. Nilai support
didapat dari rumus 1 berikut : Support h
pembelian mengandung A)/(Total ….[rumus 1]
Kemudian nilai support dari 2 item diperoleh
dari rumus 2 berikut: mengandung A dan
B)/(Total Item)...............[rumus 2].

Gambar 2.2 Use case diagram pada system


transaksi
2.3 Analisa Pola Frekuensi tinggi Tabel frekuensi transaksi tinggi
Tahap ini akan mencari item menggunakan
dataset dengan algoritma apriori yang
memenuhi minimal support dari item-set.
Nilai support didapat dari rumus 1 berikut
Support(A) 𝐽𝑢𝑚𝑙𝑎ℎ transaksi
𝑚𝑒𝑛𝑔𝑎𝑛𝑑𝑢𝑛𝑔 𝐴 𝑇𝑜𝑡𝑎𝑙 transaksi [rumus 1] Tabel diatas menujukkan hasil calon 2-

Kemudian nilai support dari 2 item itemset dari pola data Bahan baku pembeli

diperoleh dari rumus 2 berikut: pada tabel 4. Dari data tersebut diatas, jika

Support(A,B)=P(A∩B) 𝐽𝑢𝑚𝑙𝑎ℎ Transaksi ditetapkan nilai ф yang telah ditentukan

𝑚𝑒𝑛𝑔𝑎𝑛𝑑𝑢𝑛𝑔 𝐴 𝑑𝑎𝑛 𝐵 𝑇𝑜𝑡𝑎𝑙 transaksi oleh user yaitu = 3 maka F2 = {{air

[rumus 2] Contoh perhitungan algoritma mineral,telur}, {chocolate,air mineral}}.

apriori dengan data set pola data Bahan Yang tidak memenuhi nilai ф = 3 maka

baku yang didapat diSuper Market jatiroto akan dihapus. Langkah selanjutnya

seperti pada tabel 1 berikut : membentuk 3 item set seperti pada tabel 4

Tabel Pola Frekuensi pada dataset berikut :


Tabel nilai support pada itemset

Support Itemset length


0.050933 (telur, air 2
mineral)
0.059733 (coklat, mineral 2
Data tersebut diatas dalam database water)
Customers direpresentasikan dalam bentuk 0.052667 (spageti, air 2
mineral)
seperti tampak pada tabel 2 berikut:
Tabel frekuensi tinggi pada item Dengan demikian F3= {}, karena lebih

No Nama Total kecil dari nilai yang ditetapkan ф = 3, jadi


Transaksi untuk F4, F5,F6, dan seterusnya merupakan
0 air mineral 968
himpunan kosong
1 telur 748
2 spaghetti 738 Setelah didapat support dan confidence
3 coklat 691 untuk masing-masing kandidat, lakukan
4 kentang 687 perkalian antara support dan confidence,
5 teh hijau 565
dimana confidence-nya diambil 70%
6 susu sapi 530
7 daging sapi 419 keatas, sehingga didapat seperti pada tabel
8 pancake 384 berikut :
9 sayuran 384

Selanjutnya mencari candidat 2 -itemset


seperti pada tabel 3 berikut :
Tabel nilai support dan confidence pada - Jika item coklat maka akan air mineral
itemset dengan support 40% dan confidence 50%
Ifantece Suppor Confide Support
dent t nce x 3. KESIMPULAN DAN SARAN
then Confide 3.1 Kesimpulan
consequ nce Berdasarkan pengujian data yang telah
ent dilakukan pada kedua dataset. Untuk pola
Jika 0.5093 50% 0,4 item yang terbentuk pada transaksi dengan
Telur 3 kombinasi 2 yaitu “ jika Telur maka akan
maka ada Air Mineral” dengan support 0.50933
air dan Confidence 50,308%. Sedangkan
minera untuk kombinasi 3 item didapat “ jika
l Spageti dan Air mineral, maka akan ada
Jika 0.5973 50% 0,4 coklat ” dengan support 4% dan
Spageti 3 confidence 22,222%. 2. Untuk pola item
maka yang terbentuk dengan kombinasi 2 yaitu “
air jika Telur maka akan ada air mineral”
minera dengan support 12% dan Confidence
l 33,962%. Sedangkan untuk kombinasi 3
Jika 0.5267 50% 0,4 item didapat “ jika coklat dan spageti,
Coklat 7 maka akan ada air mineral” dengan
maka support 4,667% dan Confidence 13,208%.
air 3.2 Saran
minera Berdasarkan hasil penelitian dan
l kesimpulan yang telah dijelaskan
sebelumnya, peneliti memberikan
beberapa saran, diantaranya sebagai
Setelah didapat hasil perkalian antara
berikut:
support dan confidence, pilihlah yang hasil
perkalianya paling besar. Hasil paling besar 1. Bagi peneliti yang ingin melanjutlan

dari perkalian-perkalian tersebut penelitian ini diharapkan mempunyai data

merupakan rule yang dipakai pada saat set yang kompleks dan tidak banyak
transaksi, karena hasil perkalian dari ke-3 memiliki attribut
item diatas bernilai sama, maka semuanya 2. Gunakanlah tools visualisasi yang
bisa dijadikan rule. mudah digunakan unuk memvisualisasi
- Jika item telur maka akan air mineral kan data hasil mining
dengan support 40% dan confidence 50%
3. Saran saya untuk peneliti https://media.neliti.com/media/publications/2
selanjutnya, gunakan lah bahasa 36599-algoritma-apriori-untuk-analisis-
pemrograman pyhton untuk membuat keranja-1ad5198e.pdf

algoritma ini, karena python sangat [7] Sunarti, F. Handayanna, dan E.

reliable untuk interpretasi bigdata. Irfiani, “Analisa Pola Penjualan Makanan


dengan Penerapan Algoritma Apriori”, Vol.
20, No. 4, pp. 478-488, November. 2021.
[8] A.V. Putri, “Analisa Pola Belanja
DAFTAR PUSTAKA
Konsumen Menggunakan Algoritma Apriori
[1] Anief, M. (1991). Apa yang Perlu
Pada Toko Buku Al-Mumtaz”, juli. 2019.
Diketahui Tentang Bahan baku. Yogyakarta:
[9] W. Dari, “Analisis Metode Apriori
PenerbitGajah Mada University Press.
Untuk Memprediksi Persediaan Barang
Halaman 3.
Pada Warung”, Vol. 1, No. 4, pp. 438-447,
[2] Agrawal,dalam
Agustus. 2022.
simanjuntak.2010.”Aplikasi data mining
[10] Sunarti, F. Handayanna, dan E.
untuk pemodelan pembelian barang dengan
Irfiani, “Analisa Pola Penjualan Makanan
menggunakan Algoritma Apriori.”jurnal
dengan Penerapan Algoritma Apriori”, Vol.
teknik informatika.Hlm 1- 31.
20, No. 4, pp. 478-488, November. 2021.
[3] Dewati,S.2014.”Analisis pola
[11] A.V. Putri, “Analisa Pola Belanja
transaksi Bahan baku menggunakan
Konsumen Menggunakan Algoritma Apriori
Algoritma Apriori”.jurnal teknik
Pada Toko Buku Al-Mumtaz”, juli. 2019.
informatika. Hlm 1-9.
[12] W. Dari, “Analisis Metode Apriori
[4] Kurniawan, H.2014.”Analisa pola
Untuk Memprediksi Persediaan Barang
penyakit swalayan dengan menerapakan
Pada Warung”, Vol. 1, No. 4, pp. 438-
association rule menggunakan algoritma
447, Agustus. 2022.
apriori”.seminar nasional informatika.
[13] Kusrini., Luthfi, E. T., 2009. Algoritma
Hlm195- 201.
Data Mining, Andi Publisher, Yogyakarta.
[5] Kusrini. 2009.Algoritma Data
[14] Turban, E., 2005, Decision Support
Mining.Yogyakarta:Andi offset.
Systems and Intelligent Systems Edisi Bahasa
Simanjuntak.2010.”Aplikasi Data mining
Indonesia. Andi Publisher, Yogyakarta.
untuk pemodelan pembelian Barang
[15] Hermawati, F. A., 2013, Data Mining.
menggunakan algoritma apriori.”jurnal
Andi, Yogyakarta.
teknik informatika. Hlm1- 31.
[6] Algoritma Apriori untuk Analisis
Keranjang Belanja pada Data Transaksi
Penjualan Sandi Fajar Rodiyansyah

You might also like