Professional Documents
Culture Documents
Penerapan Algoritma CART Dalam Menentukan Jurusan Siswa Di MAN 1 Inhil
Penerapan Algoritma CART Dalam Menentukan Jurusan Siswa Di MAN 1 Inhil
Abstract— MAN 1 Inhil is a school that applies ministerial Berdasarkan 360 data yang diklasifikasikan disimpulkan bahwa
regulations to determine the direction of student majors at the jurusan agama terdiri dari 71 yang diklasifikasikan secara benar.
beginning of entry, namely in class X. Determination of majors is Jurusan IPA berjumlah 144 meliputi 119 diklasifikasian secara
done by considering several indicators, namely the results of benar dan 24 diklasifikasikan sebagai IPS dan 1 diklasifikasi
academic tests, interviews, and student interest. The calculation in sebagai agama. Jurusan IPS berjumlah 146 meliputi 129
determining this course is very simple, namely by adding up the diklasifikasikan secara benar dan 16 diklasifikasi sebagai IPA. Oleh
values of each indicator and dividing them together so that an karena itu dapat disimpulkan bahwa algoritma CART memiliki tingkat
average value is obtained. If the value is fulfilled then the student is akurasi 80% sehingga bisa digunakan dalam pengambilan
grouped based on their interests. This can lead to errors in decision keputusan.
making by the school due to subjective factors by prioritizing student
interests and not based on the value of the academic test results. Kata Kunci— Algoritma CART, Decission Tree, Klasifikasi,
Therefore we need methods and algorithms to help make decisions MAN 1 Inhil
well, the decision tree method. One algorithm that can be used is
CART algorithm to classify majors with three indicators, namely
Natural Sciences, Social Sciences and Religion. The results of this I. PENDAHULUAN
study indicate that the CART algorithm is able to predict correctly, Saat ini penentuan jurusan pada tingkat SMA dan
from 360 data classified using the CART algorithm, it can be setingkatnya dimulai sejak siswa masuk yaitu mulai dari kelas
concluded that 71 data majoring in religion and correctly classified X. Hal ini bertujuan agar siswa lebih mendalami bidang
by CART. 144 data majoring in Natural Sciences, 119 data correctly
keilmuan yang diminatinya sejak awal masuk sekolah menenah
classified and 24 data classified as IPS, and 1 data classified as
atas sehingga siswa bisa memfokuskan dirinya dalam
religion. Of 146 data majoring in social studies, 129 were classified
correctly, 16 data were classified as natural sciences. Therefore it
mengembangkan kemampuan dan minat yang diminatinya.
can be concluded that CART algorithm has an 80% accuracy so that Pemilihan jurusan yang tidak tepat bisa saja merugikan siswa
it can be used in decision making tersebut dan juga karirnya di masa yang akan datang [1].
Salah satu sekolah yang menerapkan sistem penjurusan
Keywords— CART algorithm, Classification, Decission tersebut adalah sekolah MAN 1 di Indragiri Hilir (Inhil) dengan
Tree,MAN 1 Inhil
jurusan yang tersedia yaitu IPA, IPS, dan MAK(Agama). Saat
ini, pemilihan jurusan di MAN I Inhil dilakukan pada saat calon
siswa dinyatakan lulus masuk di sekolah ini. Sistem seperti ini
Abstrak— MAN 1 Inhil merupakan sekolah yang menerapkan
sangat efektif dilakukan, jika sebelumnya siswa tersebut telah
peraturan menteri untuk melakukan penentuan jurusan siswa di
memiliki persiapan dan pengetahuan mengenai jurusan yang
awal masuk yaitu pada kelas X. Penentuan jurusan dilakukan
dengan mempertimbangkan beberapa indikator yaitu hasil tes akan dipilih. Namun sebaliknya, jika siswa tersebut belum
akademik, wawancara, dan minat siswa. Perhitungan dalam mengetahui arah kemampuan mengenai jurusan yang akan
penentuan jurusan ini sangat sederhana yaitu dengan dipilih maka siswa tersebut akan kebingungan dalam memilih
menjumlahkan nilai setiap indikator dan dibagi keseluruhannya jurusan dan bisa berakibat pada salah ambil jurusan.
sehingga didapatkan nilai rata-rata. Jika nilai tersebut terpenuhi Indikator yang digunakan oleh pihak sekolah dalam
maka siswa tersebut dikelompokkan berdasarkan minat nya. Hal ini
menentukan jurusan siswa adalah hasil tes akademik,
bisa menimbulkan kesalahan dalam pengambilan keputusan oleh
wawancara, dan minat siswa. Indikator tersebut dijumlahkan
pihak sekolah karena bersifat subjektif dengan mengutamakan
minat siswa dan bukan berdasarkan nilai dari hasil tes akademik.
dan dibagi sehingga didapat nilai rata-rata. Jika nilai tersebut
Oleh karena itu butuh metode dan algoritma dalam membantu terpenuhi maka siswa tersebut dikelompokkan berdasarkan
mengambil keputusan dengan baik yaitu metode decision tree. Salah minat nya. Perhitungan seperti ini sangat sederhana. Hal ini bisa
satu algoritma yang bisa digunakan yaitu algoritma CART untuk menimbulkan kesalahan dalam pengambilan keputusan oleh
melakukan pengklasifikasian jurusan dengan tiga indikator yaitu pihak sekolah karena bersifat subjektif yaitu dengan
IPA, IPS dan Agama. Hasil penelitian ini menunjukkan bahwa mengutamakan minat siswa bukan berdasarkan nilai dari hasil
algoritma CART mampu melakukan prediksi dengan benar. tes akademik.
Seringkali dijumpai dalam memilih jurusan, siswa hanya A. Pohon Keputusan (Decission Tree)
ikut-ikutan teman atau hanya memiliki informasi sedikit dari Decission tree adalah metode pengambilan keputusan
teman maupun oranglain mengenai jurusan yang dipilih. Oleh teknik klasifikasi dengan struktur flowchart yang mirip dengan
karena tidak memperhatikan nilai dan peminatan kurikulumnya pohon. Model yang dibentuk oleh metode ini ini sangat mudah
sehingga menyebabkan salah jurusan dan berakibat putus dipahami sehingga menjadikan metode ini sangat umum dan
sekolah di tengah jalan [2]. Terdapat beberapa hambatan yang popular [7]. Terdiri dari beberapa algoritma dalam membangun
dihadapi oleh siswa dalam memilih jurusan yaitu hambatan tree yaitu CART, ID3 dan C4.5. Penelitian ini menggunakan
yang berasal dari dalam berupa kemampuan diri dan hambatan algoritma CART.
yang berasal dari luar yaitu permintaan atau paksaan orang tua
dalam memilih jurusan yang mana dilatarbelakangi oleh B. Algoritma CART (Classification And Regression Tree)
perkerjaan di masa depan yang diharapkan oleh orang tua untuk Merupakan algoritma yang umum dan banyak digunakan
anaknya dimasa yang akan datang [3]. yang mengintegrasikan berbagai faktor dari sumber yang
Berdasarkan hasil angket yang disebarkan kepada siswa berbeda [8] untuk masalah klasifikasi dan regresi berdasarkan
MAN 1 Inhil bahwa mayoritas siswa memperoleh jurusan biner rekursif [9]. Algoritma ini tergolong dalam model
berdasarkan hasil pilihan yang telah diisi pada formulir nonparametric [10] yang tidak memerlukan bentuk fungsional
pemilihan jurusan. Selain itu, berdasarkan angket bahwa tingkat dan telah terbukti menjadi alat ampuh untuk masalah prediksi
kepuasan siswa serta nilai akhir yang dihasilkanpun bervariasi, dan klasifikasi [9]. CART mengandalkan partisi biner rekursif
mulai dari hasil yang memuaskan hingga hasil yang kurang [11] dari data dasar pembangunan pohon regresi. Pohon
memuaskan. Oleh karena itu perlu adanya algoritma dalam didirikan dari dataset yang dikumpulkan di simpul pohon akar
menentukan atau memutuskan jurusan yang tepat sehingga dan setiap node dibagi menjadi dua node turun menggunakan
diharapkan nilai akhir siswa mayoritas memuaskan. Metode variabel pemisahan (salah satu variabel prediktor) . Pemilihan
yang bisa digunakan dalam pengambilan keputusan adalah variabel pemisahan mencari penurunan variabilitas dalam-node
decision tree. Salah satu algoritma yang sederhana dan kuat dan untuk peningkatan variabilitas antara-node, dengan setiap
dalam pengambilan keputusan adalah algoritma CART [4]. partisi yang diperoleh menghasilkan pohon dengan variabilitas
Algoritma CART menghasilkan 87% tingkat akurasi data uji yang lebih sedikit daripada pohon sebelumnya.
dan data latih [5] sehingga dapat digunakan dalam pengambilan Berdasarkan penelitian [6] menunjukkan bahwa
keputusan oleh pihak sekolah dan memberikan informasi dalam berdasarkan nilai precision, nilai precission metode naive bayes
menentukan jurusan yang benar [6]. lebih baik dibandingkan dengan metode yang lain dengan nilai
77,51%. Sedangkan berdasarkan nilai recall dan accuracy,
II. METODE PENELITIAN decision tree lebih baik dibandingkan dengan metode yang lain
dengan nilai recall sebesar 90,80% dan nilai accuracy sebesar
79,14% [1].
Tahapan-tahapan yang dilakukan pada algoritma CART ini
sebagai berikut [12]–[14]: Pertama, lakukan penyusunan calon
cabang (candidate split) terhadap seluruh variabel prediktor
dengan lengkap. Daftar yang berisi calon cabang tersebut
dinamakan calon cabang mutakhir. Kedua, lakukan penilaian
seluruh calon cabang mutakhir dengan melakukan perhitungan
nilai besaran kesesuaian Ф(s|t). Lakukan tahapan kedua sampai
tidak adalagi noktah keputusan dan akan berhenti jika tidak ada
lagi noktah keputusan. Untuk mencari kesesuaian Ф(s|t) dari
calon cabang s pada noktah keputusan t menggunakan
persamaan sebagai berikut:
Ф (s|t) = 2PLPRQ(s|t)………………………………….. (1)
Dimana Q (s|t) = ∑𝐽𝑢𝑚𝑙𝑎ℎ
𝑖=1 |𝑃(𝑗|tL) − 𝑃(𝑗|tR) …….…(2)
tL = cabang kiri dari noktah keputusan t
Gambar 1. Metodologi Penelitian
tR = cabang kanan dari noktah keputusan t
Metode Penelitian memberikan penjelasan tentang langkah- 𝑗𝑢𝑚𝑙𝑎ℎ 𝑐𝑎𝑡𝑎𝑡𝑎𝑛 𝑝𝑎𝑑𝑎 𝑐𝑎𝑙𝑜𝑛 𝑘𝑖𝑟𝑖 𝑡𝐿
langkah, data, lokasi penelitian, metode evaluasi yang dimana PL = 𝑗𝑢𝑚𝑙𝑎ℎ 𝑐𝑎𝑡𝑎𝑡𝑎𝑛 𝑝𝑎𝑑𝑎 𝑑𝑎𝑡𝑎 𝑙𝑎𝑡𝑖ℎ𝑎𝑛
…………....(3)
digunakan serta penjelasan terstruktur tentang algoritma atau 𝑗 𝑐𝑎𝑙𝑜𝑛 𝑐𝑎𝑏𝑎𝑛𝑔 𝑘𝑖𝑟𝑖 𝑡𝐿
P(j|tL) = …………………(4)
metode dari penelitian yang dibahas. 𝑛𝑜𝑘𝑡𝑎ℎ 𝑘𝑒𝑝𝑢𝑡𝑢𝑠𝑎𝑛 𝑡
dibawah ini.
WEKA merupakan salah satu tools yang mampu melakukan No. Nama JK MTK IPA … JUR
perbandingan beberapa algoritma machine learning yang 1 Muh Weldi LK 70 85 … AGAMA
digunakan dalam pengaplikasian pada permasalahan data 2 Cici Alia PR 60 90 … AGAMA
mining. Tools ini bisa dikembangkan oleh siapa saja karena 3 Syaifira A PR 65 90 … IPA
bersifat open source dan dikembangkan pertamakali oleh 4 Nia Zufiani PR 65 85 … IPA
University of Wakaito di Selandia Baru [15] sebagai 5 Abdul LK 60 80 … IPA
penambangan data. Pada tools ini, data-data di uji prosedur- Rahman
6 Muh Rizki LK 60 61,43 … AGAMA
prosedurnya untuk melakukan eksplorasi dan permodelan guna
7 Muh Arya LK 55 70 … AGAMA
menghasilkan hubungan yang tersembunyi dari data tersebut
8 Meilani S PR 45 52,86 … AGAMA
[16].
9 Widia Putri PR 50 44,29 … IPA
10 Ihsan D LK 60 47,14 … IPA
III. HASIL DAN PEMBAHASAN
11 Meiry M PR 45 52,86 … IPS
Data inputan berjumlah 439 record yang berasal dari data 12 Windi A PR 35 52,86 … IPS
rekapitulasi pendaftaran dan seleksi siswa kelas X. Adapun 13 Puspa Y PR 30 47,14 … IPS
target dan klasifikasi dalam penentuan jurusan menggunakan 14 Suandi PR 35 52,86 … IPS
atribut seperti Jenis Kelamin, Nilai Tes Siswa berupa Nilai 15 Tirta PR 45 47,14 IPS
Matematika, IPA, IPS dan Agama, ditunjukkan pada TABEL I.
TABLE IV. DATA UJI
TABLE I. DATA REKAPUTULASI (POTONGAN DATA)
No. Na JK MTK IP IPS AGAMA JUR
No. Nama JK MT IPS … Jurusan ma A
K 1 Muh LK 75 75 58,71 82,98 ?
1. Muh Ariansyah LK 85 75 … Agama Reza
2. Robiansyah LK 70 85 … Agama
3. M.Hidayat PR 90 70 … Agama C. Penerapan Metode Cart
… … … … … … …
Tahapan pertama pada Algoritma CART ini adalah
439 Muhammad Ridho LK 0 0 0 Tidak Lulus
menentukan calon noktah keputusan dengan cara menyusun
A. Preprocessing Data calon cabang (candidate split) yang dilakukan terhadap seluruh
atribut prediktor yaitu Jenis Kelamin, Rata-rata nilai IPA, Rata-
Tahapan ini bertujuan untuk memilih data dan atribut yang rata nilai IPS, Rata-rata nilai Agama, Rata-rata nilai
sesuai dan lengkap. Awalnya tribut berjumlah 11, namun Matematika, sehingga terbentuk daftar calon cabang mutakhir
setelah dilakukan penyeleksian dan pembersihan data menjadi
seperti yang ditunjukkan pada TABEL V.
8 atribut yang dapat digunakan. Atribut seperti peringkat, nilai
rata-rata, dan keterangan lulus/tidak lulus dihapus dan tidak TABLE V. DAFTAR CALON MUTAKHIR
digunakan. Selain itu, data yang digunakan berjumlah 360
Nomor
record dari yang sebelumnya berjumlah 439 record data. Data calon Calon cabang kiri (tL) Calon cabang kanan (tR)
hasil pada tahap ini di tunjukkan pada TABEL II. cabang
1 Jenis Kelamin = Laki-laki Jenis Kelamin =
TABLE II. DATA HASIL PREPROCESSING (POTONGAN DATA) Perempuan
2 Rata-rata nilai IPA ≤ 50 Rata-rata nilai IPA > 50
No. Nama JK MTK IP … Jurusan
S
1. Muh Ariansyah LK 85 75 … Agama 3 Rata-rata nilai IPA ≤ 80 Rata-rata nilai IPA > 80
4 Rata-rata nilai IPS ≤ 50 Rata-rata nilai IPS > 50
2. Robiansyah LK 70 85 … Agama 5 Rata-rata nilai IPS ≤ 60 Rata-rata nilai IPS > 60
3. M.Hidayat PR 90 70 … Agama 6 Rata-rata nilai Agama ≤ 60 Rata-rata nilai Agama > 60
… … … … … … … 7 Rata-rata nilai Agama ≤ 80 Rata-rata nilai Agama > 80
360 Selfi Nurdiati PR 25 25 … IPS 8 Rata-rata nilai Matemtika Rata-rata nilai Matematika
≤ 30 > 30
B. Data Latih Dan Data Uji 9 Rata-rata nilai Matematika Rata-rata nilai Matematika
≤ 50 > 50
Berdasarkan data yang dihasilkan pada TABEL II
selanjutnya digunakan 15 data latih pada TABEL III. Data yang telah diolah pada Tabel 5 selanjutnya di seleksi
Selanjutnya akan dilakukan pengujian data dengan mencari berdasarkan data latih sehingga menghasilkan data calon
label atau jurusanya berdasarkan perhitungan algoritma CART. mutakhir pada TABEL VI.
Data uji pada penelitian ini di tunjukkan pada TABEL IV.
Berdasarkan TABEL IX, selanjutnya dihitung nilai Nama MTK IPA IPS Agama Jurusan Prediksi
kesesuain (goodness) calon cabang φ(s|t) menggunakan Muh 75 75 58,71 82,98 Agama ?
Persamaan 2 dengan mengalikan nilai 2PLPR dan Q (s|t). Nilai Reza
2PLPR didapat dari (2PL x PR) kalikan 2. Hasil perhitungannya Berdasarkan kesimpulan rule, rata-rata nilai agama
ditunjukkan pada TABEL X. merupakan nilai yang diprioritaskan terlebih dahulu untuk
menentukan jurusan. Siswa yang bernama Muhammad Muh
Calon cabang tertinggi berada pada nomor calon cabang ke
Reza tidak memenuhi syarat dikarenakan rata-rata nilai
6 yaitu 0,8889 berdasarkan TABEL X diatas. Nilai yang
agama ≤ 60 sehingga tidak memenuhi masuk jurusan IPS,
dihasilkan pada calon cabang kiri Rata-rata nilai Agama ≤ 60
rata-rata nilai agama ≤ 80 sehingga tidak memenuhi masuk
dan calon cabang kanan Rata-rata nilai Agama >60 sehingga
jurusan IPA, rata-rata nilai agama > 80 sehingga memenuhi
calon cabang inilah yang dipilih sebagai root node pada tahap
masuk jurusan Agama. Sehingga disimpulkan bahwa jurusan
ini. Namun, tetap dilakukan perhitungan kembali sampai
yang cocok untuk Muhammad Muh Reza adalah Agama.
memiliki noktah keputusan dengan iterasi selanjutnya, setelah
Hasilnya ditunjukkan pada TABEL XII.
menghilangkan no 6 yang terpilih sebelumnya. Hal ini akan
menghasilkan jumlah kesesuian hasil prediksi jurusan yang TABLE XII. DATA UJI PREDIKSI
memilih jurusan IPA dan IPS dan Agama. Perhitungan iterasi
terakhir ditunjukkan pada Gambar I. yang menghasilkan pohon Nama MTK IPA IPS Agama Jurusan Prediksi
keputusan. Muh 75 75 58,71 82,98 Agama Agama
Iterasi selanjutnya adalah Calon cabang nomor 7 yang Reza
memiliki nilai tertinggi. Nilai yang dihasilkan adalah calon D. Pengujian Tools Weka
cabang kiri rata-rata nilai agama ≤ 80 dan calon cabang kanan
Menggunakan 15 data maka dilakukan pengujian algoritma
> 80 sehingga dijadikan cabang kedua. Masing-masing cabang
Cart pada tools Weka. Hasilnya sebagai berikut :
memiliki keterangan yang berbeda. Pada cabang dengan nilai
rata-rata agama ≤ 80 memiliki keterangan yang homogen maka AGAMA <59.72: IPS (5/0) AGAMA ≥ 59.72
proses pencabangan dihentikan, untuk cabang dengan nilai
rata-rata aga- ma > 80 memiliki keterangan belum homogen — AGAMA <78.38: IPA (4/0)
tetapi sudah memenuhi dari dari seluruh data latih yaitu 15 data, — AGAMA ≥ 78.38
maka proses pencabangan juga dihentikan. Selanjutnya
dilakukan pengklasifikasian data uji pada TABEL XI. — — IPA <87.5: AGAMA (4/0)
— — IPA ≥ 87.5
— — — IPS <62.86: IPA (1/0)
— — — IPS ≥ 62.86: AGAMA (1/0)
Pohon visualisasi Algoritma CART dapat dilihat pada ditunjukkan pada TABEL XIV dengan akurasi yang tergolong
Gambar II. dan hasil prediksi dari kesimpulan rule ditunjukkan tinggi yaitu 80%.
pada TABEL XIII. Sedangkan Uji coba tingkat akurasi