Download as pdf or txt
Download as pdf or txt
You are on page 1of 11

Yuni Arkhiansyah.

63
Jurnal Informatika, Vol.7, No.1, Juni 2007
STMIK Darmajaya

IMPLEMENTASI CIRI ENERGI RATA RATA, CACAH
PERPOTONGAN PADA TITIK DAN RASIO PERIODE
KEHENINGAN PADA PENCARIAN FILE AUDIO


Yuni Arkhiansyah



ABSTRACT
Recently, the main focus in research and development are pointing to multimedia
data, including audio. The method used for indexing and retrieval of multimedia data is
known as MIRS (Multimedia Indexing and Retrieval System). MIRS differs from
traditional database management system since multimedia data has different
characteristics compared to alphanumeric data.
In this research a method for indexing and retrieval of audio file is developed and
evaluated. The number of samples of the data used in this research are varied, but the
sampling rate and the numer of bits per sample are the same. An audio file is represented
by a number of features extracted from the file and stored in the systems database. The
features used for this research are average enegy, zero crossing rate and silence ratio. The
three features are used for matching between query audio file and audio file in the
database either individually or simultaneously.
The experimental results show that the succes rate of this system to find audio
files depends on the feature used and the threshold used for measuring the similarity
between query audio and files in the database. By using Euclidean Distance, the average
energy gives 90% succes rate, the zero crossing rate gives 77% succes rate, the silence
ratio gives 90% succes rate and the combined feature gives 90% succes rate. This succes
rate percentage showed that the features used to recognize similarity between query audio
file and database audio file is appropriate.



Keyword : MIRS, average energy, zero crossing rate, silence ratio







Yuni Arkhiansyah.

64
Jurnal Informatika, Vol.7, No.1, Juni 2007
STMIK Darmajaya

1. PENDAHULUAN
Memasuki era informasi multimedia digital, diperlukan suatu cara untuk
menyimpan (indexing) dan temu kembali (retrieval) isi data multimedia, seperti data
audio, video, citra ataupun animasi. Contoh kasus yang berhubungan dengan penelitian
ini adalah jika kita mempunyai banyak lagu dalam bentuk digital, bagaimana kita dapat
mencari lagu tertentu yang kita lupa judul lagunya namun ingat penggalan lagunya saja?.
Permasalahan tersebut hanya dapat diselesaikan dengan menggunakan metode MIRS
(Multimedia Indexing and Retrieval System) dan bukan diselesaikan dengan
menggunakan metode DBMS (Database Management System) sebab DBMS mencari
suatu objek berdasarkan teksnya dan bukan isinya. Lu (1999) menyebutkan MIRS
merupakan sistem dasar yang menyediakan temu kembali informasi multimedia
menggunakan kombinasi antara DBMS (DataBase Management System), IR (Information
Retrieval) dan teknik temu kembali berdasarkan isi (Content-based retrieval technique).
Penelitian yang berkaitan dengan audio telah banyak dilakukan antara lain oleh
Liu dan Wan (2001) yang meneliti tentang klasifikasi audio menggunakan probabilistic
neural network dengan penghitungan Euclidean Distance. Penelitian penggolongan audio
berdasarkan efektifitas ciri Zero Crossing Rate dan penggambaran isi audio dilakukan
oleh Andersson (2004). Gouyoun, Pachet dan Delerue (2000) berhasil meneliti bahwa
manusia dapat membedakan sinyal audio bersuara banyak (polyphonic) dengan
menggunakan zero crossing. Panagiotakis dan Tziritas (2005) meneliti bahwa informasi
audio dapat disimpan dan dipanggil dari database dengan menggunakan RMS dan Zero
Crossing. Buggati, Flammini dan Migliorati (2002) berhasil membandingkan teknik Zero-
Crossing Rate digabungkan dengan Bayesian Classifier dan Neural Network Classifier
untuk membedakan musik dan suara.
Pada tulisan ini dikaji kinerja metode pengindeksan dan temu kembali
menggunakan ciri dari domain waktu yaitu ciri energi rata rata (average energy), cacah
perpotongan pada titik nol (zero crossing rate) dan rasio periode keheningan (silence
ratio). Temu kembali data audio didasarkan pada pencocokan potongan file audio query
dengan file audio basis data menggunakan euclidean distance untuk mengukur rasio
kemiripannya.

2. METODOLOGI PENELITIAN
File wav pada penelitian ini diperoleh dari proses perekaman kaset dan mp3
dengan sample rate 44100 dan bit per sample 16. Data penelitian adalah 30 file dengan
format wav dengan 10 file digunakan sebagai basis data dan 20 file yang lain digunakan
untuk query.
Untuk penelitian ini dirancang dan digunakan 2 sistem yaitu sistem untuk
menyimpan basis data (SPBD) dan sistem untuk melakukan pencarian (SPFA). Tahap
awal dari sistem pembuat basis data adalah melakukan normalisasi terhadap nilai sample
file wav, hal ini dilakukan untuk mengatasi perbedaan volume penggalan file wav query
dengan file wav basis data pada saat perekaman. Normalisasi dilakukan dengan
mengalikan setiap sample dengan nilai maksimal jangkauan bit tiap sample yang dibagi
dengan nilai sample terbesar.
Tahap berikutnya adalah melakukan ekstraksi terhadap file audio ternormalisasi,
sebelum diekstraksi semua file wav baik query atau basis data dipotong dahulu sepanjang
10 ms (Wang, Liu dan Huang, 2000) untuk diperoleh cirinya. Ekstraksi pertama
dilakukan dengan menggunakan energi rata rata (Average Energy) untuk diperoleh ciri
AE. Ciri AE adalah ciri yang digunakan untuk menyatakan nyaring atau tidaknya sinyal
audio. Ciri ini diperoleh dari persamaan sebagai berikut :
Yuni Arkhiansyah.

65
Jurnal Informatika, Vol.7, No.1, Juni 2007
STMIK Darmajaya

N
n x
E
N
n

=
=
1
0
2
) (
(1)
dengan E adalah energi rata rata dari potongan audio, x(n) menyatakan nilai dari sample
ke n sedangkan N merupakan jumlah total sample pada potongan audio.
Ciri yang kedua yaitu ciri cacah perpotongan pada titik nol (Zero Crossing Rate)
untuk diperoleh ciri ZCR. Ciri ZCR adalah ciri yang digunakan untuk menyatakan
frekuensi dari perubahan tanda sinyal amplitudo dari positif ke negatif. Persamaan yang
digunakan untuk menghitung cacah perpotongan pada titik nol adalah :
N
n x n x
ZC
N
n
2
| ) 1 ( sgn ) ( sgn |
1


=
(2)
dengan ZC adalah cacah perpotongan pada titik nol dari potongan audio, sgn x(n)
menyatakan tanda dari x(n), bernilai 1 jika x(n) adalah positif dan bernilai 1 jika x(n)
adalah negatif, sedangkan N merupakan jumlah total sampel dalam potongan audio.
Ciri ketiga adalah ciri rasio periode keheningan (Silence Ratio) untuk diperoleh
ciri SR. Ciri SR adalah bagian dari potongan audio dalam keadaan hening atau diam.
Persamaan yang digunakan untuk mengukur rasio periode keheningan adalah :
l
s
SR

=
(3)
dengan SR adalah rasio periode keheningan, s menyatakan periode keheningan dalam
potongan audio dan l menyatakan panjang potongan audio. Pada penelitian ini periode
keheningan dihitung dari nilai jangkauan 16 bit yaitu 2
16
= 65536 dibagi dengan 10 (Li
dan Drew, 2003). Sehingga semua nilai amplitudo <=6553 adalah periode keheningan.
Setelah proses ekstraksi, ciri ciri yang diperoleh kemudian disimpan di basis
data untuk digunakan sebagai pembanding oleh sistem pencarian file audio. Tahap awal
yang dilakukan SPFA adalah menormalisasi audio query. Untuk proses normalisasi sama
dengan proses normalisasi pada sistem pembuat basis data, kemudian audio query
ternormalisasi tersebut diekstraksi untuk diperoleh cirinya. Ciri ciri query ini yang
dicocokan dengan ciri di basis data. Pencocokan dibagi menjadi 2 yaitu pencocokan antar
ciri dan pencocokan gabungan. Untuk pengukuran kemiripan digunakan euclidean
distance (Gonzales dan Wood, 1993) dimana persamaannya :
2 / 1
2
,
2
]) , [ ] , [ ( ,

=

j i
j i T j i Q T Q
(4)
dengan ||Q,T|| adalah jarak atau rasio kemiripan antara audio query dengan audio basis
data, Q[i,j] menunjukkan baris ke i dan kolom ke j dalam index audio query dan T[i,j]
menunjukkan baris ke i dan kolom ke j dalam index audio basis data.

3. HASIL DAN PEMBAHASAN

Untuk mengetahui keberhasilan sistem maka dilakukan pengujian terhadap sistem dengan
ekstraksi dan pencocokan menggunakan ketiga ciri diatas secara individual serta secara
gabungan.
a. Ciri Energi Rata Rata
Pada pengujian ciri energi rata rata digunakan threshold sebesar 0.276
(Handayani,2006). Pengujian pertama menggunakan 10 file audio query yang diperoleh
Yuni Arkhiansyah.

66
Jurnal Informatika, Vol.7, No.1, Juni 2007
STMIK Darmajaya

dari 10 file audio basis data yang durasinya dipenggal sepanjang 10 detik dari posisi awal.
Hasil pengujian pada Tabel 1 dapat dikatakan, dengan menggunakan threshold 0.276
maka kesepuluh penggalan file audio query dapat ditemukan kemiripannya di basis data,
sehingga keberhasilan sistem adalah 100 % untuk audio query berdurasi 10 detik.
Rasio kemiripan berkisar antara angka 0 sampai 1, dengan kriteria rasio
kemiripan bila mendekati 0 maka ciri penggalan file audio query mirip dengan ciri file
audio basis data, rasio mendekati 1 maka ciri penggalan file audio query tidak mirip
dengan ciri file basis data, dengan ketentuan rasio kemiripan lebih kecil atau sama dengan
threshold.
Tabel 1. Hasil Pencocokan Audio Query Berdurasi 10 detik

File query Asereje mempunyai jarak kemiripan terdekat dengan file Asereje
basis data dibanding dengan file yang lain di basis data, proses pencarian dikatakan
berhasil apabila dalam pencocokkan ini perbedaan antara ciri query dengan ciri di
dalam basis data adalah lebih kecil (nilai ini merupakan nilai terkecil/minimum dari
keseluruhan jarak file di basis data) atau sama dengan dari nilai ambang (threshold)
tertentu maka ciri file audio yang dimaksud telah ditemukan kemiripannya. Selisih
0.12172 lebih kecil dari 0.276, sehingga ciri query tersebut ditemukan kemiripannya
di basis data.
Pengujian kedua menggunakan 10 file audio berdurasi 10 detik dengan volume
pada saat perekaman lebih kecil dari volume file audio basis data. Hasil pengujian seperti
terlihat pada Tabel 2.
Tabel 2. Hasil Pencocokan Audio Query Bervolume Lebih Rendah


Proses normalisasi sangat berguna untuk mengatasi permasalahan query dengan
volume lebih rendah atau tinggi. Dari Tabel 2 terlihat keberhasilan sistem dalam
mengenali kemiripan antara ciri query dengan ciri basis data sebesar 80% sebab terdapat
2 file query yaitu file Asereje dan Laksamana Raja di Laut oleh sistem cirinya dianggap
lebih mirip dengan ciri file kesepuluh yaitu file Yen Ing Tawang. Hal ini terjadi karena
jarak/rasio kemiripan antara ciri file query Asereje dengan ciri file Yen Ing Tawang di
No Judul Jumlah Sample Durasi Rasio Kemiripan
1. Asereje 2684989 10.00 Record ke 1: 0.12172
2. Betapa Ku Cinta Padamu 3015846 10.07 Record ke 2: 0.13117
3. Karena Cinta 3951930 10.04 Record ke 3: 0.14972
4. Laksamana Raja di Laut 4004359 10.06 Record ke 4: 0.03509
5. Mantra 2847096 10.01 Record ke 5: 0.07684
6. Perdamaian 3490074 10.00 Record ke 6: 0.00416
7. Petruk Dadi Ratu 2165667 10.05 Record ke 7: 0.04841
8. Singkong dan Keju 4100255 10.00 Record ke 8: 0.03474
9. Tombo Ati 2818785 10.00 Record ke 9: 0.08018
10. Yen Ing Tawang 3151676 10.06 Record ke 10: 0.04244
No Judul Jumlah Sample Durasi Rasio Kemiripan
1. Asereje 441080 10.00 Record ke 10: 0.20390
2. Betapa Ku Cinta Padamu 444316 10.07 Record ke 2: 0.25895
3. Karena Cinta 443111 10.04 Record ke 3: 0.20514
4. Laksamana Raja di Laut 443769 10.06 Record ke 10: 0.20054
5. Mantra 441727 10.01 Record ke 5: 0.17050
6. Perdamaian 441378 10.00 Record ke 6: 0.20810
7. Petruk Dadi Ratu 443298 10.05 Record ke 7: 0.24296
8. Singkong dan Keju 441390 10.00 Record ke 8: 0.21126
9. Tombo Ati 441009 10.00 Record ke 9: 0.21147
10. Yen Ing Tawang 443782 10.06 Record ke 10: 0.19647
Yuni Arkhiansyah.

67
Jurnal Informatika, Vol.7, No.1, Juni 2007
STMIK Darmajaya

basis data lebih kecil (0.20390) dari jarak ciri file query Asereje dengan ciri file Asereje
basis data (0.37422).
Pengujian ketiga menggunakan 10 file audio berdurasi 10 detik dengan volume
pada saat perekaman lebih tinggi dari volume file audio basis data. Hasil pengujian
seperti terlihat pada Tabel 3. Keberhasilan sistem mengenali kemiripan antara ciri query
dengan ciri basis data sebesar 90% sebab terdapat 1 file query yaitu file Asereje oleh
sistem cirinya dianggap lebih mirip dengan ciri file Yen Ing Tawang.


Tabel 3. Hasil Pencocokan Audio Query Bervolume Lebih Tinggi

No Judul Jumlah Sample Durasi Rasio Kemiripan
1. Asereje 441833 10.01 Record ke 10: 0.17952
2. Betapa Ku Cinta Padamu 442115 10.02 Record ke 2: 0.27518
3. Karena Cinta 441936 10.02 Record ke 3: 0.18211
4. Laksamana Raja di Laut 441007 10.00 Record ke 4: 0.18274
5. Mantra 442099 10.02 Record ke 5: 0.13027
6. Perdamaian 441031 10.00 Record ke 6: 0.23196
7. Petruk Dadi Ratu 441910 10.02 Record ke 7: 0.19558
8. Singkong dan Keju 441098 10.00 Record ke 8: 0.66764
9. Tombo Ati 441373 10.00 Record ke 9: 0.19853
10. Yen Ing Tawang 441121 10.00 Record ke 10: 0.18720

Dari tabel di atas sistem mengenali file query Asereje mirip dengan file Yen Ing
Tawang sebab jarak/rasio kemiripan antara ciri file query Asereje dengan ciri file Yen
Ing Tawang di basis data lebih kecil (0.17952) dari jarak ciri file query Asereje dengan
ciri file Asereje basis data (0.18705).

b. Ciri Cacah Perpotongan pada Titik Nol
Pada pengujian ciri cacah perpotongan pada titik nol digunakan threshold
sebesar 0.396 (Handayani,2006). Hasil pengujian pertama dapat diamati pada Tabel 4.
Keberhasilan sistem dalam melakukan proses pencocokan ciri cacah perpotongan pada
titik nol adalah 100 % untuk audio query berdurasi 10 detik.
Tabel 4. Hasil Pencocokan Audio Query Berdurasi 10 detik

No Judul Jumlah
Sample
Durasi Rasio Kemiripan
1. Asereje 441080 10.00 Record ke 1: 0.00000
2. Betapa Ku Cinta Padamu 444316 10.07 Record ke 2: 0.00000
3. Karena Cinta 443111 10.04 Record ke 3: 0.00000
4. Laksamana Raja di Laut 443769 10.06 Record ke 4: 0.00000
5. Mantra 441727 10.01 Record ke 5: 0.00000
6. Perdamaian 441378 10.00 Record ke 6: 0.00000
7. Petruk Dadi Ratu 443298 10.05 Record ke 7: 0.00000
8. Singkong dan Keju 441390 10.00 Record ke 8: 0.00000
9. Tombo Ati 441009 10.00 Record ke 9: 0.00000
10. Yen Ing Tawang 443782 10.06 Record ke 10: 0.00000

Dari tabel diatas, keberhasilan sistem melakukan pencarian menggunakan ciri cacah
perpotongan pada titik nol dan threshold sebesar 0.396 untuk audio query berdurasi 10
detik adalah 100%, sebab kesepuluh file query oleh sistem dapat dikenali sesuai dengan
file basis data dengan rasio kemiripan adalah 0.
Yuni Arkhiansyah.

68
Jurnal Informatika, Vol.7, No.1, Juni 2007
STMIK Darmajaya

Pengujian kedua menggunakan data yang sama dengan pengujian kedua pada ciri
energi rata rata yaitu 10 file audio berdurasi 10 detik dengan volume lebih rendah. Hasil
pengujian seperti terlihat pada Tabel 5.







Tabel 5. Hasil Pencocokan Audio Query Bervolume Lebih Rendah

No Judul Jumlah Sample Durasi Rasio Kemiripan
1. Asereje 441048 10.00 Record ke 1: 0.10009
2. Betapa Ku Cinta Padamu 441938 10.02 Record ke 2: 0.10490
3. Karena Cinta 441520 10.01 Record ke 2: 0.11079
4. Laksamana Raja di Laut 441078 10.00 Record ke 4: 0.28588
5. Mantra 441897 10.02 Record ke 5: 0.20041
6. Perdamaian 441300 10.00 Record ke 2: 0.22901
7. Petruk Dadi Ratu 442138 10.02 Record ke 7: 0.31111
8. Singkong dan Keju 441225 10.00 Record ke 2: 0.10546
9. Tombo Ati 441212 10.00 Record ke 9: 0.11284
10. Yen Ing Tawang 441167 10.00 Record ke 10: 0.38571

Keberhasilan sistem dalam melakukan pencarian adalah 70%, sebab terdapat 3
ciri file query yaitu ciri file Karena Cinta, Perdamaian serta Singkong dan Keju oleh
sistem dikatakan lebih mirip dengan ciri file Betapa Ku Cinta Padamu. Hal ini terjadi
karena rasio kemiripan antara ciri penggalan file Karena Cinta query, Perdamaian,
Singkong dan Keju dengan ciri file Betapa Ku Cinta Padamu di basis data lebih kecil dari
rasio kemiripan antara ciri file query Karena Cinta, Perdamaian, Singkong dan Keju
dengan file Karena Cinta, Perdamaian, Singkong dan Keju di basis data.
Pengujian ketiga menggunakan 10 file audio berdurasi 10 detik dengan volume
lebih tinggi dari volume file audio basis data. Hasil pengujian terlihat pada Tabel 6.
Tabel 6. Hasil Pencocokan Audio Query Bervolume Lebih Tinggi

No Judul Jumlah Sample Durasi Rasio Kemiripan
1. Asereje 441833 10.01 Record ke 2: 0.10482
2. Betapa Ku Cinta Padamu 442115 10.02 Record ke 2: 0.09245
3. Karena Cinta 441936 10.02 Record ke 9: 0.11012
4. Laksamana Raja di Laut 441007 10.00 Record ke 4: 0.26783
5. Mantra 442099 10.02 Record ke 5: 0.17973
6. Perdamaian 441344 10.00 Record ke 9: 0.27891
7. Petruk Dadi Ratu 441910 10.02 Record ke 7: 0.26317
8. Singkong dan Keju 441098 10.00 Record ke 2: 0.10892
9. Tombo Ati 441373 10.00 Record ke 9: 0.10540
10. Yen Ing Tawang 441121 10.00 Record ke 10: 0.39527

Keberhasilan sistem dalam melakukan pencarian dengan threshold sebesar 0.396
untuk audio query bervolume lebih tinggi adalah 60%, sebab terdapat 4 ciri file query
yaitu ciri file Asereje dan Singkong dan Keju oleh sistem dikatakan lebih mirip dengan
ciri file Betapa Ku Cinta Padamu, sedangkan ciri file Karena Cinta dan Perdamaian lebih
mirip cirinya dengan ciri file Tombo Ati.
c. Ciri Rasio Periode Keheningan
Yuni Arkhiansyah.

69
Jurnal Informatika, Vol.7, No.1, Juni 2007
STMIK Darmajaya

Pengujian ciri rasio periode keheningan digunakan threshold sebesar 0.454
(Handayani,2006). Hasil pengujian pertama dapat diamati pada Tabel 7. Keberhasilan
sistem dalam melakukan proses pencocokan untuk ciri rasio periode keheningan adalah
100 % untuk audio query berdurasi 10 detik.







Tabel 7. Hasil Pencocokan Audio Query Berdurasi 10 detik

No Judul Jumlah Sample Durasi Rasio Kemiripan
1. Asereje 441080 10.00 Record ke 1: 0.26553
2. Betapa Ku Cinta Padamu 444316 10.07 Record ke 2: 0.25400
3. Karena Cinta 443111 10.04 Record ke 3: 0.26649
4. Laksamana Raja di Laut 443769 10.06 Record ke 4: 0.05010
5. Mantra 441727 10.01 Record ke 5: 0.12510
6. Perdamaian 441378 10.00 Record ke 6: 0.00615
7. Petruk Dadi Ratu 443298 10.05 Record ke 7: 0.09982
8. Singkong dan Keju 441390 10.00 Record ke 8: 0.04726
9. Tombo Ati 441009 10.00 Record ke 8: 0.04726
10. Yen Ing Tawang 443782 10.06 Record ke 10: 0.10149

Dari kesepuluh file query ditemukan kemiripannya sesuai dengan file basis data
sebab rasio kemiripan kesepuluh file tersebut lebih kecil dari threshold yaitu 0.454.
Pengujian yang kedua untuk ciri rasio periode keheningan adalah menggunakan
10 file audio berdurasi 10 detik dengan volume lebih rendah. Hasil pengujian seperti
terlihat pada Tabel 8.
Tabel 8. Hasil Pencocokan Audio Query Bervolume Lebih Rendah

No Judul Jumlah Sample Durasi Rasio Kemiripan
1. Asereje 441048 10.00 Record ke 1: 0.37422
2. Betapa Ku Cinta Padamu 441938 10.02 Record ke 2: 0.45316
3. Karena Cinta 441520 10.01 Record ke 3: 0.35875
4. Laksamana Raja di Laut 441078 10.00 Record ke 5: 0.30959
5. Mantra 441897 10.02 Record ke 5: 0.29592
6. Perdamaian 441433 10.00 Record ke 6: 0.27731
7. Petruk Dadi Ratu 442138 10.02 Record ke 7: 0.37168
8. Singkong dan Keju 441225 10.00 Record ke 8: 0.32579
9. Tombo Ati 441212 10.00 Record ke 9: 0.40869
10. Yen Ing Tawang 441167 10.00 Record ke 10: 0.38707

Dari tabel 8, keberhasilan sistem untuk melakukan pencarian audio query dengan
threshold 0.454 dan ciri rasio periode keheningan adalah sebesar 90% sebab terdapat 1
ciri file query yaitu ciri file Laksamana Raja di Laut oleh sistem dikatakan lebih mirip
dengan ciri file Mantra.
Pengujian ketiga menggunakan file audio berdurasi 10 detik bervolume lebih
tinggi dari volume file audio basis data. Hasil pengujian seperti pada Tabel 9.


Tabel 9. Hasil Pencocokan Audio Query Bervolume Lebih Tinggi

Yuni Arkhiansyah.

70
Jurnal Informatika, Vol.7, No.1, Juni 2007
STMIK Darmajaya

No Judul Jumlah Sample Durasi Rasio Kemiripan
1. Asereje 441833 10.01 Record ke 1: 0.33451
2. Betapa Ku Cinta Padamu 442115 10.02 Tidak ditemukan kemiripan
3. Karena Cinta 441936 10.02 Record ke 3: 0.35880
4. Laksamana Raja di Laut 441007 10.00 Record ke 4: 0.26296
5. Mantra 442099 10.02 Record ke 5: 0.23970
6. Perdamaian 441031 10.00 Record ke 6: 0.29971
7. Petruk Dadi Ratu 441910 10.02 Record ke 7: 0.31487
8. Singkong dan Keju 441098 10.00 Tidak ditemukan kemiripan
9. Tombo Ati 441373 10.00 Record ke 9: 0.37231
10. Yen Ing Tawang 441121 10.00 Record ke 10: 0.36394
Keberhasilan sistem mencocokan ciri rasio periode keheningan antara ciri
potongan file query berdurasi 10 detik dan bervolume lebih tinggi dengan ciri file basis
data adalah 80% sebab dari kesepuluh file query tersebut dengan menggunakan threshold
0.454, terdapat 2 ciri file query, yaitu Betapa Ku Cinta Padamu dan Singkong dan Keju
yang dianggap tidak mirip dengan ciri file lain di basis data sebab rasio kemiripan lebih
tinggi dari threshold yang telah ditetapkan sehingga sistem menganggap kedua ciri file
tersebut tidak mirip dengan ciri file manapun di basis data.
d. Ciri Gabungan
Pada pengujian ciri gabungan (penggabungan ciri energi rata rata, cacah
perpotongan pada titik nol dan rasio periode keheningan) digunakan threshold sebesar
0.276 (Handayani,2006). Pengujian pertama menggunakan 10 file audio query yang
diperoleh dari 10 file audio di basis data yang durasinya dipenggal sepanjang 10 detik
dari posisi awal. Hasil pengujian dapat diamati pada Tabel 10.
Pada tabel dibawah ini dapat dikatakan dengan menggunakan threshold 0.276
maka kesepuluh penggalan file audio query dapat ditemukan kemiripannya di basis data,
sehingga keberhasilan sistem adalah 100 % untuk audio query berdurasi 10 detik.
Tabel 10. Hasil Pencocokan Audio Query Berdurasi 10 detik

Pada tabel tersebut dapat dikatakan dengan menggunakan threshold 0.276 maka
kesepuluh penggalan file audio query dapat ditemukan kemiripannya di basis data,
sehingga keberhasilan sistem adalah 100 % untuk audio query berdurasi 10 detik.
Pengujian kedua menggunakan 10 file audio berdurasi 10 detik dengan volume
lebih kecil dari volume file audio basis data. Hasil pengujian terlihat pada Tabel 11.
Tabel 11. Hasil Pencocokan Audio Query Bervolume Lebih Rendah

No Judul Jumlah Sample Durasi Rasio Kemiripan
1. Asereje 2684989 10.00 Record ke 1: 0.12172
2. Betapa Ku Cinta Padamu 3015846 10.07 Record ke 2: 0.13117
3. Karena Cinta 3951930 10.04 Record ke 3: 0.14972
4. Laksamana Raja di Laut 4004359 10.06 Record ke 4: 0.03509
5. Mantra 2847096 10.01 Record ke 5: 0.07684
6. Perdamaian 3490074 10.00 Record ke 6: 0.00416
7. Petruk Dadi Ratu 2165667 10.05 Record ke 7: 0.04841
8. Singkong dan Keju 4100255 10.00 Record ke 8: 0.03474
9. Tombo Ati 2818785 10.00 Record ke 9: 0.08018
10. Yen Ing Tawang 3151676 10.06 Record ke 10: 0.04244
Yuni Arkhiansyah.

71
Jurnal Informatika, Vol.7, No.1, Juni 2007
STMIK Darmajaya


Proses normalisasi sangat berguna untuk mengatasi permasalahan query dengan
volume lebih rendah atau tinggi. Dari Tabel 11 terlihat keberhasilan sistem dalam
mengenali kemiripan antara ciri query dengan ciri basis data sebesar 80% sebab terdapat
2 file query yaitu file Asereje dan Laksamana Raja di Laut oleh sistem cirinya dianggap
lebih mirip dengan ciri file kesepuluh yaitu file Yen Ing Tawang.
Pengujian ketiga menggunakan 10 file audio berdurasi 10 detik dengan volume
pada saat perekaman lebih tinggi dari volume file audio basis data. Hasil pengujian
seperti terlihat pada Tabel 12.
Tabel 12. Hasil Pencocokan Audio Query Bervolume Lebih Tinggi

No Judul Jumlah Sample Durasi Rasio Kemiripan
1. Asereje 441833 10.01 Record ke 10: 0.17952
2. Betapa Ku Cinta Padamu 442115 10.02 Record ke 2: 0.27518
3. Karena Cinta 441936 10.02 Record ke 3: 0.18211
4. Laksamana Raja di Laut 441007 10.00 Record ke 4: 0.18274
5. Mantra 442099 10.02 Record ke 5: 0.13027
6. Perdamaian 441031 10.00 Record ke 6: 0.23196
7. Petruk Dadi Ratu 441910 10.02 Record ke 7: 0.19558
8. Singkong dan Keju 441098 10.00 Record ke 8: 0.66764
9. Tombo Ati 441373 10.00 Record ke 9: 0.19853
10. Yen Ing Tawang 441121 10.00 Record ke 10: 0.18720

Pada Tabel 12 terlihat keberhasilan sistem mengenali kemiripan antara ciri query
dengan ciri basis data sebesar 90% sebab terdapat 1 file query yaitu file Asereje oleh
sistem cirinya dianggap lebih mirip dengan ciri file Yen Ing Tawang.
Dari hasil pengujian pengujian yang terlihat pada tabel tabel diatas maka
keberhasilan sistem dalam mengenali kemiripan antara penggalan file audio dengan audio
basis data ditunjukkan pada Tabel 13.
Tabel 13. Prosentase Rata Rata Keberhasilan Sistem
Ciri Pengujian - pengujian Prosentase
Keberhasilan
Energi rata - rata 100% 80% 90% 90%
Cacah perpotongan pada titik nol 100% 70% 60% 77%
Rasio periode keheningan 100% 90% 80% 90%
Gabungan 100% 80% 90% 90%
Nilai prosentase keberhasilan ini menggambarkan bahwa pemilihan ciri ciri
yang digunakan untuk mengenali kemiripan antara file wav query dengan file wav di
basis data relatif baik.

4. KESIMPULAN DAN SARAN
No Judul Jumlah Sample Durasi Rasio Kemiripan
1. Asereje 441080 10.00 Record ke 10: 0.20390
2. Betapa Ku Cinta Padamu 444316 10.07 Record ke 2: 0.25895
3. Karena Cinta 443111 10.04 Record ke 3: 0.20514
4. Laksamana Raja di Laut 443769 10.06 Record ke 10: 0.20054
5. Mantra 441727 10.01 Record ke 5: 0.17050
6. Perdamaian 441378 10.00 Record ke 6: 0.20810
7. Petruk Dadi Ratu 443298 10.05 Record ke 7: 0.24296
8. Singkong dan Keju 441390 10.00 Record ke 8: 0.21126
9. Tombo Ati 441009 10.00 Record ke 9: 0.21147
10. Yen Ing Tawang 443782 10.06 Record ke 10: 0.19647
Yuni Arkhiansyah.

72
Jurnal Informatika, Vol.7, No.1, Juni 2007
STMIK Darmajaya

Dari hasil penelitian yang telah dilakukan dapat disimpulkan bahwa untuk file
wav query yang dipenggal sepanjang 10 detik dari posisi awal, file query bervolume lebih
rendah dan bervolume lebih tinggi, sistem telah dapat mengenali kemiripan ciri query
dengan prosentase yang berbeda beda tergantung pada ciri yang digunakan. Untuk ciri
energi rata rata dan ciri gabungan dengan threshold sebesar 0.276, keberhasilan rata
rata sistem mengenali kemiripan adalah 90%, untuk ciri cacah perpotongan pada titik nol
dengan threshold sebesar 0.396 adalah 77% dan rasio periode keheningan dengan
threshold 0.454 adalah 90%.
Dari hasil penelitian ini masih perlu dikaji lebih lanjut menggunakan audio query
yang dipenggal tidak terbatas pada awal file audio saja, selain itu diperlukannya
media/alat rekam yang benar benar menjamin kualitas suara sehingga keberhasilan
pencarian menggunakan normalisasi sample data menjadi optimal.

Yuni Arkhiansyah.

73
Jurnal Informatika, Vol.7, No.1, Juni 2007
STMIK Darmajaya

DAFTAR PUSTAKA
Andersson, T, 2004, Audio Classification and Content Description, thesis, Department
of Computer Science and Engineering Division of Signal Processing.

Buggati. A, Flammini, A dan Migliorati, Pierangelo, 2002, Audio Classification in
Speech and Music: A Comparison Between A Statistical and Neural Approach,
EURASIP journal on Applied Signal Processing.

Craig, 2003, WAVE PCM Soundfile Format, http://ccrma.stanford.edu, diakses tanggal
8 Agustus 2005.

Gonzales, R.C., Woods, R.E, 1993, Digital Image Processing, Addison-Wesley
Publishing Company, USA.

Gouyoun. F, Pachet. F dan Delerue, Olivier, 2000, On The Use of Zero Crossing Rate
For An Application of Classification of Percussion Sound, Audio Visual Institut,
Fabra University Barcelona dan Sony Computer Laboratory, Paris.

Handayani, M.R., 2006, Pencarian File Audio Berdasar Energi Rata Rata, Cacah
Perpotongan pada Titik Nol dan Rasio Periode Keheningan, Tesis Master,
Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Gadjah Mada,
Yogyakarta.

Li dan Drew, 2003, Fundamentals of Multimedia, Prentice Hall.

Liu, Mingchun dan Wan, Chunru, 2001, A Study on Content-Based Classification and
Retrievalof Audio Database, Nanyang Technological University School of
Electronic Engineering Nanyang Avenue, Singapore.

Lu, G., 1999, Multimedia Database Management Systems, Artech House, Boston
London.

Panagiotakis, C dan Tziritas, G, 2005 A Speech/Music Discriminator Based on RMS
and Zero Crossing , Department of Computer Science, University of Crete,
Greece. (www.csd.uch.gr/) diakses tanggal 9 Juli 2005.

Wang. Y, Liu. Z dan Huang, Jin Cheng, 2000, Multimedia Content Analysis Using Both
Audio and Visual Clues, IEEE Signal Processing Magazine.

You might also like