Professional Documents
Culture Documents
Kesahan Dan Kebolehpercayaan
Kesahan Dan Kebolehpercayaan
Kesahan Dan Kebolehpercayaan
Konsep kesahan adalah satu konsep penting yang mesti difahami apabila kita ingin membina
sesuatu ujian. Ujian merupakan satu alat (instrumen) yang kita gunakan untuk membuat inferens
Kesahan sesuatu alat kajian dipengaruhi oleh jenis pemboleh ubah. Sekiranya sesuatu
pemboleh ubah berbentuk fizikal atau kuantitatif, kita boleh menentukan kesahan alat pengukur bagi
pemboleh ubah tersebut dengan mudah. Contoh pemboleh ubah kuantitatif adalah seperti ketinggian,
panjang dan luas sebuah bilik darjah. Kita boleh menggunakan pembaris untuk mengukur ketinggian,
panjang dan luas sebuah bilik darjah. kita boleh menggunakan timbang untuk menyukat berat
seseorang pelajar. Bagaimanapun, sekiranya pemboleh ubah berbentuk konstruk dan konsep atau
berbentuk kualitatif, kita akan mengalami kesukaran untuk menentukan kesahan alat ukur yang akan
Kesahan bergantung kepada tujuan dan masa sesuatu alat ukur dibina. Kesahan sesuatu alat
ukur akan berubah sekiranya tujuan alat ukur tersebut dibina dan masa alat ukur tersebut digunakan
berubah. Untuk menentukan kesahan sesuatu ujian yang dibina, pembina mestilah memahami apa
yang hendak diukur. Pembina hendaklah menetapkan apa yang hendak diukur sebelum menentukan
bagaimana sesuatu pengukuran itu harus dibuat. Pembina seharusnya menentukan apakah trait (ciri-
ciri atau kemahiran) yang hendak diukur itu, di samping dapat mengenal pasti apakah trait yang bukan
hendak diukur, kemudian barulah ujian (memilih item daripada bank item) dipasang untuk
mengukurnya.
Menurut Bhasah Abu Bakar (2003), alat ukur yang mempunyai kesahan yang tinggi bagi
mengukur sikap pelajar Tingkatan 5 terhadap mata pelajaran perdagangan akan berubah kesahannya
sekiranya alat tersebut digunakan untuk mengukur sikap pelajar Tingkatan 5 terhadap mata pelajaran
sejarah. Kesahan pada amnya kerap merujuk kepada takat di mana sesuatu ujian itu mengukur apa
yang seharusnya diukur berdasarkan definisi yang telah ditetapkan oleh pembina. Secara khususnya,
kesahan ujian adalah berkenaan dengan kesesuaian rujukan yang dibuat berdasarkan kepada keputusan
ujian berkenaan. Kesahan sesuatu alat pengukuran boleh dilihat dari tiga aspek utama. Ketiga-tiga
aspek kesahan ini ialah kesahan kandungan, kesahan kriteria dan kesahan konstruk.
JENIS-JENIS KESAHAN
Merujuk buku Kaedah Penyelidikan Pendidikan oleh Mohd. Majid Konting (2000), terdapat tiga jenis
1) KESAHAN KANDUNGAN
Kesahan kandungan sesuatu alat pengukuran merujuk kepada sejauh mana alat itu mengumpul
data yang merangkumi kandungan sesuatu bidang yang dikaji. Sesuatu alat pengukuran dikatakan
mempunyai kesahan kandungan yang tinggi sekiranya alat tersebut dapat mengukur semua isi serta
kandungan bidang yang dikaji dengan berkesan. Sekiranya alat pengukuran tidak dapat mengukur
semua isi sesuatu bidang, maka alat tersebut tidak mempunyai kesahan kandungan yang tinggi.
Matlamat utama kesahan kandungan sesuatu alat ukur ialah untuk memastikan semua isi dan
kandungan bidang yang dikaji diukur bagi menggambarkan bidang berkenaan. Walaupun matlamat
utama kesahan kandungan sesuatu alat kajian adalah untuk menentukan pengukuran ke atas semua
kandungan sesuatu bidang yang dikaji, kesukaran sering berlaku disebabkan isi dan kandungan yang
luas dalam bidang berkenaan. Bagi mengatasi masalah kandungan yang luas, penyelidik pendidikan
biasanya menggunakan teknik pensampelan bagi mendapatkan isi dan kandungan yang boleh
digunakan bagi mewakili isi dan kandungan bidang yang dikaji. Penyelidik perlu memastikan prinsip
Kesahan kandungan sesuatu alat ukur bergantung kepada skop dan objektif bidang yang dikaji.
Kesahan kandungan sesuatu alat ukur dikatakan sesuai sekiranya data atau maklumat yang dikutip
menunjukkan liputan menyeluruh sesuatu pencapaian atau penguasaan terhadap sesuatu bidang atau
kemahiran tertentu yang dikaji. Alat ujian matematik tingkatan 2 dikatakan mempunyai kesahan
kandungan yang sesuai sekiranya markah-markah yang didapati oleh pelajar yang diuji adalah hasil
pencapaian atau penguasaan mereka daripada keseluruhan kandungan sukatan mata pelajaran
matematik tingkatan 2.
kandungan sesuatu bidang. Penyenaraian ini boleh dilakukan dengan menggunakan Jadual Penentuan.
Dengan menggunakan Jadual Penentuan, kandungan atau domain-domain yang hendak dikaji
disenaraikan secara terperinci. Dari senarai kandungan atau domain tersebut, pensampelan boleh
Bagi meningkatkan kesahan kandungan sesuatu alat ukur, penyelidik disyorkan untuk
mendapatkan penilai luar. Penilai luar bertugas sebagai penilai bagi memastikan domain-domain yang
terkandung dalam alat ukur mewakili bidang yang dikaji. Penilai luar biasanya terdiri daripada pakar-
pakar bidang yang berkaitan dengan bidang yang dikaji oleh penyelidik.
2) KESAHAN KRITERIA
Kesahan kriteria bagi sesuatu alat kajian merujuk kepada sejauh mana kaitan antara butir-butir
dalam alat kajian dengan kriteria luaran yang berkecuali. Kesahan kriteria mempersoalkan sama ada
butir-butir alat kajian sah mengukur kriteria yang hendak diukur. Sekiranya kriteria luaran yang
berkecuali sebenarnya sah bagi mengukur kriteria yang hendak diukur, maka kaitan yang bererti antara
butir-butir dalam alat kajian dengan kriteria luaran tersebut akan menunjukkan kesahan kriteria
Kriteria yang hendak diukur adalah kriteria yang tekal sebagaimana ditunjukkan oleh subjek di
luar pengukuran. Kriteria yang dipilih mestilah kriteria yang benar-benar mewakili dengan tepat
domain yang diukur. Kesahan kriteria menekankan kepada perbandingan suatu skala markah dengan
pemboleh ubah luaran atau kriteria yang diketahui atau dipercayai mengukur sifat yang dikaji. Oleh
itu, kriteria luaran mestilah dikenal pasti dan ditentukan kesahannya bagi mengukur sesuatu gagasan
Kriteria yang digunakan bagi menentukan kesahan kriteria biasanya terdiri daripada dua jenis
Kriteria serentak ialah kriteria yang ditunjukkan pada masa yang sama atau hampir sama
dengan pengukuran yang dikenakan ke atas kriteria tersebut. Alat kajian bagi mengukur kebolehan
bermain muzik dikatakan mempunyai kesahan kriteria serentak yang tinggi sekiranya seseorang
pelajar yang mencapai kebolehan cemerlang dalam ujian tersebut juga pada masa itu boleh
b) Kriteria jangkaan
Kriteria jangkaan adalah kriteria yang ditunjukkan pada selang masa yang berbeza selepas
pengukuran dikenakan ke atas kriteria tersebut. Kesahan kriteria jangkaan alat kajian bagi mengukur
kebolehan bermain muzik dikatakan rendah apabila seseorang pelajar yang mencapai kebolehan yang
tinggi dalam ujian tersebut tidak dapat menunjukkan kebolehannya bermain muzik dengan baik
apabila beliau mengadakan konsert bermain muzik beberapa bulan selepas ujian tersebut diadakan.
Kesahan kriteria jangkaan membawa pertanyaan: Bolehkah ujian berkenaan menjangkakan prestasi
masa hadapan sama ada berjaya atau gagal dalam sesuatu kursus?
Contoh: Andaikan semua pelajar yang ingin memasuki IPTA/IPTS dimestikan mengambil peperiksaan
pemilihan ke IPTA/IPTS (jangkaan). Kriterianya ialah PNGK semester akhir. Oleh itu hitungkan skor
korelasi peperiksaan pemilihan ke IPTA/IPTS dengan skor di semester akhir IPTA/IPTS. Jika nilai
korelasinya tinggi, ini melambangkan kesahan ramalannya adalah tinggi (Bhasah Abu Bakar, 2000).
Menurut Bhasah Abu Bakar (2003), terdapat empat faktor-faktor yang mempengaruhi pekali kesahan
kriteria iaitu:
Tempoh masa lama akan mengurangkan kesahan ujian kerana kesan peluang akan
ramai agar attrition yang berlaku kemudiannya tidak akan mengganggu pekali kesahan.
b) Kesan pemilihan
Pemilihan yang tertumpu kepada sesuatu kumpulan pelajar cemerlang atau yang lemah
c) Kesan kebolehpercayaan
Peningkatan kesahan akan terjadi sekiranya item yang ditambah adalah bersamaan
3) KESAHAN KONSTRUK
Konstruk adalah satu konsep yang tidak boleh diukur secara terus atau diukur tanpa ralat,
tetapi diukur menggunakan penunjuk (Joseph F. Hair et. al, 1992). Sebagai contoh: Kesediaan
membaca adalah konstruk yang terbentuk daripada kombinasi beberapa konsep seperti ketajaman
Menurut Cronbach dan Quirk, konstruk merujuk kepada proses dalaman atau postulasi
sifat/ciri manusia yang ditunjukkan daripada prestasi ujian (Cronbach & Meehl, 1995). Menurut
Cronbach (1984) lagi, konstruk ialah satu konsep teori yang diterbitkan daripada penyelidikan dan
pengalaman lain yang dibina untuk menjelaskan satu bentuk perlakuan yang dilihat. Matlamat utama
mewujudkan konsep konstruk dalam bidang pendidikan ialah untuk menyatakan kuantitinya pada satu
skala dengan angka sepadan dengan banyaknya trait yang dipunyai oleh seseorang individu. Satu skor
boleh didapati dengan mencampurkan nilai trait berkenaan di sepanjang respons. Skor ini bertujuan
untuk mencerminkan amaun konstruk dipunyai oleh seseorang individu. Maka matlamat bukti
berkaitan konstruk bagi kesahan ialah menentukan darjah bagi skor sesuatu instrumen itu adalah
Sebagai contoh dalam kesahan kontruk ialah seperti motivasi. Untuk mengukur kewujudan
motivasi dalam pencapaian akademik seseorang pelajar, kita mestilah faham dan jelas tentang definisi
motivasi dalam pencapaian akademik. kita hendaklah faham apakah yang dimaksudkan dengan
motivasi dalam pencapaian akademik. Apakah teori-teori yang ada yang dapat menghuraikan tentang
motivasi. Apakah dia ciri-ciri motivasi. Bagaimanakah bentuk seseorang itu yang dikatakan
mempunyai motivasi dalam akademik? Bagaimana pula halnya bagi mereka yang tidak bermotivasi?
Justeru itu untuk memastikan sama ada seseorang pelajar itu mempunyai motivasi untuk pencapaian
akademik, kita bina instrumen (ujian) berdasarkan teori pencapaian akademik tadi. Kemudian kita
tadbirkan instrumen (ujian) berkenaan dan dapatkan data. Berdasarkan data yang dikumpulkan, skor
yang diperoleh akan menjelaskan sesuatu yang bermakna tentang pelajar tadi berkait dengan motivasi
pencapaian akademiknya.
Menurut Bhasah Abu Bakar (2003), terdapat beberapa faktor yang mempengaruhi kesahan iaitu:
Sesuatu ujian itu dikatakan boleh dipercayai sekiranya ujian itu dapat mengukur sesuatu apa
yang hendak diukur dengan tekal. Ini bermakna, sesuatu individu itu akan mendapat skor yang sama
daripada sesuatu ujian seandainya kebolehan individu itu adalah tekal atau trait yang hendak diukur itu
Pekali kebolehpercayaan boleh didefinisikan sebagai korelasi antara skor dalam ujian selari. Ia
mengukur tahap persamaan antara ujian, manakala indeks kebolehpercayaan mengukur darjah
ditakrifkan sebagai nisbah varian skor sebenar kepada varian skor cerapan. Pengukuran
kebolehpercayaan merujuk kepada takat variasi skor individu ke atas beberapa ciri ujian selari.
Pengukuran ralat piawai dan pekali kebolehpercayaan kedua-duanya memberi huraian kepada darjah
kebolehpercayaan.
yang diperoleh dengan skor sebenar bagi sesuatu pengukuran. Maka pekali kebolehpercayaan
menunjukkan perkadaran keberubahan bagi satu set skor yang menggambarkan perbezaan sebenar
antara individu. Oleh itu pekali kebolehpercayaan 0.90 mempunyai ralat pengukuran yang lebih tinggi
dan adalah lebih boleh dipercayai daripada ujian yang mempunyai pekali kebolehpercayaan 0.60.
Terdapat pelbagai kaedah untuk menentukan pekali kebolehpercayaan sesuatu ujian. Kaedah
penentuan pekali kebolehpercayaan ujian adalah bergantung kepada apakah generalisasi yang hendak
dibuat. Sama ada pekali kebolehpercayaan itu hendak digeneralisasikan kepada a) masa yang
berlainan b) sampel item atau ujian yang berlainan atau c) pemeriksa yang berlainan.
Pentadbiran Dua Ujian
Kaedah ini memerlukan penguji membina dua bentuk ujian yang sama untuk menguji
perlakuan atau konstruk yang sama dan mentadbirkan ujian berkenaan kepada kumpulan pelajar yang
sama juga. kedua-dua bentuk ini hendaklah ditadbirkan dalam tempoh yang terdekat antara Bentuk A
dan Bentuk B. Tempoh masa hanya setakat mengelakkan pelajar daripada keletihan menjawab
kedua0dua ujian. Kumpulan berkenaan dibahagikan secara rawak kepada dua kumpulan Kumpulan
1 dan Kumpulan 2. Mula-mula Kumpulan 1 ambil Ujian A dan Kumpulan 2 ambil Ujian B. Sebaik
sahaja ujian tamat, mereka diberikan masa untuk berehat dan kemudian ujian diteruskan dengan
Kumpulan 1 menjawab Ujian B dan Kumpulan 2 menjawab Ujian A. Pekali korelasi dihitung untuk
skor bagi kedua-dua ujian berkenaan menggunakan formula Pearson Product Moment. Lebih tinggi
pekali persamaan, maka lebih tinggilah kebolehpercayaan penggunaan ujian skor daripada bentuk
ujian berlainan bentuk itu boleh digunakan bertukar ganti. Anggaran kebolehpercayaan yang minimum
Kaedah uji dan uji kembali merupakan kaedah bagi mendapatkan dua set kesahan dengan
mentadbir alat ukur yang sama ke atas subjek yang sama sebanyak dua kali. kesahan yang didapati
daripada pengukuran pertama dan pengukuran kedua dikorelasikan. Pekali korelasi yang terhasil
merupakan indeks kebolehpercayaan. Sekiranya pekali korelasi yang didapati positif dan teguh, maka
Kaedah uji dan uji kembali terdedah kepada perubahan disebabkan oleh faktor sistematik dan
faktor tidak sistematik. Apakah perubahan yang disebabkan oleh faktor sistematik? Oleh kerana alat
ukur yang sama ditadbir sebanyak dua kali ke atas subjek yang sama tetapi pada waktu yang berlainan,
maka perubahan sistematik yang berlaku adalah disebabkan oleh kematangan subjek dan alat ukur.
Subjek semakin matang pada pengukuran kedua berbanding dengan pada pengukuran
pertama. Bagaimanapun, faktor sistematik tidak mempengaruhi paras kebolehpercayaan sesuatu alat
ukur. Operasi atau pengurusan alat ukur pada kali pertama dan kali kedua dalam kaedah uji dan uji
kembali mungkin menghasilkan faktor tidak sistematik yang boleh mempengaruhi kebolehpercayaan.
Oleh itu, kita perlu mengadakan pengurusan alat ukur yang piawai, serupa dan terkawal bagi
mencegah kesan faktor tidak sistematik. Kita perlu menghalang perubahan disebabkan sikap, minat,
kecergasan fizikal dan kestabilan emosi subjek. Kita juga perlu mengadakan tugasan yang piawai pada
kedua-dua pengukuran serta mengadakan pengukuran terhadap lebih banyak pensampelan tingkah
laku.
Dua set kesahan yang boleh digunakan untuk mendapatkan indeks kebolehpercayaan boleh
juga didapati dengan menggunakan kaedah bentuk setara. Kaedah bentuk setara menggunakan satu
alat ukur yang dibina dan satu alat ukur yang piawai. Kedua-dua alat ukur tersebut adalah setara dari
segi kandungannya tetapi mungkin berbeza dari segi penyampaian. Kedua-dua alat ukur ditadbir ke
atas subjek yang sama dan pada masa yang sama. Kesahan yang didapati daripada pengukuran dengan
menggunakan kedua-dua alat ukur tersebut dikorelasikan. Pekali korelasi yang positif dan teguh
menunjukkan indeks kebolehpercayaan yang tinggi bagi alat ukur yang dibina.
Kaedah bentuk setara boleh mengatasi masalah pensampelan tugasan yang terhad
sebagaimana yang dialami dengan penggunaan kaedah berbahagi dua. Oleh itu kerana kita
menggunakan dua set alat ukur dan satu daripadanya adalah alat ukur piawai, kita dapat memastikan
liputan yang menyeluruh terhadap kandungan atau domain yang dikaji. Bagaimanapun, kaedah bentuk
setara jarang digunakan bagi mendapatkan dua set kesahan. Kekurangan penggunaan kaedah ini
adalah disebabkan kaedah bentuk setara memerlukan dua alat ukur yang mengandungi paras
kesukaran dan kandungan yang setara. Masa yang banyak juga diperlukan untuk mentadbir dua alat
Kaedah yang sering digunakan bagi mendapatkan dua set kesahan ialah kaedah bahagi dua.
Kaedah ini memerlukan satu alat ukur yang mengandungi beberapa butir ditadbirkan hanya sekali ke
atas subjek. Gerak balas pada butir-butir bernombor ganjil diasingkan dari gerak balas pada butir-butir
bernombor genap. Dua set kesahan yang didapati daripada gerak balas pada butir-butir bernombor
ganjil dan gerak balas yang didapati daripada butir-butir bernombor genap dikorelasikan. Pekali
korelasi yang positif dan teguh antara dua set kesahan tersebut menunjukkan alat ukur mempunyai
Kaedah bahagi dua sering digunakan bagi menentukan kebolehpercayaan sesuatu alat ukur
kerana kaedah ini hanya memerlukan pentadbiran alat ukur sekali sahaja. Dengan menggunakan satu
pentadbiran, kaedah bahagi dua dapat mencegah berlakunya perubahan disebabkan ketiga-tiga sumber
variasi iaitu variasi individu dari satu pengukuran ke satu pengukuran, variasi tugasan dari satu
pengukuran ke satu pengukuran dan variasi pensampelan gagasan yang berbeza antara satu
Bagaimanapun, kaedah bahagi dua menyebabkan kandungan butir yang berkurang. Ini adalah
kerana butir-butir yang merangkumi kandungan bidang yang dikaji dibahagi dua. Dengan
pembahagian tersebut, kandungan bidang yang diukur menjadi separuh daripada kandungan sebenar.
Misalnya, sekiranya penggunaan 100 butir dalam alat ukur merangkumi bidang yang hendak diukur,
dengan kaedah bahagi dua kita hanya menggunakan 50 butir sahaja untuk mengukur kandungan
bidang tersebut. Kandungan butir yang berkurang sebanyak separuh akan merendahkan kesahan
kandungan alat ukur. Bagi mengatasi butir dan kandungan yang berkurang disebabkan penggunaan
kaedah bahagi dua untuk menentukan indeks kebolehpercayaan, penyelidik biasanya menggunakan
Formula Spearman-Brown.
Formula Spearman-Brown
Indeks kebolehpercayaan:
2r gg
____________________
1 + r gg
Di mana r gg = Pekali korelasi antara kesahan butir bernombor genap (g) dan kesahan butir bernombor
ganjil (g).
Misalnya, sekiranya pekali korelasi antara kesahan butir bernombor genap dan kesahan butir
bernombor ganjil ialah 0.78, maka nilai indeks kebolehpercayaan alat ukur tersebut adalah:
1 + 0.78
= 0.88
Kaedah pekali alpha ini bergantung kepada ketekalan prestasi individu dari satu butir ke butir lain. Di
samping itu, pekali alpha juga berasaskan kepada sisihan piawai alat ukur dan sisihan piawai butir-
sama bagi sesuatu gagasan. Formula Kuder Richardson 20 (KR 20) tidak sesuai digunakan untuk
mengukur yang berkaitan dengan kepantasan seperti ujian yang perlu dijawab dengan cepat. Untuk
KR 21 = r21 = n 1 - mm ( 1 mm / n )
n1 SA2
di mana mm adalah min kesahan kumpulan dan simbol-simbol lain mempunyai erti sama dengan (KR
20).
a) Panjang Ujian
b) Keheterogenan kumpulan
Apabila pelajar yang mengambil ujian itu lebih heterogen, maka pekali kebolehpercayaan ujian
Satu ujian mungkin lebih boleh dipercayai pada satu-satu aras kebolehan tetapi kurang boleh
dipercayai pada aras yang lain. Aras kesukaran ujian mempengaruhi kebolehpercayaan ujian kerana
item yang sukar akan membuat pelajar meneka jawapan. Kesukaran sesuatu ujian dipengaruhi oleh:
i. jenis ujian
ii. tujuan ujian
Pemboleh ubah yang menjadi tumpuan penyelidik memberikan pengukuran yang tekal dari lain-lain
pemboleh ubah. Kebolehpercayaan tinggi manakala ujian pemboleh ubah sahsiah mempunyai
f) Batasan Masa
Kebolehpercayaan yang ditentukan adalah fungsi kepada penentuan ke atas ralat pengukuran di mana
Rujukan :
Bhasah Abu Bakar (2003), Asas pengukuran bilik darjah. Tanjong Malim. Quantum Books
ISI KANDUNGAN :
PENGENALAN KESAHAN
1. Kesahan Kandungan
2. Kesahan Kriteria
a. Kriteria serentak
b. Kriteria jangkaan
3. Kesahan Konstruk
PENGENALAN KEBOLEHPERCAYAAN
RUJUKAN