Professional Documents
Culture Documents
Teori Dalam Pengukuran Dan Penilaian GGGB6333: Perbezaan Teori Ujian Klasik & Teori Ujian Moden
Teori Dalam Pengukuran Dan Penilaian GGGB6333: Perbezaan Teori Ujian Klasik & Teori Ujian Moden
TAJUK:
PERBEZAAN TEORI UJIAN KLASIK
&
TEORI UJIAN MODEN
DISEDIAKAN UNTUK:
PROF. MADYA DR. NORASMAH BINTI OTHMAN
DISEDIAKAN OLEH:
NURZAYANI BINTI YUSUP
(P76118)
TARIKH HANTAR:
26.05.2015
FAKULTI PENDIDIKAN
UNIVERSITI KEBANGSAAN MALAYSIA
PENGENALAN
Analisis item merupakan cara mengukur kualiti sesebuah soalan itu dimana ia
menguji soalan tersebut sama ada bersesuaian ataupun tidak kepada responden. Ia juga
menguji sejauh mana kemampuan ataupun sifat soalan tersebut jika soalan tersebut
digunakan berkali kali menggunakan ujian yang berlainan. Terdapat dua teori pengukuran
yang masih digunakan sehingga ke hari ini, iaitu Teori Ujian Klasik yang juga dikenali
sebagai Classical Test Theory (CTT), dan juga teori moden iaitu Teori Respon Item disebut
sebagai Item Response Theory (IRT).
Rajah 1
Rajah 1 diatas menunjukkan pembahagian di dalam analisis item dimana ia meliputi teori
klasik dan teori moden.
Teori Ujian Klasik adalah teori mengenai skor ujian yang memperkenalkan tiga
konsep utama, iaitu skor ujian (lebih dikenali sebagai skor cerapan), skor sebenar (true score)
dan skor ralat (error score). Berdasarkan kerangka teori itu tadi, pelbagai bentuk model telah
dirangka. Satu model linear mudah mengaitkan hubungan skor ujian (X) dengan nilai tambah
dua pembolehubah tersebunyi, skor sebenar (T) dan skor ralat (E).
X =T + E
Daripada persamaan tersebut, kita dapat rumuskan skor yang dicerap bukanlah skor
sebenar yang menggambarkan kebolehan atau pencapaian calon. Selain itu, skor yang dicerap
daripada sesuatu ujian mengandungi ralat dan ianya tidak bergantung kepada skor sebenar.
Oleh kerana terdapat dua unknown di dalam persamaan tersebut, ianya tidak akan dapat
diselesaikan melainkan jika andaian dibuat. Terdapat tiga andaian iaitu;
a) Skor sebenar dan skor ralat tidak mempunyai hubungan ataupun kaitan antara satu
sama lain
b) Purata skor ralat didalam populasi yang dikaji adalah 0
c) Skor ralat dalam ujian yang selari adalah tidak berkaitan
*Ujian selari : mempunyai kadar pengukuran skor dan ralat varians yang sama
CTT paling banyak digunakan kerana ianya paling mudah dalam menganalisis dan
ianya masih digunakan di negara kita dakam pembinaan ujian berdasarkan kesukaran dan
diskriminasi item. Namun kedua dua statistik ini bergantung kumpulan, bermaksud
pembina ujian dikehendaki untuk memilih wakil sampel yang hampir sama kebolehannya
dengan sampel yang bakal digunakan. Jika ujian ujian tersebut dipraujikan kepada
kumpulan lemah, maka nila p nya juga rendah dan begitu juga sebaliknya.
Dengan menggunakan model CTT, ciri ciri pelajar (kebolehan pelajar yang
dinyatakan sebagai markah yang didapati dalam skor ujian atau skor cerapan) dan ciri ciri
ujian tidak boleh dipisahkan. Oleh itu, kebolehan pelajar diterangkan berdasarkan skor
sesuatu ujian. Pelajar itu akan dianggap berkebolehan rendah jika tidak dapat menjawab item
yang berkenaan sekiranya ujian yang diberikan itu sukar, dan pelajar akan dianggap
berkebolehan tinggi jika dapat menjawab dengan betul ujian yang mudah.
CTT lebih berorientasikan kepada ujian daripada item. Ianya diukur berdasarkan
jumlah skor daripada satu ujian atau bilangan item yang dijawab betul daripada satu set item.
Ini bermaksud CTT tidak dapat membuat ramalan mengenai prestasi pelajar apabila pelajar
diberikan sesuatu item untuk dijawab.
Bagi mengatasi kelemahan kelemahan yang ada pada teori klasik, ahli psikometrik
telah telah berusaha mencari satu teori alternatif dan model pengukuran mental. Antara ciri
ciri ujian alternatif ini adalah item itemnya tidak lagi bergantung kumpulan, skor yang
menghuraikan kecekapan pelajar tidak bergantung ujian, model dapat menjelaskan hingga
pasa item, model tidak memerlukan ujian selari untuk mentaksir kebolehpercayaan, dan
model dapat memberikan pengukuran yang tepat pada setiap faktor kebolehan.
Sebagaimana dalam teori klasik, beberapa postulasi dibuat sebelum ianya boleh
diguna pakai. Antaranya ialah prestasi pelajar boleh diramalkan melalui satu set faktor yang
dipanggil trait, trait pendam atau kebolehan, dan hubungan diantara prestasi item dan trait
yang mendasari prestasi item berkenaan bagi seseorang pelajar dimana ia boleh dihuraikan
melalui satu fungsi yang dikenali sebagai ciri item atau keluk ciri item (ICC). IRT diukur
berdasarkan kebarangkalian menjawab betul satu item dalam ujian yang diberikan.
c
a
Da ( bi ) 1
Pi ( j ) =c i+ ( 1c i ) [1+e
Pi ( j )
ai
bj
ci
PERBEZAAN TEORI UJIAN KLASIK (CTT) DAN TEORI RESPONS ITEM (IRT)
CTT
Model
Ralat
pengukuran
Hubungan
keupayaan
item
Statistik item
Keupayaan
Invarian bagi
item dan
individu
Saiz sampel
Linear
X =T + E
p, r
Skor ujian (atau anggaran skor
sebenar dilaporkan pada skala
skor ujian)
Tiada parameter item dan
individu adalah bergantung pada
sampel.
Secara umum diantara 200 hingga
500
TRI
Bukan Linear
Pi ( j ) =c i+
( 1c i ) eDa (bi)
1+eDa (bi )
Berdasarkan perbezaan di atas, dapat kita simpulkan bahawa menggunakan IRT lebih
bagus daripada menggunakan CTT. Ini kerana parameter item yang bebas daripada sampel
dimana data diperoleh (kesukaran dan diskriminasi). Ia juga tidak bergantung kepada item
tertentu di dalam ujian. Selain itu, IRT boleh mengukur kebolehan kumpulan orang yang
berbeza kebolehan berdasarkan satu skala yang sama disamping mengena pasti ujian yang
mengandungi item item yang berat sebelah (DIF).