Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 6

SUBJEK:

TEORI DALAM PENGUKURAN DAN PENILAIAN


GGGB6333

TAJUK:
PERBEZAAN TEORI UJIAN KLASIK
&
TEORI UJIAN MODEN
DISEDIAKAN UNTUK:
PROF. MADYA DR. NORASMAH BINTI OTHMAN
DISEDIAKAN OLEH:
NURZAYANI BINTI YUSUP

(P76118)

TARIKH HANTAR:

26.05.2015

FAKULTI PENDIDIKAN
UNIVERSITI KEBANGSAAN MALAYSIA
PENGENALAN

Analisis item merupakan cara mengukur kualiti sesebuah soalan itu dimana ia
menguji soalan tersebut sama ada bersesuaian ataupun tidak kepada responden. Ia juga
menguji sejauh mana kemampuan ataupun sifat soalan tersebut jika soalan tersebut
digunakan berkali kali menggunakan ujian yang berlainan. Terdapat dua teori pengukuran
yang masih digunakan sehingga ke hari ini, iaitu Teori Ujian Klasik yang juga dikenali
sebagai Classical Test Theory (CTT), dan juga teori moden iaitu Teori Respon Item disebut
sebagai Item Response Theory (IRT).

Rajah 1
Rajah 1 diatas menunjukkan pembahagian di dalam analisis item dimana ia meliputi teori
klasik dan teori moden.

TEORI UJIAN KLASIK (CLASSICAL TEST THEORY, CTT)

Teori Ujian Klasik adalah teori mengenai skor ujian yang memperkenalkan tiga
konsep utama, iaitu skor ujian (lebih dikenali sebagai skor cerapan), skor sebenar (true score)
dan skor ralat (error score). Berdasarkan kerangka teori itu tadi, pelbagai bentuk model telah
dirangka. Satu model linear mudah mengaitkan hubungan skor ujian (X) dengan nilai tambah
dua pembolehubah tersebunyi, skor sebenar (T) dan skor ralat (E).
X =T + E

Daripada persamaan tersebut, kita dapat rumuskan skor yang dicerap bukanlah skor
sebenar yang menggambarkan kebolehan atau pencapaian calon. Selain itu, skor yang dicerap
daripada sesuatu ujian mengandungi ralat dan ianya tidak bergantung kepada skor sebenar.
Oleh kerana terdapat dua unknown di dalam persamaan tersebut, ianya tidak akan dapat
diselesaikan melainkan jika andaian dibuat. Terdapat tiga andaian iaitu;
a) Skor sebenar dan skor ralat tidak mempunyai hubungan ataupun kaitan antara satu
sama lain
b) Purata skor ralat didalam populasi yang dikaji adalah 0
c) Skor ralat dalam ujian yang selari adalah tidak berkaitan
*Ujian selari : mempunyai kadar pengukuran skor dan ralat varians yang sama
CTT paling banyak digunakan kerana ianya paling mudah dalam menganalisis dan
ianya masih digunakan di negara kita dakam pembinaan ujian berdasarkan kesukaran dan
diskriminasi item. Namun kedua dua statistik ini bergantung kumpulan, bermaksud
pembina ujian dikehendaki untuk memilih wakil sampel yang hampir sama kebolehannya
dengan sampel yang bakal digunakan. Jika ujian ujian tersebut dipraujikan kepada
kumpulan lemah, maka nila p nya juga rendah dan begitu juga sebaliknya.
Dengan menggunakan model CTT, ciri ciri pelajar (kebolehan pelajar yang
dinyatakan sebagai markah yang didapati dalam skor ujian atau skor cerapan) dan ciri ciri
ujian tidak boleh dipisahkan. Oleh itu, kebolehan pelajar diterangkan berdasarkan skor
sesuatu ujian. Pelajar itu akan dianggap berkebolehan rendah jika tidak dapat menjawab item
yang berkenaan sekiranya ujian yang diberikan itu sukar, dan pelajar akan dianggap
berkebolehan tinggi jika dapat menjawab dengan betul ujian yang mudah.
CTT lebih berorientasikan kepada ujian daripada item. Ianya diukur berdasarkan
jumlah skor daripada satu ujian atau bilangan item yang dijawab betul daripada satu set item.
Ini bermaksud CTT tidak dapat membuat ramalan mengenai prestasi pelajar apabila pelajar
diberikan sesuatu item untuk dijawab.

TEORI MODEN : TEORI RESPON ITEM (ITEM RESPONSE THEORY, IRT)

Bagi mengatasi kelemahan kelemahan yang ada pada teori klasik, ahli psikometrik
telah telah berusaha mencari satu teori alternatif dan model pengukuran mental. Antara ciri
ciri ujian alternatif ini adalah item itemnya tidak lagi bergantung kumpulan, skor yang
menghuraikan kecekapan pelajar tidak bergantung ujian, model dapat menjelaskan hingga
pasa item, model tidak memerlukan ujian selari untuk mentaksir kebolehpercayaan, dan
model dapat memberikan pengukuran yang tepat pada setiap faktor kebolehan.
Sebagaimana dalam teori klasik, beberapa postulasi dibuat sebelum ianya boleh
diguna pakai. Antaranya ialah prestasi pelajar boleh diramalkan melalui satu set faktor yang
dipanggil trait, trait pendam atau kebolehan, dan hubungan diantara prestasi item dan trait
yang mendasari prestasi item berkenaan bagi seseorang pelajar dimana ia boleh dihuraikan
melalui satu fungsi yang dikenali sebagai ciri item atau keluk ciri item (ICC). IRT diukur
berdasarkan kebarangkalian menjawab betul satu item dalam ujian yang diberikan.

KELUK CIRI ITEM (ICC)


Ia merupakan satu keluk yang menghuraikanpertalian
diantara
kebarangkalian
menjawab betul dengan kebolehan bagi seseorang pelajar terhadap
sesuatu item.
Berdasarkan rumus bagi keluk ini yang menyamai persamaan regresi (mempunyai kecerunan
dan pintasan), ia menggambarkan bahawa item item itu berbeza dari segi kesukaran dan
diskriminasinya. Bentuk sebenar keluk bagi setiap item adalah ditentukan oleh kesukaran dan
diskriminasinya sendiri. Cerun keluk adalah bergantung kepada diskriminasinya. Semakin
besar diskriminasinya, semakin cerun keluknya.

c
a

Rajah 2 : ICC Ogif Kebolehan


Rajah 2 menggambarkan bagi rumus di bawah bagi 3 parameter. Fungsi ogif ini
adalah asas kepada IRT.

Da ( bi ) 1

Pi ( j ) =c i+ ( 1c i ) [1+e

Pi ( j )

= kebarangkalian seorang pelajar berkebolehan menjawab item i dengan betul

ai

= parameter diskriminasi bagi item i

bj

= parameter kesukaran bagi item i

ci

= parameter tekaan bagi item i


n
e
D

= bilangan item dalam ujian


= nilai eksponen
= faktor skala (D=1.72)

PERBEZAAN TEORI UJIAN KLASIK (CTT) DAN TEORI RESPONS ITEM (IRT)
CTT
Model

Ralat
pengukuran
Hubungan
keupayaan
item
Statistik item
Keupayaan

Invarian bagi
item dan
individu
Saiz sampel

Linear
X =T + E

Lemah (mudah untuk memenuhi


keperluan data ujian)
Ralat = X T
Tidak dinyatakan

p, r
Skor ujian (atau anggaran skor
sebenar dilaporkan pada skala
skor ujian)
Tiada parameter item dan
individu adalah bergantung pada
sampel.
Secara umum diantara 200 hingga
500

TRI
Bukan Linear
Pi ( j ) =c i+

( 1c i ) eDa (bi)
1+eDa (bi )

Mempunyai kekuatan (lebih sukar


untuk memenuhi keperluan data ujian)
Ralat = respon pemerhatian (diperoleh)
respon yang diramalkan
Keluk ciri item (ICC)

a, b, c (bagi model 3 parameter)


Keupayaan skor dilaporkan pada skala
- ke +
Ya parameter item dan individu
adalah bebas atau tidak bergantung
pada sampel sekiranya model sesuai
untuk data ujian.
Bergantung kepada model IRT yang
digunakan (secara umumnya sampel
yang besar iaitu lebih dari 500 sampel)

Berdasarkan perbezaan di atas, dapat kita simpulkan bahawa menggunakan IRT lebih
bagus daripada menggunakan CTT. Ini kerana parameter item yang bebas daripada sampel
dimana data diperoleh (kesukaran dan diskriminasi). Ia juga tidak bergantung kepada item
tertentu di dalam ujian. Selain itu, IRT boleh mengukur kebolehan kumpulan orang yang

berbeza kebolehan berdasarkan satu skala yang sama disamping mengena pasti ujian yang
mengandungi item item yang berat sebelah (DIF).

You might also like