Professional Documents
Culture Documents
DFDFD
DFDFD
DFDFD
ÖLÇME VE DEĞERLENDĠRME
ÖLÇME: Belli bir nesnenin belli bir özelliğe sahip olup olmadığının; sahipse sahip oluĢ
derecesinin gözlenip, gözlem sonuçlarının sayı ve sembollerle ifade edilmesidir. Ölçme bir
betimleme iĢidir.
NESNELERĠN
1
VARLIKLARIN GÖZLEM SAYI YA DA SEMBOLLERLE = ÖLÇME
OLAYLARIN ĠFADE
Özellikleri
NOT: Ölçme iĢinde ölçme konusu olan Ģey bir özelliktir. Özelliğe sahip olup olmama sahip oluĢ
derecesi nesneden nesneye, durumdan duruma, aynı nesne içinde zamandan zamana ya da yerden
yere değiĢebilir. Cinsiyet, medeni durum, ağırlık kiĢiden kiĢiye: sıcaklık zamandan zamana ya da
yerden yere değiĢebilir. Belli bir özelliğe sahip olmama veya sahip olma derecesi bakımından
bireyler arasında farklılıklar vardır. ĠĢte bu farklılıklar ölçme için temeldir. Eğer bütün insanlar
aynı uzunlukta olsaydı ya da sıcaklık her zaman ve her yerde aynı olsaydı bu değerlerin ölçülmesi
diye bir durum söz konusu olmazdı.
ÖLÇME ÇEġĠTLERĠ:
1) DOĞRUDAN (TEMEL) ÖLÇME: Ölçülmek istenen özellik ya da nesnenin evrende var
olduğu Ģekliyle kendi cinsinden bir birimle ölçülmesidir.
Örn: Boyun metre ile ağırlığın terazi ile ölçülmesi gibi. Yani ağırlığın bir baĢka ağırlık ile
uzunluğun bir baĢka uzunluk ile ölçülmesidir.
Doğrudan ölçmede geçerliği ve güvenirliği yüksek olan bir ölçme elde edilir. Ağırlık, uzunluk, renk
vb. doğrudan ölçülebilir.
ÖRNEKLER:
* Boy uzunluğunun ölçülmesi
2) DOLAYLI ÖLÇME: Ölçülmek istenen özellik ile ölçmede kullanılan aracın özelliği
birbirinden farklı ise bu tür ölçmelere dolaylı ölçme adı verilir. Özellik kendisine ait olmayan
baĢka bir araçla ölçülür. Geçerlilik ve güvenirlik düĢüktür. EĞĠTĠMDEKĠ ÖLÇÜMLERĠN BÜYÜK
BĠR KISMI DOLAYLI ÖLÇÜMDÜR.
Eğitimde genellikle ölçme konusu olan davranıĢ değil onunla ilgili olduğu sanılan davranıĢlar
gözlenip, gözlem sonucu asıl ölçme konusu olan davranıĢa yüklenir.
Eğitimdeki ölçmelerin genellikle dolaylı olması eğitimdeki ölçme sonuçlarına daha çok hatanın
karıĢması ihtimalini arttırır.
Zekâ, baĢarı, kiĢilik, akademik baĢarı vb. özellikler dolaylı ölçme ile ölçülür.
ÖRNEKLER
2
* Öğrencinin zekâ düzeyinin ölçülmesi,
3) TÜRETĠLMĠġ ÖLÇME: Ġki değiĢken arasında aritmetik bir iĢlemle elde edilen
ölçmeye türetilmiĢ ölçme denir. Örneğin bir cismin hacmi kütlesine bölünürse yoğunluğu bulunur.
Dolayısıyla iki ölçme arasında aritmetiksel bir iĢlem yapılması bir ölçme iĢlemini yani türetilmiĢ
ölçmeyi ifade eder. Bir otomobilin hızını bulmak için önce otomobilin aldığı yolu ve bu yolu ne
kadar zamanda aldığı tespit edilir. Daha sonra arabanın hızını bulmak için alınan yol zamana
bölünür. Yine aritmetiksel iĢlem yapıldığı için yapılan ölçme türetilmiĢtir.
ÖLÇMEDE BĠRĠM: Ölçme iĢleminin sonucunu sayısal olarak ifade edebilmek için bir
birime ihtiyaç duyulur. Metre, kilogram, kilowatt, derece, saat, lira, puan, adım, karıĢ vb. çeĢitli
ölçme araçlarına iliĢkin ölçme birimleridir. Sonuçlar ifade edilirken bu birimler kullanılır. 20
öğrenci, 25 derece gibi… Birimler 2 türlüdür:
* DOĞAL BĠRĠM: Bir değiĢkenin hangi niteliğine ya da miktarına bir birim denileceğinin
tanımlanmamıĢ olduğu birimlerdir.
Örn: Sınıftaki öğrenci sayısını sayarken 1 öğrenci 1 birim olarak kabul edilir.
* TANIMLANMIġ BĠRĠM: DeğiĢkenin ne kadarlık miktarına 1 birim denileceği
uzmanlarca tanımlanmıĢ birimlerdir.
Örn: Bazı insanların uzunlukları metre ile, bazı insanların kulaç kullanarak ölçmeleri birimlerin
genelliğini bozar, veya ağırlık ölçmede kullanılan kilogram dünyanın her yerinde kabul edilen genel
3
bir birim iken geçmiĢte kullanıĢmıĢ olan okka günümüzde herkes tarafından kullanılmadığı için
genel bir birim değildir.
Örn: Ġnsanların ağırlığının ton ile değil de kilo ile ifade edilmesi…
ÖLÇÜM: Ölçme sonucudur. BaĢka bir ifade ile ölçme iĢlemi sonucunda elde edilen sayı veya
semboldür. Örn: Bir öğrencinin bir sınavdan almıĢ olduğu puan bir ölçümü ifade etmektedir. Yani
ölçüm ölçme iĢlemi bittikten sonra elde edilen niceliktir.
edilebilmesi ve ölçmede bu değerin sıfır sayısı ile gösterilebilmesi çok istenen bir özelliktir. Bazı
değiĢkenlerin doğal (gerçek) sıfır noktası vardır. Bir kursa devam eden öğrencileri sayıyorsak,
hiçbir öğrencinin gelmediği bir günde devam eden öğrenci sayısı sıfırdır ve sıfır doğaldır. Doğal
Bazı değiĢkenlerin doğal sıfır değeri bulunmaz. Örn; sıcaklık ölçmekte kullanılan
santigrat ve fahrenheit derecelerinin sıfırları itibaridir (bağıldır). Bir uzunluk için yüksekliğin
doğal sıfırı anlamlı olduğu halde, yeryüzündeki coğrafi yüksekliklerin ölçülmesinde kullanılan sıfır
itibari yani bağıldır. Eğitimde sıkça kullanılan baĢarı ölçmede takdir edilen notun sıfırı itibari yani
bağıldır.
2007 KPSS: AĢağıdaki örneklerin hangisinde sözü edilen ölçme iĢleminde bağıl (keyfî, itibari)
ÖLÇÜT (kriter, standart, norm): Ölçümler hakkında bir karara varırken kullanılan
kriterlerdir. Örn: Bir öğrencinin baĢarılı sayılabilmesi için istendik davranıĢların % 50 sini
kazanmıĢ olması, % 30‘dan fazla devamsızlık etmemiĢ olması ya da geçme notu 100 üzerinden en
az 45 olanların baĢarılı olması, sayılması gibi… Ölçüt ikiye ayrılır:
4
a) Mutlak ölçüt: Değerlendirilecek grup dikkate alınmadan ölçme iĢleminden önce belli olan
ölçüte mutlak ölçüt adı verilir. Mutlak ölçüt kesindir, gruba ve kiĢiye göre değiĢmez.
Bölgesel normlar
KiĢisel yetenekler
2009 KPSS SORUSU: AĢağıdaki değerlendirme süreçlerinin hangisinde bağıl ölçüt kullanılmıĢtır?
A) Mezun olmak için diploma notunun 4 üzerinden en az 2 olması
B) Ortalamanın 10 puan üzerinde alanların sınıfı geçmesi
C) Askere ağırlığı 150 kg‟nin altındaki erkeklerin alınması
D) Soruların % 80‟ini doğru cevaplayanların bilgi yarıĢması elemelerine katılması
E) Yüksek lisansa girebilmek için yabancı dil sınavından en az 70 puan alınması
2006 KPSS:
III. Sınavda 65‘in altında puan alan öğrenciler dersi tekrar ederler.
IV. Türkçe ve matematik derslerinden baĢarısız olan öğrenciler bir sonraki döneme devam
edemezler.
5
DEĞERLENDĠRME: Ölçme sonuçlarını bir ölçütle karĢılaĢtırıp, bir değer yargısına
oradan da bir karara ulaĢma sürecidir.
Bu örneklerin her biri bir ölçme sonucudur. Ama bunlar kendi baĢlarına hiç bir Ģey ifade etmezler.
Elde ettiğimiz sayıların bizimle konuĢması, bazı fikirler vermesi gerekir.
6
Değerlendirme sürecinde en önemli öğe kriterdir. Değerlendirme sürecinde kullanılan
kriterlere göre değer yargısı ve dolayısıyla karar değiĢecektir. Bir dersin ölçüt alınabilecek en
önemli öğesi hedef ve davranıĢlardır.
2007 KPSS: Değerlendirme yapılırken, ölçüt ile ölçme sonuçlarının aynı birimle ifade edilmesi
gerekir. Bunun en önemli amacı aĢağıdakilerden hangisidir?
→ Ölçme, değerlendirmeden önce gelir. Ölçme yapıldıktan sonra değerlendirmeye geçilir bu sıra
hiç değiĢmez.
→ Ölçme, objektiftir yani fotoğraf çeker gibi mevcut durumu ortaya koymaktadır.
Değerlendirme ise sübjektiftir. KiĢisel kanılara dayanır.
→ Ölçme daha çok gözleme; değerlendirme ise daha çok karĢılaĢtırmaya, yorum ve yargıya
dayanır.
→ Değerlendirme ölçmeyi de içine alan bir kavramdır, dolayısıyla ölçmeye göre daha kapsamlıdır.
ÖRN: Öğrencinin tarih dersinden 70 puan alması bir ÖLÇMEDĠR. Sadece puanına bakarak tarih
dersinden geçip geçmeyeceğine karar vermek oldukça zordur. Bu konuda karar için öğrencinin
puanının bir ölçütle karĢılaĢtırılması gerekir. Eğer öğretmen 70 puanın geçebilmek için yeterli
olacağını önceden belirtmiĢse öğrenci tarih dersinden geçebilecektir. Bu durumda öğrencinin
geçebileceğine iliĢkin karar verilmiĢtir. Yani DEĞERLENDĠRME yapılmıĢtır.
ÖLÇME DEĞERLENDĠRME
►Bugün hava sıcaktır. ►Bugün hava sıcak olduğu için maç yapılabilir.
►Fatih matematikten pekiyi aldı. ►Fatih matematikten pekiyi ile geçti.
►Abdulsamet kısa boyludur. ►Abdulsamet kısa boylu olduğu için kaleci olamaz.
►Furkan sınavdan en yüksek puanı aldı. ►Furkan en yüksek puanı alarak sınıfını geçti.
►Ebubekir iyi bir çocuktur. ►Ebubekir iyi çocuk olduğu için sevilebilir.
►Bu gömlek 75 ytl dir. ►Bu gömlek 50 ytl den fazla olduğu için pahalıdır.
7
EĞĠTĠM SÜRECĠ ĠÇĠNDE ÖLÇME VE DEĞERLENDĠRMENĠN YERĠ VE ÖNEMĠ
Eğitim süreci içinde ölçme ve değerlendirme, öğrencilerimizin hedef davranıĢların ne
kadarını gerçekleĢtirdiklerini, gerçekleĢtirilmeyen amaçların neler olduğu, hangi konuların
yeterince öğrenilip öğrenilmediği, hangi konuların eksik ya da yanlıĢ öğrenildiği hakkında bilgi
verir.
►Uygulanan eğitim programının baĢarılı olup olmadığı hakkında yöneticilere ve diğer ilgililere bilgi
verir.
DEĞERLENDĠRME BĠÇĠMLERĠ
A) ÖLÇÜTE GÖRE YAPILAN DEĞERLENDĠRME
1) MUTLAK DEĞERLENDĠRME (Kriter Dayanıklı Değerlendirme): Mutlak ölçüt kullanılarak
hedefe dayalı olarak yapılan değerlendirmedir.
Mutlak değerlendirmede öğrencinin grup içindeki baĢarısına bakılmaz. Yani burada birey testteki
baĢarısına göre testle ölçülmek istenen nitelikler yönünden grup içindeki diğer bireylerle
karĢılaĢtırılmaz. Mutlak değerlendirmede bireyin bireysel baĢarısı dikkate alınır.
8
Bağıl ölçüte göre yapılan değerlendirme sonucunda verilen not öğrencinin belli bir bilgi
veya beceriler toplamından baĢka, bir değiĢkene göre ne kadarını öğrendiğinin bir göstergesidir.
Bağıl değerlendirmede kriter grubun baĢarısına göre belirlenir.
ÖRNEK: * Sınıfın aritmetik ortalamasının altında kalanların baĢarısız sayılması.
* 100 metre yarıĢına katılanlar arasında yarıĢı ilk 5'e girerek tamamlayanların
okul takımına seçilmesi.
1) Öğrencilerin birbirine göre baĢarı düzeylerini belirleyerek ileri ve geri öğrenciler için ek
önlemler alma: BAĞIL DEĞERLENDĠRME.
a-Öğrencilerin sırasına göre değerlendirme yapmak Örneğin: Okulda ilk 5 giren öğrencilere burs
vermek
e-Öğrencilerin ilk baĢarı durumları ile son baĢarı durumları arasında ki farkın değerlendirmede
kullanılması
2006 KPSS: AĢağıdakilerden hangisi bağıl değerlendirmede kullanılan bir ölçüt değildir?
2008 KPSS: Değerlendirme, ölçme sonuçlarının bir ölçütle karĢılaĢtırılarak bir yargıya varılması
iĢidir.
9
B) AMACINA GÖRE YAPILAN DEĞERLENDĠRME
Eğitim öğretimde temelde üç amaç için değerlendirme yapılır:
Örn: Öğrencilerin belli üniversitelere, bir üniversitenin değiĢik fakültelerine yada bir fakültenin
farklı bölümlerine yerleĢtirilmeleri, onların bu öğretim kurumlarında baĢarılı olmak için gerekli
olduğu düĢünülen giriĢ davranıĢlarına sahip oluĢ derecelerine göre yapılır. Bu anlamda yerleĢtirme
YORDAMA ile yakından ilgilidir.
Bu değerlendirmede kullanılan ölçme araçları Ģunlardır: Yetenek testi, tanıma testi, yerleĢtirme
testi, muafiyet testi, seviye tespit sınavı, hazırbulunuĢluk testi,
NOT: HazırbulunuĢluk testi, önkoĢul bilgileri ölçme amacıyla yapılır. Seçme testi ise bireylerin
belli özelliklere sahip olma düzeylerini değerlendirme amacıyla yapılır.
2009 KPSS SORUSU: Arif Öğretmen, öğretim yılının baĢında, öğrencilerinin matematik dersine
karĢı tutumlarının nasıl olduğunu belirlemek ve elde edilen sonuçlardan hareketle öğretim
uygulamalarına yön vermek istemektedir. Bu amaçla 10 maddeden oluĢan bir tutum ölçeğini
öğrencilerine uygulamıĢ ve onların matematik dersine karĢı tutumlarını ölçmüĢtür.
Arif Öğretmen bu uygulamasında hangi ölçme ve değerlendirme türlerini kullanmaktadır?
A) Dolaylı Tanılayıcı
B) Doğrudan Biçimlendirici
C) TüretilmiĢ Tanılayıcı
D) Dolaylı Düzey belirleyici
E) Doğrudan Düzey belirleyici
2) BĠÇĠMLENDĠRME-YETĠġTĠRMEYE (FORMATĠF Değerlendirme , Öğrenme Eksikliklerinin
Değerlendirilmesi, Ġzlemeye Dayalı Değerlendirme) YÖNELĠK DEĞERLENDĠRME:
10
Biçimlendirme-yetiĢtirmeye yönelik değerlendirme maksadıyla kullanılan testlere
FORMATĠF TESTLER ya da ünite testleri denilmektedir. Bu testler yalnızca belli bir öğretim
ÜNĠTESĠNĠN BĠTĠMĠNDE uygulanır.
Bu değerlendirmede kullanılan test çeĢitleri izlenme testleri, kısa sınavlar (kuiz), ara sınavlar ya
da aylık sınavlardan oluĢmaktadır.
Bu değerlendirmede ―not verme‖ yaklaĢımı uygulanmaz. Çünkü amaç ünite sonundaki eksiklikleri
belirlemek ve bunları gidermektir.
NOT: Öğrenme güçlüklerinin ve eksikliklerinin nedenleri araĢtırılarak bir yandan öğrencilere
yardımcı olunmaya çalıĢılmakta öte yandan da öğretim ortamı ve yöntemleri sürekli olarak gözden
geçirilmektedir.
3) DEĞER BĠÇMEYE YÖNELĠK DEĞERLENDĠRME (Sonuç Değerlendirmesi, Düzey Belirleyici
Değerlendirme, Summatif-Özetleyici Değerlendirme):
2008 KPSS: Durum değerlendirme ya da düzey belirleme denen ölçme ve buna bağlı
Bu tür değerlendirmede kullanılacak veriler; bir kursun tümünü içerecek biçimde kursun
bitiminde ya da birkaç üniteyi kapsayacak biçimde öğretim dersi içinde uygulanan testlerle elde
edilir. Böylece bir testin sonuçları birçok bakımdan kullanılacaktır. Öğrencilere not verme,
öğrencilerin gelecek kurslardaki baĢarısını yordama, bir sonraki kursta öğretimin baĢlangıç
noktasını saptama, öğrencilere ve öğretmene öğrenmenin yeterliliğine ya da öğretimin etkililiğine
iliĢkin dönüt sağlama, farklı öğrenci gruplarının baĢarı durumlarını kararlaĢtırma.
Öğrencilerle ilgili olarak verilecek kararlar onların bir okuldan mezun olup olmayacağına, bir üst
kurs ya da sınıfa geçip geçmeyeceğine ya da farklı programlardan hangisine yönelmesi gerektiğine
değin olabilir.
NOT: Değer biçmeye yönelik değerlendirme; öğretim programlarının hedeflerine ulaĢma düzeyi,
öğrenme düzeyi ve öğrencilerin baĢarı düzeylerini belirlemek için yapılır. EriĢi testi, baĢarı testi,
bitirme testi (final), yeterlilik testi ve uzmanlık testleri, vize testi gibi test türleri kullanılır.
→ EriĢi Testi: Bir öğretim programının giriĢ davranıĢları ile çıkıĢ davranıĢları arasındaki farkı
bulmak için yapılır.
→ BaĢarı Testi: Öğrencinin öğrenme düzeyini belirlemek amacıyla yapılır.
11
EĞĠTĠM ÖĞRETĠMDE KULLANILAN DEĞERLENDĠRME TÜRLERĠ:
12
ÖLÇEK:
Belirli bir özelliği ölçmek için hazırlanmıĢ ve üzerinde birimleri hep aynı cinsten koyulmuĢ
bir ölçme aracını tanımlar. Yani belli bir baĢlangıç noktasından itibaren eĢit birimlerle
bölmelenmiĢ ölçme aracına ölçek adı verilmektedir. Ölçek; nesnelere verilen sayıların anlamlarını
ya da nesnelere sayılar vermede ve verilen sayıların kullanılmasında uyulması gereken kurallar ve
kısıtlamaları belirtmek için kullanılır. BaĢlıca ölçek türleri Ģunlardır:
1) SINIFLAMA (Adlandırma-Gruplandırma-Kategorileme-Nominal) ÖLÇEKLERĠ: Sınıflama
ölçeği nesneleri belli bir yönden benzeyip benzemediklerine göre sınıflandırmaya dayanır.
Nesneler arasındaki farklılıklar ve benzerlikler çok kaba biçimde belirlenir. Gözlemin en basit
biçimidir. Bu ölçekte nesneler sınıf, tip ve kategorilere ayrılır. Bu ölçek eğitimde nadiren
kullanılır. Bazı tanımlayıcı nitelikler (göz ve saç rengi gibi) insanların yaĢadığı coğrafi bölgeler,
matematiksel olarak yalnızca elimizde FREKANSLAR VARDIR. Ġstatistiksel iĢlemlerden sadece
MOD bulunabilir.
Dolayısıyla frekanslara dayalı analizler dıĢında birçok matematiksel iĢlemi yapmak anlamsızdır.
ÖRNEKLER: * Ġnsanları medeni durumlarına göre evli, bekâr, dul, boĢanmıĢ Ģeklinde
ayırmak
* Cinsiyete göre kadın, erkek
Öte yandan Aslı Burak‘ın kardeĢi, Burak‘ta Ceylanın kardeĢi ise o zaman Aslı‘da Ceylan‘ın
kardeĢidir. Yani A = B, B = C A = C Bu iliĢkiye GEÇĠġLĠLĠK adı verilir.
NOT: Her bir grubu bir sayı ile ifade edersek, örneğin kadınlara 1, erkeklere 2 dersek sınıflama
ölçeği ile ölçme yapmıĢ oluruz.
2006 KPSS: ĠĢ birliğine dayalı bir öğrenme uygulamasında gruplar öğrencilerin soyadlarının baĢ
Bu uygulamadaki gruplara ayırma, bir ölçme iĢlemi olarak kabul edilirse kullanılan ölçek türü
aĢağıdakilerden hangisidir?
13
2) SIRALAMA (DERECELEME-ORDĠNAL) ÖLÇEĞĠ: Nesneleri belli bir özelliğe sahip oluĢ
miktarı bakımından sıraya koymakla elde edilir. Yani bu ölçek niteliklerin belli bir boyutta
büyükten küçüğe, küçükten büyüğe, iyiden kötüye veya kötüden iyiye doğru sıralanması ile elde
edilir. Bu sıralar sayı ile ifade edileceği gibi birinci, ikinci, üçüncü vb. sıfatlarda da ifade
edilebilir; pekiyi, iyi, orta, geçer, kalır gibi…
Bu tür ölçeklerde öğrencilerin tüm grup içindeki yeri belirlenmektedir. Birinci, ikinci, üçüncü… gibi
numaralar öğrencilerin grup içindeki yerini belirlemede kullanılabilir. Bu ölçekte nesnelere verilen
semboller (sayılar) nesnelerin belli bir özelliğe, birbirine göre daha az ya da daha çok sahip
olduğunu belirtir.
Bu ölçekte baĢlangıç noktası ve sıralar sabit değildir.30 kiĢilik bir grup baĢarı durumlarına
göre sıralanmıĢ olsa herkesin bir sırası olur ; fakat gruba yeni bireyler katılırsa , sıralamada ki
baĢlangıç noktasında ve kiĢilerin eski sıralarında değiĢme meydana gelir.
Fakat sıraları gösteren sayılar arasındaki farklar özelliğe sahip oluĢun ve nesneler arasındaki
farkın miktarını yansıtmaz. Örn: BaĢarı sıralamasına göre veya boy uzunluğuna göre 2. öğrencinin
4. öğrenciden 2 birim daha üstün olduğu söylenemez. Bu yüzden bu tip ölçeklerden elde edilen
veriler üzerinde MOD VE MEDYAN(ORTANCA) bulunabilir. Yüzdelik hesapları yapılabilir, sıra
farkları korelasyonu da hesaplanabilir.
Bu ölçek türüne de dört iĢlemi uygulamanın bir anlamı yoktur çünkü rakamların matematiksel
anlamı yoktur. Sadece özelliğin azlık-çokluk; büyüklük-küçüklük sırasını verir.
ÖRNEKLER:
ÖRN: Ali AyĢe‘den uzundur. AyĢe de Ezgi‘den uzundur. Dolayısı ile Ali Ezgi den uzundur. Yani A>B
ve B>C ise A>C dir.
3) EġĠT ARALIKLI (ĠNTERVAL) ÖLÇEKLER: Nesnelerin belirli bir baĢlangıç noktasına göre ve
belli bir özelliğe sahip oluĢ derecesi bakımından eĢit aralıklarla sıralanmasıdır. EĢit aralıklı ölçek
birimlerde eĢitliğin sağlandığı ve sıfırın tanımlanmıĢ olduğu ölçek türüdür.
Örn: Sıfır noktası olarak kabul ettiğimiz ĠSA‘nın doğumu aslında tarihin baĢlangıç noktası
değildir. Bu nokta herkesin sıfır noktası olarak kabul ettiği noktadır.
14
Görüldüğü gibi bu ölçekte baĢlangıç noktası (0) tanımlanmıĢtır. Sıfır noktası keyfidir ve eĢit
aralıklarla bölmelenmiĢtir. Bu yüzden eĢit aralıklı ölçeklerde ölçümlerin birbirine oranlanması
anlamlı değildir yani termometre ölçeği ile 10 °C olan sıcaklığın 5 °C olan bir sıcaklıktan 2 kat
fazla olduğunu söylemenin bir anlamı yoktur.
Bu ölçekte elde edilen veriler üzerinde sınıflama ve sıralama ölçeklerinden elde edilen veriler
üzerine yapılanlara ek olarak ARĠTMETĠK ORTALAMA, STANDART SAPMA, PEARSON-
MOMENTLER ÇARPIMI KORELÂSYON KATSAYISI hesaplanabilir.
EĢit aralıklı ölçekler üzerinde toplam çıkarma iĢlemleri yapılırken, gerçek bir sıfır noktası
olmadığı için çarpma bölme iĢlemi yapılamaz. Örneğin; 20 santigrat 10 santigrat‘ın iki katıdır
denemez.
4) EġĠT ORANLI (RATĠO) ÖLÇEKLER: BaĢlangıç noktası gerçek sıfırı yani yokluğu gösteren,
birimleri eĢit ve birimleri arasında oransal iliĢki kurulabilen ölçekler oranlı ölçeklerdir. Bu ölçeğin
öncekilerden üstünlüğü SIFIR‘ın (0) gerçek anlamda yokluğu ifade etmesidir. Yani baĢlangıç
noktası olan SIFIR NOKTASI gerçek bir SIFIR NOKTASIDIR. Uzunluğun ve ağırlığın ölçülmesi
bu tür ölçeklerle yapılır. ÖRN: Ali 60 kg ve Ayhan 30 kg ise Ali‘nin ağırlığı Ayhan‘ın ağırlığının iki
katıdır, denilebilir.
Ölçme sonuçları üzerinde her türlü MATEMATĠKSEL ĠġLEM yapılabilir. METRE, KĠLOGRAM gibi
ölçme araçları bu tür ölçek esasına göre geliĢtirilmiĢtir.
2006 KPSS: Yabancı dil sınavında Duru 80, Berke 40 puan almıĢtır.
Duru‟nun yabancı dil bilgisinin Berke‟nin yabancı dil bilgisinin iki katı kadar olduğunu öne
süren bir kiĢi, bu ölçme sonuçlarının aĢağıdaki ölçek türlerinin hangisiyle elde edildiğini kabul
etmektedir?
Örnekler: Metre ile boy ölçmek, terazi ile ağırlık ölçmek, Okulda bulunan öğrenci sayısını
belirlemek, Bir öğrencini arkadaĢ sayısını belirlemek,
NOT: Dört ölçek türünden en yaygın olarak kullanılanları eĢit aralıklı ve sıralama ölçeklerdir.
Eğitimsel ve psikolojik ölçmelerde en çok kullanılan ölçekler yine sıralama ve eĢit aralıklı
ölçeklerdir.
NOT: Bu dört ölçek grubunu istatistiksel uygulama için iki grupta toplayabiliriz. Sınıflayıcı ve
sıralayıcı ölçeklerle elde edilen veriler ve değiĢkenler NĠTEL; buna karĢılık eĢit aralıklı ve
ORANLI ölçeklerle elde edilen veriler ve değiĢkenler ise NĠCEL olarak sınıflandırılabilir.
NOT: Ölçme düzeyi SINIFLAYICIDAN ORANLI‘ ya doğru kuvvetlenmektedir.
15
ÖLÇMEDE HATA: Ölçülen nesnenin gerçek değeri ile gözlem ya da ölçme sonucunda
elde edilen değer arasındaki farka ölçme hatası denir.
Örn: Gerçek boy uzunluğu 180 cm. olan bir insanın boyu ölçüm sonucu 177 cm. bulunduysa bu
ölçmede 3 cm. ölçme hatası vardır.
Kim, hangi özelliği hangi araç ile ölçerse ölçsün ölçmede hata yapacaktır. Öyleyse bir ölçme
sonucundaki hata miktarı ne kadardır? Sorusu akla gelir. Bir ölçme sonucundaki hata miktarı o
ölçme iĢleminde kullanılan birimin yarısı kadardır. Buradan Ģu sonuca ulaĢırız: Birim ne kadar
küçülürse hata miktarı o kadar azalır. Bu ifadeyi Ģu örnekle açıklayabiliriz:
ÖRNEK: A Sınavı: Sadece 1 soru sorulmuĢ, 100 puan üzerinden puanlanmıĢ,
Yukarıda verilen sınavların sizce en güvenilir olanı hangisidir? Bu örnekten Ģunu anlıyoruz:
Bir ölçme iĢleminde kullanılan birim ile ölçme sonucuna karıĢan hata miktarı birbiri ile yakından
iliĢkilidir. Birim küçüldükçe hata miktarı da azalır.
Sınav aracı, yanlıĢ cevap anahtarı, soruların sınavda yoklanacak hedef davranıĢları uygun
örneklendirmemesi durumunda ortaya çıkar.
* 30 soruluk bir kısa cevaplı testteki 15. sorunun okunamaması nedeni ile hiçbir
öğrenci tarafından cevaplandırılamaması.
* 25 soruluk çoktan seçmeli bir testin 25. sorusu sınav süresi yetersiz olduğu için
hiçbir öğrenci tarafından cevaplandırılamamıĢsa bu sorudan hiçbir öğrenci puan alamaz. Bu durum
tüm öğrencileri aynı oranda etkilediğinden öğrencilerin puanlarına sabit hata karıĢmıĢtır.
Sabit hatalar her ölçme sonucuna aynı yönde ve aynı miktarda karıĢtıkları için standart
sapma ve varyans değerlerini etkilemezler. Bu nedenle güvenirlik sabit hatalardan etkilenmez.
2) SĠSTEMATĠK (YANLI) HATA: Ölçülen büyüklüğe, ölçmeye ve ölçme koĢullarına göre miktarı
farklılık gösteren hatalardır. Sistematik hatada hata miktarı ölçümden ölçüme belli bir oranda
artar ya da azalır. Sistematik hata ölçmeyi yapanın yanlılığından da kaynaklanır. Ölçülen
büyüklüğe, ölçmeciye ve ölçülen koĢullara göre miktarı değiĢen bu hatalar puanlayıcının sübjektif
davrandığı hatalardır. Sistematik hatalarda yapılan ölçümün birden fazla tekrarlanması gerekir.
16
Örneğin; ilk 3 cm ‗lik kısmı kırık olan 50 cm‘lik bir cetveli,n büyük bir uzunluğu ölçmek
amacıyla birden fazla kullanılması durumunda hata miktarı cetvelin kullanım sayısına bağlı olarak
sistematik bir Ģekilde artacaktır.
ÖRNEKLER: * Bir öğretmenin öğrencilerin cinsiyetlerine göre fazla puan vermesi, (Kız öğr.
10 puan fazla verilmesi)
* Öğretmenin 50 puan alan kâğıda 10, 60 puan kâğıda 15, 70 puan alan kâğıda 20
puan fazla vermesi…
* Terazinin 1 kg.lık bir kütleyi, 50 gram fazla; 2 kg.lık kütleyi 100 gram fazla, 3
kg.lık kütleyi 150 gram fazla göstermesi…
2009 KPSS SORUSU: Öğretmenler genellikle söz dinleyen ve kurallara uygun davranan öğrencilere sempati
duyarlar. Yapılan araĢtırmalar, öğretmenlerin tepkilerinin, öğrencilerin derslerdeki baĢarısızlıklarından çok,
kurallara uymamalarına yönelik olduğunu ortaya koymaktadır. Öğrencilere bu konuda bir açıklama yapılmasa
da onlar, kurallara uygun davrandıklarında bunun baĢarı olasılığını etkileyebileceğini, sınavda doğru yanıtlar
vermeseler de iyi not alabileceklerini düĢünürler. Bu durumda, kurallara karĢı çıktıklarında
cezalandırılabileceklerini ya da öğretmenleri tarafından dıĢlanabileceklerini öğrenirler.
A) Rastlantısal hata B) Gözlem yetersizliği C) Sabit hata D) Mantık hatası E) Sistematik hata
ÖRNEKLER:
* Dikkatsizce puanlanan, okunan veya doğru okunduğu halde yanlıĢ kaydedilen notlar.
* Öğrencinin sınav günü hasta olması, sınav salonunun soğuk olması, Ģans baĢarısı, kopya çeken
öğrencinin aldığı puan.
* Terazinin bir ölçtüğü kütleyi 50 gram fazla gösterirken, bir baĢka kütleyi 120 gram eksik, bir
diğerini 250 gram fazla göstermesi
* Öğretmenin bir kâğıda 5 puan fazla verirken, farkında olmadan bir baĢka kâğıda 10 puan eksik
vermesi.
2008 KPSS: Bir sınavda her öğrenciye 5 puan fazla verilmesi ---- hataya örnektir. Öğrencilerin
puanlarını, aldıkları puanların yüzde 10‘u kadar artırmak ise ---- hataya örnek olabilir.
A) rasgele - sabit
B) rasgele - sistematik
C) sabit - sistematik
D) sabit – rasgele
E) sistematik - sabit
17
ÖLÇMEDE HATA KAYNAKLARI
1) ÖLÇME ARACINDAN KAYNAKLANAN HATALAR: Sorunun yanlıĢ olması, çift seçenekli
olması, eksik olması, yazım hatası, ölçme aracında yönerge olmaması, ölçme aracının iyi
yapılandırılmamıĢ olması
DUYARLILIK (Hassasiyet) : Ne kadar az hata yapılırsa duyarlılık o kadar fazla olur. Ölçme
aracının birimi ne kadar küçük olursa o oranda hassas ölçüm yapar.
ÖRN: Altın tartarken kg. yerine mg. kullanılması veya sınavda az soru yerine çok soru sorulması
duyarlılığı arttırır.
TUTARLILIK (Kararlılık) : Ölçme aracının birkaç kez uygulandığında benzer sonuçları vermesi
düzeyidir.
ÖRN: Bir zekâ testinin ilk uygulanıĢında zekâ bölümünü 80, ikinci uygulanıĢında 120 ve üçüncü
uygulanıĢında 90 buluyorsak yani sonuçlar arasında tutarlılığın sağlanmamıĢ olması bu zekâ
testinin yeterince güvenilir olmadığının bir göstergesidir.
OBJEKTĠFLĠK: Bir ölçme iĢlemini kim yaparsa yaptın ölçme iĢlemini yapan kiĢinin aynı sonuca
ulaĢması demektir. Örneği, bir matematik öğretmeni bir öğrencinin sınavdan aldığı puanı 70 olarak
hesaplamıĢsa , baĢka bir öğretmende aynı öğrencini puanını 70 olarak hesaplıyorsa , yapılan ölçme
iĢlemi objektif dolayısıyla da güvenilirdir.
18
2009 KPSS SORUSU: Bir okulda, fen bilgisi proje ödevi verilmiĢtir. Ürünlerin puanlanmasının
sınıfta derse giren öğretmen yerine, diğer sınıfın öğretmeni tarafından yapılması sağlanmıĢtır.
Projelere kod numaraları verilmiĢ ve öğrenci isimleri, projeleri değerlendiren öğretmenden
gizlenmiĢtir. Ayrıca değerlendirme için (kapsamlı, detaylı ve açık) bir puanlama rehberi
oluĢturulmuĢ, öğretmenin bu rehbere göre puan vermesi istenmiĢtir. Yukarıda anlatılan
iĢlemler, kullanılan ölçme aracının hangi özelliğini iyileĢtirmek amacıyla gerçekleĢtirilmiĢtir?
* Güvenirlik, sayısal değer alan güvenirlik katsayısı (r) adı verilen bir katsayı ile ifade edilir ve 0
ile 1 arasında değer alır. Güvenirlik katsayısı ölçümlerdeki hatayı değil hatasızlığı belirtir. Yani
güvenirlik katsayısı yüksekse ölçme aracının hatalardan arınıklık derecesinin yüksek olduğu
söylenir. Güvenirlik katsayısının yüksek olması ölçme hatasının düĢük olmasının ifadesidir.
* Güvenilir bir ölçme aracının hatası az, güvenilir olmayan ölçme aracının hatası daha fazladır.
Ölçme hatalarının kestirilmesi ölçümlerin tekrarı ile mümkündür. Aynı koĢullar altında tekrarlanan
ölçümler birbirini tutmayan sonuçlar veriyorsa güvenirlikten söz etmek mümkün değildir.
NOT: Bu yöntem daha çok ilgi, tutum, yetenek testlerinde uygulanır. Çünkü ilgi, tutum, yetenek
ölçümden ölçüme değiĢmez.
KORELÂSYON: Ġki değiĢken arasındaki iliĢki miktarını gösterir. Bu iliĢki miktarını gösteren
katsayıya korelasyon katsayısı adı verilmektedir. Bu katsayı -1.00 ile +1.00 arasında bir değer alır.
Örn: AyĢe öğretmen sınıfa uyguladığı testi belli bir zaman sonra tekrar uygulamıĢ ve aralarındaki
güvenirliği tespit etmeye çalıĢmıĢtır.
AyĢe öğretmen güvenirliği bulmada hangi yöntemi kullanmıĢtır? Test – Tekrar Test Yöntemi (E)
2004 KPSS
2007 KPSS: Lisedeki bir rehber öğretmen öğrencilerin mesleki ilgilerini belirlemek için mesleki
ilgi envanteri geliĢtirmiĢtir. Güvenirliğini belirlemek için bu envanteri aynı öğrencilere altı hafta
arayla iki kez uygulamıĢ ve iki uygulamadan elde edilen ölçüler arasındaki iliĢkiyi (korelasyon) 0,45
bulmuĢtur. AĢağıdakilerden hangisi, bu korelasyon değerinin düĢüklüğü için gerekçe olarak
gösterilemez?
19
2) PARALEL TESTLER YÖNTEMĠ (EġDEĞER FORMLAR YÖNTEMĠ) (eĢdeğerlik katsayısı):
Bu yöntemde bir testin güvenirliğinin tahmini için; bir testin en az iki eĢdeğer formunun
geliĢtirilmiĢ olması gerekmektedir. Paralel iki testin eĢdeğer olabilmesi için her iki test içindeki
maddelerin sayısı, niteliği ve ölçtükleri davranıĢlar bakımından birbirine denk olması gerekir.
Bu yöntemle güvenirliğin tahmini için yapılması gereken iĢlemler Ģöyledir: Paralel formların
her ikisi de aynı öğrenci grubuna uygulanır ve öğrencilerin iki ayrı formdan almıĢ oldukları puanlar
arasındaki korelasyon hesaplanır.
Paralel testler yöntemiyle elde edilen güvenirlik katsayısı +1.00‘e yakın ise ölçme aracının
hatalardan arınıklığının ve tutarlılığının yüksek olduğu söylenebilir.
EĢdeğer formlar yöntemiyle bulunan bu katsayı EġDEĞERLĠK KATSAYISI olarak da
bilinir. Genellikle bu yöntemle elde edilen güvenirlik katsayısı diğer yöntemlerle elde edilenlerden
daha küçük çıkar. Fakat paralel testler yöntemi bir testin tek formunun aynı öğrenci grubuna iki
kez uygulanmasından daha kullanıĢlıdır.
2.r¹,²
rx = ————
1+ r¹,²
ÖRNEK: Testi yarılama tekniğiyle elde edilen bir testin güvenirlik katsayısı 0,80 çıkmıĢtır.
Testin tümünün güvenirliği kaçtır?
2. r¹,² 2.0,80
rx = ————— = ———= 0,89
1+ r¹,² 1+0,80 Güvenirliği 1'e yaklaĢtığı için
yüksektir.
Bu yöntemle elde edilen güvenirlik katsayısının yüksek oluĢu her iki formun da güvenilir
olduğuna; yeteri kadar yüksek olmayıĢı da her iki formun güvenirliğinin düĢük olduğuna iĢaret
eder.
Testi yarılarken Ģöyle yapabiliriz = 50 sorudan oluĢan bir matematik testinin soruları 1, 3,
5 gibi tek numaralı sorular Ģeklinde iki ayrı gruba ayrılırsa ve bu iki grup sorudan elde edilen
puanlar arasında korelasyon hesaplanırsa elde edilen katsayı tüm testi ikiye bölerek elde
ettiğimiz yarım testlere ait korelasyon katsayısını yani yarım testlerin güvenirliğini verecektir.
20
4) ĠÇ TUTARLILIK YÖNTEMĠ: Ġç tutarlılık katsayısı testin bir defa uygulanması ile
güvenirliğin kestirilmesini sağlayan katsayıdır. Bir testteki maddelere verilen cevaplar toplam
test puanı ile uyumlu ise bu durumda testin iç tutarlılığa sahip olduğu söylenebilir. Yani bir testi
oluĢturan maddelerin birbiriyle uyumu iç tutarlılığı ifade eder. Ġç tutarlılık anlamında güvenirliğin
hesaplanabilmesi için birden fazla formül bulunmaktadır. Bu formüller testi oluĢturan maddelerin
niteliğine göre değiĢir. Buna göre KR–20, KR–21 ve ALPHA GÜVENĠRLĠK katsayısı adı verilen
formüller kullanılır.
KR–20 güvenirlik katsayısı bir defada uygulanan bir ölçme aracının iç tutarlılığını veren bir
katsayıdır. Kuder Richardson formülleri testteki her bir maddenin aynı değiĢkeni ölçtüğü yani
testtin ölçtüğü Ģeyin HOMOJEN olduğu sayıltısına dayanır. KR–20 formülü sadece doğru
cevaplandırılan maddelere 1 puan vererek yanlıĢ cevaplandırılan ve boĢ bırakılan maddelere ise hiç
puan verilmeksizin puanlanan testlere uygulanabilir. Eğer testteki maddeler farklı ağırlıklar ile
puanlanmıĢ ise bu formül kullanılmaz. Test içerisindeki her bir maddenin güçlük derecesi yani her
bir maddeye doğru cevap veren öğrencilerin toplam öğrencilere oranı hesaplanan bir testin
güvenirliğini tahmin etmek için KR–20 formülünü kullanırız.
NOT: 10–15 civarında maddeden oluĢan çoktan seçmeli bir testte 0,50 kadar düĢük bir KR–20
güvenirlik katsayısı yeterlidir. Ancak 50 maddenin üzerindeki testler için KR–20 değeri en az
0,80 olmalıdır.
KR–20 ile belirlenen güvenirlik katsayısı yüksek ise testle ilgili aĢağıdaki yorumlar
yapılabilir.
► Grup heterojendir. Yani uygulanan test gruptaki öğrencileri birbirinden iyi ayırmıĢtır.
►Testin yapı geçerliliği yüksektir.
NOT: KR–20 Formülü 1 ile 0 Ģeklinde puanlanan maddeler için kullanılmaktadır ve bu maddeler
farklı zorluk düzeyine sahiptirler. Bazı durumlarda testi oluĢturan maddelerin zorluk dereceleri
birbirine çok yakın olabilir. O zaman KR–21 denilen ve KR–20 formülünün özel bir durumu olan
baĢka bir formül kullanılır.
KR-21 ile hesaplanan güvenirlik katsayısı , KR-20 ile hesaplanan güvenirlik katsayısından
her zaman küçüktür.( KR21<KR20)
KR-21 ĠLE hesaplanan güvenrilik katsayısı KR-20 ile hesaplanan güvenirlik katsayısından
küçük olduğu için ; KR-21 güvenirliğin alt sınırıdır.
Örnek: KR–20 formülünün kullanıldığı çoktan seçmeli bir teste maddelerin güçlük düzeyleri 0,70;
0,60; 0,50 vb. olabilirken KR–21 Formülünün uygulandığı bir testte madde güçlükleri 0,71; 0,72;
0,73; 0,74 Ģeklinde birbirine daha yakındır.
21
ALPHA () GÜVENĠRLĠK KATSAYISI:
Alpha güvenirlik katsayısı tek bir uygulama gerektiren güvenirlik bulma tekniklerden
biridir. Ağırlıklı puanlama ve dereceleme yöntemiyle puanlama yapıldığı durumlarda
kullanılabilecek bir güvenirlik bulma tekniğidir. Testi oluĢturan maddelerin dereceleme ölçeğine
göre puanlanması (1 den 5‘e kadar veya 0 dan 4‘e kadar puan verilmesi gibi ) genellikle psikomotor
becerileri ölçmek amacıyla hazırlanan ölçme araçlarının puanlanmasında veya tutum ölçeklerinin
puanlanmasında kullanılmakta birlikte KISA CEVAPLI TESTLERĠN güvenirliğinin kestirilmesinde
kullanılır.
Alpha güvenirlik katsayısı KR–20 güvenirlik katsayısının genelleĢtirilmiĢ bir Ģeklidir. Alpha
güvenirlik katsayısı da tıpkı KR–20 güvenirlik katsayısı gibi bir iç tutarlılık katsayısıdır. 0 ile 1
arasında değer almaktadır.
NOT: Testte ölçülecek olan özellik heterojen bir yapıda ise KR–20 ya da Alpha güvenirlik
katsayılarının yerine Testi Yarılama Yöntemi kullanılmalıdır. Heterojen bir yapıda olan test için
testi yarılama yönteminin kullanımı daha uygundur ve yüksek güvenirlik katsayısı verir.
NOT: KR–20 ve KR–21 iç tutarlılık katsayıları 0 ile 1 Ģeklinde puanlanan testlerde kullanılırken
ALPHA güvenirlik katsayısı ise dereceleme ölçeğine göre puanlanması durumunda kullanılır. Örn: 1
den 5‘e kadar veya 0 dan 4‘e kadar puanlama.
Hem KR–20–21 hem de ALPHA güvenirlik katsayısı test maddelerinin homojen olduğu
durumlarda kullanılır, her ölçüde iç tutarlılık katsayısını ifade eder. Eğer test maddeleri arasında
heterojenlik söz konusu ise TESTĠ YARILAMA yöntemi daha güvenilir sonuçlar verir.
Se = Sx. 1 rx
Se: Ölçmenin standart hatası
Formülden de anlaĢılacağı üzere ölçmenin güvenirliği ile standart hatası arasında ters
yönlü bir iliĢki vardır. Yani standart hata azaldıkça ölçümlerin güvenirliği artar.
Örneğin; güvenirlik 1 ise ölçmenin standart hatası 0,00 olur. Ki bu ölçmenin standart
hatasının alabileceği en küçük değerdir. Güvenirlik 0,00 ise ölçmenin standart hatası standart
sapmaya eĢit olur bu ölçmenin standart hatasının maksimum değeri olur.
2004 KPSS: AĢağıda standart sapma ve güvenirlik katsayıları verilmiĢtir. Hangisinin
ölçmede standart hatası en düĢüktür?
SS GÜVENĠRLĠK
A) 2 0,50
B) 4 0,50
C) 5 0,30
D) 2 0,90 →
Güvenirlik katsayısının
E) 5 0,60 yüksek olması bu Ģıktaki
standart hatanın düĢük
olmasını göstermektedir.
22
BĠR TESTĠN GÜVENĠRLĠĞĠNĠ ETKĠLEYEN BAġLICA FAKTÖRLER
A) TESTĠN UZUN OLMASI: Bir testteki soru sayısı arttıkça testin güvenirliği de artar. Bunu
Ģöyle açıklayabiliriz: Seçmeli testlerden elde edilen puanlara, doğru cevabın Ģansla
bulunabilmesinden doğan Ģans hatası karıĢır. Test puanlarına Ģans hatası karıĢtığı oranda testin
güvenirliği düĢer. Soru ve seçenek sayısı arttıkça doğru cevabın bulunma olasılığı azalır.
Dolayısıyla testin güvenirliği artar. (soru sayısını artırmak güvenirliği artırmanın en öncelikli
yoludur.)
2003 KPSS: Bir lise öğretmeni kullandığı 4 seçenekli sorularını seçenek sayısını artırarak 5
seçeneğe çıkmıĢtır. Öğretmen bu değiĢikliği aĢağıdakilerden hangisini gerçekleĢtirmek amacıyla
yapmıĢ olabilir?
C) Puanlamayı kolaylaĢtırmak,
E) Soruları güçleĢtirmek,
NOT: Bir testi uzatmakla yani bir teste önceki maddelere benzer yeni maddeler eklemekle
güvenirlikteki beklenen artıĢı yordamak için SPEARMAN-BROLUN formülü adıyla bir formül
kullanılır.
n.rs
rn = —————
(n-1). rs+1
ÖRNEK: Güvenirliği 0,50 den 0,90‘a çıkarmak istediğimiz bir testi ilk uzunluğunun kaç katı
uzatmak gerekir?
n.0,50
0,90 = —————— = 9
n= 9 TTest 9 kat uzatılmalıdır.
(n-1).0,50+1
Spearman-BROWN FORMÜLÜ = * Teste sonradan konulan maddelerin önceki maddeler gibi aynı
davranıĢları ölçtüğü ve yeni maddelerin ortalama güçlüklerinin önceki maddelerin ortalama
güçlüklerine denk olduğu.
* Test uzamakla birlikte cevaplayıcıların ona cevap verme biçiminin değiĢmediği sayıltılarına
dayanır.
23
B) TEST YÖNERGESĠNĠN VE TEST MADDELERĠNĠN ĠFADESĠ: Sınav yönergesi ve sorular
ne kadar açık ve anlaĢılır olursa güvenirlik o kadar yükselir. Testin baĢında cevaplayıcılar için bir
yönerge bulunmalıdır. Cevaplama iĢleminin nasıl yapılacağı, testin nasıl puanlanacağı, testte kaç
soru bulunduğu vb. yönergede açıkça belirtilmiĢ olmalıdır.
Testte yer alan soruların açık ve anlaĢılır olup olmaması da testten elde edilen puanların
güvenirliğine etki eder. AnlaĢılması güç ve ne sorduğu açıkça anlaĢılmayan sorulara verilen
cevaplar güvenilir olmaz. Çünkü bu tür sorular ya cevaplayıcıların soruya verdiği anlama göre ya da
büsbütün geliĢi güzel cevaplandırılırlar. Böylesi sorulara değiĢik zamanlarda verilen cevaplar farklı
olacağından içinde bu tür soruların yer aldığı bir testin güvenirliği düĢük olur. Bu nedenle bir
testteki maddelerin anlatımı yalın ve anlaĢılır olmalıdır.
C) TEST ĠÇERĠĞĠNĠN BENZEġĠKLĠĞĠ (HOMOJENLĠĞĠ): Ölçtükleri davranıĢ ve konu
bakımından homojen maddelerden oluĢan bir testten elde edilen puanlar heterojen bir testten
elde edilen puanlardan daha güvenilir olur. Sözgelimi 100 maddelik bir SOSYOLOJĠ TESTĠ 100
maddelik bir SOSYAL BĠLĠMLER testinden daha güvenilirdir.
E) SINAVIN YAPILDIĞI ORTAM: Ortamda ısı, ıĢık, havalandırma, nem, güneĢ alma, gürültü gibi
değiĢkenlerin düzenli olması güvenirliği etkiler. Standart koĢullar altında yapılmayan bir ölçme
bireylere daha baĢlangıçta eĢit fırsatlar tanımadığından güvenirliği düĢürür.
F) ZAMAN (SÜRE): Sınava verilen sürenin gereğinden az olması veya gereğinden fazla olması
güvenirliği etkiler.
G) TESTĠN GÜÇLÜK DÜZEYĠ: Test maddelerinin çok kolay ya da çok zor oluĢu testin
güvenirliğini etkiler. Sorular orta güçlükte olmalıdır.
H) KOPYA ÇEKME: Kopya çekme davranıĢı öğrencinin gerçek bilgisini göstermediğinden dolayı
güvenirliği etkiler.
I) ÖLÇMENĠN YAPILDIĞI KĠġĠLER: Bireylerin ölçüme alındığı zamanda içinde bulundukları
özel koĢullar ve geçirdikleri olumsuz yaĢantılar güvenirliği etkiler. Örn: Öğrencinin sınav günü
hasta olması, hızlı okuma becerisinin düĢük olması vb…
2006 KPSS: Hazırladığı testin güvenirliğini artırmak isteyen bir öğretmen öncelikle
24
ÖLÇME ARACININ GÜVENĠRLĠĞĠNĠ ARTIRACAK GENEL ĠLKELER
1) Soru sayısı arttıkça sınavın güvenirliği artar. Çünkü soru sayısı arttıkça ölçme hatası
azalır.
2) Sorular öğrencilerin düzeylerine uygun hazırlanmalıdır. Sınav soruları öğrenci seviyesinin
üzerinde ya da altında hazırlanmıĢsa güvenirlik azalır.
2008 KPSS: Bir öğretmen aynı kapsamda ve düzeyde iki ayrı sınav hazırlamıĢ ve aynı gruba
―Birinci sınavdan elde edilen puanların güvenirliği daha yüksektir.‖ diyen bir kiĢi bu iddiasını
A) Bir sınavda yanıtların nasıl puanlanacağı kullanılan soru tipine göre değiĢir.
E) Testteki soru sayısı arttıkça ölçme sonuçlarına karıĢan hata miktarı azalır.
2) GEÇERLĠK:
Ölçme araçlarında bulunması gereken üç nitelik içinde en önemlisi GEÇERLĠK tir.
GEÇERLĠK; bir ölçme aracının ölçmeyi amaçladığı özelliği, baĢka herhangi bir özellikle
karıĢtırmadan doğru olarak ölçebilme derecesidir. BaĢka bir deyiĢle bir ölçme aracının
geliĢtirilmiĢ bulunduğu konuda maksada hizmet etmesidir.
ÖRNEK: Uzunluk ölçmek için geliĢtirilmiĢ olan metre kiĢilerin boylarını ölçme amacına hizmet
eder. Bu demektir ki bir ölçme aracı olan metre, uzunluk ölçmede geçerlidir fakat ağırlık ölçmede
geçerli değildir.
25
Bir aracın geçerli olması için, onun sadece ölçmek için düzenlendiği özelliği ölçmesi yani
onu baĢka özelliklerle karıĢtırmadan ölçmesi de gerekir. Mesela; yazı güzelliği, ifade biçimi, sayfa
düzeni, yanlılık vb. etkenlerin de ölçmeye karıĢmaması gerekir. Bu etkenlerin ölçmeye karıĢması
geçerliği düĢürür.
ÖRNEK: Bir öğretmen yaptığı bir Biyoloji sınavında yüksek bir okuma yeteneği ve kelime bilgisi
gerektirecek sorular sormuĢ ve puanlama yaparken de yazı güzelliği, sayfa düzeni vb. özelliklere
de fazla puan vermiĢtir. Böyle bir test ölçmeyi amaçladığı özelliği baĢka özellikleri de karıĢtırarak
ölçtüğü için geçerliliği düĢüktür.
NOT: Bir baĢarı testinin niteliği; ölçülecek olanın ne olduğuna ve onun nasıl ölçüleceğinin açıkça
belirlenmiĢ olmasına bağlıdır. Ne ölçülecek sorusunun cevabı testin uygunluk ve ilgililik özelliği ile
ilgilidir. Nasıl ölçülecek sorusunun cevabı büyük ölçüde testin güvenirliği ile ilgilidir.
Ölçtüğü Ģeyle ilgili olan ve ölçtüğü Ģeyi tutarlı olarak ölçen bir test GEÇERLĠDĠR. Bu yargı
geçerliğin iki önemli öğesi olduğunu belirtir:
► UYGUNLUK VE ĠLGĠLĠLĠK: Bir test için uygunluk onun ölçmek için düzenlediği özellik ya da
özelliklerle ilgili olmasıdır. Bir testin kapsadığı maddeler dersin geliĢtirmek istediği davranıĢları
yansıtıyor ve onları yeterince örnekliyorsa o zamanda ĠLGĠLĠ dir.
► GÜVENĠRLĠK: Bir testin geçerli olması için tutarlı bir biçimde ölçümde yapması gerekir. Bu
nedenle güvenirlik geçerliğin önemli bir parçasıdır. Bir test geçerli olmak için güvenilir olmak
zorundadır ancak güvenirlik geçerlik için bir önkoĢul olmasına karĢın yeterli değildir. Güvenilir olan
bir test her zaman geçerli olmayabilir.
ÖRN: Bir kısmı olmayan bir cetvelle bir kitabın boyunu 4 defa ölçerek aynı sonuca ulaĢabiliriz.
(Güvenilirdir) Fakat bu ölçme amacına hizmet etmekten uzaktır yani doğru ölçüm yapmamaktadır.
Dolayısıyla GEÇERLĠ değildir. Yani test tutarlı ölçme yapabilir ama ölçmek istediği özelliği
ölçmeyebilir.
Bir testin geçerliği bir derece sorunudur. Ya hep ya hiç sorunu değildir. Bir test hepten
geçerli veya hepten geçersiz olmak yerine daha çok veya daha az geçerli olabilir. (yüksek orta
veya düĢük)
Bir testin geçerliği o testten elde edilen puanlarla belli bir ölçütler takımı arasındaki iliĢki
bakımından belirlenir. Burada ölçütler takımı olarak neyin alınması gerektiği testin kullanılıĢ
maksadına bağlıdır. Test puanları ile ölçütler takımı arasındaki iliĢki katsayısına GEÇERLĠK
KATSAYISI adı verilir. Geçerlik katsayısı -1.00 ile +1.00 arasında değiĢir. Bir test için geçerlilik
en fazla GÜVENĠRLĠĞĠN KAREKÖKÜNE EġĠT OLABĠLĠR.
ÖRN: Güvenirliği 0,81 olan bir testin geçerliği en fazla kaç olur?
26
Bir testin kapsam geçerliğine sahip olması için bu iki isteğin birlikte karĢılanması gerekir.
Ölçme konusu; evreni yeterli ve dengeli olarak örnekleyen ve kapsadığı maddelerin her biri
ölçmek istediği davranıĢı gerçekten ölçen bir test kapsam geçerliğine sahiptir.
Bir testin kapsam geçerliği Ģu iki ana yaklaĢımdan birisiyle belirlenebilir:
→ Her bir maddenin diğer maddelerce ölçülenlerden farklı bir davranıĢı ölçmeye yönelip
yönelmediğini ve ölçmeye yöneldiği davranıĢı ölçmedeki elveriĢliliğine bakılır.
Bu konuda baĢvurulabilecek bir yolda Ģudur: Belirtke tablosuna bağlı kalarak hazırlanan bir test
aynı dersi okutan baĢka öğretmenlere, testin ilgili olduğu konuyu iyi bilen kiĢilere (konu alanı
uzmanlarına) ve ölçme değerlendirme uzmanlarına incelettirilebilir.
→ Her iki ölçüm aracı aynı öğrencilere uygulanarak öğrencilerin aldıkları puanlar birbirleriyle
karĢılaĢtırılır.
→ Daha sonra korelasyon katsayısı bulunur ve elde edilen korelasyon katsayısı ne kadar büyükse
(yani +1.00‘a yakın ise) uygulanacak aracın geçerliği de o oranda yüksek olacaktır.
Görüldüğü üzere KAPSAM GEÇERLĠĞĠ, bir testin ölçmek istediği davranıĢları ne kadar kapsadığı
ile ilgilidir.
2009 KPSS SORUSU: Bir araĢtırmacı çoklu zekâ alanlarını ölçmek amacıyla geliĢtirdiği çok boyutlu testi,
dil bilimi, matematik, resim, heykel, müzik, beden eğitimi, iletiĢim, psikoloji bölümlerindeki öğrencilere
uygulamıĢtır. Uygulama sonucunda farklı bölümlerdeki öğrencilerin kendi alanıyla ilgili sorulardan yüksek,
diğer alanlardaki sorulardan ise daha düĢük puan aldıklarını saptamıĢtır.
Buna göre, ölçme aracı için aĢağıdakilerden hangisi söylenebilir?
A) Amaca hizmet etme derecesi düĢüktür.
B) Hata düzeyi düĢüktür.
C) Geçerliği yüksektir.
D) KullanıĢlılığı yüksektir.
E) Güvenirliği düĢüktür.
2001 KMS: Bir matematik öğretmeni derste problem çözmeye yönelik aktivitelere ağırlık verdiği
halde yaptığı sınav daha çok dört iĢlem yapabilme becerisini ölçen sorulardan oluĢmuĢtur.
Öğretmen bu yaklaĢımıyla aĢağıdakilerden hangisini olumsuz yönde etkilemiĢtir?
A) Puanıyla güvenirliği
B) Test-tekrar test güvenirliği
C) Testin kullanıĢlılığı
D) Testin kapsam geçerliği *
27
2003 KPSS: Bir baĢarı testinde kapsam geçerliği yüksek ise aĢağıdaki sonuçlardan hangisi
doğrudur?
A) Tutarlı ve kararlı sonuçlar veren bir testten yararlandığı;
B) Testteki soruların pek çoğunu öğrencilerin doğru olarak yanıtlayabildikleri,
ÖRNEK: Eğitim enstitülerine veya üniversitelere alınacak öğrencileri seçmek için yapılan sınavlar.
Yapılacak sınavın bir üst eğitime geçebilecek öğrencileri seçebilme düzeyinin incelenmesi de bir
yordama geçerliğidir.
ÖRNEK: Öğrencinin matematik testindeki puanını göz önüne alarak fizik dersindeki baĢarı
durumu hakkında fikir yürütmek.
ÖRNEK: Okula daha baĢlamamıĢ bir öğrencinin zekâ testinden aldığı puana bakarak okuldaki
baĢarı durumunun ne olacağını tahmin etmeye yönelik yapılan çalıĢma da YORDAMA çalıĢmasıdır.
KiĢilerin gelecekteki baĢarılarını yordamak için kullanılan testlerin bu maksada hizmet etmesi yani
yordama geçerliğine sahip olması istenir. Bir testin yordama geçerliği o testten elde edilen
puanlar ile testin yordamak için düzenlendiği değiĢkenin doğrudan ölçüsü olan ve daha sonra elde
edilen ölçüt arasındaki KORELÂSYONDUR.
NOT: Genellikle bir zekâ ya da baĢarı testinin yordama geçerliğini belirlemede ölçüt olarak ders
notları alınır. SözgeliĢi üniversiteler arası seçme sınavında almıĢ oldukları puanlara göre,
üniversitelere girmiĢ olan öğrencilerin üniversitelerde almıĢ oldukları notlar arasındaki korelasyon
katsayısı üniversiteler arası seçme sınavının YORDAMA GEÇERLĠĞĠ katsayısıdır. Genel bir kural
olarak test puanının elde edilmesi ile ölçüt ölçüsünün (üniversitelerde almıĢ olduğu puanlar) elde
edilmesi arasında geçen zaman arttıkça korelasyon düĢer.
28
2007 KPSS: Pazarlama elemanları seçiminde kullanılmak üzere bir test geliĢtirilmiĢ ve iĢe
alımlarda bu test uygulanmıĢtır. Daha sonra, iĢe alınan elemanların ilk aydaki baĢarılı satıĢ sayıları
Yukarıda belirtilen inceleme, uygulanan testin hangi özelliği hakkında bilgi verir?
A) Yordama geçerliği
B) Yapı geçerliği
C) Kapsam geçerliği
D) Ġç tutarlığı
E) Puanlayıcılar arası güvenirliği
b) Uygunluk Geçerliği: Yordayıcı puanın sonradan elde edildiği geçerlik türüdür. Yani bu geçerlik
türünde sürece bakıp öğrencinin sınav sonucu tahmin edilmektedir.
NOT: Yordama geçerliğinde öğrencinin sınav sonucuna bakıp süreçteki baĢarısı tahmin edilmekte
iken; uygunluk geçerliğinde süreçteki baĢarısına bakılarak sınav sonucu tahmin edilmektedir.
3) YAPI GEÇERLĠĞĠ: Birbiriyle iliĢkili olduğu düĢünülen belli öğelerin ya da öğeler arasındaki
iliĢkilerin oluĢturduğu bütüne yapı denir. Bir testin içinde yer alan her bir maddenin, testin
bütünüyle iliĢkili olmasıdır. Testin bir maddesi bile testin bütününden ayrı olmamalıdır.
Yapı geçerliği; bütüne aykırı soru sorulduğu zaman bozulur. Türkçe testinin soruları
içerisinde bir Tarih sorusu sorulursa bütün bozulmuĢ ve yapı geçerliği düĢmüĢ olur.
Zekâ, yetenek, kritik düĢünme gibi özellikler bir yapıdır. Mesela; zekânın kendine özgü alt öğeleri
vardır ve bu öğeler birbirleri arasında iliĢkilidir. Bu tür yapıların ölçülmesinde ölçülecek olan yapı
tanımlanır, bunlardan ölçülebilir davranıĢlar çıkarılır ve bunları ölçecek test maddeleri geliĢtirilir.
Bir testin yapı geçerliğinin çalıĢılması testin maddelerinin ilgili olduğu alanı kapsamasına ve
maddeler arasındaki iliĢkilerin analizine dayanır.
Yapı geçerliği, bir testin veya ölçme iĢleminin teorik bir yapıyı ölçüp ölçmediğinin
belirlenmesidir. (Teorik yapı: KiĢilik, yaratıcılık, ilgi, zekâ, tutum vb) Yapı geçerliğinin temel
mantığı; ölçülmesi planlanan teorik yapıya yüksek derecede sahip olan bir grupla düĢük derecede
sahip olan baĢka bir gruba testi uygulayıp testin bu grupları ne derece uygun olarak ayırıp
ayırmadığına bakmaktır.
29
ÖRNEK: 25 maddeden oluĢan bir testin bir grup öğrenciye uygulandığını düĢünelim. Testin birinci
maddesinin testin bütünüyle iliĢkili olup olmadığını anlamak için bu maddeye öğrencilerin verdikleri
cevaplardan elde edilen puanlar ile bu madde dıĢında 24 maddeden öğrencilerin elde ettiği puanlar
arasındaki korelasyona bakılır. Birinci maddeden elde edilen puanlar ile diğer 24 maddeden elde
edilen puanlar arasındaki korelasyon yüksek ise bu madde YAPI GEÇERLĠĞĠNE sahiptir. Bu iĢlem
testte yer alan her bir madde için ayrı ayrı gerçekleĢtirilerek her bir maddenin YAPI GEÇERLĠĞĠ
tespit edilir.
4) GÖRÜNÜġ GEÇERLĠĞĠ: Bir testin gerçekten ne ölçtüğü ile değil onun ne ölçüyor göründüğü
ile ilgilidir. Bir testin görünüĢ geçerliği o testin ölçmek istediği Ģeyi ölçüyor görünmesidir.
GörünüĢ geçerliği olan bir test kapağında ne yazılıysa onu ölçüyor görünür. ÖRNEK: Kapağında
Ġngilizce testi yazılı olan bir testin içinde Ġngilizce ile ilgili sorular varsa bu testin görünüĢ
geçerliği vardır.
NOT: Testin görünüĢ geçerliği bazı durumlarda yükseltilmeli bazı durumlarda gizlenmelidir. Eğer
bir test piyasaya kabul ettirilmek isteniyorsa görünüĢ geçerliği yükseltilmelidir. Buna karĢılık
KĠġĠLĠK TESTLERĠNĠN ve kiĢilik testlerindeki maddelerin görünüĢ geçerlikleri gizlenmelidir.
Yoksa kiĢiler maddelere doğru cevap vermekten kaçınabilirler.
5) MEVCUT HAL GEÇERLĠĞĠ (hali hazır geçerliği): Öğrencinin bugünkü durumunu belirlemek
amacıyla kullanılan ölçme aracının sahip olması gereken bir özelliktir. Daha çok öğrencinin Ģimdiki
davranıĢı ile ilgilidir. Eğer öğrenciler sınava girmeden önce iyi hazırlanmıĢlar ise sınavda baĢarılı
olacaklardır.
►Güvenirlik: Bir testin güvenilir olması geçerli olmasını etkileyen faktörlerden biridir. Güvenirlik
geçerlik için gerekli ama yeterli bir Ģart değildir.
►Ölçme Sisteminden Kaynaklanan Hatalar(Sistematik-Yanlılık): Ölçme iĢlemine katılan sabit
hatalar ile sistematik hatalar geçerliği düĢürür.
►Ölçme Yönteminin Bireyin Alacağı Puanı Etkilemesi: Bir derste yazılı yoklama, çoktan seçmeli
test ya da doğru-yanlıĢ testi gibi yöntemlerden birinin kullanılması öğrencinin alacağı puandaki
hata miktarını değiĢtirebilir.
>Ölçme aracında yer alan bütün sorular ölçülmek istenilen özellik ile ilgili olmalıdır.
>Ölçme aracında çok zor ya da çok kolay soruların olması geçerliği düĢürür. Sorular orta güçlükte
olmalıdır.
30
>Ġyi bir sınav planı hazırlanmalıdır.
►Bir ölçme aracı için en önemli özellik geçerliktir. Yani ölçme aracının amaca hizmet etme
derecesidir
►Güvenirlik geçerlik için bir ön koĢuldur ancak tek baĢına yeterli değildir.
►Güvenilir olan bir test her zaman geçerli olmayabilir ancak geçerli olan bir test mutlaka
güvenilirdir.
►Genel anlamda bir ölçme aracının güvenirliğini sağlayan bütün çalıĢmalar geçerliği de etkiler.
►Bazı durumlarda güvenirliği arttırmaya yönelik bir çalıĢma geçerliği düĢürebilir. ÖRN: Bir
testte aynı özelliği taĢıyan sorular çoğaltılarak (homojenlik) güvenirlik artırılabilir. Ancak bu
Ģekilde yapılan bir düzenleme de sorular hedef alanlarını ve konuları yeterince örnekleyemeyeceği
için testin kapsam geçerliği dolayısı ile geçerliği düĢmüĢ olur.
►Bir ölçme aracı için geçerlik katsayısı maksimum güvenirlik katsayısının kareköküne eĢittir.
►Bir öğretmenin her yıl aynı sınav sorularını sorması öncelikle geçerliği düĢürür. Soruların
öğrencilerin bildiği bir kaynaktan aynen alınıp kullanılması, sınavdan önce soruların verilmesi, sınav
süresi kısa olduğu için bazı soruların yanıtlanamaması, sınav süresinin gereğinden uzun olması
nedeni ile kopya çekilmesine fırsat verilmesi gibi durumlar geçerliği düĢüren nedenlerdir.
►Güvenirlik sadece tesadüfî hatalardan etkilenir. Geçerlik sabit ve sistematik hatadan doğrudan,
tesadüfî hatadan ise dolaylı olarak etkilenir.
GÜVENĠRLĠK GEÇERLĠK
Genellikle ölçme aracı ile ilgilidir. Ölçme iĢleminin amacı ile ilgilidir.
31
2007 / KPSS
Bir dersteki baĢarıyı ölçmek için geliĢtirilmiĢ beĢ testle ilgili olarak tablodaki bilgiler elde
edilmiĢtir.
1. Sınıfındaki öğrenciler arasında bu dersteki baĢarısı yüksek olanları seçmek isteyen bir
öğretmenin hangi testi kullanması en uygun olur?
A) 1 B) 2 C) 3 D) 4 E) 5
2. ―Bir testin güvenirliğinin yüksek olması, geçerli bir test elde etmek için yeterli değildir.‖
yargısını desteklemek için hangi test örnek gösterilebilir?
A) 1 B) 2 C) 3 D) 4 E) 5
3. Diğerlerinden daha kolay olduğu halde kabul edilebilir düzeyde güvenilir ve geçerli olan
test hangisidir?
A) 1 B) 2 C) 3 D) 4 E) 5
3) KULLANIġLILIK:
Bir testin kullanıĢlılığı güvenirliği ve geçerliğinden sonra düĢünülmesi gereken bir
özelliktir. KullanıĢlılık; bir testin kullanılmasındaki kolaylıktır. KullanıĢlılık özelliğine sahip bir
testin uygulanması emek, para ve zaman gibi faktörler açısından ekonomik sayılabilecek sınırlar
içindedir.
Kullanılması zor olan; ileri derecede uzmanlık gerektiren emek, para, zaman gibi açılardan ağır
sayılabilecek gerekçeleri olan bir test kullanıĢlı değildir.
►Hazırlanmasının kolay,
►Uygulanmasının kolay,
►Puanlanmasının kolay,
►Çoğaltılmasının kolay,
32
TESTLER VE TESTLERĠN SINIFLANDIRILMASI
Test: bireylerin belli özelliklerini ölçmek için düzenlenen ve onu alan herkes için aynı olan
sorulardan oluĢan bir ölçme aracıdır.
Testleri ölçmek istediği özelliğe göre ikiye ayırabiliriz:
1) Tipik DavranıĢ Testlerinde: Bu tür testlerde amaç, kiĢinin belli bir durumda nasıl davrandığını
ortaya çıkarmaktır. Tutum ölçekleri, ilgi ölçekleri ve kiĢilik ölçekleri bu gruba girer.
2) Maksimum Yeterlik Testleri: Bir kiĢinin bir iĢi belli bir durumda ne kadar iyi yada doğru
yapılabildiği belirlenmeye çalıĢılır. Bu da kendi içerisinde ikiye ayrılır:
* Özel Yetenek Testi: Sınırlı ve dar bir alanda sahip olunan zihin gücünü
ölçmek için düzenlenmiĢ testlerdir. Müzik yeteneği testi gibi.
b) BaĢarı Testi: KiĢinin bir eğitim süreci içinde ya da daha geniĢ anlamda çevre koĢulları
altında ne kadar öğrendiğini ölçen testlerdir. Bu testler bireylerin ileride ne kadar
öğrenebileceğini değil geçmiĢte ne kadar öğrendiğini ortaya çıkarmak için kullanılır. Örn:
öğretmenlerin sınıflarda uyguladığı testler baĢarı testidir.
Testler: Bir uygulayıcının bir defada uygulayabildiği kiĢi sayısı bakımından;
1) Bireysel Testler: Bir uygulayıcı tarafından bir defada yalnız bir kiĢiye uygulanabilen
testlerdir. KiĢinin okuma, konuĢma durumunu belirlemek için bireysel test kullanmak zorunludur.
Bireysel testlerde ürünle birlikte süreçte gözlenir. Stanford-Binet Zekâ testi, okuma testleri
örnek olarak verilebilir.
2) Grup Testleri: Bir uygulayıcı tarafından bir defada birçok kiĢiye uygulanabilir. Bu tür testler
daha çok okunduğunu anlama gücüne dayanır. Uygulanması ve planlanması oldukça kolay ve ucuzdur.
Bunlarda ürün gözlenebilir ancak süreç (davranıĢın ortaya çıkması) gözlenemez. Sınıfta
öğretmenlerce kullanılan bütün yazılı sınavlar bu gruba girer. ÖSS sınavında kullanılan testler.
2) Güç testleri: TanımlanmıĢ bilgi ve beceriler bakımından kiĢilerin baĢarı düzeyini ölçmeye
yöneliktir. Bu testler gittikçe güçleĢen bir seri sorudan oluĢur. Güç testinde cevaplayıcının her
soruyu cevaplamasına yetecek kadar zaman verilir. Ya da zaman sınırlaması hiç yoktur. Güç
testinde cevaplayıcının hızına değil kaç soruyu doğru cevapladığına bakılır. (BaĢarı testleri)
33
PuanlanıĢlarında puanlayıcının öznel kanı ve görüĢlerinin etkisi olup olmaması
bakımından testler OBJEKTĠF ve SUBJEKTĠF olarak ikiye ayrılır:
1) Objektif testler: Bir test, testin ölçtüğü alanda ve uzmanlaĢmıĢ olsun ya da olmasın herkesin
puanlayabileceği ve her kim puanlarsa puanlasın bir kiĢinin alacağı puan değiĢmeyecek Ģekilde
geliĢtirilmiĢse o test tamamen objektiftir. Doğru-yanlıĢ testleri, çoktan seçmeli testler büsbütün
objektiftir. Kısa cevap ya da tamamlama maddelerinin puanlanması kısmen objektiftir.
2) Subjektif Testler: KiĢinin alacağı puanın testi puanlayanın öznel kanı ve yargısından
etkilendiği testlere subjektif testler denir. Sözlü yoklamalar ve yazılı yoklamalarda belli bir
cevaba verilen puan: puanlayıcıdan puanlayıcıya değiĢir.
2) Dile Dayalı Olmayan Testler: Soruların ya da yönergelerin sunuluĢunda yazılı ya da sözlü tek
bir sözcük kullanılmaz. Bütün yönergeler demontrasyon ve pandomim ile sunulur. Okuma yazma
bilmeyenler, baĢka bir dil konuĢanlar ve sağırlar için bu tür testler kullanılmak zorundadır.
Performans testleri de denilen testlerin büyük bir kısmı, dile dayalı olmayan testler grubuna
girer. Bu testlerde kiĢilerden belli bir yol izleyerek belli bir ürün ortaya çıkarmaları istenir.
Burada kiĢinin bir iĢi yapıĢ Ģekli ve o iĢin kalitesi gözlenmek istenir.
Ölçülecek hedefin davranıĢsal olarak gözleniĢine göre testler 4 gruba ayrılır:
1) ÖzdeĢ Öğeler Testi: Test durumunda gözlenen davranıĢ asıl ölçülmesi düĢünülen davranıĢın
kendisidir. Bu tür testlerde ölçülen davranıĢlar doğrudan ölçülürler. Performans testleri.
2) Ġlgili DavranıĢ Testi: Burada kiĢiler gerçek iĢ koĢullarına benzetilmiĢ koĢullar içine sokulur ve
yapay durumda gözlenen davranıĢlardan onların gerçek yaĢam durumundaki baĢarıları yordanmaya
çalıĢılır. Tıpta kadavra üzerinde çalıĢma, pilotların eğitimi örnek olarak verilebilir.
34
2) Ehliyet Testleri: Bir öğrencinin öğrendiği esas konu içeriği yani daha üst düzeydeki ve daha
ileri öğrenmeler için temel olan bilgi ve beceriler oranını belirlemek için kullanılır.
Örn: Öğrenciler daha karmaĢık çarpma ve bölme iĢlemlerine geçmeden önce çarpım tablosunu
ezberlemiĢ olmalıdırlar.
3) Ölçme Testleri: Bir öğretim birimi sonunda ya da öğretim sürüp giderken her bir öğrencinin
baĢarısının kesin ölçüsünü elde etmeyi amaçlar. Değer biçmeye yönelik değerlendirmelerin
dayanacağı ölçümler bu testlerle elde edilir.
1) Testin Kullanılacağı Amaç Belirlenmelidir: Bu karar sınava iliĢkin verilecek kararlardan daha
önce gelmelidir. Çünkü sınavın amacına göre diğer hususlar değiĢecektir. ÖRN: Sınavın güçlük
derecesine karar verirken öncelikle sınavın amacına bakılır. Bir sınavın amacı Ģunlar olabilir:
Seçme, yerleĢtirme, öğrenme düzeyini belirleme, geçme, kalma kararını verme vb.
2001 KMS: Sınavların bir plana göre hazırlanması gerekir. Sınav planı adı verilen bu
hazırlıkta ilk olarak aĢağıdakilerden hangisi belirlenir?
D) Sınavın amacı *
E) Cevapları puanlama yöntemi
35
ÖRNEK:
-YaĢadığımız
çevre ünitesinde
*
geçen kavramların
anlam bilgisi
1 . ────
2 . Yoklanacak davranıĢların belirlenmesi
4 . ────
NOT: Bir soruya doğru cevap verenleri soruyu cevaplayanların sayısına bölersek o sorunun zorluk
(güçlük) derecesini bulmuĢ oluruz.
NOT: Sınavdaki soruların güçlük dağılımı ile ilgili genel olarak kabul edilen yaklaĢım Ģu Ģekildedir:
Soruların % 10‘u çok kolay; % 20‘si kolay; % 40‘ı vasat (orta); % 20‘si zor ve %10‘u çok zor
sorulardan oluĢmalıdır. Böyle bir baĢarı testi iyi bir ölçme aracıdır.
36
7) Sınavın Süresini Belirleme: Bir sınavın amacı, soru sayısı, zorluk düzeyi, soru tipi öncelikle ve
sınava giren öğrencilerden en zayıf olan öğrencinin durumu dikkate alınarak bir düzenleme yapılır.
8) Soru (madde) Yazımı: Bir test planlanırken madde yazma aĢamasında, sınav sorularının kimin
tarafından yazılacağı ve yazılmıĢ olan sorulardan hangilerinin sınava dahil edileceği belirlenir.
12) Uygulama
* Soru kâğıdından veya kitapçığından ayrı bir cevap kâğıdı kullanılıp kullanılmayacağı karara
bağlanmalıdır.
ÖRN: Bir doğru yanlıĢ testinde doğru cevabın Ģansla bulunma olasılığı 1/2‘dir. BeĢ seçenekli
çoktan seçmeli bir soruda ise bu olasılık 1/5‘tir. Test puanına Ģans baĢarısından ileri gelen bir
hata karıĢmıĢsa bu test puanının GEÇERLĠĞĠNĠ düĢürür. Bir cevaplayıcının seçmeli testlerden
elde ettiği toplam puanını Ģans baĢarısından arıtmak için düzeltme formülü adıyla bilinen formül
kullanılır.
Düzeltme formülünün uygulanıp uygulanmayacağına iliĢkin karar test uygulanmadan önce verilmiĢ
olmalıdır. Bu karar test yönergesinde de belirtilmelidir.
YanlıĢ
DüzeltilmiĢ Puan = Doğru Sayısı - ———————
Seçenek Sayısı – 1
ÖRNEK: Her biri 5 Ģıklı 100 çoktan seçmeli maddeyi kapsayan bir test uyguladığımızı düĢünelim.
Bir öğrenci bu testte 60 maddeyi doğru cevaplandırmıĢ, 32 maddeyi yanlıĢ cevaplandırmıĢ ve 8
maddeyi de cevapsız bırakmıĢ olsun. Bu öğrencinin düzeltilmiĢ puanı kaçtır?
32
Bu öğrencinin düzeltilmiĢ puanı = 60 ─ ——— = 52
5–1
Düzeltme formülünün uygulanması öncelikle testin güvenirliğini etkiler.
37
Kısaca özetlersek bir sınav planı aĢağıdaki 13 basamaktan oluĢmaktadır:
1) Sınavın amacını belirleme,
2) Ölçülecek davranıĢların belirlenmesi,
3) Belirtke tablosunun hazırlanması,
12) Uygulama,
1) YAZILI YOKLAMALAR (Uzun Yazmalı Sınavlar –Essey Tipi, Klasik Tip – Kompozisyon Tipi)
Eğitimde en sık kullanılan eğitim aracıdır. Bunun nedeni bu sınav türünün hazırlanmasının
kolay olması, uzun zaman almaması ve öğretmenlerce iyi biliniyor olmasıdır. Bu tür sınavlar
soruların bir kâğıtta yazılı olarak verilmesi ve cevapların yazılı olarak istenmesi Ģeklinde uygulanır.
Yazılı yoklamaların en önemli avantajı bilgi düzeyinin üstündeki üst düzey zihinsel iĢlemler
(uygulama, analiz, sentez, değerlendirme, organize etme, orijinal görüĢ ve ürünler ortaya
koyabilme ) gerektiren türdeki hedefleri ölçebilmesidir.
Yazılı Yoklamaların Özellikleri:
38
* Bu sınav türüyle kompozisyon becerileri ya da bilgiyi sentez etme yeteneklerinin ölçülmesi
durumunda yazılı sınavların yeri önemlidir.
Yazılı Sınavların Kullanılacağı Durumlar:
* Sınav sorularını hazırlamak için az zaman olduğunda,
* Öğretmen; çoktan seçmeli test ve diğer sınav türlerini geliĢtirmede yeterli değilse kullanılabilir.
* Yazılı kâğıdı okunurken öğrencinin isminin olduğu bölüm kapatılmalı yani objektif olunmalıdır,
* Öğrenci bir sorunun cevabını bir baĢka sorunun cevabı içinde veriyorsa puan kırılmalıdır,
* Sınavda kullanılacak soru sayısının üç katı kadar soru hazırlanıp, bunlar arasından sorulacak
sorular seçilmelidir,
39
3)Sınıflama Yolu ile Puanlama: Sınav kâğıtları genel izlenimle okunur kâğıtlar iyi, kötü, orta
Ģeklinde gruplara ayrılır. Daha sonra puanlama yapılır.,
4)Anahtarla Puanlama: Soruları hazırlayan kiĢinin sorularda mutlaka bulunması gereken yanıtları
içerecek Ģekilde cevap anahtarı hazırlayıp sınav kâğıtlarını bu anahtara göre değerlendirmesidir.
En sağlıklı puanlama cevap anahtarına göre yapılan puanlamadır.
2002 KPSS: Bir öğretmen yalnızca “yazmalı bir yazılı sınav” hazırlamak istemektedir.
AĢağıdakilerden hangisi bu sınavdan elde edilecek puanların güvenirliğini ve geçerliğini
artırmaz?
A) Çabuk cevaplanabilen türden çok sayıda soru sorulması ve sınavın bir süre
sonra tekrar uygulanması
Cevabı bir kelime, bir cümle, bir tarih ve birkaç madde olan sorulara kısa cevaplı testler
denir. Bu tür testlerde düz ifadeli bir cümle hazırlanır. Sonra bu düz cümlenin içinden bir kelime
çıkarılır ve boĢluğu öğrencinin tamamlaması istenir. Yazılı yoklamalardan farkı cevabın en fazla bir
cümle olması, seçmeli testlerden farkı ise cevabın öğrenciye verilmeyip kendisinin yazmasıdır.
40
ÖZELLĠKLERĠ:
* Öğrencilerin KĠLĠT KAVRAMLARI, TANIMLARI, ĠFADELERĠ bilip bilmediklerini ölçme imkânı
verir.
* Yazılı yoklamaların alternatifi olan bir sınav türüdür.
* Puanlanması kolaydır.
2) Puanlama yazılı sınavlara göre daha objektiftir. Geçerlik ve güvenirlik yazılı yoklamalardan daha
yüksektir.
4) Ġmla, yazı güzelliği gibi yanlılık oluĢturacak etkenlerin puanlamaya katılması engellenir.
* BoĢluk doldurmalı türdeki sorularda boĢluklar mümkün olduğu kadar cümle sonuna bırakılmalıdır.
* BoĢluklar doğru cevabın sığacağı kadar olmalıdır.
* Her soruda mümkünse tek boĢluk olmalıdır.
* Eğer boĢluğun birden çok kelime ile doğru cevaplanma ihtimali varsa bunların tümü doğru kabul
edilmelidir.
41
* Fazla uzun ifadeler kullanılmamalıdır.
* Sorular birbirine cevap verir nitelikte hazırlanmamalıdır.
* Sorular ayrıntıya değil konulardaki TEMEL NOKTALARA dayalı olmalıdır.
* Kitap ifadeleri aynen kullanılmamalıdır böyle bir hata öğrencileri ezber yapmaya yöneltir.
2008 KPSS:
E) Sözlü
Öğrencinin belli konulardaki yanlıĢ veya doğruları ayırt edebilme gücünü ölçmek amacıyla
bir kısmı doğru bir kısmı yanlıĢ önermelerden oluĢan testlerdir. Öğrenciden hangi cümlenin doğru
ya da yanlıĢ olduğunu bulması istenir.
ÖZELLĠKLERĠ:
* Doğru yanlıĢ testlerindeki maddeleri cevaplama iĢi hem kolaydır hem de çok az zaman alır. Bu
özelliklerden dolayı bir sınav süresi içinde diğer bütün tekniklere kıyasla daha fazla soru sorma
imkanı ortaya çıkar. Bu durum, bu tür testleri kapsam geçerliği en yüksek teknik haline getirir.
* Puanlanması kolay, çabuk ve objektiftir.
* Yalnızca iki seçenek olduğu için Ģansla puan elde etme ihtimali yüksektir. (% 50)
42
* Bir doğru yanlıĢ testi öğrencilerin yanlıĢ öğrendikleri yerleri ortaya çıkarmaya elveriĢli değildir.
* Kullanılacak ifade mutlak anlamda doğru yada yanlıĢ olmak zorundadır.
* Bu sınav türü eğitimin alt ve üst basamaklarında kullanılabilir.
* Cevaplanması çok zaman gerektirmediğinden çok geniĢ bir bilgi alanı yoklanabilir.
→ Ders kitabından kalıp halinde ifade cümleler alınarak madde ve cümle yazılmamalıdır. Bu durum
öğrenciyi ezbere teĢvik eder.
43
4) ÇOKTAN SEÇMELĠ SINAVLAR
Bir soru kökü ve muhtemel cevaplardan oluĢan sınav tipidir. Bu sınav tipinde öğrenci
verilen açıklama ve soru köküne göre en uygun veya doğru cevabı seçer. Çoktan seçmeli testler
madde kökü, seçenekler (cevap Ģıkları), anahtarlanmıĢ cevap (doğru cevap) ve çeldiriciler olmak
üzere madde formunu oluĢturan 4 öğeden oluĢmaktadır.
2) Bu sınav geniĢ bir öğrenme alanı kapsayacaksa, çok sayıda soru kullanılması gerekiyorsa içeriği
iyi örnekleyebilme özelliğini taĢıdığı için bu tür testler tercih edilmelidir.
3) Yapılan sınavın sonuçlarına dayalı olarak öğrenci hakkında çok önemli kararlar verilecekse ve bu
yüzden sınavın yüksek bir puanlama güvenirliğine sahip olması isteniyorsa çoktan seçmeli test
tercih edilmelidir. (Örn: ÖSS)
* Çoktan seçmeli testler eğitimde en çok kullanılan testlerdir. Bunun sebebi objektif puanlama
yapabilmesi, çok sayıda sorunun tek oturumda kalabalık gruplara uygulanması, Ģans baĢarısına
daha az yer vermesi ve benzeri olabilir.
* Çok sayıda soru sorulması mümkündür. Böylece güvenirlik ve kapsam geçerliği yükselir.
44
* Cevaplaması kısa süre alır.
* ġans baĢarısı vardır, seçenek sayısı artırıldıkça Ģans baĢarısı azalır.
ÇOKTAN SEÇMELĠ TESTLERDE DĠKKAT EDĠLECEK NOKTALAR:
→ Bu tür sorularda kök cümle mümkün olduğu kadar soru cümlesi olmalıdır.
→ Madde kökünde mümkün olduğunca olumsuz ifadelere yer verilmemelidir. Eğer olumsuz kök
yazılmak zorunda kalınırsa olumsuz ifadenin altı çizilmeli ya da koyu yazılmalıdır.
→ Muhtemel cevapların hepsi kısmen doğru ise en doğru cevabın seçilmesi gerektiği sorunun kök
kısmında belirtilmelidir.
A) ------------------- KÖK
a) A)---------------- KÖK
b) a) b) c)
c) Cevap Ģıkları d) e)
d)
e)
45
→ Testin tekrar tekrar kullanılabilmesi için mutlaka bir cevap kâğıdı hazırlanmalıdır.
→ Soru kâğıtları a-b-c gibi gruplara ayrılarak öğrencilerin kopya çekmesi engellenmelidir.
ÇOKTAN SEÇMELĠ MADDE ÇEġĠTLERĠ
1) MADDE KÖKÜ SORU KĠPĠNDE OLANLAR: Adından da anlaĢıldığı gibi bu tür sorularda
madde kökü bir soru cümlesidir. Ġkiye ayrılır:
a) Olumlu soru kipindeki maddeler: AĢağıdakilerden hangisidir? Hangisi söylenebilir? Hangisi
doğrudur? Gibi olumlu soru kipleriyle cümle tamamlanır.
2) MADDE KÖKÜ EKSĠK CÜMLE OLANLAR: Belli bir maddenin bir kısmı madde kökünü, ikinci
kısımda seçenekleri oluĢturmaktadır.
ÖRNEK:
Genel anlamda geçerlik, bir testin;
3) TEK BĠR DOĞRU CEVAP ĠSTEYENLER: Seçeneklerden yalnızca bir tanesi kesin doğru
cevaptır. Çeldiriciler kesinlikle yanlıĢtır.
ÖRNEK:
AĢağıdakilerden hangisi ölçme araçlarında bulunması gereken en önemli niteliktir?
4) EN DOĞRU CEVABI ĠSTEYENLER: Seçeneklerin hepsi kısmen doğru ama biri diğerlerine
oranla daha doğrudur.
ÖRNEK:
46
5) ORTAK KÖKLÜ MADDELER: Bir paragraf, bir tablo, bir grafik verilir ve verilen bu materyal
üzerinden maddeler hazırlanır. KiĢinin öğrendiklerini hatırlama ve tanıma gücünün ötesinde, üst
düzeydeki zihinsel yetenekleri ve becerileri ölçmeye daha elveriĢlidir.
ÖRNEK:
Dersler X K
Fizik 60 110
Kimya 68 130
Biyoloji 36 80
Tarih 52 120
Matematik 52 100
Yukarıdaki tabloda 5 derse ait aritmetik ortalama ve soru sayıları verilmiĢtir. 1., 2.
ve 3. sorular bu tabloya göre cevaplanacaktır.
2008 KPSS: Bir ölçme uzmanı Fen ve Teknoloji dersi için hazırlanan baĢarı testini incelemiĢ ve
ortak köke dayalı soruların 5 – 6 civarında olduğunu saptamıĢtır. Bu durumu eleĢtiren uzman, bir
A) Öğrencilere aynı kökle ilgili çok sayıda soru sormak motivasyonu düĢürür.
B) Sorular tek bir test yaprağına sığmayacağı için test düzeni bozulabilir.
6) ORTAK SEÇENEKLĠ MADDELER: Birkaç maddenin seçenekleri aynı olduğu zaman seçenekleri
her madde sonunda tekrarlamak yerine maddelerin ortak seçenekleri baĢa yazılır. Madde
köklerinin altına bir daha tekrarlanmaz. Teste ekonomiklik sağlar.
ÖRNEK:
47
* Çok sorudan oluĢtuğu için kapsamı geniĢ, geçerliği ve güvenirliği en yüksek sınav türüdür.
* Bu sınav türünde elde edilen verilerle birçok istatistikî iĢlem yapılabilir.
* Tüm öğretim kademelerinde kullanılabilir.
* YanlıĢ öğrenmelerin belirlenmesinde iyi bir tekniktir.
→ Soruların farklı gruplar halinde hazırlanmaması durumunda kopya çekilmesi ihtimali vardır.
2006 KPSS: Çoktan seçmeli bir test maddesini cevaplayan bir kiĢinin çeldiricileri eleyerek
doğru cevaba ulaĢmasında, aĢağıdakilerden hangisi belirleyici olmalıdır?
A) Ġfadelerin, kök ifadesiyle tutarlılığı
B) Seçeneklerin soyutluk-somutluk derecesi
C) Yoklanan davranıĢın öğrenilmiĢ olması
D) Seçeneklerin birbirini içerip içermemesi
E) Ġfadelerin kısalık ve uzunluğu
2006 KPSS: Test maddesinde, ders kitabından aynen alınan ifadelerin kullanılması eğitimsel
doğurguları açısından nasıl bir etki yaratır?
A) Maddeyle yoklanan davranıĢ hatırlama düzeyinde kalır.
B) Kitabı okumamıĢ öğrenci maddeyi kesinlikle cevaplayamaz.
C) Maddenin anahtarlanması kolaylaĢır.
D) Maddenin okunup anlaĢılması zorlaĢır.
E) Maddede gereksiz ipuçları bulunmaz.
2007 KPSS: Çoktan seçmeli bir testteki sorularda, çeldiricilerin doğru cevaba anlamca
yaklaĢtırılması bu testin hangi özelliğini doğrudan etkiler?
48
2009 KPSS SORU: Bu yıl yükseköğretim programına alınan 120 öğrenci, çoktan seçmeli bir yabancı dil
testine alınacaktır. Bu testten en yüksek puanı alan 40 öğrenci öğrenimlerine birinci sınıftan baĢlayacak;
diğer 80 öğrenci ise hazırlık sınıflarında bir yıl yabancı dil eğitimi alacaklardır.
Bu süreçte, ölçme değerlendirme ilkelerine aykırı olan durum aĢağıdakilerden hangisidir?
A) Puanlamada objektifliğin sağlanamaması
B) Ölçme aracı olarak çoktan seçmeli testin kullanılması
C) Testin puanlanmasında Ģans baĢarısından arıtma yöntemi uygulanmaması
D) Birinci sınıfa seçilen öğrenci sayısının az olması
E) Ölçüt dayanaklı ölçme yapılması gerekirken norm dayanaklı ölçme yapılması
5) EġLEġTĠRMELĠ TESTLER
Bu tür sınavlarda iki bölümde verilen bilgiler, kelimeler, numaralar, semboller eĢleĢtirilir.
Öğrencilerin bilgiler, nesneler, olaylar hakkında iliĢki kurma güçleri ölçülür.
ÖZELLĠKLERĠ:
1) Bu tür testlerde maddeler iki sütun halinde sıralanır. Sol taraftaki sütuna ifadeler sağ
taraftaki sütuna cevaplar denir. Öğrencilerden ifadelerin cevaplarını bulmaları istenir.
4) Doğru cevabı vermede Ģans faktörü diğer test türlerine göre azalmıĢtır.
ELEġTĠRMELĠ TESTLER HAZIRLANIRKEN DĠKKAT EDĠLMESĠ GEREKENLER
ÖRNEK:
Öncüllerde roman adları, seçeneklerde ise yazarların adları verilmiĢtir. Romanların kimler
tarafından yazıldığını belirledikten sonra, o yazarın önündeki harfi ilgili romanın solundaki
parantez içine yazınız.
ÖNCÜLLER SEÇENEKLER
H) Zola
49
→ Her eleĢtirmeli soru grubu mümkün olduğu kadar aynı konuda olmalıdır.
→ Ġfadelerin ve cevapların açık, anlaĢılır ve kesin bilgiyi yoklayıcı özellikte olması gerekir.
EġLEġTĠRME SINAVLARININ YARARLI YÖNLERĠ:
6) SÖZLÜ SINAVLAR
Soruların genellikle sözlü sorulduğu ve cevaplarında sözlü verildiği sınav çeĢidine sözlü
yoklama denir. Eğitimde kullanılan ilk sınav türüdür.
Sözlü Yoklamanın Kullanılacağı Durumlar: Anadili ve yabancı dil konuĢma gücü gibi özellikler
ancak sözlü yoklama yolu ile ölçülebilir. Yani kelimeleri doğru telaffuz ederek, cümle içinde kurala
uygun Ģekilde yerine koyarak gereken hızda ve akıcılıkta, mantıksal, etkili konuĢma gücü ancak
sözlü yoklamalar ile ölçülebilir.
SÖZLÜ YOKLAMALARIN ÖZELLĠKLERĠ:
1) Sözlü sınavların diğer sınav türlerine üstünlüğü sözlü performansın vurgulandığı davranıĢların
baĢka bir teknikle ölçülememesidir. Bu yüzden Ġngilizce ve Türkçe gibi sözlü ifade becerisini
ölçmeyi ve geliĢtirmeyi amaçlayan derslerde kullanılabilir.
2) GeliĢtirilmesi çok uzun zaman isteyen bir yoklamadır. Bunun nedeni her bir öğrenciye ayrı
zaman ayrılması zorunluluğudur.
50
SÖZLÜ SINAVLARIN UYGULANMASINDA DĠKKAT EDĠLECEK NOKTALAR:
→ Sözlü sınavlar mevzuat gereği öğretmenler tarafından kullanılmak zorundadır. Bunun için bu
sınavların kendi niteliklerinin elverdiği ölçüde geçerli ve güvenilir olması sağlanmalıdır.
→ Önce sınav planı hazırlanmalıdır.
→ Sorular sınavdan önce hazırlanmalı. Sınav esnasında akla gelen sorular öğrencilere
yöneltilmemelidir.
→ Her öğrenciye aynı soru sorulmamalıdır.
→ Sözlü sınava katılacak öğrenci sayısı birden fazla ise aynı düzeyde sorular hazırlanmalıdır.
→ Sınav yapacak öğretmenin sınava girecek öğrenci ile aynı ortamda olması gerekir.
→ Sınavda sorulacak soruların cevapları önceden listelenmeli, muhtemel tüm cevaplar çıkartılarak
kaç puan verileceği önceden tespit edilmelidir.
→ Öğrencilere kitaptaki ifadeleri ezbere söyleyeceği türden sorular sorulmamalıdır.
→ Küçük yaĢtaki çocukların yazı yazma becerileri tam olarak geliĢmediğinden sözlü sınavlar
yapmak daha uygundur.
→ Öğrencilerin bilgi ve kavram yanlıĢlığının anında belirlenme imkânının olduğu tek sınavdır.
7) ÖDEV VE PROJELER
Bir konu hakkında derinlemesine inceleme yapılması amacıyla verilen soru veya sorulara
ödev ya da proje adı verilir. Ödev ve projeler bireysel olabileceği gibi birden çok öğrencinin
birlikte yapabileceği çalıĢmalar Ģeklinde de olabilir.
Bir ölçme yöntemi olmayan ödev ve projeler geleneksel olarak ilk ve orta öğretimde
kullanılmaktadır. Bu nedenle bu tür çalıĢmaların puanlanmasında da bazı niteliklere dikkat edilmesi
gerekir.
Ödev ve projelerle öğrencilerin birçok çalıĢma yapması, üst düzeyde beceriler göstermesi
beklenir. Bu becerilerin geliĢtirilmesi ve ölçülüp değerlendirilmesi ders saatlerinde mümkün
olmamaktadır. Çünkü öğrenci bu tür çalıĢmaları daha çok sınıf dıĢında yapar ve okul dıĢındaki
birçok kaynaktan yararlanır. Öğrencilerin birçok becerisinin geliĢtirilmesi açısından ödev ve
projeler hem yararlı hem de gereklidir.
Ödev ve projelerin öğrencilerin kendileri tarafından yapılıp yapılmadığının kontrol edilmesi
zordur. Bu nedenle ödev ve projelerin geçerliliği düĢüktür. Ödev ve projelerin puanlanmasında
öğretmenin takdir hakkı diğer ölçme araçlarına göre daha fazladır. Bu durum ödevlerin
51
puanlanmasında güvenirliğin düĢmesine neden olur. Bu nedenle ödev ve projeler bir ölçme aracı
olarak kullanılmaktan çok bir öğrenme aracı olarak kullanılmalıdır.
Ödev ve projelerin verilmesinde dikkat edilecek noktalar:
1) Her öğrenciye veya her gruba farklı ödevler verilmelidir.
3) Ödev ve projelerin içeriği çok iyi saptanmalı ve sınırları çok iyi çizilmelidir.
4) Ödev ve projelerin nasıl puanlanacağına iliĢkin bir puanlama anahtarı hazırlanmalı ve bu anahtar
öğrencilere de verilmelidir.
Öğrencinin yeteneği tek bir zamanda ölçülür Öğrencinin yeteneği süreç içinde ölçülür
Öğrencilerin grup içinde bir grup tayin eder Öğrencini bireysel değerlendirmesi söz
konusudur
Öğrencinin dil yeteneğinin ranjını yakalamaz Dil öğrenme performansını çoğu yönüyle
yakalar
1) Öğretmen, öğrenci, öğretmen ve öğrenci veya aileler tarafından seçilen bazı çalıĢmalar
Ģunlardır:
►Öğrencinin yazma becerisindeki geliĢimini yansıtan yazılı ödevler (yazdığı hikâyeler, kitap
raporları, araĢtırma raporları, günlük tutma vb…)
52
►Öğrencinin ürettiği sanatsal iĢler,
2) Öğrencinin yaptığı çeĢitli çalıĢma örneklerine yönelik olarak yapılan eleĢtirilerin yer aldığı
yazılar,
3) Öğrencinin ilerleyiĢine yönelik olarak öğrenci ve öğretmen iĢbirliği ile hazırlanan geliĢim
raporları,
4) Öğretmenin gözlemlerine dayalı olarak tuttuğu notlar,
5) Aile öğretmen görüĢmeleri sonucunda tutulan notlar,
Eğitim – Öğretim Sürecinde Portfolyoların Kullanılma Amacı ve Temel Ġlkeleri ise Ģunlardır:
►Öğrencinin öğretim programı dıĢındaki faaliyetlerini de kapsayan çok yönlü geliĢimi hakkında
bilgi vermek,
53
ÖZ DEĞERLENDĠRME: Belli bir konuda bireyin kendi kendisini değerlendirmesine öz
değerlendirme denilmektedir.
2008 KPSS:
Öğrencilerin belli bir konuda kendileriyle ilgili bilgi, beceri, tutum ve davranıĢlarını
yorumlamalarına ………………; araç-gereç kullanma, deney yapma, ya da proje hazırlama vb.
becerilerinin puanlama kriteri kullanılarak değerlendirilmesi sürecine…………………. denir.
54
►Öğrencilerin arkadaĢlarının geliĢimi ve onlarla ilgili duygu ve düĢüncelerini yansıttığı akran
değerlendirme formlarını doldurma,
Portfolyo da genel olarak Ģu incelemeler yapılır:
Öğrenci ne öğrendi? Öğrenme sürecinde izlediği yollar nasıl idi? Yeteneklerini kullanabildi mi?
Nasıl düĢündü? Hangi soruları sordu? Bilgiyi ne Ģekilde yapılandırdı? ĠĢbirlikçi çalıĢabildi mi?
ĠletiĢim becerilerini kullanabildi mi? KarĢılaĢtığı güçlüklere karĢı ne yaptı?
NOT: Portfolyo değerlendirmede öğrenci ne biliyor sorusuna cevap aranır. Diğer ölçme
araçlarının sorduğu hangi öğrenci daha çok biliyor sorusu portfolyoda kullanılmaz. Yani
portfolyoda öğrenciler arasında rekabet söz konusu değildir.
Portfolyonun Sınırlılıkları:
☻Portfolyolara konulacak her bir çalıĢma için ölçüt geliĢtirilmesi ve bu ölçütlere göre
değerlendirme yapılması zaman alıcıdır.
2009 KPSS SORUSU. Fen ve teknoloji öğretmeni, öğrencilerin sınıf içi baĢarılarını yazılı ve
sözlü yoklamalarla değerlendirmekte, öğrencilerin, hazırladıkları ürün dosyalarıyla
değerlendirilmesine ise daha az yer vermektedir.
Bu öğretmen aĢağıdakilerden hangisine daha çok önem vermektedir?
A) Öğrencinin kendi öğrenmeleriyle ilgili güçlü ve zayıf yönlerini analiz etmesini sağlamaya
B) Öğrencilerin bireysel geliĢim aĢamalarını izlemeye
C) Öğrencileri baĢarılarına göre sıralamaya
D) Öğrencide sorumluluk bilincini geliĢtirmeye
E) Öğrencilere günlük hayata dair beceriler kazandırmaya
2009 KPSS SORUSU Mehmet Öğretmen hazırladığı bir Türkçe sorusunda bir sözcüğün cümlede
hangi anlamda kullanıldığını sormuĢtur.
Mehmet Öğretmen, bu sorusuyla aĢağıdaki süreçlerden hangisini ölçmek istemektedir?
A) Metin içerisinde açıkça verilmiĢ bilgiden doğrudan çıkarım yapma
B) Metinde kullanılan cümle yapısını irdeleme
C) Bilgi ve fikirleri yorumlama ve birleĢtirme
D) Metnin kapsamını ve dilini gözden geçirme ve değerlendirme
E) ĠliĢki kurma ve karar verip çözümleyebilme
55
AKRAN DEĞERLENDĠRME FORMU
Değerlendiren öğrencinin;
1. Grubumuzdaki Öğrenciler
2. ArkadaĢım
2. ArkadaĢım
2. ArkadaĢım
1. ArkadaĢım
2. ArkadaĢım
1. ArkadaĢım
1. ArkadaĢım
1. ArkadaĢım
Ben
Ben
Ben
Ben
Etkinliğe katılımda gönüllüdür.
ÖRNEK: Öğrencinin kendi çalıĢmalarının değerlendirilmesine katılmasını, her bir öğrencinin kendi
ilerleyiĢini izlemesini ve öğretmenlerin bireysel olarak öğrencilerinin geliĢimlerini takip etme
olanağı sağlar. Yukarıda açıklaması verilen değerlendirme türü aĢağıdakilerden hangisidir?
A) Portfolyo *
B) Gözlem
C) Beceri Testi
56
2006 KPSS: Öğrencinin belirli bir süreçteki geliĢimini incelemek amacıyla geliĢtirilen bireysel
yapmaları beklenmez?
A) Performans değerlendirme
B) Akran değerlendirme
C) Mutlak değerlendirme
D) Tümel (portfolyo) değerlendirme
E) Bağıl değerlendirme
2008 KPSS: Dönem boyunca az sayıda sınav yapıp, öğrencilerin öz değerlendirme ve akran
değerlendirme formlarını, performanslarını ve hazırladıkları ürün dosyalarını değerlendirmeye
daha çok zaman ayıran bir öğretmen bu uygulamasıyla aĢağıdakilerden hangisine en az hizmet
eder?
2009 KPSS SORUSU: • Portfolyolardan elde edilen puanlarla aynı konulara iliĢkin hazırlanmıĢ objektif
testlerden elde edilen puanlar arasındaki iliĢkinin incelenmesi
• Portfolyolardan elde edilen puanlarla bu portfolyonun kapsamına iliĢkin daha sonradan ortaya çıkacak
performans ölçüleri arasındaki iliĢkinin incelenmesi
• Farklı öğretmenlerin aynı portfolyolara verdiği puanlar arasındaki iliĢkinin incelenmesi
Portfolyo değerlendirmesine iliĢkin yukarıda verilen yöntemler aĢağıdaki amaçlardan daha çok hangisini
gerçekleĢtirmek için kullanılmaktadır?
A) Portfolyo değerlendirmesinde kullanılacak puanlama yönergelerini hazırlamak
B) Portfolyolardan elde edilen verilerin güvenirliğini ve geçerliğini sağlamak
C) Öğrencilerin iĢlenen konulara iliĢkin öğrenme düzeylerini saptamak
D) Öğrencilerin sergileyebileceği en iyi çalıĢmaları belirlemek
E) Öğrencilerin önceki eğitim hayatında gösterdikleri performansı ortaya çıkarmak
57
PERFORMANS DEĞERLENDĠRME
Performans değerlendirme, öğrencilerin; zeka, öğrenme türleri gibi bireysel özellikleri
dikkate alınarak, bunları eyleme dönüĢtürmelerini sağlayacak (gerçek yaĢama aktaracak) durum ve
ödevler olarak tanımlanabilir. Bu değerlendirmeler süreç içerisine yayılmıĢtır, gözlenebilen bir
performans veya somut bir ürünle sonuçlanmaktadır.
Bu değerlendirme biçimi; analiz yapma, yorumlama, araç-gereç kullanma, deney yapma, proje
hazırlama gibi öğrencinin süreç içinde beceri geliĢimini izlemeye olanak tanıyan bir değerlendirme
yaklaĢımıdır.
Performans değerlendirmede öğrenci çalıĢmaları değerlendirilirken, DERECELĠ
PUANLAMA ANAHTARI, DERECELENDĠRME ÖLÇEKLERĠ, KONTROL LĠSTESĠ, ÖZ-AKRAN
DEĞERLENDĠRME FORMLARI KULLANILMAKTADIR.
☻Öğrencilerin geliĢimini yani ne yaptığını değil, nasıl yaptığını gözlemek için ideal bir yaklaĢımdır.
☻Öğrenci merkeze alınır. Ġlgi, öz güven ve güdülenme düzeyi artar.
☻Öğrencilerin bilgiyi kullanmasını ve gerçek yaĢam durumlarına yakın ürünler ortaya koymasını
sağlar.
2008 KPSS: AĢağıdakilerden hangisi performans değerlendirmesini gerektiren bir durumdur?
58
2008 KPSS: Öğrencilerin belli bir konuda kendileriyle ilgili bilgi, beceri, tutum ve davranıĢlarını
yorumlamalarına ………………; araç-gereç kullanma, deney yapma, ya da proje hazırlama vb.
becerilerinin puanlama kriteri kullanılarak değerlendirilmesi sürecine…………………. denir.
2009 KPSS SORUSU: Fen ve teknoloji dersine ait bir kazanım Ģöyledir: ―Farklı yoğunluğa sahip
sıvıların cisimlere uyguladığı kaldırma kuvvetini karĢılaĢtırır ve sonuçları yorumlar.‖
Bu kazanımın ne ölçüde edinildiğini belirlemek isteyen bir öğretmen aĢağıdaki uygulamalardan
hangisini gerçekleĢtirmelidir?
A) Çoktan seçmeli test
B) YapılandırılmıĢ grid
C) Kavram haritası
D) Performans değerlendirme
E) Sözlü sınav
59
2) Tutum Ölçekleri
Tutumlar da öğrenci baĢarısını etkileyen duyuĢsal özelliklerden biridir. Bir öğrenci bir derse, bir
öğretmene karĢı olumlu bir tutuma sahipse o derse daha çok çalıĢır, onu diğer derslerden ayrı
tutar ve o derste daha baĢarılı olur.
Öğrencilerin belli konulara karĢı tutumları, ilgili konuda belirttiği düĢüncelerinden, onları
gözleyerek, kompozisyon yazdırarak belirlenebilir.
3) Gözlem Tekniği
Planlı ve sistemli bir veri toplama tekniği olan gözlem; bir olay, bir durum, bir kiĢi vb. hakkında
bilgi toplamada izlenen yol olarak tanımlanabilir. Gözlem doğrudan duyu organlarıyla yapılabileceği
gibi çeĢitli araçlar yardımıyla da yapılabilir. Araç kullanılarak yapılan gözlemler, gözlemlerin daha
duyarlı yapılmasını, daha geçerli ve güvenilir sonuçlar elde edilmesini ve sonuçların birbirleriyle
karĢılaĢtırılmasında bir standart oluĢmasını sağlar.
1) Ġġ PERFORMANS TESTLERĠ
Özellikle psiko-motor düzeydeki hedeflerin (becerilerin) ölçülmesinde kullanılan bir test
türüdür. ĠĢ-performans testleri Ģu olanakları gerçekleĢtirme gücüne sahiptir:
1) ĠĢ testleri ile anılan performans testleri öğrencilerin bazı becerileri yapma kabiliyeti hakkında
uygulanan diğer araçlardan daha objektif, güvenilir ve geçerli ölçüler sağlar.
2) Dikkatli bir Ģekilde hazırlanmıĢ iĢ testlerinden elde edilen sonuçlar öğrenimin ne derece etkili
olduğu ve hangi hususlar üzerinde daha fazla durulması gerektiği hakkında öğretmeni aydınlatır.
Yine aynı Ģekilde bir iĢ testi üzerinde çalıĢmak ve sonuçlarını tahlil etmek öğrenciye kendi
kuvvetli ve zayıf yanlarını tahlil etme imkânı verir.
3) ĠĢ testleri öğretim sonuçlarını doğrudan doğruya çalıĢma veya uygulama esnasında ölçerler.
60
PERFORMANS TESTLERĠNĠN SINIRLI YÖNLERĠ
1) Testin uygulanması fazla zaman gerektirir.
2) Testin uygulanması sırasında gerek test almayı bekleyen gerekse testi tamamlayan öğrenciler
ile ilgili olarak bazı disiplin sorunları ile karĢılaĢılabilir.
2) ÇETELEME ARACI
Gözlenecek davranıĢların varlığını ‗x‘ , ‗evet‘ ,‘gözlendi‘ gibi iĢaret veya kelimelerle
gösterilmesine olanak sağlayan, fakat gözlenen davranıĢın derecesini belirtmeyen araç tipidir.
Çeteleme araçları bir beceriyi oluĢturan birimlerin öğrenci tarafından yapılma derecesi hakkında
bilgi vermez.
3) DERECELENDĠRME ÖLÇEKLERĠ
Gözlenen beceri veya davranıĢın karĢılanma derecesinin belirlenmesini sağlayan araçlardır.
Derecelendirme ölçeklerinin hazırlanmasında aĢağıda verilen basamakların izlenmesi uygun
olur.
1. Ürün bölünebildiği ölçüde alt bölümlere ayrılmalı, ürünü oluĢturan öğeler ayrıntılı olarak
belirlenmelidir.
4. Puanlamada ürün özellikleri istenilen nitelikte taĢıyorsa 1;hiç taĢımıyorsa 0 puan verilir.
Belli oranlarda ise 3, 2 ve 1 puan verilir. Bu sayılar pekiyi,iyi,orta ve zayıf olarak sıfat
haline dönüĢtürülebilir.
61
DERECELEME ÖLÇEĞĠ
Katılmıyorum(2)
Katılmıyorum(1)
Katılıyorum(4)
katılıyorum(5)
Kararsızım(3)
Tamamen
Hiç
Matematik çok sevdiğim dersler arasındadır
Matematik çalıĢmak beni dinlendirir.
Matematik derslerinde konu azaltılsa mutlu olurum
Matematik çalıĢırken canım sıkılır.
Matematikle uğraĢmak beni dinlendirir.
BoĢ zamanlarımda matematikle uğraĢmaktan zevk alırım
Matematik dersinden korkarım
Matematik problemi çözmek beni yorar.
Gözlenen hedef davranıĢlar böyle bir puanlama anahtarına göre puanlanır ve öğrencilere bu
puanların ortalaması alınarak bir not verilir.
Hareket gözlenmedi 0
Zayıf 1
Orta 2
Ġyi 3
Rubrik bir öğrenci veya grubun yaptırılan bir etkinlikte kazandırılmak istenen
bilgi, beceri veya tutumda belirlenen kritere bağlı kalarak ne düzeyde kazanım elde ettiğini
belirlemek amacı ile hazırlanan not verme (derecelendirme) anahtarlarıdır. Rubrik, bir ölçme veya
etkinliğin tamamının ya da bölümlerinin nasıl puanlanacağının ana hatları ile gösterilmesidir. BaĢka
bir tanımla rubrik, kabul edilebilir ya da edilemez performans sınırlarının öğretmen ve öğrenciler
için açıkça belirtildiği kriter grubu ölçeğidir. Sınavlar için hazırlanan cevap anahtarının daha
geliĢmiĢi ve daha çok etkinlikleri değerlendirmede kullanılanlarıdır.
Öğrenci merkezli öğretim uygulamalarında kullanılan rubrik öğrenme standartlarını
yüksek tutmak için öğretmenin değerlendirmede kullanacağı ölçütleri geliĢtirerek öğrenciye
verdiği yönergelerdir. Bu yönergeler öğretim çalıĢmaları baĢlamadan önce öğrencilere verilerek
beklentiler netleĢtirilir ve öğrencinin çalıĢma süreci boyunca kendisini yönlendirmesi sağlanır.
62
Rubrik değerlendirmenin iĢlevleri Ģunlardır:
►Öğretmenin ne beklediği öğrenci tarafından bilindiğinden öğrenci kendisini programlayabilir.
►Her öğrencinin elinde rubrik önceden bulunduğundan öğrenci performansını geliĢtirir.
Rubrik puanlamada;
►Öğrencinin kazanması gereken özellikler (hedef-davranıĢlar) belirlenerek uzmanlarında görüĢü
alınarak standart bir form üzerinden öğrencinin değerlendirilmesi yapılır.
►Her alan ve konu için standart bir form geliĢtirilerek değerlendirme yapılır.
a-Holistik rubrik; Genel olrak yazma veya diğer yaratıcı, sanatsal çalıĢmalar için kullanılır.
Holistik rubrikler de ürün veya süreci bölümlere ayırmak her beceriyi ve kriteri bağımsız olarak
değerlendirmek yerine ürün ve sürecin bütünü değerlendirilir. Holistik rubrikler de öğrencinin
gösterdiği performansın bütününe tek bir puan verilmektedir. SONUCA ODAKLIDIR.
b- Analitik Rubrik: Analitik rubrikte ürün veya süreç bölümlere ayrılaraka her bölüm puanlanır ve
en sonunda puanlar toplanır. Bu rubrik türü çalıĢmanın yada ürünün faklı boyutlarına farklı puanlar
vermek mamacıyla yapılır. Analitik rubrikler, öğrenci performansının çeĢitli boyutlarındaki baĢarı
düzeyleri hakkında bilgi veren bir puanlama aracıdır. Bu tür puanlama ile öğrenciye yaptığı
çalıĢmadaki performansı hakkında ayrıntılı geri bildirim verir. SÜRECE ODAKLIDIR.
63
Puan Tanımlayıcı Ġfadeler
4 Resimleri verilen tüm canlılarla yuvalarını doğru olarak eĢleĢtirmiĢ,
eĢleĢtirdiklerini istenilen yere yapıĢtırmıĢtır.
Canlılar
3 Resimleri verilen canlıların yarıdan fazlasının yuvalarını doğru olarak eĢleĢtirmiĢ,
ile
eĢleĢtirdiklerini istenilen yere yapıĢtırmıĢtır.
Yuvalarını
2 Resimleri verilen tüm canlıların yarıdan azının yuvalarını doğru olarak eĢleĢtirmiĢ,
EĢleĢtirme
eĢleĢtirdiklerini istenilen yere yapıĢtırmıĢtır.
1 Resimleri verilen canlılardan birisinin yuvasını doğru olarak eĢleĢtirmiĢ.
Diğerlerini yanlıĢ eĢleĢtirmiĢtir.
Puan Tanımlayıcı Ġfadeler
4 Canlıların yuvalarının olmasının gerekçelerini doğru olarak açıklamıĢ ve yuvaları
olmaması durumunda olabilecekleri örneklerle doğru olarak belirtmiĢtir.
KONTROL LĠSTESĠ
Kontrol listeleri daha çok süreci ölçer ve belli kurallara uyulup uyulmadığını, belli iĢlem
yollarının izlenip izlenmediğini, bir davranıĢın gösterilip gösterilmediğini belirlemede kullanılır.
ĠĢin yapılıĢında gösterilmesi gereken davranıĢlar ve bitmiĢ üründe bulunması istenilen özellikler
var ya da yok iliĢkisinde ele alınır. Kontrol listeleri performansı oluĢturan davranıĢların her
birine ne düzeyde sahip olduğu hakkında bilgi veremez.
64
Araç kullanmaya iliĢkin bir kontrol listesi.
KONTROL LĠSTESĠ
GÖZLENECEK DAVRANIġLAR
Evet Hayır
MarĢa basmadan önce vitesi boĢa alıyor mu?
MarĢa basarak motoru çalıĢtırıyor mu?
Arabayı birinci vitese alıyor mu?
KalkıĢ iĢaretini veriyor mu?
KalkıĢ yaparken el frenini bırakıyor mu?
Kontrol listesinde gözlenen davranıĢların varlığı veya yokluğu ‗yapar‘ ‗eder‘ Ģeklindeki
kelimelerle, ya da ‗evet‘ ‗hayır‘ Ģeklinde ifade edilir.
Bir iĢin yapılması sırasında nelerin, hangi sırada ve nasıl yapılacağını göstermesi nedeniyle
öğretim amaçlı da kullanılabilir.
Gözlenecek davranıĢların varlığını veya yokluğu-nu gösterme olanağı tanır.
Performansı oluĢturan davranıĢlardan ne kadarına sahip olunduğunu belirlemeyi
kolaylaĢtırır.
Performansın en önemli ve gözlenebilir yanlarını kapsar.
Performansı oluĢturan davranıĢların her birine ne düzeyde sahip olunduğu hakkında bilgi
veremez.
Bu ölçme aracı aĢağıdakilerden hangisidir?
A ifadesi
D Y
B Ġfadesi C Ġfadesi
D Y D Y
1 2 3 4 5 6 7 8
65
ġekilde görüldüğü gibi her öğrenciye A ifadesi sunulur. Bu ifadeye iliĢkin öğrencinin kararı yanlıĢ
olduğu yönünde ise (Y) c ifadesi ile; doğru(D) olduğu yönünde ise A ifadesi ile ilintili B Ġfadesi ile
karĢılaĢır.
,c- Kağıt kalem ile yapılabildiği gibi bilgisayar ortamında da eğlenceli bir Ģekilde ullanılabilir.
d- Öğretmen öğrenciler cevapları verirken hangi kararlardan vazgeçtiklerini , hangi sorulara
ne dediklerini tepsi edebilir.
-Kalsik doğru- yanlıĢ testleri gibi öğrencilerin tahminle cevap verme olasılığı vardır. Fakat
sorular birbiyleriyle iliĢkili olduğundan Ģans baĢarısı klasik doğru yanlıĢ testlerine göre
düĢüktür.
2-YAPILANDIRILMIġ GRĠD: Öğrenci yeni aldığı bilgiyi anlamlandırmalı, var olan bilgilerle
iliĢkilendirmeli ve bu Ģekilde öğrenmeye yöneltilmelidir. YapılandırılmıĢ grid öğrencilerin bilgileri
ne Ģekilde iliĢkilendirdiğini yani öğrencilerin anlamlı öğrenmelerini ölçmeyi amaçlayan bir tekniktir.
Öğrencilerin kavram yanılgılarını, biliĢsel yapılarındaki eksikli ve aksaklıklarını ortay çıkarması
açısından yapılandırılmıĢ grid son zamanlarda öne çıkan bir yöntemdir.
Özellikleri: YapılandırılmıĢ Grid tekniğinde öğrencinin seviyesine ve yaĢına uygun olarak 9,12 veya
16 kurucuktan oluĢan bir tablo hazırlanır.
1 2 3
4 5 6
7 8 9
66
öğrencilerde var olan biliĢsel aksaklıkları gösterir.YapılandırılmıĢ grid tekniğinin uygulanması çok
az bir zamanda da mümkündür.
YapılandırılmıĢ Grid Tekniğinin Sınırlılıkları:
YapılandırılmıĢ Grid tekniği baĢlangıçta öğretmenlere hazırlanması açısından zor ve zahmetli
gelebilir. Ġyi bir yapılandırılmıĢ grid hazırlıklı ve alanında yeterli olan öğretmenler tarafından
hazırlanabilir. Bu nedenle öğretmenlerin bu tekniği iyi hazırlanmıĢ ve sıkı bir çalıĢma ile kullanması
gerekir.
3-VEE DĠYAGRAMI: Gowin ve Novak tarafından 1977 yılında anlamlı öğrenme teorisine dayalı
olarak geliĢtirilen vee diyagramı, kavramların oluĢumunda , kavramlar arası iliĢki kurmaya yardımcı
olur.
Vee diyagramları, öğrenciye laboratuar çalıĢması öncesi hazırlık yapması, teorik bilgi ile
uygulama arasında iliĢki kurmasını sağladığı için ölçme ve değerlendirme için kullanımı oldukça
iyidir. Vee diyagramları da uygulamada öğrencinin ne gördüğünü ve bunun nasıl yorumlandığını
göstererek değerlendirme amaçlı kullanılır.
Hazırlanması:
Araç Gereçler
67
Vee Diyagramının Bölümleri
Odak Sorusu: Kavramsal kısım ile yöntemsel kısım arasındaki iliĢkiyi sorgular. Odak sorusu kuram
ile uygulama arasındaki iliĢkiyi gösteren geçiĢtir. Odak sorusu bir yada iki tane olabilir. Odak
sorusu araĢtırmadaki olayları belirleyen , önemli ve yol gösterici kavramları içerir.
Araç ve Gereçler : Deneyde kullanılacak olan , sadece deneye ait olan araç ve gereçlerin liste
halinde yazıldığı bölümdür.
Kavramlar: deney ile ilgili gereken kavramların deneyden önce yazıldığı, öğrenciye uygulamada
yardımcı olan bölümdür.
Deneysel iddialar ve Bilgi iddiaları: Odak soruların cevabı olan bilgi iddiaları, araĢtırmaya yön
veren bölümdür. Bilgi iddiaları, kavramsal ve yöntemsel kısım ile tutarlı olmalıdır. Deneyle ilgili
olan yani uygulamaya yönelik olanlar ise deneysel iddialar oluĢturur.
Veri dönüĢümleri: Kullanılacak olan kayıtların, uygulamanın daha baĢarılı ve geçerli sonuçlar
vermesi için deneyden önce kendi aralarında dönüĢtürülmesidir. Böylece öğrenciler odak sorusunu
daha rahat ve kolay bir Ģekilde anlar ve bu soruya cevap verebilir.
4-POSTERLER: Bir projeyi, bir konuyu, bir sistemi resimler ile zenginleĢtirilmiĢ Ģekilde daha
önceden o konu, proje yada sistem ile ilgisi olmayan bireylere ana hatlarıyla tanıtıcı nitelikte olan
grafiklere poster denir.
68
Posterler ölçme ve değerlendirme aracı olarak kullanılırsa bazı kriterlere göre
değerlendirildiğinde öğrencilerin araĢtırma yapma becerilerinin ve üst düzey davranıĢlarının
geliĢmesine yardımcı olur. Öğrencinin performansının değerlendirildiği posterin son hali yan
hazırlana son ürün öğrenci baĢarı düzeyini belirlemede çok etkilidir. Öğretmenler , hazırlanan
posteri dikkatlice inceleyerek her öğrenciye anında dönüt vermeli ve dikkatlice posterin en iyi
Ģekilde hazırlanmasını sağlamalıdır.
5-KELĠME ĠLĠġKĠLENDĠRME TESTĠ (KĠT): Öğrencinin biliĢsel yapısını ve bu yapıdaki
kavramlar arasındaki bağları, yani bilgi ağını gözler önüne serebilen , uzun dönemli hafızadaki
kavramlar arasındaki iliĢkilerin yeterli olup olmadığını tespit edebilmemize yarayan tekniklerden
birisi kelime iliĢkilendirme testidir.
Öğrenci bu teknikte belli bir süre içerisinde (çoğunlukla 30 Saniye) herhangi bir konu ile ilgili
verilen bir anahtar kavramın çağrıĢtırdığı kelimelere cevap olarak verir.öğrencinin uzun dönemli
hafızasından herhangi bir anahtar kavrama verdiği sıralı cevabın biliĢsel yapıdaki kavramlar
arasında bağlantıları ortaya koyduğu ve anlamsal yakınlığı gösterdiği farz edilir. Anlamsal yakınlık
ve anlamsal mesafe etkisine göre , anlamsal bellekte iki kavram birbirine mesafe açısından ne
kadar yakın ise o kadar sıkı iliĢkidedir ve hatırlama esnasında da zihinsel araĢtırma daha çabuk
olacağından her iki kavramla ilgili cevap daha hızlı olacaktır.
Avantajları: Hem ölçme ve değerlendirme hem de tanı amaçlı kullanılabilen KĠT‘in en büyük
avantajı hazırlanmasının kolay olması ve 5 dakikalık bir zaman diliminde uygulanabilir. Ayrıca
bireysel uygulanabileceği gibi büyük gruplara da kolaylıkla uygulanabilir. Tüm derslerde
kullanılabilme esnekliği de vardır.
Öğrencinin biliĢsel yapısındaki kavramlar arasında var olan iliĢkileri ortaya koymayı,
öğrencinin ne bildiği ve ne öğrendiği arasındaki farkı görmemizi sağlar.
Sınırlılıkları: Üst düzey düĢünme becerilerinin ölçülmesinde zayıf kalabilir.
69
ÖLÇME SONUÇLARI ÜZERĠNDE
ĠSTATĠSTĠKSEL ĠġLEMLER
Ölçme sonuçlarına bakarak, grup hakkında ya da eğitim sistemi hakkında bazı kararlar
verebilmek için ölçme sonuçları üzerinde istatistiksel iĢlemlerin yapılması gerekmektedir. Ancak
istatistiksel iĢlemlerin yapılabilmesi için öncelikle ön uygulamaların yapılması gerekir. Yani
bilgilerin istatistiksel yolla çözümleme aĢaması iki ana uygulamadan oluĢur.
82, 77, 95, 62, 68, 38, 62, 45, 100, 62, 100, 68
Bu Ģekliyle bu notlar hakkında yorum yapmak oldukça zordur. O nedenle bunları sıralamak gerekir.
SıralanmıĢ puanlar ise Ģöyledir:
38, 45, 62, 62, 62, 68, 68, 77, 82, 95, 100, 100
Bu haliyle bu sınavdan alınan en yüksek notun 100 en düĢük notun da 38 olduğu söylenebilir.
FREKANS DAĞILIMI: Frekans dağılımı test puanlarının nasıl bir dağılım gösterdiğini ve HER
PUANIN KAÇ KEZ TEKRARLANDIĞINI GÖSTERĠR. Frekans dağılımının en basit biçiminde
puanlar büyükten küçüğe doğru sıralanır ve her puanı alan öğrenci sayısı ( frekans: f) onun
karĢısına yazılır.
ÖRNEK: Yukarıda verilen puanların frekans tablosunu oluĢturacak olursak:
PUAN FREKANS
. 38 1
. 45 1
. 62 3
. 68 2
. 77 1
. 82 1
. 95 1
. 100 2
70
ÖRNEK:
12
10
8
FREKANS
6 PUAN
0
2 4 6 8 10 12 14 16
PUAN FREKANS
2 2
14 8
16 + 2
38
TOPLAM FREKANS = =
71
1) MERKEZĠ EĞĠLĠM ÖLÇÜLERĠ (Vasat Ölçüleri, Merkeze Yığılma Ölçüleri)
Merkeze yığılma ölçüleri puanların nerelerde toplandığını açık ve kesin olarak ortaya
çıkarmada kullanılır. Puan dağılımında verilerin hangi puan etrafında toplandığı hakkında bilgi
veren ve grubunu özetleyen değerlerdir. Merkeze YIĞILMA ÖLÇÜLERĠ MOD (Tepedeğer),
MEDYAN (Ortanca), ARĠTMETĠK ORTALAMALARDIR.
ÖRNEK: Bir sınıfta 10 öğrenci olsun. Öğrencilerin fizik dersinden aldıkları puan sırasıyla 55, 70,
75, 40, 50, 45, 80, 90, 35, 60 ise bu sınıfın aritmetik ortalaması kaçtır?
55+70+75+40+50+45+80+90+35+60
ARĠTMETĠK ORTALAMA= ———————————————— = 60
10
12
10
8
FREKANS
6 PUAN
0
2 4 6 8 10 12 14 16
72
ÖRNEK:
Matematik dersinden 20 öğrencinin aldıkları puanlar aĢağıdaki gibidir.
X (puan) f
100 1
90 2
80 3
70 2
60 4
50 3
40 2
30 2
20 1
ÖRNEK:
2008 KPSS: Mehmet öğretmen, öğrencilerine uyguladığı bir test sonucunda elde ettiği
puanlardan bazı istatistikleri hesaplamıĢtır. Daha sonra, öğrencilerden birinin puanını yanlıĢ
yazdığını fark etmiĢ ve gerekli düzeltmeyi yaparak istatistikleri tekrar hesaplamıĢtır.
Buna göre, Mehmet öğretmen‟in düzeltmesi sonucunda aĢağıdaki istatistiklerden hangisi kesin
olarak değiĢmiĢtir?
DĠKKAT 1 :
Ders AO MOD MEDYAN SS Bu tür tablolar verildiği sorularda;
1 50 70 60 5 Grubun baĢarı düzeyinin,
2 60 40 50 7 Grubun mutlak baĢarı düzeyinin ,
3 75 65 70 4 Öğrencilerin ortalama baĢarı düzeyinin,
4 55 80 70 3 öğrencilerin öğrenme düzeyinin en düĢük
5 90 95 92 2 yada yüksek olduğu ders hangisidir.
ġeklinde ifadeler bulunursa aritmetik
ortalamaya bakılır ve aritmetik ortalamaya göre yorum yapılır.
73
AĞIRLIKLI ORTALAMA: Bazı durumlarda puanların ortalamaya katkılarının farklı olması
gerekebilir. Farklı ağırlıklar verilerek hesaplanan ortalamaya ―ağırlıklı ortalama‖ denir. Örneğin:
lisede baĢarı notu hesaplama da ağırlıklı ortalama kullanılır. Her bir dersin notu, haftalık ders
saati ile çarpılarak bu çarpımların sonuçları toplanır ve ders saati toplamına bölünür.
Puan×Kredi
Ağırlıklı Ortalama =
Toplam kredi
ÖRNEK: Bir ilköğretim öğrencisinin aldığı notlar ve derslerin kredileri aĢağıdaki gibidir.
Türkçe 4 5
Fen Bilgisi 3 4
Beden Eğ. 2 5
Yabancı Dil 2 3
4 3 4 5 3 4 2 5 2 3 60
Ağırlıklı Ortalama= = =4
15 15
B) ORTANCA (MEDYAN): Büyüklük sırasına göre düzenlenmiĢ puanlar dizisinin tam
ortasına düĢen puana ortanca (medyan) denir. Ölçümlerin yarısı bu değerin üstünde diğer yarısı da
altında yer alır. Ölçüm sonuçlarının sayısının tek olması, çift olması ortancanın hesaplanma
yöntemini değiĢtirir.
* Bir dizi ölçümde ölçüm sayısı (N) tek ise,
ORTANCA
n 1 7 1
Veya Ģöyle de bulabiliriz n = 7 ise formül ise = = 4 sayı bize ortancayı verir.
2 2
* Bir dizi ölçüm sayısı (N) çift ise, ölçüm değerleri sağdan ve soldan eĢit oranda
ayrıldıktan sonra ortada kalan 2 değer toplanarak ikiye bölünür ve ORTANCA bulunur.
ÖRNEK: 40, 80, 45, 55, 65, 75 sayılarının ortanca değerini bulunuz?
Öncelikle bu veri grubu sıraya konur. 40, 45, 55, 65, 75, 80
55 65
N= = 60 ORTANCA 60'TIR.
2
74
Ortancanın Bazı Özellikleri:
* Ortanca bir dağılımı ortadan ikiye böldüğüne göre, dağılımda % 50. noktayı gösterir.
* Ortanca ölçüm sayısına eklenecek herhangi bir değerden hemen etkilenir ve değiĢir.
* Ortanca, ölçüm sonuçları dizisindeki değerleri iki eĢit gruba böler.
C) MOD (Tepe Değer): Ölçme sonucu elde edilen ölçümlerden en çok tekrarlanan değere
MOD (tepe değer) denir. Yani frekansı en yüksek olan değerdir. Tepe değer verilerin en çok hangi
puan etrafında toplandığı hakkında bilgi verir. Bir dağılımda birden çok MOD olabilir.
ÖRNEK: 10 kiĢilik bir sınıfın Türkçe dersinin sınavından aldığı notlar Ģöyle olsun…
Bir puan dağılımında ardıĢık iki değer en büyük ve eĢit frekansa sahipse, mod bu iki değerin
ortalamasına eĢittir.
46
Mod = 5 ‘tir.
2
Bir puan dağılımında ardıĢık olmayan iki değer en büyük ve eĢit frekansa sahipse, bu dağılımın iki
farklı modu olur.
NOT: Bir frekans dağılımında bütün değerlerin frekansı aynı ise bu frekans dağılımının MODU
yoktur.
NOT: MOD: merkezi yığılma ölçüsü olarak kaba bir istatistik olup ancak en büyük frekansın hangi
puanda olduğunu gösterir. Böyle olmakla birlikte tepe değer: ortanca ve aritmetik ortalama gibi
istatistiklerle karĢılaĢtırılarak frekans dağılımlarının yorumlanmasında kullanılır.
75
2003 KPSS: AĢağıda aynı değiĢkenle ilgili bir ölçümler dizisine iliĢkin dört tanım
verilmiĢtir.
I. En yüksek frekansa sahip olan değer,
II. Büyüklük sırasına konmuĢ ölçümler dizisinin tam ortasındaki değer,
I II III IV
Ortalama, ortanca ve mod arasında benzerlikler olduğu gibi birçok farklılıkta söz
konusudur.
a) Ortalama; ortanca ve mod‘a göre daha çok bilgiye dayanır. Çünkü ortalama
hesaplanırken gözlenen ölçümlerin tümü iĢleme katılır. Ölçümlerin tümünün iĢleme katılması
ortalamayı diğer vasat ölçülerinden daha istikrarlı ve daha güvenilir yapar.
b) Ortalama, vasat ölçüsü olmanın dıĢında baĢka matematiksel iĢlemler içinde uygundur.
c) Ortalamanın değeri ölçümlerin değerine bağlıdır. Ayrıca ortanca bir puan dağılımındaki
uç değerlerden etkilenmez. Örneğin 2,5,7 olan bir dağılımda ortanca 5 tir. Eğer Bu dağılım
2,5,100 olsaydı ortanca yine 5 olurdu.
2007 / KPSS
Frekans
8
7
6
5
4
3
2
1
0 Puan
1-5 6-10 11-15 16-20 21-25
76
1. 5A sınıfının mevcudu kaçtır?
A) 5 B) 7 C) 8 D) 20 E) 25
A) 5 B) 7 C) 8 D) 18 E) 25
2009 KPSS SORUSU: Bir coğrafya öğretmeni 100 soruluk bir baĢarı testi uygulamıĢ ve test
puanlarının ortalamasını 75, ortancasını 80, tepe değerini (mod) 90, standart sapmasını 8 ve
ranjını 90 bulmuĢtur. Öğrencilerin dersten geçebilmeleri için en az 65 puan almaları
gerekmektedir.
Test puanlarına iliĢkin istatistiklere ve değerlendirme ölçütüne dayanarak bu dağılım için
aĢağıdakiyorumlardan hangisi yapılamaz?
A) Ölçümlerin yüzde elliden fazlası ortalamadan büyüktür.
B) Merkezî eğilim ölçüsü olarak ortancadan yararlanılmalıdır.
C) Sınıfın büyük çoğunluğu geçer not alır.
D) Tepe değeri, gözlenen en büyük değerdir.
E) Ortalamayı çarpıtan uç değer(ler) bulunmaktadır
Merkezi dağılım ölüleri verilerin yığılma gösterilen noktadan ne kadar uzakta olduklarını,
nasıl bir dağılım gösterdiklerini belirten istatistikleridir. Bir grubu belirli bir özelliği yönünden
yeterince tanıyabilmek ve gruplar arasında çok yönlü karĢılaĢtırmalar yapabilmek için merkezi
eğilim ölçüleri yeterli değildir. Bu durumda merkezi dağılım ölçülerine gereksinim duyulur. BaĢlıca
dağılım ölçüleri Ģunlardır:
C) Çeyrek sapma
A) RANJ (Puan GeniĢliği): Bir dağılımda en yüksek puan ile en düĢük puan arasındaki farktır.
Ranj; bir veri grubunun hangi aralıkta değiĢkenlik gösterdiğini belirten istatistiktir. Ranj, puan
dağılımları hakkında kaba bilgi verir.
ÖRNEK: Puanları 90, 85, 75, 70, 55, 40 olan bir dizi düĢünelim. Bu dizinin ranjı:
90 ─ 40 = 50 dir
Ranj değeri dikkate alınarak yapılabilecek yorumlar yüzeysel olmakla birlikte sadece ranj
değeri varsa Ģu yorumlar yapılabilir:
1) Ranj değeri büyük olan grupların test sonuçları ranj değeri küçük olan grupların test
sonuçlarından daha güvenilirdir.
77
2) Ranj değeri büyük olan grubun heterojen olduğu, bilenle bilmeyenin birbirinden ayrıldığı,
bireylerin ölçülen özellik bakımından farklılık gösterdiği söylenebilir.
3) Ranj değeri küçük olan bir grubun homojen olduğu, bilenle bilmeyenin birbirinden ayrılmadığı,
bireylerin ölçülen özellik bakımından benzer olduğu söylenebilir.
Standart sapma normal dağılım üzerinde aritmetik ortalamaya . ( X ) göre olan -3 ve +3 arasında
yer alan dağılıma göre Ģu Ģekilde gösterilir:
-3 -2 -1 X +1 +2 +3
Bir dağılımda aritmetik ortalama ( X ) 60, standart sapma 3 ise dağılım doğrusu Ģu Ģekilde
gösterilir:
-3 -2 -1 0 +1 +2 +3
51 54 57 60 63 66 69
78
Grup homojen bir yapıya sahiptir.
Dikkat :Bu tür tabloların verildiği sorularda, Öğrenciler arasında farklılaĢmanın en fazla/en az,
Ders AO MOD MEDYAN SS
Öğrencilerin öğrenme düzeylerinin benzer
1 50 70 60 12 farklı,
2 60 40 50 3
3 75 65 70 5 Grubun homojen / heterojen olduğu ders
4 55 80 70 10 hangisidir Ģeklinde sorulursa standart sapmaya
5 90 95 92 7
bakılır.
ÖRNEK:
A) I 65 75 70 7
B) II 35 55 40 6
C) III 40 40 40 8
D) IV 40 25 30 9
E) V 60 40 45 16
Çözüm: Standart sapması büyük olan dağılımda bireyler arası farklılaĢmada büyüktür. Standart
sapma büyüdükçe benzerlik azalır. Dolayısıyla farklılaĢmanın en çok olduğu test standart sapmanın
en yüksek olduğu 5. testtir. Doğru cevap E Ģıkkıdır.
79
ÖRNEK:
DERSLER X S.S
TÜRKÇE 70 3
MATEMATĠK 71 4
COĞRAFYA 70 4
FĠZĠK 80 5
KĠMYA 75 4
Hangi derste ortalama öğrenme düzeyi en yüksektir? Hangi derste ortalama öğrenme
düzeyi en düĢüktür?
ÇÖZÜM:
b) Aritmetik ortalaması en düĢük olan derste ortalama öğrenme düzeyi en düĢüktür. Ancak
yukarıdaki gibi aritmetik ortalamalar birbirine eĢitse bu durumda standart sapması büyük olan
dersin ortalama öğrenme düzeyi en düĢüktür. Dolayısıyla COĞRAFYA dersinde ortalama öğrenme
düzeyi en düĢüktür.
2008 KPSS: Bir grup öğrenciye uygulanan dönem sonu sınavlarına iliĢkin istatistikler tablodaki
gibidir.
Tarih 40 30 35 39 7
Türkçe 30 15 18 23 6
Fizik 50 30 30 30 11
Felsefe 40 14 10 7 9
80
2009 KPSS SORUSU:
58. – 60. SORULARI AġAĞIDAKĠ BĠLGĠLERE GÖRE CEVAPLAYINIZ.
10 soruluk bir sınava ait öğrenci yanıtları aĢağıdaki tabloda verilmiĢtir. Her soruda doğru yanıta ―1‖, yanlıĢ
yanıta ―0‖ puan verilmiĢtir. Yanıtlanmayan soru bulunmamaktadır.
SORULAR
1 2 3 4 5 6 7 8 9 10
A 1 1 1 0 0 1 1 0 1 0
B 1 1 0 0 1 1 1 0 0 1
C 0 1 0 0 1 1 1 1 1 1
D 1 1 1 0 1 0 1 1 1 0
E 0 0 1 0 0 0 1 1 1 0
F 1 1 0 0 1 1 1 1 1 1
G 1 1 0 0 1 1 1 0 0 0
ÖĞRENCĠLER
H 1 1 0 0 1 1 1 0 0 1
I 1 1 1 0 0 0 1 0 0 1
J 0 0 0 0 0 1 1 1 0 0
Puan Puan
81
C) ÇEYREK SAPMA
Çeyrek sapma birinci ve üçüncü çeyreğin farkının yarısıdır ve q ile gösterilir.Bri yayılma
ölçüsü olan çeyrek sapma, merkezi eğilim ölçüsü olarak ortancanın kullanıldığı durumlarda
kullanılır.
Q3 -Q1 Y -Y
Q= veya Q= 75 25
2 2
Q1 Q3
Y25 Q2 Y75
%25 %25
Örnek:
Birinci çeyreği 20, üçüncü çeyreği 40 olan bir dağılımın çeyrek sapması kaçtır?
Çözüm:
Q3 -Q1 40-20
Q= Q= 10 ‘dur.
2 2
Not:UygulanmıĢ olan bir sınavda puanlar aĢırı uçlara yayılmıĢsa yayılma ölçüsü olarak çeyrek sapma
kullanılır.
2) Madde iyi öğrenci ile zayıf öğrenciyi birbirinden ayırt edebiliyor mu?
3) Maddelerin çeldiricileri iyi çalıĢıyor mu?
82
ÖRNEK: Bir testin 15. maddesine 40 öğrenci doğru 10 öğrencide yanlıĢ cevap vermiĢ ise bu
40
maddenin güçlük indeksi 0,80 olur.
50
→ Madde güçlük indeksi maddeyi doğru cevaplayanların sayısına göre 0 ile 1 arasında değer alır.
MADDE GÜÇLÜK ĠNDEKSĠ özellikle büyük gruplarda (100-200 cevaplayıcının olduğu durumlarda)
öğretmenler tarafından karmaĢık istatistiksel hesaplamalar gerektirmeyen ―basit madde analizi‖
yöntemiyle de bulunabilir. Madde analizi yönteminde izlenecek yol Ģöyledir:
1) Öğrenci cevapları puanlandırılır.
2) Test puanlarına göre öğrenci cevap kâğıtları en yüksek puandan en düĢük puana doğru
sıralanır.
3) SıralanmıĢ kâğıtlardan en yüksek ve en düĢük puan alan % 27‘lik grupta yer alan kağıtlar
seçilerek üst ve alt gruplar oluĢturulur. Geride kalan diğer kâğıtlar (% 46) analiz dıĢında tutulur.
n(dü)+n(da)
FORMÜL = P.j ———————
N
83
Görüldüğü üzere indeksin 1‘e yakın çıkması kolay bir soru olduğunu; 0‘a yakın çıkması zor
bir soru olduğunu gösterir. Soruların ORTA güçlükte olması ise güvenirliği artırıcı rol oynar.
ÖRNEK: AĢağıdaki tabloda numaralanmıĢ 5 sorunun doğru cevaplanma yüzdeleri verilmiĢtir. (PJ)
Bu değerlere bakarak yapılan yorumlardan hangisi doğrudur?
1. SORU A *B C D TOPLAM
ÜST 20 59 11 10 100
GRUP
ALT 11 12 39 38 100
GRUP
nü + na 59+12 71
P = ————— = ———— = ———— = 0,3555 ~ 0,36... ZOR BĠR
N 100+100 200 SORUDUR.
ÖRNEK: 200 kiĢilik bir gruba uygulanan 10 maddelik bir genel yetenek testinde üst
grupta ve alt grupta 100‘er kiĢi bulunmaktadır. Test 5 seçeneklidir. Ve 1. madde için alt ve üst
gruplardaki seçenek dağılımları aĢağıda verilmiĢtir.
1. SORU A B C D E
ÜST %3 % 20 % 11 % 54 % 12
GRUP
ALT % 13 % 20 % 21 % 34 % 12
84
n(dü)+ n(da) 54+34 88
(PJ) MADDE GÜÇLÜK ĠNDEKSĠ = ——————— = ———— = ——— = 0,44
N 200 200
0,41 ve 0,60 arasında bulunan maddeler ORTA GÜÇLÜKTEKĠ MADDELER olduğu için bu
maddenin ORTA GÜÇLÜKTE BĠR MADDE OLDUĞU yorumu yapılır.
Bir sorunun ayırıcılık gücü bilen ile bilmeyeni veya baĢarılı öğrencilerle baĢarısız
öğrencileri ayırt etme kudretini ifade eder. Bir baĢka deyiĢle maddelerin ancak iyi öğrenciler
tarafından cevaplandırılabileceği, konuya hakim olmayanların bilemeyecekleri nitelikte olması
özelliğidir.
Madde yeteri kadar ayırıcı ise test puanı yüksek olanların maddeyi doğru cevaplamaları,
test puanı düĢük olanların ise yanlıĢ cevaplamaları beklenir. Öyleyse güvenilir bir test ayırıcılığı
yüksek maddelerden oluĢan bir testtir.
Maddenin ayırıcılık gücü değeri -1 ve +1 arasında değer alır. BaĢarı testlerinde maddelerin ayırıcı
gücü aĢağıdaki kriterlere göre değerlendirilir.
0,30 ve 0,39 arasında bulunanlar Oldukça iyi çalıĢan ama yine de geliĢtirilebilir.
85
c) Ayırıcılık gücünün büyüklüğü testin kullanılıĢ amacına, o testi alan grubun ölçülen değiĢken
bakımından homojen yada heterojen oluĢuna göre değiĢir.
ÖRNEK:
NO * N
ÜST GRUP 15 5 3 2 0 25
ALT GRUP 5 10 5 5 0 25
15 5 10
rj= = 0,40 → SORU BĠLEN ÖĞRENCĠLER ile BĠLMEYEN ÖĞRENCĠYĠ
25 25
AYIRMADA YETERLĠDĠR... (ÇOK ĠYĠ ÇALIġAN)
2003 KPSS: AĢağıdaki tabloda numaralanmıĢ beĢ sorunun doğru cevaplanma yüzdeleri (pj)
değeri ile ayırt edicilik değerleri (rj) verilmiĢtir.
SORU Pj rj
1 0,35 0,60
2 0,40 -0,35
3 0,80 0,10
4 0,25 0,15
5 0,85 0,50
Çözüm: Bir maddenin ayırt ediciliği bilenle bilmeyeni birbirinden ayırt etmesidir. Yani zayıf
öğrenci ile iyi öğrenciyi ayırabilmesidir. Ayırt etme indeksi -1 ile +1 arasında değiĢir. Bir maddenin
ayırt etme indeksi 0,19 ve daha küçük ise, çok zayıf ve düzeltilemiyor ise testten çıkarılmalıdır.
Buna göre negatif bir ayırt ediciliğe sahip olan 2 . MADDE testten çıkarılmalıdır.
Soru 2: BaĢvuran kiĢinin çok, seçilecek kiĢinin az olduğu bir sınavda kullanılacak soruların çoğu
güçlük ve ayırt edicilik bakımından yukarıdaki sorulardan hangisine benzer olmalıdır?
A) 1 B) 2 C) 3 D) 4 E) 5
86
Çözüm: Böyle bir durumda ayırt ediciliği yüksek, güç sorular tercih edilmelidir. 1. Soru GÜÇ ve
AYIRT EDĠCĠ bir soru olduğu için o soru tercih edilmelidir.
A) 1 B) 2 C) 3 D) 4 E) 5
Çözüm: Kolay sorular güçlük indeksinin 0,50‘den büyük olduğu sorulardır. 3 ve 5. soruların güçlük
indeksleri 0,80 ve 0,85‘tir ve dolayısıyla kolay sorulardır. Ayırt edici sorular ise 1‘e yakın olan
sorulardır. Bu durumda testte hem kolay hem de ayırt edici olan 5. SORUDUR.
GÜÇLÜK ĠNDEKSĠ
0 0,40_0,60 +1
2008 KPSS: Bir testteki maddelere iliĢkin aĢağıdaki değerler elde edilmiĢtir.
Maddeler I II III IV V
Madde güçlüğü 0,1 0,15 0,5 0,6 0,9
Madde ayırıcılık 0,08 -0,15 0,5 0,28 0,43
gücü
A) I B) II C) III D) IV E) V
A) I B) II C) III D) IV E) V
87
2009 KPSS SORUSU: Uygulama sonucunda yukarıdaki değerleri elde eden bir öğretmen,
ayırtediciliği düĢük olan maddeleri düzeltilemediği için testten çıkarmak istemektedir.
Bu maddelerin çıkarılması aĢağıdakilerden hangisine neden olur?
A) Testin ölçüt geçerliğinin düĢmesine
B) Kalan maddelerin güçlük indeksinin düĢmesine
C) Çeldiricilerin iyi çalıĢmamasına
D) Testin iç tutarlığının düĢmesine
E) Testin kapsam geçerliğinin düĢmesine
2009 KPSS SORUSU: Tablodaki maddelerden hangisi hem kolay hem de ayırtedici bir
sorudur?
A) 3 B) 4 C)8 D) 9 E) 10
2009 KPSS SORUSU: Tablodaki maddelerden hangisi, testle ölçülen özellikler açısından
oldukça üst düzey yeterliğe
sahip olan öğrencileri seçmek için kullanılabilir?
A) 1 B) 2 C) 5 D) 7 E) 10
Madde varyansı bir maddeyi doğru cevaplayanların oranıyla yani madde güçlük indeksi ile
(pj), o maddeyi cevaplayamayanların oranının (qi) çarpımına eĢittir.
Maddeyi doğru cevaplayamayanların oranı 1‘den madde güçlük indeksinin çıkarılması ile elde edilir.
qj=1-pj‘dir.
Örnek:
Bir maddenin güçlük indeksi 0,40 ise bu maddenin varyansı kaçtır?
Çözüm:
qj = 1 – pj Sj2 = pj . qj
qj = 1 – 0,40 Sj2 = 0,40 . 0,60
qj = 0,60 Sj2 = 0,24‘tür.
88
MADDENĠN STANDART SAPMASI(Sj)
Bir maddenin Standart sapması o maddenin varyan sının kareköküne eĢittir.Madde
varyansı madde standart sapmasının karesi olduğundan madde standart sapması için yapılan
yorumlar madde varyansı içinde geçerlidir.
Madde güvenirlik indeksi, madde ayırt edicilik gücü indeksi ile maddenin standart
sapmasının çarpımı sonucu elde edilir. rj ile gösterilen madde güvenirlik indeksi aĢağıdaki formül
ile hesaplanır.
rj=rjx . Sj
Örnek:
Standart sapması 8, madde ayırt ediciliği 0,50 olan bir maddenin güvenirliliği kaçtır?
Çözüm:
rj = rjx . Sj rj = 8 . 0,50 rj = 4‘tür.
Bir maddenin standart sapması ya da ayırt edicilik gücü arttıkça güvenirlik indeksi de artar.
89
NOT: TESTTEN alınabilecek en yüksek puan: her bir sorunun ağırlıklı puanının 1 olduğu bir sınav
için o sınavdaki soru sayısı kadardır. Yani 10 soruluk bir testten maksimum 10, 80 soruluk bir
testten maksimum 80 alınabilir.
2004 KPSS:
TARĠH 14 11,7
FĠZĠK 19 13,4
KĠMYA 12 6,9
ÇÖZÜM: Böyle bir soruyu cevaplayabilmek için testin ortalama güçlük derecesine bakarsak hangi
derste öğrencilerin daha baĢarılı olduğuna karar verebiliriz.
Testin ortalama güçlüğünü bulmak için her derse ait aritmetik ortalamayı, alınabilecek en
yüksek puana yani soru sayısına böleriz.
13,4 6,9
FĠZĠK: ———= 0,70 KĠMYA :——— = 0,58
19 12
Bu sonuçlara göre ortalama güçlüğü en yüksek olan ders yani en kolay ders
MATEMATĠKTĠR. Bu yüzdende öğrencilerin en baĢarılı olduğu ders MATEMATĠKTĠR.
90
ÖRNEK:
4 0 ─ 50 16
5 0 ─ 40 16
ÇÖZÜM: Tabloda 5 sınıfa ait yapılan ölçme sonuçlarının değerlendirme aralığı ve sınıf
ortalamaları verilmiĢtir. Yukarıda verilen sınıflardan hangisi öğrenmeler bakımından diğerlerine
göre daha baĢarısızdır?
Sınıfın baĢarısız olması demek testin ortalama güçlük düzeyi bakımından öğrencilere güç
gelmiĢ olması demektir. Öyleyse her sınıf için testlerin ortalama güçlük düzeylerini bulup ona göre
sınıfların baĢarı durumları hakkında yorum yapabiliriz.
72
1 . SINIF ĠÇĠN ORTALAMA GÜÇLÜK = 0,72
100 Bu sınıflarda
(P)→Güçlük düzeyi
0,50'den büyük olduğu
13,5 için öğrencilerin çoğu
2. SINIF ĠÇĠN ORTALAMA GÜÇLÜK= 0,67 konuyu öğrenmiĢlerdir
20
ve baĢarı yüksektir
4.20 yorumu yapılır.
3. SINIF ĠÇĠN ORTALAMA GÜÇLÜK= 0,84
5
16 Bu sınıflarda ise (P) → Güçlük
4. SINIF ĠÇĠN ORTALAMA GÜÇLÜK= 0,32
50 düzeyi 0,50 den küçük olduğu için
16 öğrenciler konuyu öğrenmemiĢ ve
5. SINIF ĠÇĠN ORTALAMA GÜÇLÜK= 0,40 öğrencilerin baĢarı düzeyleri de
40
düĢüktür. Ancak en baĢarısız olan
SINIF 4. SINIFTIR =0,32
2008 KPSS: Bir grup öğrenciye uygulanan dönem sonu sınavlarına iliĢkin istatistikler tablodaki
gibidir.
Tarih 40 30 35 39 7
Türkçe 30 15 18 23 6
Fizik 50 30 30 30 11
Felsefe 40 14 10 7 9
91
NOT: Bir test bütün olarak analiz edilirken öğrencilerin boĢ bıraktıkları ve cevaplamadan
kaçındıkları madde sayılarına ve bu maddelerin içeriklerine de bakmak gerekir. Testteki soruların
öğrenciler tarafından boĢ bırakılarak cevaplandırılmaması testin güvenirlik ve geçerliğini büyük
ölçüde düĢürür. Üstelik testteki maddelerin programın hedefleri ile ilgili olacağı düĢünülürse boĢ
bırakılan sorular ile ölçülmesi amaçlanan hedef davranıĢlarda ölçülmemiĢ olur.
Testte yer alan herhangi bir madde öğrencilerin üçte biri veya dörtte biri tarafından boĢ
bırakılmıĢ ise aĢağıdaki ihtimallerden biri ya da bir kaçı söz konusu olabilir:
→ Testin açıklaması (yönergesi) öğrencinin cevaplama iĢlemini nasıl yapacağını anlaĢılır bir
Ģekilde ifade etmekten uzaktır.
→ Madde kökü, ne sorulduğunu, sorudan ne istendiğini anlatacak yeterlilikte değildir.
→ Seçenekler arasında kesin ve tek bir doğru cevap yoktur.
TESTĠN AYIRTEDĠCĠLĠĞĠ
Uygulanan testin maksadı baĢarı düzeyleri bakımından öğrencileri birbirinden AYIRTETMEK ise
baĢka bir deyiĢle programın hedeflerini gerçekleĢtirmiĢ öğrenci ile gerçekleĢtirmemiĢ öğrenciyi
teĢhis etmekse TESTĠN PUANLARINDAN HESAPLANAN DĠZĠ GENĠġLĠĞĠ BÜYÜK
OLMALIDIR.
Dizi GeniĢliği: En yüksek puan ile en düĢük puan arasındaki farktır yani RANJ…
KURAL: Ayırt edici, dolayısıyla geçerliği ve güvenirliği yüksek bir testte hesaplanan dizi geniĢliği
o testten elde edilmesi, mümkün en yüksek puanın yarısına yakın olmalıdır.
ÖRNEK:
Dersler Ranj K
Fizik 50 110
Kimya 72 130
Biyoloji 38 80
Tarih 75 120
Matematik 58 100
Yukarıdaki tabloda 5 derse ait ranj değerleri ve soru sayıları verilmiĢtir. Sınıfın
hangi dersteki ayırt ediciliği en yüksektir?
ÖRNEK: 80 maddeden oluĢan birçoktan seçmeli testte en yüksek puan 65 en düĢük puan 45
olarak gözlenmiĢtir. Bu test hakkında öğrendiğimiz kurala göre ne söylenebilir?
80
Beklenen dizi geniĢliği (RANJ) = 40 civarında olmalıdır.
2
Test puanlarının dizi geniĢliği = 65 ─ 45 = 20
92
YORUM: Hesaplanan dizi geniĢliği beklenenden oldukça düĢük olduğu için TESTĠN
AYIRTEDĠCĠLĠK GÜCÜ ZAYIFTIR yani iyi öğrenmiĢ öğrenci ile iyi öğrenmemiĢ öğrenciyi ayırt
etme gücü ZAYIFTIR.
Testten elde edilen puanların aritmetik ortalamasından yararlanılarak da özellikle testin ayırt
edicilik gücü hakkında bilgi sahibi olunabilir. BaĢlıca, kullanılıĢ amacı: farklı baĢarı düzeylerine
göre öğrencileri ayırt etmek ve öğrenme derecelerine göre öğrencileri sıralamak olan bir testin
ORTALAMA PUANI; O TESTEN ELDE EDĠLECEK EN YÜKSEK PUANIN YARISINA yakın
olmalıdır.
ÖRNEK:
Dersler X K
Fizik 60 110
Kimya 68 130
Biyoloji 36 80
Tarih 52 120
Matematik 52 100
Yukarıdaki tabloda 5 derse ait aritmetik ortalama ve soru sayıları verilmiĢtir. Sınıfın
hangi dersteki ayırt ediciliği en yüksektir?
Dağılımın standart kayması ile dizi geniĢliği birlikte de düĢünülebilir. Dizi geniĢliğinin (R) standart
kaymaya (S) oranı bu konuda bir fikir verebilir.
KURAL: Geçerliği ve güvenirliği yüksek bir testin puanlarından hesaplanan dizi geniĢliği (R)
değeri, Standart Sapma (S) değerine bölündüğünde 4 ile 6 arasında bir değer elde edilmelidir.
( R / S: 4–6)
Örnek: 80 maddeden oluĢan bir çoktan seçmeli testte en yüksek puan 65 en düĢük puan 45 ve
testin standart sapması 2,5 olarak hesaplanmıĢtır. Bu öğrendiğimiz kurala göre bu test hakkında
ne söylenebilir?
R / S = 20 / 2,5 = 8
YORUM: Dizi geniĢliğinin standart sapmaya oranı 4 ile 6 arasında bir sayı olmadığı için bu testin
güvenirliği ve geçerliği düĢüktür.
93
DAĞILIMIN YORUMLANMASI
Frekans dağılımlarına bağlı olarak bir grup hakkında iki türlü yorum yapılabilir: Bunlar
ÇARPIKLIK (KayıĢıklık) veya Bağıl DeğiĢkenlik yorumlarıdır.
ÇARPIKLIK KayıĢıklık): Bir frekans dağılımının Ģekline bakarak onu oluĢturan puanların dağılımı
hakkında bazı yorumlar yapılabilir. Bu yorumlar aritmetik ortalama, ortanca ve modun birbirlerine
olan büyüklük, küçüklük ve eĢitlik durumlarına göre üç farklı biçimde yapılır.
(ORTALAMA-ORTANCA)
ÇARPIKLIK ÖLÇÜSÜ = 3. ————————————
S. SAPMA
Bu formülün uygulanması sonunda elde edilen değerlere göre testin güçlüğüne iliĢkin
olarak Ģunlar söylenebilir:
ÇARPIKLIK ÖLÇÜSÜ GRUP ĠÇĠN TESTĠN GÜÇLÜK DÜZEYĠ
NOT: Verilen formül uygulandığında elde edilen sonuç sıfır veya sıfır civarında çıkarsa normal
dağılım eğrisine uyuyor demektir.
ÖRNEK: Aritmetik ortalaması 68, ortancası 65 ve standart sapması 13 olan bir testin çarpıklık
değeri kaçtır? Bu test nasıl bir testtir?
(68–65) 3,3
ÇÖZÜM: ÇARPIKLIK = 3. ————— = —— = 0,69
13 13
Bu test zor sorulardan oluĢan, oldukça zor bir testtir. Yorumu yapılabilir.
94
BÖYLE BĠR GRAFĠK SĠMETRĠK BĠR DAĞILIM
OLDUĞUNU GÖSTERĠR
birbirine eĢit olmayıp ikisinin eĢit olduğu bir dağılım var ise
X
MOD
MEDYAN
b) Sağa Çarpık Dağılım (Pozitif KayıĢlı): Mod < Ortanca < x (Aritmetik Ortalama)
Ģeklinde olduğu yani aritmetik ortalamanın ortancadan, ortancanın moddan büyük olduğu dağılım
sağa çarpık yani pozitif kayıĢlı bir dağılımdır. Grafikle gösterecek olursak:
Grafikte puanların çoğu dağılımın sol tarafında yığılmıĢtır. Böyle bir dağılımda Ģu yorumlar yapılır:
►Pozitif kayıĢlıdır.
►Öğretim yetersizdir.
c) Sola Çarpık Dağılım (Negatif KayıĢlı): X < ORTANCA < MOD Ģeklinde olduğu yani
aritmetik ortalamanın ortancadan küçük, ortancanın da moddan küçük olduğu dağılım SOLA
ÇARPIK yani NEGATĠF KAYIġLI bir dağılımdır. Puanların yarıdan fazlasının aritmetik
ortalamanın üstünde toplandığı söylenir. Grafikle gösterecek olursak;
95
frekans
puan
x MEDYAN MOD
Grafikte puanların çoğu sağ tarafta yığılmıĢtır. Böyle bir dağılımda Ģu yorumlar yapılır:
►Negatif kayıĢlıdır.
►Öğretim yeterlidir.
►Öğrencilerin öğrenme düzeyi yüksektir.
►BaĢarı yüksektir.
d) Ġki ya da Çok Modlu Dağılım: BaĢarı düzeyleri çok farklılık gösteren bir sınıfın
dağılımı bu Ģekildedir. Öğretim dönemi baĢında öğrencilerin önbilgi düzeyleri çok farklılık
gösteriyorsa öğretim sonunda bu tür bir dağılım elde edilebilir.
MOD X MOD
ORTANCA
96
BAĞIL DEĞĠġKENLĠK KATSAYISI (V)
Hem aritmetik ortalamayı hem de standart sapmayı içeren ve daha çok bilgi, veren değiĢkenlik
katsayısı ―bağıl değiĢkenlik‖ katsayısıdır. Bağıl değiĢkenlik katsayısı standart sapmanın aritmetik
ortalamaya bölünüp, yüzle çarpılması sonucunda elde edilen bir yüzdedir. Bağıl değiĢkenlik
katsayısı aĢağıdaki formül ile hesaplanır.
Sx
V = .100
X
Normal dağılım gösteren bir veri grubunda bağıl değiĢkenlik katsayısı 20 ile 25 arasında
değiĢir.
Bağıl değiĢkenlik katsayısının 20‘en daha küçük olması standart sapmanın aritmetik
ortalamaya göre küçük olması demektir. Standart sapmanın küçük olması ise, puanların birbirine
yakın olduğu, yani puan dağılımının sivri olduğunu gösterir.
Bağıl değiĢkenlik katsayısının 25‘ten daha büyük olması standart sapmanın aritmetik
ortalamaya göre büyük olduğu anlamına gelir. Standart sapmanın büyük olması ise, puanların
birbirinden uzak olduğu, yani puan dağılımının basık olduğunu gösterir.
Bağıl
Puan
DeğiĢkenlik Dağılım Özelliği
Dağılımı
Katsayısı
26 ve yukarısı Heterojen Basık
20-25 Normal Normal Dağılım
97
STANDART PUANLAR
Standart puan; gözlenen puanların ortalamadan olan farklarının standart sapma cinsinden
belirtilmesidir. Ġki farklı dersten alınan puanların veya farklı kategorilerden elde edilen
ölçümlerin birbirleriyle karĢılaĢtırılması hatalı olur. KarĢılaĢtırmanın yapılabilmesi için Z ve T
puanlarının hesaplanması gerekir. Bu puanlar; araĢtırmalarda sıkça karĢılaĢılan Ģu tür soruları
cevaplandırma imkânı sağlar:
→ Üzerinde birden çok gözlem yapılan bir öğrenci (birden çok test alan bir öğrenci) aldığı
puana göre hangi testte daha baĢarılıdır?
→ Birden çok gözlemden aldıkları puanlara göre, birçok kiĢiden hangisi daha baĢarılıdır?
→ Birden çok gözlemden aldıkları puanlara göre birçok kiĢinin baĢarı sırası nedir?
A) Z PUANI = Z puanlarının ortalaması sıfır ( X =0) Standart sapması (S = 1,00) kabul edilir.
Herhangi bir kiĢinin testten almıĢ olduğu puanı Z puanına dönüĢtürerek verilen bir puanın
ortalamanın ne kadar altında veya üstünde kaldığını belirleyebiliriz. Z puanını hesaplayabilmek için
Ģu formülden yararlanırız:
XX
FORMÜL = Z =
S
Z: Z Puanı
98
ÖRNEK:
GELĠġĠM 75 60 12
ÖĞRENME 80 65 10
ÖLÇME 65 65 5
YÖNTEM 90 80 4
PROG. GEL. 60 50 6
REHBERLĠK 85 60 8
XX
Z=
S
75 60
* GELĠġĠM ĠÇĠN = 1,25
12
80 65
* ÖĞRENME ĠÇĠN = 1,5 BULUNAN Z
10
DEĞERLERĠNDEN EN
65 65 BÜYÜK DEĞER
* ÖLÇME ĠÇĠN = 0 EN DÜġÜK Z PUANI
5 ÖĞRENCĠNĠN EN BAġARILI
OLDUĞU DERSĠ
90 80
* YÖNTEM ĠÇĠN = 2,5 GÖSTERĠRKEN EN KÜÇÜK
4 DEĞER ÖĞRENCĠNĠN EN
60 50 BAġARISIZ OLDUĞU DERSĠ
* PROG. GEL. ĠÇĠN = 1,6 GÖSTERĠR.
6
85 60
* REHBERLĠK ĠÇĠN = 3,13 EN BÜYÜK Z PUANI
8
ÖRNEK: AĢağıdaki tabloda bir öğrencinin dört farklı baĢarı testinden aldığı puanlar ile testlerin
ortalaması ve standart sapması verilmiĢtir.
1. TEST 2. TEST 3. TEST 4. TEST
Öğrencinin puanı = 60 63 67 90
Testin Ortalaması = 50 60 55 50
Testin Standart Sapması = 10 1 12 40
99
2007 / KPSS
AĢağıdaki tabloda beĢ dersin sınavlarının puan dağılımlarına iliĢkin aritmetik ortalama ile
standart sapmalar ve Ali‟nin bu sınavlardan elde ettiği puanlar verilmiĢtir.
En baĢarılı En baĢarısız
A) Matematik Türkçe
B) Matematik Biyoloji
C) Fizik Kimya
D) Fizik Biyoloji
E) Kimya Biyoloji
(X X )
T= 50+ .10
S
Eğer önceden Z puanları hesaplanmıĢ ise Z puanlarını T puanına dönüĢtürmek daha kolaydır. Bu
durumda Ģu formül kullanılır =
T = 50 + 10. Z
NOT: Z puanlarının NEGATĠF (-) çıkması, sıfır (0) değerini alması gibi olumsuzluklardan dolayı Z
puanı T puanına dönüĢtürülür. Sonuç olarak aynı olmasına karĢın T puanları pozitif değerler
aldığından anlaĢılması ve yorumlanması daha kolaydır.
NOT: Bir öğrencinin birden fazla ders içerisindeki veya birden fazla öğrenci içerisindeki baĢarı
derecesi sorulduğu zaman mutlaka Z ve T puanı hesaplamalarından birisi yapılmalıdır.
ÖRNEK:
ÖĞR. PUANI 60 70 80
X 50 60 40
S 10 20 10
60 50
ZMAT = 1.00 T= 50+10.Z= TMAT= 50+10.1 = 60
10
100
B) Fizik dersinin Z ve T puanları kaçtır?
70 60 10
ZFĠZĠK = =0,50 T= 50+10.Z= TFĠZĠK= 50+10.0,50= 55
20 20
C) Kimya dersinin Z ve T puanları kaçtır?
80 60 40
ZKĠMYA = 4 T= 50+10.Z = TFĠZĠK= 50+10.4= 90
10 10
D) EN BAġARILI OLUNAN DERS HANGĠSĠDĠR?
Z ve T puanının en yüksek olduğu ders olan KĠMYA dersi en baĢarılı olunan derstir.
2008 KPSS: Aynı öğrencilere uygulanan ve bağıl değerlendirme yapılan iki sınavla ilgili aritmetik
I 55 15 70 ?
II 60 5 ? 68
B) Ali ikinci sınavdan da 70 alırsa ilk sınava göre daha baĢarısız olmuĢ olur.
D) AyĢe‘nin ikinci sınavdaki baĢarısı Ali‘nin ilk sınavındaki baĢarısından daha iyidir.
%68
%95
%99
101
→ -1 ile +1 standart sapma bölgesinde yer alan notlar, sınava giren öğrencilerin % 68‘inin notlarını
gösterir.
→ -2 ile +2 standart sapma bölgesinde yer alan notlar, sınava giren öğrencilerin % 95‘inin notlarını
gösterir.
→ -3 ile +3 standart sapma bölgesinde yer alan notlar, sınava giren öğrencilerin % 99‘unun
notlarını gösterir.
SORU: Standart sapması 4 olan bir çoktan seçmeli testten 60 puan alan bir öğrencinin % 99
olasılıkla gerçek puanı hangi aralıkta yer alır?
SORU: Standart sapması 3 olan çoktan seçmeli bir testten 70 puan alan bir öğrencinin % 95
olasılıkla gerçek puanı hangi aralıkta yer alır?
SORU: Standart sapması 10 olan bir çoktan seçmeli testin güvenirlik katsayısı 0,75 tir. Bu
testten 60 puan alan bir öğrencinin gerçek puanı % 68 olasılıkla hangi güven aralığında yer alır?
NOT: Böyle bir durumda yani hem standart sapma hem de güvenirlik katsayısı veriliyor
ise bizim standart hatayı bulduktan sonra öğrencinin gerçek puanının hangi aralıklarda yer aldığını
belirlememiz gerekir.
Ölçmenin Standart Hatası Se ile gösterilir. Ve Ģu Ģekilde formüle edilir
Se = SS. 1 rx
Se = 10. 1 0,75 -3 -2 -1 0 1 2 3
55 60 65
Se = 10.0,5
Se = 5 Öğrencinin gerçek puanı 55–65 güven aralığındadır.
102
ÖRNEK SORULAR
2001 KPSS: Bir sınıftaki öğrencilerin beĢ farklı testteki yanıtları 100 üzerinden puanlanmıĢ ve
bu puanlardan aĢağıdaki tabloda gösterilen istatistikler hesaplanmıĢtır.
ARĠTMETĠK ORTALAMA MOD ORTANCA STANDART S
1. TEST: 60 70 65 8
2. TEST: 30 40 35 6
3. TEST: 40 40 40 10
4. TEST: 40 20 25 10
5. TEST: 50 30 40 15
SORU 1 ) Bu bilgilere göre hangi testten elde edilen puanların dağılımı ―tek modlu ve
simetriktir‖?
A) 1 B) 2 C) 3 D) 4 E) 5
Çözüm: Simetrik dağılımlar normal dağılımlardır. Normal dağılımlarda aritmetik ortalama, mod
(tepe değer) ve medyan (ortanca) aynı değerdir. 3. testin MOD, MEDYAN ve ARĠTMETĠK
ORTALAMASI birbirine eĢit olduğu için SĠMETRĠK olan dağılım 3. TESTTĠR…
Çözüm: Soruda sorulan ortalamadan sapma miktarını belirlemek için standart sapma değerine
bakılır. Ortalamadan sapmanın en yüksek olduğu test yani standart sapması en yüksek olan test 5.
TESTTĠR. Standart sapması en düĢük yani ortalamadan sapmanın en az olduğu test 2 . TESTTĠR.
CEVAP E ġıkkıdır.
SORU 3) Hangi testte: yoklanan öğrenmeler açısından, sınıftaki öğrenciler arasındaki farklılaĢma
en büyüktür?
A) 1 B) 2 C) 3 D) 4 E) 5
Çözüm: Öğrenciler arasındaki farklılaĢma hakkında bize standart sapma bilgi verir. Standart
sapma değeri küçükse grup homojendir yani öğrenciler arası farklılaĢma azdır. Standart sapma
değeri büyüdükçe gruptaki öğrenciler arası farklılaĢma artar. Yani grup HETEROJENDĠR…
103
2002 KPSS: Her biri 0 veya 1 Ģeklinde puanlanan 100 soruluk genel baĢarı sınavında eĢit sayıda
öğrencisi olan 5 sınıfın puan dağılımlarının genel Ģekilleri ile aritmetik ortalama ve standart sapma
değeri aĢağıdaki grafiklerde gösterilmiĢtir:
I II III IV V
A) I B) II C) III D) IV E) V
Çözüm: Grubun testten baĢarılı olduğu grafikler sola çarpık grafiklerdir. Hatırlanacağı üzere sola
çarpık grafiklerde sorular kolay, grup baĢarılı idi. Buna göre II ve V grafikler sola çarpık
grafiklerdir. II. De ortalama 65, SS = 10‘dur. V. te ortalama 70, standart sapma 5‘tir. Buna göre
V.dağılımının ortalaması daha yüksek ve standart sapması da daha küçük olduğu için en baĢarılı
grup V. dağılımının olduğu gruptur.
2004 KPSS:
A) 14 B) 25 C) 48 D) 28 E) 54
Çözüm: Bir puan dağılımında en çok tekrar eden (frekansı en çok olan) puan ya da ölçüme tepe
değer (mod) denir. Doğru cevap E seçeneği.
MATEMATĠK 70 60 65 10 60
FĠZĠK 65 70 75 4 72
TÜRKÇE 68 75 70 5 55
TARĠH 80 80 80 7 73
COĞRAFYA 60 65 70 3 69
104
SORU) Hangi derste dağılım normaldir? (KayıĢıklık O ya da simetriktir)
SORU) Hangi derste grup heterojendir ya da farklılaĢma en yüksek veya öğrencilerin öğrenme
düzeyleri birbirine uzaktır?
Çözüm: Ortalama öğrenme düzeyi için aritmetik ortalamaya bakılır. Aritmetik ortalamanın en
yüksek olduğu TARĠH dersinde ortalama öğrenme düzeyi en YÜKSEK; aritmetik ortalamanın en
düĢük olduğu COĞRAFYA dersinde ortalama öğrenme düzeyi en düĢüktür…
SORU ) Öğrencinin en baĢarılı ve en baĢarısız olduğu ders hangisidir?
60 70
1. YOL = ZMAT = 1
10
Z PUANININ en yüksek olduğu
72 65
ZFĠZ = 1,75 COĞRAFYA dersi öğrencinin en
4
55 68 baĢarılı olduğu derstir. Z PUANININ
ZTÜRKÇE= 2,6
5 en düĢük olduğu TÜRKÇE dersi de
73 80 öğrencinin en baĢarısız olduğu derstir.
ZTARĠH= 1
7
69 60
ZCOĞ= 3
3
105
BĠLĠMSEL ARAġTIRMANIN TEMEL KAVRAMLARI
EVREN: AraĢtırmanın yapılacağı, araĢtırma süresinde elde edilen verilerin analizi ve sonuçlarının
geçerli olacağı grubu ifade eder.
NĠCEL DEĞĠġKEN: Gözlenen değiĢkenlerden elde edilen veriler sayı ve miktar olarak
belirleniyor ve açıklanıyor ise bu tür değiĢkene NĠCEL DEĞĠġKEN adı verilir. Örn: YaĢ, Ağırlık,
Boy, Sıcaklık, Zaman
NĠTEL DEĞĠġKEN: Gözlenen değiĢken kalite, özellik ve tür olarak kategorilere ayrılıyorsa
bunlara nitel değiĢken adı verilir. Örn: BaĢarılı-baĢarısız, bayan-erkek gibi.
SÜREKLĠ DEĞĠġKEN: Ġki ölçüm arasında sayıda değer alabilen ve bu değerleri sayısal olarak
ifade edebilen değiĢkenlerdir. Örn: Boy, kilo vb…
SÜREKSĠZ DEĞĠġKEN: Cinsiyet, medeni durum, sürücü belgesine sahip olup olmama gibi iki
değer alabilen ve kesirli değerler kabul etmeyen değiĢkenlere denir.
BAĞIMSIZ DEĞĠġKEN: Bir araĢtırmada etkisi incelenen yani SEBEP durumunda olan
değiĢkendir.
BAĞIMLI DEĞĠġKEN: Bir araĢtırmada olayın SONUCU durumunda olan yani bağımsız değiĢkene
bağlı olarak değiĢiklik gösteren değiĢkendir.
BAĞIMSIZ BAĞIMLI
DEĞĠġKEN DEĞĠġKEN
BAĞIMSIZ BAĞIMLI
DEĞĠġKEN DEĞĠġKEN
106
2006 KPSS: Bir öğretmen fen bilgisi öğretiminde performans değerlendirme yaklaĢımını
matematik baĢarısına etkisini ölçmeyi planlayan bir öğretmen, bir sınıfında geleneksel öğretim
yöntemini kullanırken diğer bir sınıfında ise iĢlenen her konudan sonra bilgisayar programıyla
alıĢtırmalar yaptırmaktadır.
KORELÂSYON: DeğiĢkenler arasındaki iliĢkiyi sayısal olarak gösteren istatistiksel bir tekniktir.
Korelâsyon katsayısı -1.00 ile +1.00 arasında değer alır. DeğiĢkenler birlikte azalıp birlikte
çoğalıyorsa iliĢki (+) yönde; biri artarken diğeri azalıyorsa veya biri azalırken diğeri artıyorsa
iliĢki (-) yönde çıkar. Korelasyon katsayısının +1‘e veya -1‘e yaklaĢması iliĢkinin mükemmelliğini
SIFIRA yaklaĢması ise zayıflığını ya da yokluğunu gösterir.
Pozitif (Doğrusal) ĠliĢki:
Nötr Kolerasyon:
Örn: Yemek Yeme → Hayvan Sevgisi
107
2006 KPSS: Bir grup öğrencinin tarih, coğrafya, felsefe ve yabancı dil testlerinden aldıkları
dil
dil
2008 KPSS: Bir araĢtırmada X ve Y değiĢkenleri arasında sıfıra yakın bir iliĢki bulunmuĢtur.
Bu değiĢkenler aĢağıdakilerin hangisinde verilenler olabilir?
X Y
108
ÖLÇME VE DEĞERLENDĠRME SORULARI
X ORTANCA STANDART
SAPMA
1 30 50 20
2 40 40 8
3 50 60 10
4 70 50 4
5 90 70 5
A) 1 B) 2 C) 3 D) 4 E) 5
A) 1 B) 2 C) 3 D) 4 E) 5
ÇÖZÜM. Sağa çarpık dağılımlar çarpıklık değeri pozitif olan dağılımlardır.
3.( x or tan ca )
Çarpıklık = formülünden dağılımların çarpıklık
S tan dartsapma
değeri hesaplandığında 4. testin çarpıklığı 15 bulunur ve en yüksek
bu olduğu için sağa çarpıktır
yorumu yapılır.
SORU 3. Bir testin güvenirliği 0,75 ve test puanlarının standart kayması 5 ise yapılan
ölçmenin standart hatası kaçtır?
A) 2,5 B) 3,5 C) 5 D) 6,2 E) 8
Se = 5x. 1 rx
Se = 5. 1 0,75
Se = 5. 0,25
Se = 5.05
Se = 2,5 (CEVAP A)
109
SORU 4. Güvenirliği 0,75 standart sapması 10 olan bir testten 45 puan alan bir öğrencinin
% 99 olasılıkla puanının güven aralığı kaçtır?
Se = 10. 0,25
Se = 10.0,5
Se = 5
-3 -2 -1 0 1 2 3
30 35 40 45 50 55 60
CEVAP B
SORU 5. Yapılan bir sınavda Aritmetik Ortalama = 60, Ortanca = 55, Standart sapma =5
bulunmuĢtur. Bu dağılım için aĢağıdakilerden hangisi söylenemez.
110
Tepe Ortanca Standart AyĢe‘nin
TÜRKÇE 65 70 70 6 50
MATEMATĠK 36 55 40 5 46
FĠZĠK 40 40 40 8 45
KĠMYA 35 20 30 9 50
COĞRAFYA 80 40 45 12 90
A) Matematik ─ Türkçe
B) Matematik ─ Kimya
C) Coğrafya ─ Matematik
D) Coğrafya ─ Fizik
E) Coğrafya ─ Türkçe
ÇÖZÜM: AyĢe‘nin en baĢarılı ve en baĢarısız olduğu dersleri bulabilmek için onun her bir
ders için Z puanını hesaplarız. Z puanının en büyük olduğu ders en baĢarılı olduğu derstir. En
küçük olduğu derste en baĢarısız olduğu derstir.
Öğrencinin puanı-Aritmetik Ortalama
Z puanı = —————————————————
Standart Sapma
xx
Z=
SS
50 65
Z Türkçe = = -2,5
6 Öyleyse en baĢarılı olduğu der Z
46 36 puanının 2 olduğu MATEMATĠK
Z Mat = =2 dersidir.
5 En baĢarısız olduğu derste Z puanın
45 40 -2,5 olduğu TÜRKÇE dersidir.
Z Fiz = = 0,625
8
50 35
Z Kim = = 1,66
9
90 80
Z Coğ = = 0,83
12
111
SORU 7. En yüksek ve en düĢük ortalama öğrenme düzeyleri sırasıyla hangi derslerdir.
A) Coğrafya ─ Kimya
B) Matematik ─ Coğrafya
C) Türkçe ─ Kimya
D) Fizik ─ Kimya
E) Kimya ─ Matematik
ÇÖZÜM: En yüksek ve en düĢük ortalama öğrenme düzeyleri hakkında bize ARĠTMETĠK
ORTALAMA bilgi verir. Aritmetik ortalamanın en yüksek olduğu derste ortalama
öğrenme düzeyi en yüksektir. Soruda da aritmetik ortalamanın en yüksek olduğu
ders COĞRAFYA dır.
B) Kimya
C) Coğrafya
D) Fizik
E) Türkçe
112
12
10
8
6
4
2
0
2 4 6 8 10 12 14 16
Puan
SORU 10.
A) 18 B) 14 C) 10 D) 6 E) 2
ÇÖZÜM. Ranj (Dizi GeniĢliği) Bir dağılımda en yüksek puan ile en düĢük puan arasındaki
farktır.
ÇÖZÜM . Mod (tepe değer): Bir puan dağılımında en çok tekrarlanan puandır, ya da frekansı
en çok olan değerdir.
B) Sola çarpıktır.
C) Sağa çarpıktır.
113