Download as pptx, pdf, or txt
Download as pptx, pdf, or txt
You are on page 1of 71

MTSK SINAV SORUMLUSU

YETİŞTİRME KURSU
ÖLÇME VE DEĞERLENDİRME

Dr. Öğr. Celal İNCE


ÖLÇME VE DEĞERLENDİRME KURS
İÇERİĞİ
◦ Ölçme
◦ Ölçek
◦ Ölçüt
◦ Değerlendirme
◦ Ölçme türleri
◦ Ölçek türleri
◦ Değerlendirme türleri
◦ Bir ölçme aracında bulunması gereken özellikler
◦ Geçerlik türleri
◦ Güvenirlik türleri
◦ Psikomotor alandaki davranışların sınıflandırılması
ve performans testleri
Dr. Öğr. Celal İNCE
ÖLÇME
 Ölçme betimleme işidir.
 Kararlara dayanak oluşturacak bilgiler elde

edilmesidir.
 Ölçme farktan doğmuştur.
 Niteliklerin nicelendirilmesi işidir.
ÖLÇME
 Belli bir niteliğin gözlemlenerek gözlem
sonuçlarının sayı yada sembollerle ifade
edilmesidir.
 Belli bir nesnenin veya nesnelerin belli bir

özelliğe sahip olup olmadığının, sahipse


sahip oluş derecesinin gözlenip gözlem
sonuçlarının sembollerle ve özellikle sayı
sembolleriyle ifade edilmesidir.
ÖLÇME
Eşya, olay veya insanların ölçmeye konu olan
niteliklerini
 Sayma,

 Gözleme

 Ölçme aracıyla karşılaştırma

Ölçme işlemi sonucunda ölçmeye konu olan


niteliğin
 Sayı ile

 Derece ile

 Sıfatlarla gösterilmesi vardır.


ÖLÇME ÜÇ BASAMAKTA
GERÇEKLEŞİR

 Ölçülecek özelliğin tanınması ve


tanımlanması
 Ölçülecek özelliğin ortaya çıkarılmasını ve

gözlenmesini sağlayacak işlemlerin


belirlenmesi
 Gözlem sonuçlarını derece yada miktar olarak

niceleyecek işlemlerin bulunması.


ÖLÇME İŞLEMİNE ÖRNEKLER
 Kemal’in gözleri kahverengidir.
 İbrahim’in boyu 1.82 olarak belirlenmiştir.
 Kapının beyaz olarak belirlenmesi.
 Aslı’nın güzel olarak nitelendirilmesi
 Merve sınıfın en başarılı kızı olarak

belirlenmesi.
 Belli bir derse karşı tutumunun hangi

düzeyde olduğunun belirlenmesi


ÖLÇME İŞLEMLERİNE ÖRNEKLER
 Hangi mesleki alanlara ilgisinin olduğunun
belirlenmesi
 Ne gibi kişilik özelliklerine sahip olduğunun

belirlenmesi
 Bir kişinin cinsiyetinin belirlenmesi
 Sıcaklığın kaç derece olduğunun belirlenmesi
 Ağırlığın kaç kilogram olduğunun

belirlenmesi
ÖLÇME
GÖZLENEN NİTELİK SAYI YADA SEMBOL
Kitabın sayfa sayısı 170
Cinsiyet Kız – Erkek
Başarı sırası Üçüncü (3.)
Odanın sıcaklığı 24 C
Boy uzunluğu 165cm
ÖLÇME TÜRLERİ
Ölçmeye konu olan niteliklerden bazıları
doğrudan ölçülebilir bir nitelik taşırken bazıları
dolaylı yollarla ölçülebilecek niteliktedir.
Ölçmeyi doğrudan ve dolaylı ölçme olarak iki
türde ele almak mümkündür.

ZERRİN SARIGÜL
ÖLÇME TÜRLERİ
DOĞRUDAN (TEMEL) DOLAYLI ÖLÇME:
 Ölçülen özelliğin
ÖLÇME:
 Ölçmeye konu olan
doğrudan
ölçülemeyerek
özelliğin kendisiyle kendisiyle ilişkili olduğu
aynı türden bir düşünülen başka
araçla ölçülmesidir. özellikler aracılığıyla
 Doğal birimleri ölçülmesidir.
 Kendi içinde göstergeyle
vardır. ölçme ve türetilmiş
 Özellik doğrudan ölçme olarak ikiye ayrılır
gözlemlenir.

ZERRİN SARIGÜL
DOĞRUDAN ÖLÇME VE DOLAYLI
ÖLÇME
 Doğrudan ölçme  Dolaylı ölçme
yapıldığında ölçme yapıldığında ölçme
sonuçlarına daha az sonuçlarına daha
hata karışır. çok hata karışır.
 Uzunluk, ağırlık  Başarı, yetenek,

doğrudan kişilik, ilgi, tutum


ölçülebilmektedir. ancak dolaylı olarak
ölçüle bilmektedir.
ÖLÇME TÜRLERİNE ÖRNEKLER
 Kefeli terazi ile kütlenin ölçülmesi
 Yaylı kantar ile kütlenin ölçülmesi
 Sıcaklığın termometre ile ölçülmesi
 Uzunluğun metre ile ölçülmesi
 Sınıftaki öğrencilerin sayılması
 Bir cismin yoğunluğu(kütle/hacim)
Ölçmede Birim
 Bir ölçme aracının en küçük parçasına birim
denir.
 Doğal birim ve tanımlanmış birim olarak ikiye

ayrılır.
 Birimin ;Eşitlik-Genellik-Kullanışlık olmak

üzere 3 özelliği vardır.

ZERRİN SARIGÜL
ÖLÇMEDE SIFIR
 Doğal Sıfır (Mutlak): Gerçekte yokluğu ifade
eden sıfırdır. Kg, metre… Örneğin 0 metre
olan bir şey gerçekte yokluğu ifade eder ve
gerçekten yoktur.
 Tanımlanmış Sıfır (Bağıl, İzafi Sıfır): Gerçekte

yokluğu ifade etmeyen, izafi olarak


oluşturulmuş bir başlangıç noktasıdır.
Sıcaklık, takvim… Örneğin sıcaklık 0 derece
ise sıcaklık yoktur diyemeyiz, sıfır derece de
olsa ortada hissedilen bir sıcaklık mevcuttur.
ÖLÇEK
 Ölçek, ölçme aracı anlamına geldiği gibi birim
anlamına da gelir.
 Ölçekler ölçme sonucunda elde ettiğimiz sayı ve
sembollerin matematiksel özelliklerini gösterir.
 Ölçek 1:Nesnelere sayılar vermede ve nesnelere
verilen sayıların kullanılmasında uyulması
gereken kurallar ve kısıtlamaları belirtir.
 Ölçek 2: Belli bir başlangıç noktasından itibaren
değişmez bir birimle bölmelenmiş araçtır.
ÖLÇEK
 Belli birimde bölmelenmiş ölçme aracıdır.
 Ölçme sonuçlarını gösteren sembol ve

sayıların formal nitelikleridir.


ÖLÇEK TÜRLERİ
 Ölçeklerin formal incelenmesi sonucu 4 ana
türde olabilecekleri ortaya çıkmıştır
 Sınıflama ölçekleri
 Sıralama ölçekleri
 Eşit aralıklı ölçekler
 Eşit oranlı ölçekler
SINIFLAMA (ADLANDIRMA) ÖLÇEĞİ
 Ölçülecek değişkenin sadece kategorik
değerler alabildiği durumlarda kullanılır.
 Nesneleri belli bir yönde benzeyip

benzemediğine göre sınıflar.


 Farklılık veya benzerlik çok kaba biçimde

saptanır.
 Gözlemin en basit biçimidir.
 Sayılar sadece sınıf, küme, tip veya kategori

bildirir.
SINIFLAMA (ADLANDIRMA) ÖLÇEĞİ
 Simetriklik ve geçişlilik özelliği vardır.
 Hassasiyeti en düşük ölçme türüdür.
 Bu ölçekle sadece sayma işlemi ve saymaya

dayalı işlemler yapılabilir. Yani frekans


bulunabilir. Yüzdelikler ve mod bulunabilir.
 Toplama, çıkarma, çarpma ve bölme gibi

işlemler yapılamaz.
SINIFLAMA ÖLÇEĞİYLE YAPILAN
ÖLÇME ÖRNEKLERİ
 Cinsiyet
 Medeni durum
 İllerin telefon kodları
 Öğrencilerin okul numaraları
 Sporcuların sırt numaraları
SIRALAMA ÖLÇEĞİ
 Nesneleri belli bir özelliğe sahip oluş miktarı
bakımından sıraya koymakla elde edilir.
 Özelliğe en az sahip olandan en çok sahip

olana yada en çok sahip olandan en az sahip


olana doğru sıralar. Sonra her bir sıraya sayı
verilir. Belli bir özelliğe birbirlerine göre göre
daha az yada daha çok sahip olma durumunu
belirtir.
 Farkı anlatır ancak farkın miktarını

yansıtmaz.
SIRALAMA ÖLÇEĞİ
 Geçişlilik ve asimetriklik özellikleri vardır.
 Başlangıç noktası ve sıralar sabit değildir.
 Dört işlem yapılamaz. Çünkü verilen

rakamların matematiksel anlamları yoktur.


 Azlık-çokluk veya büyüklük-küçüklük sırasını

verir. Ancak bunun miktarını vermez.


 Eşitlik ve farklılığın yanı sıra daha az veya

daha çoğu gösterir.


 Ortanca hesaplanabilir.

ZERRİN SARIGÜL
EŞİT ARALIKLI ÖLÇEK
 Ölçülen özelliğin belli bir başlangıç noktasına göre
belli bir özelliğe sahip oluş derecesi bakımından
eşit aralıklarla sıralandığı ölçek türüdür.
 Sıralar arasındaki fark eşittir.
 Ölçme işlemi sonucunda elde edilen sayısal
değerler bir miktarı gösterir. Ölçülen özelliğe sahip
oluş düzeyi bakımından karşılaştırma yapma
imkanı tanır.
 Ölçekteki tüm birimler birbirine eşittir ve başlangıç
noktası olan sıfır noktası matematiksel anlamda
sıfır değildir. İzafi sıfırdır.
EŞİT ARALIKLI ÖLÇEK
 Toplama, çıkarma, aritmetik ortalama,
standart sapma, korelasyon gibi bir takım
istatistiksel işlemler yapılabilir.
 Başlangıç noktası izafi sıfır olduğu için

oransal işlemlere imkan vermez.


EŞİT ARALIKLI ÖLÇEK ÖRNEKLERİ
 Saat
 Takvim
 Termometre
 Standart testler

ZERRİN SARIGÜL
EŞİT ORANLI ÖLÇEKLER
 İzafi sıfır yerine doğal sıfır noktası vardır.
 Gerçek bir sıfır noktası vardır ve ölçek eşit

aralıklarla bölmelenmiştir.
 Bu ölçekle elde edilen ölçme sonuçları

üzerinde her türlü matematiksel işlem


yapılabilir.
 Ölçülen özellik hakkında en duyarlı ölçme

sonuçlarını verir.
 En çok bilgi sağlayan ölçek türüdür.
EŞİT ORANLI ÖLÇEK ÖRNEKLERİ
 Uzunluk ölçüleri
 Ağırlık ölçüleri
 Elektrik ölçümleri
 Ses şiddeti
 Basınç birimleri

ZERRİN SARIGÜL
ÖLÇÜT
 Elde edilen ölçümlerden bir anlam çıkarmak
için söz konusu ölçümlerin bir ölçüt ile
karşılaştırılması gerekir.
 Ölçüt olmadan ölçme sonuçları hakkında bir

yargıya varılamaz.
 Ölçütün amaca uygun olması gerekmektedir.
 Mutlak ölçüt ve bağıl ölçüt olarak ikiye

ayrılmaktadır.

ZERRİN SARIGÜL
MUTLAK ÖLÇÜT (ÖLÇÜT YADA
KRİTER DAYANAKLI ÖLÇME)
Değerlendirilecek grup dikkate alınmadan
önceden, kesin olarak belirtilirse buna mutlak
ölçüt denir.
 Süreç öncesinde belirlenir ve kıyas yoktur.
 Kesin ve önceden belirlenmiş bir eşik

değeridir.
 Konu kapsamı ya da hedef davranışlara dayalı

ölçmelerde mutlak ölçüt kullanılmaktadır.


MUTLAK ÖLÇÜT
 Sınava girmeden önce öğrenci kaç puan alırsa
başarılı olacağını bilir. Buradaki ölçüt mutlak
ölçüttür.
 Bir alanda yeterliliğin belirlenmesinden

bahsediliyorsa buradaki ölçüt mutlak


olmalıdır.
MUTLAK ÖLÇÜT ÖRNEKLERİ
 Sınavdan geçmek için 60 almak
 Mezun olmak için diploma notunun 4

üzerinden 2 olması
 Askere ağırlığı 150 kg nin altında olanların

alınması
 Soruların %80 nini doğru cevaplayanların

finale kalması
 Dil tazminatı için yds den en az 50 alınması
BAĞIL ÖLÇÜT (NORM DAYANAKLI
ÖLÇME)
 Bağıl ölçütte ölçüt ölçme sonuçlarından
çıkarılır.
 Ölçme işlemi yapılmadan ölçütün sınırı

belirlenemez. Bu nedenle bağıl ölçüt ölçme


işlemi yapıldıktan sonra belirlenmektedir.
 Bireylerin performansları birbirini etkiler.
BAĞIL ÖLÇÜT ÖRNEKLERİ
 İlk %20′lik dilime girme
 Çan eğrisi sistemi.
 Sınıf ortalaması ve üstünde puan alanlar
 En yüksek notu alan ilk üç kişi
 Bilgi yarışmasından en az puanı alma
 Grup ortalamasının üzerinde performans

gösterme
ÖLÇMEDE HATA KAYNAKLARI
Ölçmede hata
 ölçmeciden,
 ölçülen özellikten,
 ölçme aracı ya da yönteminden
 ölçme ortamından

kaynaklanan hatalar olarak karşımıza


çıkmaktadır.
ÖLÇMECİDEN KAYNAKLANAN
HATALAR
Hatanın ölçmeyi yapan kişiden çıkmasıdır.
 Nesnel davranmaması
 Dikkatsiz olması
 Önyargıları
 Eğitim düzeyi

ZERRİN SARIGÜL
ÖLÇÜLEN ÖZELLİKTEN
KAYNAKLANAN HATALAR
Hatanın üzerinde ölçme yapılan kişiden
çıkmasıdır.
 Psikolojik durumu
 Önyargıları
 Stres
 Kişinin dikkatsizliği
 Kişinin sağlık durumu
ÖLÇME ARACI VEYA YÖNTEMİNDEN
KAYNAKLANAN HATALAR
Ölçmek istediğimiz özelliği yanlış araç ya da
yanlış yöntemle ölçmemiz sonucunda ortaya
çıkan hatalardır.
 Psikomotor davranışların yazılı yoklamayla

ölçülmesi bu hata türüne örnektir.


ÖLÇME ORTAMINDAN
KAYNAKLANAN HATALAR
Ölçme ortamındaki eksikliklerden ya da
olumsuzluklardan ortaya çıkan hatalardır.
 Sıcak ortam
 Gürültü
 Işık vs.

ZERRİN SARIGÜL
ÖLÇMEDE HATA TÜRLERİ
 Sabit hata
 Sistematik hata
 Tesadüfi hatalardır.

ZERRİN SARIGÜL
SABİT HATA
 Ölçümden ölçüme değişmeyen hata türüdür.
 Her bir ölçüme için aynı yönde etkilidir.
 Her ölçümde hata miktarı aynıdır.
 Kaynağı bellidir.
 Ayıklanabilir bir hata türüdür.
 Bireysel ölçümleri ve ölçümlerin ortalamalarını
gerçekte olduğundan büyük yada küçük göstere
bilir.
 Ölçümlerin dağılım ölçülerini (standart sapmayı)
değiştirici yönde etkiye sahip değildir.
SABİT HATA ÖRNEKLERİ
 Öğretmenin herkese 10 puan fazla vermesi.
 Kırık bir cetvelle bir kez yapılan ölçme.
 Baskülün her ağırlığı 1 kg fazla tartması.
 Soruların birine hiçbir öğrencinin cevap

verememesi.
 Süre yetersiz olduğundan 10. sorunun

cevaplanamaması
SİSTEMATİK HATA
Ölçülen büyüklüğe, ölçmeciye veya ölçme
koşullarına bağlı olarak miktarı değişen
hatalara sistematik hata denir.
 Hata belli bir kurala göre yapılmaktadır.
 Yönü ve miktarı tespit edilebilir.
 Hatanın kaynağı bellidir ve hata düzeltilebilir.
 Puanlayıcı yanlılıklarını yansıtan tüm hatalar

sistematiktir.
 Sabit hatadan ayrılan kısmı her ölçmeye

hatanın karışmaması ya da karışıyorsa hata


miktarının farklı olmasıdır.
SİSTEMATİK HATA ÖRNEKLERİ
 Yazısı güzel olanlara 10 puan fazla vermek
 Her öğrenciye puanlarının %10′u kadar fazla

puan vermek
 Kırık bir cetvelle aynı özellik üzerinde birden

çok defa ölçüm yapmak


 Kız öğrencilere 10 puan fazla vermek.
 50 puanlığa 5, 60 puanlığa 10, 70 puanlığa

15 puan fazla vermek.


 Yazı güzelliğine, ifade gücüne, devamsızlığa

göre puan vermek.


TESADÜFİ (RASGELE-RANDOM)HATA
 Yönü çoğu zaman belli olmakla birlikte
miktarı belli olmayan hata türüdür.
 Tesadüfi hatada, hata kaynağı çoğunlukla

belli değildir.
 Hata ölçme sonuçlarına gelişigüzel karışır,

düzeltilemez.
 Bir ölçme sonucu içindeki rasgele hataların

azlığı oranında güvenilirdir.


TESADÜFİ HATA ÖRNEKLERİ
 Bir öğretmenin yazılı kağıtlarını okurken
dikkatsiz davranması.
 Tartının bir nesneyi 10 gr fazla, başka bir

nesneyi 5 gr fazla ölçmesi.


 Sınav günü öğrencinin hasta olması.
 Sıranın bozuk olması.
 Güneş gelmesi, kopya çekmesi, şans başarısı,

doğru ölçüleni yanlış kaydetme, hatalı puan


verme, öğrencinin kaydırma yapması vs.
ÖLÇMEDE HATA
 Bir testin güvenirliği daha çok tesadüfî
hatalardan etkilenir.
 Sabit hata ve sistemli hata öncelikle geçerliği

düşürür.
 Aynı özellik ya da özelliklerle ilgili çok sayıda

ölçme yapılacak olursa rasgele hataların


ortalaması sıfıra yaklaşır.
DEĞERLENDİRME
 Değerlendirmenin öğeleri ölçme sonucu, ölçüt
ve karardan oluşmaktadır.
 Değerlendirme, ölçme sonuçlarının ölçütle

karşılaştırılarak nitelik hakkında karar verilme


sürecidir.
 Buradaki ölçüt, ölçme sonuçlarının

karşılaştırılarak yorumlanmasına dayanak


sağlayan kurallardır.
 Karar / Yargı: Ölçme sonuçları bir ölçütle

karşılaştırıldıktan sonra bir yargıya


varılmasıdır.
DEĞERLENDİRME TÜRLERİ
Değerlendirme türleri
 Ölçüte göre
 Amaca göre değerlendirme

olarak 2 başlıkta incelenmektedir


ÖLÇÜTE GÖRE DEĞERLENDİRME
a) Mutlak Değerlendirme: Süreç içerisinde
belirlenmiş ölçek mutlak ise, değerlendirme
mutlak değerlendirme olur. Yani ölçme
sonuçlarının mutlak bir ölçütle
karşılaştırıldığı değerlendirme türüdür.
b) Bağıl Değerlendirme: Bağıl kriterlere göre
yapılan değerlendirmedir. Diğer bir tanımla
bağıl değerlendirme, ölçme sonuçlarının
karşılaştırıldığı ölçütün, bağıl olduğu
değerlendirme türüdür.
AMACA GÖRE DEĞERLENDİRME
TÜRLERİ
a) Tanıma Yerleştirme
 Temel amaç, önkoşul eksikliklerinin

belirlenmesi ve giderilmesidir.
 Eğitim sürecinin başında, süreç öncesinde

hazırbulunuşlukların belirlenmesini hedefler.


 Genelde öğrencilerin bir okula, kursa vs.

seçilmesi için kullanılır.


 Her türlü seçme ve seçme testi tanıma

yerleştirme değerlendirmesidir.
AMACA GÖRE DEĞERLENDİRME
TÜRLERİ
b) Biçimlendirici Değerlendirme (Formative – Geliştirici)
 Öğrenme eksikliklerinin belirlenmesi amacıyla

yapılmaktadır.
 Eksikliklerin kaynağının belirlenmesi, giderilmesi ve

öğrenmelerin tamamlanmasına çalışılır.


 İzleme testleri, ünite testleri, formative testler,

quizler vs.
 Testler öğrencilere not vermek amacıyla kullanılmaz.

 İki amacı vardır: Öğrencilerin öğrenme kesikliklerini

belirlemek ve öğretimin gidişatını değerlendirmektir.


AMACA GÖRE DEĞERLENDİRME
TÜRLERİ
c) Düzey Belirleyici Değerlendirme (Summative –
Özetleyici)
 Öğrencinin öğrenme düzeyinin belirlenmesinde

kullanılır.
 Karar verilir. Geçti, kaldı, başarılı, başarısız…

 Finaller, erişi testleri (ön test ile son test

arasındaki fark) yer alır.


 Dersteki kritik davranışları ölçen sorulardan

oluşan başarı testleri kullanılır.


 Hedefe ne kadar ulaşıldığını göstermeye ve

ders başarısının belirlenmesine yardımcı olur


ÖLÇME ARAÇLARINDA BULUNMASI
GEREKEN ÖZELLİKLER
 Güvenirlik

 Geçerlik

 Kullanışlık
A) GEÇERLİK
 Bir ölçme aracı veya yönteminin, onunla ölçülmek istenen
değişkeni ölçüp ölçmediği; ölçebiliyorsa, onu başka
değişkenlerden ne derece arınık olarak ölçtüğüdür.
 Bir ölçme aracının ölçmeyi amaçladığı özelliği başka
özellikle karıştırmadan, doğru olarak ölçebilme derecesidir.
 Ölçme aracının, geliştirilmiş bulunduğu konuda maksada
hizmet etmesidir.
 Ölçme aracı neyi ölçmek için hazırlanmışsa, bunun
dışındaki özelliklerin ölçmeyi etkilememesidir.
 Örn. Bir biyoloji testi yüksek okuma gücü ve kelime bilgisi
gerektirecek şekilde hazırlanmışsa ve çocuğun bu
kabiliyetleri düşükse, biyolojiyi iyi bilse bile zayıf alır. O
öğrenci için o testin geçerliliği düşüktür.
A) GEÇERLİK
 Testin geçerliği bir derece sorunudur.
Tamamen geçerli ya da tamamen geçersiz
olması söz konusu değildir. Az geçerli veya
çok geçerli olabilir.
 Güvenirlik geçerliğin önemli parçasıdır.

Geçerli olabilmesi için test öncelikle güvenilir


olmak zorundadır.
GEÇERLİK TÜRLERİ
 Kapsam
 Yordama
 Yapı
 Görünüş
KAPSAM GEÇERLİĞİ
 En önemli geçerlik türüdür,
 Bir bütün olarak testin ve testteki her bir

maddenin amaca ne derece hizmet ettiğidir.


 Soruların belirtke tablosunda belirtilen

dağılıma uyup uymadığı kontrol edilir


YORDAMA GEÇERLİĞİ
 Yordama bir tahmindir.
 Yordama; istatistiksel teknikler kullanarak ve

bilinenlerden yararlanılarak, bilinmeyen


durumlar hakkında yapılan geleceğe yönelik
tahminlerde bulunma işlemidir.
 Bir testten alınan puanlara dayanarak, belli bir

programda ya da işteki başarısını önceden


kestirme işlemidir.
YAPI GEÇERLİĞİ
 Ölçme aracı içerisinde yer alan maddelerin,
diğer maddelerle bütünlük içerisinde
olmasıdır.
 Yapı geçerliği daha çok psikolojik ölçümlerle

ilgili görülmüştür. (İlgi, kişilik, tutum vs.)


GÖRÜNÜŞ GEÇERLİĞİ
 Testin ölçmek istediği özelliği ölçüyor
görünmesidir.
 Testin bütünü için gerekli olan bu görünüş

geçerliği her bir soru içinde gereklidir.


 Kapağında fizik testi yazan kitapçıktaki

sorular fizik bilgisini ölçüyorsa görünüş


geçerliği vardır denir.
GEÇERLİĞİ ETKİLEYEN FAKTÖRLER

● Güvenirlik: Geçerlik için güvenirlik şarttır. Ancak tek


başına yeterli değildir.
● Ölçme sisteminden kaynaklanan hatalar: Sabit hatalar ve
sistematik hatalar geçerliği düşürür.
● İstenmeyen değişkenlerin ölçümlere karışması: Testin
başka özellikleri ölçmesi geçerliği düşürür.
● Dersin kapsamı dışında sorular hazırlanması
● Maddelerin zorluk derecesi (Sorular orta güçlükte olmalı)
● Sorularla ilgili ipuçları vermek geçerliği düşürür.
● Sınav planı (Belirtke tablosu)
● Cevap şıklarının dizilişi (a a a a gibi aynı şıklar arka arkaya
gelmemelidir)
● Her sınavda farklı sorular sorulması
B) GÜVENİRLİK
 Ölçme aracının hatalardan arınıklık düzeyidir.
 Yani ölçme aracının, ölçme sonuçlarına hata karıştırmadan

ölçme yapabilmesidir. Güvenilir bir test aynı gruba iki ya da


üç kez uygulandığında, gruptaki her bir kişi, bütün
uygulamalarda yaklaşık olarak aynı puanı almalıdır.
 Ölçme sonucunda hata miktarı düştükçe güvenirlik artar.

 Güvenirlik ölçme aracının kararlılığı ve tutarlılığı ile ilgilidir.

Ölçmede objektiflik üç şekilde sağlanır;


1- Aynı özelliği birden fazla kişi ölçer ve elde edilen
sonuçların ortalaması alınır.
2-Birey aynı özelliği birkaç kez ölçer ve ölçümlerinin
ortalamasını alır.
3-Cevap anahtarı kullanarak puanlama yapar.
GÜVENİRLİĞİ ETKİLEYEN FAKTÖRLER
1.Testin uzun olması – soru sayısı: Soru sayısı ne kadar artarsa, güvenirlik o kadar
yüksek olur.
2. Test sorularının ayırt edicilik gücü: Testin soruları bilen öğrencilerle bilmeyen
öğrencileri ayırt etme gücü yükseldikçe güvenirlik artar.
3. Testin anlaşılır olması: Soruların açık ve net olması
4. Sınavın yapıldığı ortam: Isı, ışık, ses, havalandırma, güneş, gürültü gibi etkenler
güvenirliği etkiler.
5. Zaman: Verilen zamanın ne az ne de çok olması gerekir. Yetecek şekilde
verilmelidir.
6. Şans başarısı: Ölçmeye karışan bir hatadır ve güvenirliği düşürür.
7. Testin uygulama koşulları: Sınav ortamına ilişkin rahatsızlıklar (sıranın bozuk
olması, ısı vs.), hızlı okuma ve anlama becerisinin düşük olması, hastalık ve
yorgunluk, soru ve yönergeyi (açıklamalar) anlayamama.
8. Kopya çekme: Gerçek bilgiyi göstermez ve bilgi eksiklikleri belirlenemez.
9. Test maddelerinin homojenliği: Aynı testle birden fazla özellik yerine, aynı
özelliğin ölçülmesi daha verimlidir.
10. Testin güçlüğü: Sorular orta güçlükte olmalıdır. Çok kolay ya da çok zor olamsı
güvenirliği düşürür.
11. Puanlamada nesnellik: Puanlamanın nesnel olması güvenirliği arttırır.
12. Öğrencilerin özellikleri: Kişilik özellikleri (heyecanlı vs.) sınava karşı tutum,
uykusuzluk etkilidir.
Güvenirlik Belirleme Yöntemleri
Güvenirlik katsayısı: Güvenirlik katsayısı 0 ile +1
arasında değişen değerler alır. +1’e yaklaştıkça
güvenirlik artar, 0’a yaklaştıkça azalır.
Güvenirlik katsayısı; Gerçek ölçümlerin
sonucunun, gözlenen puanların (gerçek ölçüm ve
hatadan oluşur) sonucuna oranıdır. Ancak biz
gerçek ölçümleri bilemeyiz. Elimizde olan sadece
gözlenen ölçümlerdir. Gerçek ölçümlerin
bilinememesinden dolayı güvenirlik katsayısı
dolaylı olarak hesaplanmaktadır.
GÜVENİRLİK BELİRLEME YÖNTEMLERİ
a)Test – tekrar test yöntemi: Bu yöntemde bir
test aynı gruba belli bir zaman aralığıyla iki kez
uygulanır. Daha sonra bu iki uygulamadan
alınan puanlar arasındaki korelasyon
hesaplanır. Elde edilen katsayı testin güvenirlik
katsayısıdır. (İstikrar katsayısı – Kararlılık
katsayısı)
GÜVENİRLİK BELİRLEME YÖNTEMLERİ
b)Paralel testler yöntemi: Bu yöntemle yapılacak
güvenirlik tahmininde birbirine eşdeğer iki
testin geliştirilmiş olması gerekir. Paralel
testlerin her ikisi de aynı gruba uygulanır ve
öğrencilerin iki ayrı testten almış oldukları
puanlar arasındaki korelasyon hesaplanır.
Paralel iki testin eşdeğer olabilmesi için her iki
test içindeki maddelerin sayısı, niteliği ve
ölçtükleri davranışlar bakımından birbirine denk
olmalıdır.
GÜVENİRLİK BELİRLEME YÖNTEMLERİ
c)Test yarılama yöntemi (İki yarıya bölme): Test
güvenirliği belirlemede en çok kullanılan
yöntemdir. Uygulanmış olan test iki eşdeğer
yarıya bölünerek (1,3,5,7 ve 2,4,6,8. sorular
gibi) öğrencilerin testtin iki yarısından aldıkları
puanlar arasındaki korelasyon hesaplanır. Bu
yöntem testin iç tutarlılık katsayısını verir.
Bulunan güvenirlik katsayısı yarı testin
güvenirliğini verir.
GÜVENİRLİK KATSAYISI
 Hesaplamada belirlenen güvenirlik katsayısı
yüksek ise şu yorumlar yapılır;
Testin yapı geçerliği yüksektir.
Test grubu birbirinden iyi ayırmıştır. (Bilen –
bilmeyen)
Test maddeleri homojendir. (Maddeler
homojendir ve aynı davranışı ölçmüştür)
Puanlar tesadüfi hatadan arınıktır.
Maddeler birbiriyle tutarlıdır.
Madde iç tutarlıkları yüksektir.
GÜVENİRLİK VE GEÇERLİK
ARASINDAKİ İLİŞKİ
● Geçerlik için güvenirlik ön şarttır. Ancak güvenilir olan
bir ölçme aracı geçerli olmayabilir.
● Geçerlik, güvenirliğin en fazla kareköküne eşittir.
Fazla olamaz.
● Güvenirlik düştükçe geçerlikte düşer. Ancak
güvenirliği yüksek olan bir testin geçerliği düşük olabilir.
● Bir ölçme aracının güvenirliğini sağlayan bütün
çalışmalar, geçerliği de arttırır.
● Bazen güvenirliği arttırırken geçerliğin düştüğü
durumlar olabilir. ÖR: Test homojenleştirilerek (aynı tip
soru ilave ederek) güvenirlik artabilir ancak bunun
kapsamı daraltma riski vardır. Geçerlik düşer.
C) KULLANIŞLILIK
 Bir testin kullanışlılığı, onun geliştirilmesi,
çoğaltılması, uygulanması ve puanlanmasının
kolay ve ekonomik olması demektir.
 Kötü baskı, soruların okunaksız olması

kullanışlılığı etkiler.
 Her bireye ayrı ayrı hazırlandığı için bireysel

testlerin kullanışlılığı düşüktür. (Stanfort –


Binet testi gibi.)

You might also like