Professional Documents
Culture Documents
Güvenirlik
Güvenirlik
Çoğu ölçme aracı tamamen güvenilir veya geçerli sonuçlar vermez, ölçme
sonuçlarına hemen her zaman hata karışır.
Ölçmeye karışan çeşitli hatalar nedeniyle gözlenen bir özelliğin gerçek değeri
doğrudan elde edilemez.
Hatanın miktarı arttıkça elde edilen değer bireyin gerçek değerinden (gerçek başarı,
yetenek, bilgi düzeyi vb.) uzaklaşır.
Ölçmede amaç, ölçülen niteliğin gerçek değerini ortaya çıkartmaktır. Ancak çeşitli
faktörlere bağlı olarak ölçmeye hata karışır. Bu nedenle gerçek değer, gözlenen değere
dayalı olarak tahmin edilmeye çalışılır.
Ölçmede hata, gerçek değer ile gözlenen değer arasındaki fark olarak ifade edilir. Bu fark
fazla ise ölçmede hata fazla, az ise ölçmede hata azdır.
Tesadüfi
Sistematik
Sabit Hata (Random-Rastgele)
Hata
Hata
Sabit Hata
NOT: Sabit hata veren bir ölçme aracının tekrar tekrar kullanımı da sistematik hatayı doğurur.
Örneğin, 20 cm olarak hazırlanan bir cetvel aslında 19 cm ise bu cetvelin 20 cm olarak ölçtüğü
bir uzunluk için hata 1 cm iken 40 cm olarak ölçtüğü bir uzunluk için hata 2 cm olur.
Tesadüfi Hata
Kaynağı, yönü ve miktarı belli olmayan ve bazı ölçme sonuçlarına tesadüfen karışan
hatadır.
Eğitimde en çok karşılaşılan ve en büyük sorun olan hata türüdür.
Örnekler:
• Bir öğrencinin girdiği sınavda yer alan sorulardan 5’ini attığı halde tutması
• Bir öğretmenin yazılı kağıtlarını okurken bazı soruların cevaplarını görmemesi
• Dikkatsizce okunup puanlanan notlar
• Öğrencinin sınavda kaygı, heyecan, hastalık vb. nedenlerle düşük puan alması
Ölçmenin yapıldığı gruba ait bireylerde gözlenen geçici ve önceden tahmin
edilemeyen değişiklikler bu tür hata kaynaklarıdır.
Bireyin ölçme işlemi yapılırken içinde bulunduğu motivasyon, heyecan, stres,
uykusuzluk, yorgunluk, hastalık, dikkat dağınıklığı, vb.
Bireyin ölçme işlemi yapılmadan önce geçirdiği kaza, tartışma, vb.
Bireylerin test maddelerini cevaplarken yaptıkları gerçek hatalar değil, zaman
içerisinde önceden kestirilemeyen biçimde değişen ve bu nedenle ölçmede
tutarsızlığa ve hataya yol açan faktörlerdir.
Ölçme aracını oluşturan maddelerin kapsamı yeterince temsil etmemesi
Ölçme aracındaki maddelerin iyi ifade edilememesi
Ölçme aracının uzunluğu, ölçme aracındaki madde sayısı
Bir test oluşturulurken gözlenmek istenen davranışların çok iyi tanımlanması,
maddelerin anlaşılır olması madde sayısının ve uygulama süresinin uygun biçimde
belirlenmesi, bu tür hata kaynaklarının azalmasını sağlayacaktır.
Ölçmeyi yapan kişinin, puanlama yaparken yorgun olması, dikkatsizliği
Puanlayıcının, cevapları kendi bakış açısına ve anlayışına göre değerlendirmesi
Puanlamanın bilgisayar ile yapıldığı durumlarda cevap anahtarındaki cevaplardan
bazılarının silik olması nedeniyle optik okuyucu tarafından okunmaması
Puanlamanın nesnel olmadığı, öznel kanılara dayandığı durumlarda, puanlar bir
puanlayıcıdan diğerine veya puanlama zamanına göre değişecektir.
Testin yapıldığı ortamın sıcaklığı
Işığın yetersiz olması
Gürültü düzeyi
Testin yapıldığı ortam testi alan tüm bireyler tarafından aynı olmalıdır. Aksi takdirde,
testten yüksek puan alan bireyler testle ölçülmek istenen özelliğe en çok sahip olan
değil, testi en iyi koşullar altında alanlar olacaktır.
Aynı özelliği ölçen iki test uygulanacaksa, benzer koşullar altında uygulanmalıdır.
Aşağıdaki ifadelerin hata türlerin ve hata kaynaklarını bulalım:
Hata Türü Hata Kaynağı
Süre yetişmediği için son soruyu kimsenin yapamaması Sabit Ölçme Aracından Kaynaklı
Kişiden Kaynaklı
Ali’nin 12. soruyu atıp tutturması Tesadüfi
Bir öğretmenin sevdiği öğrencilere fazladan 10 puan vermesi Sistematik Ölçmeciden Kaynaklı
(2008 KPSS)
Bir sınavda her öğrenciye 5 puan fazla verilmesi _____ hataya örnektir. Öğrencilerin
puanlarını, aldıkları puanların yüzde 10’u kadar artırmak ise _____ hataya örnek
olabilir.
Bu parçadaki boşluklara, aşağıdakilerden hangisindeki sözcükler sırasıyla
getirilmelidir?
A) Rastgele - sabit
B) Rastgele – sistematik
C) Sabit – sistematik
D) Sabit- rastgele
E) Sistematik - sabit
Cevap: C
Bir ölçme aracında temel olarak üç özellik bulunmalıdır. Bu özellikler en basit
şekilleriyle aşağıdaki gibi ifade edilebilir.
Not: Doğru ölçme, doğru bir ölçme aracı kullanımıyla olur. Doğru ölçme de
beraberinde doğru değerlendirmeyi getirir. Bu nedenle ölçme yaparken ölçme
aracında bulunması gereken özelliklere dikkat edilmesi gerekir.
Güvenirlik, bir ölçme aracının ölçmek istediğimiz özelliği ne derece hatasız
ölçtüğüdür.
Güvenirlik; ölçme aracının kararlı, tutarlı, duyarlı ve objektif sonuçlar vermesi ile
ilgilidir.
Kararlılık
Ölçme sonuçlarının birbiriyle tutarlı olması, ölçme aracının ölçülen özelliği kararlı
bir şekilde ölçtüğünün göstergesidir. Bir ölçme aracının aynı gruba zaman
aralıklarıyla tekrar tekrar uygulanması sonucu elde edilen sonuçların zamana
rağmen aynı ya da benzer olabilme derecesine kararlılık anlamında güvenirlik
denir.
Kararlılık
Ölçme birimi ile ilgilidir. Birim küçüldükçe daha doğru ölçmeler elde
edilecektir. Çünkü duyarlılık yani ölçme aracının hassaslığı arttıkça
hata azalır.
0 ≤ Güvenirlik Katsayısı ≤ 1
Güvenirlik katsayısının 1 olması mükemmel bir güvenirliği,
dolayısıyla hatasız bir ölçmeyi ifade eder. Bu durumda elde edilen
ölçme sonuçları, ölçülen özelliğin gerçek değerini verir.
Sonucun bire yakın olması, iki uygulamadan elde edilen puanların birbirine yakın
olduğunu gösterir.
Eğer ölçmeye karışan hatalar gerçekten tesadüfiyse aynı hatalar birden fazla
tekrarlanmayacaktır. Böylece iki farklı uygulamadan elde edilecek benzer sonuçlar
ölçümlere tesadüfi hatanın pek karışmadığının göstergesi olacaktır.
TEST A TEST A
ZAMAN
Birinci uygulama İkinci uygulama
AYNI GRUP
Bu nedenle daha çok kısa zamanla değişmeyen psikolojik özellikleri ölçen testlerin
güvenirlikleri bu yolla bulunur.
Test tekrar test yönteminin hesaplanması
Bu yöntemin zorlukları
Test-tekrar test yöntemi iki uygulama gerektirdiği için pratik bir yöntem olarak
görülmemektedir.
Aynı testin kullanılması beraberinde bazı zorluklar getirir.
Zaman faktörü etkilidir.
Bu yöntemle yapılan güvenirlik kestirimleri daha çok KARARLILIK katsayısı olarak
yorumlanır. Çünkü zaman içinde gerçek puanda bir değişme olup olmadığını
gösterir.
Bu yöntemin uygulanması için birinci uygulamada kullanılan testin paraleli olan bir
başka test sağlanmalıdır. Paralel testlerin her ikisi de aynı öğrenci grubuna
uygulanır.
AYNI
GRUP
Bu yöntemin zorlukları:
aynı değişkeni ölçen iki test hazırlamak
ve hazırlanan testlerin matematiksel olarak eşitliklerini kontrol altında tutmak
Bu yöntemle yapılan güvenirlik kestirimleri daha çok TUTARLILIK katsayısı
olarak yorumlanır.
GRUP
1. Yarı
2. Yarı
puanları
puanları
𝑟𝑥 = testin güvenirliği
Bir test ne kadar homojense, maddeler birbiriyle o derece yüksek ilişkili olacak,
dolayısıyla maddeler arasındaki tutarlılık da o derece yüksek olacaktır.
K
K
i 1
Pi (1 Pi )
K = Testteki madde sayısı
Pi = Madde güçlüğü
KR 20 1 𝑆𝑌2 = Test puanlarının
K 1 SY2 varyansı
KR-21 kullanım koşulları;
- KR-21, KR-20’in özel bir formudur. Testte yer alan maddelerin güçlüklerinin
hesaplanamadığı durumlarda testteki tüm maddelerin güçlük derecelerinin birbirine
yakın ya da eşit olduğu varsayımına dayanır.
Dolayısıyla,
KR-20 ≥ KR-21
KR-20 ve KR-21 gibi yorumlanır. Yalnızca kullanıldığı durumlardaki puanlama
biçimleri farklıdır.
Ağırlıklı puanlama veya dereceleme yöntemiyle puanlama uygulandığı durumlarda
kullanılabilecek bir güvenirlik hesaplama tekniğidir.
Puanlayıcı güvenirliğini hesaplamak için iki veya daha fazla puanlayıcının aynı
bireylere ait testleri birbirlerinden bağımsız olarak puanlamaları ve bu puanlar
arasındaki ilişkinin hesaplanmasıyla elde edilir.
Ölçme aracının hatalardan arınıklık derecesini gösteren güvenirlik katsayısı, ölçme
işleminde yapılan hatanın miktarını belirtmez.
Ölçmede yapılan standart hatanın değerini hesaplamak için güvenirlik ve test
puanlarının standart sapması kullanılır.
Ölçme sonuçlarına karışan hata miktarının artı ya da eksi yönlü olduğu bilinmediğinden
hesaplanan standart hata miktarı elde edilen ölçme sonuçlarına bir eklenip bir de
çıkarılarak bir aralık değeri elde edilir. Bu aralığa güven aralığı adı verilir.
Belirli olasılık değerlerine karşılık gelen farklı güven değerleri hesaplanmaktadır.
Ölçme hatası, ölçülen özelliğin bireyde var olan gerçek değeri ile ölçme ile ölçülen
özelliğin gözlenen değeri arasındaki fark olarak ifade edilir.
E = X -T
E = Ölçme hatası
X = Gözlenen değer
T = Gerçek değer
Ölçmenin standart hatası (SHö), belli güven düzeyleri için testten alınan puanların
gerçek puandan olan sapma miktarını hesaplamada kullanılır.
Hatasız ölçme olmaz. Bu nedenle ölçme sonuçları ölçek üzerinde tek bir noktadan
ziyade iki nokta arasındaki bir aralık olarak düşünülmelidir. Çünkü test puanlarına
karışan hatanın yönü (- , +) bilinmez ve bireyin gerçek puanı, bir aralık olarak
hesaplanır.
Ölçme hatalarına ait dağılımın normal olduğu varsayılır.
Normal Dağılım Eğrisi, ölçme sonuçlarının orta noktalarında yoğunlaştığı, uç
noktalarda seyrekleştiği bir dağılım şeklini ifade etmektedir.
Normal dağılım eğrisi simetriktir. Bu eğrinin sağındaki ve solundaki alanlar
birbirine eşittir.
Eğrinin temel çizgisi standart sapma birimleriyle bölümlenmiştir. Bu çizgi üzerinde
aritmetik ortalamanın bulunduğu noktaya sıfır değeri verilir ve çizgi bu noktanın
sağına +1 SS, +2 SS, +3 SS ve soluna -1 SS, -2 SS, -3 SS olmak üzere standart sapma
birimi kullanılarak alanlara ayrılır.
Normal dağılım eğrisi kuramsal olarak sonsuza kadar uzanır. Ancak uygulamada
ortalamanın 3 SS üstüne ve 3 SS altına uzanıyor olarak düşünülür.
Normal dağılımda ölçümlerin yaklaşık,
%68’inin X ± 1 SS
%95’inin X ± 2 SS
%99’unun X ± 3 SS alanı içerisine düşer.
Bir bireyin gerçek değeri %68 olasılıkla
X - 1𝑆𝐻Ö < T < X +1𝑆𝐻Ö sınırları arasındadır.
Bir bireyin gerçek değeri %95 olasılıkla
X - 2𝑆𝐻Ö < T < X + 2𝑆𝐻Ö sınırları arasındadır.
Bir bireyin gerçek değeri %99 olasılıkla
X - 3𝑆𝐻Ö < T < X + 3𝑆𝐻Ö sınırları arasındadır.
ÖRN: :
X (Bir bireyin test puanı) = 60
SHö = 5
Bireyin gerçek puanı %68 olasılıkla
60 - (1x 5) < T < 60 + (1x5) (55 < T < 65)
Bireyin gerçek puanı %95 olasılıkla
60 - (2x 5) < T < 60 + (2x5) (50 < T < 70)
Bireyin gerçek puanı %99 olasılıkla
60 - (3x 5) < T < 60 + (3x5) (45 < T < 75)
Ölçme aracına ilişkin faktörler
Testin uzunluğu
Yönergenin anlaşılırlığı
Soruların homojenliği ve anlaşılırlığı
…………………….