Download as pdf or txt
Download as pdf or txt
You are on page 1of 24

Psikolojide

Ölçme ve Ölçek
Geliştirme-II
Ölçme Araçlarının Ps�kometr�k N�tel�kler� ve
Ölçme Kuramları
Adnan ERKUŞ • Önder SÜNBÜL • Seç�l ÖMÜR SÜNBÜL
Seha YORMAZ • Sem�h AŞİRET
Adnan ERKUŞ, Önder SÜNBÜL, Seçil ÖMÜR SÜNBÜL, Seha YORMAZ, Semih AŞİRET

PSİKOLOJİDE ÖLÇME VE ÖLÇEK GELİŞTİRME-II

ISBN 978-605-318-818-6
DOI 10.14527/9786053188186

Kitap içeriğinin tüm sorumluluğu yazarlarına aittir.

© 2017, PEGEM AKADEMİ

Bu kitabın basım, yayım ve satış hakları Pegem Akademi Yay. Eğt. Dan. Hizm. Tic. Ltd. Şti.ye ait-
tir. Anılan kuruluşun izni alınmadan kitabın tümü ya da bölümleri, kapak tasarımı; mekanik, elekt-
ronik, fotokopi, manyetik, kayıt ya da başka yöntemlerle çoğaltılamaz, basılamaz, dağıtılamaz. Bu
kitap T.C. Kültür Bakanlığı bandrolü ile satılmaktadır. Okuyucularımızın bandrolü olmayan ki-
taplar hakkında yayınevimize bilgi vermesini ve bandrolsüz yayınları satın almamasını diliyoruz.

Pegem Akademi Yayıncılık, 1998 yılından bugüne uluslararası düzeyde düzenli faaliyet yürüten
uluslararası akademik bir yayınevidir. Yayımladığı kitaplar; Yükseköğretim Kurulunca ta-
nınan yükseköğretim kurumlarının kataloglarında yer almaktadır. Dünyadaki en büyük çevri-
miçi kamu erişim kataloğu olan WorldCat ve ayrıca Türkiye’de kurulan Turcademy.com ve
Pegemindeks.net tarafından yayınları taranmaktadır, indekslenmektedir. Aynı alanda farklı yazar-
lara ait 1000’in üzerinde yayını bulunmaktadır. Pegem Akademi Yayınları ile ilgili detaylı bilgilere
http://pegem.net adresinden ulaşılabilmektedir.

1. Baskı: Nisan 2017, Ankara

Yayın-Proje: Özlem Sağlam


Dizgi-Grafik Tasarım: Ayşe Nur Yıldırım
Kapak Tasarım: Pegem Akademi

Baskı: Vadi Grup Ciltevi A.Ş.


İvedik Organize Sanayi 28. Cadde 2284 Sokak No:105
Yenimahalle/ANKARA
(0312 394 55 91)

Yayıncı Sertifika No: 14749


Matbaa Sertifika No: 26687

İletişim
Karanfil 2 Sokak No: 45 Kızılay / ANKARA
Yayınevi: 0312 430 67 50 - 430 67 51
Yayınevi Belgeç: 0312 435 44 60
Dağıtım: 0312 434 54 24 - 434 54 08
Dağıtım Belgeç: 0312 431 37 38
Hazırlık Kursları: 0312 419 05 60
İnternet: www.pegem.net
E-ileti: pegem@pegem.net
İnsanın psikolojik özelliklerini ölçmek gibi
güç bir işe katkı sunmuş olan
evrenvatandaşı tüm bilimcilere…
ÖN SÖZ
İlkini çıkarırken ‘bu kitap dizisinin en az altı ciltten oluşacağını’ belirtmiş ve
bundan sonrakileri de MeÜ EÖD Abd’nin değerli akademisyenleriyle birlikte ger-
çekleştirmeyi umduğumu eklemiştim. Biraz geç olsa da ikinci cilt ile karşınızda-
yı(m)z. Bundan sonra arayı fazla açmadan ve üstelik ‘ailemizi’ de her ciltte giderek
büyüterek, dizinin diğer ciltlerini sizlere sunmayı planlıyoruz. Umarız ülkemizin
psikometri ve onun eğitimde ölçme-değerlendirme, endüstri psikolojisinde ölç-
me-değerlendirme, klinik psikolojide ölçme-değerlendirme gibi uygulama alanla-
rına bir katkı sunabiliriz.
Bilindiği gibi, psikolojik değişkenlerin ölçülmesi, fen bilimlerindeki değiş-
kenlerin ölçülmesinden çok daha çetrefil sorunları aşmayı gerektiriyor. Psikolojik
değişkenlerin psikometrik anlamda ölçülmeye başlamasının üzerinden ancak bir
yüzyıldan biraz daha fazla zaman geçti. Bu süreç içinde, psikolojik değişkenlerin
ölçülmesinde epey yol alındı, ancak ‘koşu’ hâlâ amacına tam olarak ulaşamadı. Bu
doğal karşılanmalıdır; çünkü, kendi nöronal bağlantılarımızla yine kendi bilişi-
mizin-duyuşumuzun nasıl işlediğini çözmeye çalışıyoruz. Bu süreçte, hem ölçme
aracı geliştirme yöntem ve tekniklerimiz, hem ölçme ile ilgili kuramlarımız, hem
de ölçme araçlarımızın psikometrik özellikleri konusunda önemli gelişmeler de
yaşandı ve hemen her gün de yaşanmaya devam ediyor. Bu bakımdan, ölçme ku-
ramları ile güvenirlik ve geçerlik konusunda yeni bakış açılarının ortaya çıkması
da doğal karşılanmalıdır. Son yıllarda hızla yaşamımıza giren bilgisayar teknolo-
jisinin alanımıza da çok önemli katkıları oldu. Kim bilir, belki de yakın gelecekte,
bilgisayar teknolojisi ile birlikte biyoloji bilimindeki, kuantum mekaniğindeki ve
özellikle de beyin fizyolojisi konusundaki gelişmeler ile psikolojinin insanı anlama
ve açıklama çabaları bütünleşecek ve insanı bütünsel olarak ölçme ve değerlendir-
me aşamasına geçeceğiz.
Bu kitap dizisinin ilk cildinde, psikolojide ölçme ve ölçek geliştirmenin te-
mel kavram ve işlemleri biraz değişik bir açıdan ele alınmıştı. Bu ciltte, iki ana
bölüm bulunmaktadır: Ölçme Araçlarının Psikometrik Nitelikleri ve Ölçme Kuram-
ları. Ölçme Kuramları bölümünü genç arkadaşlarım üstlendiler; diğer bölümü de,
özellikle ilk kitaptaki yaklaşımın devamı olan tartışmalı konulara değineceğimden
ve biraz ‘aykırı’ yaklaşımlarda bulunacağımdan dolayı ben üstlendim; böylelikle
gençleri de ‘suçuma ortak etmemeye’ çalıştım. Bu bakımdan her bölümün yazar-
larının sadece kendi yazdıklarından sorumlu olmaları gerekmekle birlikte, kitabın
editörü olmamasına rağmen, tümündeki eksiklik ve yanlışlıkları ayrıca bizzat şah-
sım adına üstleniyorum.
vi Psikolojide Ölçme ve Ölçek Geliştirme II

Güvenirlik ve geçerlik bölümlerinde birbirini bütünleyen ve ilk kitaptaki


yaklaşımın devamı olan “yeni” bazı şeyler ekledim ve bu konulara biraz farklı
yaklaştım. Elbette, böyle bir girişim çeşitli riskleri ve eksiklikleri de beraberinde
getirecektir. İşte bu risk ve eksiklikleri göze almaktan ‘korktuğum için’ olsa gerek,
kendi yazdığım bölümleri alanımızdan değerli bazı arkadaşlarıma da okuttum,
görüşlerini almaya çalıştım. Elbette, bu durum, tüm sorumluluğu onlarla paylaş-
tığım veya onların benim “aykırı” görüşlerime tümüyle katıldıkları anlamına gel-
miyor; özellikle her türlü yanlıştan kendimin sorumlu olduğunu belirtiyor ve Prof.
Dr. Şener Büyüköztürk ile Doç. Dr. İbrahim Alper Köse’ye zaman ayırıp ve emek
harcayıp titizlikle okuyarak yaptıkları tüm eleştiri, öneri ve düzeltmeler için çok
teşekkür ediyorum. Bu arkadaşlarımın özel bir seçilme gerekçesi bulunmamak-
tadır, kitap konusundaki konuşmalar sırasında yeri geldiği için kendilerinden bu
rica yapılmıştır. Diğer arkadaşlarımızdan da gelecek kitaplarda yararlanırız, gönül
alırız. Umarım, bu yazılanlara alandan herkes katkı sunar da daha doğruyu hep
birlikte bulabiliriz.
Kendi yazdığım bölümlerde, içerik ve açıklama açısından alandan olan ve
olmayan okuyucu dengesini tutturabildim mi bilemiyorum. Çünkü bazı yerlerde
formüllerin içinde boğulunurken, bazı yerlerde üstün körü geçiverdim. Bunun bir
nedeni uygulamada, alan dışından kişilerin de güvenirlik ve geçerlikle bir şekil-
de tanışık olmalarıdır. İstatistiksel işlemleri ise, alandan olanların temeli olduğu/
olması, alandan olmayanların da ya istatistik kursları almaları veya araştırmaları
gerektiği düşüncesiyle çoğunlukla atladım veya ‘ödev’ olarak verdim; ancak bazı
pratik amaçlar için de örnekleyerek sundum. Kuramsal tarihçe ve kendi yakla-
şımlarım için de uzun uzun tartışmak ve karşılaştırmak yerine (çünkü daha çok
tartışılacağa benziyor), doğrudan mantıksal ve işlemsel temelde kendi görüşümü
açıklamaya giriştim; aksi halde, bu kitap hiçbir zaman tamamlanamazdı! Kendi
yaklaşımlarım, salt bu karmaşaya son vermek için yıllar içinde üretilmiştir; ama
umarım karmaşayı daha da arttırmış olmamışımdır. Kendi yazdığım bölümlerde
kullandığım dil ise, eh sanırım her zamanki gibi, bana göre… Bana yapılan onca
‘baskıya’ rağmen de galiba değişmeyecek…
Ölçme Kuramları bölümünün, oldukça doyurucu olduğunu söylemeliyim.
Her kuramın hem mantıksal ve istatistiksel temelleri çok iyi işlenmiş, hem de her
kuram için örneklerle anlaşılabilirliği artırılmış durumdadır. Bu kadar derli toplu
ve doyurucu bir bölüm yazdıkları için genç arkadaşlarıma çok teşekkür ediyo-
rum. Ölçme kuramları bölümünde, Klasik Test Kuramı’nın sayıltıları ve eşitlikleri,
Madde Tepki Kuramı’nın sayıltıları, eşitlikleri, modelleri, türleri, model-veri uyu-
mu ve kestirim yöntemleri, Kökdeşlik (congenerik) Kuramı ve Genellenebilirlik
Kuramları yer almaktadır. Özellikle MTK’da model-veri uyumu ile kestirim yön-
Ön Söz vii

temlerinin alandaki lisanüstü öğrencilerimiz için çok yararlı olacağını beklemek-


teyim. Tüm kuramların özellikle dilimizde ilk kez topluca ve böylesine ayrıntılı bir
şekilde ele alınmasının psikometri ve eğitimde ölçme-değerlendirme lisansüstü
programları için son derece yararlı olacağını düşünmekteyiz.
Bundan öncekilerde olduğu gibi, bu kitapta da eksiklikler ve hatta yanlışlıklar
mutlaka olacaktır. Özellikle, kuramlar-güvenirlik ve geçerlik konusu sürekli evril-
mekte ve tartışılmakta olduğu ve özellikle bu kitabın ilk bölümüyle ikinci bölümü
güvenirlik konusunda birbirleriyle binişiklik gösterdikleri için kapsamın sınırları-
nı çizmekte epey zorlandık. Bu eksiklikleri ve hataları gelecek baskılarda, sizlerin
de katkılarıyla gidermeye çalışacağımızdan emin olabilirsiniz. Ancak, kitaptaki
tüm hataları ve eksiklikleri baştan kabul ediyor ve sorumluluğunu alıyoru(z)m.
Ne kadar ciddiye alınırız bilemiyoruz ama, kitaptakilerin tartışılması bizleri
çok sevindirecektir. Bilimin itici gücü, eleştirel irdeleme, merak, kuşku ve sorgula-
madır; raflarda tozlanan kitaplarla veya okuyup da okumamış görünmekle bilim-
sel ilerleme bir hayalden öteye geçemez. Umarım, bu kitaptaki yazılanlar alanda
‘ses bulur’ da tartışılır; tartışıla tartışıla daha iyiye ve güzele doğru hep birlikte yol
alırız.
Kitabın basımında emeği geçen Pegem Akademi çalışanlarına teşekkür eder,
okuyuculara yararlı olmasını dileriz. Bilimle kalın...
Yazarlar adına Dr. Adnan Erkuş
Nisan 2017
YAZARLAR
1. Bölüm: Ö
 lçme Araçlarının Psikometrik Nitelikleri
Dr. Adnan ERKUŞ, Emekli Öğretim Üyesi

2. Bölüm: P
 sikolojide Ölçme Kuramları
Dr. Önder SÜNBÜL, Mersin Üniversitesi Eğitim Fakültesi
Dr. Seçil ÖMÜR SÜNBÜL, Mersin Üniversitesi Eğitim Fakültesi
Uzm. Semih AŞİRET, Mersin Üniversitesi Eğitim Fakültesi
Uzm. Seha YORMAZ, Mersin Üniversitesi Eğitim Fakültesi
İÇİNDEKİLER

Ön Söz.....................................................................................................................................v
Yazarlar .............................................................................................................................. viii
Bazı Hatırlatmalar.............................................................................................................. xii

I. BÖLÜM
ÖLÇME ARAÇLARININ PSİKOMETRİK NİTELİKLERİ

1. KISIM
GÜVENİRLİK (RELIABILITY)
Ölçme ‘Sonuçlarına’ Karışan Hatalar..................................................................................4
Güvenirlik Tanımları..........................................................................................................14
Klasik Test Kuramında Hata ve Güvenirlik.....................................................................16
Ölçme Araçlarının Güvenirliklerini İrdeleme Yolları....................................................22
Maddelerin Gerçek ve Hata Puanlarına İlişkin Farklı Ön Kabullere Dayanılarak
Türetilen Farklı Alfa Katsayıları........................................................................................34
Puanlama Güvenirliği veya Puanlayıcılar Arası Güvenirlik..........................................38
Madde Tepki Kuramında Güvenirlik................................................................................48
Güvenirlik ile İlgili Diğer Konular....................................................................................49
Ölçme Araçlarının Güvenirliğini Rapor Etme................................................................50
Güvenirlik ile ilgili Yapılan Hatalar ve Son Uyarılar.......................................................51
Kaynaklar..............................................................................................................................54

2. KISIM
ÖLÇMEDE GEÇERLİK
Ölçme Geçerliği...................................................................................................................76
Geriye Dönük (Retrospective/Postdictive) Geçerlik................................................82
Zamandaş (Concurrent) Geçerlik...............................................................................83
Yordama (Predictive) Geçerliği...................................................................................83
Karar (Değerleme-Kullanım) Geçerliği............................................................................91
Kaynaklar............................................................................................................................101
x Psikolojide Ölçme ve Ölçek Geliştirme II

II. BÖLÜM
PSİKOLOJİDE ÖLÇME KURAMLARI

1. KISIM
KLASİK TEST KURAMI (KTK)
Gözlenen Puan Dağılımının Beklenen Değeri..............................................................111
Paralel Formlar Arası Korelasyon: Güvenirlik..............................................................112
Gözlenen Puan ve Gerçek Puan Arasındaki Korelasyon: Güvenirlik İndeksi..........114
Gözlenen Puan ve Hata Puanı Arasındaki Korelasyon................................................115
Test Uzunluğunun Güvenirlik Üzerine Etkileri............................................................115

2. KISIM
MADDE TEPKİ KURAMI (MTK)
Madde Karakteristik Eğrisi..............................................................................................124
Madde Tepki Kuramının Sayıltıları.................................................................................125
Madde Tepki Kuramı Modelleri......................................................................................127
Test Karakteristik Eğrisi....................................................................................................136
Madde Parametrelerinin Değişmezliği...........................................................................138
Bilgi Fonksiyonları............................................................................................................140

3. KISIM
ÇOKBOYUTLU MADDE TEPKİ KURAMI
Boyutluluk (Dimensionality)...........................................................................................144
Çokboyutlu Madde Tepki Kuramı Modeli Türleri........................................................151
ÇBMTK’de Eş Olasılık Konturları, Madde Vektörü ve Grafiksel Gösterimler..........153
Çokboyutlu Yapıların Tekboyutlu Madde Tepki Kuramına Dayalı Analizi...............156

4. KISIM
MADDE TEPKİ KURAMINDA MODEL-VERİ UYUMU
Sayıltıların İncelenmesi....................................................................................................160
Model-Veri Uyumunun Değerlendirilmesi...................................................................164
İçindekiler xi

5. KISIM
MADDE TEPKİ KURAMINDA KULLANILAN KESTİRİM
YÖNTEMLERİ
Yetenek Kestirimi..............................................................................................................190
Madde ve Yetenek Parametrelerinin Kestirimi..............................................................200

6. KISIM
GENELLENEBİLİRLİK KURAMI
Genellenebilirlik Kuramı’nın Temel Kavramları...........................................................216
Tek Yüzeyli Desenler.........................................................................................................220
İki Yüzeyli Desenler..........................................................................................................230

Kaynaklar............................................................................................................................241
Yazarlar Hakkında.............................................................................................................247
xii Psikolojide Ölçme ve Ölçek Geliştirme II

BAZI HATIRLATMALAR
Okuyucunun, bir temeli olduğunu varsaymakla birlikte, bazı hatırlatmaların
yapılmasını yararlı görmekteyiz.

Varyans, Kovaryans, Matris, Vektör, Faktör…


Evrenin oluşumunu başlatan Büyük Patlamadan dolayı her şey birbiriyle iliş-
kilidir ve büyük kozmik zamanda enerji farklılıklarından dolayı madde farklılıkla-
rı da ortaya çıktığı için her şey değişim içindedir: Termodinamiğin 2. Yasası. Tam
da bu nedenle, bilim de bu doğanın bir parçası olan insan bilişinin gelişiminin bir
ürünü olarak, bu farklılık-benzerlik ve buradan hareketle değişimin işleyiş kural-
larını bulma çabası olarak ortaya çıkmıştır. Bu farklılık ve benzerlik ve değişimi ne
denli dakik bir şekilde tanımlayabilir (ölçebilir) isek, o denli sağlam (güvenilir-ge-
çerli) çıkarımlar yapabiliriz. Bu bakımdan bilimin temeli ölçmeye ve ölçmenin
temeli de benzerlik (merkezi eğilim) - farklılık (değişim) ölçülerine ve bunların
üzerinde yükselen ilişki ve farklılık işlemlerine dayanır.

Varyans ve ölçmedeki yeri


Bilimde ve dolayısıyla ölçme sonuçları üzerinde yapılan işlemlerde en çok
bilgi veren değişim ölçüsü varyanstır. Varyans aritmetik ortalamayla birlikte ve
hatta her ne kadar sürekli değişkenler için aritmetik ortalamadan türetiliyorsa da
sadece kendisi başlı başına (özellikle de insanın psikolojik özelliklerinin ölçümü
söz konusuysa) en önemli bir ölçüdür. Sürekli veriler için varyans:
_| X i
2
2
2
v =x =
2 | x 2 = | ^ X - X h2 tanım eşitlikleri ile | x - N
N N N
hesaplama eşitliği. Bu eşitliklerin tümü evren varyansı için aynı sonucu verir. Ör-
neklem varyansı için paydanın n-1 (serbestlik derecesi) olması gerekir.
Veriler, ikili (dichotomic) süreksizse (1-0) varyans bir ikili değişken (örneğin
çoktan seçmeli bir maddeye verilen yanıtlar) için (Bernoulli Teoremine göre);
σ2 = p x q’dur; bir örneklem grubu içinse, = n x p x q’dur. p, ilgilenilen özel-
liğin gözlenme oranı (1-0’lı puanlanan bir test maddesi için doğru cevap oranı =
madde güçlük düzeyi), q ise ilgili özelliğin gözlenmeme oranı (doğru cevaplama-
ma oranı).
Sürekli veriler için olan eşitlikten de görüleceği gibi, varyans, her bir puanın
kendi aritmetik ortalamasından olan uzaklığına (sapma puanı, = x) dayanmakta-
dır ve bir tek puanın değişimi ancak sapma puanı kadardır. Ancak, bir grup ölçüm
Bazı Hatırlatmalar xiii

sonucu için sapma puanlarının toplamları daima 0,00 olacağından, kareleri alına-
rak bu sorundan kurtulunur; varyans, bu bakımdan sapmaların ikinci momen-
tidir. Bu özellikler gereği, varyans hiçbir zaman eksi değerler al(a)maz. Bir grup
ölçme sonucunun varyansı 0,00’a eşitse, “o grupta ölçülen özellik açısından hiçbir
değişim yoktur”, yani “benzeşik (homojen) bir grup ile karşı karşıyayız”; 0,00’dan
uzaklaştıkça da (üst sınırı ölçeğin ranjına bağlıdır), “o grup ölçülen özellik açısın-
dan farklılaşıyor”, yani “ayrışık (heterojen) bir grup ile karşı karşıyayız” demektir.
Şimdi, varyansın büyük ya da küçük olması beklentilerini biraz aydınlatmaya
çalışalım. Hangi durumlarda büyük, hangi durumlarda küçük varyans arzu edilir
ve bunlar neyi gösterir? Varyans = Hata, her koşulda doğru mudur?
Bilimsel araştırmalarda, araştırma grupları arasındaki “farklılığı” araştırırken,
gruplararası ve grupiçi değişimin en önemli göstergesi olarak varyans kullanılır.
Ölçek geliştirme sürecinde de varyans, maddeler arası ve bireyler arası değişimin
en önemli ölçüsüdür.
Görgül bir bilimsel araştırmada denence (hipotez) test edilirken çoğunlukla
değişim yaratma potansiyeli olan bir değişkenin (bağımsız değişken) ilgili özellik
(bağımlı değişken) üzerinde beklenen değişimi yapıp yapmadığı merak edilir; bu-
nun için de genellikle deney ve kontrol veya araştırma ve karşılaştırma grubu (ya
da grupları) kullanılır ve her gruptaki bireylerin ölçülen değişken açısından ola-
bildiğince “aynı” olmasına (seçilmesine) özen gösterilir ve yöntembilim alanında
bu bakımdan, grupları a priori ve a posteriori denkleştirme ve kontrol konusunda
zengin bir literatür vardır. Bu bakımdan, istenmeyen değişimin kaynağı olabile-
cek diğer değişkenler (karıştırıcı değişkenler) olabildiğince kontrol altında tutulur
ki, geriye tek değişim kaynağı olarak değişimlenen (manipüle edilen) bağımsız
değişkenden gelen etki kalabilsin. Bu, şu anlama gelir: Gruplar arası (deney ve
kontrol grupları olsun) varyans olabildiğince büyük, grup içi varyans da olabildi-
ğince küçük olmalıdır. Bu bakımdan, varyans analizindeki F değerinin (oranının)
büyüklüğü için (yani, H0 denencesini reddetmek için gerekli olan Alfa olasılığı
için- amaç elbette buysa), gruplar arası varyansın (σ2GA) büyük ve grupiçi varyan-
sın (σ2Gİ) küçük olması arzu edilir. Araştırmanın etkililiği, σ2GA’nın büyüklüğüne
bağlıdır, ancak bu tek başına yeterli değildir, diğer yandan σ2Gİ’nin de olabildiğin-
ce küçük olması gerekir:
F = σ2GA / σ2Gİ; 15/3 ≠ 15/15 gibi. Bu bakımdan, F değeri kuramsal olarak
minimum 1,00 olabilir.
Her grup içindeki bireyler ölçülen özellik açısından ne kadar birbirlerinden
farklıysa σ2Gİ da o kadar büyüyecektir (maksimum σ2GA kadar); bu bakımdan or-
taya çıkacak fark değişimlemeden mi, yoksa her grupta bulunan bireylerin zaten
xiv Psikolojide Ölçme ve Ölçek Geliştirme II

var olan farklılıklarından mı kaynaklanıyor “anlaşılamaz”. Bundan dolayı, σ2Gİ bir


araştırma denencesinin testinde araştırmaya (ölçmenin değil) karışan hatanın bir
ölçüsü olarak alınır:
Grup Grup I Grup II
A B A B
durumu durumu durumu durumu
Birey
1 5 1 1 9
2 5 9 1 1
3 5 2 1 8
4 6 5 1 2
5 5 7 2 3
. 5 2 1 4
. . . . .
. . . . .
. . . .
Tablodaki hipotetik durum ve değerlerden şunu anlıyoruz: A durumunda,
Grup I ve Grup II’nin arasındaki σ2GA büyük, σ2Gİ ise küçük olacak ve gruplar
arasındaki fark denencesi (H1) de kabul edilmiş (H0 red); oysa ki B durumunda,
σ2GA büyük olsa bile σ2Gİ de büyük olacağından H0 denencesinin kabulü olasılığı
da artacaktır.
Bir ölçek geliştirme sürecinde ise (tekboyutluluk açısından), yukarıdaki gör-
gül araştırmanın etkinliğindeki satır/sutün varyans beklentisinin tam tersi söz
konusudur: Ölçülecek özellik açısından, ‘madde veya ölçek toplam puanları için’
bireyler arası varyansın (σ2BA) oldukça büyük, sütunlarda yer alan maddeler arası
varyansın (σ2MA ) ise oldukça küçük olması arzu edilir:
Bazı Hatırlatmalar xv

Madde

Birey 1 2 3 4 5 . . . k
1 5 5 4 5 1 . . .
2 1 2 1 1 4 . . .
3 3 3 3 3 5 . . .
4 2 2 2 2 4 . . .
5 2 1 1 1 5 . . .
. . . . . .
. . . . . .
. . . . . .
Peki neden? Bunun iki potansiyel nedeni vardır: 1) Geliştirilecek ölçeğin, öl-
çülecek özelliğin tüm ranjını temsil edecek olan bireylere ‘uygulanacak’ olması ve bu
nedenle maddelerin ve ölçeğin bu bireyler arası farkı ayırt edebilmesi ile 2) ölçek
veya altölçekteki maddelerin tekboyutluluğunun sağlanması. Aynı boyut içindeki
σ2MA’ın büyümesi, maddelerin aynı şeyleri ölçmekten giderek uzaklaşması ve tek-
boyutluluğun bozulması anlamına gelir; bu da hem madde istatistik ve paramet-
relerini hem de güvenirlik ve geçerliği olumsuz yönde etkiler. Örneğin, tablodaki
5. madde oldukça sorunlu görünmektedir; bu maddenin yazımında anlamsal bir
sorun olabilir veya bir başka altboyuta ait olabilir, salt bu nedenle σ2MA büyür. El-
bette, ölçülen özellik çokboyutlu olabilir, ancak bu beklenti her altboyutun kendi
içinde tekboyutlu hale getirilmesi gerektiğini ortadan kaldırmaz. Ölçme kuram-
larını, ölçek geliştirme sürecini ve ölçeğin psikometrik özelliklerini anlayabilmek
için bu bireylerx maddeler matrisinin çok iyi kavranması gerekmektedir.
Varyansın en iyi kullanıldığı alan, ileride görüleceği gibi, Genellenebilirlik
Kuramı’dır. Bir Yüzeyli (facet) Genellenebilirlik Kuramı, (bireyler x maddeler) de-
ğişim kaynağının yanında ortaketkiyi de dikkate alarak, aslında psikometrik anla-
yışı yansıtmaktadır.
Ancak bu istatistiklerin hemen tümü ve dolayısıyla madde-ölçek psiko-
metrik özellikleri, sonuçta, maddelerin gerçekten ilgili özelliği ölçecek şekilde
hazırlanıp hazırlanmamasına ve deneme uygulamasındaki örneklemin ilgili
özelliğin ranjını temsil edici olup olmamasına dayanmaktadır.
xvi Psikolojide Ölçme ve Ölçek Geliştirme II

Kovaryans ve ölçmedeki yeri


Kovaryans, aynı obje kümesine ait iki değişkenin birlikte değişkenliği hak-
kında bilgi verir (Baykul, 2010; s. 59). Tıpkı korelasyonda olduğu gibi, kovaryans-
tan söz edebilmek için ölçümler arasında bağımlılık olması gerekir. İki değişken
arasındaki kovaryans eşitliği:

Kov ^ X, Y h =
| xy
=
| ^ X - X h^Y - Y h = | XY - XY , beklenen
N N N
değerler için
Kov (X,Y) = E(XY)-E(X).E(Y).
İkili puanlanan maddeler içinse, evren kovaryansı, v jk = r jk - r j r k;
eğer bir başarı testinin iki maddesi arasındaki kovaryans hesaplanacaksa,
S jk = p jk - p j p k .p jk her iki maddede de doğru cevaplayanların göreli frekansı,
pj, j maddesini, pk, k maddesini doğru cevaplayanların göreli frekanslarıdır.
Bir değişkenin (ölçme işleminde maddenin) kendisiyle kovaryansı, onun var-
yansını verir; bu bakımdan, eğer maddeler arası kovaryans matrisi oluşturulmuş-
sa, bu matrisin köşegen değerleri maddelerin her birinin varyansları (bir madde-
nin kendi kendisiyle kovaryansı varyansıdır) olduğundan, matrisin sadece yarısını
(alt veya üst) vermek yeterli olur ve böyle bir matris, “varyans-kovaryans” matrisi
olarak da adlandırılabilir. Kovaryanslar ham puanlar üzerinden de hesaplanabilir,
ama kullanışlı olmaz; bunun yerine standart puanlardan hesaplanması yeğlenir;
çünkü ham puanlar eşit aralıklı olarak kabul edilemez ve bu nedenle karşılaştırma
yapmaya uygun değildir.
Bir tek değişkenin-maddenin (bireysel puanlar açısından/sütun) varyansının
büyük olması, maddeler arası (satır) varyansın ise küçük olması arzu edilirken;
maddelerin birbirleriyle kovaryanslarının ise büyük olması (ölçek tekboyutluluğu
açısından) arzu edilir. İki madde arasındaki kovaryans ne kadar 0,00’a yaklaşırsa,
iki madde arasındaki ilişki de dikleşir (ortogonal) ve iki maddenin birbirinden ba-
ğımsız (farklı boyutlarda) yer aldığı sonucuna varılır. Ölçek geliştirme sürecinde,
tekboyutluluk açısından arzu edilen;
Madde varyansı Maddeler arası varyans Madde kovaryansları
(sütun içi/bireyler arası) (sütunlar arası/maddeler arası) (ikişerli birlikte değişim)
Büyük Küçük Büyük (yeterince)
• Madde varyansı büyüdükçe grubun ölçülen değişken açısından hetero-
jen, maddenin ayırt ediciliğinin yüksek olacağına; küçüldükçe grubun
homojen ve maddenin ayırt ediciliğinin düşük olacağına işaret eder:
Grubun örneklenmesi ve/veya madde yazımı sorunları.
Bazı Hatırlatmalar xvii

• Maddeler arası varyansın küçük olması, maddelerin aynı boyutu ölçtü-


ğüne, büyüdükçe farklı boyutları ölçtüğüne işaret eder: Kavramsal ör-
nekleme, madde örnekleme ve/veya madde yazımı sorunları.
• Madde kovaryansının büyüklüğü (elbette bir yere kadar arzu edilir), iki
maddenin ‘benzer’ şeyleri ölçtüğüne; küçüklüğü (0,00 tamamen ayrı)
farklı şeyleri ölçtüğüne işaret eder: Yukarıdaki sorunların tümü.
Bu üç durum, ölçme ‘hataları’ açısından önemli göstergeler olduğundan, öl-
çek geliştirme sürecinde olduğu gibi, güvenirlik-geçerlik irdelemelerinde, model
test etmelerde ve daha pek çok işlemde önemli istatistiklerdir.

Vektör ve ölçmedeki yeri


Vektör, aynı boyut üzerinde yer alan bir grup verinin başlangıç ve bitim de-
ğerleri ile büyüklük ve yönü hakkında bilgi veren büyüklüklerdir. Bir vektör üze-
rindeki değerlere vektörün bileşenleri denir.
Vektörler, bir psikolojik özelliği ölçme iddiası içeren bir ölçme aracının mad-
delerinin boyutluluklarını (tek boyutluluk-çok boyutluluk, tekfaktör/çok bileşen-
lilik) ve bu boyutlar arasındaki ilişkileri (veya ilişkisizlikleri) saptamada önemli
bir yer tutar.
İki vektörün birbirine göre ilişkileri, onların skaler çarpımlarıyla bulunabilir:
u.v = |u| . |v| . Cosθ. Bu çarpımın 0,00 olması (Cosθ=0,00), iki vektör arasındaki
açının 90o, yani bu iki vektörün (boyutun) birbirine dik olması durumunda, bu iki
vektör (boyut) birbirinden lineer bağımsız demektir. Vektörler ile faktör analizinde
boyut çıkarma birbiriyle yakından ilişkilidir.
Psikolojik değişkenler için lineer bağımsız olan iki vektör veya boyutun topla-
namazlığı söz konusudur. Örneğin, psikolojide “çatı” değişken olan kişilik, duygu
dışavurum tarzları veya ilgiler gibi değişkenler böyledir: Nörotik kişilik boyutu-
nun psikotik kişilik (MMPI’da olduğu gibi) boyutuyla, açık alana ilgi boyutunun
sayısal ilgi boyutuyla (Kuder İlgi Envanteri’nde olduğu gibi) toplanması bir anlam
ifade etmez. Bu bakımdan, bir kişinin “kişilik (toplam) puanı veya ilgi toplam pu-
anı şudur” demek anlamlı olmaz; ancak her altboyut toplam puanları bir anlam
ifade eder. Ancak ve ancak, aynı vektör üzerindeki bileşenler veya vektörler ara-
sındaki açı küçük olursa toplanabilirlik söz konusu olmaya başlar. Tekboyutlulu-
ğu gösterilmiş bir ölçek veya bir altölçeğin kendini oluşturan maddelerinden elde
edilmiş puanlarının toplanması, ölçmede birikimliliğe uygundur. Ancak psikolo-
jik değişkenler için pür/saf bir vektör elde edebilmek hemen hemen olanaksızdır.
Öte yandan boyutlar arası açının küçük olduğu (tekfaktörlü-çokbileşenli) durum-
xviii Psikolojide Ölçme ve Ölçek Geliştirme II

larda, çokça kanıtlandığı gibi (Wechsler Zekâ ölçeklerindeki gibi) hem altboyutlar
kendi içinde hem de altboyutlar kendi arasında toplanabilir ve bu toplamlar, pu-
anların yorumunda bir anlam ifade eder. Kümelerle gösterildiğinde bu durum şu
şekildedir (Erkuş, 2014):

A. Ayrık yapılar (faktörler) B. Bileşik yapılar (bileşenler)

Ayrık yapıların her biri kendi içinde tek boyutludur ve vektörler arası açı
900’ye yaklaşır ve faktör analizinde dik döndürmelere uygundur. Bu tür ayrık ya-
pılarda, maddeler birbirleriyle ya çok küçük kovaryans gösterirler veya hiç gös-
termezler, bir faktörde yer alan maddeler de diğer faktörlerle ya korelasyon gös-
termez ya da eksi korelasyon gösterirler. Bileşik yapılarda ise vektörler arası açı
küçüktür ve eğik (oblique) döndürmelere uygundur. Bileşenli yapılarda, maddele-
rin hemen tümü ilk faktöre artı yük verirler ve ilk faktörün açıkladığı varyans tüm
faktörlerden “açık ara” fazladır, çünkü psikolojik yapının doğası gereği “benzer
şeyi” (“aynı” değil) ölçerler (birbirleriyle kovaryans gösterirler) ve açıklayıcı faktör
analitik tekniklerle ölçeğin yapısı irdelenirken maddelerin hep diğer yapılara da
yük verdiği görülür ve bu tür maddeler “atıldıkça” bu kez diğer maddeler de yük
vermeye başlarlar. Tüm bunlar bize, hem ölçülen psikolojik yapının çok iyi bilin-
mesi, hem de maddelerin yük değerleri ve işaretlerinin (ezber ölçütlerden uzak)
bu değişkenin kavramsal yapısının dikkate alınması gerektiğini gösterir. Bileşen-
li yapılar için, “a priori” puanlamanın bu istatistiksel sonuçlara göre yeniden ya-
pılmasına ve ölçme hatalarının hiç değilse görgül-istatistiksel irdelemeden sonra
“temizlenmesine” yönelik bir öneri ilk kitapta yapılmıştı. Aksi halde “kompleks”
madde diye atılan her madde (aslında çokboyutlu veya bileşenli olan) psikolojik
özelliğin yanlış tanımlanmasına ve ölçülmesine yol açmaktadır. Psikometride, bi-
leşik-ayrık yapı ayrımı için gerekli olan açı ölçütünün bulunması, hâlâ en önemli
araştırma konularının başında gelmektedir ve gelmelidir.
Bazı Hatırlatmalar xix

Matrisler ve ölçmedeki yeri


Matris, iki boyutlu uzayda iki değişkenin koordinat değerlerini veren (satır/
sütun) bir tablo gösterimidir: A = |ajk|. Böyle bir matriste, her bir satır veya sütu-
nun değerleri uzayda birer nokta olarak bir vektör oluştururlar. Matrisler, ölçmede
bazı işlemleri yapmada önemli bir yer tutarlar. Psiko-fizik ölçmenin, aynı bireyler-
den tek tek alınan fiziksel-algısal büyüklüklerini içeren tekrarlı ölçmelerini içeren
matrislerin yerine, psikometrik ölçmenin madde-bireyler matrisinin kullanılma-
sıyla birlikte önemi ve işlevi daha da artmıştır. Matrislerle (M = (1xA) / N olmak
üzere) yapılabilecek bazı işlemler:
• Bir puanlar matrisinin (birey x madde), kendisinin transpozuyla (sağ-
dan) çarpımı, kovaryans matrisini, bu matrisin köşegen değerleri de
madde varyanslarını verir.
• 1-0 puanlanan maddeli testler/ölçekler için, madde güçlük/onaylanma
düzeyleri için, madde puanları matrisinin, 1 satırlı n sütunlu ve tüm
elemanları 1 olan bir matrisle çarpımı, madde güçlük (veya onaylanma)
indeksleri matrisini verir.
• Madde güçlük (onaylanma) matrisinin, kendi transpozuyla çarpımının
kovaryans matrisinden çıkarılmasıyla da maddeler arası kovaryans mat-
risi elde edilir.
• Model test etmek de korelasyon/kovaryans matrisine dayanır:

KK/ y ^ I - b h-1 _ CUC + } i7^ I - b h-1A / y + K f / y ^ I - b h-1 CU / x OOO


JK T T TN

| ^Kh = KKK OO
/ x UC 7^ I - b h-1A / y
T T
/ x U / x + K d OO
T T
K
L P
Kestirilen kovaryans matrisi (∑) ile gözlenen kovaryans matrisi (S) arasındaki
ilişki konusunda Maximum Likelihood uyum fonksiyonu,
F = log|∑| + tr(S∑-1)-log|S|-(p + q)
şeklinde formüle edilir. İki matris ne kadar birbirine eşitse, uyum o kadar
yüksek anlamına gelir.

Faktör ve ölçmedeki yeri


Faktör, iki anlamda kullanılmaktadır: Bağımsız değişken/etmen olarak ve
doğrudan gözlenemeyen ya da örtük değişken, yani psikolojik yapı (construct). Bu-
radaki ilgimiz, psikolojik değişkenin altta yatan örtük yapısı anlamındadır. Faktör
analizi, genel olarak, gözlenen değişkenler arasındaki ilişkilerden hareketle, bu
xx Psikolojide Ölçme ve Ölçek Geliştirme II

örtük yapıları ortaya çıkarma, yani aynıları aynı yerde-farklıları farklı yerde öbek-
leme işlemidir; bu işlem maksimum k-1 faktör çıkarılıncaya kadar devam eder.
Bir psikolojik ölçme aracının maddeleri için söyleyecek olursak; maddeler arası
korelasyon veya kovaryanstan hareketle, birbiriyle ilişkili olanlar bir faktör (veya
bileşen) altında yer alırlar; bu madde öbeği içindeki her maddenin o faktöre kat-
kısı ise faktör yükü (factor loading) adını alır. Bir maddenin tüm faktörlere verdiği
yüklerinin karelerinin toplamı ise o maddenin veya değişkenin ortakvaryansını
(common variance/communality) verir: Demek ki, ortakvaryans bir maddenin kaç
faktör varsa hepsine ve isterse negatif olsun toplam olarak katkısını verir; ortak
varyans, ham puan yerine z-puanlarının kullanılması ve değerlerin 1,00’den kü-
çük olmasından dolayı daima 1,00’den küçük olur. Bir maddenin, ilgili özelliğe
katkısı için ortakvaryansın 0,50 ve üstü olması arzu edilir. Elbette, ilişkili (bile-
şik) ve ilişkisiz (ayrık) faktörler için formüllerde biraz farklılık söz konusudur. Her
bir maddenin kendi faktör katkısı ile testin varyansına katkısının parçası biricik
varyans (unique variance) olarak adlandırılır ve bu da ortakvaryansın 1,00’den çı-
karılmasıyla elde edilir. Biricik varyans da iki bileşenden oluşur: Özgül varyans
(specific variance) ve hata varyansı (error variance). Bu bakımdan, ortakvaryans,
özgül varyans ve hata varyansının toplamı 1,00’e eşittir ve ortakvaryans ile öz-
gül varyansın toplamı da o değişkenin güvenirliğini gösterir. Her faktörün kendi
içindeki maddelerin faktör yükleri karelerinin toplamı ise o faktörün özdeğerini
(eigenvalue) verir ve bu da o faktörün ölçeğin tümündeki katkısını (bir anlamda
açıklanan varyansı) gösterir. Buradan hareketle, mükemmel bir tekboyutluluk için
(her madde aynı yönde işarete ve 1,00 faktör yüküne sahipse), özdeğer = madde
sayısı (k) anlamına geldiği sonucu çıkarılabilir; ancak tekrar belirtmek gerekirse,
bu psikolojik ölçme araçları için hemen hemen olanaksızdır.
Faktör döndürme, ilgili faktörlerin uzayda döndürülerek anlamlı hale getiril-
mesine yarar. Temel olarak dik (ayrık faktörler için) ve eğik (bileşen yapısındakiler
için) döndürme yöntemleri altında çeşitli döndürme işlemleri vardır.
Not: Okuyucuya, bu kısımdaki cebirsel işlemler konusunda daha ayrıntılı
bilgi için McDonald, 1999’a ve Baykul, 2010’a başvurması salık verilir. Bu kısım
(şimdilik) Adnan Erkuş tarafından yazılmıştır.
I. BÖLÜM
ÖLÇME ARAÇLARININ PSİKOMETRİK
NİTELİKLERİ

Bilimin dört temel ‘çalışma amacı’; anlamak, açıklamak, yordamak (predic-


tion) ve denetim altına almaktır. İnsanlar bilim olmadan da anladıklarını, açıkla-
dıklarını ve hatta yordadıklarını geçmişte ve bugün de günlük yaşamda sıklıkla
belirtmektedirler. Sıradan gözlemlerimiz oldukça özneldir ve bizleri yanılgıya sü-
rükleyebilirler; bilimde gözlem ise, herkesin üzerinde anlaşmaya vardığı sayısal-
laştırmaya dayandığı için “oldukça” nesneldir. Bir balıkçı da havanın durumundan
fırtına olacağını, balık akınının olacağını tahmin edebilir; ancak balıkçının tah-
mini yanılma paylarına rağmen kendi bölgesi için geçerli olabilir, bir başka böl-
gede işe yaramaz; meteorolog ise tahminini sayısallaştırılmış gözlem sonuçlarına
ve önceden bulunmuş fizik yasalarına dayandırır ve her koşulda bu bilgiler işe
yarar. Dogmalar da bir açıklama getirdiklerini iddia ederler; ancak bilimin farkı,
akla uygunluğun yanında kullandığı yöntemde yatmaktadır; temelde bu yöntem
gözlem ve deneydir. Bu sayısallaştırma yoluyladır ki, gözlemlerimiz iletilebilir,
tekrarlanabilir, doğruluğu yanlışlığı test edilebilir duruma gelirler. Oysa günlük
yaşamdaki öznel gözlemlerimize dayanan anlama, açıklama ve çıkarımlarımız ço-
ğunlukla birbirimizinkinden farklıdır ve kişiler arası çatışmalarımızın da önemli
bir kısmını bu oluşturur. Bilimde ise bu gözlem önceden standartları belirlenmiş
bir araç yoluyla sayılara dökülerek yapılır. Her türlü ölçme, başlı başına bir gözlem
olayı; gözlemin sayısallaştırılmış şeklidir.
Bu ölçmelerin işe yararlığı ise, elde edildiği aracın psikometrik nitelikle-
rinin sağlamlığına bağlıdır. Bu psikometrik nitelikler ise “güvenirlik (reliability)”
ile “geçerlik(validity)tir. Bu iki özellik birbirine bağlıdır: Bir ölçme aracının geçerli
olabilmesi öncelikle onun güvenilir ölçme yapabilmesine bağlıdır; bu bakımdan
2 Psikolojide Ölçme ve Ölçek Geliştirme II

geçerli olan bir ölçme aracı zaten güvenilir olmak zorundadır; ancak güvenilir
olan bir ölçme aracı geçerli olmayabilir. Ancak, bunlar da psikolojik değişkenin
yapısının ne ve nasıl olduğunun ortaya çıkarılma (ölçme aracının geliştirilme) süre-
cinin sağlamlığına bağlıdır…
Psikolojik ölçme araçlarının güvenirliği ve geçerliği denince, çoğu kez, sanki
bunlar ölçek geliştirme sürecinden ayrı niteliklermiş gibi algılanmakta ve o şekilde
ele alınagelmektedir. Oysaki bu iki niteliğin ‘nitelikli olabilmesi’ tamamıyla öl-
çek geliştirme sürecinin niteliğine bağlıdır ve hatta ölçek geliştirme sürecinin ta
kendisidir. Bu bölümün, bu niteliklere yaklaşımı bu bakışaçısına uygun olacaktır.
Bu bakımdan, hem güvenirlik hem de geçerlik kısımlarında, bugüne kadar alışı-
lagelmiş sınıflama ve anlatımların dışına çıkılacaktır. Böylesi bir bakışaçısı, ölçme
kuramlarına da zaman zaman genelleştirilecektir. Bu nedenle, kitabın okuyucusu
tartışmaya açık bakışaçısına, bölümün yazarı da eleştirileri göğüslemeye hazır ol-
malıdır.
Bazı yayınlarda belirtilen “kullanışlılık (usability)” ise ölçeğin psikometrik ni-
teliği değil, bir ölçme aracının belirli bir kullanıcı için elverişli olup olmamasıyla
ilgilidir (o da ölçek kullanıcısını ilgilendirir, ölçeği değil) ve teknik bir özellik de-
ğildir. Bir psikolojik ölçme aracının, uygulama biçimi, sayfa sayısı, madde sayısı
vb tümüyle ölçülecek özelliğin yapısına bağlıdır. Örneğin MMPI, WISC gibi “hacmi
büyük” ve “uygulaması zor” ölçme araçlarının, kullanıcıların bazıları öyle istiyor
diye hacmi azaltılamaz veya uygulama zorluğu basitleştirilemez. Bu bakımdan,
“kullanışlılık” denilen “şey” bu kitapta yer alamayacaktır.
1. KISIM

GÜVENİRLİK (RELIABILITY)

Güvenirlik ile hata yan yana olan iki kavramdır ve özelliktir; sözün kısası,
güvenirlik ile hata düşman kardeşlerdir. “Güvenilir kişi” dendiğinde, sözü-özü bir
kişi; söz verdiği zaman ve yerde hatasız ve üstelik istikrarlı bir şekilde bulunan kişi
akla gelir. Ölçme araçları için de benzer bir durum söz konusudur. Ancak, ne
tür araç kullanırsak kullanalım (çoğu insan için olduğu gibi), ölçme sonuçlarına;
çeşitli kaynaklardan bir miktar hata karışabilir. Bu durum, sadece insan bilimleri
için değil, fizik bilimleri için de geçerlidir; ancak, insanın doğrudan gözlenemeyen
psikolojik özelliklerinin ölçülmesi söz konusu olduğunda, bu durum bir o kadar
daha önemli duruma gelir. Peki hatadan neyi kastediyoruz, hata kaç türlüdür, bu
hatalar nerelerden kaynaklanır? Bu hatanın kaynağını, türünü, miktarını bilmek
neden önemlidir? Çünkü her türlü anlama, açıklama, yordama ve denetim alma
işleminin doğruluğu bu ölçmenin hatasızlığına bağlıdır. Ayrıca, hatanın kaynağını
bilirsek onu daha başlangıçta kontrol edebiliriz; türünü ve miktarını bilebilirsek,
işlemlerimizde onu etkisizleştirebilir, hatasız durumlar için kestirimlerde buluna-
biliriz.
Hangi alanda olursa olsun, ister fen bilimleri isterse sosyal bilimler –hatta
sosyal yaşantıda kişiler arası ilişkilerde, güvenirlik (reliability) söz konusu oldu-
ğunda, hatanın ne ve ne kadar olduğuna değinmeden güvenirliği irdelemek ola-
naklı değildir. “Bu saat hiç şaşmaz, buna güvenebilirsin”, “bu terazi hatasız ölçer”,
“bu ölçek 0,99 güvenilirdir”, “Ali’ye güvenebilirsin, söz verdi mi yapar”… Hata kav-
ramı, ister istemez “gerçek” kavramı ile de düşman kardeştir; bu bakımdan güve-
nirlik ile gerçek arasında da ortak kardeşlik söz konusudur.
4 Psikolojide Ölçme ve Ölçek Geliştirme II

Ölçme ‘Sonuçlarına’ Karışan Hatalar


Her ölçme kuramı, bir önceki bölümde ele alındığı gibi, kendi hata modeli
ile birlikte vardır. Dolayısıyla, “neyin” hata, “neyin” gerçek olarak görüldüğü, bu
hatanın “ölçülen” ve “gerçek” ile ilişkisi ve onun nasıl belirleneceği konusunda
farklılıklar karşımıza çıkaracaktır. Klasik Test Kuramı, “gerçek puan” kuramı ola-
rak anılmasına rağmen, aslında psikometrideki tüm kuramlar bu gerçeğin arayışı
içindedir.
Kısaca, ölçmelerde hata (error), ölçülmek istenmeyen miktarın ölçüm sonuçla-
rına karışmasıdır. Diğer yandan, ‘bilmeyerek’ yapılan hata, “bilerek” yapılan yan-
lıştan (false) farklı ele alınmalıdır. Ölçme sonuçlarına ‘karışan’ hataları tanıyalım:
1. Sabit hata: Her bir ölçme sonucuna belirli ve aynı yönde (+ veya -) ve
sabit miktarda karışan hatadır. Bu durum genellikle ölçme aracının ka-
librasyonundaki bozulmadan veya ölçmecinin bilerek ekleme-çıkarma-
lar yapmasından ortaya çıkar. Örneğin, evdeki baskül, her 10 kg’da 1 kg
fazla tartıyorsa ve toplam ağırlık 110 kg gelmişse, “gerçek” ağırlık 100 kg
demektir. Bazen, ölçmeci de sınıftaki tüm puanlara (bazı gerekçelerle)
5’er puan ekleyebilir; aslında bu sabit hata gibi görünmekle birlikte, sabit
yanlıştır. Sabit hatanın yönü ve miktarı bilindiğinde, gözlenen puandan
o miktar kadar çıkarılıp eklenerek, gerçek puan bilinebilir.
2. Sistematik hata: Ölçme sonuçlarına belirli bir yönde belirli bir sistema-
tiğe dayanarak (bir aritmetik dizi, oran vb) giderek artan veya giderek
azalan miktarlarda karışan hatalardır. Bu hataların da yönü ve sistemati-
ği bilinirse, gözlenen sonuçlar düzeltilebilir. Eğer belirlenemeyen neden-
lerle bu sistematik artış/azalış ortaya çıkıyorsa, hatadır; ancak, özellikle
insan özellikleri açısından bakılacak olursa, örneğin, yaşlılık belirli fizik-
sel (ağırlık kaldırma gibi) ve psikolojik özelliklerde (unutma gibi) doğal
olarak sistematik bir azalışa; çocukluktan gençliğe geçişte ise sistematik
artışa neden olabilirler. Bu tür durumlarda, aslında bu değişimler, hata
değil, gerçek puanlardaki değişimler olarak görülmelidirler. Örneğin, bir
çocuğunuz olsun ve onun boyunu ve ağırlığını her hafta kaydediyor
olun. Eğer bir patolojik durum veya dışsal bilinen bir neden yoksa, çocu-
ğunuzun boy uzunluğu ve ağırlığı her hafta giderek artacaktır (olgunlaş-
ma –‘maturation’); bu durumda, “benim metrem” veya “baskülüm hatalı
ölçüyor” diyebilir misiniz? Aynı şekilde, zekâ yaşa bağlı olarak sistematik
bir şekilde belirli bir yaşa kadar artar; aynı ölçme aracıyla ölçülen birey
de giderek artan zekâ puanları alır; bu durumda zekâ ölçeği hatalı öl-
çüm yapıyor sonucundan çok, ölçülen özelliğin değiştiği sonucuna yük-
Güvenirlik (Reliability) 5

leme yapılır. Elbette, hem boy uzunluğu hem de ağırlık açısından, 19.
yüzyıla kadar çocuklar bu belirttiğimiz şekilde değil, tam tersine “cüce”
veya zekâsı geri yetişkinler” olarak nitelendiriliyordu; o dönemlerdeki
çocuk giyimlerine ve çocuklara bakış açılarına bir göz gezdirildiğinde
bu durum kolaylıkla anlaşılır. İşte, tam da bu nedenle, eğer ölçülen bir
değişken başka bir değişkene bağlı olarak değişiyorsa, o değişkenin dü-
zeylerine bağlı olarak normlar geliştirilir; özellikle bu tür durumlarda
(çünkü başka normlar da vardır) norm geliştirmenin esprisi yatmakta-
dır. Yoksa çocuklar hep “geri zekâlı” veya “cüce” olarak nitelendirilirdi
Peki, ölçmecilere bir soru: Madde Ayrımsal İşlevi’nde (DIF) bu değişim
mi incelenir? Öyle ya, madem zekâ yaşa bağlı olarak değişiyor, grup
farklarına ANOVA ile bakarız, olur biter, DIF’e ne gerek var?! Gelecek
kitaplarda bu konuya da eğileceğiz. Bu bakımdan sistematik değişim-
ler gerçek puanlarda değişime yolaçacağından, bu tür hataların yolaçtığı
farklılıklar güvenilmezlik (unreliability) kaynağı olarak hesaba katılmaz-
lar (Ghiselli, Campbell ve Zedeck, 1981). Bu durum, bir önceki bölümde
ele alınan Genellenebilirlik Kuramı’nın da ortaya çıkışının temel gerek-
çesini oluşturur.
3. Seçkisiz (random) hata: Seçkisiz hatalar [“random” teknik anlamda asla
“rasgele”, “gelişigüzel” olamaz; bunlar tam tersine “nonrandom” (acciden-
tal, haphazard, incidental) seçme ve olasılık işlemleridir ve hem olasılıkları
bilinemez hem de yanlı -bias- verilere/seçimlere yol açarlar (Bu konuda
bkz. Erkuş, 2013 ve 2014).] ne yönde ve ne miktarda olduğu bilinme-
yen hatalardır ve her türlü ölçmede bir şekilde bulunabilirler. İşte, ölç-
me araçlarındaki hatalara konu olan çoğunlukla bu hatalardır. Yönü ve
miktarı hakkında bir bilgiye sahip değiliz; çünkü, çeşitli kaynaklardan +
veya – yönde ölçme sonuçlarına hata karışır; kimisi puanların yüksel-
mesine kimisi de düşmesine yol açar. Peki, yükselme ve düşme (+ ve -)
ne anlama gelir; birbirlerini (aynı miktardaysa ve seçkisiz seçilmişlerse)
nötrleştirmelerine… Bu bakımdan örnekleme bir birim seçerken, onu
seçkisiz seçmenin, seçilen birimlerden gelecek hatalar açısından örnek-
lemin yansız seçimine katkıda bulunduğu varsayılır. Özellikle seçimlerin
birbirini etkilememesi (bağımsızlık) ve seçimlerin olasılıklarının aynı
(eşitlik) olması koşulları bunu sağlar. Seçkisiz hataların bu özelliği, bu
hataların davranışı ve dağılımı hakkında önemli bir taban sağlar. Özel-
likle psikolojik ölçmeler için geliştirilen araçlar, bir bireyden çok sayıda
veya çok sayıda bireyden bir ölçüm almayı gerektirdiği için şu çıkarımı
yapmak yanlış olmayacaktır: “Yeterince çok” ölçüm alınırsa, bu ölçümlere

You might also like