Download as pdf or txt
Download as pdf or txt
You are on page 1of 33

Psychometria to:

• dział psychologii zajmuj cy si teori i opracowywaniem testów psychologicznych

• dział metodologii psychologicznej zajmuj cy si pomiarem zachowa ludzkich w aspekcie


psychologicznym

• dziedzina obejmuj ca badania psychometryczne na ogół odnosz ce si do ró nych aspektów


procesów psychicznych, w tym badania osobowo ci, inteligencji, okre lania zdolno ci i
odnosz ca si do kwestii zastosowania zasad matematycznych i statystycznych w psychologii
dotycz pomiaru warto ci cech psychologicznych

Cechy psychologiczne:
• (konstrukty teoretyczne) - nie s bezpo rednio obserwowalne a zanim b d mogły zosta
wyra one ilo ciowo, wymagaj najpierw operacyjnego zdefiniowania (s bezpo rednio
nieobserwowalne)

• Charakterystyka pomiaru psychologicznego, czyli poznawanie nieobserwowalnych bezpo rednio


wła ciwo ci sprawia, e niezb dne staje si opracowanie teorii wi cej efekty badania za
pomoc narz dzia pomiarowego (np. testu psychologicznego) z cech psychologiczn , która
efekty te odzwierciedla poprzez warto ci liczbowe.

• Np. inteligencja, osobowo (ekstrawersja, sumienno ), poczucie lokalizacji kontroli,


preferencja warto ci, nadzieja na sukces, motywacja osi gni , radzenie sobie ze stresem

W ramach psychometrii podejmuje si zagadnienia, takie jak:


• sposoby budowania pozycji testowych (ang. test item),

• opracowywanie kryteriów wyboru pozycji testowych o najlepszych parametrach

• zasady przekształcania odpowiedzi testowych na wyniki liczbowe

• zasady oceny jako ci tych wyników

• zasady interpretacji wyników

• zasady okre lania stopnia stronniczo ci wyników testowych wzgl dem okre lonej grupy
społecznej

Psychometria czyli teoria testów


• dostarcza modelowych (teoretycznych) rozwi za , i w tym sensie ró ni si od - maj cego
bardziej aplikacyjne znaczenie - pomiaru psychologicznego.

• Pomiar psychologiczny wi e si ze szczegółowymi zasadami posługiwania si konkretnymi


narz dziami badawczymi Wypracowane w ramach teorii testów rozwi zania mog by
uogólniane na sytuacje pomiaru ró nych cech psychologicznych. Rozwi zania te, najcz ciej w
postaci modeli matematycznych czysto statystycznych, s najwi kszym dorobkiem psychometrii.

1










































































5 zasad - charakterystyk pomiaru cech psychologicznych:

1. Cechy psychologiczne powinny by definiowane nie tylko w terminach teoretycznych ale w


kontek cie zwi zków z innymi konstruktami teoretycznymi czy obserwowanymi zjawiskami

2. adna realizacja pomiaru psychologicznego nie ma charakteru uniwersalnego. Jest ograniczona


do teorii, w kontek cie której zostało zbudowane dane narz dziarze pomiarowe

3. Pomiar psychologiczny jest z konieczno ci oparty na próbce zachowania. Zadania wchodz ce w


skład danego testu s jedynie próbk z wszystkich mo liwych zada

4. Wyniki pomiaru psychologicznego ze wzgl du na natur mierzonych cech, s analogicznie do


wyników pomiaru w innych dziedzinach rzeczywisto ci, s zawsze obarczone bł dem.
St d wskazane podawanie przedziałów ufno ci danych wyników.

5. Wyniki pomiaru psychologicznego nie gwarantuj automatycznie przeło enia na skal o


niezawodnie zdefiniowanych jednostkach.

Test psychologiczny:

• specyficzna procedura diagnozowania mo e by zbiorem pyta lub zada , które – w


standaryzowanych warunkach – maj wywoła okre lone rodzaje zachowa i dostarcza
wyników o po danych własno ciach psychometrycznych tj. wysoka trafno , rzetelno

• „obiektywna i wystandaryzowana miara próbki zachowania”

• „Testy to zbiory pyta lub sytuacje, słu ce do badania własno ci jednostek lub grup ludzkich
przez wywoływanie u nich okre lonych obserwowalnych reakcji werbalnych lub niewerbalnych,
b d cych w miar mo no ci reprezentatywnymi próbkami ich zachowania si ”

• „Badanie testowe to taka sytuacja:


- w której osoba badana uczestniczy dobrowolnie i jest wiadoma celu, jakim jest jej ocena
- tworzona specjalnie dla celów diagnostycznych,
- w której wywołuje si zachowania typowe pod wzgl dem tej charakterystyki, jaka ma by
przedmiotem cel owej obserwacji
- która od diagnosty nie wymaga osobistego zaanga owania
- w której jasno jest okre lony zakres i rodzaj dopuszczalnych zachowa ”.
• jest to narz dzie pozwalaj ce na uzyskanie takiej reprezentatywnej próbki zachowa , o których
mo na powiedzie (np. na podstawie zało e teoretycznych lub zwi zków empirycznych), e s
one wska nikiem danej cechy psychologicznej

• Jest to narz dzie obiektywne, wystandaryzowane, trafne, rzetelne, znormalizowane, wyposa one
w reguły obliczania mierzonej cechy psychologicznej oraz jasno okre laj ce zakres i rodzaj
dopuszczalnych zachowa ze strony diagnosty.

• Badanie testowe to taka sytuacja, w której osoba badana uczestniczy dobrowolnie i wiadomie
celu jakim jest ocena jej psychologicznych cech

2










































































Cele stosowania testów psychologicznych:
1. Diagnozowanie – osób lub grup osób - Jakie rodzaje oddziaływa psychologicznych
(edukacyjnych, terapeutycznych) b d pomocne w odniesieniu do danej osoby/ grupy w celu
zapewnienia wła ciwego rozwoju, rozwi zania konfliktów, poprawy zdrowia psychicznego

2. Przewidywanie sukcesu - Zastosowanie w poradnictwie zawodowym, przy doborze i selekcji


kandydatów, okre lenie potencjału i predyspozycji zawodowych

3. Rozwój wiedzy - Stosowanie w badaniach naukowych jako weryfikacja teorii naukowych i


zmierzaj ce ku rozwojowi danej dziedziny wiedzy psychologicznej

Psychometryczne kryteria dobroci testów psycghologcicznych:


• Rzetelność - to dokładno z jak test mierzy to co ma mierzy Rzetelno mówi nam o tym, w
jakim stopniu wynik danego testu odzwierciedla poziom mierzonej cechy u danej osoby oraz na
ile miał wpływ na wynik czynnik losowy

• Trafność - czyli obszar zastosowania testu; trafno : to informacja o tym, jak test pełni swoj
funkcj , to okre lenie czy test mierzy to co ma mierzy , oznacza co mo na poprawnie
wywnioskowa na podstawie wyniku testowego

• Normalizacja - czyli nadawanie znaczenia wynikom testowym Wynik otrzymany w te cie


psychologicznym nie ma adnego znaczenia tak długo, jak długo nie mo na odnie go do
precyzyjnego i jednolitego układu odniesienia. Normalizacja testu to procedura tworzenia
zbiorów - w specjalny sposób przetworzonych, wyników testu dla osób o okre lonych
wła ciwo ciach zdefiniowanych za pomoc kryterium zewn trznego; Efektem normalizacji testu
jest zbudowanie zestawu norm, które stanowi podstaw interpretacji wyników testowych
uzyskanych przez konkretne osoby badane

• Adaptacja - czyli dopasowanie testu do polskich warunków Znaczna cz testów stosowanych


w Polsce to testy obcoj zyczne. Aby takie testy mogły by stosowane, powinny zosta nie tylko
przetłumaczone , ale tak e zaadaptowane do warunków polskiej kultury. Adaptacja to proces
przystosowania wersji pierwotnej do specyfiki kultury danego kraju, w którym test b dzie
u ywany.

• Obiektywność - czyli niezale no wyników testowania. Test jest obiektywny, je eli dwie ró ne
osoby opracowuj jego wyniki otrzymuj ten sam rezultatu. Aby było to mo liwe, test musi
posiada jasno okre lony klucz oceniania odpowiedzi, zmniejszaj cy do minimum wpływ
subiektywnych interpretacji.

• Standaryzacja - czyli jednolito warunków badania. Aby wyniki danego testu mo na było ze
sob porównywa , dany test powinien by zawsze przeprowadzany w identycznych warunkach.
Tylko wtedy ró nice w wynikach testowych badanych osób mo na przypisa czynnikom
indywidualnym, a nie np. zewn trznym warunkom badania.

3































































Rodzaje testów psychologicznych

Testy psychologiczne - wspólne wła ciwo ci psychometryczne ale bardzo zró nicowana
wewn trzne grupa narz dzi do pomiaru cech psychologicznych, którymi posługuj si psycholodzy
(grupa testów A, B, C) oraz inni specjali ci po realizacji szkolenia z zakresu psychometrii (grupa
testów A, B)

Kryteria podziału:
- Przedmiot pomiaru
- Ilo osób do bada
- Materiał na jakim test jest zrealizowany (materiał testowy)

1. Kryterium przedmiot pomiaru


• Cechy osobowo ci - (narz dzia nazywane s kwestionariuszami cech osobowo ci lub
inwentarzami osobowo ci) (np. NEO-FFI)
- nie ma jednej, poprawnej odpowiedzi w kwestionariuszu, brak te bł dnej odpowiedzi
- s odpowiedzi diagnostyczne
- wa na jest wiedza o sobie badanego podczas uzupełniania kwestionariusza
- wynik w danej podskali wskazuje intensywno cechy

• Cechy intelektualne (inteligencja; zdolno ci) - (narz dzia nazywane testami) (np. Test Matryc
Ravena)
- badany wykonuje specyficzne zadania zwi zane z ocen jego intelektu (matematyczne;
werbalne; abstrakcyjno-logiczne; sprawno ci psychomotorycznych)
- w te cie jest dobra (poprawna) tylko jedna odpowied , która jest zgodna z kluczem i jest
diagnostyczna
- pytanie/ zadanie ocenia czy badany rozwi zał dany problem czy nie

testy inteligencji

• testy szybko ci
- zło one z wielu zada o takiej samej lub podobnej trudno ci
- zadania s łatwe i ich wykonanie le y w granicach mo liwo ci badanego
- czasowe ograniczenie wykonania testu
- wa na jest ilo rozwi zanych zada w wyznaczonym czasie
- sprawno intelektualna jako szybko efektywnej pracy intelektualnej

• testy mocy
- wa na jest poprawno rozwi zania
- zadania zró nicowane i wraz z post pem rozwi zywania wzrasta ich trudno , a
- badany dochodzi do takiego zadania, którego ju nie mo e rozwi za

4




























































2. Kryterium ilo osób badanych
• indywidualne
- tylko jedna osoba badana w danym czasie
- nawi zanie indywidualnego kontaktu z badanym w tym mo liwo uzupełniania arkusza
pyta z badanym
- wa na procedura badania, kolejno zadawanych pyta
- mo liwo wł czenia pyta otwartych do testu
- czasochłonne
- dokładna analiza, wszechstronna diagnoza w zakresie badanej cechy (np. MMPI; WISC)

• grupowe
- prosty sposób badania - podanie instrukcji i samodzielne uzupełnianie przez badanego arkusza
testowego
- brak indywidualnego kontaktu z badanym
- głównie stosowanie pyta zamkni te
- uproszczony format odpowiedzi

3. Kryterium materiał na jakim test jest zrealizowany


• werbalny (słowny)
np. NEO-FFI; DINEMO (Dwuwymiarowy Inwentarz Inteligencji Emocjonalnej)

• niewerbalny (bezsłowny; wykonywalny)


np. Test Figur Bentona, Test Matryc Ravena

Analizy itemmetryczne
W psychometrii s trzy ró ne strategie konstrukcji testów powstały one w trakcie rozwoju pomiaru
psychologicznego
- teoretyczna
- wewn trzna
- zewn trzna
W ramach ka dej z nich stosuje si inne techniki analizy danych zorientowane na badanie własno ci
pozycji testowych (pyta , zada testowych), tzw. analizy itemmetryczne (od ang. item)

5



























Test nigdy nie powstaje poprzez napisanie „od razu” finalnego zestawu pyta

Tworzone s tzw. „pule wyj ciowe” itemów, które pó niej s oceniane przez ekspertów (s dziowie
kompetentni) np. ze wzgl du na trafno tre ciow itemów.

Pytania, które uzyskały najwy sze oceny ekspertów słu budowie tzw. eksperymentalnych wersji
narz dzi diagnostycznych za pomoc których prowadzi si badania stanowi ce ródło danych do
analiz itemmetrycznych.

W wyniku tych analiz wybiera si pytania o najlepszych charakterystykach pomiarowych i tworzy


finalne wersje testów.

Pozycja testowa
Pozycja testowa, (ang. item) to sformalizowany wska nik danej cechy psychologicznej, zdanie,
twierdzenie lub pytanie opisuj ce okre lone zachowanie (lub zdanie wyzwalaj ce okre lone
zachowanie) oraz skala rejestruj ca to zachowanie (zawieraj ca okre lone opcje odpowiedzi o
danym formacie) oraz reguła przekształcania odpowiedzi w wynik liczbowy

WA NE!!!
Pozycj testow tworzy nie tylko tre pytania (zadania), ale tak e format odpowiedzi – wielko
zestawu opcji lub wersji odpowiedzi, liczba kategorii odpowiedzi oferowanych osobie badanej do
wyboru

Rys historyczny
pozwala łatwiej zrozumie ró nice mi dzy strategiami konstrukcji
Jako pierwsz wypracowano strategi teoretyczn (dedukcyjn )
W strategii tej z góry (z mocy teorii) zdefiniowane jest jakie zmienne b dzie mierzył test. Wobec
tak tworzonych narz dzi formułowano krytyk , która ogniskowała si wokół dwu problemów.

• problemem - efekt tzw. redundancji pomiarowej


Narz dzia budowane dedukcyjnie, je li miały wiele skal, charakteryzowały si silnymi korelacjami
mi dzy nimi, co z perspektywy „ekonomii” pomiaru jest zjawiskiem negatywnym.

Rozwi zaniem problemu było powstanie strategii wewn trznej (indukcyjnej) czyli budowa narz dzi
ci le w oparciu o empiri i zastosowanie analizy czynnikowej do analizy danych

• problemem - niezadowalaj c trafno diagnostyczna


narz dzia zbudowane o strategi dedukcyjn mierzyły zmienne, ale nie zawsze pozwalały na
budowanie u ytecznych wniosków podczas diagnozy.

Rozwi zaniem strategie zewn trzne - odrzucenie teorii i oparcie si na tylko na empirii, przy czym
dane zbierano na specyficznych (np. klinicznych) grupach szukaj c wska ników (kryteriów)
pozwalaj cych na ró nicowanie mi dzy specyficznymi grupami (np. zdrowi vs. chorzy).

Współcze nie cz sto stosuje si tzw. strategie kombinowane, które z ka dego z trzech klasycznych
podej bior to co najlepsze.

Trzy klasyczne strategie konstruowania testów i zwi zane z nimi techniki analizy wła ciwo ci
pozycji testowych zostan omówione oddzielnie

6




















































































1. Strategia teoretyczna (dedukcyjna)
• opiera si na teorii psychologicznej,
• celem konstrukcji jest pomiar cech postulowanych przez teori

Kluczowym etapem konstrukcji jest tu analiza definicji cech zmiennych na podstawie których
generuje si propozycje itemów do puli badawczej.

Strategia ta odwołuje si do danych z prób reprezentatywnych, jako e poszukujemy wska ników


cech, które maj wyst powa w ró nym stopniu u ró nych osób w całej populacji.

Klasycznie kryterium wł czania pozycji testowych do puli pomiarowej testu:


- trudno pozycji (wska nik trudno ci)
- moc dyskryminacyjna
Powstałe w wyniku zastosowania tej strategii narz dzia diagnostyczne cechuje:
• zalety: wysoka trafno teoretyczna i cz sto wysoka trafno kryterialna
• wady: wzajemne skorelowanie skal (redundancja pomiarowa)

Trudno pozycji testowej – wska nik trudno ci


to proporcja liczby osób, które udzieliły prawidłowej odpowiedzi na pytanie (zgodnej z kluczem
i\lub diagnostycznej)do ogółem przebadanej liczby osób

T% - wska nik trudno ci pozycji testowej


np – liczba osób, która udzieliła zgodnej z kluczem odpowiedzi na pytanie
(poprawnej) ( ni )
n – liczba osób bior cych udział w badaniu, które odpowiedziały na to
pytanie (pozycj testow )

Najprostsza miara pozwalaj ca podj decyzje o tym, które pozycje testowe mog wej do
ostatecznej puli testu.

Jest stosowany zazwyczaj do testów wiedzy, testów właściwości poznawczych. Zazwyczaj jest
wyrażany jako odsetek osób, które znały prawidłową odpowiedź na pytanie. Im wyższa wartość
wskaźnika T, tym łatwiejsza jest dana pozycja testowa.

Poprawka na zgadywanie
W przypadku testów wiedzy mo liwa jest korekta wyniku otrzymanego poprzez zastosowanie tzw.
poprawki na zgadywanie, obliczanej według wzoru:

Pk – wynik po korekcie czyli wynik danej osoby poprawiony ze


wzgl du na zgadywanie P – wynik surowy (otrzymany) czyli liczba
prawidłowych odpowiedzi
B – liczba bł dnych (nieprawidłowych) odpowiedzi,
m – liczba opcji odpowiedzi dost pnych do wyboru.

7









































• Stosowanie poprawki na zgadywanie uzasadnione jest tylko w testach z ograniczeniem
czasowym.

• W przypadku testów mocy, gdzie osoby badane mogą „rozwiązywać" wszystkie zadania
stosowanie poprawki na zgadywanie jest nie daje nic istotnego, ponieważ korelacja wyników
prawidłowych oraz błędów jest idealnie ujemna i poprawka niczego nie wnosi.

• Warunkiem stosowania poprawki na zgadywanie jest taka postać wszystkich zadań, że wszystkie
opcje odpowiedzi są równie atrakcyjne i prawdopodobne.

• Stosowanie poprawki na zgadywanie ma sens szczególnie w przypadku testów składających się z


zadań o małej liczbie opcji odpowiedzi (n≤4).

• Poprawkę na zgadywanie szczególnie warto stosować w przypadku trudnych testów gdvż nasilają
one tendencję do zgadywania

Moc dyskryminacyjna
informuje w jakim stopniu dana pozycja testowa ró nicuje dan populacj , ze wzgl du na mierzon
cech

W rozumieniu operacyjnym jest to korelacja mi dzy pozycj testow a skal ; Obliczanie tych
korelacji wymaga spełnienia specyficznych zało e – jedna z korelowanych zmiennych jest
mierzona na skali nominalnej, druga na przedziałowej

Pomiar mocy dyskryminacyjnej obejmuje zmienn dychotomiczn (dyskretn ) - pozycja testowa) i


zmienna ci gł (wynik ogólny)

Warto ci mocy dyskryminacyjnych maksymalizuj si dla pyta o przeci tnej trudno ci. moc
dyskryminacyjna niesie t sam informacj co wska nik trudno ci (o stopniu ró nicowania) ale
ró nicowanie to jest „badane” w kontek cie zmiennej mierzonej przez cał skal

Pozycja testowa o dodatniej mocy dyskryminacyjnej np. D = 0.68


jest cz ciej rozwi zywana przez osoby badane o wysokich wynikach ogólnych w te cie, czyli
dobrze ró nicuje osoby w odniesieniu do innych pozycji testowych oraz zwi ksza wariancj
(zró nicowanie) wyników testowania = dobrze mo na na podstawie danej pozycji testowe okre li
poziom danej mierzonej cechy psychologiczne

Pozycja testowa o ujemnej mocy dyskryminacyjnej np. D - 0.55


jest cz ciej rozwi zywana przez osoby o niskim/ bardzo niskim wyniku w danym te cie czyli
ró nicuje te osoby przeciwnie ni inne pozycje testowe a tym samym zmniejsza wariancj wyników
testowania trudno na jej podstawie okre li poziom mierzonej cechy psychologicznej

Moc dyskryminacyjn oblicza si uprzednio rekoduj c pytania z inwersj . Je eli pomimo


rekodowania pyta z inwersj dostajemy ujemne warto ci mocy dyskryminacyjnych to znaczy:
• e osoby badane udzielaj paradoksalnych odpowiedzi (np. ekstrawertycy odpowiadaj jak
introwertycy, introwertycy jak ekstrawertycy)
• badacz pomylił si ustalaj c klucz - warto ujemn mo na traktowa jako dyskwalifikacj
pozycji mimo znacz cej warto ci mocy dyskryminacyjne
8










































































Przyjmuje si , e moc dyskryminacyjna (warto wska nika dyskryminacyjnego - D)
• musi mie warto > 0,20 aby pozycja była wł czona do skali (około 5% wspólnej wariancji ze
skal ).
• do ostatecznej wersji testu wchodz pozycje o dodatniej, wysokiej mocy dyskryminacyjnej
(najlepiej D powy ej 0,40)

Metody obliczania mocy dyskryminacyjnej


W psychometrii wypracowano ró ne formuły obliczania mocy dyskryminacyjnej

• Proste wska niki dyskryminacyjne


• Współczynniki oparte na analizie korelacji mi dzy wynikiem w danej pozycji testowej a
wynikiem ogólnym
- współczynnik korelacji dwuseryjnej (biseryjnej)
- współczynnik korelacji punktowo-dwuseryjnej,
- współczynnik korelacji punktowo-czteropolowej
• Współczynniki oparte na analizie ró nic mi dzy skrajnymi grupami

2. Strategia wewn trzna (indukcyjna)


Strategi , która opiera si na metodologii, a nie na wiedzy i teorii. Celem bada jest nie tylko
konstrukcja nowego narz dzia diagnostycznego, ale tak e identyfikacja podstawowych wymiarów
zachowania za pomoc eksploracyjnej analizy czynnikowej.

Analiza czynnikowa jest metod analizy danych, której istota polega na identyfikacji mniejszej
liczby wymiarów, skupie , czy te czynników w wi kszym zbiorze skorelowanych zmiennych
niezale nych lub te pozycji w narz dziu testowym.

Podobnie jak w przypadku strategii dedukcyjnej przedmiotem pomiaru s cechy, zatem badania
prowadzi si na próbach reprezentatywnych dla populacji.

Kluczowym etapem konstrukcji jest empiryczny dobór wska ników za pomoc analizy
czynnikowej, a kryterium wł czania pytania dla skali jest warto ładunku czynnikowego ( ci le –
warto ci konfiguracji ładunków)

Powstałe w wyniku zastosowania tej strategii skale s oszcz dne (krótkie) i trafne teoretycznie, ich
wad jest ich nadmierna jednorodno i ogólno .

9
















































Ładunek czynnikowy
• wskazuje na korelacyjny zwi zek mi dzy pytaniem a czynnikiem
• Dla oceny siły zwi zku kluczowa jest warto ładunku czynnikowego, natomiast znak ładunku
(„-”) wskazuje na pytania „nie wprost” wymagaj ce rekodowania
• Przyjmuj si , e warunkiem wł czenia pytania do skali jest warto ładunku > 0,30 (oznacza to
około 10% wspólnej wariancji).
• Zazwyczaj wł czane do skali s pytania maj ce wysokie ładunki jednego z czynników i niskie
pozostałych – mierz ce okre lon a nie inne cechy psychologiczne.

3. Strategia zewn trzna (kryterialna)


opiera si na wiedzy (np. klinicznej) a nie na teorii psychologicznej. Celem konstrukcji jest pomiar
„syndromów zachowania”, np. syndromów klinicznych

Kluczowym etapem konstrukcji jest empiryczny dobór wska ników.

Analiza odwołuje si do danych z prób dobieranych celowo (np. chorzy vs. zdrowi). Kryterium
wł czania pozycji do skali jest korelacja pozycji z zewn trznym kryterium.

Powstałe narz dzia cechuje wysoka trafno kryterialna, cz sto takie testy s nisko rzetelne i
nadmiernie długie.

W strategii zewn trznej rezygnuje si z zało enia o pomiarze cechy. W efekcie korelacje mi dzy
pytaniami nie s oczekiwane Poszukuje si pyta , opisuj cych zachowania ró nicuj ce dwie grupy
osób (np. objawy kliniczne, vs. brak objawów)

Czynniki zakłócaj ce pomiar


• Symulacja i dysymulacja
• Aprobata społeczna
• Styl odpowiadania

Symulacja i dysymulacja
• Dyssymulacja - wiadoma lub nie wiadoma tendencja osoby badanej
do przedstawiania si w korzystnym wietle

• Symulacja - wiadoma lub nie wiadoma tendencja do bezpodstawnego


przedstawiania si w niekorzystnym wietle

Oba terminy maj konotacj kliniczn . W kontek cie kwestionariuszowego badania tzw. zdrowej
osobowo ci u ywa si poj cia potrzeby aprobaty społecznej, b d aprobaty społecznej

10


























































Aprobata społeczna
Aprobata społeczna rozumiana jest jako tendencja do kierowania si przy odpowiadaniu na pytania
społecznym warto ciowaniem zachowania.

Aprobata społeczna przejawia si w zaprzeczaniu posiadania cech społecznie niepo danych oraz
przypisywaniu sobie cech społecznie po danych.

Aprobat społeczn mo na traktowa jako:


- styl odpowiadania (uwarunkowany sytuacyjnie, np. ze wzgl du na specyficzny cel badania),
- cech osobowo ci
Aprobata społeczna mo e mie charakter samooszukiwania (nie wiadomy), jak i sprawiania
wra enia ( wiadomy)

Aprobata społeczna mo e by kontrolowana na ró ne sposoby


• Podczas konstrukcji kwestionariusza - dbało o stosowanie zrównowa onych opcji odpowiedzi
w pytaniach; nale y unika stosowania wielkich kwantyfikatorów czasu w tre ci pyta („nigdy”,
„zawsze” – wzbudzaj bowiem potrzeb aprobaty) warto doda do głównych skal testu skal
pyta kontrolnych, tzw. skal kłamstwa, b d skal sprawiania wra enia np. EPQ-R posiada skal
kłamstwa

• Po badaniach pilota owych, w trakcie analizy itemmetrycznej - usuwanie z kwestionariusza pyta


silnie obci onych aprobat społeczn , w efekcie budowa skal nieobci onych aprobat
społeczn

Style odpowiadania
Styl odpowiadania – tendencja osoby badanej do wybierania okre lonej opcji odpowiedzi
niezale nie od tre ci pytania kwestionariuszowego; tendencja do zgadzania si , do zaprzeczania,
udzielania odpowiedzi przypadkowych („strzelanie”), b d nieuwa nych (opuszczenia).

Style odpowiadania mog by kontrolowane przez:


• precyzyjne formułowanie tre ci pyta – pytania takie ogniskuj uwag osoby badanej;
• wyrównanie proporcji odpowiedzi diagnostycznych „tak”/„nie” ; „prawda”/ „fałsz” - u ycie takiej
proporcji prowadzi do zerowania wariancji zwi zane z potakiwaniem, b d przeczeniem;
• budowanie wska ników potakiwania i „strzelania” w celu identyfikacji osób badanych
przejawiaj cych te style odpowiadania (szczególnie w przypadku długich kwestionariuszy)

11



































































Rzetelność
Takie opracowanie testu (materiału testowego i procedury badania), tak, aby maksymalizował on
dokładno pomiaru cechy badanej przez test psychologiczny

Rodzaje błędów pomiaru


W psychometrii rozró nia si mi dzy losowym a systematycznym bł dem pomiaru

• Bł d systematyczny, w rozumieniu klasycznej teorii testów, nie wi e si z niedostatkami


rzetelno ci testu, wiadczy o „inwalidacji”, niedostatkach trafno ci narz dzia.

• Bł d losowy powoduje obni enie rzetelno ci pomiaru testem, mo e by konsekwencj :


- konstrukcji testu - np. osoby badane w ró ny sposób rozumiej tre pyta
- sytuacji testowania - np. specyficznych warunków danego badania, b d
specyficznych stanów osoby badanej
- złej oceny wyników; pomyłek psychologa stosuj cego klucz, na co szczególnie
wra liwe s narz dzia składaj ce si z pyta otwartych

Uwaga !!!
Oszacowanie rzetelno ci w aspekcie: stabilno i zgodno wewn trzna zwi zana jest z
minimalizacj ródeł bł du losowego, konstrukcji testu - jako pozycji testowych,
sytuacji testowania – warunków badania

Dobrze opracowane narz dzie diagnostyczne powinno mie zbadane oba aspekty rzetelno ci
stosownymi metodami.

Tylko takie podej cie do badania rzetelno ci daje pełen obraz rzetelno ci narz dzia – opisuje
niedostatki rzetelno ci wi ce si z tymi ródłami bł du losowego.

Podstawy klasycznej teorii testów


Równanie sformułowanej przez Gulliksena w klasycznej teorii testów
mówi, e wynik otrzymany (Xx )(surowy) jest przybli eniem wyniku
prawdziwego i składa si z wyniku prawdziwego (Xt) i składowej bł du
(Xe):

Wynik prawdziwy jest tu definiowany jako granica do jakiej zmierza rednia


pomiarów i-tej osoby w nieograniczonej serii testów równoległych
12

































































Wynik prawdziwy to taki wynik, który otrzymaliby my dysponuj c doskonale rzetelnym
narz dziem

Poniewa nie ma takich narz dzi pomiarowych wynik otrzymany jest zawsze zniekształcony
poprzez składow bł du

Kolejne równania podane przez Gulliksena dotycz parametrów


opisuj cych wyniki testowe. Z równania wynika, e rednia wyników
uzyskanych za pomoc testów - Mxz mocy wcze niejszego zało enia
dotycz cego warto ci oczekiwanej bł dów pomiaru odpowiada redniej
wyników prawdziwych Mt.

Z kolei wariancja wyników otrzymanych jest zawsze wi ksza od wariancji


wyników prawdziwych, poniewa powi kszona jest o składow bł du.

Zatem parametrem obci onym przez bł d losowy jest wariancja


wyników testu, a najistotniejszym problemem teorii pomiaru jest okre lenie stopnia w jakim
wariancja bł du obci a wariancj wyników otrzymanych.

Je eli wariancja wyników otrzymanych nie bazuje jedynie na bł dzie, mo na oczekiwa , e wyniki
otrzymane i prawdziwe b d skorelowane.

Korelacj tak nazywamy wska nikiem rzetelno ci

Na mocy klasycznej teorii testów wykazano, e korelacja mi dzy dwoma


testami równoległymi równa jest współczynnikowi rzetelno ci –
kwadratowi wska nika rzetelno ci, który jest stosunkiem wariancji
wyników prawdziwych do wyników otrzymanych

Dwa testy s testami równoległymi, je eli spełnione s cztery warunki:


• maj równe rednie,
• maj równe wariancje
• zwi zki pomi dzy kolejnymi pytaniami opisywane s przez takie same warto ci interkorelacji,
• w taki sam sposób koreluj z okre lonym kryterium zewn trznym.

13




























































Wa ne
Korelacja mi dzy testami równoległymi pozwala na empirycznie podej cie do zwi zku mi dzy tym
co abstrakcyjne (wyniki prawdziwe) a tym co mierzalne (wyniki otrzymane) zast puj c korelacj
mi dzy wynikami prawdziwymi i otrzymanymi korelacj mi dzy dwoma testami.

Kwadrat wska nika rzetelno ci jest proporcj wariancji wyników prawdziwych do wyników
otrzymanych co pozwala sformułowa tzw. logiczn definicj rzetelno ci, a tak e pozwala w wa ny
statystycznie sposób interpretowa warto ci współczynników rzetelno ci.

Warto współczynnika rzetelno ci mo na traktowa jako odsetek wariancji wyników otrzymanych


wyja nianych przez wyniki prawdziwe.

Rzetelno pomiaru to proporcja wariancji wyników


prawdziwych do wariancji wyników otrzymanych.

Współczynnik rzetelno ci mo e przyjmowa warto ci z


zakresu od 0 do blisko 1. Rtt ε (0,1)

Je li wariancja bł du jest mała a wariancja wyników prawdziwych (lub wariancja wyników


otrzymanych) wysoka to warto współczynnika b dzie d ył do jedno ci.

W odwrotnej sytuacji warto współczynnika rzetelno ci b dzie zmierza do zera.

Badacz powinien d y od uzyskiwania wyników o mo liwie wysokiej wariancji dbaj c o


minimalizowanie wariancji bł du.

Współczynnik rzetelności a jednorodność próbki

Jeżeli próbka składa się z osób podobnych do siebie ze względu na mierzona cechę danym testem,
to wariancja wyników prawdziwych jest niewielka.

Zmiana w zakresie jednorodności próbki osób badanych prowadzi do zmiany współczynnika


rzetelności testu.

Wzór pozwala określić zmianę współczynnika rzetelności testu, jeśli stosujemy go do próbki o innej
wariancji całkowitej niż ta dla której został obliczony

ruu - szacowana rzetelność na nowej próbce;

st2 - wariancja całkowita próbki, dla której obliczono współczynnik


rzetelności testu rtt

su2 - wariancja całkowita próbki, dla której szacujemy rzetelność testu

14






















































Interpretacja warto ci współczynników rzetelno ci

rtt > 0,90 bardzo rzetelny pomiar, test mo e by stosowany zarówno w badaniach naukowych, jak i
do formułowania diagnoz indywidualnych

0,90 > rtt > 0,80 rzetelny pomiar, test mo e by stosowany w badaniach naukowych, jak i do
diagnoz indywidualnych, które b d mniej precyzyjne.

0,80 > rtt > 0,70 przeci tna rzetelno , test powinien by stosowany jedynie w badaniach
naukowych

0,70 > rtt > 0,60 niska rzetelno , test mo e by stosowany warunkowo w badaniach naukowych

0,60 > rtt > 0,50 – w tpliwa rzetelno pomiaru, test o bardzo niskiej u yteczno ci klinicznej i
naukowej

Wska nik rzetelno ci testu ma szczególne znaczenie przy ustalaniu podziału uzyskanych wyników
na kategorie opisowe czyli przy sposobie interpretacji.

Przyj ty w psychologii podział na wyniki: bardzo wysokie, wysokie, przeci tne, niskie, bardzo
niskie jest umowny i powinien by dostosowany do wska nika rzetelno ci testu.

Od testów stosowanych w diagnostyce wymagamy precyzji – W przypadku opisu i interpretacji


pojedynczych wyników indywidualnych zale y praktykowi na dokładno ci pomiaru.

W sytuacji wnioskowania o ró nicach mi dzy dwiema osobami wysoka rzetelno ułatwia


wnioskowanie o ró nicach.

W badaniach naukowych testy zazwyczaj słu zazwyczaj do badania korelacyjnych zale no ci


mi dzy zmiennymi, odpowiedzialno diagnosty jest w takim przypadku mniejsza.

Standardowy błąd pomiaru SEM


Wychodz c od „logicznej” definicji rzetelno ci i dokonuj c
kilku przekształce arytmetycznych, mo na wyprowadzi wzór
na standardowy bł d pomiaru:

Standardowy bł d pomiaru - SEM od ang. standard error of


measurement, jest odchyleniem standardowym (sx) rozkładu bł dów pomiaru wokół wyniku
otrzymanego.

Jest to przeci tna warto bł du jaki popełniamy posługuj c si testem o okre lonej rzetelno ci i
okre lonej wariancji wyników surowych.

Łatwo pokaza , e im wy sza warto współczynnika rzetelno ci rtt tym mniejsza warto
standardowego bł du pomiaru.

15





































































Budowa przedziału ufno ci dla wyniku otrzymanego
Przedział ufno ci dla wyniku otrzymanego pozwala na okre lenie granic, w których – z przyj tym
prawdopodobie stwem – (85%; 90%; 95%; 99%) znajduje si wynik prawdziwy osoby badanej

Diagnoz nale y zawsze budowa za pomoc przedziału ufno ci. Nie mo na odnosi do norm
wyniku otrzymanego

Interpretacja przedziału ufno ci: Przedział ufno ci obejmuje (zawiera w sobie) z


prawdopodobie stwem 1-α, szacowany wynik prawdziwy testu

Standardowy bł d ró nicy mi dzy dwoma wynikami


Informacje o rzetelno ci testu nale y bra pod uwag tak e,
gdy dokonujemy porównania mi dzy dwoma wynikami.

Cel - wykluczenie, e ró nica mi dzy dwoma wynikami jest


pozorna

Posługujemy standardowym bł dem ró nicy mi dzy dwoma wynikami.

Ogólny wzór na standardowy bł d ró nicy mi dzy dwoma wynikami, uzale nia jego wielko od
warto ci standardowych bł dów pomiaru testów, których wyniki porównujemy:

16







































Standardowy bł d estymacji SEE
Lord i Novick zaproponowali inne ni Gulliksen rozumienie standardowego bł du pomiaru

standardowy bł d estymacji SEE ang. – standard error of estimate, charakter którego jest zale ny od
wyniku prawdziwego.

Bł d ten ma rozkład symetryczny wokół wyniku prawdziwego i niesymetryczny wokół wyniku


otrzymanego (jest symetryczny dla wyników rednich i sko ny dla wyników skrajnych).

Budowa przedziału ufno ci za pomoc SEE odbywa si wokół estymowanego wyniku


prawdziwego, zatem jest to koncepcja bł du, która lepiej oddaje to co „dzieje si w trakcie
mierzenia”.

Mimo konceptualnej „wy szo ci” SEE nad SEM - ten rodzaj bł du jest rzadko stosowany do
okre lania przedziałów ufno ci

Jest to post powanie o wiele bardziej skomplikowane obliczeniowo. Przy czym uzyskane granice
przedziałów ufno ci s bardzo podobne, a przedział budowany za pomoc SEM jest zawsze szerszy.

• Dwukrotne badanie tym samym testem • Metody oparte na analizie wła ciwo ci statystycznych
stabilno ci bezwzgl dnej pozycji testowych
wiarygodno ci testu wzory KR20 i KR21 oraz
formuły obliczania Alfa Cronbacha
• Porównanie cz ci (np. połówek) testu • Ocena stopnia zgodno ci s dziów kompetentnych
Metoda połówkowa
Wzór „proroczy” Spearmana-Browna dla n=2

• Metody oparte na analizie zwi zków itemów z ogólnym wynikiem testu


Wzory „prorocze” Spearmana i Browna

• Porównanie form równoległych testu


równowa no ci mi dzytestowa
stabilno ci wzgl dnej
17





































Dwukrotne badanie tym samym testem
• Metoda estymacji stabilno ci bezwzgl dnej testu odwołuje si do dwukrotnego pomiaru tym
samym testem tej samej grupy osób badanych, mi dzy pomiarami mija jaki czas (inna nazwa –
badanie stało ci); metoda ta jest wra liwa na przypadkowe zmiany dotycz ce osoby badanej i
warunków badania

• Metoda estymacji wiarygodno ci testu, polega tak e na dwukrotnym badaniu tej samej grupy,
jednak mi dzy pomiarami nie ma przerwy – badanie drugie nast puje zaraz po zako czeniu
pierwszego; metoda pozwala oceni chwilowe – nie trwaj ce dłu ej ni samo badanie – i
zwi zane z osob badan czynniki zakłócaj ce pomiar
np. zm czenie, lub fluktuacje uwagi.

Porównanie form równoległych testu


Metoda ta odwołuje si do dwukrotnego badania grupy osób badanych, jednak w miejsce
dwukrotnego u ycia tego samego testu u ywane s dwie wersje równoległe.

• W przypadku dokonania pomiarów bez przerwy czasowej metoda nazywana jest estymacj
równowa no ci mi dzytestowej; pozwala okre li zwi zek mi dzy bł dem pomiaru a ró nicami
wersji, tym samym oceni zwi zek rzetelno ci i specyficznych tre ci pyta .

• Współczynnik stabilno ci wzgl dnej uzyskujemy dokonuj c pomiarów wersjami równoległymi z


odst pstwem czasu; uzyskana informacja o ródle bł du dotyczy zarówno zmienno ci
intraindywidualnej, jak i tre ci pyta .

Porównanie cz ci (np. połówek) testu


Metoda połówkowa pozwala okre li współczynnik równowa no ci mi dzypołówkowej;

Metoda połówkowa pozwala na oszacowanie rzetelno ci pomiaru testem na podstawie


jednokrotnego badania tej samej grupy osób jednym testem.

Przypomina – współczynnik równowa no ci mi dzytestowej.

Test mo e by podzielony na połowy: losowo lub z uwzgl dnieniem statystyk opisuj cych
poszczególne pytania, albo na pytania o numerach parzystych vs. pytania o numerach
nieparzystych.

Ocenianym ródłem bł du s ró nice mi dzy połówkami dotycz ce specyficznych tre ci pyta .

18









































































Metody oparte na analizie wła ciwo ci statystycznych pozycji testowych
Estymacja zgodno ci wewn trznej opiera si na jednokrotnym badaniu, w ogólnym rozumieniu
współczynniki tego rodzaju s redni wszystkich mo liwych współczynników równowa no ci
mi dzypołówkowej odwołuj cych si do ró nych „przepołowie ”.

Metody tego typu odwołuj si do tzw. wzorów KR20 i KR21 opracowanych przez Kuder i
Richardson, oraz formuły obliczania Alfa Cronbacha.

Współczynniki maksymalizuj si dla skal jednorodnych czynnikowo (homogenicznych), w


których poszczególne pozycje s wzgl dem siebie równoległe; ródłem bł du jest zatem
heterogeniczno pyta i ich tre .

Metody oparte na analizie zwi zków itemów z ogólnym wynikiem testu


Metody te pozwalaj na okre lenie rzetelno ci w oparciu o jednokrotne badanie.

W sensie operacyjnym obliczane wska niki s „pochodnymi” mocy dyskryminacyjnych – korelacji


mi dzy pozycjami a wynikami ogólnymi w skali.

W celu obliczenia tak budowanych współczynników rzetelno ci stosuje si wzory zaproponowane


przez Spearmana i Browna lub Gulliksena.

ródłem bł du jest dobór tre ci itemów.

Wzory „prorocze” Spearmana i Browna


Pozwalaj na okre lenie rzetelno ci testu n-krotnie wydłu onego, przy zało eniu e dodane pytania
s tak samo dobre jak zadania w wersji przed przedłu eniem.

n – wielko przedłu enia testu,


rtt – rzetelno testu przed przedłu eniem,
rttn – rzetelno testu po n-krotnym przedłu eniu.

Powy szy wzór mo na przekształci , aby okre lał krotno przedłu enia testu niezb dn do
osi gni cia danej warto ci współczynnika rzetelno ci.

rttn – po dana rzetelno testu po n-krotnym wydłu eniu,


rtt – pierwotna rzetelno testu.
19















































































Ocena stopnia zgodno ci s dziów kompetentnych
Metoda stosowana niezbyt cz sto, zazwyczaj w przypadku narz dzi, gdzie odpowiedzi osoby
badanej podlegaj „swobodnej” ocenie diagnosty.

W celu oceny zgodno ci kilku zestawów ocen tego samego materiału, dokonanych przez kilku
niezale nie pracuj cych diagnostów – s dziów kompetentnych oblicza si np. współczynnik
zgodno ci s dziów W-Kendalla.

ródłem wariancji bł du mog by niedostatki pracy diagnostów lub niedostatki klucza według
którego dokonywane s oceny.

Czynniki wpływaj ce na rzetelno pomiaru


Na rzetelno testu wpływaj cztery czynniki:
- długo testu (ilo pyta w te cie)
- jako pyta (wielko wska nika mocy dyskryminacyjnej)
- homogeniczno mierzonej zmiennej
- zakres mierzonych wielko ci.

Wydłu anie testu powoduje wzrost rzetelno ci, skracanie obni enie rzetelno ci (por. „wzory
prorocze” Spearmana i Browna).

Rzetelno buduj dobre pytania. Im lepsze charakterystyki pyta (np. pytania opisywane s przez
wysokie warto ci mocy dyskryminacyjnych) tym bardziej rzetelna skala.

Pytania o zerowych mocach dyskryminacyjnych (nie ró nicuj ce osób badanych) obni aj


rzetelno testu.

Trafno rozumiana jest najcz ciej, jako:


stopie , w jakim test mierzy cech , któr ma mierzy , obszar pomiaru cechy psychologicznej
– innymi słowy – „czy test inteligencji mierzy inteligencj ”

1. stopie dokładno ci przewidywania okre lonych kryteriów zewn trznych

2. mo liwo opisu zachowa pozatestowych na podstawie badania testem

„Czy test inteligencji pozwala przewidywa inteligentne zachowania w yciu osoby badanej, albo
zachowania, które mog wymaga inteligencji”.

Druga z wymienionych cech – czyli mo liwo opisu zachowa pozatestowych na podstawie


badania testem okre laj cych trafno jest wa niejsza

Tak rozumiana trafno jest najwa niejsz własno ci testu z punktu widzenia psychologa.

Celem wszystkich diagnoz jest opis lub przewidywanie funkcjonowania osoby badanej w „realnym
yciu”.

Informacja o trafno ci okre la nie tylko status – „dobro ” pomiarow – narz dzia, ale tak e stanowi
wskazówki interpretacyjne dla diagnosty, co w szerszym kontek cie jest realizacj postulatu
budowy diagnozy bazuj cej na dowodach empirycznych.
20




































































































Trafno a rzetelno pomiaru
Rzetelno jest podstaw – warunkiem koniecznym trafno ci. Rzetelno stanowi zarazem górn
granic trafno ci. Jest niemo liwe, aby trafno była wi ksza od rzetelno ci.

Testy o du ej trafno ci pomiaru s zarazem bardzo rzetelne.

Jednak ta zale no nie jest odwrotna, tzn. wysoka rzetelno nie gwarantuje trafno ci (nie jest
warunkiem wystarczaj cym)

Rodzaje trafno ci
W podr cznikach psychometrii wymienia si trzy rodzaje trafno ci:
• teoretyczn (ang. construct),
• kryterialn (diagnostyczn , prognostyczn ),
• tre ciow (wewn trzn ).

Wymieniana niekiedy jest tak e pseudo-trafno : trafno fasadowa

Pami ta nale y o tym, i s to przede wszystkim aspekty trafno ci, którym odpowiadaj techniki
walidowania (tj. badania trafno ci) testów.

Jedna trafno , która przejawia si w swoich 3 aspektach, którym odpowiadaj okre lone metody
badania trafno ci.

Trafno tre ciowa


zakres, w jakim pozycje testowe reprezentuj uniwersum pozycji testowych (czy te zachowa
zwi zanych z cech ); stopie w jakim pozycje testowe stanowi reprezentatywn próbk zachowa

Jest jedynym aspektem trafno ci, który nie mo e by okre lany w badaniach empirycznych.

Badanie trafno ci tre ciowej sprowadza si do oceny (procedura s dziów kompetentnych) – czy
wska niki spełniaj kryteria definicyjne cech.

Mo na mówi o trafno ci tre ciowej pojedynczej pozycji.

Pozycje testowe o du ej trafno ci tre ciowej charakteryzuje dobra charakterystyka


psychometryczna – s one tzw. osiowymi wska nikami danej cechy.

Trafno tre ciowa jest koniecznym, cho niewystarczaj cym warunkiem innych rodzajów
trafno ci.

Wi kszo podr czników uto samia trafno tre ciow i trafno wewn trzn , ten rodzaj trafno ci
mo e by jednak rozumiany bardziej ogólnie – jako stopie w jakim posta narz dzia odpowiada
koncepcji zało onej przez konstruktora testu.

21





















































































































Trafno kryterialna
stopie w jakim test koreluje z okre lonym (nietestowym) kryterium zewn trznym np. czy wynik w
te cie inteligencji pozwala przewidywa redni ocen szkolnych (kryterium zewn trzne)

Trafność prognostyczna + Trafność diagnostyczna = Trafność kryterialna

Trafno diagnostyczna jest warunkiem koniecznym, ale nie wystarczaj cym trafno ci
prognostycznej – testy prognostyczne musz diagnozowa , ale diagnozowanie nie gwarantuje
prognozowania.

Okre lenie zewn trznego wobec testu kryterium i jego własno ci jest kluczow i trudn kwesti w
badaniach trafno ci kryterialnej.

Standardowe post powanie zakłada prowadzenie bada zgodnie z tak procedur , która pozwala na
okre lenie rzetelno ci kryterium np. w przypadku diagnoz klinicznych nie mo e by to pojedyncza
diagnoza tylko zestaw diagnoz sporz dzonych przez niezale nie pracuj cych diagnostów, których
zgodno badamy (procedura s dziów kompetentnych)

Technikami analizy danych w badaniach trafno ci kryterialnej s techniki korelacyjne.

W przypadku zastosowania zestawu (baterii) testów do przewidywania (predykcji) kryterium,


dobr strategi jest u ycie analizy regresji lub analizy dyskryminacyjnej – w celu opracowania
baterii testów (predyktorów) o wysokiej trafno ci i niskiej redundancji pomiarowej.

Zestaw testów musi w jak najwy szym stopniu pozwala przewidzie kryterium, ale testy b d ce
predyktorami nie powinny korelowa mi dzy sob .

Ocena współczynników trafno ci kryterialnej mo e by korygowana ze wzgl du na nierzetelno


kryterium - (poprawka na nierzetelno ) nierzetelno testu

W przypadku estymacji wyników kryterium na podstawie testu, stosowanej w celu selekcji osób
badanych, pami ta nale y o estymacji przedziału ufno ci uwzgl dniaj cego standardowy bł d
estymacji kryterium.

Trafno kryterialna nie jest własno ci stał .

B dzie zmienia si w wyniku ograniczania zmienno ci kryterium, lub zmienno ci mi dzy osobami
badanymi testem. Np. Je li b dziemy wi za oceny szkolne ogółu uczniów z wynikami testu
inteligencji to uzyskamy umiarkowan korelacj . Taka sama korelacja obliczona dla osób
najinteligentniejszych b dzie nieistotna, gdy o ró nicach ocen szkolnych tych osób b d
decydowa inne zmienne.

22



























































































Warto współczynnika trafno ci kryterialnej mo e by tak e efektem czynników losowych, wa ne
jest stosowanie tzw. walidacji krzy owej

Polega to na opracowaniu reguły przewidywania kryterium na podstawie testu b d testów na


podstawie danych z jednej próby i testowanie efektywno ci takiej reguły na innych danych.

Poprawka na nierzetelno
Mo liwe jest obliczanie współczynników trafno ci, których warto b dzie skorygowana ze
wzgl du na nierzetelno zarówno testu, jak i zewn trznego kryterium.

Estymowana ocena zwi zku mi dzy zmiennymi b dzie odpowiada takiej warto ci korelacji – jak
uzyskaliby my stosuj c doskonale rzetelny test i doskonale rzetelne kryterium

Trafno teoretyczna
rodzaj trafno ci, który wiadczy o zgodno ci zmiennej mierzonej przez test z konstruktem
teoretycznym.

Badanie trafno ci teoretycznej oznacza identyfikacj „tre ci psychologicznej” mierzonej przez test

W odró nieniu od trafno ci kryterialnej, istot trafno ci teoretycznej jest mo liwo przewidywania
kryteriów psychologicznych, a nie kryteriów „pozatestowych”

w praktyce ocena trafno ci teoretycznej polega na prowadzeniu bada , w których weryfikowane s


twierdzenia teoretyczne, w sytuacji skrajnej badania takie mog prowadzi nawet do modyfikacji
teorii

W psychometrii wypracowano szereg metod badania trafno ci teoretycznej, mo na podzieli je na


dwie grupy:
• metody analizuj ce zwi zki mi dzy konstruktem a zachowaniem oraz
• metody, gdzie w ró noraki sposób prowadzone analizy danych korelacyjnych

23

























































Metody analizy danych korelacyjnych

Analiza macierzy korelacji


W metodzie badania wewn trznej struktury testu w najprostszym przypadku testowane s zwi zki
mi dzy skalami w te cie, lub podskalami a skal ogóln . badana jest tzw. trafno czynnikowa
oparta na analizie czynnikowej.

Metoda analizy korelacji testu walidowanego i innych testów w uproszczonej formie polega na
analizie korelacji walidowanego testu z grup narz dzi mierz cych t sam zmienn i/lub korelacji
z innymi kryteriami, w postaci bardziej zaawansowanej odwołuje si do analizy czynnikowej
prowadzonej na skalach zestawu narz dzi diagnostycznych.

Metoda wielu cech – wielu metod Campbella i Fiskego


jest najbardziej zaawansowan formalnie technik analizy macierzy korelacji, mo liwe jest
stosowanie „uproszczonej formy” tego paradygmatu odwołuje si do pomiaru co najmniej dwu lub
wi cej niezale nych cech za pomoc dwu niezale nych metod aby dany test uzna za trafny nale y
wykaza zarówno trafno zbie n (konwergentn ), jak i trafno ró nicow (dyksryminatywn ).

Skala ma korelowa z innym pomiarem podobnej zmiennej (aspekt konwergentny), ale nie powinna
korelowa z miarami innych zmiennych i innymi skalami wewn trz tej samej metody (aspekt
dyskryminatywny).

Dopiero spełnienie tych dwu warunków ł cznie w pełni wiadczy o trafno ci skali.

24












































Trafność fasadowa
dotyczy wygl du testu, wra enia odnosz cego si do przeznaczenia testu jakie wywiera na osobach
badanych

Kwestionariusze, które charakteryzuje wysoka trafno fasadowa (łatwo odgadn co mierzy test)
s szczególnie podatne na zniekształcenia.

Ze wzgl du na ten efekt w przypadku niektórych testów, szczególnie z obszaru psychologii


klinicznej, cel badania bywa maskowany np. poprzez:
• nadanie odpowiedniej nazwy (tytułu) kwestionariusza,
• umieszczenie pyta buforowych
• dodanie pyta z inwersj odpowiedzi (nie wprost).

Z drugiej strony, budz ca zaufanie posta testu (tj. test wygl da jak test psychologiczny a nie
psychozabawa) mo e pełni istotn rol w budowaniu pozytywnego stosunku osoby badanej do
sytuacji, w której test jest stosowany, jak i do diagnozy oraz osoby psychologa.

Norma psychometryczna
jest to standard ilo ciowy, wyznaczony przez liczb osób uzyskuj cych dane wyniki lub przez
redni obliczon dla przedstawicieli danej grupy.

Normalizacja testu polega opracowaniu procedury przekształcania wyników liczbowych


(surowych/ inaczej otrzymanych/ obliczonych), uzyskanych przez osob badan w wyniki
ró nicowe, umo liwiaj ce lokalizacj cechy danej osoby na tle reprezentatywnej populacji.

Norma nie oznacza standardu „dobrego” wykonania testu,

Norma opisuje poziom typowego wykonania testu przez osoby (osob ) nale ce do danej badanej
grupy

Wykorzystuje si w tym celu standardowe jednostki z (standaryzacja wyniku otrzymanego)

Standaryzacja
przekształcenie zmiennej, w wyniku którego otrzymujemy rozkład o średniej zero (M=0) i
odchyleniu standardowym równym jeden (s=1).

polega na zamianie wyników surowych na wyniki standaryzowane

wymaga obliczenia średniej i odchylenia standardowego więc można standaryzować jedynie


zmienne mierzone na skalach ilościowych

Wynik wystandaryzowany
wartość zmiennej wyrażona w odchyleniach standardowych

25




































Psychologiczne testy standaryzowane
• zawierają instrukcję przeprowadzenia testu;
• klucz - zasady wg których ocenia się poszczególne odpowiedzi i interpretuje wyniki

Interpretacja wyników surowych wymaga przeliczenia na pozycję w skali znormalizowanej


(standardowej)

Normy typu standardowego:


• Steny
• Staniny
• Skala ilorazu inteligencji IQ
• Skala T (teny)
• Tetrony

Warto ci w standardowych jednostkach oblicza si stosuj c wzoru:


warto standardowej jednostki = z * SD + M
SD – odchylenie standardowe w danej skali M – rednia dla danej skali
26






Normalizacja
jedno z poj w psychometrii dotycz ce procesu porz dkowania wyników uzyskanych z badania
danym testem

odpowiednio przeprowadzony proces oblicze statystycznych polegaj cych na ustaleniu zale no ci

mi dzy wynikami otrzymanymi za pomoc danego narz dzia ( testu psychologicznego) a wynikami
rednimi w danej próbie badawczej

Grupa normalizacyjna to
• grupa osób, której wyniki testu maj zastosowanie dla budowy norm dla testu
• grupa osób uczestnicz cych w badaniach normalizacyjnych
• grupa reprezentatywna dla populacji, do której test jest adresowany

Jak buduje si normy


Normy buduje si bazuj c na wynikach pozyskanych za pomoc narz dzia, dla którego normy
przygotowujemy.

Próba w takich badaniach powinna by reprezentatywna dla populacji, dla której tworzymy normy,
zatem mo liwie liczna, najlepiej je li posługujemy si kwotowym, b d losowym doborem próby.

Istotn jest kwestia okre lenia populacji dla której budujemy normy. (np. normy dla wieku; płci;
zawodów)

Standardem powinno by wyodr bnianie subpopulacji ze wzgl du na zmienne demograficzne, je li


zmienne te ró nicuj wyniki surowe w te cie.

Np. je li w zakresie neurotyzmu mierzonego danym testem wyst puj ró nice mi dzy kobietami i
mężczyznami to nale y przygotowa odr bne normy dla kobiet i odr bne dla m czyzn.

W tabeli zaprezentowany jest w sposób w jaki buduje si normy, tj. wynikom surowym WS
otrzymanych na podstawie bada przypisywane s warto ci jednostek standardowych.

Kolejne kroki
1. obliczamy liczebno (czyli ile razy wyst piła dana warto wyniku testu w badanej grupie) oraz
liczebno skumulowan
2. stosujemy poprawk na nieci gło skali,
3. wynik ten dzielony jest przez liczebno próby N, aby uzyska prawdopodobie stwo uzyskania
danego b d mniejszego wyniku surowego.
4. tak wyznaczon warto prawdopodobie stwa odnosimy do dystrybuanty krzywej Gaussa, aby
wyznaczy warto statystyki z, czyli wielko odchylenia od redniej
5. nast pnie stosuj c odpowiednie dla danej skali standardowej parametry wyznaczamy jej warto ci
odpowiadaj ce danym wynikom surowym.

27

















































































Jak wybra jednostk podczas normalizacji testu?
O wyborze jednostki standardowej podczas normalizacji testu decyduj :
• zakres mierzonych wielko ci,
• przeznaczenie testu (pomiar cech osobowo ci, inteligencji)
• czy zakładamy normalno rozkładu mierzonej zmiennej

Przedstawione jednostki standardowe ró ni si nie tylko parametrami, ale tak e własno ciami.

Bior c te ró nice pod uwag nale y dokonywa wyboru jednostki podczas normalizacji testu.

Pierwsza decyzja badacza dotyczy tego, czy zakłada si normalno diagnozowanej zmiennej.
Je li tak, mo e wtedy wybra jednostki bazuj ce na rozkładzie normalnym.

Je li nie, to badacz powinien zastosowa centyle.

Je eli zakładamy normalno rozkładu to kluczow kwesti jest to jak zmienn mierzymy oraz to
jaki zakres maj wyniki surowe.

Je li zakres wyników surowych jest mały to nie ma potrzeby stosowa jednostek standardowych,
które maj wiele warto ci (IQ, skala T) Stosujemy wtedy steny (1-10) , b d staniny (1-9).

Decyduj c si na steny, b d staniny kierujemy si tym, e: steny lepiej opisuj kra ce a staniny
rodek rozkładu.

Na ogół testy inteligencji w takiej sytuacji s normalizowane przy u yciu stanin, a kwestionariusze
osobowo ci przy u yciu stenów.

Zarówno jednak steny i staniny, które s czułe w zakresie ok. +/-2s, a tak e tetrony (ok. +/-2,5s) nie
pozwalaj ró nicowa w zakresach skrajnych np. w sytuacjach klinicznych.

Je eli chcemy opisywa wyniki skrajnie oddalone od redniej populacyjnej wskazane jest
stosowanie Tenów (1-100), b d w przypadku inteligencji ilorazu inteligencji (0-200).
28































































Jednostki norm oparte na rozkładzie prostok tnym
Najcz ciej stosowanymi jednostkami opartymi na rozkładzie prostok tnym s centyle i decyle.
Obie te jednostki s kwantylami.
Kwantyl umo liwia podział populacji lub zbioru jednostek na okre lone cz ci (setne, dziesi tne,
wiartki, połówki itp.) z uwagi na warto analizowanej zmiennej.
Centyle (cz ci setne) mówi jaki odsetek populacji osi ga dany wynik lub ni szy.
Osoba, której wynik równy jest 80. centylowi wykonała test lepiej ni 80% badanych w danej
próbie.
Np. Je eli wynikowi surowemu 8 punktów odpowiada 13 centyl oznacza to, e wyniki od 1 do 8
punktów uzyskało 13% osób badanych. Natomiast 9 i wi cej punktów uzyskało pozostałe 87%.
Zarówno w przypadku centyli, jak i innych kwantyli mówimy, e bazuj na rozkładzie
prostok tnym, czyli równo prawdopodobnym;
S to jednostki w przypadku których nie przyjmujemy zało e co do rozkładu mierzonej zmiennej.
Centyle stosuje si szczególnie wtedy, gdy zakładamy, zmienna nie ma rozkładu normalnego, b d
uzyskany rozkład empiryczny jest skrajnie sko ny, b d kurtyczny.

Standaryzacja
Standaryzacja testu to ujednolicony sposób posługiwania si testem
W szerszym znaczeniu, standaryzacja to ujednolicony ogół czynno ci zwi zanych z prowadzeniem
badania i opracowywaniem wyniku
Standaryzacja ma na celu minimalizowanie wpływu czynników zakłócaj cych pomiar, b d cych
efektem:
– post powania osoby prowadz cej badanie
– warunków, w jakich badanie jest przeprowadzane

Procedura standaryzacji
Dotyczy sytuacji
• badania testem
- zasady ogólne
- instrukcja
- pomoce
• obliczania wyników
- klucz odpowiedzi
- obliczanie, sprawdzanie, kodowanie wyników
• interpretowania wyników
- reguły
- normy
Dobrze wystandaryzowany test składa si z: instrukcji dla osoby badanej, okre lonego materiału
testowego, klucza – zasad oceny wyników, reguł interpretacji wyniku.

29













































30
Konsekwencje odst pstw od procedury standaryzacji:
• zmiana własno ci testu - przede wszystkim obiektywno ci
• trudno ci w ustaleniu rzetelno ci i trafno ci testu
• uzasadnione w tpliwo ci odnoszenia uzyskanych wyników do norm
• zastrze enia odno nie stosowania testów w praktyce diagnostycznej, jak i powstałych na ich
podstawie diagnoz

Standaryzacja procedury badawczej ujednolica warunki badania (pozornie) dla psychologicznie


zró nicowanych osób badanych, jednocze nie stawiaj c osoby badane w faktycznie ró nych
sytuacjach

Obiektywno
Opracowanie procedury interpretacji wyników badania testem, aby stosowanie jej było za ka dym
razem identyczne, niezale ne od osoby badaj cej

Obiektywno ma na celu
• zminimalizowanie wpływu osoby przeprowadzaj cej test na wyniki
• zagwarantowa , e ró ne osoby badaj ce dokonaj identycznej oceny wyników danej osoba
badanej

Obiektywno jest konsekwencj standaryzacji

Komputerowe wersje testów


Komputerowe wersje testów psychologicznych wymagaj specjalnych elementów procedury
standaryzacyjnej np. dotycz cych jako ci obrazu
Wa ne jest tak e, aby sprawdzi do wiadczenie osoby badanej w obszarze obsługi komputera

Komputerowe wersje testów


• wykazuj korzystn charakterystyk psychometryczn ,
• na ogół s mniej podatne na zniekształcenia ni ich odpowiedniki w wersji „papier-ołówek”
• pozwalaj na rejestracj szeregu parametrów odpowiedzi, niedost pnych w badaniu tradycyjnym
• Umo liwiaj wprowadzanie nowych procedur testowych w postaci testów „dynamicznych”, w
których program decyduje o kolejno ci zadawanych pyta , tak aby diagnoza – o wysokich
własno ciach psychometrycznych – mogła by postawiona za pomoc mo liwie małego zestawu
zada testowych

Adaptacja kulturowa testu


oznacza legalne - z poszanowaniem prawa autorskiego w tym za wiedz i zgod autora/ autorów
testu zagranicznego zapo yczenie testu z kraju, w którym był skonstruowany i opracowywanie go
w taki sposób, aby nadal był trafnym i rzetelnym narz dziem diagnozy psychologicznej w innym
kraju dla innych warunków kulturowych

31



























































Proces przystosowania wersji oryginalnej testu do innej specyfiki kulturowej polega na
zastosowaniu specjalnych procedur przystosowuj cych i nie sprowadza si tylko do
przetłumaczenia oryginału tekstu
Od strony badawczej proces adaptacji przypomina proces konstrukcji nowego narz dzia
Prowadzone s analizy itemmetryczne, badania słu ce ustaleniu rzetelno ci i trafno ci nowego
narz dzia, przygotowuje si nowe normy

Strategie adaptacji kulturowej testu


• Transkrypcja - tłumaczenie zakładaj ce maksymaln wierno tre ci i formy;
• Translacja - przekład dopuszczający modyfikacje, tam gdzie ”dosłowne” tłumaczenie jest
niemożliwe
• Trawestacja - tłumaczenie dopuszczające dalej idące modyfikacje
• Rekonstrukcja - budowa testu bazująca na nowym materiale testowym zgodnie jednak z
procedurą konstrukcji oryginału
• Parafraza - opracowanie zupełnie nowego testu, jedynie inspirowanego testem zagranicznym

Metody sprawdzania tłumaczenia


Je eli adaptacja bazuje na tłumaczeniu materiału oryginalnego konieczne jest sprawdzenie
tłumaczenia.
Najcz ciej stosowane jest:
• tłumaczenie zwrotne,
• badania na grupie dwuj zycznej.
Tłumaczenie zwrotne (back translation) – w metodzie tłumacz nie znaj cy oryginalnej wersji testu
dokonuje przekładu zwrotnego tłumaczenia na j zyk oryginału
Przekład ten jest porównywany z oryginałem testu Dobrym pomysłem jest, aby oceny tej
dokonywał autor oryginału.
Badanie na grupie dwuj zycznej (tzw. badania bilingwalne). Osoby dwuj zyczne wypełniaj wersj
oryginaln i tłumaczenie testu – tak jak „zwykłe osoby badane” –

32


























Je eli tłumaczenie jest poprawne, osoby badane w obu wersjach powinny wybiera takie same
odpowiedzi.
Do pewnego stopnia tak prowadzone badanie przypomina badanie stabilno ci
Mo liwe jest obliczanie statystyk opisuj cych zgodno wersji, zarówno dla skal, jak i
pojedynczych pyta – jest to zalet tej metody.

Wybrane kryteria równowa no ci i wierno ci oryginałowi


Ocena równowa no ci powinna dotyczy co najmniej trzech aspektów:
• Równowa no fasadowa - adaptacja i oryginał maj podobn form graficzn testu, podobn
liczb i kolejno pyta , podobna jest tak e liczba i sformułowanie kategorii odpowiedzi.
• Równowa no psychometryczna - podobne: moc dyskryminacyjna pyta , rzetelno skal,
korelacje z innymi testami, wyst puje równo rednich i wariancji skal.
• Równowa no funkcjonalna - test mierzy t sam zmienn , jest odporny na oddziaływanie
tych samych zmiennych zakłócaj cych, mo e mie podobne zastosowania.

Ocena procesu adaptacji


Proces adaptacji mo e by oceniany z perspektywy wierno ci oryginałowi testu.
Ocenia si :
• Wierno tłumaczenia – porównuje si np.: podobie stwo tre ci pyta i ich leksykalne
podobie stwo, a tak e stopie trudno ci u ytego j zyka.
• Wierno rekonstrukcji – porównuje si np.: powtórzenie etapów konstrukcji, podobie stwo
technik oceny psychometrycznej, podobie stwo post powania badawczego.

33




































































You might also like