Professional Documents
Culture Documents
Psychometria Wykład
Psychometria Wykład
Cechy psychologiczne:
• (konstrukty teoretyczne) - nie s bezpo rednio obserwowalne a zanim b d mogły zosta
wyra one ilo ciowo, wymagaj najpierw operacyjnego zdefiniowania (s bezpo rednio
nieobserwowalne)
• zasady okre lania stopnia stronniczo ci wyników testowych wzgl dem okre lonej grupy
społecznej
1
ś
ę
ż
ą
ą
ą
ś
ś
ę
ę
ś
ś
ś
ą
ś
ż
ą
ą
ż
ś
ę
ć
ę
ą
ę
ą
ż
ą
ś
ę
ś
ś
ą
ę
ą
ę
ń
ś
ą
ą
ś
ę
ć
ć
ę
ą
ą
ą
ż
ę
ą
ę
ń
ą
ą
ż
ś
ę
ę
ą
ą
ą
ż
ę
ś
ć
ę
ą
ś
ś
ś
ą
ś
ć
5 zasad - charakterystyk pomiaru cech psychologicznych:
Test psychologiczny:
• „Testy to zbiory pyta lub sytuacje, słu ce do badania własno ci jednostek lub grup ludzkich
przez wywoływanie u nich okre lonych obserwowalnych reakcji werbalnych lub niewerbalnych,
b d cych w miar mo no ci reprezentatywnymi próbkami ich zachowania si ”
• Jest to narz dzie obiektywne, wystandaryzowane, trafne, rzetelne, znormalizowane, wyposa one
w reguły obliczania mierzonej cechy psychologicznej oraz jasno okre laj ce zakres i rodzaj
dopuszczalnych zachowa ze strony diagnosty.
• Badanie testowe to taka sytuacja, w której osoba badana uczestniczy dobrowolnie i wiadomie
celu jakim jest ocena jej psychologicznych cech
2
ę
ą
Ż
ż
ą
ś
ź
ę
ę
ż
ą
ą
ę
ć
ś
ą
ż
ń
ę
ś
ń
ś
ą
ś
ś
ą
ć
ą
ż
ą
ż
ś
ś
ń
ż
ę
ż
ć
ć
ś
ś
ż
ę
ą
ś
ą
ę
ę
ś
ń
ą
ń
ń
ś
ś
ć
ę
ą
ę
ż
ą
ń
ń
ń
ś
ś
ć
ż
ć
ż
ą
ę
ć
ą
Cele stosowania testów psychologicznych:
1. Diagnozowanie – osób lub grup osób - Jakie rodzaje oddziaływa psychologicznych
(edukacyjnych, terapeutycznych) b d pomocne w odniesieniu do danej osoby/ grupy w celu
zapewnienia wła ciwego rozwoju, rozwi zania konfliktów, poprawy zdrowia psychicznego
• Trafność - czyli obszar zastosowania testu; trafno : to informacja o tym, jak test pełni swoj
funkcj , to okre lenie czy test mierzy to co ma mierzy , oznacza co mo na poprawnie
wywnioskowa na podstawie wyniku testowego
• Obiektywność - czyli niezale no wyników testowania. Test jest obiektywny, je eli dwie ró ne
osoby opracowuj jego wyniki otrzymuj ten sam rezultatu. Aby było to mo liwe, test musi
posiada jasno okre lony klucz oceniania odpowiedzi, zmniejszaj cy do minimum wpływ
subiektywnych interpretacji.
• Standaryzacja - czyli jednolito warunków badania. Aby wyniki danego testu mo na było ze
sob porównywa , dany test powinien by zawsze przeprowadzany w identycznych warunkach.
Tylko wtedy ró nice w wynikach testowych badanych osób mo na przypisa czynnikom
indywidualnym, a nie np. zewn trznym warunkom badania.
3
ż
ą
ś
ę
ć
ą
ś
ć
ś
ż
ć
ś
ą
ś
ś
ę
ś
ż
ć
ż
ż
ę
ś
ą
ć
ś
ć
ę
ą
ą
ą
ć
ą
ą
ś
ć
ć
ę
ę
ć
ć
ż
ą
ę
ś
ś
ć
ć
ż
ń
ż
ż
ż
ć
ż
ć
ś
ć
ś
ę
ś
ż
ą
Rodzaje testów psychologicznych
Testy psychologiczne - wspólne wła ciwo ci psychometryczne ale bardzo zró nicowana
wewn trzne grupa narz dzi do pomiaru cech psychologicznych, którymi posługuj si psycholodzy
(grupa testów A, B, C) oraz inni specjali ci po realizacji szkolenia z zakresu psychometrii (grupa
testów A, B)
Kryteria podziału:
- Przedmiot pomiaru
- Ilo osób do bada
- Materiał na jakim test jest zrealizowany (materiał testowy)
• Cechy intelektualne (inteligencja; zdolno ci) - (narz dzia nazywane testami) (np. Test Matryc
Ravena)
- badany wykonuje specyficzne zadania zwi zane z ocen jego intelektu (matematyczne;
werbalne; abstrakcyjno-logiczne; sprawno ci psychomotorycznych)
- w te cie jest dobra (poprawna) tylko jedna odpowied , która jest zgodna z kluczem i jest
diagnostyczna
- pytanie/ zadanie ocenia czy badany rozwi zał dany problem czy nie
testy inteligencji
• testy szybko ci
- zło one z wielu zada o takiej samej lub podobnej trudno ci
- zadania s łatwe i ich wykonanie le y w granicach mo liwo ci badanego
- czasowe ograniczenie wykonania testu
- wa na jest ilo rozwi zanych zada w wyznaczonym czasie
- sprawno intelektualna jako szybko efektywnej pracy intelektualnej
• testy mocy
- wa na jest poprawno rozwi zania
- zadania zró nicowane i wraz z post pem rozwi zywania wzrasta ich trudno , a
- badany dochodzi do takiego zadania, którego ju nie mo e rozwi za
4
ą
ś
ż
ż
ż
ż
ć
ś
ę
ś
ą
ć
ż
ś
ś
ć
ś
ń
ń
ś
ć
ą
ś
ę
ą
ę
ż
ę
ń
ś
ć
ą
ś
ś
ś
ś
ą
ś
ć
ą
ż
ś
ą
ę
ż
ź
ż
ś
ś
ą
ą
ż
ć
ę
ś
ć
ą
ę
ż
ś
2. Kryterium ilo osób badanych
• indywidualne
- tylko jedna osoba badana w danym czasie
- nawi zanie indywidualnego kontaktu z badanym w tym mo liwo uzupełniania arkusza
pyta z badanym
- wa na procedura badania, kolejno zadawanych pyta
- mo liwo wł czenia pyta otwartych do testu
- czasochłonne
- dokładna analiza, wszechstronna diagnoza w zakresie badanej cechy (np. MMPI; WISC)
• grupowe
- prosty sposób badania - podanie instrukcji i samodzielne uzupełnianie przez badanego arkusza
testowego
- brak indywidualnego kontaktu z badanym
- głównie stosowanie pyta zamkni te
- uproszczony format odpowiedzi
Analizy itemmetryczne
W psychometrii s trzy ró ne strategie konstrukcji testów powstały one w trakcie rozwoju pomiaru
psychologicznego
- teoretyczna
- wewn trzna
- zewn trzna
W ramach ka dej z nich stosuje si inne techniki analizy danych zorientowane na badanie własno ci
pozycji testowych (pyta , zada testowych), tzw. analizy itemmetryczne (od ang. item)
5
ż
ż
ń
ą
ę
ę
ś
ć
ż
ą
ś
ą
ć
ń
ń
ż
ń
ń
ę
ę
ś
ć
ń
ż
ś
ć
ś
Test nigdy nie powstaje poprzez napisanie „od razu” finalnego zestawu pyta
Tworzone s tzw. „pule wyj ciowe” itemów, które pó niej s oceniane przez ekspertów (s dziowie
kompetentni) np. ze wzgl du na trafno tre ciow itemów.
Pytania, które uzyskały najwy sze oceny ekspertów słu budowie tzw. eksperymentalnych wersji
narz dzi diagnostycznych za pomoc których prowadzi si badania stanowi ce ródło danych do
analiz itemmetrycznych.
Pozycja testowa
Pozycja testowa, (ang. item) to sformalizowany wska nik danej cechy psychologicznej, zdanie,
twierdzenie lub pytanie opisuj ce okre lone zachowanie (lub zdanie wyzwalaj ce okre lone
zachowanie) oraz skala rejestruj ca to zachowanie (zawieraj ca okre lone opcje odpowiedzi o
danym formacie) oraz reguła przekształcania odpowiedzi w wynik liczbowy
WA NE!!!
Pozycj testow tworzy nie tylko tre pytania (zadania), ale tak e format odpowiedzi – wielko
zestawu opcji lub wersji odpowiedzi, liczba kategorii odpowiedzi oferowanych osobie badanej do
wyboru
Rys historyczny
pozwala łatwiej zrozumie ró nice mi dzy strategiami konstrukcji
Jako pierwsz wypracowano strategi teoretyczn (dedukcyjn )
W strategii tej z góry (z mocy teorii) zdefiniowane jest jakie zmienne b dzie mierzył test. Wobec
tak tworzonych narz dzi formułowano krytyk , która ogniskowała si wokół dwu problemów.
Rozwi zaniem problemu było powstanie strategii wewn trznej (indukcyjnej) czyli budowa narz dzi
ci le w oparciu o empiri i zastosowanie analizy czynnikowej do analizy danych
Rozwi zaniem strategie zewn trzne - odrzucenie teorii i oparcie si na tylko na empirii, przy czym
dane zbierano na specyficznych (np. klinicznych) grupach szukaj c wska ników (kryteriów)
pozwalaj cych na ró nicowanie mi dzy specyficznymi grupami (np. zdrowi vs. chorzy).
Współcze nie cz sto stosuje si tzw. strategie kombinowane, które z ka dego z trzech klasycznych
podej bior to co najlepsze.
Trzy klasyczne strategie konstruowania testów i zwi zane z nimi techniki analizy wła ciwo ci
pozycji testowych zostan omówione oddzielnie
6
ś
ę
ś
Ż
ę
ę
ę
ś
ą
ą
ć
ę
ą
ś
ą
ą
ż
ą
ą
ę
ę
ż
ę
ą
ę
ć
ą
ś
ż
ę
ą
ż
ę
ą
ę
ę
ą
ę
ę
ą
ś
ś
ę
ć
ś
ś
ć
ć
ś
ś
ę
ą
ą
ą
ź
ą
ę
ź
ż
ą
ę
ą
ą
ą
ż
ę
ę
ą
ż
ś
ę
ń
ą
ę
ź
ź
ą
ę
ś
ś
ę
ś
ś
ć
1. Strategia teoretyczna (dedukcyjna)
• opiera si na teorii psychologicznej,
• celem konstrukcji jest pomiar cech postulowanych przez teori
Kluczowym etapem konstrukcji jest tu analiza definicji cech zmiennych na podstawie których
generuje si propozycje itemów do puli badawczej.
Najprostsza miara pozwalaj ca podj decyzje o tym, które pozycje testowe mog wej do
ostatecznej puli testu.
Jest stosowany zazwyczaj do testów wiedzy, testów właściwości poznawczych. Zazwyczaj jest
wyrażany jako odsetek osób, które znały prawidłową odpowiedź na pytanie. Im wyższa wartość
wskaźnika T, tym łatwiejsza jest dana pozycja testowa.
Poprawka na zgadywanie
W przypadku testów wiedzy mo liwa jest korekta wyniku otrzymanego poprzez zastosowanie tzw.
poprawki na zgadywanie, obliczanej według wzoru:
7
ę
ś
ć
ś
ę
ć
ź
ę
ę
ą
ę
ś
ę
ą
ś
ć
ź
ą
ę
ą
ć
ą
ż
ę
ż
ś
ź
ą
ć
ę
ś
ę
ż
ś
ć
ę
ż
ą
ź
ś
ć
• Stosowanie poprawki na zgadywanie uzasadnione jest tylko w testach z ograniczeniem
czasowym.
• W przypadku testów mocy, gdzie osoby badane mogą „rozwiązywać" wszystkie zadania
stosowanie poprawki na zgadywanie jest nie daje nic istotnego, ponieważ korelacja wyników
prawidłowych oraz błędów jest idealnie ujemna i poprawka niczego nie wnosi.
• Warunkiem stosowania poprawki na zgadywanie jest taka postać wszystkich zadań, że wszystkie
opcje odpowiedzi są równie atrakcyjne i prawdopodobne.
• Poprawkę na zgadywanie szczególnie warto stosować w przypadku trudnych testów gdvż nasilają
one tendencję do zgadywania
Moc dyskryminacyjna
informuje w jakim stopniu dana pozycja testowa ró nicuje dan populacj , ze wzgl du na mierzon
cech
W rozumieniu operacyjnym jest to korelacja mi dzy pozycj testow a skal ; Obliczanie tych
korelacji wymaga spełnienia specyficznych zało e – jedna z korelowanych zmiennych jest
mierzona na skali nominalnej, druga na przedziałowej
Warto ci mocy dyskryminacyjnych maksymalizuj si dla pyta o przeci tnej trudno ci. moc
dyskryminacyjna niesie t sam informacj co wska nik trudno ci (o stopniu ró nicowania) ale
ró nicowanie to jest „badane” w kontek cie zmiennej mierzonej przez cał skal
Analiza czynnikowa jest metod analizy danych, której istota polega na identyfikacji mniejszej
liczby wymiarów, skupie , czy te czynników w wi kszym zbiorze skorelowanych zmiennych
niezale nych lub te pozycji w narz dziu testowym.
Podobnie jak w przypadku strategii dedukcyjnej przedmiotem pomiaru s cechy, zatem badania
prowadzi si na próbach reprezentatywnych dla populacji.
Kluczowym etapem konstrukcji jest empiryczny dobór wska ników za pomoc analizy
czynnikowej, a kryterium wł czania pytania dla skali jest warto ładunku czynnikowego ( ci le –
warto ci konfiguracji ładunków)
Powstałe w wyniku zastosowania tej strategii skale s oszcz dne (krótkie) i trafne teoretycznie, ich
wad jest ich nadmierna jednorodno i ogólno .
9
ą
ą
ś
ż
ą
ć
ę
ź
ę
ż
ś
ć
ż
ę
ż
ą
ę
ę
ń
ą
ą
ż
ż
ę
ż
ś
ć
ą
ę
ś
ś
ą
ć
ć
ę
ą
ź
ę
ż
ę
ś
ć
ź
ą
ń
ą
ś
ś
Ładunek czynnikowy
• wskazuje na korelacyjny zwi zek mi dzy pytaniem a czynnikiem
• Dla oceny siły zwi zku kluczowa jest warto ładunku czynnikowego, natomiast znak ładunku
(„-”) wskazuje na pytania „nie wprost” wymagaj ce rekodowania
• Przyjmuj si , e warunkiem wł czenia pytania do skali jest warto ładunku > 0,30 (oznacza to
około 10% wspólnej wariancji).
• Zazwyczaj wł czane do skali s pytania maj ce wysokie ładunki jednego z czynników i niskie
pozostałych – mierz ce okre lon a nie inne cechy psychologiczne.
Analiza odwołuje si do danych z prób dobieranych celowo (np. chorzy vs. zdrowi). Kryterium
wł czania pozycji do skali jest korelacja pozycji z zewn trznym kryterium.
Powstałe narz dzia cechuje wysoka trafno kryterialna, cz sto takie testy s nisko rzetelne i
nadmiernie długie.
W strategii zewn trznej rezygnuje si z zało enia o pomiarze cechy. W efekcie korelacje mi dzy
pytaniami nie s oczekiwane Poszukuje si pyta , opisuj cych zachowania ró nicuj ce dwie grupy
osób (np. objawy kliniczne, vs. brak objawów)
Symulacja i dysymulacja
• Dyssymulacja - wiadoma lub nie wiadoma tendencja osoby badanej
do przedstawiania si w korzystnym wietle
Oba terminy maj konotacj kliniczn . W kontek cie kwestionariuszowego badania tzw. zdrowej
osobowo ci u ywa si poj cia potrzeby aprobaty społecznej, b d aprobaty społecznej
10
ą
ę
ś
ę
ś
ę
ż
ą
ę
ż
ą
ś
ę
ę
ą
ę
ą
ą
ą
ę
ę
ę
ę
ę
ś
ą
ś
ą
ą
ą
ś
ę
ś
ś
ę
ą
ę
ś
ć
ż
ś
ą
ć
ą
ń
ś
ę
ą
ź
ą
ę
ź
ś
ć
ż
ą
ą
ę
Aprobata społeczna
Aprobata społeczna rozumiana jest jako tendencja do kierowania si przy odpowiadaniu na pytania
społecznym warto ciowaniem zachowania.
Aprobata społeczna przejawia si w zaprzeczaniu posiadania cech społecznie niepo danych oraz
przypisywaniu sobie cech społecznie po danych.
Style odpowiadania
Styl odpowiadania – tendencja osoby badanej do wybierania okre lonej opcji odpowiedzi
niezale nie od tre ci pytania kwestionariuszowego; tendencja do zgadzania si , do zaprzeczania,
udzielania odpowiedzi przypadkowych („strzelanie”), b d nieuwa nych (opuszczenia).
11
ż
ń
ę
ż
ę
ą
ą
ś
ą
ż
ś
ż
ź
ś
ś
ą
ż
ą
ż
ż
ą
ż
ć
ś
ć
ą
ć
ć
ę
ć
ń
ż
ą
ę
ą
ą
ź
ś
ć
ą
ż
ą
ź
ę
ą
ć
ż
ż
ę
ś
ę
ą
ż
ź
ś
ś
ą
ę
ż
ż
ą
ż
ń
ń
ę
ę
ą
Rzetelność
Takie opracowanie testu (materiału testowego i procedury badania), tak, aby maksymalizował on
dokładno pomiaru cechy badanej przez test psychologiczny
Uwaga !!!
Oszacowanie rzetelno ci w aspekcie: stabilno i zgodno wewn trzna zwi zana jest z
minimalizacj ródeł bł du losowego, konstrukcji testu - jako pozycji testowych,
sytuacji testowania – warunków badania
Dobrze opracowane narz dzie diagnostyczne powinno mie zbadane oba aspekty rzetelno ci
stosownymi metodami.
Tylko takie podej cie do badania rzetelno ci daje pełen obraz rzetelno ci narz dzia – opisuje
niedostatki rzetelno ci wi ce si z tymi ródłami bł du losowego.
Poniewa nie ma takich narz dzi pomiarowych wynik otrzymany jest zawsze zniekształcony
poprzez składow bł du
Je eli wariancja wyników otrzymanych nie bazuje jedynie na bł dzie, mo na oczekiwa , e wyniki
otrzymane i prawdziwe b d skorelowane.
13
ż
ą
ą
ą
ę
ą
ą
ż
ę
ą
ę
ś
ę
ą
ą
ź
ś
ę
ą
ż
ą
ę
ą
ą
ą
ż
ę
ż
ę
ź
ś
ś
ż
ę
ę
ą
ż
ś
ą
ż
ś
ą
ę
ś
ę
ś
ą
ę
ą
ę
ę
ś
ś
ż
ą
ż
ś
ś
ć
ż
Wa ne
Korelacja mi dzy testami równoległymi pozwala na empirycznie podej cie do zwi zku mi dzy tym
co abstrakcyjne (wyniki prawdziwe) a tym co mierzalne (wyniki otrzymane) zast puj c korelacj
mi dzy wynikami prawdziwymi i otrzymanymi korelacj mi dzy dwoma testami.
Kwadrat wska nika rzetelno ci jest proporcj wariancji wyników prawdziwych do wyników
otrzymanych co pozwala sformułowa tzw. logiczn definicj rzetelno ci, a tak e pozwala w wa ny
statystycznie sposób interpretowa warto ci współczynników rzetelno ci.
Jeżeli próbka składa się z osób podobnych do siebie ze względu na mierzona cechę danym testem,
to wariancja wyników prawdziwych jest niewielka.
Wzór pozwala określić zmianę współczynnika rzetelności testu, jeśli stosujemy go do próbki o innej
wariancji całkowitej niż ta dla której został obliczony
14
ś
ę
ż
ś
ś
ć
ś
ć
ę
ź
ę
ą
ż
ś
ć
ś
ć
ę
ś
ś
ż
ć
ś
ć
ć
ż
ś
ć
ą
ę
ą
ć
ś
ś
ą
ą
ę
ż
ę
ę
ż
ś
ś
ś
ś
ć
ż
ą
ę
ą
ę
ą
ż
ę
Interpretacja warto ci współczynników rzetelno ci
rtt > 0,90 bardzo rzetelny pomiar, test mo e by stosowany zarówno w badaniach naukowych, jak i
do formułowania diagnoz indywidualnych
0,90 > rtt > 0,80 rzetelny pomiar, test mo e by stosowany w badaniach naukowych, jak i do
diagnoz indywidualnych, które b d mniej precyzyjne.
0,80 > rtt > 0,70 przeci tna rzetelno , test powinien by stosowany jedynie w badaniach
naukowych
0,70 > rtt > 0,60 niska rzetelno , test mo e by stosowany warunkowo w badaniach naukowych
0,60 > rtt > 0,50 – w tpliwa rzetelno pomiaru, test o bardzo niskiej u yteczno ci klinicznej i
naukowej
Wska nik rzetelno ci testu ma szczególne znaczenie przy ustalaniu podziału uzyskanych wyników
na kategorie opisowe czyli przy sposobie interpretacji.
Przyj ty w psychologii podział na wyniki: bardzo wysokie, wysokie, przeci tne, niskie, bardzo
niskie jest umowny i powinien by dostosowany do wska nika rzetelno ci testu.
Jest to przeci tna warto bł du jaki popełniamy posługuj c si testem o okre lonej rzetelno ci i
okre lonej wariancji wyników surowych.
Łatwo pokaza , e im wy sza warto współczynnika rzetelno ci rtt tym mniejsza warto
standardowego bł du pomiaru.
15
ę
ś
ę
ź
ą
ę
ć
ą
ę
ż
ń
ą
ś
ż
ś
ą
ś
ć
ę
ż
ę
ś
ć
ę
ć
ż
ą
ś
ć
ś
ć
ś
ż
ś
ż
ć
ż
ć
ż
ż
ę
ć
ć
ż
ś
ą
ć
ś
ć
ź
ą
ą
ć
ę
ę
ś
ś
ś
ż
ę
ś
ś
ś
ć
ż
ś
ś
ś
ć
Budowa przedziału ufno ci dla wyniku otrzymanego
Przedział ufno ci dla wyniku otrzymanego pozwala na okre lenie granic, w których – z przyj tym
prawdopodobie stwem – (85%; 90%; 95%; 99%) znajduje si wynik prawdziwy osoby badanej
Diagnoz nale y zawsze budowa za pomoc przedziału ufno ci. Nie mo na odnosi do norm
wyniku otrzymanego
Ogólny wzór na standardowy bł d ró nicy mi dzy dwoma wynikami, uzale nia jego wielko od
warto ci standardowych bł dów pomiaru testów, których wyniki porównujemy:
16
ś
ę
ś
ż
ń
ń
ą
ż
ś
ż
ż
ś
ę
ę
ę
ę
ą
ę
ć
ż
ś
ż
ż
ć
ą
ę
ę
ę
ś
ż
ś
ę
ś
ż
ż
ć
ś
ę
ć
Standardowy bł d estymacji SEE
Lord i Novick zaproponowali inne ni Gulliksen rozumienie standardowego bł du pomiaru
standardowy bł d estymacji SEE ang. – standard error of estimate, charakter którego jest zale ny od
wyniku prawdziwego.
Mimo konceptualnej „wy szo ci” SEE nad SEM - ten rodzaj bł du jest rzadko stosowany do
okre lania przedziałów ufno ci
Jest to post powanie o wiele bardziej skomplikowane obliczeniowo. Przy czym uzyskane granice
przedziałów ufno ci s bardzo podobne, a przedział budowany za pomoc SEM jest zawsze szerszy.
• Dwukrotne badanie tym samym testem • Metody oparte na analizie wła ciwo ci statystycznych
stabilno ci bezwzgl dnej pozycji testowych
wiarygodno ci testu wzory KR20 i KR21 oraz
formuły obliczania Alfa Cronbacha
• Porównanie cz ci (np. połówek) testu • Ocena stopnia zgodno ci s dziów kompetentnych
Metoda połówkowa
Wzór „proroczy” Spearmana-Browna dla n=2
• Metoda estymacji wiarygodno ci testu, polega tak e na dwukrotnym badaniu tej samej grupy,
jednak mi dzy pomiarami nie ma przerwy – badanie drugie nast puje zaraz po zako czeniu
pierwszego; metoda pozwala oceni chwilowe – nie trwaj ce dłu ej ni samo badanie – i
zwi zane z osob badan czynniki zakłócaj ce pomiar
np. zm czenie, lub fluktuacje uwagi.
• W przypadku dokonania pomiarów bez przerwy czasowej metoda nazywana jest estymacj
równowa no ci mi dzytestowej; pozwala okre li zwi zek mi dzy bł dem pomiaru a ró nicami
wersji, tym samym oceni zwi zek rzetelno ci i specyficznych tre ci pyta .
Test mo e by podzielony na połowy: losowo lub z uwzgl dnieniem statystyk opisuj cych
poszczególne pytania, albo na pytania o numerach parzystych vs. pytania o numerach
nieparzystych.
18
ą
ę
ę
ż
ż
ę
ź
ś
ś
ż
ć
ę
ą
ś
ę
ę
ś
ą
ę
ć
ś
ś
ą
ą
ś
ę
ż
ś
ń
ć
ć
ż
ż
ę
ę
ż
ś
ą
ś
ś
ę
ć
ą
ź
ę
ż
ą
ą
ę
ś
ż
ą
ę
ą
ę
ś
ś
ę
ę
ż
ę
ę
ń
ż
ś
ą
ś
ż
ń
ń
ą
ś
ą
Metody oparte na analizie wła ciwo ci statystycznych pozycji testowych
Estymacja zgodno ci wewn trznej opiera si na jednokrotnym badaniu, w ogólnym rozumieniu
współczynniki tego rodzaju s redni wszystkich mo liwych współczynników równowa no ci
mi dzypołówkowej odwołuj cych si do ró nych „przepołowie ”.
Metody tego typu odwołuj si do tzw. wzorów KR20 i KR21 opracowanych przez Kuder i
Richardson, oraz formuły obliczania Alfa Cronbacha.
Powy szy wzór mo na przekształci , aby okre lał krotno przedłu enia testu niezb dn do
osi gni cia danej warto ci współczynnika rzetelno ci.
W celu oceny zgodno ci kilku zestawów ocen tego samego materiału, dokonanych przez kilku
niezale nie pracuj cych diagnostów – s dziów kompetentnych oblicza si np. współczynnik
zgodno ci s dziów W-Kendalla.
ródłem wariancji bł du mog by niedostatki pracy diagnostów lub niedostatki klucza według
którego dokonywane s oceny.
Wydłu anie testu powoduje wzrost rzetelno ci, skracanie obni enie rzetelno ci (por. „wzory
prorocze” Spearmana i Browna).
Rzetelno buduj dobre pytania. Im lepsze charakterystyki pyta (np. pytania opisywane s przez
wysokie warto ci mocy dyskryminacyjnych) tym bardziej rzetelna skala.
„Czy test inteligencji pozwala przewidywa inteligentne zachowania w yciu osoby badanej, albo
zachowania, które mog wymaga inteligencji”.
Tak rozumiana trafno jest najwa niejsz własno ci testu z punktu widzenia psychologa.
Celem wszystkich diagnoz jest opis lub przewidywanie funkcjonowania osoby badanej w „realnym
yciu”.
Informacja o trafno ci okre la nie tylko status – „dobro ” pomiarow – narz dzia, ale tak e stanowi
wskazówki interpretacyjne dla diagnosty, co w szerszym kontek cie jest realizacj postulatu
budowy diagnozy bazuj cej na dowodach empirycznych.
20
Ź
ż
ś
ć
ś
ż
ń
ż
ć
ż
ś
ś
ś
ć
ń
ś
ć
ć
ś
ń
ś
ę
ć
ć
ś
ś
ć
ą
ś
ą
ć
ą
ą
ś
ś
ś
ś
ś
ć
ę
ć
ą
ś
ą
ą
ś
ą
ń
ś
ś
ę
ą
ź
ń
ś
ą
ę
ę
ś
ć
ę
ż
ś
ć
ś
ć
ć
ą
ą
ę
ś
ż
ć
ż
ś
ś
ś
ć
ć
ą
ć
ę
ż
ń
ę
ż
ń
ą
ą
ę
ś
ż
ę
ę
ś
ą
ż
ą
ż
ą
Trafno a rzetelno pomiaru
Rzetelno jest podstaw – warunkiem koniecznym trafno ci. Rzetelno stanowi zarazem górn
granic trafno ci. Jest niemo liwe, aby trafno była wi ksza od rzetelno ci.
Jednak ta zale no nie jest odwrotna, tzn. wysoka rzetelno nie gwarantuje trafno ci (nie jest
warunkiem wystarczaj cym)
Rodzaje trafno ci
W podr cznikach psychometrii wymienia si trzy rodzaje trafno ci:
• teoretyczn (ang. construct),
• kryterialn (diagnostyczn , prognostyczn ),
• tre ciow (wewn trzn ).
Pami ta nale y o tym, i s to przede wszystkim aspekty trafno ci, którym odpowiadaj techniki
walidowania (tj. badania trafno ci) testów.
Jedna trafno , która przejawia si w swoich 3 aspektach, którym odpowiadaj okre lone metody
badania trafno ci.
Jest jedynym aspektem trafno ci, który nie mo e by okre lany w badaniach empirycznych.
Badanie trafno ci tre ciowej sprowadza si do oceny (procedura s dziów kompetentnych) – czy
wska niki spełniaj kryteria definicyjne cech.
Trafno tre ciowa jest koniecznym, cho niewystarczaj cym warunkiem innych rodzajów
trafno ci.
Wi kszo podr czników uto samia trafno tre ciow i trafno wewn trzn , ten rodzaj trafno ci
mo e by jednak rozumiany bardziej ogólnie – jako stopie w jakim posta narz dzia odpowiada
koncepcji zało onej przez konstruktora testu.
21
ś
ę
ż
ż
ą
ź
ę
ś
ę
ś
ś
ś
ę
ć
ć
ć
ć
ą
ś
ć
ś
ć
ą
ć
ż
ą
ś
ś
ś
ć
ć
ś
ż
ś
ż
ż
ś
ś
ę
ę
ś
ą
ą
ć
ś
ś
ą
ć
ś
ą
ą
ś
ą
ż
ą
ż
ń
ą
ż
ś
ż
ż
ś
ś
ą
ę
ś
ą
ś
ę
ę
ć
ś
ć
ś
ś
ć
ż
ą
ź
ć
ś
ć
ą
ę
ś
ć
ś
ś
ń
ą
ś
ą
ć
ś
ś
ć
ś
ę
ś
ę
ś
ć
ć
ą
ą
ą
ę
ś
ę
ś
ż
ą
ś
ń
ń
ą
Trafno kryterialna
stopie w jakim test koreluje z okre lonym (nietestowym) kryterium zewn trznym np. czy wynik w
te cie inteligencji pozwala przewidywa redni ocen szkolnych (kryterium zewn trzne)
Trafno diagnostyczna jest warunkiem koniecznym, ale nie wystarczaj cym trafno ci
prognostycznej – testy prognostyczne musz diagnozowa , ale diagnozowanie nie gwarantuje
prognozowania.
Okre lenie zewn trznego wobec testu kryterium i jego własno ci jest kluczow i trudn kwesti w
badaniach trafno ci kryterialnej.
Standardowe post powanie zakłada prowadzenie bada zgodnie z tak procedur , która pozwala na
okre lenie rzetelno ci kryterium np. w przypadku diagnoz klinicznych nie mo e by to pojedyncza
diagnoza tylko zestaw diagnoz sporz dzonych przez niezale nie pracuj cych diagnostów, których
zgodno badamy (procedura s dziów kompetentnych)
Zestaw testów musi w jak najwy szym stopniu pozwala przewidzie kryterium, ale testy b d ce
predyktorami nie powinny korelowa mi dzy sob .
W przypadku estymacji wyników kryterium na podstawie testu, stosowanej w celu selekcji osób
badanych, pami ta nale y o estymacji przedziału ufno ci uwzgl dniaj cego standardowy bł d
estymacji kryterium.
B dzie zmienia si w wyniku ograniczania zmienno ci kryterium, lub zmienno ci mi dzy osobami
badanymi testem. Np. Je li b dziemy wi za oceny szkolne ogółu uczniów z wynikami testu
inteligencji to uzyskamy umiarkowan korelacj . Taka sama korelacja obliczona dla osób
najinteligentniejszych b dzie nieistotna, gdy o ró nicach ocen szkolnych tych osób b d
decydowa inne zmienne.
22
ę
ś
ś
ą
ś
ń
ś
ś
ś
ś
ć
ć
ć
ć
ć
ą
ć
ę
ś
ę
ę
ę
ś
ć
ż
ę
ż
ś
ę
ś
ę
ż
ś
ś
ć
ś
ą
ć
ą
ć
ę
ą
ś
ą
ą
ą
ś
ć
ą
ś
ż
ą
ż
ę
ś
ć
ś
ń
ż
ć
ć
ś
ć
ż
ś
ą
ę
ą
ć
ą
ę
ą
ż
ę
ą
ś
ą
ę
ą
ć
ę
ą
ę
ą
ę
ą
ś
ą
ś
ć
ą
Warto współczynnika trafno ci kryterialnej mo e by tak e efektem czynników losowych, wa ne
jest stosowanie tzw. walidacji krzy owej
Poprawka na nierzetelno
Mo liwe jest obliczanie współczynników trafno ci, których warto b dzie skorygowana ze
wzgl du na nierzetelno zarówno testu, jak i zewn trznego kryterium.
Estymowana ocena zwi zku mi dzy zmiennymi b dzie odpowiada takiej warto ci korelacji – jak
uzyskaliby my stosuj c doskonale rzetelny test i doskonale rzetelne kryterium
Trafno teoretyczna
rodzaj trafno ci, który wiadczy o zgodno ci zmiennej mierzonej przez test z konstruktem
teoretycznym.
Badanie trafno ci teoretycznej oznacza identyfikacj „tre ci psychologicznej” mierzonej przez test
W odró nieniu od trafno ci kryterialnej, istot trafno ci teoretycznej jest mo liwo przewidywania
kryteriów psychologicznych, a nie kryteriów „pozatestowych”
23
ż
ę
ś
ć
ś
ż
ć
ś
ś
ś
ą
ż
ą
ś
ą
ą
ć
ś
ś
ś
ś
ć
ś
ę
ę
ż
ą
ś
ż
ę
ę
ę
ś
ś
ć
ś
ś
ż
ś
ą
ć
ń
ś
ć
ć
ę
ż
ż
ś
ś
ć
ą
ź
ć
ż
ą
ą
Metody analizy danych korelacyjnych
Metoda analizy korelacji testu walidowanego i innych testów w uproszczonej formie polega na
analizie korelacji walidowanego testu z grup narz dzi mierz cych t sam zmienn i/lub korelacji
z innymi kryteriami, w postaci bardziej zaawansowanej odwołuje si do analizy czynnikowej
prowadzonej na skalach zestawu narz dzi diagnostycznych.
Skala ma korelowa z innym pomiarem podobnej zmiennej (aspekt konwergentny), ale nie powinna
korelowa z miarami innych zmiennych i innymi skalami wewn trz tej samej metody (aspekt
dyskryminatywny).
Dopiero spełnienie tych dwu warunków ł cznie w pełni wiadczy o trafno ci skali.
24
ę
ę
ć
ć
ż
ć
ś
ś
ć
ę
ż
ą
ą
ą
ę
ą
ą
ą
ż
ą
ę
ą
ś
ą
ą
ś
ć
ę
ż
ą
ę
ę
ś
ą
ą
ć
ą
ś
ć
ż
ą
ą
ą
ż
Trafność fasadowa
dotyczy wygl du testu, wra enia odnosz cego si do przeznaczenia testu jakie wywiera na osobach
badanych
Kwestionariusze, które charakteryzuje wysoka trafno fasadowa (łatwo odgadn co mierzy test)
s szczególnie podatne na zniekształcenia.
Z drugiej strony, budz ca zaufanie posta testu (tj. test wygl da jak test psychologiczny a nie
psychozabawa) mo e pełni istotn rol w budowaniu pozytywnego stosunku osoby badanej do
sytuacji, w której test jest stosowany, jak i do diagnozy oraz osoby psychologa.
Norma psychometryczna
jest to standard ilo ciowy, wyznaczony przez liczb osób uzyskuj cych dane wyniki lub przez
redni obliczon dla przedstawicieli danej grupy.
Norma opisuje poziom typowego wykonania testu przez osoby (osob ) nale ce do danej badanej
grupy
Standaryzacja
przekształcenie zmiennej, w wyniku którego otrzymujemy rozkład o średniej zero (M=0) i
odchyleniu standardowym równym jeden (s=1).
Wynik wystandaryzowany
wartość zmiennej wyrażona w odchyleniach standardowych
25
ś
ą
ż
ą
ę
ń
ą
ż
ę
ą
ń
ż
ś
ą
ą
ą
ż
ć
ą
ę
ę
ą
ć
ę
ę
ś
ć
ą
ą
ę
ż
ę
ą
ą
ć
ą
Psychologiczne testy standaryzowane
• zawierają instrukcję przeprowadzenia testu;
• klucz - zasady wg których ocenia się poszczególne odpowiedzi i interpretuje wyniki
mi dzy wynikami otrzymanymi za pomoc danego narz dzia ( testu psychologicznego) a wynikami
rednimi w danej próbie badawczej
Grupa normalizacyjna to
• grupa osób, której wyniki testu maj zastosowanie dla budowy norm dla testu
• grupa osób uczestnicz cych w badaniach normalizacyjnych
• grupa reprezentatywna dla populacji, do której test jest adresowany
Próba w takich badaniach powinna by reprezentatywna dla populacji, dla której tworzymy normy,
zatem mo liwie liczna, najlepiej je li posługujemy si kwotowym, b d losowym doborem próby.
Istotn jest kwestia okre lenia populacji dla której budujemy normy. (np. normy dla wieku; płci;
zawodów)
Np. je li w zakresie neurotyzmu mierzonego danym testem wyst puj ró nice mi dzy kobietami i
mężczyznami to nale y przygotowa odr bne normy dla kobiet i odr bne dla m czyzn.
W tabeli zaprezentowany jest w sposób w jaki buduje si normy, tj. wynikom surowym WS
otrzymanych na podstawie bada przypisywane s warto ci jednostek standardowych.
Kolejne kroki
1. obliczamy liczebno (czyli ile razy wyst piła dana warto wyniku testu w badanej grupie) oraz
liczebno skumulowan
2. stosujemy poprawk na nieci gło skali,
3. wynik ten dzielony jest przez liczebno próby N, aby uzyska prawdopodobie stwo uzyskania
danego b d mniejszego wyniku surowego.
4. tak wyznaczon warto prawdopodobie stwa odnosimy do dystrybuanty krzywej Gaussa, aby
wyznaczy warto statystyki z, czyli wielko odchylenia od redniej
5. nast pnie stosuj c odpowiednie dla danej skali standardowej parametry wyznaczamy jej warto ci
odpowiadaj ce danym wynikom surowym.
27
ś
ę
ą
ś
ę
ś
ą
ć
ż
ć
ź
ą
ę
ć
ż
ę
ś
ę
ą
ć
ą
ą
ż
ę
ą
ś
ć
ą
ć
ś
ą
ś
ć
ą
ń
ę
ś
ą
ć
ś
ć
ą
ć
ę
ś
ś
ą
ć
ą
ń
ś
ń
ć
ą
ę
ą
ę
ś
ś
ę
ć
ś
ę
ć
ę
ą
ą
ę
ą
ą
ź
ę
ż
ę
ż
ę
ń
ż
ś
ś
ś
Jak wybra jednostk podczas normalizacji testu?
O wyborze jednostki standardowej podczas normalizacji testu decyduj :
• zakres mierzonych wielko ci,
• przeznaczenie testu (pomiar cech osobowo ci, inteligencji)
• czy zakładamy normalno rozkładu mierzonej zmiennej
Przedstawione jednostki standardowe ró ni si nie tylko parametrami, ale tak e własno ciami.
Bior c te ró nice pod uwag nale y dokonywa wyboru jednostki podczas normalizacji testu.
Pierwsza decyzja badacza dotyczy tego, czy zakłada si normalno diagnozowanej zmiennej.
Je li tak, mo e wtedy wybra jednostki bazuj ce na rozkładzie normalnym.
Je eli zakładamy normalno rozkładu to kluczow kwesti jest to jak zmienn mierzymy oraz to
jaki zakres maj wyniki surowe.
Je li zakres wyników surowych jest mały to nie ma potrzeby stosowa jednostek standardowych,
które maj wiele warto ci (IQ, skala T) Stosujemy wtedy steny (1-10) , b d staniny (1-9).
Decyduj c si na steny, b d staniny kierujemy si tym, e: steny lepiej opisuj kra ce a staniny
rodek rozkładu.
Na ogół testy inteligencji w takiej sytuacji s normalizowane przy u yciu stanin, a kwestionariusze
osobowo ci przy u yciu stenów.
Zarówno jednak steny i staniny, które s czułe w zakresie ok. +/-2s, a tak e tetrony (ok. +/-2,5s) nie
pozwalaj ró nicowa w zakresach skrajnych np. w sytuacjach klinicznych.
Je eli chcemy opisywa wyniki skrajnie oddalone od redniej populacyjnej wskazane jest
stosowanie Tenów (1-100), b d w przypadku inteligencji ilorazu inteligencji (0-200).
28
ś
ś
ś
ż
ś
ż
ą
ą
ą
ś
ą
ć
ż
ż
ż
ę
ą
ż
ć
ę
ś
ś
ć
ć
ś
ą
ę
ś
ć
ć
ź
ą
ź
ż
ą
ć
ż
ś
ą
ą
ą
ć
ę
ą
ę
ę
ż
ą
ś
ś
ć
ż
ą
ą
ć
ą
ż
ź
ż
ą
ą
ń
ś
Jednostki norm oparte na rozkładzie prostok tnym
Najcz ciej stosowanymi jednostkami opartymi na rozkładzie prostok tnym s centyle i decyle.
Obie te jednostki s kwantylami.
Kwantyl umo liwia podział populacji lub zbioru jednostek na okre lone cz ci (setne, dziesi tne,
wiartki, połówki itp.) z uwagi na warto analizowanej zmiennej.
Centyle (cz ci setne) mówi jaki odsetek populacji osi ga dany wynik lub ni szy.
Osoba, której wynik równy jest 80. centylowi wykonała test lepiej ni 80% badanych w danej
próbie.
Np. Je eli wynikowi surowemu 8 punktów odpowiada 13 centyl oznacza to, e wyniki od 1 do 8
punktów uzyskało 13% osób badanych. Natomiast 9 i wi cej punktów uzyskało pozostałe 87%.
Zarówno w przypadku centyli, jak i innych kwantyli mówimy, e bazuj na rozkładzie
prostok tnym, czyli równo prawdopodobnym;
S to jednostki w przypadku których nie przyjmujemy zało e co do rozkładu mierzonej zmiennej.
Centyle stosuje si szczególnie wtedy, gdy zakładamy, zmienna nie ma rozkładu normalnego, b d
uzyskany rozkład empiryczny jest skrajnie sko ny, b d kurtyczny.
Standaryzacja
Standaryzacja testu to ujednolicony sposób posługiwania si testem
W szerszym znaczeniu, standaryzacja to ujednolicony ogół czynno ci zwi zanych z prowadzeniem
badania i opracowywaniem wyniku
Standaryzacja ma na celu minimalizowanie wpływu czynników zakłócaj cych pomiar, b d cych
efektem:
– post powania osoby prowadz cej badanie
– warunków, w jakich badanie jest przeprowadzane
Procedura standaryzacji
Dotyczy sytuacji
• badania testem
- zasady ogólne
- instrukcja
- pomoce
• obliczania wyników
- klucz odpowiedzi
- obliczanie, sprawdzanie, kodowanie wyników
• interpretowania wyników
- reguły
- normy
Dobrze wystandaryzowany test składa si z: instrukcji dla osoby badanej, okre lonego materiału
testowego, klucza – zasad oceny wyników, reguł interpretacji wyniku.
29
ć
ą
ę
ę
ż
ś
ą
ę
ś
ż
ę
ą
ą
ą
ś
ć
ę
ś
ą
ą
ź
ą
ę
ż
ę
ń
ś
ś
ą
ż
ż
ą
ą
ę
ż
ą
ś
ż
ś
ą
ę
ą
ę
ą
ź
30
Konsekwencje odst pstw od procedury standaryzacji:
• zmiana własno ci testu - przede wszystkim obiektywno ci
• trudno ci w ustaleniu rzetelno ci i trafno ci testu
• uzasadnione w tpliwo ci odnoszenia uzyskanych wyników do norm
• zastrze enia odno nie stosowania testów w praktyce diagnostycznej, jak i powstałych na ich
podstawie diagnoz
Obiektywno
Opracowanie procedury interpretacji wyników badania testem, aby stosowanie jej było za ka dym
razem identyczne, niezale ne od osoby badaj cej
Obiektywno ma na celu
• zminimalizowanie wpływu osoby przeprowadzaj cej test na wyniki
• zagwarantowa , e ró ne osoby badaj ce dokonaj identycznej oceny wyników danej osoba
badanej
31
ż
ż
ń
ż
ś
ż
ś
ą
ą
ą
ą
ś
ś
ś
ć
ć
ć
ć
ż
ą
ś
ż
ś
ą
ę
ś
ę
ż
ż
ż
ą
ś
ć
ą
ę
ś
ś
ś
ą
ś
ś
ą
ć
ż
ą
ą
ą
ś
ę
ą
ń
ą
ę
ą
ą
ż
ą
ż
ż
Proces przystosowania wersji oryginalnej testu do innej specyfiki kulturowej polega na
zastosowaniu specjalnych procedur przystosowuj cych i nie sprowadza si tylko do
przetłumaczenia oryginału tekstu
Od strony badawczej proces adaptacji przypomina proces konstrukcji nowego narz dzia
Prowadzone s analizy itemmetryczne, badania słu ce ustaleniu rzetelno ci i trafno ci nowego
narz dzia, przygotowuje si nowe normy
32
ż
ę
ę
ś
ą
ą
ę
ę
ę
ą
ę
ą
ż
ą
ą
ś
ć
ś
ą
ę
ś
ę
ę
ś
ą
ę
Je eli tłumaczenie jest poprawne, osoby badane w obu wersjach powinny wybiera takie same
odpowiedzi.
Do pewnego stopnia tak prowadzone badanie przypomina badanie stabilno ci
Mo liwe jest obliczanie statystyk opisuj cych zgodno wersji, zarówno dla skal, jak i
pojedynczych pyta – jest to zalet tej metody.
33
ż
ż
ę
ń
ę
ś
ś
ć
ż
ż
ż
ć
ś
ś
ś
ć
ć
ć
ś
ż
ć
ń
ś
ż
ż
ń
ć
ń
ż
ę
ą
ś
ą
ś
ć
ż
ż
ń
ż
ę
ę
ś
ą
ś
ć
ś
ę
ę
ć
ę
ą
ą
ś
ś
ń
ć
ą
ą
ś
ę
ś
ń
ń
ą
ć
ś
ć
ń
ą