Download as pdf or txt
Download as pdf or txt
You are on page 1of 252

Finansów i w Warszawie

Recenzent
Prof. dr hab. Bogdan Zawadzki

Copyright © 2009 by Finansów i w Warszawie

Redaktor
Wojciech

Redakcja i korekta
Joanna Dziejowska

Wydanie I

ISBN: 978-83-61086-31-4

VIZJA PRESS & IT


ul. Dzielna 60, O1-029 Warszawa
tel./fax 022 536 54 68
e-mail: vizja@vizja.pl
www.oferta.vizja.net.pl

i
BEST Beczek, tel. 693 650 984
Warszawa 2009
Spis

Wprowadzenie . . . . . . . . . . . . . . . 9

1. Zastosowanie testów psychologicznych 12


Ewa Witkowska
1.1. testu psychologicznego i jego podstawowe 12
1.1.1. pomiaru testem 14
1.1.2. pomiaru testem 14
1.1.3. Standaryzacja . 15
1.1.4. Normy . . . . . . . . . . 16
1.1.5. . . . . . 16
1.2. Testy jako diagnostyczne 17
Pytania . . . . . . . . . . . . 20

2. wybranych testów psychologicznych 21


Krzysztof Fronczyk
2.1. Testy cech intelektu. . . . . . . . . . . . . 23
2.1.1. Skale rozwojowe . . . . . . . . . . 25
2.1.2. Testy inteligencji ogólnej i 29
2.2. Kwestionariusze i temperamentu 39
2.2.1. Inwentarze przeznaczone do diagnozy jako . 40
2.2.2. Inwentarze przeznaczone do diagnozy wybranych wymiarów
. . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
2.2.3. Charakter pozycji testowych w kwestionariuszach 47
2.2.3.1. pozycji testowych w kwestionariuszach . 47
2.2.3.2. Forma pozycji testowych w kwestionariuszach. 49
Pytania . . . . . . . . . . 52

3. Co to jest pomiar psychologiczny? 54


Krzysztof Fronczyk
3.1. natury mierzonych w psychometrii 54
3.2. pomiaru ....... . 56
3.3 . .................... . 58
3.4. pomiaru .......... . 61
3.5. Kwestie problemowe pomiaru psychometrycznego 63
Pytania . . . . . . . . . . 64

4. Klasyczna teoria testów 65


Andrzej Rynkiewicz
4.1. Wynik prawdziwy i pomiaru 66
4.2. Podstawowe klasycznej teorii testów 69
4.3. wyników i dla jednej osoby. 74
4.4. wyników i dla populacji. . . . 76
4.5. Teoretyczna definicja testu . . . . . . 77
4.6. Korelacja wyników otrzymanych i prawdziwych 79 5
4.7. Standardowy pomiaru. 80
Zalecana literatura. . . . . . . . . 82
Literatura dla bardziej ambitnych . 82
Zadania . . . . . . . 82
Odpowiedzi do . . . . . . . 83

5. Jakich informacji o dostarcza testowanie? . . . . . . . . . . . . .. 84


Konrad Jankowski, Marcin Zajenkowski
5.1. Metody szacowania pomiaru testem. . . . . . . . . . . . 84
5.1.1. Metoda powtarzanego pomiaru . . . . . . . . . . . . . . . . . 85
5.1.1.1. czasowa a o . 87
5.1.2. Metoda wersji alternatywnych 89
5.1.3. Metoda . . 90
5.1.4. . . . . 93
5.1.5. ocen . . . 97
5.1.6. Porównanie metod szacowania . 98
5.1. 7. Metody szacowania w SPSS . . 99
5.1.7.1. Metody dwukrotnego badania tej samej grupy osób 99
5.1.7.2. ..... . . . . . . . 102
5.1.7.3. Alfa Cronbacha w SPSS. . . . . . . . . . . . . . . 104
5.1. 7.4. pomiaru testem jako w SPSS 106
Pytania 108
Zadania . . . . . 109
Zadania w SPSS . . . 110

Adam Tarnowski, Krzysztof Fronczyk


5.2. pomiaru testem . . . . . . . . . . . . . . . . . . . . . . . . 111
5.2.1. i jej z innymi testu. 111
5.2.2. Rodzaje . . . . . . . 114
5.2.2.1. . 114
5.2.2.2. teoretyczna 118
5.2.2.3. kryterialna. 131
5.2.2.4. Inne aspekty 136
5.2.3. Wzajemne relacje poszczególnymi rodzajami 137
5.2.4. pomiaru testowego a od standardowej procedury
badania . . . . . . . . . . . . . . . . . . . 139
5.2.5. Szacowanie ........... . 140
5.2.5.1. 140
5.2.5.2. korelacji . . . . . . 145
5.2.5.3. Analiza czynnikowa . . . . . . . . 147
5.2.5.4. Analiza 151
5.2.5.4.1. Test t-Studenta . . . . . 151
5.2.5.4.2. Jednoczynnikowa analiza wariancji 154
6 Pytania 159
Ewa Witkowska, Krzysztof Fronczyk
5.3. Analiza pozycji testowych . . . . . 161
5.3.1. pozycji testowych . . . . . . . 162
5.3.2. Moc dyskryminacyjna pozycji testowych 165
5.3.3. pozycji testowych a wyników testu 169
5.3.4. Obliczanie pozycji testowych i wyników
w SPSS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . , 172
5.3.4.1. Obliczanie i mocy dyskryminacyjnych przy
SPSS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172
5.3.4.2. Obliczanie podstawowych charakterystyk
wyników testu przy zastosowaniu SPSS 174
5.3.5. Forma pozycji testowych 176
Pytania 177
Zadania . . . . . . . 177
Odpowiedzi do 179

6. Jakich informacji o osobie badanej dostarcza testowanie? 180


Andrzej Rynkiewicz
6.1. standardowe i . . . . . . 180
6.1.1. Standardowy pomiaru . . . . . . . . . 181
6.1.2. dla wyniku otrzymanego. 182
6.1.2.1. Obliczanie dla wyniku otrzymanego 185
6.1.2.2. Interpretacja dla wyniku otrzymanego 186
6.1.3. Standardowy wynikami otrzymanymi . . .. 187
6.1.4. dla wynikami otrzymanymi .. 190
6.1.4.1. Obliczanie dla wynikami
otrzymanymi. . . . . . . . . . . . . . . . . . . . 192
6.1.4.2. wynikami otrzymanymi 193
6.1.5. Estymowany wynik prawdziwy . . . . . . . . . . . . . . 194
6.1.6. Standardowy estymacji wyniku prawdziwego . . . . 197
6.1.7. dla estymowanego wyniku prawdziwego 199
6.1.7.1. Obliczanie dla estymowanego wyniku
prawdziwego 200
Literatura zalecana . · 201
Zadania . . . . . . . 201
Odpowiedzi do · 203

Andrzej Rynkiewicz
6.2. Normy i normalizacja · 205
6.2.1. Norma i normy · 205
6.2.2. Standaryzacja . · 207
6.2.3. Normalizacja . .209
6.2.4. Skale znonnalizowane ; 215
6.2.4.1. Skala staninowa · 216
6.2.4.2. Skala stenowa . · 217 7
6.2.4.3. Skala tenowa .. · 217
6.2.4.4. Skala tetronowa . · 218
6.2.4.5. Iloraz inteligencji · 219
6.2.4.6. Przeliczanie wyników na skale znonnalizowane : 220
6.2.5. Nonny centylowe . .222
Zalecana literatura. . .226
Zadania . . . . . . . .227
Odpowiedzi do .228

7. Etyka testowych. .230


Ewa Witkowska
7.1. Prawa osoby badanej i psychologa-diagnosty .230
7.2. Przygotowanie do diagnozowania . . . . . . . . . . .232
7.3. Zawieranie kontraktu oraz zgoda na w badaniu
diagnostycznym . . . . . . . . . . . · 233
7.4. Tajemnica zawodowa. . . . . . . . . · 235
7.5. Komunikowanie wyników testowych .236
7.6. Ochrona diagnostycznych .240
7.7. Podsumowanie .242
Zalecana literatura. . .242
Pytania .243

Literatura. .244

Indeks . .. .248
WPROWADZENIE

Niniejszy psychometrii zawiera podstawowe informacje, z jakimi


powinni studenci w trakcie studiów psychologicznych. Studenci
z do przedmiotów metodologicznych, do
statystyki oraz psychometrii. Spowodowane jest to zwykle
przedmioty tego typu bardzo trudne, szczególnie dla studentów psychologii,
których zainteresowania zwykle dalekie od matematyki. Jest to prze-
konanie. W opinii autorów niniejszego zrozumienie podstawowych
idei psychometrii nie wymaga matematyki, a przede
wszystkim od w sobie psychometria ezy statystyka jest
trudna i dla adepta psychologii. Jest to
podstaw psychometrii jest w pracy psychologa.
Naszym celem takie przedstawienie psychometrii, aby to zada-
nie. w sposób poszczególne
zagadnienia, tak aby ich zrozumienie. tego celu
nie tylko odpowiedniej prezentacji lecz jego
selekcji. psychometria dysponuje bowiem rozbudowanym
aparatem statystycznym, którego omawianie nie jest konieczne do zrozumienia
najbardziej fundamentalnych psychometrii. te wy-
starczy podstawowa matematyki oraz nieco ogólnej wiedzy ze
nego kursu psychologii.
Rezygnacja z omawiania statystycznych nie ujmuje
w niczym Dla psychologów-praktyków,
jakimi obecni studenci psychologii, nie jest bowiem ona koniecz-
na. jest jednak rozumienie podstawowych z testa-
mi psychologicznymi. Nie bowiem tego typu
w sposób osobom badanym bez takich
jak np. czy pomiaru testem.
Niniejszy jako podstawowych informa-
cji z zakresu psychometrii dla studentów, ale za przewodnik
w przeprowadzaniu prostych analiz danych psychometrycznych przez wszyst-
kich zainteresowanych szczególnie magistrantów, którzy
przed dokonania analizy danych z przepro- 9
Krzysztof Fronczyk

wadzonych do prac magisterskich. Zadanie to


analiz przeprowadzone w programie SPSS. do CD
zawiera pliki danych wykorzystane w opisanych nim
posiadacz programu SPPS takich samych analiz, co powinno
planowanie i przeprowadzanie analiz danych.
- podstawowe zagadnienia ma
pierwszy, autorstwa Ewy Witkowskiej, jest wprowadzeniem w proble-
Zawiera on omówienie podstawowych tenninów psychometrii.
drugi, napisany przez Krzysztofa Fronczyka, jest wybra-
nych psychometrycznych. z ograniczono
w nim do opisaniajedynie niewielkiej liczby testów. Starano w spo-
sób maksymalnie reprezentatywny dla ogromnej liczby stosowanych na
tak aby Czytelnik na temat
tego typu technik badawczych. Kolejny autorstwa Krzysztofa
Fronczyka, jest wprowadzeniem do zagadnieI'1 pomiaru w psychometrii. Pomiar
cech psychicznych nie jest bowiem tak oczywisty, jak pomiar fi-
zycznych, nieco szerszego potraktowania tego zagadnienia.
Andrzej Rynkiewicz w rozdziale czwartym wprowadza Czytelnika w zagadnie-
nia klasycznej teorii testów. Teoria ta definiuje, jak wyniki testo-
we. niej jest szacowanie testów oraz obliczanie

Kolejne dwóch zasadniczych funkcji, jakie wyniki.


Z jednej strony dane uzyskane z badania testem pewnej grupy osób
infonnacji o samym ijego Z drugiej - wyniki
poszczególnych osób badanych o psychicznych tych-
osób.
Pierwsza z wymienionych funkcji wyników testowych jest omówiona w roz-
dziale z trzech Pierwsza autorstwa Konrada
Jankowskiego i Marcina Zajenkowskiego, jest sposobom szacowa-
nia pomiarów dokonywanych przy pomocy testów. Natomiast w dru-
giej napisanej przez Adama Tarnowskiego i Krzysztofa Fronczyka, omó-
wiono sposoby szacowania pomiarów dokonywane przy testów.
W trzeciej Ewa Witkowska i Krzysztof Fronczyk
psychometryczne pozycji testowych.
Druga funkcja wyników testowych, informowanie o
psychicznych osób badanych, poruszona w rozdziale szóstym, napisanym
przez Andrzeja Rynkiewicza. Opisano w nim tworzenie dla
indywidualnych wyników osób badanych oraz konstruowanie odniesienia
dla wyników, jakim normy empiryczne.
etycznym aspektom stosowania te-
stów psychologicznych zarówno w praktyce naukowych, jak i w bada-
10 ni ach stosowanych. ten Ewa Witkowska.
Wprowadzenie

Autorzy za wszelkie uwagi oraz


sposobu prezentacji a stopnia jego Czytelnicy
swe komentarze za poczty elektronicznej na adres:
fronczyk@vizja.pl. Czytelników tekstu niniejszego
z do stworzenia udoskonalonej kolejnej
wersji

Warszawa, 2008 Krzysztof Fronczyk

11
1. ZASTOSOWANIE TESTÓW PSYCHOLOGICZNYCH

Ewa Witkowska
PSYCHOLOGII
UNIWERSYTET WARSZAWSKI

1.1. testu psychologicznego.


i jego podstawowe
Testy psychologiczne, tworzone na podstawie wiedzy psychometrycznej,
w przeznaczonymi do pomiaru cech lub stanów psychicz-
nych. nim staje lepsze zrozumienie i przewidywanie ludzkich
zachowaJl w realnych sytuacjach Diagnoza testowa pozwala
dowo czy dana osoba raczej dobrym czy raczej
czy poradzi sobie w typie czy proponowany terapii
dzie w jej przypadku itp. Zmienne mierzone przez testy psychologiczne
a o ich wnioskujemy na podstawie
zachowania. Niekiedy zmienne tego typu nazywane konstruktami.
to oznacza, zmienna mierzona przez test stworzona w ramach pewnej
teorii, w celu ludzkiego zachowania. takich zmiennych to
cechy psychiczne (na ekstrawersja czy inteligencja), stany emocjonalne
(takie jak czy postawy Uak autorytaryzm).
o testach psychologicznych jako o diagnostycznych, na-
nie ich do testowego (ka-
papieru, na którym wydrukowano pytania kwestionariuszowe czy
prezentowanych badanemu przez psychologa). Test to procedura zbierania
informacji na temat psychologicznych faktów z badanego - jest
w niej przestrzeganie odpowiednich zasad opisanych w testowym.
bardzo istotny jest kontakt psychologa z Roli dia-
gnosty nie jako do funkcji ro-
bota", mechanicznie opisany w sposób
nia. zatem w praktyce test psychologiczny jest
a badanym w czasowym, fizycznym
i psychologicznym, przy czym test jest w któ-
rej wszystkie czynniki - (na badanego) i ze-
(na badaniu) - na reakcje oso-
by badanej. WJlsensie metodologicznym test psychologiczny jest
zachowania, poprzez zastosowanie standaryzowanych
po prostu zadaniami czy pytaniami testowymi. Reakcje badanych
opisem poszczególnych aspektów zachowania
. -na zachowaJl ekstrawertywnych w sytu-
12 acjach (Zawadzki, 2006).
1. Zastosowanie testów psychologicznych

"testy psychologiczne" odnosi do grupy metod,


cych pod przedmiotu pomiaru i procedury badania.
Ze na badania, testy na indywidualne,
czyli takie, gdzie psycholog bada w danym momencie tylko oraz
grupowe, przy pomocy których naraz bada osób. Ze na przed-
miot pomiaru testy dzieli na testy oraz kwestionariusze
zwane inwentarzami. Specyfika testu w porównaniu
z kwestionariuszem, polega na tym, w istnieje jedna dobra odpo-
natomiast w przypadku kwestionariusza wybrana przez badanego
jest "dobra", bo mierzonej cechy ma swoje wady
i zalety. testów testy inteligencji, testy
oraz Testy inteligencji poznawczy, na
problemów, do
ska oraz korzystanie z Testy
potrzebny, aby nowe testy
uczenia
Laicy badania psychologiczne z wykorzystaniem testów
jako technokratyczny, abstrakcyjny i tajemniczy obszar pracy psychologa, a tak-
z profesjonalnego testu psychologicznego od
drukowanych w prasie popularnych psychozabaw albo w Internecie
"testów" i psychozabaw, czy po-
czucie Co zatem czyni z testu psychologicznego test? Co test
psychologiczny od psychozabawy? W jaki sposób test dobry od
kiepskiego?
Towarzystwo Psychologiczne w 1994 test psy-
chologiczny jako diagnozowania. ona zbio-
rem zadali lub które - w standardowych warunkach -
rodzaje i wyników o
psychometrycznych, czyli i
pomiaru. Wyniki te interpretowane w odniesieniu do norm opracowanych dla
populacji, z której pochodzi osoba badana. psy-
chometryczne testu to w istocie procedury badania z testu,
czyli pomiaru testowego, a nie - testu jako takiego. omówieniu
wszystkich pomiaru testowego poszczególne
niniejszego dalej opisano pokrótce, co kryje za poszczególnymi
terminami.
na test psychologiczny, oprócz samego testowe-
go (arkusza czy z pytanimni, na które odpowiada badany lub stwier-
dzeniami, do których ustosunkowuje), testowy
i klucz. testowy to opracowanie informacje do-
testu - jego teoretyczne, dane na temat i
opis procedury badania oraz normy. Wnikliwa lektura powinna 13
Ewa Witkowska

zawsze pierwszym krokiem psychologa, zastosowanie testu


w diagnozie. Klucz z kolei zawiera o poprawnych lub
diagnostycznych o badanej cechy) odpowiedziach.

1.1.1. pomiaru testem


pomiaru testem psychologicznym jest do-
pomiaru wyników) uzyskanych przy tego
Test rzetelny pomiar to (w pewnym uproszczeniu) taki, który daje takie
same wyniki, gdy przebadamy nim ludzi dwukrotnie, albo badanie jego al-
ternatywnymi formami (testami ale przy in-
nych testowych) prowadzi do uzyskania takich samych wyników.
o poziom pomiaru testem jest podstawo-
wym, aczkolwiek warunkiem, który musi aby
test uznany za pomiarowe dobrze funk-
Informacja o wysokiej precyzji pomiaru, czyli dobrej pomiaru
testem, nie ozna\,;za bowiem, autorowi testu
instrument o lnU o tym, czy test
mierzy (np. czy charak-
(np. osoby badanej) jest pomiaru testem.

1.1.2. pomiaru testem


pomiaru testem informuje o tym, czy test mierzy za-
a w konsekwencji - jak dobrze on Jest
to kluczowe dla praktycznego wykorzystania testów i na zakres
wych interpretacji wyników testowych. informuje o tym,
czy przy danego testu inteligencji powodzenie ba-
danego na studiach. z uwagi na
testu, sama testem" definiowana (Murphy
i Davidshofcr, 2005). W praktyce pomiaru testem sprowadza do
dwóch kwestii - tego, jakie wnioski na temat zmiennych mie-
rzonych przez test oraz tego, co na podstawie wyników testowych wnio-
o zachowaniach badanego w realnym (Hornowska, 2002).
Jako testy psychologiczne na wniosków na te-
mat rzeczywistego zachowania osób badanych w realnym a nie
do diagnozowania, pomiaru testem jest uznawana za
testu psychologicznego. Innymi - pomiaru te-
stemjest pomiaru w porównaniu z funkcjo-
nowaniem w a pomiaru testowego to faktyczna
14 interpretacji wyników testowych.
1. Zastosowanie teslów psychologicznych

1.1.3. Standaryzacja
standaryzacji odnosi do warunków badania testem, a konkretnie -
do zapewnienia, stosowana procedura jest identyczna z
w testowym. Chodzi tu zarówno o to, badania nie
dystraktory (np. pojawienie osób trzecich,
jak i o to, aby testowy zawsze taki sam, co
jest w przypadku testów wykonani owych (na przy-
gdy badany ma za zadanie przed badaniem psycholog
musi jej elementy nie uszkodzone w dotychczasowych
badaniach) .
Procedura badania testem jest opisana w do danego
testu. Znajdziemy tam informacje o tym, czy badanie ma charakter indywidualny
czy grupowy, czy ma ono prowadzone z ograniczeniem czasowym czy
bcz niego, czy osoba badana ma powrotu do
w jakim zakresie psycholog jest uprawniony do udzielania pomocy badanemu
i inne wskazówki przeprowadzania badania danym
Standaryzacja jest z tego tylko wtedy, gdy przestrzega-
na jest warunków testowania badanych, w wynikach
indywidualnym, a nie warunkom testowania. Aby lepiej
konsekwencje nieprzestrzegania standardowej procedury badania,
sobie Psycholog
Jasia i badany w dobrze
nym, cichym pomieszczeniu, natomiast - po dniu pracy, oko-
godziny 21.00, w pokoju, gdzie w sposób jarzeniówka,
a przez czas trwania badania zza okna alarmu samocho-
dowego. wynik na poziom
inteligencji Czy taki rezultat jest miarodajny? Czy wskazuje
on na poznawcze czy jedynie na gorsze warunki ba-
dania? Niestety, w takiej sytuacji nie da tego i tym samym nie
wyników obu Podobny problem w sytu-
acji, gdy sposób badania odbiega od tego, któremu poddana próba norma-
lizacyjna (na psycholog test na dwie i
z badanym dwukrotnie, zamiast jednorazowo, jak
Tracimy wówczas odnoszenia wyniku uzyskanego przez bada-
do podanych norm i tym samym - porównania z odniesienia
(Homowska, 2002).
Aby porównywanie wyników osób psycholog-diagno-
sta jest do zapoznania z badania testem,
w testowym i do skrupulatnego jej przestrzegania. 15
Ewa Witkowska

1.1.4. Normy
Normy dla testu, na nadawanie sensu wynikom testowym poszcze-
gólnych osób badanych, poprzez porównywanie ich z wynikami uzyskanymi
przez odniesienia. Wynik surowy uzyskany przez w te-
(suma punktów odpowiedzi poprawnych lub diagnostycznych) jest
sam w sobie nie jest do zinterpretowania.
interpretacja wyniku testu psychologicznego odbywa poprzez porównanie go
z wyników próby normalizacyjnej. Ten sam wynik oczy-
porównywany z grupami odniesienia, innych in-
terpretacji. na podstawie danych normalizacyjnych, zamieszczo-
nych w testowym, wynik pewnego badanego w skali
inwentarza NEO-PI-R (Siuta, 2006) oceniony jako wynik wysoki na
tle populacji ogólnej. Jednak ten sam wynik na tle
wyników
W celu dobrze normy.
W sensie psychometrycznym "norma" opisuje jedynie typowy poziom wykona-
nia, albo na podstawie tego, jaki odsetek osób w grupie odniesienia
wyniki, albo na podstawie oszacow.anej dla
przedstawicieli danej grupy. Tak rozumiana norma nie odnosi do tego, czy
dane cechy o zdrowiu czy chorobie, ani nie wyznacza stan-
dardu czy "dobrego" wykonania.

1.1.5.
testu sprowadza do tego, uzyskany przez bada-
nego wynik w nie w sposób od tego, kto test
Gdyby zatem dwóch psychologów badanie tym samym
testem tej samej osoby lub ten sam z badania testowego, to
powinni oni w taki sam sposób badanie oraz wyniki
badanego. W konsekwencji powinni oni do takich samych wniosków dia-
gnostycznych.
Nie wszystkie testu samego w sobie
i niekoniecznie ocenione na pierwszy rzut oka. Po czym zatem
profesjonalny test psychologiczny? Po pierwsze, test zawiera
o tym, kto jest jego autorem, a w przypadku testów adaptowanych do warunków
polskich - kto jest autorem adaptacji. Poza tym test, w od
psychozabawy czy quizu, ma, oprócz samego testowego, dodatkowe
elementy, których jest testowy,
informacje, m.in. o teorii u jego podstaw, oszacowaniach
i standardowego pomiaru, badaniach
16 próbie normalizacyjnej, procedurze badania i obliczania wyników. W przypadku
1. Zastosowanie testów psychologicznych

testu psychologicznego korzysta z gotowych pomocy testowych -


arkuszy zadal1 i arkuszy odpowiedzi. Dodatkowo testy psy-
chologiczne ochronie prawnej i nie rozpowszechniane dla
zabawy, czyli drukowane w prasie czy zamieszczane w Internecie (Standardy,
2007).

Test psychologiczny to specyficina diagnozowania ukrytych zmiennych


woparciu o próbki zachmva'rria, która ódbywa w standardowych warunkach, cha-
.. rakteryzuje i pomiaru, a otrzymany wynik jest
interpretowany woparciu o

1.2. Testy jako diagnostyczne


Test psychologiczny to jedna z metod diagnozowaniu psychologicz-
nemu. Przez rozumie proces aktywnego poszukiwania
danych potrzebnych do decyzji o do zmia-
ny aktualnego stanu lub ludzi, co
na w efekcie terapii czy porady (Paluchowski, 2006). testu po-
winno zatem zawsze postrzegane w szerszym diagnostycznym.
Diagnozowanie na podstawie uzyskanych przez badanego wyników testowych
wymaga zarówno wiedzy z zakresu psychometrii, jak i fachowych
zastosowania jej w praktyce. Zbieranie informacji w procesie diagnostycznym to
i skomplikowany proces, w którym szczególnie istotne
kroki:
1. zdefiniowanie natury problemu i, co za tym idzie, diagno-
stycznych, na które
2. Zdecydowanie, jakie informacje aby odpowiedzi na
pytania diagnostyczne.
3. Wybór odpowiedniej metody zbierania informacji, w tym m.in.: testów psy-
chologicznych, wywiadów, obserwacji czy ankiet.
4. Odpowiednie przeprowadzenie i ocena wyników procedury testowej.
5. interpretacja uzyskanych wyników.
6. interpretacji wyników oraz danych pozatekstowych, tak aby po-
diagnoza psychologiczna, na postawione pytania
diagnostyczne.
7. Poinformowanie klienta o wynikach (APA, 2000).
Testy psychologiczne fakty psychologiczne
z jednostki, do informacji o zachowaniu - albo typowym,
z czym mamy do czynienia w sytuacji pomiaru cech lub chwilowym,
kiedy mierzymy stany. Stwierdzenie, testy cechy czy stany jest pew-
. nym skrótem W testy jedynie zachowanie i na 17
Ewa Witkowska

tcj podstawie o ukrytych psychicznych,


czyli o cechach czy stanach (Zawadzki, 2006).
Testy wykorzystywane zarówno do pomiaru "zdrowego" zachowa-
nia, jak i jego Pomiar testowy dostarcza informacj i na temat
mierzonej zmiennej. Mimo to, niekiedy na podstawie wyników testowych
ludzi, na pod typów, czy-
li z nie pojedynczych cech, lecz ich konfiguracji .
. Ponadto, w niektórych przypadkach, wyniki testu diagnozie ja-
-
Idea badania wybranych charakterystyk psychologicznych za testów
wywodzi z obszaru psychologii indywidualnych,
nicowaniem w zakresie takich zmiennych, jak inteligencja czy ce-
chy Takie opisuje danej osoby na tle innych
osób z populacji, zatem celem pomiaru staje zbadanie wza-
jemnego ludzi pod cechy. dwa
- nomotetyczne i idiograficzne, które na taki opis
idiograficzne stawia sobie za cel opisanie jednostki poprzez scharak-
teryzowanie cech typowych tylko dla niej i od innych ludzi.
Z kolei nomotetyczne przy opisie do cech, które charakte-
wszystkie osoby w populacji, istniej c tylko
w zakresie ich Obydwa te - nomotetyczne i idiograficzne
- swoje które na specyfiki
jednostki. typowymi dla metody stan-
dardowe - testy i kwestionariusze (Zawadzki, 2006). To im
jest ta Z kolei idiograficzne wykorzystuje techniki projekcyj-
ne, którymi nie dalej zajmowali'.
Czasami zdarza testy psychologiczne z ankie-
tami. Zasadnicza tymi polega na tym, pozycje
ankiet nie skal, tak jak dzieje w przypadku testów.
testu, wnioskujemy o cechy, na ekstrawersji na podstawie
odpowiedzi na wszystkie pytania, w przypadku ankiety - na podstawie
poszczególnych rozpatrywanychjako miary osobnych zmiennych. Ponadto
nie jest to ankiety, w od testów psycholo-
gicznych, informacji o populacjach, a nie o jednostkach.
testy w diagnozie, o ograniczeniach tej metody. Po
pierwsze, test psychologiczny nie jest wszystkich
których zbadanie pomocne w ocenie diagno-
zmiennej, jakkolwiek test, jako systematyczna próbka z
przynajmniej w ma zachowania na ten
, o technikach projekcyjnych przeczyta Czytelnik w Anastasi A., Urbina S.
(1999); Testy psychologiczne, Warszawa, Pracownia Testów Psychologicznych Polskiego Towarzystwa
18 Psychologicznego.
konstrukt. testu jako pomiarowego jest w mierze determi-
nowana przez przez autora próbki
Obecnie obserwuje szerokie zainteresowanie testami psychologicznymi.
stosowania testów kontrowersji,
które z tego, na podstawie wyników testowych podejmowanie
decyzje ludzkiego (Murphy i Davidshofer, 2005). Jako
obszary praktycznego wykorzystania testów wymienia zwykle edu-
rynek pracy, oraz W szkolnictwie testy
wykorzystywane w celach selekcyjnych (na by orzec, czy
zachodzi potrzeba przez danego ucznia specjalnego, skiero-
wania go do programu nauczania indywidualnego lub na rewalidacyjno-
wychowawcze), aby rozwojowe i dziecka, czy
rodzaj zaburzdi. i rozwojowych oraz zalecenia do
dalszej pracy z dzieckiem (Szustrowa, 2003). W testy wykorzysty-
wane do orzekania o stanie psychicznym czy o stopniu przy-
stosowania Testy zastosowanie w celu kto
najlepszym opiekunem dziecka w przypadku rodziców rozwiedzionych
lub gdy zachodzi podejrzenie sprawowania opieki rodzicielskiej.
Na rynku pracy testy wykorzystuje w selekcji pracowników, przy
ocenie programów szkoleniowych oraz przy ocenie pracowniczej.
z testów w celu diagnozy wyboru odpowiedniej
metody terapeutycznej oraz oceny jej
Mimo wymienione cztery obszary traktuje jako dzie-
dziny testy w praktyce, to w opracowanym przez
(2003) Raporcie o stanie orzecznictwa psychologicznego w Polsce wymieniono
26 obszarów praktyki psychologicznej, w których z orzecz-
nictwem psychologicznym, czyli zawodowymi psychologa, polega-
na - na podstawie wyników 'psychologicznych - sa-
modzielnych orzecze11 i opinii psychologicznych, czyli potencjalnie opartych na
wynikach testowych.

o czym zawsze testy psychologiczne:


1 Diagnoza ma na poznattie i zrozumienie klienta.
2 testu Jest jednym z elementów procesu diagnostycznego.
3 Diagnozowanie tez w sensie jest konsekwencje
dla osoby badartej;
Atesty psychologiczne to nic innego jak metódy zacho-
adekwatniedobratie ze priMmiotpomiaru.
S Wykorzystanie testu:Zawsze powifina refleksja "dlaczego" i"kiedy" go
a nie tytko ,Jakiego" testu

19
Ewa Witkowska

Pytania
l. Co to jest test psychologiczny?
2. Jak profesjonalny test psychologiczny od popularnej psychozaba-
wy?
3. podstawowe charakterystyki testu.
4. Co to jest pomiaru testem?
5. Dlaczego pomiaru testem jest uznawana za jego cha-

6. Na czym polega standaryzacja warunków testowania?


7. Co to jest diagnozy testowej?
8. Co to jest "norma" w sensie psychometrycznym?
9. Na czym polega diagnozowanie psychologiczne?
10. Jakie inne metody, oprócz testów psychometrycznych, wykorzy-
stane przez psychologa w diagnozie?
11. Jakie informacje zawiera testowy?
12. Po czym dobry test psychologiczny?
13. Opisz idiograficzne i nomotetyczne do diagnozy

20
2. WYBRANYCH TESTÓW PSYCHOLOGICZNYCH

Krzysztof Fronczyk
PSYCHOLOGII
FINANSÓW I W WARSZAWIE

Testy psychologiczne, mimo posiadania wspólnych


bardzo metod, jakimi psycholo-
gowie. Istnieje poklasyfikowania tych metod i wy-
szeregu grup testów. Niniejszy ma na celu zaprezentowanie
z nich. Przedstawionc pytania i za-
dania testowe, czemu przynajmniej prezentacja
ogromnej testów.
Testy psychologiczne poklasyfikowane na podstawie kry-
teriów. Jednym z kryteriów klasyfikacji jest ze na
przedmiot pomiaru. Na jego podstawie przeznaczone do
pomiaru cech oraz przeznaczone do pomiaru cech inte-
lektu, takich jak inteligencja czy przeznaczone do pomiaru
cech nazywane kwestionariuszami (lub inaczej inwentarzami),
natomiast do pomiaru cech intelekt to testy we
znaczeniu tego
W testach przeznaczonych do pomiaru cech intelektu (np. testy ma-
tematycznych, werbalnych, przestrzennych, abstrakcyjno-logicznych, sprawno-
psychomotorycznej, intdigencji ogólnej) osoba badana wykonuje specyficzne
zadania. W tych testach istnieje tylko Jedna Natomiast
w kwestionariuszach nie ma odpowiedzi.
jedynie odpowiedzi na posiadania danej cechy.
Kwestionariusze odmienne testy i inteligencji
informacji o osobach badanych. W testach badani zadania intelektu-
alne, a obserwuje w nich to, czy badany jest w stanie dany
problem czy nie. Mamy rzeczywistego zachowania osoby bada-
nej. W kwestionariuszach natomiast wykorzystuje badanego o sobie
samym, mu pytania jego zachowania. Kwestionariusze doty-
relacji badanego D swoim zachowaniu.
Ze na znaczenie obu wymienionych grup metod one
nieco opisane w dalszej niniejszego wraz z prezenta-
najbardziej znanych testów do tych grup.
Inne kryterium klasyfikacji testów dotyczy liczby jednorazowo badanych osób
przy pomocy danego Ze na to kryterium testy
indywidualne oraz grupowe. 21
Krzysztof Fronczyk

Testy grupowe, które wykonywane przez wiele osób,


prostym sposobem badania, do podania instrukcji
i badanym arkuszy testowych. Prostota badania sprzyja zachowaniu
standardowej procedury badania. testom grupowym jest jedno-
czesne badanie liczby osób, której ograniczona jest
tylko rozmiarami sali, w jakiej przeprowadza badanie (z czego wynika liczba
miejsc do siedzenia oraz psychologa
instrukcji do danego testu), a kontroli zachowania osób ba-
danych i prowadzenia w warunkach dla wszystkich badanych.
Z powodu jednoczesnego badania wielu osób, pozycje testowe testów grupo-
wych skonstruowane tak, aby nie wchodzenia w indywi-
dualny kontakt z badanymi, udzielania im dodatkowych itp. Testy
grupowe z pozycji testowych, kilka go-
towych odpowiedzi, a badany musi nich. Pozwala to na
szybkie i sprawne przeprowadzenie badania. W testach grupowych nie
otwarte pozycje testowe, czyli takie, w których osoba badana sama musi sfor-
to znacznie badania i obliczania
wyników. Sposób obliczania wyników jest uproszczony, tak by spraw-
dzanie liczby testów jak najmniej czasu.
Testy grupowe od badanych korzystania z instrukcji udzielanych
grupie, samodzielnego czytania ewentualnych, wydrukowanych instrukcji
oraz samodzielnego wpisywania swoich odpowiedzi. Brak kon-
troli nad tym, czy badani do instrukcji we sposób lub czy
na wszystkie pozycje testowe wyników
grupowych.
Testy grupowe idealne w sytuacji, gdy trzeba szybko
osób, np. w celu selekcji, gdy chodzi o osób o skraj-
nym nasileniu psychicznej.
Natomiast testy indywidualne, ze na nie
wykorzystywane do jednoczesnego badania jednej osoby. Specyfika
ta wynika zwykle ze procedury badania, od psychologa
jednoczesnego wykonywania wielu (np. mierzenia czasu udzielania
odpowiedzi na poszczególne pozycje testowe, zapisywania odpowiedzi osoby
badanej, prezentowania testowego w odpowiedniej punkto-
wania odpowiedzi badanego w trakcie przeprowadzania badania itp.).
polega nie tylko na procedury testowej, która przez musi
bardzo dobrze opanowana, ale na indywi-
dualnego kontaktu z temu testy indywidualne
dokonywanie obserwacji zachowania osoby badanej podczas
udzielania odpowiedzi na pytania testu. Wymienione testów indy-
widualnych do tego, one znacznie bardziej
22 nie musi to testy indywidualne zasto-
2. wybranych teslów psychologicznych

sowanie w psychologii klinicznej, na i bardziej


wszechstronne zdiagnozowanie badanego (np. gdy diagnoza poprzedza
czy

2.1. Testy cech intelektu


testów inteligencji i testy mocy i
Testy z wielu o tej samej podobnej
Zwykle to zadania których wykonanie w granicach
osób, dla których test jest przeznaczony. Czas wykonania testów szyb-
jest jednak ograniczony, a liczba na tyle aby badany
nie wszystkich w wyznaczonym czasie. Osoby o poziomie
do pomiaru której stworzony dany test, w tym ogra-
niczonym czasie zadali. osoby o poziomie Tak
badanego jest liczba podanych odpowiedzi (z
liczby ewentualnych jest ich zwykle ze na
Innymi testy w wykonywaniu za-
testowych. to intelektualnej rozumianej jako
efektywnej pracy intelektualnej.
W do testów w testach mocy o wyniku decyduje
nie tyle co ich Zadania w testach mocy
zwykle trudniejsze i bardziej w testach Zadania
w a czas wykonania nie jest ograniczo-
ny. Badani, kolejne zadania, zwykle do takiego, które jest
zbyt trudne. Nie wszystkie testy jednoznacznie do jednej
z tych dwu grup. bowiem takie testy, które cechy zarówno testów
mocy, jak i
Inny testów dotyczy na jakim one zrealizowane.
Z tego punktu widzenia testy werbalne i niewerbalne (zwane
testami wykonaniowymi czy .
.W testach wykonaniowych badany musi na kon-
kretnym materiale. Zadania tego typu np. na rysowaniu, prowadze-
niu przez labiryntu, klocków,
wek, matematycznych, elementów
odnajdywaniu obrazka itp.
W testach werbalnych badanego udzielana jest w formie
pisemnej lub ustnej. W testach tego typu konieczna jest nawet
badaniu podlega która nie musi z
rodzajem testów skale rozwojowe przeznaczone do diagnozy po-
ziomu rozwoju intelektualnego dzieci. W tego typu zadania
oddzielne zestawy przeznaczone dla poziomów wieku. Jest to zrozu-
pod wraz z rozwojem 23
Krzysztof Fronczyk

intelektualne dziecka. Oznacza to, zadania, które stosunkowo trudne dla


dzieci dla dzieci starszych lub banalne, a tym
samym badanych, wszystkie starsze dzieci w sta-
nie je Tak w zestawach przeznaczonych dla dzieci,
w kolejnych grupach wieku, co raz trudniejsze zadania.
Badanie za skal rozwojowych, które jest indywidualne, rozpoczyna
zwykle od zestawu liczbie lat danego dziecka. W wy-
padku, gdy badany nie radzi sobie z zadaniami przeznaczonymi dla jego wieku
wykonuje zadania przeznaczone dla osób dziecko
bez problemu zadania dla swojego wieku, to do
trudniejszych, do o takim poziomie których dziecko
nie jest w stanie
Niektóre z przeznaczonych do pomiaru inteligencji i
szczególna bateriami. Baterie z pewnej liczby
nych testów. z nich przeznaczony jest do pomiaru nieco innej
intelektualnej. Oprócz wyników w poszczególnych testach, zazwyczaj oblicza
rodzaj wyniku ogólnego, rezultatem wszystkich testów.
Procedura badania zwykle, wykonuje kolejno wszystkie
testy w jej
Za pierwszego testu inteligencji jest Alfred Binet (1857-1911)
i jego - Theophile Simon. W 1905 roku opracowali oni zestaw
o poziomie opartych na nauczania. Tak
utworzony test przeznaczony do pomiaru bardzo funkcji intelek-
tualnych, ze szczególnym oceniania i rozumowania. Skala ta
zadania sensoryczne i percepcyjne. Test ten za-
równo zadania werbalne, jak i wykonani owe. Ten pierwszy test inteligencji
o charakterze skali rozwojowej przeznaczonej dla dzie-
ci w wieku od 3 do 13 lat.
Opracowany przez siebie test Binet i Simon przekazali pewnej liczbie pary-
skich uczniów. ilu uczniów danego rocznika odpowiada-
na zadanie testu. zadanie
przez 70% dzieci w tym samym wieku, uznawano, dzieci w da-
nym wieku powinnaje W ten sposób dla dzieci o
poziomie wieku zadania, które przez dzieci te powinny
Tak np. poziomowi 3 lat przypisywano wszyst-
kie zadania wykonane przez trzylatków, poziomowi 4 lat -
wszystkie zadania wykonane przez czterolatków itd.,
do wieku 13 lat.
Procedura obliczania wyników indywidualnych dzieci
dziecko poprawnie zadania przeznaczone dla pewnej grupy
wieku, wynik jego jako tzw. wiek wieko-
24 wi dzieci poprawnie te same zadania. dziecko
2. wybranych testów psychologicznych

w rozmaitych zadaniach testowych wynik charakterystyczny dla


ciolatków, to jego wiek 5 lat, bez na wiek
(chronologiczny).
Metoda Bineta zainteresowaniem i
wielu zagranicznych adaptacji. Naj sza jest adaptacja
znana pod Stanfordzkiej Skali Bineta. Test Bineta zaadaptowany
w 1916 roku do dzieci przez Lewisa Termana,
z Uniwersytetu Stanford w Kalifornii. Terman po raz pierwszy po-
ilorazu inteligencji. Iloraz inteligencji jest to proporcja wieku
do wieku przez 100, by setne na
ten temat znajduje w rozdziale 6.2.4.5.).
Nowy test bardzo szybko standardowym psychologii kli-
nicznej, psychiatrii i poradnictwa szkolnego. Obecnie jednak oryginalny test
Bineta ma jedynie i nie jest w praktyce psycholo-
gicznej. Natomiast w USA stosowana jest uaktualniona wersja tego testu.
W Polsce nie istnieje aktualna adaptacja testu Bineta, co wy-
korzystanie w praktyce.
Od czasu utworzenia skali Bineta ogromna liczba te-
stów inteligencji i omówione wybrane, najbardziej
znane, tego typu. rozpoczynamy od przedstawie-
nia wybranych testów, charakter do testu Bineta, czyli skal
rozwojowych. W dalszej przedstawione testy stworzone z
o badaniu ludzi

2.1.1. Skale rozwojowe


Omówienie wybranych skal rozwojowych rozpocznie przedstawienie Skali
Columbia (Ciechanowicz, 1992). Jest to niewerbalny
test, do oceny poziomu dziecka. Columbia
z 70 tablic z rysunkami (3 tablice i 67 tablic
zadania). Tablice te zestaw 3, 4 lub 5 kolorowych rysunków, któ-
rymi figury geometryczne lub rysunki ogólnie znanych przedmiotów. Obiekty
te, wedle autorów, znane dziecku. zadanie przed-
stawione jest na karcie. Na rys. 2.1. przedstawiono
przeznaczony dla mlodszych dzieci) zadania do znaj-
w Columbia. -
Zadaniem osoby badanej jest wskazanie na z tablic rysunku
z Oznacza to wykrycia zasady
kilka rysunków i na tej podstawie wykluczenia jednego z nich. Takie zadania
tworzenia klas logicznych przez
klasyfikowania elementów podobnych i jest za
jeden z przejawów inteligencji i wykorzystuje w wielu te- 25
Krzysztof Fronczyk

stach. zaczyna
w trakcie swojego rozwoju, co wykorzystywanie
klasyfikacji w testach przeznaczonych dla dzieci.

Rysunek 2.1. zadania do pozycji testowych Skali Columbia

Skala Columbia jest


element dziecko pokazuje lub wskazuje ruchem
Skala Columbia do indywidualnego badania dzieci w wieku od 3,5 dolO
lat. Jest przeznaczona dla dzieci zarówno o rozwoju jak i zaburzo-
nym. Ze na niewerbalny charakter i bardzo prosty sposób udzielania od-
powiedzi, diagnozowanie dzieci z
i (np. po mózgowym, uszkodzeniach centralnego
nerwowego, na zaburzenia mowy i
Skala Columbia ma czemu
stosowana w Polsce (Ciechanowicz, 1992).
Innym skali rozwojowej jest Wykonaniowa
Skala Leitera (MWSL), niewerbalnym testem inteligencji dla dzieci, zre-
alizowanym tylko na materiale percepcyjnym (rysunki geometrycz-
nych oraz znanych obiektów). W zadaniu badanemu przedstawia
wzór narysowany na pasku kartonu oraz drewnianych, niewielkich
klocków z odpowiednimi rysunkami (dla zadania to
klocki z innymi rysunkami). Badany ma wzór przy pomocy klocków.
W niektórych przypadkach wzór jest a badany sam musi
elementy na podstawie samodzielnie wykrytej zasady. Badany udziela
odpowiedzi, klocki w specjalnej ramki. Skala Leitera
da z 52 stopnia
Zadania pogrupowane po cztery, serie od A do M.
Zadania w tego testu podstawowe operacje inte-
lektualne, takie jak wykrywanie relacji i ich wykorzystanie przy
obiektów. Operacje te w mierze od
testowy powoduje, test w ograniczonYIJ1 zakresie
do posiadanych przez badanego to konsekwencje
26 celu, jakiemu Skala Leitera. bowiem o stworzenie uniwer-
2. wybranych testów psychologicznych

salnego do stosowania wobec badanych z grup


i etnicznych, a wolnego od uczenia
oraz
procedura badania Leitera jest temu celowi.
W trakcie przeprowadzania badania, dziecko nie otrzymuje instrukcji
czy poszczególnych Test ten nie wyma-
ga mowy ani jej rozumienia. W niektórych zadaniach badany otrzy-
muje wskazówki, ale jedynie w sposób niewerbalny (przekazywane za
gestów czy demonstracji). Tak badany sam musi
w innych testach w rozpoznawaniu problemów i

Skala Leitera przeznaczona jest dla dzieci w wieku od 3 do 15 lat. Badanie ma


charakter indywidualny, bez ograniczenia czasu (z 4 Badanych
tutaj nie wykonania, a wykonania które
poziom Jest to test mocy. Liczba ja-
kie dziecko otrzymuje, od odnoszonych sukcesów i a czas
badania jest bardzo W przypadku dzieci wynosi on
20 minut, a naj starszych - 60 minut.
Procedura badania dla psychologa przeprowadza-
badanie. Pomoce testowe, na które kartoniki oraz klocki
z naniesionymi odpowiednimi rysunkami, bowiem
W celu zachowania badania, diagnosta musi biegle opano-
badania, tak aby z pomoce do
kolejnych
. Skala Leitera znajduje zastosowanie w praktyce psychologicznej do diagno-
zy intelektu. Skala jest szczególnie przydatna do badania dzieci, z którymi kon-
takt werbalny jest utrudniony lub (dzieci lub z zaburzeniami
mowy czy z zahamowaniami emocjonalnymi lub dobrze
polskiego). Nie wymaga bowiem od nich ani ani rozumienia mowy.
badanie dzieci w rozwoju
Polska standaryzacja tego pochodzi z 1993 roku (Jaworowska,
Matczak, Szustrowa, 1996), a Skala Leitera stosowana w naszym
kraju.
do oceny poziomu rozwoju intelektu-
alnego dziecka jest test Diagnoza Intelektualnych. Pierwotna wersja
tego oznaczona skrótem DMI (Matczak, 1992) dwóch
znacznych modyfikacji w postaci testów DMI-2M i DMI-2S (Matczak, 2001).
Wszystkie testy DMI oparte na koncepcji Jeana Piageta i do
operacyjnego (Piaget, 1966; 1981;.2006). Piageta prze-
jawem nabywania przez dziecko operacyjnego jest
klasyfikacji oraz dostrzegania relacji. Przez klasyfikowanie Piaget rozumie
grupowanie elementów na zasadzie natomiast spostrzeganie rela- 27
Krzysztof Fronczyk

cji jest elementami.


wraz z rozwojem poziom tych jest przedmiotem diagnozy przy
testów DM!. Tak testy te stopnia rozwojowego zaawan-
sowania operacyjnego i wykrywania jego deficytów. z testów
zawiera zadania zrealizowane zarówno na materiale werbalnym, rysunkowym,
jak i liczbowym. Oprócz oceny testy DMI
infonnacji o stopniu rozwoju operacji jest analiza
odpowiedzi udzielanych przez dziecko.
Nieco zostanie opisana konstrukcja testów DMI-2. z nich
z dwóch podtestów, z których jeden zawiera zadania o strukturze klas,
a drugi - zadania o strukturze relacji. W ramach z podtestów
trzy rodzaje Pierwszym, i najprostszym z nich, jest Zadania
tego typu na trójelementowej klasy lub serii czwartym ele-
mentem. Drugi rodzaj pozycji testowych to Analogie. Zadaniem osoby badanej
jest dopasowanie do pary elementów drugiej pary elementów na wzór
pierwszej. Ostatni rodzaj stanowi Nie chodzi tu
o w sensie algebraicznym, a o klas lub relacji, czyli o po-
szukiwanie ich wspólnych. Badany ma tu dwie klasy lub serie
wspólnym elementem, wedle których dobrano elementy
tych dwóch
odpowiedzi badany wybiera czterech (DMI)
lub (DMI-2) podanych. Odpowiedzi punktuje w skali od O do 3 (w za-
od stopnia ich
Testy DMI przeznaczone dla dzieci w wieku szkolnym. Przeprowadza je
indywidualne lub grupowo od wersji) w trakcie dwu sesji. Czas badania
testami DMIjest nieograniczony. Wersje przeznaczone do indywidualnych
tym od wersji do grupowych, w tych pierwszych przewi-
dziane jest zbieranie od dzieci odpowiedzi. Wersje przeznaczone do
indywidualnych diagnozy psychometrycznej
z ideami diagnozy dynamicznej.
Testy DMI zamiast, lub jako testu inteligencji,
w celu oceny ogólnego poziomu dziecka. Ponadto one
przydatne w diagnozowaniu stopnia rozwojowego zaawansowania ope-
racyjnego i w jego deficytów. to istotne prognozowania
szkolnych lub wykrywania przyczyn w nauce. Uzyskiwane
infonnacje z indywidualnych)
pomocne przy planowaniu korekcyjno-wychowawczych.
Testy DMI wybranych, najbardziej znanych w Polsce skal
rozwojowych.

28
2. wybranych testów psychologicznych

2.1.2. Testy inteligencji ogólnej i


Testy opisane w niniejszym podrozdziale przeznaczone dla osób
wykorzystane w badaniach dzieci i
Jednak nie one w swojej konstrukcji specyfiki zmian
cych wraz z rozwojem
Jednymi z bardziej rozpowszechnionych tego typu Testy Matryc
Ravena, od osoby badanej,
jej pochodzenia itp. one aktualne spostrze-
gania, a logicznego
Testy Matryc Ravena przeznaczone do grupowych,
przy ich pomocy pojedyncze osoby. Testy te kilka wersji.
od wersji testu, podstawowe wszystkich jego odmian
jednakowe. Testy Matryc testami niewerbalnymi. Zadania
nych wzorów (matryc), w których fragment. Osoba
badana musi elementy matrycy i
element wzoru z podanych alternatywnych (rys. 2.2.).

2 3

O C) L:) V V V I (] C
O O O V
er-
V
-o-
V
---o
-er il
V
O O D o-
n
V
-o-
n D C- D
I 234 2 3 .4

[®wOOW
S 6 7 8 S 678 5 678

IX)I pDI X)
Rysunek 2.2. do pozycji testowych Testu Matryc Ravena

Zadania w serie. W od wersji, liczba zada11 w serii,


a samych serii jest Zarówno serie, jak i zadania w seriach
stopnia Poszczególne wersje testu matryc
poziomem poszczególnych jak i serii.
Poszczególne wersje przeznaczone dla osób o poziomie intelektu-
alnym i w wieku. Najbardziej znana jest wersja Standard, która posiada 29
Krzysztof Fronczyk

trzy fonny: oraz Plus. Ponny Klasyczna i


tym samym poziomem podczas gdy forma Plus
jest znacznie od nich trudniejsza. Oprócz wersji Standard, istnieje Test Matryc
w wersji Kolorowej oraz Test Matryc w wersji Dla Zaawansowanych.
Test Matryc Ravena w wersji Standard - fonna Klasyczna (TMS-K)
stworzony z o badaniu osób o ale nie skrajnie wysokim
lub skrajnie niskim poziomie rozwoju Na wykorzystuje
go do badania osób o poziomie Dla osób o
inteligencji jest on za trudny, dla osób wybitnie zdolnych - za Wersja
Dla Zaawansowanych natomiast szczególnie we wszystkich
tych przypadkach, w których chodzi o wybranie osób o spraw-
intelektualnej (Jaworowska i Szustrowa, 1992).
Test Matryc Ravena w wersji Kolorowej (TMK) przeznaczony jest dla dzieci
w wieku 5-10 lat i osób o intelektualnych. Zadania
jak w wersji Standard i Dla Zaawansowanych z tym,
znacznie i wydrukowano je w na barwnym tle (w wer-
sji Standard i Dla Zawansowanych wszystkie pozycje testowe
Badanie tym testem przeprowadzane indywidualnie (naj dzie-
ci) lub w grupach (Jaworowska i Szustrowa, 1992).
Testy Matryc Ravena z najbardziej znanych i stosowa-
nych testów na w praktyce psychologicznej (Jaworowska i Szustrowa,
2000). te wykorzystywane do selekcji kandydatów do
pracy na typu stanowiska, poziomu intelektu-
alnego. Testy Ravena osób o inteli-
gencji. Wszystkie opisane wersje testów Ravena polskie aktualne ada-
ptacje i stosowane w diagnozie indywidualnej w naszym kraju.
Innym powszechnie na przeznaczo-
nym do pomiaru inteligencji Skale Inteligencji Wechslcra. Jest to grupa na-
przeznaczona dla osób w wieku. z tych skal
Amerykanin - David Wechsler w 1939 roku. wersja dla
dzieci. Skale Wechslera sobie i wraz z
czasu wielokrotnie uaktualniane, a zaadaptowano je do w wie-
lu
Skale Inteligencji Wechslera nie jednorodnymi testami
z o podobnej konstrukcji czy formie. Skonstruowane one jako na-
z pewnej liczby testów od wersji skali) i z tego
powodu nazywane bateriami. Testy (zwane "podtestami", ze na
to, w Skal Wechslera
na dwie grupy: testy werbalne oraz testy niewerbalne. Oprócz wyniku, w
dym z podtestów, jest obliczenie wyniku testów werbalnych
30 (zwanego werbalnym ilorazem inteligencji), wyniku testów niewerbalnych (zwa-
2. wybranych testów psychologicznych

nego niewerbalnym ilorazem inteligencji), a ogólnego ilorazu inteligencji


obliczanego na podstawie wyników wszystkich testów.
Najbardziej znana jest Skala Wechslera przeznaczona do pomiaru inteligen-
cji osób Obecna wersja tego testu tzw. WAIS-R (Wechsler Adult
Intelligence Scale-Revised) zawiera podtestów werbaln,ych oraz podte-
stów niewerbalnych. Do testów werbalnych testy o nazwach:
Rozumienie, Arytmetyka, i Powtarzanie
Cyfr. Test bada ogólny zakres zgromadzonych informacji oraz po-
zgromadzonymi w Zawiera
on pytania wiedzy ogólnej na temat z historii, zna-
nych osób, geografii, literatury czy naukowych. Pytania te charak-
ter otwarty, co czasem stwarza w ocenianiu odpowiedzi. Test
bada i uczenia Jest to typowy
test stosowany w przeznaczonych do badania werbalnych.
Jego pozycje testowe z pojedynczych (takich, jak np. "rok",
"chleb", "sen", "wieczny", a zadaniem osoby
badanej jest podawanie ich Test Rozumienie bada
i moralnych oraz rozumienie i ocenianie
sytuacji on z od badanego uzasad-
niania norm i zwyczajów, a rozumienia
Test Arytmetyka bada rozumowanie liczbowe i tempo manipulacji liczbami, kon-
i rozumowanie logiczne, abstrakcyjne. on z
arytmetycznych z np. na obliczaniu reszty przy
w sklepie itp. zadania, badany nie
ani innymi pomocami, czas zadania
jest ograniczony do 60 lub (w przypadku trudniejszych) 120 sekund. Test
bada rozumowanie przez i operowanie
z pozycji tego testu zawiera przedmioty lub
Zadaniem osoby badanej jest znalezienie co te Zwykle
chodzi o wskazanie wspólnej kategorii, do której przedmioty
cia czy wspólnej W testach
Rozumienie i pozycje testowe charakter otwarty,
a odpowiedzi badanego oceniane na trzpunktowej skali, w której O oznacza
1- a 2-
Test Powtarzanie Cyfr bada do koncentracji uwa-
gi i uczenia Pozycje testowe z szeregu cyfr, któ-
re odczytywane na badanemu przez psychologa (badany nie widzi tych
cyfr). Zadaniem badanego jest powtarzanie tych liczb wprost jak i wspak.
pozycje proste i z liczby cyfr (np. 5 - 3 - 9),
jednak 9 cyfr nie jest w stanie prawie nikt.
Testami niewerbalnymi w WAIS-R Braki w obrazkach, ob-
razków, Klocki, i Symbole cyfr. Test Braki w obrazkach bada percep- 31
Krzysztof Fronczyk

z figur, detali istotnych od


nieistotnych oraz spostrzegania. W tym badanemu prezentowane
rysunki znane przedmioty czy sytuacje. Na z rysun-
ków opuszczono Zadaniem osoby badanej jest wskazanie braku-
elementu. zadanie tego testu prezentuje rys. 2.3.

Rysunek 2.3. zadania do pozycji testowych testu Braki w obrazkach


ze Skali Wechslera

Test obrazków (rys. 2.4.) bada rozumienie sytuacji interperso-


nalnych i przewidywania konsekwencji. Zadania tego testu zawie-
po kilka obrazków wydrukowanych na kartonikach. Obrazki te
w taki sposób, aby zachowana czasowa

;I·
po sobie kolejnych

A B c

t
i

Rysunek 2.4. zadania do pozycji testowych testu


obrazków ze Skali Wechslera

Test Klocki bada oraz analizy


i syntezy. on z klocków, których dwie
ki pomalowano na dwie na czerwono, a dwie w pomalowane
na i czerwono w ten sposób, linia na
i (rys. 2.5.).
32
2. wybranych testów psychologicznych

Rysunek. 2.5. Elementy testu Klocki ze Skali Wechslera

Poszczególne pozycje testowe z kartoników na których wydru-


kowano kombinacje klocków. to dwuwymiarowe (rys.
2.6.). Zadaniem osoby badanej jest odwzorowanie poszczególnych za
klocków.

Rysunek. 2.6. Wzór do klocków, jakie w Klocki


ze Skali Wechslera

Test bada podobnych konfiguracji,


analizy i syntezy, a ma-
nipulacji. Zadania tegó testu na pewnych (np. twarzy
z fragmentów obrazka (rys. 2.7. i 2.8.).

Rysunek 2.7. Elementy pozycji testowej do testu ze Skali


Wechslera 33
Krzysztof Fronczyk

Rysunek 2.8. elementy pozycji testowej z rys. 2.7.

Test Symbole cyfr bada uczenia i krót-


Test ten ze swego rodzaju szyfru
z cyfr pewne symbole graficzne. Zadaniem osoby badanej jest
zakodowanie cyfr przy podanego szyfru. Czas wykonania
jest ograniczony tak, aby badany nie wszystkich cyfr
(których jest 100) w wyznaczonym czasie (rys. 2.8.). poszczególne
osoby tym, jak cyfr im w czasie
(Homowska, 2004).

Rysunek 2.9. zadania do pozycji testowych testu Symbole cyfr ze


Skali Wechslera

Oprócz WAIS-R, przeznaczonego dla osób 18 lat, stworzono wer-


dla dzieci od 6 do 17 lat (WICS-R - Wechsler Intelligence Scalejor Chidren-
Revised) oraz dla dzieci od 4 lat do 6,5 roku (WPSSI - Wechsler
Preschool and Primary Scale oj Intelligence). Wersja dla dzieci z ta-
kich samych testów i jak wersja dla (oczywi-
o innym poziomie Dodatkowo WISC-R zawiera test Labirynty
(rys. 2.10.) przeznaczony do badania koordynacji wzrokowo-ruchowej i orienta-
cji w przestrzeni. Zadania tego testu na znalezieniu z labiryntu,
przy czym poszukiwanie drogi rozpoczyna od labiryntu. Test
z szeregu labiryntów o poziomie

34
2. wybranych testów psychologicznych

Rysunek 2.10. zadania do pozycji testowych testu Labirynt ze Skali


Wechslera dla dzieci

Skale Wechslera do pomiaru poziomu inteligencji ogólnej przede wszyst-


kim w praktyce psychologicznej np. w poradnictwie szkolnym i zawodowym,
a w psychologii klinicznej. Badanie Wechslera dostarcza informacji
wszechstronnego opisu funkcjonowania poznawczego
temu jest diagnoza szczególnych i intelek-
tualnych oraz zaniedbanych, sfer funkcjonowania poznaw-
czego. Jest to u dzieci, obszarów,
w których dziecko powinno szczególnie stymulowane, by
szy rozwój swojego intelektu. jest zdiagnozowanie sfer funkcjo-
nowania intelektualnego, w których szczególnie niekorzystne zmiany np.
vi wyniku uszkodzenia mózgu czy innego procesu chorobowego.
Skale Wechslera przeznaczonymi do indywidualnych
i nie stosowane w badaniach grupowych. Wynika to ze pro-
cedury badania, od diagnosty zarówno prezentowania
testowego pomocy testowych, ustnego zadawania itp), zapi-
sywania odpowiedzi badanego, jak jednoczesnego rejestrowania czasu wy-
konania poszczególnych WAIS-R i WICS-R aktualne polskie ada-
ptacje i stosowane w naszym kraju Gaul, Homowska,
Machowski, Zakrzewska, 2005; Matczak, Piotrowska, Ciarkowska, 1998).
Oryginalnymi polskimi przeznaczonymi do pomiaru zarówno in-
teligencji ogólnej, jak i wybranych baterie testów APIS-Z i APIS-P
(Matczak, Jaworowska, Ciechanowicz, 2006; Matczak, Jaw:orowska,
Ciechanowicz, Zalewska, 2005).
Bateria Testów APIS-Z przeznaczona jest dla
studentów i natomiast APIS-P jest stworzonym
z o uczniach w szkole podstawowej, 35
Krzysztof Fronczyk

do gimnazjum i w szkole ponadgimnazjalnej. Jak


nietrudno pozycje testowe, w baterii testów
APIS-Z, trudniejsze te w APIS-P.
Podobnie jak Skale Wechslera, baterie APIS z pewnej
liczby testów. je, cztery typy abstrakcyjno-
-logiczne, werbalne, wzrokowo-przestrzenne i z tych
dwa testy. Tak APIS-P i APIS-Z z testów:
Klasyfikacja, liczb abstrakcyjno-logiczne), Synonimy,
Nowe werbalne), Kwadraty, Klocki wzrokowo-prze-
strzenne), Zachowania, Historyjki testów
z 15 zadatl, a trzy - z 10. W dwóch testach zadania charakter
w - otwarty.
W celu przedstawienia baterii APIS omówiony zostanie charak-
ter pozycji testowych poszczególnych testów w jej Test
Klasyfikacja z w których podano kilka nazw obiektów nale-
do tej samej kategorii. Zadaniem badanego jest wybranie
ciu innych obiektów takiego, który do tej samej kategorii co obiekty
podane. pozycja testowa zawiera krowa. Do wy-
boru natomiast mamy: wróbel, krokodyl, mysz, Drugi z testów
przeznaczonych do pomiaru abstrakcyjno-logicznych, jakim jest test
liczb, zawiera pozycje testowe z trzech par liczb,
z tym, trzecia para jest i tylko z pierwszej liczby. W
parze druga liczba jest wynikiem pewnego matematycznego na liczbie
pierwszej. pierwsze dwie pary, jakie jest to dzia-
i odpowiednio (rys. 2.11.).

15 5 0,3 0,1 9

Rysunek 2.11. zadania do pozycji testowych testu


liczb baterii APIS

W Synonimy zadania na dopisywaniu synonimów podanych


Za razem podano na ma
wyraz bliskoznaczny oraz kropek, liczbie jego liter
(np. kartofel- z ....... ). W Nowe z pozycji testowych
z trzech wyrazów, ten sam ten nie
jest wydrukowany, a zadaniem osoby badanej jest jego znalezienie tak, jak zapre-
zentowano to na rys. 2.12.

36
2. wybranych testów psychologicznych

/"

wica

let

Rysunek 2.12. zadania do pozycji testowych testu Nowe ba-


terii APIS

Test Kwadraty z wielobocznych figur. z takich figur


tak w na dwie za jednej linii prostej, aby po
odpowiednim obróceniu elementów kwadrat. Zadaniem
osoby badanej jest znalezienie takiego (rys. 2.13.).
wybranych liczb na bokach figury.

12 13

7 8

4 3 2

Rysunek 2.13. zadania do pozycji testowych testu Kwadraty baterii


APIS

Test Klocki ma wprawdzie z testów Skali Wechslera,


jednak zadania tego testu inny charakter. one na zliczaniu
klocków, z jakich zbudowano przedstawione na rysunkach
przestrzenne konstrukcje (rys. 2.14.). polega na tym, na-
te klocki, które niewidoczne, a badany musi sobie je
.

37
Krzysztof Fronczyk

Rysunek 2.14. zadania do pozycji testowych testu Klocki baterii


APIS

w Zachowania wymaga od badanego podawania


norm Jest to test podobny do testu Rozumienia ze Skali Wechslera
z w Zachowania pytania charakter Warto
nie chodzi tu o lecz o rozumienie
ich sensu. Test Historyjki przypomina jeden z testów Skali Wechslera,
a mianowicie - obrazków. polega na tym,
w obrazków poszczególne obrazki wydrukowane od-
dzielnych kartonikach, a w Historyjki -na kilku stronach zeszytu, w jakim
umieszczono testy skali APIS. W Historyjki badany nie ma
swobodnego przesuwania obrazków tak, jak w
obrazków.
W baterii APIS, oprócz wyniku, w z testów jest oblicze-
nie wyniku wszystkich testów interpretowanego jako miara inteligencji
ogólnej.
Baterie APIS zastosowanie w selekcji kandydatów do pracy, a
doradztwie zawodowym oraz poradnictwie szkolnym. APIS-P na
trafne prognozowanie szkolnych.
Baterie APIS wykorzystywane zarówno w badaniach grupowych,
jak i indywidualnych. Czas wykonywania testu jest ograniczony,
co oznacza stoperem przez
badanie. Po czasu przeznaczonego na wykonanie danego testu, prze-
rywa badanemu nad wykonywaniem dalszych jego i poleca mu
do kolejnego testu. czas wszystkich testów
baterii APIS- Z wynosi 60 minut, a APIS- P-58 minut.
Oprócz baterii testów, takich jak skale Wechslera czy APIS, które przezna-
czone do pomiaru testy, do pomiaru
pojedynczych
Jednym z tego typu testów jest polski test Leksykon (Jurkowski, 1997). Jest
38 on przeznaczony do pomiaru werbalnych. niemu jest
2. wybranych lesIów psychologicznych

ocena zasobu i korzystania z tego zasobu stosownie do


kontekstu. Skonstruowany on z o grupowych badaniach
w wieku 12-17 lat. Czas badania nie jest ograniczony, ale jego
nienie zajmuje badanemu 50 minut.
Leksykon z 60 pozycji, zgrupowanych w jednorod-
nych pod formy i sposobu pracy. Test podzielony jest na dwie
Pierwsza z nich przeznaczona jest do oceny biernego
a druga - czynnego.
pozycji testowych wchodzi w typu a
- w typu otwartego. Zadania testu Leksykon na
odnajdywaniu synonimów wyrazów Gest to test podobny do
testu Synonimy z baterii APIS z wyrazy bliskoznaczne wyszukuje
podanych), sensownym uzupehlianiu podanymi wyrazami, usta-
laniu nazw dla rzeczy zdefiniowanych lub opisanych oraz znajdowaniu typowych
przymiotnikowych dla danych rzeczowników.
Zadania otwarte w zdaniach synonima-
mi, luk w zdaniach i znajdywania podanym
definicjom.
Wszystkie zadania wydrukowane w jednym zeszycie testowym. Wyniki te-
stu Leksykon nie tylko od posiadanego przez badanego zasobu lecz
od korzystania z niego, a - w mniejszym stopniu - od
kompetencji gramatycznych i ortograficznych.
Test Leksykon znajduje zastosowanie w badaniach naukowych, poradnictwie
szkolnym i zawodowym.
Oprócz testu Leksykon, istnieje ogromna liczba innych
przeznaczonych do diagnozy poszczególnych W Polsce jednak nie po-
siadamy aktualnie stosowanych testów tego typu przeznaczonych do powszech-
nego

2.2. Kwestionariusze i temperamentu


Kwestionariusze, w do testów inteligencji i od-
do wiedzy osób badanych na temat. Pozycje testowe zawarte
w kwestionariuszach na samoopisie. Nie rejestruje w nich
zachowania osoby badanej, a jej o zachowaniu.
kwestionariusz to ustrukturowany wywiad, z
sam badany prezentuje sobie poszczególne pozycje testowe (zwykle odczytuje
je z wydrukowanego formularza).
Istnieje odmiana kwestionariuszy oparta nie na relacji na temat
zachowania, a na relacji osoby badanej na temat zachowania osób trzecich. Tego
typu kwestionariusze wykorzystuje zwykle w badaniu dzieci, które nie
jeszcze lub ich samowiedza jest zbyt aby 39
Krzysztof Fronczyk

do samoopisu. takiego in-


wentarzajest kwestionariusz temperamentu EAS. Kwestionariusz ten
jest przez jednego z rodziców lub nauczyciela badanego dziecka. Z tego powodu
jego pozycje testowe w trzeciej osobie liczby pojedynczej
np. "Lubi z
do tego specyficznego rodzaju inwentarzy jednocze-
pierwszym kwestionariuszem, jaki opracowano. Dokonali tego holenderscy
badacze - Gerard Heymans i Enno D. Wiersma, którzy w 1905 roku opracowali
pierwszy inwentarz temperamentu. W kwestionariuszu tym, przez
lekarzy, pytania aspektów zachowania
ka. Pytania tego kwestionariusza nie osoby go a ludzi
dobrze znanych osobom na pytania inwentarza.
Heymansa i Wiersmy w USA Woodworth, który w 1917 roku opu-
Arkusz Danych Osobistych ze 116 pytal'l.
aspektów przystosowania, uznanych przez autora za symptomy nerwi-
cowe. Inwentarz stworzony przez Woodwortha przeznaczony do wychwyty-
wania osób neurotycznych przy kwalifikacji poborowych do armii
(Zawadzki, 2006). Od tego czasu rozwój rodzaju kwestio-
nariuszy. W chwili obecnej na istnieje ogromna liczba inwentarzy
do pomiaru naj rozmaitszych cech stosowanych we
wszystkich dziedzinach praktyki psychologicznej. zaprezentowano naj-
kategorie kwestionariuszy oraz wybrane ich
kwestionariuszy dwie grupy. z nich
wielu psychicznych. Ich autorzy
mieli zwykle na celu psychiki" lub, przynajmniej, ca-
sfery psychicznej, np. czy temperamentu. Do
drugiej grupy inwentarze przeznaczone do diagnozypojedyn-
czych wybranych psychicznych, np. czy stylu
funkcjonowania psychicznego w aspekcie. Dalej opisane
do obu tych grup.

2.2.1. Inwentarze przeznaczone do diagnozy jako


kwestionariuszy takie które
w zamierzeniu swoich twórców struktury
ka. Do inwentarzy tego typu np. MMPI, Kwestionariusz Guilforda-
Zimmermana, Kwestionariusz Cattella (16PF), Inwentarz Psycho-
logiczny Gougha (CPI), kwestionariusze Eysencka (MPI, EPQ, EPQ-R),
Formalna Charakterystyka Zachowania - Kwestionariusz Temperamentu
(FCZ-KT), Kwestionariusz Temperamentu EAS, kwestionariusze przeznaczo-
ne do pomiaru wielkich czynników (NEO-PI, NEO-FFI,
40 NEO-PI-R).
2. wybranych testów psychologicznych

Jednym z pierwszych tej grupy, popular-


na jest Minnesota Multiphasic Personality Inventory (MMPI).
Inwentarz ten skonstruowany w latach czterdziestych XX wieku w USA
przez Hathawaya i McKinleya (Anastasi i Urbina, 1999). Pierwotnie on prze-
znaczony do diagnozy rodzaju psychicznych. Jednak bardzo
szybko go do co raz to nowych celów, poza
pierwotne zastosowanie. MMPI szeroko stosowany do diagnozy osobowo-
osób normalnych w badaniach selekcyjnych i kwalifikacyjnych do
miejsc pracy, wykorzystywano go w wojsku oraz
MMPI zawiera 566 na które osoba badana "praw-
da", "to pytanie mnie nie dotyczy" "nie
Pytania m.in. ogólnego stanu zdrowia, spraw rodzinnych, problemów
szkolnych, politycznych i postaw wobec religii, postaw
wobec seksualnego, nawyków, nastroju, psychopatologicznych.
MMPI z 10 skal: Hipochondrii, Depresji, Histerii, Psychopatii,
Paranoi, Psychastenii, Schizofrenii oraz Hipomanii.
Dodatkowo kwestionariusz ten zawiera tzw. skale kontrolne, przeznaczone do
pomiaru tendencji osoby badanej do udzielanych odpowiedzi.
MMPI w rozwoju psychometrii. Wielu badaczy wyko-
pozycje testowe tego kwestionariusza, skale przeznaczo-
ne do pomiaru rodzaju cech psychicznych. Wraz z rozwojem psycho-
metrii wykorzystywano odmienne rodzaje strategii w tworzeniu tego typu skal.
jego polska wersja.
Mimo ogromnego znaczenia MMPI jest o charakterze hi-
storycznym. Ogromna liczba naukowych z wykorzystaniem MMPI wy-
jego liczne psychometryczne (Anastasi i Urbina, 1999). Ponadto
w JIlinionego znacznie wiedza na temat
oraz jej Co w czasu, jaki
od stworzenia MMPI, rozmaite zmiany kulturowe
pozycji MMPI nie odzwierciedla dobrze psychicznych, do pomiaru
których stworzone. Polska, adaptacja MMPI jest stara, a do-
datkowo wykonana ona bez zgody praw autorskich (szerzej
7.6.). Te wszystkie fakty MMPI obecnie nie powinien
stosowany w praktyce psychologicznej.
Ze na charakter MMPI opracowano jego -
MMPI-2. Obecnie prace nad jego
MMPI wielu twórców znanych obecnie inwentarzy osobowo-
Jednym z w którym wykorzystano pozycji kwestio-
nariuszowych MMPI jest Psych%gical Inventory (CPI) (Anastasi
i Urbina, 1999). W do MMPI on skonstruowany z
o ludzi normalnych. W najnowszej wersji
on z skal: Dominacja, Tolerancja, Ambicja, podobania 41
Krzysztof Fronczyk

Swoboda towarzyska, Powodzenie przez konfor-


mizm, Poczucie Powodzenie przez Dobre samo-
poczucie, psychologicz-
na, Opanowanie oraz W 1987 roku ten
zestaw jeszcze dwiema skalami Empatii i (Anastasi
i Urbina, 1999).
CPI jest wykorzystywany do wielu celów. Znajduje on zastosowanie m.in.
w selekcji pracowników i planowaniu kariery zawodowej, a w psychologii
klinicznej.
Innym inwentarzem z z MMPI
jest 16-czynnikowy kwestionariusz Cattella (16PF) (Sanocki, 1986).
Obecnie istnieje wydanie tego kwestionariusza. Kwestionariusz ten
przeznaczony jest do badania 16 wymiarów które na
czynników
W najnowszym wydaniu kwestionariusza Cattella, oprócz wyni-
ków poszczególnych skal, oblicza trzy stylu odpowiadania,
do zgadzania odpowiedzi
oraz do przedstawiania w nadmiernie korzystnym lub niekorzystnym

problem ze stosowaniem zarówno CPI, jak i 16 PF polega na tym,


nie aktualne, legalne, polskie adaptacje tych kwestionariuszy. Dla obu
tych kwestionariuszy nie ma aktualnych polskich norm. adapta-
cje (Kotas, Markowska, 1971; Nowakowska, 1970) wymicnionych zo-
opracowane lat temu i dawno dezaktualizacji.
kwestionariuszy Hans Jurgen Eysenck. Swoje
inwentarze w latach czterdziestych XX wieku. Jeden z pierwszych
kwestionariuszy Eysencka - Maudsley Medical Questionnaire (MMQ) -
jedynie do diagnozy nerwicowych. Wraz z rozwojem swojej teorii oso-
stopniowo Eysenck nowe wymiary oraz zastoso-
wania swoich inwentarzy. Kolejno Maudsley Personality Inventory
(MPI) (w którym Eysenck Personality Inventory
(EPI), Eysenck Personality Questionnaire (EPQ) (w którym dodano psychotyzm)
i jego zmodyfikowana wersja - Eysenck Personality Questionnaire - Revised
(EPQ-R), która ma (Brzozowski, Drwal, 1995) i jest
powszechnie stosowana w Polsce. Z tego powodu zostanie on omówiony nie-
co
Kwestionariusz EPQ-R opublikowany w 1985 roku (Eysenck, Eysenck,
Barrett, 1985). Kwestionariusz ten oparty jest na koncepcji Eysencka
i zawiera skale podstawowym wymiarom
tej koncepcji: ekstrawersja - introwersja, neurotyzm
emocjonalna) i psychotyzm do dziwnych, nietypowych
42 czy nawet skala która mierzy
2. wybranych testów psychologicznych

uzyskiwania aprobaty lub do przedstawiania


w korzystnym
Kwestionariusz EPQ-R ze 100 na które oso-
by badane z dwóch odpowiedzi "tak" lub "nie".
badany nie na z podanych, musi która
jest prawdy. Badanie kwestionariuszem EPQ-R przeprowa-
zarówno indywidualnie, jak i grupowo. Czas badania nie jest ograniczony.
czas, potrzebny na kwestionariusza, wynosi oko-
20-25 minut.
Kwestionariusz przeznaczony jest do badania osób i od
16. roku Aby na pytania, wystarczy pod-
stawowe. EPQ-R wykorzystywany jest do prognozowania powodzenia w nauce
szkolnej i na studiach, w poradnictwie zawodowym jako metoda prognozowania
dostosowania jednostki do charakteru pracy na stanowisku, a
przy dokonywaniu wyboru zawodu. EPQ-R stosowany bywa
w bardziej zagadnieniach diagnostycznych, np. przy prognozo-
waniu powodzenia w wybranej dyscyplinie sportowej czy w poradnictwie
i rodzinnym.
Bardzo popularne we psychologii inwentarze
na modelu wielkich czynników tzw. "Wielkiej
(McCrae i Costa, 2005). Do grupy tej innymi kwestio-
nariusze NEO-FFI i NEO-PI-R, swoje polskie adaptacje. Podobnie jak
w teorii Eysencka, w modelu "Wielkiej jest
i ekstrawersja. Psychotyzm natomiast rozbity jest na dwie cechy:
i Dodatkowo wprowadzony jest nowy wymiar: na do-
Na czynnik o poziomie
daje to 30 podwymiarów.
KwestionariuszNEO-PI-R daje pomiaru w zakresie z tych
30 podwymiarów, w do NEO-FFI, któremu uzy-
dane tylko ogólnych wyników superczynników osobowo-
Istotne jest to, wszystkie skale kwestionariuszy NEO nor-
malnej w do kwestionariuszy Eysencka czy MMPI
(Zawadzki, Strelau, Szczepanik i 1998).
Pozycje kwestionariuszy NEO-FFI oraz NEO-PI-R stanowi odpowiednio 60
oraz 240 o charakterze samoopisowym, których w sto-
sunkudo osoby badany ocenia na skali (od
nie zgadzam" do zgadzam").
Kwestionariusze NEO rekomendowane do badal1. naukowych, a w przy-
padku NEO-FFI do stosowania w diagnozie indywidualnej dokonywanej
na potrzeby praktyki, w tym w obszarze edukacji oraz doradztwa zawodowego
i selekcji (np. prognozowanie adaptacyjnych do szkol-
nego lub zawodowego) oraz psychologii zdrowia. kwestionariusze NEO 43
Krzysztof Fronczyk

z poznawaniu zdrowej to czasem


one zastosowanie w psychologii klinicznej (Siuta, 2006; Zawadzki, Strelau,
Szczepanik i 1998).
Do grupy kwestionariuszy wybranego obszaru
ludzkich inwentarze temperamentu.
takich inwentarzy dotyczy specyficznych teorii temperamentu. Z tego powo-
du one takie wymiary, jakie w danej teorii.
kwestionariuszy tcmperamentujest opracowany przez Zawadzkiego
i Strelaua (1997) inwentarz pod Formalna Charakterystyka Zachowania -
Kwestionariusz Temperamentu (FCZ-KT).
kwestionariusza FCZ-KT stanowi Regulacyjna
Teoria Temperamentu Strelaua (2001). on ze 120 pozycji, które
stwierdzeniami od badanego ustosunkowania w formie od-
powiedzi "tak" lub "nie". Pozycje 6 skal,
sensorycznej, emocjonalnej,
i
FCZ-KT przeznaczony jest do indywidualnych lub grupowych osób
w wieku 15-80 lat. Czas badania jest nieograniczony, zajmuje 30
minut. Kwestionariusz znajduje praktyczne zastosowanie w poradnictwie za-
wodowym i wychowawczym, a w badaniach naukowych i klinicznych.
to jest obecnie szeroko stosowane w Polsce.
Poszczególne inwcntarze wymienione w tym krótkim
wiele wspólnego, mimo w momentach historycznych
i aktualny, w danym momencie, stan rozwoju wiedzy psycho-
logicznej oraz metod psychometrycznych. cech w wy-
mienionych inwentarzach jest po pozorna. Mimo one
nazwy, wymiary zawarte w niektórych kwestionariuszach
jak odpowiedniki skal zawartych w innych inwentarzach lub jako
dowe innych wymiarów.

2.2.2. Inwentarze przeznaczone do diagnozy wybranych wymiarów

kwestionariuszy inwentarze wybranych


psychicznych, których autorzy nie mieli na celu ujmowania
czy temperamentu. one zwykle pojedynczych charakterystyk zachowa-
nia lub aspektów czy temperamentu, takich jak np. depresyj-
umiejscowienie poczucia kontroli, style radzenia sobie ze stresem, zainte-
resowania itd.
Jako pierwszy tej grupy przedstawiona zostanie,
w 1961 roku, Skala Depresji Becka (BOI). ona do oceny i nasi-
44 lenia objawów depresji. Ze na jest bardzo stoso-
2. wybranych testów psychologicznych

wana W badaniach psychologicznych. jej zajmuje 10 minut.


Skala z 21 do kolejnych pozycji kwestio-
nariuszowych, badany powinien która, jego zdaniem,
w najlepszy sposób opisuje jego stan. Za na pytanie badany
w od objawów, od O do 3 punktów,
przy czym liczby na nasilenie depresji.
Niestety, mimo wielkiej w praktyce klinicznej i badawczej, BDI
nie ma aktualnej legalnej polskiej adaptacji, w z czym nie powinien
stosowany w Polsce (pamowski i Jernajczyk, 1977). Korzystanie z kwestionariu-
sza Becka gdy aktualnie prace nad
nowej wersji tego - BDI-II.
innego kwestionariusza z omawianej grupy jest Inwentarz
Stanu i Cechy (STAI) autorstwa C.D. Spielbergera, R.L. Gorsucha i R.E.
Lushene'a. Jego budowa opiera na rozumianym
jako i uwarunkowany sytuacyjnie stan jednostki a rozumia-
nym jako cecha jako stan" odpowiedzialny
jest za wyników z sytuacji na jako cecha" dotyczy na-
tomiast od sytuacji indywidualnych pod
przejawów
Kwestionariusz STAI z dwóch
po 20 Za pierwszej STAI (X-l)
poziom traktowanego jako aktualny stan emocjonalny. Ta kwestio-
nariusza pozwala nawet w niewielkich czaso-
wych. druga STAI (X-2) dotyczy rozumianego jako cecha osobowo-
W obu osoba badana ustosunkowuje do stwierdzenia,
z czterech Wysokie punktowe
poziom
Kwestionariusz ten znajduje zastosowanie w psychologii klinicznej
(np. do badania chorych somatycznie, w celu poziomu aktualnego
z lub pacjenta zabiegami), a w selekcji
pracowników do zawodów niskiego poziomu STAI posiada
a stosowany w praktyce w naszym
kraju Sosnowski i Matusik, 2002).
Innym inwentarzem przeznaczonym do pomiaru specyficznego wymiaru oso-
jest Kwestionariusz do Badania Poczucia Kontroli (KBPK) (Krasowicz
i Kurzyp-Wojnarska, 1990). Kwestionariusz ten do pomiaru zmiennej oso-
zwanej poczuciem kontroli zachowania, -opisanej w teorii
uczenia Rottera (Reykowski, 1992). Pytania KBPK, które doty-
pozytywnych Sukcesów, natomiast pytania
negatywnych Niskie wyniki o poczuciu
kontroli a wysokie - o poczuciu kontroli Inwentarz
przeznaczony jest do badania w wieku 13-17 lat. Kwestionariusz ma 45
Krzysztof Fronczyk

dwie wersje, dla i gramatycz-


Zawiera pytania sytuacji w
(kontakty w grupie rodzinne, szkolne,
wolnego czasu itp.). KBPK stosowany jest przede wszystkim do ce-
lów badawczych, ewentualnie jako metoda
w praktyce psychologicznej.
Kwestionariusz Radzenia Sobie w Sytuacjach Stresowych (CISS) Endlera
i Parkera (Strelau, Jaworowska, Szczepaniak, 2005) przeznaczo-
ny jest do badania jakie ludzie w sytuacjach stre-
sowych, w trzy style radzenia sobie z,e stresem: styl skoncentrowany na
zadaniu, styl skoncentrowany na emocjach oraz styl skoncentrowany na unika-
niu. Ten ostatni styl dwie fonny: w
i poszukiwanie kontaktów towarzyskich.
CISS z 48 jakie ludzie
w sytuacjach trudnych. Badany na S-stopniowej skali
tego typu
Jeszcze innym wykorzystania kwestionariuszy jest Inwentarz
opracowany przez Frydrychowicz,
Matuszewskiego (1994), który pozwala na 9 grup
cych odpowiednie skale (Handlowo-Biurowe, Techniczne, Literackie, Rolnicze,
Wojskowe, Plastyczne, Naukowe, Muzyczne). Kwestionariusz ten
przeznaczony jest do do wyboru kierun-
ku dalszego to wykorzystywane w praktyce
psychologicznej, przy interpretacji wyników
nonny opracowane w 1991 roku, czyli dawno.
Inwentarz mimo przeznaczony do diagnozy jednego aspektu
jakim zainteresowania, posiada wiele wymiarów. wie-
ma Skala Agresji Buss Durkec (Drwal, 1995). Struktura
ta wynika z tego, w psychologii wiele rodzajów agresji. Skala
Agresji Buss Durkee zawiera siedem skal do fonn za-
chowania agresywnego (Atak, Negatywizm,
Uraza, Agresja Jest to o tyle o ile inne
ce na kwestionariusze jedynie ogólnej miary
bez przejawów tej cechy. Wyniki
wszystkich siedmiu skal, po zsumowaniu, ogólnego poziomu
agresji. Dodatkowo, w inwentarzu zawarta jest skala poczucia winy.
Skala Agresji Buss Durkee bywa stosowana w praktyce do badania
i a w praktyce klinicznej przy diagnozie agresyw-
pacjentów psychiatrycznych. Inwentarz ten nie do badania przyczyn
i intencji agresywnego zachowania, a jedynie poziomu po-
46 szczególnych rodzajów
2. wybranych lesIów psychologicznych

tego Choynowski (1972)


pod Nastroje i Humory. Obecnie jest to jednak adaptacja co
stosowanie jej w praktyce psychologicznej w Polsce.
Kofta, i Ignaczak (1977) opracowali do pomiaru ostat-
niego z wymiarów w Kwestionariuszu Nastroje i Humory, jakim
jest poczucie winy. Celem Kwestionariusza Poczucia Winy (KPW) wspomnia-
nych autorów jest zbadanie i czasu
nia poczucia winy. W kwestionariuszu tym przedstawiony jest badanemu szereg
opisy sytuacji. Zadaniem bada-
nego jest ich za przedstawionych do wyboru dwuwarian-
towych odpowiedzi. Decyzja o ich wyborze jest odzwierciedleniem przekonali,
i reakcji osoby badanej, na poczucia winy
jego brak.
Kwestionariusz Poczucia Winy nie stosowany w praktycc psycholo-
gicznej ze na brak aktualnych norm, go w bada-
niach naukowych. na ten temat w rozdziale 6.2.

2.2.3. Charakter pozycji testowych


w kwestionariuszach
2.2.3.1. pozycji testowych w kwestionariuszach
Po krótkim wybranych kwestionariuszy przejdziemy do opisu ty-
powych pozycji testowych, z jakich one budowane.
Pozycje testowe w kwestionariuszach naj rozmaitszych zagad-
Ogromna kwestionariuszy jest zrozu-
psychiczne bardzo
przejawy. Wernera i Pervina (1986) jest scha-
rakteryzowanie pozycji testowej ze na obszar funkcjonowania
psychicznego, a oraz ezas któ-
rego dana pozycja testowa dotyczy. na tych kryteriach klasyfikacji,
w dalszej przedstawione rodzaje pozycji testowych oraz ich
z inwentarzy.
pod obszar funkcjonowania psychicznego
pozycji testowych w inwentarzy na trzy
kategorie: przekonania, emocje oraz zachowania (Marody, 1976). Wob-
z tych kategorii podkategorie. I tak po-
zycji testowych dwie grupy.
z nich pozycje testowe, których z przekonaniami osoby ba-
danej na temat, czyli z takimi zagadnieniami, jak stosunek do samego
siebie czasem o rzeczach, o których nie wypada "Jestem
MMPI), przypisywanie sobie pewnych cech ("Czy masz usposo- 47
Krzysztof Fronczyk

bienie?"; EPQ-R) czy ("Czy potrafisz w


warunkach?"; KTS). pozycji testowych przekonatl
takie, które nie do osoby badanej, lecz do ogólnych
na temat w pozagrobowe"; MMPI),
czy opinii wobec kwestii ("Czy lepiej jest
w drogami?"; EPQ-R)
oraz innych ludzi ludzi, których znam, lubi
mnie"; NEO-FFI), a spostrzegania innych ludzi wobec osoby
badanej.
pozycji testowych emocji dwie grupy.
Do pierwszej z nich takie pozycje testowe, które
("Czy lubisz towarzyskie?"; MPI) czy
natomiast pozycje testowe, których koncentruje na uczuciach
wanych przez ("Czy czasem czujesz "podle" bez powodu?";
EPQ-R).
Pozycje, których koncentruje do jakiej-
kolwiek obserwowalnej badanego odwiedzam swoich zna-
jomych"; FCZ-KT). Do kategorii tej reakcje fizjologiczne
i zachowania, które poza ("Bardzo
w DOTS-R).
Oprócz tych trzech (przekonania, emocje, zachowania) kategorii
pozycji Angleitner i Riematm (1991) na pozycje kwestionariu-
szowe, które reakcji trudnych do zaobserwo-
wania przez innych ("W nocy dostrzegam po niebie chmury"; FCZ-KT,
"Czy budzisz na szybko i bez KTS).
od tego, do jakiej kategorii pozycje testowe inwentarzy
(przekonania, emocje, zachowania), to ich zarówno
jak i których nie inni";
SCL-90). Pozycje symptomów w inwenta-
rzach przeznaczonych do diagnozy czy psychicznych.
kwestionariuszy, uwa-
takie pozycje testowe, które sposobu zachowania
czyli formalnych aspektów zachowania ("Czy zwykle mówisz szybko?"; KTS).
Pozycje testowe tego typu nie specyficznych przejawów wybranego ob-
szaru funkcjonowania psychicznego (przekonania, emocje, zachowania).
natomiast one np. na tempie czy czasie trwania. Takie
pozycje charakterystyczne dla kwestionariuszy temperamentu (Angleitner
i Riemann, 1991).
Pozycje testowe w kwestionariuszach analizowane nie tylko pod
obszaru funkcjonowatlia psychicznego, lecz sytuacji, jakiej do-
Z tego trzy grupy pozycji testowych. Po pierwsze,
48 w kwestionariuszach spotyka pozycje testowe, w których nie sprecyzowano,
2. wybranych teslów psychologicznych

do jakiej sytuacji. Tego typu pozycje testowe to wszystkie przytoczo-


ne dotychczas Po drugie, pozycje testowe, w których w ogól-
nikowy sposób jakiej sytuacji chyba wszystko,
gdyby mnie sprowokowano"; IPSA, "Zwraca zmiana smaku wody,
gdy przebywam w nowym miejscu"; FCZ-KT). takie po-
zycje testowe, w których w jasny sposób ("W karnawale,
tylko mam w wielu zabawach, prywatkach";
krócej zwykle, to dnia rozbity (rozbita) i
czony FCZ-KT). Dwie ostatnie kategorie
pozycji testowych, w stosowanych kwestionariu-
szach (Werner i Pervin, 1986).
Oprócz oraz sytuacji aspekt czasowy, jakiego
pozycje testowe. Generalnie pozycje testowe do prze-
lub co jest odpowied-
nim czasem gramatycznym czasowników. Oprócz tego w kwestionariuszach spo-
tyka pozycje testowe w trybie (np.
bym przez czasu i zamiast
MMPI). jednak w kwestionariuszach
spotyka pozycje testowe (Werner i Pervin, 1986).
zagadnienie aspektu czasowego, jakiego pozycje testowe,
o wykonywania W niektórych po-
zycjach testowych stosuje w rodzaju: "czasa-
mi", "rzadko", "bywa, "przez czasu" itp. Inne pozycje testowe
w ogóle nie Oprócz pozycji testowych, do tych
dwóch przeciwstawnych grup, takie, których nie
jest jasna co do danej ta wynika
niekiedy z w takim aby one jedynie
a nie innych aspektów danego zachowania np. Jako
takiej pozycji testowej stwierdzenie z kwe-
stionariusza MMPI - "Ludzie mnie W zdaniu tym nie do
wiadomo, czy zniecierpliwienie u badanej osoby
szybko czy badany obserwuje u siebie takie zniecierpliwienie.

2.2.3.2. Forma pozycji testowych w kwestionariuszach


Pozycje testowe w kwestionariuszach, powinny
ujednolicone pod swej formy, czemu jest jedna-
kowy sposób udzielania odpowiedzi w danym inwentarzu. Ustosunkowanie
badanego do poszczególnych pozycji testowych polega zwykle na wyborze jed-
nej z opcji odpowiedzi, jakie zawarte w pozycji testowej. Liczba opcji
odpowiedzi bywa nazywana formatem odpowiedzi. z opcji odpowiedzi
jest pewna liczbowa, w jakim 49
Krzysztof Fronczyk

dana odzwierciedla W przypadku najprostszych dwu-


kategorialnych formatów odpowiedzi jedna z odpowiedzi wskazuj e na posiadanie
danej a druga - na jej brak. na posiadanie
danej cechy nazywana jest Jako po"
pytanie "Czy masz w z zaczerp-
ze skali intro-ekstrawersji kwestionariusza EPQ-R Eysencka.
jest tu "nie",
z innymi jest charakterystyczna dla osób o wysokim nasileniu ekstra-
wersji. Podobnie w innych pytaniach, na odpowiedzia-'
mi diagnostycznymi takie, które na bycie
to od pytania, zarówno odpowiedzi "tak", jak i "nie".
W z tym, odpowiedziom diagnostycznym przypisywany jest jeden
punkt, a odpowiedziom niediagnostycznym zero punktów to im suma
uzyskanych punktów za udzielone odpowiedzi na pytania skali intro-ekstrawersji
kwestionariusza EPQ-R, tym nasilenie ekstrawersji.
sobie w której kwestionariusz EPQ-R
skonstruowany w odwrotny sposób, tj. sumy uzyskanych punk-
tów za udzielone odpowiedzi na pytania skali intro-ekstrawersji na
nasilenie introwersji. Jednak w tej sytuacji
(czyli "tak" w przytoczonej po-
zycji testowej. Podobnie we wszystkich pozycjach testowych odpo-
wiedziami diagnostycznymi odpowiedzi odwrotne do tych, jakie
diagnostyczne w sytuacji, gdy suma wyników skali odpowiada
mu nasileniu ekstrawersji.
w podanym "nie" jest diagnostyczna
dla ekstrawersji, a "tak" - dla introwersji. to przeciwne bieguny tej
samej cechy psychicznej. w kwestionariuszu EPQ-R uzyskanie
szych wyników z nasilenie ekstrawersji,
jako wybrano "nie".
Jak to, co zostanie nazwane jest
umowne i od celu oraz przez danego
tego, na co niskie wyniki uzyskiwane w kwestio-
nariuszu, a na co - wysokie wyniki. W inwentarzach nie ma jednej
odpowiedzi tak, jak jest to w testach inteligencji i
Pozycje testowe tak jak przedstawiono to w po-
lub jednak od formy, zadaniem
badanego jest zawsze ustosunkowanie do pozycji testowej przez wy-
branie jednej z opcji odpowiedzi do niego. Opisany dwu..
kategorialny ("tak" "nie" czy "prawda" - format odpowiedzi to
jeden z najprostszych sposobów w kwestionariuszach.
on "nie wiem", "trud-
50 no ,,?" itp. Bardziej rozbudowane formaty odpowiedzi
Krzysztof Fronczyk

w ten sposób, aby najlepiej opisywaly one badanego. z przymiotników


jest diagnostyczny dla pewnej cechy psychicznej, do pomiaru której (lub któ-
rych) stworzona dana lista przymiotnikowa. Tak np. wybranie przy-
miotnika "ambitny" (w kwestionariuszu ACL) jest diagnostyczne dla potrzeby
o nasileniu tej potrzeby, a za jego
wybranie badany otrzymuje punkt. W omawianym typie kwestionariuszy
na z przymiotnikami, które o niskim nasileniu da-
nej cechy. Takim przymiotnik "niecierpliwy".
on o niskim nasileniu potrzeby Jego wybranie przez
jest z uzyskaniem punktu ujemnego. suma wszystkich
punktów uzyskanych przez w skali potrzeby wskazuje
na jej nasilenie.
Z innych sposobów udzielania odpowiedzi w kwestionariuszach warto wymie-
rangowanie na przypisaniu rang poszczególnym stwierdzeniom
w kwestionariuszu kryterium. Taki sposób
wykorzystany jest np. w Skali Rokeacha (Brzozowski,
1989). Zawarta jest w niej lista (np.
narodowe", Zadaniem badanego jest przypisanie
z liczb w taki sposób, aby je od do
najmmeJ
Na rodzaju pozycji testowych
w inwentarzach warto one czasem oznaczenia-
mi i symbolami graficznymi, poszczególne opcje odpowiedzi,
na celu odpowiadania. przedstawiamy ta-
kiej pozycji testowej z Arkusza Opisu Pracy Neuberger i Allerbeck
(w polskiej adaptacji Zalewskiej, 2001).
Pan/i teraz o tym wszystkim, co odgrywa w Panali pracy
(np. warunki pracy, koledzy, czas pracy itd.), to w jakim stopniu jest
Pan/i ogólnie zadowolony/a ze swojej pracy?
twarz"

Pytania
1. Jak kwestionariusze
2. Co jest informacji w testach inteligencji?
3. Jaki charakter pozycje testowe w kwestionariuszach
52 4. Podaj znanych Ci testów inteligenci i
2. wybranych testów psychologicznych

5. Czy testy grupowe w badaniach indywidualnych oraz czy


testy indywidualne w badaniach grupowych?
uzasadnij.
6. Podaj znanych Ci testów grupowych i indywidualnych.

Nie przedstawiamy tu konkretnych wskazówek litera-


tury. W celu zapoznania z testów psychologicznych, ogólnie
testowych.

53
3. CO TO JEST POMIAR PSYCHOLOGICZNY?

Krzysztof Fronczyk
PSYCHOLOGII
FINANSÓW I W WARSZAWIE

Niniejszy jest ogólnym podstawom pomiaru psychome-


trycznego, czyli pomiaru dokonywanego za testów i kwestionariuszy.
mierzenie i liczbami zjawisk psychologicz-
nych jest bardzo trudne czy Znacznie so-
bie mierzenie fizycznych (np. Zjawiska psychiczne
tak nieuchwytnym w porównaniu ze zjawiskami fizycznymi,
to jakiekolwiek Mimo to dawno w psycho-
logii próby mierzenia psychicznych.

3.1. natury mierzonych


w psychometrii
Pomiar nie jest tak prosty czy oczywisty jak pomiar
fizycznych, takich jak np. wzrost albo waga. W przeciwidlstwie
do fizycznych, cechy i stany psychiczne nie
obserwacji. Nie jest zaobserwowanie stanu
emocjonalnego czy poziomu inteligencji w taki sam sposób, w jaki
wzrost lub Z tego powodu wiele zmiennych psy-
chologicznych jako zmienne ukryte latentne), co oznacza brak
ich obserwacji (Strelau, 200 l).
Wydaje cech psychicznych jako ukrytych nie
ich mierzenia. Jak co nie jest obser-
wowalne? Aby to konieczne jest pewnych co do
natury tych nieobserwowalnych zmiennych.
I tak w psychometrii zmienne latentne roz-
maite stany, pod swego Innymi
psychiczne poszczególnym ludziom w stopniu.
Odzwierciedla to kontinuum, które jako
wielki, pod mierzonej cechy, zbiór ludzi. Na
jednym tego osoby o
nasileniu danej cechy, a na drugim - o nasileniu.
tymi osoby o nasileniach cechy.
54 takie rozumienie jest teoretycznym. Trudno sobie np.
3. Co to jest pomiar psychologiczny?

wieka o wysokim poziomie inteligencji,


ludzie o bardzo wysokim poziomie inteligencji. jest to, istnieje bardzo
stanów kontinuum. Tak
np. ludzie o stopniu inteligencji: od osób genialnych
a na osobach
osobami danej psychicznej
relacje. Niektóre osoby nasileniem
danej w porównaniu z innymi osobami. np.
Jan jest bardziej inteligentny od Piotra czy Lech jest mniej neurotyczny
od Zbigniewa. to relacji inteli-
gencji oraz neurotyzmu charakterystycznych dla wymienionych osób.
pod danej cechy psychicznej (np. inteli-
gencji) do nasilenia tej cechy, a nie jako-
o wielu innych psychicznych powie-
to zmienne a nie Tak ludzie
nasileniem neurotyzmu, ekstrawersji, i wielu innych cech
psychicznych, i wszystkie te wymienionych cech.
Zmienne jedynie tcgo, czy badane obiekty czy
takic same pod danym W ich przypadku nie o
nasileniu badanej kategoriami zmiennych
nie J;l1a stanów Zmienne te innym
kontinuum ccch psychicznych. zmiennej jest
W sensie biologicznym nie o jakichkolwiek stanach
a kobietami. nie jest opisywana przez kon-
tinuum, a przez dwie kategorie. zmienne nie
ujmowane w sposób nie one przedmiotem pomiaru psy-
chometrycznego.
wiele cech psychicznych ma charakter
do podania kolejnego u podstaw pomiaru.
to dotyczy nieobserwowalnej zmiennej. W psychome-
trii przyjmuje wiele cech ma normalny. Oznacza to, na kon-
tinuum cechy najrzadziej - skrajne
(zarówno skrajnie wysokie, jak i skrajnie niskie).
Oprócz charakteru zmiennych latentnych, w psychometrii przyj-
muje wszystkich ludzi pod wspólnych
dla nich cech. takie zwane jest nomotetycznym (Zawadzki, 2006).
Codzieima obserwacja, a badania naukowe na bardzo
ludzkich zachowa11, co pozornie tezie o istnieniu wspól-
nych dla wszystkich ludzi cech zachowania. bowiem to
ludzkich wynika z
ka, która jest uwarunkowana odmiennymi cechami psychicznymi w przypadku
osoby. Ten sposób rozumowania charakterystyczny jest dla 55
Krzysztof Fronczyk

idiograficznego. W nomotetyczne nie przeczy


cowaniu ludzkich wskazuje ono, specyfika jednostki
w unikatowym dla niej nasileniu poszczególnych (a nie w po-
siadaniu unikatowych, jej cech). Oprócz nasilenia
pojedynczych cech jest konfiguracja poszczególnych cech
rozpatrywana jako pod cecha
oraz to, cech
otrzymuje bardzo kombinacji po-
szczególnych cech. Te konfiguracje odpowiedzialne za
zachowaIlludzkich.

3.2. pomiaru
psychiczne nieobserwowalnymi zmienny-
mi, którym charakter o normalnym,
do zdefiniowania, czym jest pomiar psychologiczny. Pomiar psycholo-
giczny to liczb poszczególnym osobom w taki sposób,
aby relacje liczbami relacje za-
mierzonej (Magnusson,
1991). Tak mamy tu do czynienia, z jednej strony, z
a z drugiej - ze zbiorem liczb, które
poszczególnymi mie-
rzonej psychicznej, jak poszczególnymi liczbami
relacje. O pomiarze
wtedy, gdy relacje liczbami odzwierciedla-
relacje badanej cechy psychicznej.
Szczególnie istotne dwie relacje: i
dwóm lub osobom tej samej liczbowej opisuje w której
badanej cechy u tych osób jest takie samo. Natomiast
wanie dwóch liczb dwóm osobom oznacza, poziomy badanej
cechy u tych osób W ramach relacji
i dwóm osobom liczby, to
której z nich a której mniej-
Osoba, której charakteryzuje
szym nasileniem badanej cechy osoba, której
dwie jednostki lub równe pod pew-
nej cechy nie wyczerpuje jednakjeszcze pomiaru, które dotyczy tego, jak
wielka jest ta (Stachowski, 2008). Skoro bowiem badana cecha z
ma charakter i bardzo
to tym samym liczby, które powinny
56 w danej cechy.
3. Co lo jesl pomiar psychologiczny?

W celu osobom badanym liczb trafnie odzwierciedla-


badanych pod mierzonej cechy, psycholog musi
odpowiednimi które mu przeprowadzenie
takiego procesu takimi kwestio-
nariusze czy testy lub inne metody diagnostyczne, które nie omawiane szcze-
w tym czym innym jest zmienna
psychologiczna, a czym innym jej pomiar. Jedna zmienna psychologiczna
(np. inteligencja) zwykle mierzona na wiele sposobów (np.
testami inteligencji).
takimi jest z po-
miaru w psychometrii. Polega ona na tym, nigdy nie wiadomo, jakie relacje
reprezentowane przez wyniki pomiaru psychometrycznego. Jak dotychczas
nie opracowano metody czy relacje uzyskanymi
w procesie pomiaru liczbami odpowiadaj relacjom
badanej cechy. Aby o pomiarze zmiennych latentnych,
konieczne jest taka istnieje w Tak
do kolejnego bardzo istotnego relacje
zmiennej nieobserwowalnej odzwierciedlone przez
relacje liczbami przypisywanymi ludziom w trakcie pomiaru.
W celu lepszego czym jest pomiar, rozpatrzmy fikcyjny
pomiaru inteligencji. Pomiar inteligencji to oso-
bom badanym liczb w taki sposób, aby poziom inteligencji ba-
danych. któremu takie
jeden z wielu testów inteligencji, wystandaryzowana procedura obser-
wacyjna czy fizjologiczne inteligencji, takie jak np.
fal alfa czy latencja (Matczak, 1994).
do pomiaru inteligencji wybrano pewien test psychologiczny,
a w badaniu cztery osoby: A, B, C i D, które wyniki
przedstawione w tabeli 3.1.

Tabela 3.1. Hipotetyczne wyniki badania pewnym testem inteligencji

Osoba Wynik
A 100
B 130
C 70
D 100

Relacje liczbami uzyskanymi przez poszczególne osoby badane po-


winny relacje nimi pod badanej
cechy. osobie A 100 punktów oraz osobie D rów-
100 punktów odzwierciedla fakt, ich poziomy inteligencj i so- 57
Krzysztof Fronczyk

bie równe. osobie B 130 punktów w tej samej skali


inteligencj i odzwierciedla sytuacj w której osoby A i D mniej inteligentne
osoba B. Ponadto w poziomie inteligencji B jest
taka sama, jak Aa C.
nie chodzi tu po prostu o w wynikach zastosowanego testu inteligencji,
który jest tylko jednym z wielu sposobów pomiaru inteligencji, ale o to,
wyniki te poziom inteligencji osób badanych. Jak wspomnia-
no, inteligencja mierzona na wiele sposobów. Gdyby zastoso-
wano inne pomiarowe, inne liczby. Jednak
relacje nimi powinny takie same, jak w opisanym Tak
od wykorzystanej techniki pomiaru, wy-
niki osoba B jest najbardziej inteligentna, a osoba C - najmniej .
., Poziom inteligencji osób A i D powinien sobie równy. Dodatkowo osoba B
powinna o tyle samo inteligentniejsza od A (oraz D), o ile A (oraz D) jest
inteligentniejsza od C.

3.3.
Aby móc o jakichkolwiek ukrytych
nych, musimy obserwowalne zmienne, które
o zmiennych nieobserwowalnych. To, co psycholog to za-
chowanie Na jego podstawie o cechach psychicz-
nych, poszczególnym osobom. Przy czym zachowanie jest tu
rozumiane szeroko. to konkretne gesty, mimika twarzy
czy zmiany fizjologiczne (np. pocenie Widzimy, i na tej
podstawie przypuszczamy, smutek lub rozpacz.
trudne zadanie matematyczne i na
tej podstawie jest inteligentny. Te obserwowalne zachowania
o stanach czy cechach psychicznych nazywane
nim jest wnioskowanie o zmiennych ukrytych.
psychiczna I tak np.
o inteligencji nie tylko poprawne
matematycznych, ale np. podawania ra-
dzenia sobie w nowych sytuacjach uczenia i wiele in-
nych. Problem doboru odpowiednich komplikuje to, jeden i ten
sam Szybkie zadania
matematycznego nie musi z inteligencji, lecz np. ze spostrze-
i dobrego wzroku, które to
od kolegów.
Skoro jedna psychiczna ma wiele a jeden
z wieloma to
58 ników jest niejednoznaczna. Dzieje tak, zwykle ludzkie zachowanie jest
3. Co to jest pomiar psychologiczny?

wielu cech oraz sytuacji, w jakiej aktualnie znajduje.


widzimy i w eleganckiej restauracji przy jednym
stoliku i obiadu, to przy-
najmniej kilku powodów, dla których tam Po pierwsze,
obserwujemy pracowników jednej finny, którzy wyszli na obia-
to osoby bardzo towarzyskie, które nigdy nie obiadów
samotnie i zawsze do restauracji z ze znajomych z pracy.
jest nawet, to przyjaciele, którzy wspólnie obiad. Po drugie
jest, ta para jest wzajemnie zainteresowana i obserwujemy ich
podczas randki. I wreszcie, ostatnia interpretacja to taka, której
obie osoby bardzo a to, przy jednym stoliku jest czystym
przypadkiem.
Jak wszystkie podane interpretacje do takich zmiennych
psychologicznych, jak stan czy uczucie zakochania lub
Wszystkie te zmienne nie obserwowalne, charak-
ter latentny. W celu wnioskowania o którejkolwiek z wymienionych zmiennych,
konieczne jest znalezienie odpowiednich Jak pokazano w opisa-
nym jeden jakim jest zjedzenie wspólnego obiadu
zmiennych. Tak tylko to jedno zachowanie
nie jednoznacznie jego psychologicznych przyczyn. Konieczne
jest zatem zaobserwowanie jeszcze innych dodatkowych bo-
wiem pojedynczy nie jest jednoznaczny. W przytoczonym
np. czy obie osoby sobie w oczy, jak
szybko czy ze i wiele innych. Gdyby obie
osoby z opisanej scenki szybko i nie ze zbyt
ich zachowanie podyktowane jest stanem Gdyby
natomiast opisane osoby z i nie zbytniej
osoby te rozmowne i towa-
rzyskie. nie wyklucza to motywacji Z by
takie które o tym, opisana para jest
w trakcie randki.
Warto im lub razy zaobserwujemy u danej oso-
by zachowania na posiadanie danej cechy, tym bardziej
jej Tak z uznamy,
cechuje wysokim poziomem inteligencji, zaobserwujemy, potrafi on
nie tylko szybko i poprawnie zadania matematyczne, lecz
to wielokrotnie w trakcie lekcji, a co przyswa-
ja sobie oraz bogatym trudniej
Jasiowi jednorazowo zaobser-
wowali poprawne zadania przez Jasia.
powiedziano, pomiar psychologiczny polega na
waniu liczb osobom badanym. Z omówionego w psycho- 59
Krzysztof Fronczyk

metrii to polega na zliczaniu poszczególnych


danej cechy. Im danej cechy u osoby
badanej, tym poziom tej cechy.

.
2008).

wszystko to co do tej pory napisane o


im bierze pod tym
lepiej o psychicznych. Pojedyncze
niki bowiem niejednoznaczne, wiele psy-
chicznych. Z tego powodu testy psychologiczne zbudowane z wielu
ków, z których tworzy
w jednego nie oznacza, w celu
zdiagnozowania danej psychicznej konieczne jest zaobserwowanie
u konkretnej osoby wszystkich W. przypadku badanych
wszystkich zawar-
tych w danym Im w przypadku danej osoby
pewnej psychicznej, tym poziom tej
nej dana osoba posiada. Suma w przypadku
osoby badanej, czyli suma wyników poszczególnych pozycji testowych, jest wy-
nikiem ogólnym testu.

Wynik jest jest


punktów uzyskanych w poszczególnych

zachowatl traktowanych w testach jak cech lub


stanów jest z przyczyn, dla której testy psychologiczne z
liczby pozycji testowych. jest to, odpowiedzi na pojedyncze
pozycje testowe przypadkowe. Wprowadzenie wielu pozycji pozwala
na ograniczenie (ale nie na odpowiedzi przez to,
wynik danego testu jest uogólnieniem wielu tyl-
ko w przypadku jednego z nich uzyskano wynik przypadkowy, to nie on
w tak istotny sposób na wynik ogólny z wielu pozycji testowych,
w porównaniu do testu z bardzo liczby pozycji np. jednej
czy dwóch.
Testy z wielu pozycji testowych dlatego, ich licz-
ba precyzyjniejsze badanych Gdyby pe-
wien test tylko zjednej pozycji testowej o formacie odpowiedzi "tak"
i "nie", to badani zostaliby podzieleni jedynie na dwie grupy. Nie chodzi jednak
tylko o pokategoryzowanie ludzi, np. na dwie grupy ekstrawertyków i intrower-
60 tyków, cechom latentnym, do pomiaru których stosuje testy,
3. Co to jest pomiar psychologiczny?

charakter. psychologiczna jest bowiem


i prostych kategorii ludzi nie opisuje jej w sposób
Testy precyzyjnemu badanych,
Aby to test powinien wiele ka-
tegorii liczbowych. poziom badanej cechy czy stanu
psychicznego powinien swoje odzwierciedlenie w
wynikach testowych (Zawadzki, 2006).

3.4. pomiaru
Ostatnie zagadnienie, jakie zostanie omówione w niniejszym rozdziale, to pro-
blem odniesienia dla wyników testowych. o pomiarze, powie-
polega on na liczb.
dla danej osoby, nic wiemy nadal, o jak nasileniu badanej
cechy ona Musimy punkt odniesienia, czyli
z mogli uzyskane wyniki.
takim punktem odniesienia maksymalny
wynik w Skoro maksymalny wynik, to ma maksy-
malny poziom badanej cechy. analiza do stwierdze-
nia, maksymalny wynik w danym nie musi maksymalnemu
nasileniu badanej cechy. sobie W pewnym
inteligencji maksymalny wynik wynosi 50 punktów. W grupie
studentów osób wynik maksymalny. Czy oznacza to,
te osób ma maksymalny poziom inteligencji?
tak nie Z o normalnym cech psychicznych, do
których inteligencja, wiadomo bowiem, osób bardzo inteli-
gentnych jest niewiele. Skoro tak osób uzyskuje bardzo wysoki wynik, to
prawdopodobnie dany test jest raczej i dlatego tak badanych
wynik. Oznacza to, nie zbyt
o poziomie inteligencji badanych studentów, a jedynie o prawdopodobnej przy-
czynie tak wysokich wyników, testu.
Konieczne jest znalezienie z by
wyniki uzyskane przez poszczególne osoby badane. opisany
maksymalny wynik w nie takiej funk-
cji. wynik minimalny z
uzyskane przez badanych? W takiej sytuacji
nad Czy np. w inteligencji
badany nie zadania i tym samym wynik równy zero,
to czy oznacza to, osoba ta jest pozbawiona inteligencji? Taka in-
terpretacja wydaje absurdalna. ma pewien poziom
inteligencji. Nawet pod to, ludzie o bardzo
niskim jej poziomie (osoby to nie ludzie, którym nie przy- 61
Krzysztof Fronczyk

taka cecha. Mówi o tym nomotetyczne do diagnozowania


ludzi uniwersalne cechy (do których inteligencja)
wszystkich ludzi. W omówionym wynik zero oznacza tyle,
w przypadku osoby, która taki wynik, test zbyt trudny.
Gdyby ta sama osoba test, prawdopodobnie uzy-
wynik niezerowy.
Jak porównywanie wyników osób badanych zarówno z wynikiem
maksymalnym, jak i z wynikiem minimalnym w danym nie ma sensu.
W psychologii z porównuje wyniki poszczegól-
nych badanych jest wyników danego testu. Tak pomiar
psychologiczny dokonywany jest na skali co Nie ma
tu bowiem zera absolutnego, czyli brak cechy. na-
silenia cechy u danej jednostki jest uzyskanym przez wy-
nikiem a wyników badanej populacji. Zwykle ta
jest w jednostkach odchylenia standardowego.

•.
.
pomiarl'lm '

Pomiar psychologiczny nie ma charakteru a jedynie


porównywania wyniku konkretnej osoby badanej ze
populacji. Sam pojedynczy wynik osoby badanej bez odniesienia go do
niej populacji nie ma znaczenia.
Aby lepiej na czym polega specyfika pomiaru w psychometrii, war-
to Jan w pewnej firmie.
Po pierwszym pracy 2000 jest to pierwsza
praca Jana, to po raz pierwszy zarobione przez Jana Z pie-
tych Jan musi w kolejnego Po kilku dniach
Janowi tylko 1000
Jan ma obecnie o 1000 mniej. ma dwa razy mniej
na W kolejnych kilkunastu dni Jan
mu na dni przed Janowi
jedna W chwili obecnej ma on 2000 razy mniej
na i o 1999 mniej na do domu,
Jan mu a mu O czyli Jan nie ma
W przypadku jest porównywanie kwot
zarówno ze na to, o ile one jak i ile razy
jest przeprowadzanie operacji dodawania i odejmowania oraz
i dzielenia. Ponadto istnieje tzw. zero absolutne, czyli taka
62 której nie
3. Co to jest pomiar psychologiczny?

Inaczej mierzenie psychicznych. W przypadku


dzy jednostki równe, a np. 10 a 11 jest taka sama
jak 1000 a 1001 W przypadku punków zliczonych z testu
psychologicznego tak nie musi. Poszczególne pozycje testowe w niejedna-
kowy sposób Jedne z nich lepszymi a inne
gorszymi. Nie istnieje naturalny punkt zerowy, jak w przypadku

3.5. Kwestie problemowe pomiaru psychometrycznego


Jak wspomniano, w psychometrii nie ma czy liczby uzyskane
w trakcie pomiaru relacje
badanej cechy. Aby jakikolwiek pomiar sens, konieczne jest
jednak o tym, odzwierciedla on ce-
Warto jednak sobie z przyczyn takiego

problem dotyczy odzwierciedlenia relacji bada-


nej cechy przez liczby przypisane w procesie pomiaru. Wyniki poszczególnych
osób badanych porównuje ze a ostateczny rezultat testu jako
od w jednostkach odchylenia standardowego. Przyjmuje
przy tym odchylenie standardowe jest
równym przyrostom latentnej zmiennej psychologicznej, czyli, zachowane
relacje zmiemlej latetnej a liczbami
w trakcie pomiaru. Nie ma jednak dowodu, w ten sposób otrzymuje ska-
le czyli z równych jednostek. Zwykle bowiem nie
w populacji. Przyjmowanie
jest jedynie a nie
ta wynika z dwóch powodów. Po pierwsze, wykazanie
w populacji przebadania populacji, a to jest nie-
Zawsze w badaniu badacz ma do czynienia jedynie z
osób. normalny w próbie pewnej zmiennej nie oznacza, w po-
pulacji ma ona normalny. Po drugie, wykazanie, dana ce-
cha ma normalny w populacji posiadania innego
pomiarowego. Jego konstrukcja takie same jak obecnie
opisywany problem jednostek pomiaru.
jest to, nie wiadomo, czy zachodzi jednoznaczne przy-
a wyników
testowych. Cecha ludzka stanowi od jednostek, w jakich
wyniki jej pomiaru. Nie ma jednej poprawnej
odpowiedzi,jako wyraz przyrostu zmiennej psychologicznej, na obszarze
skali ma Nie ma jednostka odchylenia stan-
dardowego w krzywej normalnej odpowiada takim samym
przyrostom zmiemlej psychologicznej. 63
Krzysztof Fronczyk

Aby czy zbiór jednostek na skali testowej odpowiada 'równo-


miernym jednostkom na kontinuum odpowiedniej zmiennej psychologicznej,
funkcjonalnego nimi. Aby ten
trzeba by zmiennej psychologicznej
(Guilford i Comrey, 1961).

Pytania
1. Co to jest cecha latentna?
2. Jakie czynniki pomiar w psychologii?
3. Co to jest pomiar
4. Dlaczego idiograficzne nie znajduje zastosowania w psychometrii?
5. Podaj werbalnych, muzycznych,
operacyjnej, poczucia kontroli, autorytaryzmu,
6. Czy z wymienionych przez Ciebie w punkcie 5.
w kwestionariuszu lub
7. Jakie przyjmuje aby mierzenie cech psychicz-
nych?
8. Jak czym jest
9. Na czym miedzy nomotetycznym a idiograficz-
nym?

64
4. KLASYCZNA TEORIA TESTÓW'

Andrzej Rynkiewicz
PSYCHOLOGII
UNIWERSYTET WARSZAWSKI

to parametr pomiarowego,
czyli pomiaru.
dzia o stosunkowo oraz takie, których stosowanie
ze znacznym Testy psychologiczne raczej do tej drugiej grupy.
O ile w przypadku typowych do pomiaru fizycz-
nych zagadnienie czasem (bo jest bardzo
o tyle testu psychologicznego na taki luksus sobie
nie Z tego testu jest jednym z
w psychometrii.
Do tej pory brana pod operacjonalizacja
testów jest klasycznej teorii Harolda Gulliksena. Mimo
swojego wieku, teoria ta nie jest bo wiele nowo
technik psychometrycznych w mniejszym lub stopniu tworzonych jest
na podstawie teorii Gulliksena.
Klasyczna teoria testów jest modelem matematycznym. Jak
model, na fundamencie pewnych podstawowych
tzw. aksjomatów. Aksjomaty to zdania, które w danej teorii uznaje
zawsze za prawdziwe. Zatem aksjomaty nie weryfikacji. To na ich pod-
stawie weryfikuje kolejne twierdzenia teorii. Zwykle aksjomaty
zjawisk o charakterze czysto teoretycznym (np. definicja punktu w geometrii),
bo tylko takich zjawisk nie da empirycznie. Czasami jednak przy
pomocy aksjomatów charakteryzuje pewne obszary
Robi tak wtedy, gdy to obszary trudne lub do
zbadania. Poprzez aksjomaty nadaje im modelowy, czyli matematyczny, cha-
rakter (np. normalny cech psychicznych), który, jak
nieco upraszcza rzeczywisty obraz zjawiska. zysk, jaki z za-
stosowania aksjomatów to opisu przy pomocy bardzo
modeli matematycznych. takiego modelowego
(czyli np. cechy psychiczne ludzi) nazywane zmiennymi, a ich cha-
rakterystyczne to parametry.

IPraca nad finansowana ze ,5rodków na badania statutowe Psychologii


UW w 2008 roku. 65
Andrzej Rynkiewicz

przez Gulliksena z teorii


pomiaru fizycznych. Prawie wszystkie pomiaru
i tzw. wyniku prawdziwego.

4.1. Wynik prawdziwy i pomiaru


Gdy planowany jest pomiar psychicznej,
da to jest dla osoby stabilne - przynajmniej w krótkim okresie
czasu. to nie dotyczy cech psychicznych, których poziom
wykazuje nawet w czasie, ale wszelkich
które niezmienne co najmniej przez krótki okres na
dokonanie pomiaru. Opisywana tu teoria charakteryzuje pomia-
ry takich psychicznych, które jako stany -
z definicji zmielU1e w czasie i od sytuacji. W dalszej dla
uproszczenia jednak sukcesywnie cecha na
przedmiotu pomiaru testem psychologicznym.
Diagnoza testowa ma na celu rzeczywistego nasilenia cechy.
Psychometrycznym tego nasilenia jest wynik w adekwatnym
psychologicznym. Gdyby idealny test, czyli taki, który nie popehlia
to wynik pomiaru na prawdziwe nasilenie cechy. Taki
wynik nazywa wynikiem prawdziwym.
66
4. Klasyczna teoria testów

Wynik prawdziwy - wynik hipotetycznego pomiaru, na rzeczywiste na-


danego obiektu. (np. nasilenie cechy u Wynik praw-
dziwy idealnie pomiarowe. Jest on
z zastosowanym a ma charakte-
to do pomiaru tejsari1ej zastosowali inne
o innej jednostce, to je inny wynik prawdziwy.
Wynik otrzymany - wynik faktycznego pomiaru, który moze
dem.

W jednak idealne pomiarowe nie a wynik


w psychologicznym raczej nie jest wynikiem prawdziwym. Jest to tzw.
wynik otrzymany. Przyjmuje wynik otrzymany
dem pomiaru, a wynik otrzymany jest wyniku prawdziwego i
du pomiaru. Ta podstawowa dla teorii pomiaru przedstawiona
w równaniu 1.

X=T+E (J)

Charakterystyka pomiaru to jedno z teorii


Gulliksena i w ogóle teorii pomiaru. Z równania 1. wynika, pomiaru to
po prostu wynikiem otrzymanym a wynikiem prawdziwym.
to matematycznie zapisane w równaniu 2.

E=X-T (2)

pomiar, badacz chce wynik prawdziwy. Jest to jednak nie-


wykonalne, bo pomiarowe nie jest idealnie
pomiarowe zwykle wynik mniej lub bardziej od wyniku
prawdziwego. Ta to pomiaru (rys. 4.1.).
pomiaru dodatni, gdy wynik otrzymany jest od praw-
dziwego, lub ujemny, gdy wynik otrzymany jest od prawdziwego.
pomiaru znaczny, gdy wynik otrzymany jest bardzo oddalony od
wyniku prawdziwego, lub nieznaczny, gdy ta jest
w konkretnym pomiarze nie pomiaru rów-
ny zero), ale diagnosta nigdy nie tego bo
pomiaru jest jego

67
Andrzej Rynkiewicz

T
wynik prawdziwy i
dla diagnosty)

x
wyniki otrzymane
dla diagnosty)

Rysunek 4.1. Hipotetyczny wynik prawdziwy osoby (T) oraz wyniki otrzyma-
ne tej osoby z trzech tym samym testem (X j , X2 , X 3 ) i pomiaru (Ej, E2 , E3 ).
=
pomiaru dla wyniku X2 (E 2 X2 - T) wynosi zero

pomiaru ogólnie na systematyczne i losowe. sys-


tematyczny bierze zwykle z pojedynczego, ale za to bardzo
czynnika on np. równomierne
zmniejszanie wyników pomiaru u wszystkich osób badanych. Takim czynni-
kiem np. druk w to
odczytywanie pozycji testowych, to osoby systematycznie
sze wyniki otrzymane od innych osób, które ten sam test wydrukowa-
ny staranniej. to efekt pomiaru, bo druku nie ma
na rzeczywiste cechy.
W testów psychologicznych systematyczny po-
miaru ma znaczenie tylko wtedy, gdy jest efektem naruszenia standardowej pro-
cedury badania. W innej sytuacji, gdy standardowa procedura jest zachowana
i wszystkie osoby badane test pod tego samego CZylmika za-
(np. wszystkie osoby test wydrukowany w ten sam spo-
sób), wtedy systematyczny jest nieistotny. Wynika to z faktu, jak na razie
pomiar psychologiczny to pomiar na skali i nie
wyniki tylko nimi. W przypadku syste-
matycznego wyniki wszystkich osób na skali o sama ale
nimi bez zmian. Warto jednak czynniki
systematyczny na testu, np.
wynik testu wydrukowanego niestarannie w stopniu
od wzrokowej.
w teorii jest losowy. Ogólnie powie-
jest to nieprzewidywalny, a diagnosta nigdy nie wie, czy
pojawi oraz jaki znak i Jest to z nie-
od niczego - od testu, od osoby badanej i od warunków badania. Innymi
losowy pomiaru zawsze i

pomiaru jest teoretycznym W


68 ten jest naj prawdopodobniej olbrzymiej licz-
4. Klasyczna teoria teslów

by czynników z nich powoduje nieznaczne


cenie pomiaru, ale wszystkie razem efekt, którego nie
Te czynniki, to np. warunki fizyczne badania poziom itp.),
meteorologiczne atmosferyczne, poziom stan osoby
badanej (nastrój, poziom do cechy diagnosty
nastawienie), papieru, na którym wydrukowany test, pisaka
itp. Czynników tychjest bardzo i prawdopodobnie tylko ziden-
a jeszcze mniej Zwykle jest to jednak
ne, bo wyeliminowanie jednego czynnika pomiar znacznie
badania, a tylko jego
liczby nielosowych czynników jest nie-
przewidywalny i dlatego daje w efekcie uznawany za losowy.

Systematyczny który jego


jest, proporcjonalna, do czynnika pomiar.
ma zWykle znikome znaczenie; bopowodtlje równo-
wszystkich?sób .•
Losowy pomiaru i :znak nie Jest
przeWidywaloy, przypadkowy.

4.2. Podstawowe klasycznej teorii testów


te losowy charakter pomiaru.
w tym przypadku oznacza od rodzaju pomiarowego, od
osoby badanej i od sytuacji diagnostycznej. Ten ostatni czynnik
obejmuje diagnosty i jego zachowanie podczas badania. Dalej
te oraz ich implikacje.

1.: arytmetyczna wielu losowych wynosi


zero.
to infonnuje nas o nieprzewidywalnym charakterze pomia-
ru. Gdyby wiele testem, to
uzyskane w tych badaniach albo dodatnie, albo ujemne. Jedne z nich
znaczne, gdy wynik otrzymany daleko od prawdziwego,
a inne nieznaczne. Przy wielu pomiarach waga dodatnich,
a takich, gdy wynik otrzymany jest od prawdziwego, oraz
ujemnych, gdy wynik otrzymany jest od prawdziwego, taka sama.
Z racji znaków suma a ich
zero. tak od tego, czy pomiarów dokonano tym samym tc-
69
Andrzej Rynkiewicz

stem czy Znaczenia nie to, czy wyniki od


jednej osoby czy od osób.
matematycznie to jako parame-
tru nieskOllczenie wielu pomiaru (równanie 3).

(3)

Jednak równanie 3 tylko która


w warunkach praktycznych jedynie oszacowana. Z pewnych
dów warto tutaj graniczne tego (równanie 4).

lim LE
n
=0 (4)

wtedy to w sposób arytme-


tyczna losowych pomiaru zmierza do zera wraz ze wzrostem liczby po-
miarów. Z równania 4 wynika im pomiarów zostanie wykona-
nych, tym zeru arytmetyczna
Z tego wynika bardzo korzystna dla badaczy konklu-
zja. w równaniu l zapisane, wynik otrzymany jest
wyniku prawdziwego i wyników otrzy-
manych przez osób musi równa sumie wyników prawdziwych
tych osób i (równanie 5).

(5)

To równanie nie tylko dla wszystkich osób z konkretnej próby,


ale dla wielu osób z hipotetycznej populacji (równanie 6).

11 X == IlT + 11 E (6)

I dalej, wielu losowych wynosi zero


(równanie 3) ostatni równania 6. Zatem nie-
sk011czenie wielu wyników otrzymanych równa
wielu wyników prawdziwych (równanie 7), a granicy
i równaniem 4 ten wniosek nieco inaczej: im wy-
70
4. Klasyczna teoria testów

ników otrzymanych, tym bardziej z nich do


wyników prawdziwych (równanie 8).

(7)

lim LX =!!T
n
(8)

to uzasadnia powszechnie znane badaczy zalecenie doty-


prób. Im próby osób w badaniach,
tym mniejszym pomiaru wyników otrzymanych
z zastosowanych testów. Ta konkluzja dotyczy a nie pojedyn-
czego wyniku, pojedynczy wynik otrzymany
tak samo nieprzewidywalnym w pomiarze pierwszym, jak i kolejnym.

2.: Nie ma pomiaru a wynikami


prawdziwymi.
Wynik prawdziwy to taki wynik w który wskazuje na rze-
czywiste nasilenie cechy u osoby badanej. pomiaru nie
od wyników prawdziwych, to nie od rzeczywistego nasilenia ce-
chy. Zatem to definiuje losowy jako z
U osób z wysokim poziomem mierzonej cechy jest tak samo nieprzewi-
dywalny, jak u osób z nasileniem czy niskim. Oznacza to, dla
dowolnego nasilenia mierzonej cechy pomiaru war-

Matematycznie to jako
dwiema zmiemlymi: wynikiem prawdziwym i wynikiem otrzymanym (równanie
9). by gdyby tym samym testem nie-
skOl1czenie populacje osób. Rezultatem takiej hipotetycznej operacji
by wielki zbiór wyników prawdziwych tych osób oraz tak samo
zbiór wyników otrzymanych.

PTE =0 (9)

Z 2. wynika dla klasycznej teorii wniosek. Aby go


od znanej warian-
zmiennej A dwóch innych zmiennych B i C (A=B+C). Na
grupa osób test tylko z dwóch pozycji, to 71
Andrzej Rynkiewicz

rezultatem takiego badania zbiór odpowiedzi na zbiór


odpowiedzi na oraz zbiór wyników czyli sum wyni-
ków z pozycji pierwszej i drugiej. z tych zbiorów prawdopo-
dobnie nieco z nich wariancja w zbiorze wy-
ników bo wariancja ta to suma wariancji w z dwóch pozycji
jeszcze dodatkowo o pewien Ten to specyficzny
rodzaj wariancji, która wynika z korelacji i Jest
to tak zwana kowariancja .

. .•
ctzy qefiniuj
1 SCr y.. nie .me.
" .
.'i" i. ii.i.:"'iiii·...i i. '(' ··ii'., ,i"i.i.i.i··· . . i . ' . · "
wyniku testowego, odpowiedzi na
dwie pozycje, w pozycji pierwszej, w po-
zycji drugiej, oraz nimi (równanie 10).

(lO)

W analogiczny sposób sobie wyników otrzyma-


nych z badania wielkiej populacji osób. Wiadomo, wynik
otrzymany jest wyniku prawdziwego i (równanie l). Zatem warian-
cja wyników otrzymanych to wariancja sum wyników prawdziwych i
schematu opisanego jako
wariancji wyników prawdziwych, wariancji wyników otrzymanych i podwojonej
kowariancji nimi (równanie 11).

ax
2
=a r+E
2
=ar2 + a E2 + 2 PrE a TaE (11)

W równaniu 11 ostatni sumy wynosi O, bo zgodnie z


2 i równaniem 9 korelacja pomiaru a wynikami prawdziwymi
wynosi zero. A jak to zapisano w równaniu 12, wariancja wyników otrzy-
manychjest równa po prostu sumie wariancji wyników prawdziwych i wariancji

(12)

72
4. Klasyczna teoria testów

Równanie 12 opisuje która jest bardzo w dyskusji nad ogól-


nym testu. do niego w jednym z kolejnych

3.: Nie ma pomiaru.


to brzmi lakonicznie, ale chodzi w nim o to,
w jakikolwiek sposób dwa wielkie zbiory
pomiaru, to nie nimi Nie ma znacze-
nia, w jaki sposób te dwa zbiory to z hipotetycznych
pomiarów dla tej samej osoby lub osób, przy zastosowaniu jed-
nego testu lub dwóch testów, lub nawet za razem innego testu. Zatem
nigdy dwa zbiory nie skorelowane. dwa pomiaru
losowe. Jest to kolejne nieprze-
widywalny charakter pomiaru.
Matematyczny zapis tego przedstawiony w równaniu 13.

PEl E 2 =O (13)

wnioski z tego trzeba do opisanego


schematu wyznaczania wariancji zmiennej, dwóch in-
nych zmiennych (równanie 10). Tym razem chodzi o dwóch pomia-
ru. Sposób obliczenia wariancji dla takiej sumy zapisany jest w równaniu 14.

2
CJ" EI+E2 = CJ" EJ2 + CJ"E22 + 2 PEJE2 CJ" EJCJ" E2 (14)

Po nieznacznych tylko modyfikacjach powstaje analogiczny wzór, do


wyznaczania wariancji dla dwóch pomiaru (równanie 15).

2 2 2
CJ"EJ-EZ =CJ"EJ +CJ"E2 -
2P (15)
ElE2 CJ" EJ CJ"E2

Równania 14 i 15 ich ostatni


czyli ona równa zero, bo jak wynika z równania
13 korelacja dwoma jest równa zero. Na tej podstawie
równania 16 i 17.

2 2 2
CJ" EI+E2 = CJ"El + CJ" E2 (16)

73
Andrzej Rynkiewicz

2 2 2
(J' El-E2 = (J' EJ + (J' E2 (17)

Tak wariancja sumy oraz dwóch jest równa po


prostu sumie wariancji tych Te równania istotne przy
tzw. standardowych.

4.3. wyników i dla jednej osoby


Zwykle rezultatem diagnoz jest pojedynczy wynik otrzymany z badania kon-
kretnej osoby konkretnym testem. Czasem w badaniach o szerszym zakresie
pojawia liczba wyników otrzymanych od osób badanych
tym samym testem. Jednak wyniku prawdziwego i losowego
pomiaru trzeba sobie gdy
tym samym testem lub jego wersjami badana jest wielokrotnie
w sposób ta sama osoba. Dwa pomiary za
gdy jeden z nich nie na wynik otrzymany z drugiego. Tak dzieje
przy ocenie fizycznych, np. dwa pomiary tej samej
stalowej kostki najprawdopodobniej w stopniu
Natomiast dwa pomiary nasilenia ekstrawersji u tej samej osoby wy-
konane tym samym testem raczej nie bo osoba,
do drugiego pomiaru, swoje odpowiedzi z pierwszego,
bardziej znudzona czy nieco
inny poziom motywacji do z itp. Zatem sytu-
acja, w której wykonujemy wielokrotne pomiary nasilenia cechy u tej
samej osoby tym samym testem jest teoretyczna i najprawdopodob-
niej nigdy nie miejsca w realnych warunkach.
Wyniki otrzymane z wielu pomiarów tym samym testem realizowanych na tej
samej osobie najprawdopodobniej nie takie same. Przyjmuje wynik
prawdziwy tej osoby nie zmienia z pomiaru na pomiar, ale za razem
pomiaru. Wyniki otrzymane w takiej sytuacji
czasem od wyniku prawdziwego, a czasem czasem one od-
od wyniku prawdziwego, a czasem blisko niego lub nawet
mu równe. Gdyby takich pomiarów wiele, to uzyskane
z nich wyniki otrzymane nonnalny (krzywa Gaussa) przed-
stawiony na rys. 4.2., a). takiego czyli
wyniki otrzymane to wynik prawdziwy osoby.
wyniki otrzymane od tej samej osoby przy zastoso-
waniu tego samego testu wyniku prawdziwego tej osoby.
Pierwiastek z wariancji takiego a jego odchylenie standardowe, to
tzw. standardowy pomiaru, o którym jeszcze mowa.
74
4. Klasyczna teoria lesIów

a)

E, El
, ,
I
'X, T
i !
:X
•X
1

b)

Rysunek 4.2. wielu wyników otrzymanych (a) oraz po-


miaru (b) z pomiarów tym samym testem nasilenia cechy u tej samej osoby.
górnego to wynik prawdziwy osoby (T). dolnego wyno-
si zero. Odchylenie standardowe w obu to standardowy pomiaru (SEM).
X 1 i X 2 to wyniki otrzymane, wybrane z wielu poten-
cjalnych wyników tej osoby. E1 i E2 to pomiaru rozumiane jako X iT

Wynik· prawdziwy· - wynikówotr:zymanych w nieskOl1c;zenie wielu nieza-


cechy testem u jednej osoby. Inaczej jest to
potencjalnych wyników otrzymanych Qsoby przy pomiarze okre-
. .

a) na rys. 4.2. przedstawia wyników otrzymanych od jednej oso-


by, na którym bardzo pomiaru. to
konkretnych wyników otrzymanych od wyniku prawdziwego.
z rys. 4.2. a) jak
wyniku prawdziwego). Gdyby ten równolegle,
tak w miejscu zero,
nych a po prostu pomiaru (rys. 4.2., b)). Ten
nowy ma taki sam jak wyników otrzymanych
z rys. 4.2. a), ale one wie-
lu losowych pomiaru zawsze wynosi zero, a odchylenie standardowe to
standardowy pomiaru. 75
Andrzej Rynkiewicz

4.4. wyników i dla populacji


Druga grupa teoretycznych z klasycznej
teorii dotyczy sytuacji, gdy tym samym testem badane wszyst-
kie osoby z wielkiej populacji. te da
przy funkcji Gaussa normalny), ale one nieco inne
parametry opisywane dla jednej osoby. W tym przypad-
ku, oprócz wyników otrzymanych i
wyników prawdziwych. Gdy wykonywane pomiary tym samym te-
stem na jednej osobie, nie ma wyników prawdziwych, bo jedna osoba
ma tylko jeden wynik prawdziwy. Natomiast, gdy badanie dotyczy teoretycz-
nej populacji osób, to rozpatrujemy wiele wyników prawdziwych
(rys. 4.3., b», których charakteryzuje nasilenie cechy
w tej populacji. Wariancja natomiast informuje nas o stopniu osób
pod badanej cechy, a opisuje rzeczywiste indywidualne.
wyników otrzymanych od wszystkich osób z teoretycznej populacji
(rys. 4.3., a» wyników prawdziwych
tych osób, co wynika z l klasycznej teorii i wcze-
zapisane w równaniu 7. Wariancja takiego jest zwykle od
wariancji w wyników prawdziwych, bo oprócz rzeczywistych
nic indywidualnych w zakresie mierzonej obejmuje
nicowanie losowe wprowadzane przez pomiaru. Watro
na podstawie wyników otrzymanych
z testu ulegamy pewnemu bo rzeczywiste w zakresie
mierzonej cechy jest zwykle nieco mniejsze. Jest to konsekwencja 2
klasycznej teorii które zapisane w równaniu 12.
Wariancja wyników otrzymanych (rys. 4.3., a» jest warian-
cji z dwóch - wyników prawdziwych (rys. 4.3., b»
i (rys. 4.3., c».
pomiaru dla teoretycznej populacji osób
nie taki sam i parametry, jak liczby pocho-
z pomiaru tym samym testem nasilenia cechy u jakiejkolwiek pojedyn-
czej osoby. W klasycznej teorii przyjmuje wiele
losowych pomiaru zawsze ma zero - opisuje
to równanie 3. Natomiast odchylenie standardowe takich jest
od osoby czy od populacji, a od pomiarowego.
osoby badane tym samym testem taki sam
ale on dla testów. Tak dla
populacji osób z rys. 4.3., c) taki sam,jak
dla pojedynczej osoby z rys. 4.2., b).

76
4. Klasyczna teoria testów

•x

b)

c)

Rysunek 4.3. wyników i z pomiarów tym samym testem nasilenia cechy


u wszystkich osób z wielkiej populacji.
a) wyników otrzymanych. jest nasi-
lenia cechy w populacji, a odchylenie standardowe informuje o obserwowa-
nych indywidualnych.
b) wyników prawdziwych. jest nasi-
lenia cechy w populacji, a odchylenie standardowe informuje o rzeczywistych
indywidualnych.'
c) losowych pomiaru. wynosi zero, a odchylenie stan-
dardowe to standardowy pomiaru. i parametry tego
takie same, jak w dla jednej osoby przedstawionym na rys. 4.2.,
b).

4.5. Teoretyczna definicja testu


testu to pewna która odzwierciedla pomia-
ru Im tym pomiar. Gdy test jest
bardzo rzetelny (ma zwykle wy-
77
Andrzej Rynkiewicz

niki otrzymane z pomiaru bardzo blisko wyników prawdziwych. Nie


oznacza to jednak, w konkretnym pomiarze bo ma on losowy
charakter i teoretycznie Nawet testy o bardzo wyso-
kiej od czasu do czasu jednak im
sza testu, tym w konkretnym
pomiarze jednak stosunkowo Jest to
z tzw. o którym jest mowa w innej tej (por.
6.1.2.).
W klasycznej teorii testów definiuje jako wariancji
wyników prawdziwych do wariancji wyników otrzymanych od osób z
czenie wielkiej populacji (równanie 18).

er 2
P/ /_ T
--2 (18)
er x

Wariancja prawdziwa tu rozumiana jako odzwierciedlenie rzeczy-


wistego mierzonej cechy w populacji. Wariancja otrzymana na-
tomiast traktowana jak wariancja i
i (równanie 12), czyli wszystkie
nicowania wyników pomiaru. oznacza zatem
rzeczywiste indywidualne w obserwowanym
wyników testowych. wobec niej proporcja
z w obserwowanym pierw-
sza z nich druga jest testu, to
nicowanie wyników otrzymanych w znacznym stopniu spowodowane
rzeczywistymi indywidualnymi, a w stopniu
pomiaru. wariancji do wariancji otrzymanej
bo im jest tym mniej rzetelny test. Pozwala ona
(równanie 19).

(19)

78
4. Klasyczna teoria testów

test jest idealnie jego wynosi l. Oznacza to,


kowite wyników pomiaru testem (mianownik równania 18) spo-
wodowane jest rzeczywistymi indywidualnymi w zakresie
mierzonej cechy (licznik równania 18). Tym samym wyników
spowodowane znika. W takim przypadku powie-
wynik otrzymany jest równy prawdziwemu.
test jest jego wynosi o. Wtedy ob-
serwowane wyników otrzymanych spowodowane jest
pomiaru. W stopniu nie oddaje ono pod
dem mierzonej cechy. Pomiar takim testem do przypisywania
osobom liczb uzyskiwanych z rzutów do gry, czyli wynik pomiaru
przypadkowy.
test jest umiarkowanie to jego np.
0,80. Oznacza to, 80% wyników uzyskiwanych
przy pomiarze tym testem rzeczywistymi
a 20% tego spowodowane jest pomiaru. Te pro-
porcje wariancji i nieuzasadnione jest stwierdzenie, 80%
wyników otrzymanych równe jest wynikom prawdziwym.
Z równania 18 wynika praktyczna konkluzja. testu
dzie w populacji o wariancji wyników prawdziwych (populacja
heterogeniczna) w populacji o wariancji wyników prawdziwych (popu-
lacja homogeniczna). Jest tak dlatego, zgodnie z teorii Gulliksena
te dwie populacje Wariancja nie za-
od populacji. Zatem spadek wariancji wyników prawdziwych za
spadek wariancji wyników otrzymanych, ale nieproporcjonalnie
mniejszy. W konsekwencji wariancji wyników prawdziwych licznik
równania 18 zmniejszy bardziej mianownik.
Jeszcze to na podstawie równania 19. W populacji o
wariancji wyników prawdziwych (heterogenicznej) mianownik w równaniu (wa-
riancja wyników otrzymanych) W populacji homogenicznej ten
mianownik Natomiast w obu tych populacjach licznik (wariancja
pozostanie bez zmian. Tak w populacji he-
terogenicznej w populacji homogenicznej. Badacze i autorzy testów psycho-
logicznych powinni o to, by próbki na podstawie których szacuje

testu empirycznie na podstawie tzw.


(rit) opisywanego w innej tej

4.6. Korelacja wyników otrzymanych i prawdziwych


Sposób rozumienia testu przedstawiony w poprzednim podrozdzia-
le bliski jest typowej definicji tzw. determinacji. to w ana- 79
Andrzej Rynkiewicz

lizie regresji wariancji z do


tej wariancji wyników. W za uznaje
wyników prawdziwych, a za wyników
otrzymanych. jest determinacji dla wyników
prawdziwych i otrzymanych. Pierwiastek ze determinacji pozwa-
la Zatem pierwiastek z testu daje
dzy wynikami prawdziwymi i otrzymanymi (równanie 20). Interpretacja takiej
korelacji powinna jasna - im jest ona im
wynikami prawdziwymi i otrzymanymi, tym testu.
Czasami zastosowanie znajduje estymator omawianej tu korelacji oznaczany
symbolem rTX • Jest to tzw.

P TX = fP: = -f.
Ux
(20)

4.7. Standardowy pomiaru


Wariancja jest jednym z w psychometrii.
jest ona z te-
stu - im tym mniejszy ma wariancja w wa-
riancji wyników otrzymanych (wariancji test jest rzetelny, to
wyniki otrzymane osób zwykle blisko wyników prawdziwych. W takim
przypadku pomiaru, rozumiane jako wyników prawdziwych od
otrzymanych, stosunkowo oznacza to,
bliskie zeru, czyli (równanie 3 - niesk011czonej liczby
wynosi zero). To z kolei oznacza, pomiaru przy wysokiej

testu jest idealna, test jest Wszystkie pomiaru


wtedy równe sobie i równe zero. W takich teoretycznych warunkach wariancja
jest równa zero, a jeden informuje nas
o tym, wyników w to prawdziwe.
testu wynosi zero, oznacza to, wyników
otrzymanych z badania testem jest spowodowane pomiaru. W takiej hipo-
tetycznej sytuacji wariancja jest równa wariancji
wyników otrzymanych, a wyniki badania w stopniu nie
rzeczywistego nasilenia cechy.
bardzo za i wariancji
otrzymanej z równania 19. Powstaje w ten sposób równanie 21.
80
4. Klasyczna teoria testów

(21)

W pewnych warunkach jest odchylenia stan-


dardowego wariancji - równanie 22, które stanowi defini-
tzw. standardowego pomiaru.

aE =a x - Pll (22)

Standardowy pomiaru ma olbrzymie zastosowanie praktyczne np. przy


obliczaniu tzw. Jego zwykle wyznacza
na podstawie odchylenia standardowego wyników i
uzyskanych w próbie osób reprezentatywnej dla populacji, do bada-
nia której ma test. Takie zwykle zapisywane w do
testu. Wzór do obliczania estymatora standardowego po-
miaru zapisany w równaniu 23. oznacza jako SEM
(ang. standard errar afmeasurement).

(23)

standardowego pomiaru jcst naturalna jednostka wyników


otrzymanych w przedmiotem pomiaru jest inteligencja, a jed-
punkty ilorazu inteligencji, to standardowy pomiaru jest
w punktach ilorazu inteligencji. standardowy pomia-
ru to odchylenie standardowe w [rys. 4.2., b) i 4.3.,
c)] oraz w wszystkich potencjalnych wyników otrzymanych
jednej osoby [rys. 4.2., a)] bardzo mu - standar-
dowy pomiaru od zera lub
potencjalnych wyników otrzymanych jednej osoby od jej wyniku
prawdziwego. Im standardowy pomiaru, tym bardziej
z rys. 4.3., a) i b) oraz 4.3., c).

\y wyników otrzymanych z· vomiarów od


jeqnejosoby.Jestto pomiaru odzeralub odle.,
jednej. osoby od jej wyniku prawdziwego.
równania 22 i 2);

Z równania 22 wynika, standardowego pomiaru od


dwóch testu i odchylenia standardowego wyników otrzyma- 81
Andrzej Rynkiewicz

nych. Tak im bardziej test oraz im mniejsze wy-


ników w populacji, tym mniejszy standardowy pomiaru. Jednak
testu pozostaje w z populacji i
próby. Im mniejsze odchylenie standardowe wyników, tym
Tak w próbie, w celu zredukowania standardo-
wego pomiaru, nie przyniesie oczekiwanego efektu. Za
testu standardowy pomiaru pozostanie naj prawdopodobniej nie-
zmieniony. Jedyny pewny i sensowny sposób na zmniejszenie tego to
konstruowanie i wykorzystywanie rzetelnych testów.

Zalecana literatura
J. (1996). Metodologia psychologicznych. Warszawa: PWN.
(Str. 458-461).
Ferguson G.A., Takane, Y. (1999). Analiza statystyczna w psychologii i pedagogice.
Warszawa: PWN. (Str. 489-592).
Homowska E. (2005). Testy psychologiczne. Teoria i praktyka. Wydawnictwo Scholar.
(Str. 41-49).
Magnusson D. (1991). Wprowadzenie do teorii testów. Warszawa: PWN. (Wydanie 2:
str. 92-134).

Literatura dla bardziej ambitnych


Aranowska E. (2005). Pomiar w psychologii. Warszawa: Scholar. (Str. 17-31
i 51-54).
Gulliksen H. (1950). Theory ojmen/al tests. New York: John Wiley & Sons.
Nowakowska M. (1975). Psychologia z elementami naukometrii. Warszawa:
PWN. (Str. 22-25).

Zadania
1.
Wariancja wyników otrzymanych w teoretycznej populacji wynosi 16, a warian-
cja 3. Ile wynosi testu i jaki procent wyników
otrzymanych to prawdziwe osobami?
2.
testu jest równa 0,67. Jaka wariancja wyników otrzymanych
w teoretycznej populacji, gdyby wariancja wyników prawdziwych 13?
3.
wiele pojedynczej osoby testem o rzetelno-
0,79 wyniki otrzymane o wariancji 36. Oblicz odchylenie standardowe
w
82
4. Klasyczna teoria testów

4.
Badanie teoretycznej populacji testem o 0,82 wyniki otrzymane
o wariancji 28. Oblicz odchylenie standardowe w
5.
Hipotetyczny wynik prawdziwy osoby wynosi 24. Badanie teoretycznej popula-
cji, z której pochodzi ta osoba testem o 0,87 odchylenie standar-
dowe wyników otrzymanych 4,5. Jakie jest w realnym
badaniu tym testem wynik otrzymany tej osoby 27?
6.
testu wynosi 0,74. Badanie tym testem osób z teoretycznej populacji
odchylenie standardowe wyników otrzymanych równe 4,8. Jaki procent
dów pomiaru nie poza granice od -2 do +2?
7.
Jaka musi wariancja wszystkich potencjalnych wyników otrzymanych po-
jedynczej osoby, aby 99% najbardziej typowych dla niej wyników otrzymanych
w w granicach od 95 do 105 punktów?

Odpowiedzi do
1. ptt=0,875. prawdziwe to 87,5% otrzymanego.
2. O"x=19,4.
3. Pojedyncza osoba, O"x=O"E=6 (pierwiastek z wariancji wyników otrzyma-
nych).
4. Populacja osób, O"E=2,24 (standardowy pomiaru).
5. O"E=1,62; z27=1,85 (wystandaryzowana wyniku 27); P(X>27)=0,032
(z tablic dystrybuanty normalnego).
6. O"E=2,45; Z_2 =--0,82 (wy standaryzowana pomiaru -2); z2=0,82
(wy standaryzowana P(-2<E<2)=0,794-0,2 06=0,588
(z tablic dystrybuanty normalnego).
7. P(ZA<X<Z8)=0,99; zA=-2,57; z8=2,57 (z tablic dystrybuanty normal-
nego); pojedyncza osoba, O"x=O"E=1,95.

83
5. JAKICH INFORMACJI O DOSTARCZA
TESTOWANIE?

Konrad Jankowski, Marcin Zajenkowski


PSYCHOLOGII, UNIWERSYTET WARSZAWSKI

5.1. Metody szacowania pomiaru testem l


Z zaprezentowanej w poprzcdnim rozdziale definicji wynika,
jest to stosunek wariancji wyników prawdziwych do wariancji wyników otrzy-
manych. wynik prawdziwy nie jest obserwo-
nie wariancji wyników praw-
dziwych. Oznacza to, ze wzoru definicyjnego nie da
pomiaru konkretnym testem. Aby opracowano szereg
metod, które oszacowanie czyli wariancji wyni-
ków prawdziwych w wariancji wyników otrzymanych.
Operacyjnie definiuje jako wyników.
inaczej, im pomiaru testem, tym wyniki dwukrotnego badania
testem bardziej do siebie, co w praktyce
nimi. oba pomiary od
siebie, osoba badana podczas drugiego badania testem go
co na rezultaty uzyskane w drugim badaniu, np. nabyciu
wprawy lub pozycji testowych. Aby drugi pomiar w
pomiarem badanej cechy,
tej cechy, tak aby efektu Miara ta jednak nie
formy lub do innych informacji, cho-
dzi o sprawdzenie wyników uzyskanych w konkretny
sposób. Najlepiej dwa testy, tensam konstrukt teoretycz-
ny, w których pozycji testowych jest odmienna. Testy takie nazywane
testami Oprócz pomiaru jednakowej cechy, testy takie powin-
ny szereg formalnych warunków, aby uzyskany korelacji
pomiarami jako testu.
Dalej opisane praktyczne metody szacowania W niniejszym
rozdziale omówione takie metody, jak: dwukrotne powtarzanie pomiaru
testu i metoda wersji alternatywnych,
metoda i metoda kompetentnych.
o testów dotyczy z nich. W wypadku badania
testu i istotne jest, aby rów-
dla obu pomiarów tym samym testem. Przy wykorzy-
staniu wersji alternatywncyh istotne jest, by
I Przygotowanie sfinansowane ze na badania Psycholo-
84 gii Uniwersytetu Warszawskiego. BW 180620.
5. Jakich informacji o dostarcza testowanie?

wersje alternatywne testów. Natomiast w badaniu


jako testy traktowane testu, a w
poszczególne jego pozycje.

... . . . .... .
• X A=X S - wyników w B;
• SA=Sf}-odchyleniestandardowew jakw B;
• riAiA=:.riBiB-,-,jnterkorelacjepozycjiw A takie, B;
• A jak korelacja wy.
ników testu B z Z.

na uzyskany przez zastosowa-


nie z metod, czynniki. Podstawowym czynnikiem, intere·
badacza jest pomiaru testem. Ponadto dodatkowe
czynniki, na które
ze konkretnej procedury badania one dodatkowe
pomiaru, tym samym rze·
jest, aby badania
tych dodatkowych czynników, tak by uzyskany
przede wszystkim z samego testu.

5.1.1. Metoda powtarzanego pomiaru


Metoda szacowania za powtarzanego pomiaru polega na
dwukrotnym badaniu tych samych osób tym samym testem.
jest wynikami z obu Takie oszacowanie
przeprowadzone na dwa sposoby, czasu pierw·
szym i drugim badaniem.
Pierwszy z nich nazywany jest testu. Polega na tym,
badani ten sam test dwa razy z tzn. po pierwszego
badania natychmiast drugie. jest tu ko·
relacji wynikami obu pomiarów testem grupy osób. Badacze
na szereg z Na wyniki pomiaru
bowiem oprócz chwilowe oscylacje
funkcji poznawczych, stanu organizmu, i nabyta wprawa w wykonaniu
testu, a (Choynowski, 1971). Metoda ta powinna zatem sto·
sowana jedynie w przypadku testów, w których powtarzanie badania nie
istotnie na wyniki, np. testów motorycznych czy testów, w których
jest czas reakcji.
Drugi sposób szacowania przy pomocy powtarzanego pomiaru tym
samym testem polega na tym, pierwszym a drugim badaniem tej sa·
mej grupy osób wprowadza czasowy, np. dwa 85
Konrad Jankowski, Marcin Zajenkowski

itp. Metoda ta nazywa testu lub popular- .


nie test-retest (czasem nazwy testu).
czynnika korelacji r-Pearsona) dwoma zbiorami wyników
(z pierwszego i drugiego wykonania testu) jest tu
mówi o tym, na ile wyniki testu od losowych czyn-
ników z lub badania, i na ile w cza-
sie. Kwestia interpretacji jako
wyników w czasie zostanie bardziej omówiona w dalszej

Psychometrzy na problemy z (np.


1996). one z faktem, osoby badane do czynienia dwukrot-
nie z tym samym testem. Prezentowany podczas drugiej sesji nie jest
dla nich nowy, tak jak przy pierwszym badaniu. Na wyniki drugiego pomiaru
zatem takie czynniki, jak czy uczenie to
szczególnie widoczne w testach inteligencji, np. takich, w których sprawdza
(np. w z WAIS-R) lub
synonimów (w Synonimy z APIS-Z). sobie spra-
dwukrotnie tym samym testem, nie
w przerwie pomiarami po prostu i np. dowie
jaki jest synonim prezentowanego we badaniu.
jest zatem, aby badana nie zmianie podczas przerwy
pierwszym a drugim badaniem testem.
W pewnych przypadkach zmiana jest na tyle sto-
sowanie metody test-retest staje nicuzasadnione. to szczególnie za-
u dzieci, które dynamicznemu rozwojowi. Dobrym
dem jest tu test DMI (Diagnoza Iiltelektualnych) opracowany przez
Matczak (2001). Zdaniem autorki test ma do operacyjnego
zgodnie z Piageta. Owa w stadium
operacji konkretnych (czyli w wieku od 6-7 lat do 11-12 lat). zmiany
rozwojowe, Matczak wykonania DMI-2M w
grupach wieku dzieci (od 6 do 10 lat). wykonania
istotnie wzrasta wraz z wiekiem. Pomiar w tym
przypadku wysoce ryzykowny, zmiany w wykonaniu zadall
widoczne nawet w krótkim okresie. to, nie
o testów, w drugim pomiarze
w pierwszym. W z tym szacowano -
(patrz punkt 5.1.4.).
Podstawowym problemem staje przerwy pomiarami.
Niestety nie ustalono optymalnego czasowego. W z tym propo-
nuje aby przerwa badaniami na tyle aby badani
prezentowany zbyt przerwa
86 cecha mierzona przez test zmieni u badanego.
5. Jakich informacji o dostarcza testowanie?

pod badacze aby przerwa


pomiarami od kilku tygodni do kilku zale-
zazwyczaj od specyfiki przedmiotu pomiaru. styl (np. poznawczy)
czy szybszych zmian (zalecana przerwa krótsza)
w przypadku np. cech temperamentu (zalecana przerwa W pol-
skiej adaptacji Kwestionariusza Radzenia Sobie w Sytuacjach Stresowych (ang.
Coping Inventory oj Stressjul Situatians, CISS) badano
stylów radzenia sobie ze stresem w 2-3 tygodni (Strelau, Jaworowska,
i Szczepaniak, 2005). Korelacje dla poszczególnych skal
wysokie i od 0,73 do 0,80.
Strelau i Zawadzki (1997) w badaniach nad FCZ-KT (F ormalna Charakterystyka
Zachowania - Kwestionariusz Temperamentu), do pomiaru cech
temperamentu postulowanych przez temperamentu, zdecydo-
(dwutygodniowa
przerwa badaniami) oraz (przerwa
na). korelacji dla krótkoterminowej od 0,68
do 0,93, a dla od 0,55 do 0,90 (w od wieku i
badanej grupy).
Warto na wyniki badania test-retest, oprócz
i uczenia czynniki z
w której dokonywany jest pomiar (np. pora dnia, nastawienie badacza itp.) oraz
stan osoby badanej (aktualny nastrój, stan fizyczny itp.).
do szacowania pomiaru testem, o tym
Ma to szczególne znaczenie w przypadku stan, a nie
Przymiotnikowa Skala Nastroju UMACL (ang. UWIST
Maad Adjective Check List). (2005), polskiej adaptacji, zde-
m.in. poszczególnych wymiarów nastroju.
jednak, korelacje pomiarami w jednego tygo-
dnia istotne, niezbyt wysokie. korelacji
od 0,28 do 0,47, co w tym przypadku zgodne z ponie-
nastrój, czyli stan, inaczej cecha, podlega szybkim zmianom.
Zastosowana metoda w tym wypadku jednak
wspólnego z badaniem teoretycznej (patrz punkt 5.2.2.2.)

5.1.1.1. czasowa a o
W testów psychologicznych przy pomiarze testu, za-
rówl10 jak i (por. 5.1.2.), bierze pod
korelacji, którego wysokie interpretuje jako
wyników testu w czasie. interpretacja
jest prawdziwa jedynie, pomiarów 87
Konrad Jankowski, Marcin Zajenkowski

testowych, szczególnie o w obu pomiarach.


Korelacja sama w sobie mówi jedynie o wyników w obu pomia-
rach, ich tzn. osoby, które wyniki
w pierwszym pomiarze, wyniki w drugim pomiarze. Aby
o wyników w czasie, szczególnie istotne jest
o w obu pomiarach dla danej grupy osób. W praktyce
to jest pomijane, co do inter-
pretacyjnych Zilustruje to zawarty w tabeli
5.1. Skonstruowano dwa testy, A i B. Zbadano
z nich dla 5 osób. korelacji dla obu pomiarów te-
stem A l, i podobnie korelacja dla obu pomiarów testem B wy-
l. jedynie korelacji (bez sprawdzenia
"o pomiarów), by wyniki w A i wyniki
w B tak samo, idealnie w czasie. Jednak, pod
nie, interpretacja jest jedynie w wypad-
ku testu A, gdzie w pomiarze pierwszym (Al) i drugim (A2) w istocie
równe. Dla pomiarów w B, korelacja wynosi l,
w drugim pomiarze (B2) jest o dwie jednostki od tej w pierwszym (B l).
Zatem, wyniki osób w B nie stabilne w czasie, lecz syste-
matyczne ich tak np. przy badaniu
testu inteligencji u dzieci).
do zastosowania w prezentowanym przy-
jest korelacji Pozwala on na
nienie w wynikach uzyskanych przez osoby badane w obu pomiarach.
O ile w wypadku testu A korelacja 1, o tyle
w B mniejsza od 1 (ze na wyniki uzyskane przez
osoby badane w drugim pomiarze).

Tabela 5.1. Wyniki dwukrotnego badania testem A (A 1,A2) i testem 8 (81,82) grupy
osób

Nr osoby A1 A2 81 82
1 5 5 5 7
2 4 4 4 6
3 3 3 3 5
4 2 2 2 4
5 1 1 1 3
3 3 3 5
Korelacja rA1A2 =1 r8182 =1

interpretacja testu, jako niezmien-


wyników w czasie, jest uprawniona tylko,
88 o testów, szczególnie o w obu pomiarach.
5. Jakich informacji o dostarcza testowanie?

do badania pomiaru na
w jakim wynik testu .• zmian.
Polegana dwukrotnym badaniu tych osób tym samym testem.

Stabilll sluiY do badania· testem oraz pokazuj e,


wjakHnstopnillwynikitestu zmiany z
czaSu; Polega mLbadaniu dwa raz)' tych samych osób tym samym

5.1.2. Metoda wersji alternatywnych


W poprzednim paragrafie omówiono metody szacowania za po-
dwukrotnego badania tej samej grupy osób tym samym testem. Niniejsza
jest metodom szacowania za dwukrotnego
badania tej samej grupy osób wersjami alternatywnymi testu.
spore szacowaniem test-retest a meto-
wersji alternatywnych. dwoma metodami
w zakresie procedury badania jest tym samym testem albo
wersjami alternatywnymi testu.
Badanie wersji alternatywnych ma przebieg.
Po pierwsze, dwie wersje danego testu. Obie wersje powin-
ny pod tzn. z innych pozycji,
ale (por. idea testów
paragraf 5.3.). osób najpierw
a potem danego testu.
Podobnie jak za metody test-retest, tak poprzez zastosowanie pro-
cedury testów alternatywnych dwa
w od zastosowanej przerwy czasowej pomiarem
i testu.
testowej pod zastosowa-
nej przerwy czasowej pomiarami jest odpowiednikiem
w metodzie test-retest. Inaczej równo-
uzyskuje ze wyniki z dwóch testów
alternatywnych przeprowadzonych na tej samej grupie osób, przy czym
badaniem oporna testami nie ma przerwy czasowej. Po
nia pierwszej wersji, osoby badane natychmiast do
drugiej wersji testu. Uzyskany w ten sposób korelacji,
r-Pearsona, traktuje jako testowej.
to korelacja wynikami w dwóch
testach alternatywnych uzyskanych przez osób, ale ba-
daniem testem pierwszym i testem drugim wprowadza 89
Konrad Jankowski, Marcin Zajenkowski

Jego powinna dobrana w od tego, co testy alterna-


tywne oraz od specyfiki grupy, dla której chcemy testów:
testy przeznaczone do pomiaru czasowo
jak np. cech temperamentu, to przerwa ta np. kilka
przerw zazwyczaj nie stosuje ze na potencjalne
badawcze - trudno do tych samych osób np. po
kilku lat. istnieje podejrzenie, badana psychiczna szyb-
ko zmianom, przerwa oboma pomiarami powinna krótsza.
Krótkie przerwy czasowe w przypadku osób, u któ-
rych badana szybko ulec zmianie ze rozwojowych.
z dzieci. sobie, poziom
wykonania np. testu inteligencji znacznie, gdyby przebadano dzieci
w klasie, a te same dzieci po roku, w szóstej klasie.
dodatkowo w tempie rozwoju dzieci, to uzyskany
cZylmik korelacji pomiarami testami alternatywnymi
ny. Nie on zatem tego, jak jest pomiar tymi testami.
W praktyce ustalanie przerwy czasowej pomiarami podczas
szacowania z takimi samymi problemami, jak
w wypadku (por. 5.1.1.)

ru testem 1)a wersjamialternatYWllymi


gadaniu tych pnkolei
testu.
do badania pOllliaru
oraz nil;.
przypadkbwe z czasl.l. polega na zbadaniu tych
•••.. , ..... ,,' c •• '.' ,
Pewnego
."...... . . . ..• , •• . •.•
.

5.1.3. Metoda
W poprzednich paragrafach omOWlOno metody szacowania na
podstawie dwukrotnego pomiaru. Metoda pozwala na oszacowanie
pomiaru testem na podstawie jednokrotnego badania tej samej grupy
osób jednym testem. Jest to jedna z pierwszych metod badania we-
jakie
Technika ta opiera na dwóch testów
w ramach tego samego testu, a skorelowaniu ze wyników uzy-
skanych w tych Procedura badania polega na tym, grupa osób
wykonuje test, test jest dzielony na dwie po czym koreluje
90 ze zbiory wyników uzyskanych z pierwszej i drugiej Tak po-
5. Jakich informacji o dostarcza testowanie?

korelacji mówi o jedynie testu. Dlatego


ze wzoru Spearmana-Browna, który pozwala
tcstll na podstawie jego

2rpp
rt/=-- (5.1)
1+ rpp
rft - testu;
rpp - korelacji testu.

w miejsce rpp korelacji


mi testu, otrzymamy testu.
Warto wzór na specjalnym przypad-
kiem ogólniejszego wzoru Speannana-Browna na
pomiaru testem a

nrtti
rUn=----- (5.2)
1 + (n-l)rtri

rUn - testu po jego


rfli - testu przed jego
n- testu (ile razy test).

wzór pozwala na oszacowanie pomiaru testem (r fln ) po


jego n-krotnym pomiaru testem przed jego prze-
(rflJ Skoro znamy testu, testu
to inaczej testu po dwukrotnym W takim razie,
gdy wstawimy za n 2, otrzymamy wzór 5.1. Ze wzoru 5.2 wynika,
pomiaru testem wzrasta w jego w z czym
testu zawsze jego
korelacja miedzy testu).
Podstawowe pytanie dotyczy tego, w jaki sposób test na
ten powinien przeprowadzony tak, aby testu
siebie jest kilka
Prosty na zachodzi wtedy, gdy m.in. 10
pozycji testowych, podzielonoby w ten sposób, w pierwszej
te o numerach 1-5, a w drugiej o numerach 6-10. taki sens
w przypadku krótkich testów o podobnych pozycji (m.in.
kwestionariuszy kolejne pozycje testowe
to przy takim podziale otrzymano by i
a o testu 91
Konrad Jankowski, Marcin Zajenkowski

test bardzo nastawienie osoby badanej istotnie


ne podczas pierwszej i drugiej testu (m.in.
a w sytuacji badania w efekcie do
o
Dobór losowy sprowadza do podzielenia pozycji do obu w sposób
przypadkowy. Metoda taka jest odpowiednia, poszczególne pozycje testu
nie zbytnio ze na ich zatem dla
kwestionariuszy Natomiast, pozycji wzrasta, tak jak
to zdarza w przypadku testów inteligencji, dwie
testu
Dobór parzyste-nieparzyste polega na tym, do jednej testu
. pozycje testowe o numerach parzystych, a do drugiej - o numerach nieparzy-
stych. temu, przy kolejnych pozycji, zadania
i trudne do obu równomiernie, czemu testu
do siebie pod
Dobór pozycji testowych, polega na tym do
obu przydziela pozycje, tak aby testu
testów Kryterium pozycji i,
w efekcie, z tym obu testu. Metoda ta odpo-
wiednia dla testów, których pozycje nie ale da rów-
testu. testy, których pozycje
format odpowiedzi, tzn. w pozycje dwu-, trzy-,
czterokategorialny format odpowiedzi.
Dobór pozycji testowych do obu ma zasadnicze znaczenie dla wiel-

pozycje testu wysoko skorelowane w swojej


testu i nisko testu. Przypadek taki gdyby
m.in. w o pozycji prosty na
Wtedy odpowiedzi na pozycje w testu wysoko skorelo-
wane ze natomiast korelacja niska. Natomiast
w metodzie
wysoko skorelowane pozycje rozdzielone do oddzielnych
testu.
zastosowano m.in. do analizy w Matryc
Ravena - wersja Dla Zaawansowanych (Jaworowska i Szustrowa, 1992). W
tym mamy do czynienia z a zatem autorki pol-
skiej adaptacji test na dwie ze na
pozycje parzyste i nieparzyste. pomiaru testem
przy pomocy wzoru Spearmana-Browna, 0,80.

92
5. Jakich informacji o dostarcza testowanie?

dQpadaniairzeielnQsci. pomiacU·testemoraz wskazuje na


stopierl Polega· na jedpokrotnym badaniu te"
steru grupy osób.

5.1.4.
obok metody oszacowania po jedno-
krotnym badaniu danym testem jest estymacja (ang.
internal consistel1cy). Kuder i Richardson (2005) zwrócili na niejedno-
wyniku procedury dzielenia na Stwierdzili, testu na
dwie jest arbitralny i w od sposobu otrzyma-
my inne oszacowanie
W celu tego problemu, test zn
pozycji na 11 Wynika z tego, liczba wszystkich
liwych testu równa jest liczbie jego pozycji. Aby dobre osza-
cowanie trzeba pozycje testowe
równe i wariancje) oraz wszystkie pozycje w
ten sam czynnik
Autorzy opracowali 21 wzorów, z czego stosowane dwa (nazy-
wane skrótowo od ich nazwisk KR 20 i KR21 ). Pierwszy z nich odnosi do przy-
padków, w których bierze pod wszystkich pozycji
testowych. Wzór ten w sposób:

(5.3)

k - liczba pozycji testowych;


Pi - proporcja odpowiedzi diagnostycznych (zgodnych z kluczem) na

- proporcja odpowiedzi niediagnostycznych (nie zgodnych z kluczem);


s/ - wariancja wyników ogólnych testu;
k

L - suma dla k pozycji.


;=\

93
Konrad Jankowski, Marcin Zajenkowski

Drugi wzór (KR21 ) wymaga pozycje testowe


(równe proporcje odpowiedzi zgodnych i niezgodnych z kluczem). Ma
on
k S,2 -kj5(j
k-l (5.4)
S,

k liczba pozycji w
P - pozycji testowych;
q=l-P.
Wykazano (Cronbach, 2005), KR20 jest równy
policzonych dla wszystkich testu
na W praktyce oznacza to, niektóre oszacowania
a niektóre KR2o .
Wzory Kudera i Richardson problem metody ale
pewne ograniczenie. je jedynie testów z dwukate-
gorialnymi odpowiedziami, czyli odpowiedziami typu: tak-nie, zgadzam
zgadzam poprawne-niepoprawne itp. Cronbach (2005) wzór,
który da do wszelkich testów, a nie tylko z dychotomicznym
formatem odpowiedzi. Metoda ta, obecnie stosowana do szacowania
uznawana jest za najlepszy sposób szacowania rzetelno-
(Hornowska, 2003). Dlatego jej uwagi. Wzór, o któ-
rym mowa, znany jako alfa Cronbacha, przedstawia

a= (5.5)

k - liczba pozycji testowych;


s/ - wariancja wyników ogólnych testu;
k
" S,2 - suma wariancji pozycji testowych.
i=!

zastosowania wzoru alfa Cronbacha. W tabeli 5.2. za-


mieszczono wyniki osób z pewnego testu, w którym zakres
odpowiedzi na skali Likerta (od l do 5). W kolejnych kolumnach
przedstawiono odpowiedzi osoby, obliczenia wariancji dla testu
oraz wariancji poszczególnych pozycji testowych.
W celu obliczenia wariancji, wynik od a
94 nie do kwadratu. stanowi stosunek sumy
5. Jakich informacji o dostarcza testowanie?

wyników od podniesionych do kwadratu do liczby osób bada-


nych minus jeden. W tabeli 5.2. przedstawiono kolejne kroki obliczania wyników
wariancji testu i poszczególnych pozycji testowych.
Kolejne kroki oznaczono jako A, B, C, D w dolnym wierszu tabe-
li 5.2. Wszystkie obliczenia w ten sam sposób, zarówno chodzi
o testu, jak i poszczególnych pozycji. W kroku A zsumo-
wszystkie wyniki otrzymane testu i kolejnych pozycji), a
(krok B) od niej
poszczególny wynik otrzymany, jak to uczynione w kolumnie
oznaczonej (X-X). Otrzymane w ten sposób do kwa-
dratu (wynik tego przedstawia w tabeli 5.2. kolumna (X-X )2). W kroku
C wszystkie podniesione do kwadratu, a
je przez osób badanych minus jeden (krok D). W ten sposób uzy-
skano wariancje odpowiednio dla testu oraz kolejnej pozycji.

Tabela 5.2. Wyniki poszczególnych pozycji testowych oraz wyniki ogólne dla 5 osób bada-
nych w z 4 pozycji

Pozycje
Osoby test Pozycja 1 Pozycja 2 Pozycja 3 Pozycja 4
testowe
1234 LXc' (Xc- xJ' X/ (X1-xS' X 2' (X2-XX X3' (XrxS' X4' (X4-xS'
(Xc-Xc )2'" (X1- X1)2'" (X2- X2)2'" (Xr X3)2'" (Xr X4)2'"
1 31 1 2 7 -5 25 3 OO 1 -2 4 1 -2 4 2 -1 1
2 2454 15 3 9 2 -1 1 4 1 1 5 2 4 4 1 1
3 5545 19 -7 49 5 2 4 5 2 4 4 1 1 5 24
4 4223 11 -1 1 4 1 1 2 -1 1 2 -1 1 3 OO
5 1 331 8 -4 16 1 -2 4 3 OO 3 OO 1 -2 4
L Xc = 60 L XI = 15 L X 2 = 15 L X3 = 15 L X4 = 15
Kolejne kroki A. X2 = 3
Xc = 12 Xl =3 )(3 = 3 )(4 = 3
B. L(Xc - X cl 2 = L(X1- X 1)2= L(X2 - X 2)2= L( XrX 3)2= 'L( X4 - X 4)2=
C. = 100 = 10 = 10 =10 = 10
D.
=
s/ 100/4 = =
s/ 10/4 = =
s/ 10/4 = s/= 10/4 =
si = 10/4 =
= 25 = 2.5 = 2.5 = 2.5 = 2.5
* 1 kolumna, *·2 kolumna, *.* 3 kolumna.
X - wynik otrzymany przez
X - wyników otrzymanych;
LX - suma wyników otrzymanych;
(X-X) - odchylenie wyniku otrzymanego przez od
(X- X)2 - kwadrat odchylenia wyniku otrzymanego przez od
L(X- X)2 - suma kwadratów wyników otrzymanych od
52 - wariancja wyników.

95
Konrad Jankowski, Marcin Zajenkowski

W wariancja pozycji wynosi 2,5, zatem suma wariancji


wszystkich pozycji równa 10. Wariancja testu wynosi 25.
uzyskane dane do wzoru 5.5, otrzymujemy:

a = -
4-1
4 10
(1- - )
25
= °
'
80

wskazuje, na ile dany test jest jednorodny (homoge-


niczny), czyli na ile wszystkie pozycje w do tej samej cechy
(czynnika). Im bardziej jednorodny zbiór test (tzn. wy-
soko skorelowanych ze tym otrzyma
o jednoczynnikowej strukturze testu szczególnie
w przypadku baterii testów. takiego testu jest do pomiaru
inteligencji APIS-Z (Matczak, Jaworowska, Szustrowa i Ciechanowicz, 2006),
które z podtestów. Autorki rze-
dla wyniku ogólnego (sumy wyników przeliczonych z poszczególnych
podtestów), w przy-
padku tej baterii testów trudno o jej
Oszacowanie stosowano m.in.
w Inwentarzu NEO-FFI Costy i McCrae. to stworzono
do pomiaru tzw. Wielkiej czyli ekstrawersji, otwarto-
na i Zdaniem autorów to ce-
chy uniwersalne, co oznacza ich od ba-
danej kultury, i wieku itd. Autorzy polskiej adaptacji (Zawadzki, StreIau,
Szczepaniak i 1998) zbadali przy wzo-
ru alfa Cronbacha. Wyniki, w od skali, od 0,68 do 0,86.
Dokonano oszacowania w grupach j ednorodnych ze na
i wiek. w grupie kobiet i alfa Cronbacha
jest do siebie ale wykazuje w od wieku ba-
danych. skal wraz z wiekiem i jest naj w grupie
osób z wiekowego 50-80. alfa Cronbacha jest szcze-
gólnie niski w przypadku skali i wynosi 0,44 dla kobiet i 0,50 dla
czyzn. ten pokazuje, w jaki sposób
nej od konkretnej próby. W jednej grupie test
bardziej jednorodny, a w innej mniej.

do pomiaru testem 'oraz


W testowe do tego samego konstruktu. Polega na
jednokrotn)'Pl ba4anip testem gruPy osób:

96
5. Jakich informacji o dostarcza testowanie?

5.1.5. ocen
Innym sposobem szacowania ocen
wydawanych przez kompetentnych. Metoda ta stosowana jest
w przypadku testów, w których pytania charakter otwarty i nie ma
klucza na odpowiedzi badanych.
punkty za odpowiedzi na pozycje testowe tych samych osób. W przy-
padku tej metody jest, aby byli dobrze zaznajomieni z
tymi kryteriami oceny, a by ich oceny od siebie.
jest tu test ocenia dwóch
oblicza prosty korelacji (np. r-Pearsona),
w przypadku liczby wykorzystuje kore-
lacji W-Kendalla (zob. np. 1996). (od O do 1)
wskazuje na - im tym
sza ocen. Warto w wypadku analizy
uzyskany w istocie informuje o ocen dokonanych przez

omawianej metody szacowania jest


ocen Na bowiem po-
w ocenach wskazuje na
czynników subiektywnych. w którym zastosowano oma-
jest Test Niedok011czonych (Jaworowska i Matczak,
1998). Test ten z zdal1., które osoba badana ma
zgodnie ze swoimi skojarzeniami i odczuciami. Na podstawie kryte-
riów, diagnosta przyznaje punkty za Jak autorki
polskiego opracowania, przy tego rodzaju procedurze istnieje element subiek-
tywizmu. Problem z pytaniem, czy gdyby ten sam arkusz
odpowiedzi osoby, to wynik ogólny taki sam czy nie.
tego testu, wylosowano po 30 i ko-
biet z z trzech wersji testu. odpowiedzi osób badanych ocenia-
ne przez dwóch kompetentnych, kryteriami oceny.
W celu ustalenia obliczono korelacji
rangowej p Spearmana. korelacji od 0,89 do 0,97.
ocen zastosowano w Figuralnej
Ruffa (RFFT) i 2007). W tym osobie badanej prezentuje
kwadraty z rozmieszczonym w nich kropek oraz
cych. Zadaniem badanego jest co najmniej dwóch kropek
tak, aby nowa figura. zlicza unikalnych oraz
perseweracyjnych. Autorki polskiej adaptacji
w RFFT w ocenianiu, z
do perseweracyjnych. Badacz czasem
jako lub jako niepoprawny 97
Konrad Jankowski, Marcin Zajenkowski

wzór oryginalny. W z tym, zdecydowano me-


aby na ile jednoznaczny jest algorytm ocenia-
nia. Uzyskany wysoki W-Kendalla na
ocen trzech oraz czynników subiektywnych.
c c c

na ile obiektyWnajestocenaodpowiedzios6b badanych. Polega na tym, te same


arkusze odpowiedzi oceniane. przez kompetentnych.

5.1.6. Porównanie metod szacowania


Przed wybraniem metody estymacji
testu oraz czynniki na danego z nich
bowiem, mówi o innym, specyficznym prezentujemy skró-
towe zestawienie wszystkich metod szacowania (tabela 5.3.).

Tabela 5.3. Zestawienie metod szacowania

1 2 3 4
Metoda specy- Informacje o zastoso-
ficzne dla metody wanie
Wiarygod- Losowe zmiany W jakim stopniu Testy, w których
testu ze stanem test jest na uczenie nie ma
osoby badanej i sytu- przypadkowe zmiany na wyniki np.
badania z testy motoryczne;
i testy na czas reakcji
testowania
Losowe zmiany W jakim stopniu Przy pomiarze cech
z wyniki testu np. kwestionariusze
czasu w czasie testy
inteligencji
Dobór pozycji do Rzadko stosowana
wersji testu stwa wersjami metoda
te s- alternatywnymi testu
towa
Dobór pozycji do Przy pomiarze cech
wersji testu stwa wersjami np. kwestionariusze
alternatywnymi testu. testy
W jakim stopniu inteligencji
pomiar jest
w czasie

98
5. Jakich informacji o dostarcza testowanie?

Tabela 5.3. c.d.

1 2 3 4
Metoda po- Dobór pozycji do W jakim stopniu test Testy, w których
lówkowa polówek testu jest jednorodny pozycje
np. testy
inteligencji
W jakim stopniu test Testy, w których po-
pozycji testu jest jednorodny zycje równolegle
np. kwestionariusze
testy
style, stany
Niejasne kryteria W jakim stopniu na Testy, w których brak
ocen oceny odpowiedzi; odpowiedzi jednoznacznych
ocen osób badanych kryteriów oceny od-
czynniki su- powiedzi, np. metody
biektywne swobodne
z

5.1.7. Metody szacowania w SPSS


W tej zaprezentowane procedury obliczania omó-
wionych za pakietu statystycznego SPSS.
omówiona metoda zawiera który policzony na danych
na do W w nawiasach,
nazwy plików dane, na których liczony konkretny

5.1.7.1. Metody dwukrotnego badania tej samej grupy osób


W tej zostanie opisany sposób obliczania testu, stabil-
testowej i
w SPSS. W metodach tych jako traktowana
korelacji r-Pearsona pierwszym a drugim pomiarem danym te-
stem (dla testu i albo pomiarem
testem pierwszym a drugim (dla testowej i
inaczej, pomiaru testem
korelacji dwoma zbiorami wyników danej grupy osób. Wymienione me-
tody omówione razem, sposób w przypadku
z nich jest identyczny. Procedura zostanie omówiona na
dzie.
W pierwszym kroku dwa zbiory wyników testu na danej gru-
pie osób i dla osoby wynik otrzymany (sumaryczny wynik w te-
99"
Konrad Jankowski. Marcin Zajenkowski

Rysunek 5.1. Okienko arkusza danych z wynikami testu przygotowanymi do analizy sta-

W prezentowanym (plik danych: stabilnosc.sav) przebadano 100


osób dwa razy tym samym testem z pomiarami
(czyli przeprowadzono badanie Test, którego rze-
sprawdzono, z 10 pozycji. W sumie od
10 do 20 punktów. Obliczono wyniki dla osoby, w pierwszym
i drugim pomiarze tym testem, które wprowadzono do arkusza danych
SPSS. Wiersze kolejne osoby badane, a kolumny - wyniki otrzyma-
ne w pierwszym i drugim badaniu (rys. 5.1.). W obli-
oboma zbiorami wyników. Jak
istotne jest sprawdzenie z obu pomiarów. W tym celu
w: Analiza -> Porównywanie -> Test t dla prób
(rys. 5.2.).

Raporty warstwowe •
Opis statystyany •

............
Tabele specjalne •
,1IlI1I1IIIIIIII ...
. Ogólny modelllniowy Test t dla jednej próby •..
Modele mie&zane • Testt dla prób ...
Korelatje
Regresja • ANOVA ...
... Ii. u.

Rysunek 5.2. Okienko wyboru testu t dla prób

100
5. Jakich informacji o dostarcza testowanie?

Rysunek 5.3. Okienko testu t dla prób

Po przerzuceniu zmiennych pomimol i pomiar2, OK (rys. 5.3.).

100 .m .001i

Ist.1M'.
I (II 4""'_ )

Rysunek 5.4. Wydruk analizy testu t dla prób

wydr uk analizy (rys. 5.4.). Z tabeli dolnej "Test dla prób


nych" która wskazuje, czy
nice pomiaru 1 i pomia ru 2. W prezentowanym
nie dwustronna jest od 0,05.
Skoro jest o pomiarami,
korelacji r-Pearsona z tabeli "Kore lacje dla prób
p<O,OOl. Zatem naszego
Wynosi ona 0,982 przy poziomie
wynosi 0,982. nie wy-
testu badan a
efekt, który lub wyników
pomi arów nie uprawnione jest stwierdzenie, wyniki tego
testu w czasie.

101
Konrad Jankowski, Marcin Zajenkowski

5.1.7.2. Metoda w SPSS


W tej zostanie przedstawiony sposób obliczania po-
Spearmana-Browna w SPSS na
Skonstruowano kwestionariusz z 20 Zbadano
jego za metody Przebadano w tym celu 60 stu-
dentów. Ich wyniki zapisano w arkuszu danych programu SPSS (plik danych:
W wierszach wyniki kolejnych osób, a w kolum-
nach o pl, p2, ... , p20 odpowiedzi na kolejne pytania
(rys. 5.5.).

l'I!I; Edl'li>! \\jifGl;


,
Analiza WY"_
.... " ............. .,... ..,,,
"
"'2!Jdil!l {

Rysunek 5.5. Okienko arkusza danych z wynikami testu przygotowanymi do analizy rze-

Aby do: Analiza->Skalowanie->Analiza rze-


(rys. 5.6.). model oraz przerzu-
wszystkie pozycje testu do okna "Elementy" (rys. 5.7.).

Porównywanie ..... r"'·';"';"',",·":"·' I

Ogólny m.delliniowy

._,3_
Modele ",.,.la,,,,
Korelaq.,
Regresja
Analily il>gIIniowe
!(laByfikacja
RedukCJi' danym

Testy ,

Maizy
W.,lokrome odpoWiedzi •

Rysunek 5.6. Okienko wyboru analizy


102
5. Jakich informacji o dostarcza testowanie?

Rysunek 5.7. Okienko analizy z zaznaczonym modelem

Wydruk analizy prezentuje rys. 5.8.

1nf00000acja o anatizowanych danych


N %
60 10Q,O
O ,O
60 1QO.0
11., Usuwanie obserwaQaml ze wanalizie,
5tatyslytll
1 wartosc ,0\$4
Liczba pozycji 1(){a)
2 ,263
10(bJ
20

,542

,703
,703
,664

ll,. Pozycjami pl, p2. 1)3, p4, pS, p6, p7, pS. p9, p10.
lt Pozyqaml p11, p12, p13, p14, p15, p16, p17, p18, p19, p20

Rysunek 5.8. Wydruk analizy

testu zbadana wynosi 0,703.


Spearmana-Browna w tym jest taki sam przy
równej i nierównej testu. te nieznacznie,
gdyby test inaczej w z nieparzystej licz-
by pozycji.
Korelacja to korelacji r-Pearsona
testu. Po podstawieniu tej (0,542) do wzoru
5.1, w miejsce rpp Spearmana-
-Browna przy o równej
103
Konrad Jankowski, Marcin Zajenkowski

znajduje wiersz do wykonania analizy


dla

RELIABILITY I
/VARIABLES=pl p2 p3 p4 p5 p6 p7 p8 p9 plO pll pl2 pl3 pl4 p15 p16 p17
p18 pl9 p20
ISCALE(' ALL VARIABLES') ALLlMODEL=SPLIT.

na dokonuje w taki sposób, do pierwszej zalicza


pozycje od pl do plO a do drugiej Aby
przy innym podziale testu na np. go na pozycje parzyste i nie-
parzyste, w polu "Elementy" (rys. 5.7.) najpierw pozycje
o numerach nieparzystych (czyli 1,3,5 itd.), a o numerach parzystych
(czyli 2, 4, 6 itd.). Wiersz wtedy

RELlABILITY
/VARIABLES=pl p3 p5 p7 p9 pll p13 pl5 pl7 pl9 p2 p4 p6 p8 plO pl2 p14
pl6 pl8 p20
ISCALE('ALL VARIABLES') ALLlMODEL=SPLIT.

5.1.7.3. Alfa Cronbacha w SPSS


W tej zostanie przedstawiony sposób obliczania
za alfy Cronbacha w SPSS na
Skonstruowano kwestionariusz z 20 i za-
planowano jego Przebadano w tym celu 60 osób,
a ich wyniki zapisano w arkuszu danych programu SPSS (alfa.sav). W wierszach
wyniki kolejnych osób, a w kolumnach o pl,p2, ... ,p20
odpowiedzi na kolejne pytania. Aby Cronbacha,
do: Analiza-> Skalowanie->Analiza (rys. 5.6.).
Wszystkie pozycje, na której badana,
do okna "Elementy:" (rys. 5.9.). czy
w okienku "Model:" zaznaczonajest "Alfa". Po przycisku "Statystyki",
okno (rys. 5.10.), w którym warto "Skala przy wy-
kluczeniu pozycji". Opcja ta przewidzenie alfy,
by z analizy Po "Dalej" i "OK",
wydruki przeprowadzonej analizy (rys. 5.11.).
alfy z okna "Alfa Cronbacha". Dla analizowanego
kwestionariusza wynosi ona 0,715. Z tabeli "Statystyki pozycji
tego kwestionariusza najbardziej,
104 gdyby p13, i wtedy 0,728. Zatem,
5. Jakich informacji o dostarcza testowanie?

poprzez eliminowanie pozycji testu, które


jego
znajduje wiersz do wykonania analizy
alfy Cronbacha dla

RELIABILITY
IVARIABLES=pl p2 p3 p4 p5 p6 p7 p8 p9 plO pll p12 p13 p14 p15 p16 p17
p18p19p20
/SCALE(' ALL VARIABLES') ALL/MODEL=ALPHA
ISUMMARY=TOTAL .

Rysunek 5.9. Okienko analizy z Cronbacha

Rysunek 5.10. Okienko statystyki w analizie

105
Konrad Jankowski, Marcin Zajenkowski

Stil\Y$llllll OgÓ!6Il.

Alfa

o
P02Ytji
pl 47,68 31,831 ,691
p2 48,03 41,413 ,720
p3 4B,60 36,912 .421 ,690
1'4 48,38 37,529 ,517 ,685
pS 4B,27 37,%2 ,320 ,701
p6 47,43 37,131 ,530 ,6B3
p7 48,13 40,219 ,119 ,723
p6 47,78 38,545 ,443 .693
p9 48,43 37,741 ,364 0696
plO 47,92 3UOO ,502 .685
pll 48,07 41,758 ,048 ,724
p12 48,40 40,447 ,H9 ,713
pi3 47,77 42,555 -,Q15 ,728
pi4 47,35 38,082 ,325 .700
Irl5 48,42 38,145 ,314 ,702
1'16 47,35 40,638 ,167 ,714
1'17 47,93 38,572 ,266 ,707
pH 47,67 39,446 ,386 ,a9a
p19 48,05 41,913 ,041 .724
plO 47,52 41,000 ,368 ,105

Rysunek 5.11, Wydruk analizy alfy Cronbacha

5.1.7.4. pomiaru testem jako w SPSS


W tej zostanie przedstawiony sposób obliczania
w SPSS na
Skonstruowano test rysunkowy do badania nasilenia u dzieci.
Polega on na poproszeniu dziecka o narysowanie domu na czystej kartce A4, stan-
dardowym, dwunastokolorowym zestawem kredek. Przebadano nim
dzieci. nie ma prostego klucza przyznawania punktów za wykonanie
tego testu (tzn. nie ma szablonu, który by do rysunku i
punkty), poproszono trzech o wykonania testu i przyznanie
odpowiedniej liczby punktów w od nasilenia
kryteriami do przyznawania punktów, gdzie O oznacza brak depresji,
a 10 - jej wysokie nasilenie. Oceny testów przedstawione na rys, 5.12.

Rysunek 5.12. Okienko arkusza danych z wynikami przygotowanymi do analizy zgodno-


1 Oh
5. Jakich informacji o dostarcza testowanie?

wiersz reprezentuje a kolumny - kolejne dzieci, których testy


oceniane. Zaznaczona komórka reprezentuje przez
trzeciego testu wykonanego przez dziecko numer 10. Tak przygotowane
dane analizie (zgodnosc_sedziow.sav). W tym
celu do: Analiza-> Testy nieparametryczne-> K prób
(rys. 5.13.) i wszystkie zmienne do okna "Zmielme testowane" oraz
na dole test "W Kendalla" "Friedman", dla
wydruku analiz) (rys. 5.14.).

POI'ÓWf1Y'1\'anie s-ednkh
model liniowy
Modele mieszane
Koreta.."je
R.egresja

.........
Analizy loglinicl'",e •
Klasyfikacja •
Redukcja danych •
Skalowanie •
Chi-kwadrat...
Szeregi czasowe • Dwumianowy •..
MWY • Serii...
odpowredzl • KoS d!aJednej próby ...

Rysunek 5.13. Okienko wyboru analizy

Rysunek 5.14. Okienko testów dla kilku prób z zaznaczonym W-Kendalla

107
Konrad Jankowski, Marcin Zajenkowski

051
os2
os3 5,00
054 2,33
0$5 3,50
056 1,00
os7 4,67
os8 8,33
059 5,67
os10 8,67

testu
3
,919
24,811
9
,003

Rysunek 5.15. Wydruk analizy W-Kendalla

Rys. 5.15. przedstawia wydruk analiz. Najbardziej jest


czynnik W-Kendalla, który wynosi 0,919, przy poziomie 0,003
(W = 0,913; chi 2(9) = 24,811; p<O,OI). Oznacza to, zgodnie
ocenili testy wykonane przez poszczególne dzieci, co oznacza rzetel-
tego testu.

znajduje wiersz do obliczenia W-Kendalla


dla zaprezentowanego

NPAR TESTS
/KENDALL = osI os2 os3 os4 os5 os6 os7 os8 os9 oslO
/MISSING LISTWISE.

Pytania
1. w jaki sposób o testów odnosi do
wszystkich omówionych metod szacowania
2. i bez-
a
3. Zbadano dwukrotnie 100 osób pewnym kwestionariuszem w od-
2 tygodni. Uzyskano pomiarami 0,8 oraz
108 istotne statystycznie w w obu badaniach. Czy na podstawie
5. Jakich informacji o dostarcza testowanie?

uzyskanych wyników kwestionariusz ten jest stabil-


ny czasowo? Uzasadnij
4. Od czego przerwy czasowej w badaniu
5. Skonstruowano test inteligencji w którym poziom
wzrasta stopniowo. Jakiej metody szacowania w grupie dzieci na-
w tym przypadku? Uzasadnij wybór.
6. W pewnym ocenia osób badanych na podstawie ich
z Badani wszystkie skoja-
rzenia, jakie im do w z danym W celu
oszacowania tego testu, arkusze odpowiedzi osób badanych przed-
stawiono trzem kompetentnym psychologom. Poproszono ich, aby na pod-
stawie kryteriów ocenili badanych na skali
od l do 3. obliczono W-Kendalla i uzyskano war-
0, l. O czym ten wynik?

Zadania
1. W pewnym inteligencji postanowiono po-
Po zbadaniu odpowiedniej grupy osób, podzielono test na dwie
W jednej pozycje parzyste a w drugiej nieparzyste.
obliczono korelacji który wyno-
0,6. Oblicz tego testu.
2. w tabeli 5.4., przedstawiono wyniki osób uzyskane w pewnym
kwestionariuszu Kwestionariusz z czterech pozycji,
a zakres odpowiedzi na trój stopniowej skali (od l
do 3). Oblicz jego przy wzoru alfa Cronbacha
na podstawie przedstawionych danych.

Tabela 5.4. Wyniki osób w kolejnych, czterech pozycjach testowych

Pozycje testowe
Osoby
1234
1 221 1
2 2122
3 3323
4 2222
5 1232

109
Konrad Jankowski, Marcin Zajenkowski

Zadania w SPSS
prezentujemy zadania do obliczenia w SPSS. Dane zawarte na
cie do
l. Sk0J.1struowano kwestionariusz
Przebadano nim dwukrotnie 100 osób w 3 tygodni. Uzyskane dane
zawiera zbiór o nazwie "rzetelnoscl.sav". Wybierz i zin-
terpretuj uzyskany
2. Pewnym kwestionariuszem z 20 zbadano
120 osób. W zbiorze danych o nazwie "rzetelnosc2.sav" przedstawiono od-
powiedzi badanych na pytanie. wszystkie pozycje
podobne i siebie Wybierz naj-
i zinterpretuj uzyskany
3. W zbiorze danych "rzetelnosc3.sav" zawarto wyniki 60 osób uzyskanych
w pewnym inteligencji. Test z 20 zadall. W z nich
badani mogli l punkt za poprawne lub O za
Zadania Wybierz
i zinterpretuj uzyskany
4. Skonstruowano pewien test do badania wzrokowej. Polega on na
tym, osobie badanej prezentuje przez 3 minuty, po czym,
po 10 minutach, prosi aby z Diagnosta, na
podstawie kryteriów, ocenia wykonanie zadania na skali od 1 do
10. W celu zbadania tego testu poproszono trzech kompetentnych
psychologów o ocenienie rysunków 20 osób. Dane z tego badania zawiera
zbiór o nazwie "rzetelnosc4.sav". Wybierz i zinterpretuj
uzyskany

110
Adam Tarnowski
PSYCHOLOGII
UNIWERSYTET WARSZAWSKI
Krzysztof Fronczyk
PSYCHOLOGII
FINANSÓW I W WARSZAWIE

5.2. pomiaru testem


W niniejszym rozdziale przedstawione informacje doty-
pomiarów dokonywanych przy testów psychologicznych.
Omówione trzy rodzaje oraz sposoby ich szacowania.

5.2.1. i jej z innymi testu


Tradycyjnie pomiaru testem rozumiana jest jako wskazu-
czy test istotnie mierzy to, do mierzenia czego skonstruowany. Innymi
pomiaru testem to w jakim interpretacja jego wyników
jest zgodna ze stanem faktycznym. Jednak bardziej ogólnie
pomiaru testem informuje o tym, jakie wnioski
ne na jego podstawie. takich
jak: W jakim stopniu wyniki testu A matematyczne?; W jakim
stopniu powodzenie na studiach na podstawie wyników
testu B?; Czy kwestionariusz C dobrze diagnozuje Czy
test D mierzy jedynie czy inne psychiczne
Jak we wszystkich tych o konkretne
zastosowanie testu, a o interpretacyjne uzyskanych wyników.
Zatem np. trafny test inteligencji informuje wiernie o poziomie inteligencji
wieka, a decyzje na jego podstawie, takie jak np. skierowanie dziecka do
specjalnej, i zgodne ze stanem rzeczywistym. W poruszonym
to, dziecko wymaga specjalnego toku nauczania ze
na Co w toku nad
interpretacyjne wyników danego testu szersze

Zmienne, takie jak inteligencja, czy ekstrawersja


w wielu badaniach naukowych i praktyce psychologicznej. Za ich
i zachowanie ludzi. Takie
ukryte nazywamy zmiennymi latentnymi (nieobserwo-
walnymi), natomiast je wyniki testowe - zmiennymi mani-
festowanymi. W psychologii, podobnie jak w wielu innych naukach, istnienie
tego typu zmiennych teorie naukowe. Historia psychologii
111
Adam Tarnowski, Krzysztof Fronczyk

dostarcza jednak których


bardzo niska. Dlatego badanie pomiaru testem dobrze jest od
refleksji tego, co w zasadzie chcemy oraz czy cecha,
test mierzy, jest wymiarem zachowanie
test inteligencji taka zmienna, jak "inteligen-
·cja" istnieje od konkretnego testu, czyli jest ona
tylko wynikiem testu. Co na podstawie wyniku testu inteligen-
cji chcemy niekiedy daleko wnioski, np. o osoby do
pracy, szansach na itd.
To o istnieniu danej cechy wynika z konkretnej teorii psycholo-
gicznej, a potwierdzone jest przez wyniki empirycznych. Sama
cecha jest jednak nie obserwowalna, a jej istnienie jest jedynie przez
Oznacza to, trudno jest dobry test na podstawie teorii
psychologicznej, która np. w jasno sposób definiuje czy nie
precyzuje jej przejawów. Pewnym od zasady testy ukie-
runkowane na przewidywanie kryteriów. o nich mowa w cZ't-
kryterialnej (patrz punkt 5.2.2.3.).
jest testu. ona od innych
na które autorowi testu jest Aby test trafny, musi
warunki: normalizacji, standaryzacji i obiektywizmu (oczy-
to warunki wzajemnie to warunki konieczne
pomiaru testem, jednak nie one Aby pomiar testowy trafny,
musi on dodatkowo dobrym badanej zmiennej latentnej. Zanim
jednak zajmiemy sposobami dowodzenia wynikami testu
a przekonajmy w jaki
sposób od cech testu.
Test o nieustalonej standaryzacji nie trafny, jego wynik
od niesystematycznych odmiennie podawanej instrukcji
i zachowania psychologa w stosunku do osób
badanych. instrukcja nie motywacji do
poprawnego wykonywania lub po prostu nie ich w dostatecz-
nym stopniu. Uzyskany wynik a wnioski
na jego podstawie z nie
nie ustalone w sposób jasny zasady interpretacji wyników, a
test nie obiektywny, wnioski na jego podstawie niepra-
Psycholog musi sobie z tego, do jakich wniosków test
go do jakich nie. jest wnioskowanie na pod-
stawie testu o cechach, do których odnosi on Badanie
musi nie tylko testu jako jednej lecz rodzaju
wniosków, które wysnuwane na podstawie jego wyników. Tak
112 wnioski z testu ograniczone do sytuacji, w których on spraw-
5. Jakich informacji o dostarcza testowanie?

dzony. Obiektywizm testu, a zbiór dochodzenia od wyników testu do


wniosków diagnostycznych, jest warunkiem jego
Normalizacja (zagadnienie to szerzej opisano w rozdziale 6.2.) oznacza za-
opatrzenie testu w pewien odniesienia. normom testowym
dany wynik jest niski, lub wysoki na tle populacji.
Oznacza to, chcemy z testu poprawne wnioski, musimy posia-
odpowiedni dla danej sytuacji odniesienia. Dobrym ilu-
ten problem testy koordynacji, wykorzystywane w badaniach kie-
rowców. Normy do tych testów na podstawie
Kobiety z w podobnych zadaniach wyniki
Zatem kobieta badana tego typu testem, wynik w grupie
kobiet oceniona jako osoba o poziomic badanej cechy,
jej wynik porównany z normami opracowanymi dla Brak
adekwatnej normalizacji powoduje wnioski, a zatem traf-
pomiaru testem. próg uznanie osoby za do
prowadzenia pojazdu powinien ustalony obiektywnie i od
jednak trzeba kobieta w wynik
norm dla charakteryzuje dla kobiet.
uwagi sytuacji diagnozy indywidualnej, nie na-
ukowych, w których dopuszcza wykorzystywanie nieznormalizowanych wy-
ników testowych. W badaniach naukowych nie zwykle wniosków
pojedynczych osób, a jedynie grup badanych. W takiej sy-
tuacji nie potrzebne normy, a tym samym nie one na
wniosków.
W szczególny sposób i
przypomnijmy, oznacza pomiaru. Test rzetelny to test
obarczony Nierzetelny test nie trafny,
pomiaru jakichkolwiek wniosków. Mówimy,
jest pomiaru testem, warunkiem koniecznym po-
prawnego wnioskowania.
Warunek ten nie jest jednak pomiaru nie gwa-
rantuje wniosków. test, czyli test o bardzo wy-
sokiej nie musi zmiennej. W celu wykazania,
tak jest konieczne badania co opisano
w dalszej
Warto odwrotny problem. Jedna z metod szaco-
wania pomiaru testem polega na badaniu jego (roz-
5.1.4.). tak, test o skrajnie wysokim
rozumianej jako jest na
ze na i
lub testowych. Wysoka wyznaczona w inny sposób, np. za po- 113
Adam Tarnowski, Krzysztof Fronczyk

analizy testu, nie jest w sposób z


pomiaru testem.
Tak aby nad pomiaru testem,
w pierwszej by on rzetelny, obiektywny, wystandaryzo-
wany i znormalizowany.

5.2.2. Rodzaje
Testy psychologiczne stosowane w bardzo sytuacjach np. w psy-
chologiipracy, w diagnostyce klinicznej, w poradnictwie szkolnym i zawodo-
wym oraz w badaniach naukowych. Wnioski z wyników testów i ich
interpretacja trafne w bardzo sytuacjach i aspektach.
Dlatego, innymi, kilka rodzajów Tradycyjnie
i klasyfika-
rodzajów przedstawiamy w ninicjszym z tych
trzech jest w innych zastosowaniach testu. Dalej zosta-
omówione sposoby szacowania poszczególnych rodzajów a
zastosowania, w których one szczególnie istotne.

5.2.2.1.
(zwana czasem to w jakim
pozycji testowych jest reprezentatywna dla definicji badanej cechy. Badanie
zmiennej badanej przez test a
pozycji jest w zasadzie równoznaczne z testu.
Najprostszym zagadnienie jest
test szkolnych, którego pytania powinny w jednakowym
stopniu wszystkich omawianych w ramach danego przedmiotu i jedno-
nie nauczanych w ramach innych przedmiotów. test
ma badaniu zmiennych psychologicznych, sytuacja nieco komplikuje.
z definicj i zmielmej , ma dany test, z j a-
kich obszarów powinny poszczególne elementy testowego.
postawa wobec pewnego zagadnienia powinna z definicji
w sobie komponent poznawczy o tym zagadnieniu), emocjo-
nalny (emocje z nim oraz behawioralny do podejmowania
pewnych z tym zagadnieniem), to pozycje testu
go powinny wszystkie elementy w po-
dobnych proporcjach.
Podobnie, przyjmie robocza obejmuje wzrokowo-
oraz to test roboczej wi-
nien zadania operacji procesy realizo-
114 wane zarówno na materiale wzrokowo-przestrzennym, jak i werbalnym.
5. Jakich informacji o dostarcza testowanie?

Bardzo jest wybór definicji badanej zmiennej. Analiza definicji


wia zakresu mierzonej zmiennej. Istotne jest to, w psy-
chologii istnieje niejednokrotnie wiele koncepcji za-
Z tego powodu jest znalezienie definicji tych samych
zmiemlych. od wybom definicji, test trafny
nie. czy wszystkie po-
zycje testowe do zakresu wybranej definicji.
Jako tu teoria Eysencka. tego
autora (Strelau, 2001) z trzech wymiarów: ekstrawersji,
neurotyzmu i psychotyzmu. chcemy
skali przeznaczonej do pomiam ekstrawersji. W Eysencka na wymiar eks-
trawersji takie jak:
poszukiwanie beztroska, dominacja, oraz
Oznacza to, w kwestionariuszu przeznaczonym do pomiam ekstra-
wersji powinny pytania wszystkich
tych Nie powinny tam pytania np.
jest to innego wymiam Eysencka - neurotyzmu.
Wykazanie skali ekstrawersji na podstawie definicji
Eysencka nie oznacza, skala ta jest trafna, pod
Tak do de-
finicji ekstrawersji, np. z koncepcji McCrae i Costy (2005). Mimo
teorie Eysencka oraz Costy i McCrae to jednak
ekstrawersji jest nieco odmienna.
definicja nie tylko elementy danego ale tak-
proporcje, w jakich powinny one w tre-
dotyczy tego, czy test proporcjonalnie reprezentuje definiowany
konstrukt.
Proporcje te szczególnie istotne w przypadku testów stosowa-
nych w dydaktyce. Na w z psychometrii znacz-
nie powinno pomiaru
testem etyki testowych, tej pierwszej problematyce
znacznie uwagi w trakcie W przypadku pomiam
psychicznych kwestia poszczególnych
ków mierzonej zmiennej jest w ten sposób, wszyst-
kie w jednakowym stopniu. Rzadko bowiem
który ze jest bardziej istotny.
Zbudowanie testu trafnego powinno zatem na zgromadzeniu
pozycji testowych reprezentatywnych dla badanej zmiennej na podstawie
tej definicji. Problemem do to, na ile zebrane pozycje testowe
reprezentatywne dla definicji badanej cechy. Zagadnienie to roz-
przy pomocy kilku tzw. kompetentnych, którymi 115
Adam Tarnowski, Krzysztof Fronczyk

eksperci w danej dziedzinie. ci w jakim


z pozycji testowych odpowiada definicji cechy, ma test.
powinni zgodni w opiniach, co do stopnia
poszczególnych pozycji testowych dla badanej cechy, a ich
oceny powinny pozycje testowe definicji skali. Oba
te kryteria sprawdzone statystycznie. W celu sprawdzenia
W-Kendalla. tego
czynnika zmienia °
w przedziale od do l. Im jego tym
sza ocen Wysoki W-Kendalla nie oznacza jesz-
cze, test jest trafuy a jedynie, podobnie
pozycje testowe. Konieczne jest jeszcze przyjrzenie ocenom wystawionym
przez Tylko zgodni i wystawiali wysokie po-
szczególnym pozycjom testowym, test jest trafny.
zgodni, ale wystawiali niskie oceny. Oznacza to, test nie jest
trafny. niektóre pozycje testowe oceny wy-
sokic, a niektóre - niskie. Przy oznacza to, te pozycje
testowe, które niskie oceny nietrafne, - trafne.
Wykorzystanie kompetentnych w szacowaniu
ilustruje fikcyjny zbudowano postawy
wobec zasad ruchu drogowego, rozumianej jako stosunek do for-
malnych i nieformalnych norm poruszanie po drogach,
w poszukiwaniu informacji, emocji i stosowaniu do tych
zasad. 6 komponentu poznawczego (pytania l
i 2), emocjonalnego (pytania 3 i 4) i behawioralnego (pytania 5 i 6) tej postawy.
Poproszono trzech psychologów i wojskowych o
czy z pozycji skali jest zgodna z postawy wobec bezpie-
ruchu drogowego. ustosunkowywali do
pytania skali, je na skali: 5 - zgodna z de-
4 - Zasadniczo zgodna z 3 - Zgodna w stopniu
z 2 - W niewielkim stopniu zgodna z l - Niezgodna z defini-

i oceny zawiera Tabela 5.5.


z komputera lub kalkulatora i kartki papieru,
nie ocen przypisanych poszczególnym pozycjom testowym przez oraz
W-Kendalla. W
dzie wynosi on 0,765 (sposób obliczania przedstawiono w rozdziale 5.2.5.1.) ijest
istotny statystycznie. to o
najgorzej ocenili pozycje 5 i 6, a mamy zamiar
kwestionariusz, to te pozycje winny wyeliminowane.

116
5. Jakich informacji o dostarcza testowanie?

Tabela 5.5. Oceny postaw, dokonane przez 3 kom-


petentnych fikcyjny)

Stwierdzenie
I II III ocen
1. opis samochodu w prasie moto- 5 4 5 4,67
ryzacyjnej, szukam wyników testów zde-
rzeniowych
2. samochodem, w radio in- 5 3 5 4,33
formacji ryzykow-
nych miejsc
3. kierowców na 5 4 4 4,33
drodze budzi we mnie gniew
4. bezpiecznie, kiedy zgodnie 5 4 5 4,67
z przepisami
5. Zawsze w pasach 3 2 4 3,00
6. W nieznanej okolicy zawsze 4 3 3 3,33
do znaków drogowych

Warto na jeszcze jedno istotne zagadnienie dla zachowania


testu w procesie ustalania ostatecznego zestawu pyta6 lub
testowych. Autor testu nastawiony na
tworzenia zestawu bardzo jednorodnych, np. pozy-
cje wysokimi mocy dyskryminacyjncj (patrz
5.3.2.). W tcn sposób wszystkie pozycje
pewnego aspektu badanej cechy, a pozycje
innych aspektów badanej cechy. Wynika to z tego, pozycje testowe
zwykle silniej skorelowane ze z pozycjami do-
innych aspektów badanej cechy. Tak w znajdzie
kilka specyficznych pozycji z punktu
widzenia zagadnienia, a one skorelowane z innymi po-
zycjami testowymi, one niskie moce dyskryminacyjne. Jak wia-
domo 5.3.2.), pozycje o niskich mocach dyskryminacyjnych zwykle
eliminowane. W tym jednak wypadku takich pozycji
test pewnego istotnego aspektu W skalach postaw ta-
kiego pozycje czynnika behawioralnego posta-
wy. Z pewnych powodów, które nie tu charakteryzowane
dlatego, trudno dobre po prostu badani ten-
do zachowa{l nie zawsze zgodnych z deklarowanymi pozycje
tego typu z innymi pozycjami. W efekcie wyeliminowania pozycji
aspekt behawioralny powstaje test za-
pewne ustosunkowaniem emocjonalno-poznawczym, ale nie
117
Adam Tarnowski, Krzysztof Fronczyk

5.2.2.2. teoretyczna
podstawowym i koniecznym rodzajem jest traf-
teoretyczna. Ten rodzaj jest to wynikiem te-
stowym a latentnej cechy, do pomiaru której test skonstruowa-
ny. zmienne latentne nie obserwowalne, sprawdzenie
teoretycznej musi na metodach (Nowakowska,
1975).
w jakim wyniki naukowych da-
nym testem z oczekiwaniami teoretycznymi. Oszacowanie trafno-
teoretycznej polega na hipotez wyprowadzonych z teorii psy-
chologicznej i weryfikowaniu ich w badaniach empirycznych z zastosowaniem
testu, którego chcemy pewna teoria
przewiduje, zmienna A jest ze B,
wyniki testu przeznaczonego do pomiaru zmiennej A skorelowane z wynikami
testu przeznaczonego do pomiaru zmiennej B. Przewidywanie to spraw-
w odpowiednim badaniu. Wynik istnienie takiej korelacji
obu testów. Wynik niepotwier-
istnienia wspomnianej korelacji - nie potwierdzi teore-
tycznej pomiarów testowych. nie musi
korelacji, tak jak w opisanym Weryfikowanie hipotez
wyprowadzonych z teorii psychologicznej w sposób.
Cronbach i Meehl (2005) podstawowych sposobów
oszacowanie teoretycznej. to:
• analiza korelacji z innymi testami lub zmiennymi,
• badanie struktury testu,
• oceny
• metoda zmian nieprzypadkowych,
• analiza procesu testu.
idea z wymienionych sposobów polega na przeprowadze-
niu badania empirycznego, którego wynik i z oczekiwaniami
teoretycznymi teoretycznej. Badanie
przewidywania teoretyczne o teoretycznej testu. Brak takiego
potwierdzenia jest za braku teoretycznej
testu.
Pierwszym z przez Cronbacha i Meehla (2005) sposobów jest
wspomniana metoda analizy korelacji z innymi' testami lub zmiennymi.
jest, pomiar korelacji wynika z teorii psycholo-
gicznej. Chodzi o korelowanie testu z takimi zmiennymi, co do których
istnieje uzasadnione teoretyczne przewidywanie, powinny one
ze przez test.
118
5. Jakich informacji o dostarcza testowanie?

prosty zastosowania korelacji w analizie dotyczy sy-


tuacji, kiedy wyniki testu, którego badamy, koreluje z wynikami in-
nego testu przeznaczonego do pomiaru takiej samej zmiennej. Innymi te
dwa testy skonstruowane na podstawie tej samej teorii
istnienie danej zmiennej i korela-
cja wyników Kwestionariusza Aprobaty i Drwal, 1995)
i skali K, z kwestionariusza EPQ-R. Oba przeznaczone
do pomiaru tendencji do udzielania odpowiedzi zgodnych z oczekiwaniami
i normami Nie to konkretne cechy psy-
chiczne, ale raczej skale kontrolne. W do kwestionariusza EPQ-R
(Brzozowski i Drwal, 1995) te dwie
skale ze skorelowane, co potwierdza ich
Bardziej sytuacja to taka, w której przez test
a zachodzi postulowana przez psycholo-
Jako wspomniana w rozdziale 5.2.2.1. postawa wobec
ruchu drogowego. Na podstawie teorii psycholo-
gicznych niejedno twierdzenie na temat tej postawy.
innymi postawa
zasad ruchu drogowego z zapotrzebowaniem na sty-
i poszukiwaniem Wynika to z niektórych teorii temperamen-
tu do konstruktu optymalnego poziomu pobudzenia (Strelau,
200 l). nieco to zagadnienie, ludzie
poziomem zapotrzebowania na z
pod optymalnego poziomu pobudzenia. W celu utrzymania optimum
pobudzenia (które jest dla osób), niektórzy ludzie ze-
stymulacji, inni - przeciwnie - Zapotrzebowanie na
jest jednym z podejmowania rodzaju zacho-
na celu podniesienie poziomu pobudzenia. Do tego ro-
dzaju m.in. norm podejmowanie ryzyka,
psychoaktywnych i wiele innych. Jednym z tego typu jest
zasad ruchu drogowego, z brakiem akceptacji przy-
najmniej niektórych przepisów drogowych. zapo-
trzebowanie na jest jednym (ale nie jedynym!) z posta-
wy wobec ruchu drogowego. Tak z teoretycznego punktu
widzenia, wyniki Skali Postawy Wobec Ruchu Drogowego
o nieakceptowaniu zasad ruchu drogowego powinny
z innymi miarami o zapotrzebowaniu na Aby
to przypuszczenie, wynikami
Skali Postawy Wobec Ruchu Drogowego a Poszukiwania
Zuckermanna. Prawdopodobnie
dzy wynikami Skali Postawy Wobec Ruchu Drogowego a inny-
mi wymiarami temperamentu (np. czy Emocjonalna) 119
Adam Tarnowski, Krzysztof Fronczyk

w inwentarzu Formalna Charakterystyka Zachowania - Kwestionariusz


Temperamentu (FCZ-KT), one do konstruktu optymalnego po-
ziomu pobudzenia. tu pewne rozumowanie teoretyczne, na
podstawie którego skorelowania skal. Korelacje powinny
nie tylko istotne statystycznie, ale odpowiednio wysokie.
Rzeczywistym zastosowanie korelacji testu z innymi
testami lub zmiennymi, jako metody badania teoretycznej jest korelacja
Skali kwestionariusza EPQ-R i Skali Mach przeznaczonej do
pomiaru makiawelizmu. koncepcji Eysencka (Strelau, 2001)
osoby o wysokim poziomie innymi
norm i dziwacznym zachowaniem, emocjonal-
nym oraz bezosobowym traktowaniem innych ludzi. Natomiast makiawelizm
to cecha innymi instrumentalnym trakto-
waniem innych ludzi. Osoby z innymi,
zyski tylko dla siebie. Nie z potrzebami partnerów inte-
rakcji. Nie trudno te dwa opisy ze wspólnego.
wyniki Skali powinny
z wynikami Skali Mach, o czym do
kwestionariusza EPQ-R (Brzozowski i Drwal, 1995).
za analizy korelacyjnej tylko, wybra-
na zmienna ma charakter w tym wypadku jest
czynnik korelacji stosuje r-Pearsona, lub tau Kendalla,
nie W przypadku zmiennych charakter nominalny
jest zastosowanie innych miar takich jak np.
korelacji punktowo-dwuseryjnej.
Po to, aby pomiaru testem nie wystarczy kore-
luje on z innymi zmiennymi, z którymi teoretycznie powinien.
jest udowodnienie, test nie koreluje ze zmiennymi, z którymi
nie powinien. Do tego pierwszego rodzaju korelacji odnosi
(zwanej a do drugiego - (zwanej
W celu sprawdzenia obu tych rodzajów ko-
nieczne jest takie zaplanowanie badania, aby oprócz danego testu w nim
takich miar, z którymi powinien on oraz innych, z którymi nie
powinien badamy Skali Ekstrawersji po-
z kwestionariusza EPQ-R, jej z kwestiona-
riuszem NEO-FFI, który zawiera
w aspekcie jest wysoka korelacja Skali Ekstrawersji kwestionariusza
EPQ-R z wynikiem odpowiedniej skali NEO-FFI,
Natomiast w aspekcie niskie korelacje
Skali Ekstrawersji ze skalami konstrukty, czyli z
120 mi skalami obu kwestionariuszy.
5. Jakich informacji o dostarcza testowanie?

jednoczesnej analizy i jest badanie


Skali Depresji Zunga (Terelak, Tarnowski i Kwasucki 1993). Skala ta
z innymi testami depresji, natomiast jeszcze silniej ze
Aprobaty Skala Zunga nie zatem trafna,
w stopniu i na
Wysokie wyniki w tym inwentarzu uzyskiwali prawdopo-
dobnie ludzie a nie na rzeczywiste objawy zabu-
nastroju.
i metodologicznie po-
na i jest tzw. macierz
wielu cech - wielu metod (Campbell'i Fiske, 2005). Polega ona na wyliczeniu ko-
relacji kilkoma (przynajmniej dwoma) wieloskalowymi
te same cechy (przynajmniej dwie). Przez rozumie
tu nie tylko kwestionariusze czy testy, ale np. wywiad czy
nieco sobie, wykonujemy badanie,
w którym zastosowano kwestionariusz przeznaczony do pomiaru dwóch cech
A i B. dokonujemy pomiaru tych samych cech przy pomocy
kompetcntnych, którzy cech A i B u osób badanych na podsta-
wie obserwacji. w obu badaniach bierze ta sama grupa osób.
Na podstawie uzyskanych danych korelacje:
a) dla tej samej cechy uzyskane za metod (np. dla cechy A mie-
rzonej za kwestionariusza oraz za ocen
b) dla cech uzyskane za metod (np. dla cechy A mie-
rzonej za kwestionariusza oraz cechy B mierzonej za ocen

c) dla cech uzyskane za tych samych metod (np. dla cechy


A i cechy B mierzonej za kwestionariusza).
Korelacje wymienionc w punkcie a) miarami Natomiast
korelacje wymienione w punkcie b) miarami
korelacje z punku c) o nie onc najlep-
szymi tego aspektu ewentuahle skorelowanie
z zastosowania tej samej metody.
Campbell i Fiske klika warunków, które kore-
lacje zawarte w macierzy wielu cech wielu metod, aby
analizowane trafne. Po pierwsze, wszystkie korelacje powinny
istotne statystycznie. Po drugie, korelacje powinny
korelacje
przedstawiony zostanie wykorzystania macierzy wielu cech
wielu metod z pracy Drwala (1995), a badania nad traf-
kwestionariuszy agresji. Dla potrzeb niniejszej wykorzystane
dane jedynie dwóch kwestionariuszy, jakimi Skala Agresji
Buss-Durkee (SABD) i Inwentarz Psychologiczny Syndromu Agresji (lPSA). 121
Adam Tarnowski, Krzysztof Fronczyk

Oba wiele skal do pomiaru aspektów agresywno-


jednak dla uproszczenia zaprezentowane dane
agresji fizycznej i agresji oba trafne, to ich skale prze-
znaczone do pomiaru tych samych aspektów powinny ze
skorelowane. Tak skale agresji fizycznej obu powinny
mocno ze skorelowane, podobnie jak skale przeznaczone do pomiaru agresji
Natomiast skale aspekty
nie powinny zbyt wysoko nie
nie one w ogóle ze Po prostu te
dwa aspekty ze na to, ogólnie zjawiska agre-
ze lecz na poziomie skale przezna-
czone do pomiaru tych samych aspektów Korelacje tych dwóch
uzyskane na podstawie badania 150 uczniów w wieku 14-18 lat, przed-
stawione w tabeli 5.6. Tabela przedstawia macierz dwóch cech -
dwóch metod.

Tabela 5.6. skal agresji fizycznej i agresji kwestionariuszy SABD i IPSA

SABD IPSA
Agresja Agresja Agresja Agresja
fizyczna fizyczna
SABD Agresja
fizyczna
Agresja 0,32

IPSA Agresja Q..6l 0,32


fizyczna
Agresja 0,24 QM 0,42

Dane zaprezentowane w tabeli z pracy Drwala (1995).

W tabeli 5.6., dla korelacje traf-


to korelacje tych samych cech, ale mierzonych za
metod. Natomiast korelacje
to korelacje metodami i cechami. Tabela ta zawiera
korelacji cech, ale mierzone za
tych samych metod.
Wszystkie zaprezentowane korelacje w tabeli 5.6. istotne statystycznie,
czyli od zera. Dodatkowo korelacje
wysokie. Pierwszy warunek postawiony przez Campbella i Fiskego jest
Korelacje zarówno od kore-
122 lacji cech metod, jak i od korelacji cech
5. Jakich informacji o dostarcza testowanie?

mierzonych tymi samymi metodami. Oznacza to, warunek drugi jest

opisywanej procedury jest przede wszystkim w znalezieniu ze-


stawów testów skale pomiar
i Zestawy takie bowiem dwa rodzaje skal.
Pierwszy z nich to takie skale, które z teoretycznego punktu widzenia powinny
ze a drugi to takie, które ze nie powinny.
Szczególnym skorelowania wyników testów korelacje skal
w jednego testu. Jako podte-
sty w baterii APIS. W (Matczak, Jaworowska,
Szustrowa, Ciechanowicz, 2006) do tej baterii testów
podtesty Synonimy i Nowe silnie ze skorelowane. Jest to
oba ten sam rodzaj -
werbalne. Podobnie podtesty Kwadraty i Klocki, jako wzro-
kowo-przestrzenne, silnie skorelowane. Istotne jest, podtesty
Kwadraty i Klocki znacznie silniej skorelowane z podtestami
Synonimy i Nowe Te dwa ostatnie znacznie silniej
z podtestami Kwadraty i Klocki. o pewnych gru-
pach podtestów silnie skorelowanych ze w grupy, a z testanu
z innych grup. Taki korelacji potwierdza baterii APIS,
testy te same silnie ze skorelowane, a z testami
inne -
w ramach jednego
z wielu takich grup wzajemnie skorelowanych skal, które
z innymi grupami skal istnieje nie tylko w przypadku baterii APIS, lecz
w przypadku wielu innych Zwykle takie grupy interpretowane
podobne cechy. Niekiedy grupa silnie
skorelowanych ze skal danego testu mierzy Istnienie takich
grup interpretowane jako teoretycznej, szczególnie
gdy w grupy skal silnie skorelowanych, przy
czym z tych grup mierzy przez
na podstawie której tworzono dane
Warto obecnie rozpatrywane korelacje
struktury testu. to bowiem grupy skorelowanych skal na
dane opisywane korelacji
wynikami danego testu a innymi zmiennymi czy innymi testami.
testu, warto nie
tylko o grupach wzajemnie skorelowanych skal danego testu, lecz o gru-
pach wzajemnie skorelowanych pozycji testowych. Podobnie jak w przypadku
skal, tak i w przypadku pojedynczych pozycji testowych ich
grupy relatywnie silnie skorelowane a skore-
lowane z innymi grupami pozycji. Takie grupy pozycji testowych 123
Adam Tarnowski, Krzysztof Fronczyk

zwykle poszczególnym skalom w z liczby


skal. pozycje testowe wzajemnie skorelowane, to powinny
wysokie mocc dyskryminacyjne (por. 5.3.2.) w swojej grupy.
z pozycji testowych ma moc to prawdopo-
dobnie mierzy ona pozycje, a jest nietrafna.
Tego typu pozycje usuwa zwykle w czasie tworzenia testu. eliminacji
pozycji testowych z itemami, uzyskuje wy-
Test o
za jednej zmiennej, nie w nim
pozycje nietrafne o niskich mocach dyskryminacyjnych.
W przypadku liczby pozycji testowych analiza wszystkich korelacji jest
trudna. rozpatrzenie wszystkich korelacji np. 100
pozycji testowych z W celu wzajem-
nie skorelowanych grup pozycji testowych skal,
Jest to skomplikowana matematycznie metoda
analizy danych. W niniejszym przedstawione
jej zastosowania w psychometrii. Omawianie bardziej
matematycznych z poza ramy niniejszej
Zainteresowany Czytelnik znajdzie omówienie analizy czynnikowej
w pracach Okonia (1964), Nowakowskiej (1975) czy Zakrzewskiej (1994).
Analiza czynnikowa grup pozycji testowych
skal silnie skorelowanych grupy i relatywnie
dzy grupami. Grupy pozycji testowych tej meto-
dzie, czynników. Czynniki interpretowane jako
zmienne odpowiedzialne za wyników poszczególnych skal
pozycji testowych, na dany czynnik. zaleta
nia czynników polega na tym, zamiast liczby pozycji testowych otrzy-
mujemy relatywnie zmiennych. Jest to sposób zna-
lezienia zmiennych ujmowanych przez dany test. Skoro
analiza czynnikowa zmiennych mierzonych przez dany
test, jest ona badania jego
Zasadniczo dwie odmiany analizy czynnikowej . z nich jest
eksploracyjna analiza czynnikowa, a - konfirmacyjna analiza czynniko-
wa. Konfirmacyjna analiza czynnikowa ma na celu sprawdzenie, czy dany test
da z na podstawie teorii psychologicznej, liczby CzyImików. Pozwala
ona czy wyniki danego testu zgodne z
testu. Konfirmacyjna analiza czynnikowa dostarcza specjalnych
ków dopasowania modelu istnienie liczby czynników, na
podstawie których takiego modelu teoretycznego.
Dla chcemy czy kwestionariusz NEO-
FFI z wymiarów. Na to pytanie
124 konfirmacyjna analiza czynnikowa, której jest nie tylko sprawdzenie,
5. Jakich informacji o dostarcza testowanie?

za wyników wspomnianego odpowiada czynników, ale


jakie pytania poszczególne czynniki. Tak
przy tworzeniu tego kwestionariusza pewne pytanie jest
ekstrawersji i wchodzi do skali ekstrawersji, a w analizie czynnikowej
wchodzi ono do czynnika neurotyzmu, a nie ekstrawersji, to,
pytanie jest nietrafuym ekstrawersji i dobrane. Najlepszym
w opisanej sytuacji eliminacja tego pytania.
W przypadku eksploracyjnej analizy czynnikowej badacz nie za-
liczby i struktury czynników mierzonych przez dany test. Celem tego typu
analizy jest poznanie tych czynników. Analiza ta ma zastosowanie w sytuacji,
gdy bardzo wiadomo na temat badanego zjawiska psychicznego i celemjest
identyfikacja jego podstawowych wymiarów. Zastosowanie eksploracyjnej ana-
lizy czynnikowej w badaniu testu przedstawione zostanie przy wyko-
rzystaniu danych przytaczanej fikcyjnej Skali Postaw
Wobec Ruchu Drogowego (BRD).

Tabela 5.7. Struktura czynnikowa pozycji Skali Postawy Wobec BRD fikcyjny)

Stwierdzenie Czynnik I Czynnik II Czynnik III


1. opis samochodu w prasie motory- 0,79 -0,15 0,22
zacyjnej, szukam wyników testów zderze-
niowych
2. samochodem, w radio infor- 0,70 0,22
macji ryzykownych
miejsc
3. kierowców na 0,90 0,14
drodze budzi we mnie gniew
4. bezpiecznie, kiedy zgodnie 0,41
z przepisami
5. Zawsze w pasach 0,17 0,17 0,66
6. W nieznanej okolicy zawsze do 0,24 0,56
znaków drogowych
W tabeli czynnikowe mniejsze 0,1 jako istotne.

Hipotetyczne wyniki analizy czynnikowej Skali Postaw Wobec


Ruchu Drogowego zaprezentowano w tabeli 5.7. Wyniki analizy
struktura tej skali z trzech czynników. W tabeli 5.7. zawarte tzw.
czynnikowe, czyli korelacje poszczególnymi stwierdzeniami
a utworzonymi w drodze analizy czynnikami. tym
dla czynnika te z nich, które I tak w przy-
padku czynnika I, czynnikowych dwa pierw-
sze stwierdzenia. Na tej podstawie one bardzo 125
Adam Tarnowski, Krzysztof Fronczyk

O Jej identyfika-
cja zwykle na podstawie o
ich w omawianym do wniosku,
w mierze one poszukiwania informacji z
stwem ruchu drogowego, czyli poznawczy komponent postawy wobec bezpie-
na drodze. W podobny sposób czyn-
niki. Wydaje czynnik II mierzy komponent emocjonalny, a czynnik III
- behawioralny. W ten sposób dokonano analizy przez
wymiarów mierzonych przez
Taki rezultat jest z teoretycznego punktu widzenia.
bowiem pozycje testowe jednego z komponentów
postawy silniej ze skorelowane ze stwierdzeniami in-
nych komponentów. Z tego powodu z komponentów postawy
czynnik.
Pewna odmiana tego eksploracyjnego polega (szerzej pisze o tym
Magnusson, 1991) na zbadaniu grupy ludzi wieloma testami
zmienne (w tym testem, którego sprawdzamy). sprawdza
z którymi zmiennymi nasz test "tworzy czynnik", czyli do jakiej grupy
psychologicznych do Skali
Postawy Wobec Ruchu Drogowego, wyniki wspól-
nej analizy czynnikowej omawianej skali wymiarów kwestionariusza FCZ-KT
i skali na drodze.

Tabela 5.8. Struktura czynnikowa skal FCZ-KT oraz Skal Postawy Wobec BRD i Skali
Nieuwagi na drodze (zmodyfikowane dane z

Wymiar
1 2 3
(FCZ-KT) 0,87 -0,18
(FCZ-KT) 0,84 0,19 0,15
(FCZ-KT) -0,72 0,45
Skala BRD (FCZ-KT) -0,88
Nieuwaga (FCZ-KT) 0,14 0,62 -0,31
(FCZ-KT) -0,49 0,62 0,11
sensoryczna (FCZ-KT) -0,17 0,81
(FCZ-KT) -0,40 0,71
W tabeli czynnikowe mniejsze 0,1, jako istotne.

BRD uznamy za jej umiejscowienie w strukturze pozosta-


zmiennych daje w wiedzy o
126 kach temperamentu z zachowaniem.
5. Jakich informacji o dostarcza testowanie?

Podobnie jak w poprzednim czynniki nie znane,


a identyfikacji czynnika dokonuje na podstawie skal, które go utwo-
Pierwszym jednak krokiem jest interpretacja uzyskanych czynników, dla
których uzyskane czynnikowe zawarto w tabeli 5.8.
Przeanalizujmy uzyskane czynniki. Czynnik pierwszy l)
zany jest naj silniej z i oraz z
Wszystkie te z emo-
cji czy typem nerwowego i w ten
sposób uzyskany czynnik.
Drugi z czynników z wobec
ruchu drogowego, i Czynnik ten, obejmuje
dwie zmienne zachowanie na drodze (Skala BRD i Skala Nieuwagi)
oraz z poszukiwaniem stymulacji. Czynnik
ten zatem jako na drodze.
Trzeci czynnik, czysto temperamentalny, jest z wysokimi wynika-
mi skali Sensorycznej i Wysokie wyniki w tym czynniku
zatem ludzie nawet na energicz-
ni. mu "energii
fakty Skali BRD. Po pierwsze, jest ona rela-
tywnie od zmielll1ych temperamentalnych. wchodzi ona
w jednego czynnika. Ponadto w czynniku tym ma wysoki
inna zmienna zachowania na drodze jest nieuwaga i tylko
jedna zmienna temperamentalna. Po drugie, istnienie takiego jednego czynnika
wskazuje na silny BRD i Nieuwagi. Po trzecie
czynnikowy w czynniku 2 Skali wskazuje na znaczne po-
negatywnej postawy wobec bezpieczellstwa na drodze i podejmowania
o wysokiej stymulacyjnej, co jest teoretycznie uzasadnione, po-
zachowania tego typu zwykle z negatywnymi postawami
wobec wielu norm i przepisów.
Zastosowanie analizy czynnikowej, w celu oceny teoretycznej nazy-
wane niekiedy bywa takiego terminu nie wy-
daje szczególnie trafne, jest on wieloznaczny. wynika
dwa sposoby analizy (konfirmacyjna i eksploracyjna) znacznie
Ponadto analiza czynnikowa przeprowadzona zarówno
na wynikach poszczególnych pozycji testowych, jak i skal. Wykorzystuje
w niej, w niektórych sytuacjach, wyniki wielu testów. Ta
analizy czynnikowej nie powinna
tym samym terminem.
Kolejna metoda badania teoretycznej to ocena
wych. Dotyczy ona porównywania wyników testowych grup osób, co do których
istnieje teoretyczne przewidywanie, powinny one pod
zmiennej mierzonej przez test. test jest trafny, czyli dobrze mierzy 127
Adam Tarnowski, Krzysztof Fn;mczyk

to grupy powinny pod


wyników testowych. Badane grupy w dowolny sposób
(w inny sposób na podstawie wyników testu, np. na podstawie zmiennych
demograficznych czy innych). Jedynym ograniczeniem jest teoretyczne uzasad-
nienie wyboru grup badanych.
W celu oceny dwóch grup wyko-
test t-Studenta dla prób lub test Manna-Whitneya
testu t-Studenta nie wynik istotny statystycznie
o tym, porównywane te
w oczekiwanym z teoretycznego punktu widzenia kierunku, to jest to argument
testu. wyniki testu
oraz na podstawie której grupy oceniona na
podstawie korelacji eta.
Jednym z prostszych zastosowania tej metody wy-
niki bada6 testu inteligencji Ravena. W do tego testu
(Jaworowska, Szustrowa, 2000) o jego
wyników w od wieku badanych. prze-
wyniki w tym dzieci z grup W
wieku nie obserwuje takiego wzrostu. Wynik ten jest zgodny
z inteligencji, na podstawie której test Ravena. Teoria ta
bowiem, rozwój inteligencji przebiega od urodzenia do wczesnej
test jest trafny, podobny wzrost powinny wyniki testowe,
co stwierdzone w badaniach. teo-
retycznych zmian rozwojowych i wyników z zastosowaniem
testu Ravena jest jednym z przejawów jego
Jako inny wykorzystania oceny po-
wynik nad baterii testów APIS. Na podstawie teorii zdol-
(Matczak, 1994) badani poziomem po-
szczególnych w od obranego kierunku studiów lub rodzaju
Hipoteza ta wynika ludzie taki rodzaj edukacji, który
odpowiada ich a w danym kierunku
czynia do rozwoju specyficznych dla tego kierunku
W jednym z baterii APIS studenci typu
uczelni. w tym wypadku na sprawdzeniu,
czy te grupy studentów w oczekiwany sposób, tzn. czy
studenci poszczególnych rodzajów kierunków wyniki w testach
te intelektualne, które szczególnie potrzebne w studio-
waniu danego kierunku studiów (np. studenci studiów humanistycznych powinni
wyniki w testach werbalne). Wyniki prze-
prowadzonych zamieszczone w do baterii APIS (Matczak,
Jaworowska, Ciechanowicz i Sta11czak, 2006) hipoteza ta
128 potwierdzona, co przemawia za tej baterii.
5. Jakich informacji o dostarcza testowanie?

W omówionych grupy ze na pew-


i porównywano je pod wyników testu, którego traf-
teoretyczna jest analizowana. Procedura nieco odmienna.
Porównywane grupy ze na wyniki w
a analizowane pod innej zmiennej. jest
tzw. grup skrajnych, to jest grup o niskich oraz wysokich wyni-
kach w
Kolejna metoda oceny teoretycznej to metoda zmian nieprzypad-
kowych. Polega ona na dwukrotnym badaniu pewnej grupy osób danym testem.
pierwszym a drugim badaniem wprowadza
która zgodnie z powinna na
przez test. test ten jest badanej zmiennej
i oczekiwano zmiany jej nasilenia pod wprowadzonej
manipulacji, to powinny wyniki testu.
Bardzo cickawym badania teoretycznej przy wykorzysta-
niu zmian pod eksperymentalnego jest analiza trafno-
Skali kwestionariusza STAI Sosnowski, Matusik,
2002). Jeden ze sposobów tego na porów-
naniu wyników Skali uzyskanych przez osób badanych
w trzech sytuacjach. Pierwsza sytuacja neutralna, czyli niewywo-
Drugi pomiar dokonany w sytuacji oczekiwania na do
komory niskich Oczekiwano, sytuacja ta jako (np.
utraty powinna podniesienie poziomu
co powinno swoje odzwierciedlenie w wynikach kwestionariusza, o ile
jest on stanu Trzeci pomiar dokonany po
z komory niskich Przypuszczano, wynik w nim uzyskany
powinien nieco przed do komory, jednak
szy w sytuacji neutralnej ze na jeszcze
Przypuszczenia te potwierdzone przez uzyskane wyniki.
wykorzystano w badaniach nad
STAIjest sytuacja egzaminowania. Podobnie jak fizyczne
z pobytem w komorze niskich powinna ona
cy w kwestionariuszu STAI. sprawdzono,
uczniów w trakcie lekcji oraz drugi raz w momencie przed pisaniem
klasówki. Oczekiwanie na sprawdzian znaczne podniesienie wyni-
ków Skali co zgodne z Tak sytuacje
nia co znajduje swój wyraz w wynikach kwestionariusza.
W opisanych eksperymentalne na odpo-
wiednim doborze sytuacji tak, aby one zmiany w prze-
osób badanych. Inny rodzaj manipulacji eksperymentalnej
na wprowadzeniu celowego w czasie pierwszym
a drugim pomiarem testem. W celu zaprezentowania tego typu ponow- 129
Adam Tarnowski, Krzysztof Fronczyk

niewykorzystana zostanie hipotetyczna Skala Postaw Wobec


Ruchu Drogowego. Badanie jej
Sprawcy wypadków, zbadani w szkoleniu
na drodze. po takim szkoleniu posta-
wa wobec ruchu drogowego ulegnie poprawie. skala
jest istotnie takiej postawy, to w opisanej sytuacjijej wyniki powin-
ny po odbytym szkoleniu.
Warto wyniki dwukrotnie badanej grupy osób porów-
test t-Studenta dla prób lub, jego nie
- test Wilcoxona lub test znaków. Nieistotny statystycznie wynik testu
o braku porównywanymi Oznacza to, wpro-
wadzone eksperymentalne nie w oczekiwany sposób na
wyniki testu.
Ostatni ze sposobów oceny teoretycznej nosi analizy procesu
testu. Jak sama nazwa wskazuje, polega on na badaniu sposobu,
w jaki badani dany test. Metoda ta dotyczy zwykle procesów psy-
chicznych w danego testu. O procesach tych
wnioskuje na podstawie wykonywanych
rodzaju czy
pomijanych elementów lub pozycji testowych itp. Infonnacje tego typu
obserwacji badanych podczas lub
odpowiadania na pytania. Pomocne bywa notowanie subiektywnych ocen
osób badanych oraz ich introspekcyjnych relacji na temat sposobu dochodzenia
do odpowiedzi. badani na pytali., opo-
jakie mieli skojarzenia z pozycji tcstowych.
stwierdzenie w jednej ze skal "mam tylu przy-
na ilu W intencji autora osoby depresyjne, osamot-
nione W wielu z nich odpowiada
"nie mam bo na nich nie
ten ilustruje, analiza wybranych odpowiedzi pewne
na to, jak poszczególne pozycje testowe rozumiane przez badanych.
W badaniach nad niektórych testów procesy poznaw-
cze i niekiedy tzw. komponento-
Stemberga. jej omówienie wykracza poza ramy niniejszej
infonnacje w pracach Matczak (1994)
i (2003). W skrócie teoria ta procesy intelektualne
z pewnych komponentów pod funkcji,
tych komponentów w procesie intelek-
tualnychjest dekompozycji tych zadall., na takim ich
modyfikowaniu, by potrzebnych przy ich wykonywaniu kom-
ponentów. jak zmiany te na przez
130 i odpowiedzi), funkcjonowanie
5. Jakich informacji o dostarcza testowanie?

poszczególnych komponentów. Sternberg czas wykonania


zadania jest czasów trwania procesów z komponentów. Pomiaru
przebiegu procesu danego komponentu tak modyfiku-
zadanie, by proces ten wyeliminowany lub dodany do zadania prost-
szego. Rozpatrzmy Pierwotne zadanie z czyn-
bardzo elementarnej, np. naciskanie klawisza w odpowiedzi na
Kolejne zadanie zawiera jeden dodany element, np. wybór reakcji w
od zadania na
o dodatkowe elementy, np. zestawu na które reago-
itd. uzyskane czasy reakcji zgodne z przewidywaniami oraz danymi
z eksperymentów laboratoryjnych - test jest trafnym.
Procedury dekompozycji nie powszechnie stosowane i wymaga-
dalszego doskonalenia. Wydaje jednak, to kieru-
nek zmiennych mierzonych przez testy.

5.2.2.3. kryterialna
kryterialna (zwana niekiedy to wyników te-
stowych z kryterium Pewnego wymaga "ze-
kryterium". Przez to rozumie test, którego traf-
chce badanej zmiennej.
chodzi o która jest od testu, którego
szacuje. kryterialnej odnosi do sytuacji, w któ-
rej badaczowi na opracowaniu stosunkowo prostego pozwa-
o realnego empirycznego zjawiska, którego
stwierdzenie jest stosunkowo trudne. testy psychologicz-
ne o uszkodzeniach mózgu, zaburzenia
w funkcjonowaniu psychicznym, zanim jeszcze wykryte w badaniu
neurologicznym. Podobnie, niekiedy proste testy psychologiczne szyb-
np. depresji lub od alkoholu. Bez takich metod
stwierdzenie wymienionych obserwacji
i badania.
Ogólnie rzecz kryterium jest to zachowanie czy o której
chcemy z wyniku ocenianego testu. Tak
testu przeznaczonego do diagnozowania depresji, musimy
pewne kryterium, które depresji.
np. diagnoza psychologiczna lub psychiatryczna. Korelacja w tym
miejscu o korelacji, mamy na zjawisk, a nie
czynnik korelacji) tym kryterium a wynikiem testu jest
osoby, które zdiagnozowane przez jako
chore na w wyniki na a osoby,
które zdiagnozowane jako zdrowe, w wyniki 131
Adam Tarnowski, Krzysztof Fronczyk

na brak to test jest trafny ze na kryterium, jakim jest diagno-


za psychiatryczna depresji. nie ma
kryterium a wynikami testu. tak w sytuacji, gdy np.
osób, które zdiagnozowane przez jako chore na depre-
uzyskuje w wyniki na a druga - wyniki
na brak zaburzell. to o braku testu.
Wyniki testowe wykorzystywane czasem w celu przewidywania
stanu osoby badanej, np. powodzenia zawodowego w danym miej-
scu pracy czy skutków terapii. aby takie przewidywanie
nie wystarczy konstruktora testu, stworzone
przez niego nadaje do tego celu. Konieczne jest posiadanie odpo-
wiednich danych wyniki testu z
danym stanem w to dane kryterialnej
z w obecnie omawianym przypadku interesuje nas kryterium istnie-
w Tak aby w tym przypadku musimy
badanie, w którym pewna liczba osób (np. kandydatów do pracy)
wykona dany test, a po czasu dokonany zostanie pomiar
kryterium (np. pracy zawodowej ocenianej przez
wyniki testu z tym kryterium zmierzonym po danego
czasu, na podstawie wyników testu jest przewidywanie
stanu osoby badanej.
, Opisane dwie sytuacje dwóch rodzajów kryterialnej, jakimi
diagnostyczna i prognostyczna. W pierwszym z opisanych
kiedy na podstawie wyników danego testu o ak-
tualnie kryterium, mówimy o diagnostycznej. Natomiast
prognostyczna interesuje nas wtedy, gdy zadaniem testu jest przewidy-
wanie kryterium w
Bardzo istotnym zagadnieniem jest wybór kryterium. Kryterium
to musi wybrane tak, aby konkretnemu zapotrzebowaniu sto-
sowania danego testu. np. chcemy dane do prognozo-
wania pracy w zawodzie to musimy wyniki
naszego testu pozytywnie z powodzeniem w tym zawodzie. Pojawia
problem dobrego zdefiniowania, czym jest kryterium, jakim w naszym
jest "powodzenie w zawodzie np. o szyb-
gaszenia albo o wykonywania pewnych
zanych z gaszeniem (np. rozwijania z zakresu
mogliby prawdopodobnie jeszcze inne bardziej
kryteria powodzenia w zawodzie Kryterium to kombi-
z zakresu gaszenia zdecydujemy
na kryterium, przeprowadzimy odpowiednie badanie, które do-
prowadzi nas do wniosku, wyniki testu z kryterium,
132 to udowodnimy testu. Istotne jest jednak, w ten spo-
5. Jakich informacji o dostarcza testowanie?

sób sprawdzona dotyczy tylko przewidywania tego jednego


kryterium. za kryterium rozwijania
i wyniki testu z nim to na podstawie tych samych wyników
nic nie np. o w
czym. nie nic na temat do pracy
w innych zawodach np. w policji.
Ogólnie wybór kryterium od planowanego zastosowania danego testu
i wniosków, jakie na jakiego podstawie Jako kryterium
nie tylko wymieniona diagnoza psychiatryczna lub
psychologiczna, czy powodzenie zawodowe. Psychologa
diagnozowanie przewidywanie bardzo wielu lub stanów
wieka. Dlatego jako kryterium wykorzystane bardzo wiele zmiennych.
takich kryteriów np. lub uzyskiwa-
ne stopnie szkolne (kryterium powodzenia w nauce szkolnej lub akademickiej).
wybór takiego kryterium ma sens tylko wtedy, celem stosowania
danego testu jest przewidywanie lub ocenianie szkolnych. W szczegól-
sobic w której psycholog zainteresowany jest np.
przewidywaniem z danego przedmiotu, np. z psychometrii. W tym celu
odpowiedni test, a przez sko-
relowanie jego wyników z ocenami z egzaminu z psychometrii. lepiej
ten test na semestru, a dopiero po przeprowadze-
niu egzaminu jego ze stopniami. W ten sposób spraw-
testu. wyniki testu ze
stopniami egzaminacyjnymi, stosowanie tego testu na
semestru do przewidywania studentów pod psychometrii.
W niektórych przypadkach jest kompetent-
nych, którzy (np. na podstawie obserwacji badanych w konkretnych
sytuacjach) badacza kryterium. W ten sposób np. jest
poziomu przystosowania uczestników terapii grupowej.
Hipotetyczna procedura w ten sposób, przeszkoleni
dziowie kompetentni (którymi w tym przypadku mogli terapeuci)
filmy z nagranymi sesjami terapeutycznymi. Na podstawie zaobserwowanych
pacjentów dokonywaliby oni oszacowania poziomu przystosowania
W ten sposób uzyskuje za kryte-
rium konieczne jest jeszcze przebadanie pacjentów testem,
do diagnozy poziomu przystosowania i skorelowanie jego
wyników z ocenami
Wybór jednego kryterium nie musi dany test nadaje tylko do
diagnozowania lub przewidywania kryterium. test spraw-
dzony w stosunku do wielu kryteriów. to zarówno kryteria
tej samej zmiennej (np. kryteria depresji), jak i kryteria
ce zmiennych (np. powodzenie w zawodzie oraz powodzenie 133
Adam Tarnowski, Krzysztof Fronczyk

w zawodzie policjanta). Skorelowanie wyników testu z jednym kryterium nie


oznacza, one skorelowane z innym kryterium. W szczególno-
wysoka diagnostyczna nie gwarantuje jego prognostycznej
i odwrotnie. Sprawdzenie pomiaru testem pod innego kryte-
rium jest z rozszerzeniem jego zastosowania.
W przypadku kryterialnej podobnie jak w przypad-
ku teoretycznej, o i Jest to szczegól-
nie w sytuacji, gdy badacz chce jego dobrze
diagnozuje kryterium i tylko to kryterium. Sytuacja taka wy-
np. w przypadku kwestionariusza przeznaczonego do diagnozy depresji.
Jak wiemy, kryterium dla tego typu diagnoza depresji
przez psychologa lub czyli powinna ona
z wynikami kwestionariusza. twórca kwestionariusza
jego specyficzne dla depresji tzn., nie
osoby na inne zaburzenia psychiczne wysokie wyniki
w kwestionariuszu. to w odpowiednio zaplanowanym badaniu
empirycznym. wyniki inwentarza nie
z schizofrenii czy innych zaburzell. W omówionym przypadku spraw-
dzanie korelacji z depresji dotyczy aspektu kryte-
rialnej, a sprawdzanie korelacji z innych chorób - aspektu
kryterialnej.
Dobrym sposobem szacowania kryterialnej jest ocena, na ile
wyniki testu podejmowanie decyzji diagnostycznych w psycholo-
gii klinicznej. Procedura powinna Pacjenci
byliby badani przez psychologa pewnego typu
Dodatkowo podlegaliby oni badaniu przez psychologa,
innych technik w tym skali X, której chcemy
diagnoza przez dwie grupy
ekspertów. Pierwsza grupa do dyspozycji zebrane przez nie-
psychologa, w tym X. Druga grupa
zebranym z skali X. wyniki grupy pierwszej by-
istotnie, z test X
posiada W tym przypadku
o tzw. z zastosowaniem skali X.
Przytoczone zmiennych kryterialnych na celu przy-
idei kryterialnej. ten rodzaj do-
tyczy skorelowania testu z kryterium. Orzeka ona o tym, jak
kryterium jest test. Przedmiotem pomiaru jest tylko zmienna
kryterialna, a nie np. cechy psychiczne odpowiedzialne za skore-
lowanie kryterium i wyników testu. by bowiem skoro
wyniki pewnego testu przewidywanie powodzenia w studiach
134 nierskich, to prawdopodobnie ten test mierzy
5. Jakich informacji o dostarcza testowanie?

z tym kierunkiem studiów np. albo matematyczne


lub logiczno-abstrakcyjne. Takie przypuszczenie jest uzasadnione,
pojedyncza korelacja wyniku testu i powodzenia w studiach
jednoznacznie nie o tym, z wymienionych mierzy ten
test. W tej sytuacji nie ulega jednak jest on powo-
dzenia w studiach (Magnusson, 1991).
oceny kryterialnej, zmienne stano-
kryteria nigdy nie rzetelne i trafne. np. jako kryterium
przyjmie stopnie szkolne to jasne jest, takie kryterium bywa nierzetelne
i nietrafne. bowiem nauczyciele, którzy uczniów pod
czynniki, które nie nic wspólnego z przedmiotem oceny
(np. stopnie wystawiane na podstawie opinii, sobie na
nauki, w klasach lepiej oceniani uczniowie grzeczni,
a nie ci, którzy lepiej opanowali zagadnienia z danego przedmiotu
itd.). jest, na potrzeby szacowania pomiarów testowych
kryteria o jak i Jest to warunek
poprawnego szacowania
który w badaniach nad kry te-
kontaminacja kryterium (Magnusson, 1991).
sobie w której psycholog w klinice bada swoich pacjentów
za skali nastroju X. na podstawie danych, w tym
opinii psychologa na podstawie wyniku X, ustala rozpoznanie.
Zgromadziwszy odpowiednio danych, psycholog postanawia traf-
skali X i w tym celu porównuje pacjentów z rozpoznaniem
depresji z pacjentów. Jak badanie takie jest
badacz metodologicznego Na pod-
stawie (m.in.) skali X rozpoznanie, które kryte-
rium dla oceny X.
W opisanej sytuacji powinno na gromadze-
niu wyników skali X, od postawienia rozpoznania. Samo rozpoznanie
natomiast powinno w na podstawie innych
takich jak wywiad, obserwacja czy inne testy test, którego chcemy
wyniki skali X z ustalonym roz-
poznaniem depresji.
Ocena prognostycznej testu wymaga z tj.
okres czasu. wynik skali X progno-
terapii emocjonalnych, wszystkich
pacjentów po terapii, wyod-
zostaje grupa pacjentów, u których zaobserwowano
stwierdzimy, wyniki skali X tej grupy przed inne w gru-
pie pacjentów, u których nie poprawa - test
za trafny prognostycznie. 135
Adam Tarnowski, Krzysztof Fronczyk

W przypadku prognostycznej jest nie tylko wybór kryterium,


lecz czasu od momentu pomiaru dokonanego za po-
testu do chwili pomiaru kryterium. Zwykle czas ten podyktowany jest prze-
znaczeniem testu i wybranym kryterium. test ma wyniki tera-
pii, jest, aby badanie testem wykonane przed
terapii, a ocena kryterium po jej Tak czas
tymi dwoma pomiarami, to czas trwania leczenia. W przypadku innych zastoso-
czas ten od celu stosowania testu. chcemy
na podstawie wyników testu powodzenie zawodowe po roku od
momentu do pracy, to pomiar kryterium musi po
roku od przeprowadzenia badania testem i pracy.
jeszcze raz postaw wobec ru-
chu drogowego w kryterialnej. poszukujemy
przewidywanie, czy badana osoba
jako kierowca , skala
2 O ile jednak do
oceny teoretycznej zwykle uzyskanie odpowiedniej istotnej
grupami, to staramy i zwe-
progu wyników, który optymalne podejmowanie
decyzji diagnostycznych. Przez progu rozumie testu, po-
której badany kryterium. Wynik testu jest zwykle
a kryterium - bardzo (np. "chory na de-
- "zdrowy"). Ustalanie takiego progu jest procedu-
próg ustalimy zbyt nisko, wiele osób przepisy zostanie
uznanych za dobrych kierowców wysokie wyniki testu
o poprawnej postawie wobec na drodze). W tej sytuacji uniknie-
my decyzji niedopuszczenia do prowadzenia samochodów osób
przeciwnie, próg zostanie postawiony zbyt
wysoko, to zidentyfikujemy trafnie osób
jednak podejmiemy decyzje wobec wielu dobrych kierowców.

5.2.2.4. Inne aspekty


rodzaj to fasadowa. Test jest trafny fa-
sadowo, robi na badanym zgodne z oczekiwaniami badacza. Jest
to test powinien profesjonalnego co
u badanego do Poza tym, testu
wydaje nieodpowiednia lub dziecinna, to brakiem
ze strony osoby badanej.
2 polskich przepisów badania psychologiczne sprawcy
wypadków drogowych, osoby 24 pkt karne, zatrzymane z powodu prowadzenia pojazdu
po alkoholu, skierowane przez lekarza oraz kierowcy zawodowi. Celem psychologic7:-
136 nych jest ustalenie, czy badany jako kierowca.
5. Jakich informacji o dostarcza testowanie?

fasadowa tylko z nazwy jest Nie jest to traf-


w sensie definicyjnym, nie dotyczy tego, co test mierzy
(Anastasi i Urbina, 1999). Dotyczy ona bowiem raczej tego, co test "wydaje
w oczach badanych i na osób badanych. Jest to
istotny aspekt badania testowego, test funkcjonuje w pewnej
Psycholog bada klientów na ich lub na zlecenie instytucji
(np. pracodawcy) i nie powinien testów np. czy sprze-
ciw klientów lub do z psychologiem.
pilotów linii lotniczych, m.in. ich umie-
oceny czasu, i wykonywania kilku
(reguluje to metodyka JAR-FCL 3).
Dobrym te zmienne jest austriacki test SIMCAP. Problem
polega jednak na tym, wykonywanych przez badanego w silnym
stopniu do pracy biurowej (korekta, dat i telefo-
nów, wykonywanie itd.). Test jest trudny, wymaga chwilami eks-
tremalnej koncentracji. Piloci badani tym testem silnym oporem i zde-
cydowanie nie formy oraz informacji zwrotnych. W opisywanym
przypadku badania pracodawca, negatywnych
reakcji pilotów, o tego testu innymi technikami, mimo prze-
konania o wniosków. psycholog ma prawo do swo-
body wyboru diagnostycznych i w takiej sytuacji przy
swoim zdaniu, korzystniej ze na szerszy kontekst badania jest
test na inny, podobne

5.2.3. Wzajemne relacje poszczególnymi rodzajami


pomiaru testem, jak przedstawiono, ma wiele aspektów, a
pomiar wykonany przy testu za wielu traf-
Nie one wzajemnie ale nie w jednoznaczny spo-
sób rodzaje konieczne w
od zakresu stosowania testu i zasad jego konstrukcji.
teoretycznej jest za warunek konieczny dla
testu 2002). Jednak ocena kryterialnej jest zda-
niem Nowakowskiej (1975) w procesie oceny pomiaru te-
stowego. autorów (Magnusson, 1991, Homowska, 2001;
Anastasi i Urbina, 1999) dopuszcza inne metody badania trudno
nie ze stwierdzeniem, wyniki testu powinny
z danymi, czyli Testy oceniane
poprzez badanie ich struktury (tj. wzajemnego skorelo-
wania skal lub struktury czynnikowej) zawsze na zarzut rozmijania
z 13 7
Adam Tarnowski, Krzysztof Fronczyk

Badanie z kryterium ma znaczenie nie tylko tam,


gdzie konieczne jest kryterialnej. to
ny argument w dowodzeniu teoretycznej testu. test prze-
znaczony jest do badania uwagi wzrokowej. grupa
pacjentów z uszkodzeniem pewnych okolic kory mózgowej (o których wiadomo
z innych za uwagi wzrokowej)
wyniki w tym w porównaniu do osób zdrowych, to o tym,
test jest trafny diagnostycznie w. ocenie uszkodzenia mózgu. Jednak wynik
taki potwierdza jego Skoro bowiem uszkodzenie
struktur odpowiedzialnych za na wyników
testu, uzasadnia to twierdzenie test mierzy istotnie
kryterialna w stopniu z teore-
test psychologiczny pozwala na przewidywanie pewnych
nych (kryterium), to bardzo prawdopodobne, istnieje psychologicz-
na która ten Analiza teoretycznej jest
aby i mechanizm tej Tak np.
wyniki pewnego testu z ocenami szkolnymi, daje to do stwier-
dzenia, test ten ma chodzi o
oceny szkolnych uczniów. jednak dlaczego
wyniki tego testu z ocenami szkolnymi. w zastosowanym
nie ma czy które programu
Jak to test ten jest dobrym pod oceny
uczniów? Prawdopodobnie test ten diagnozuje dla szkol-
nych uczniów. przyczyny sukcesów edukacyjnych,
jednym z ich wysoka inteligencja. Z teo-
retycznego punktu widzenia stopnie szkolne powinny kore-
z inteligencji. Skoro nasz test koreluje ze stopniami szkolnymi,
to bardzo prawdopodobne, jest on inteligencji. Podobne rozumowanie
u podstaw sprawdzania takich testów inteligencji, jak np. Skala
Columbia (Ciechanowicz, 1992) czy test inteligencji
Ravena (Jaworowska, Szustrowa, 2000). przedstawione rozumowa-
nie jest pewnym uproszczeniem. Istnieje wiele
sukcesów szkolnych, a inteligencja jest tylko jednym z nich. Innym uwarunko-
waniemjest np. motywacja. Gdyby nic nie wiadomo o Ravena
lub skali Columbia, to miary np. motywacji do
nauki. Jednak ilme badania, a analiza w z przedstawiony-
mi danymi wymienione testy miarami inteligencji.
Nie zawsze musi teoria kryterium
i wyników testu. Zdarza takie jest po prostu empi-
rycznie swojego teoretycznego uza-
sadnienia. Szczególnym przypadkiem
138 danych testowych i kryteriów w sytuacji, gdy nie istnieje teoria
5. Jakich informacji o dostarcza testowanie?

jednego z drugim jest kwestionariusz MMPI. W inwenta-


rzu tym nawet pozycji nie ma znaczenia, jest jedynie korelacja
wyników testowych i kryteriów, jakimi diagnozy zabu-
rze11 psychicznych.
Na wynik testu ma szereg zmiennych psychologicznych.
Wyniki kwestionariusza nasilenie w pewnym stopniu
od szeregu innych czynników, takich jak np. intelektualna (warun-
zasób do zrozumienia i potrzeba
aprobaty na unikanie pewnych odpowiedzi w
czy poziom mechanizmów obronnych (które adekwatny sa-
moopis). Niektórzy autorzy (Magnusson, 1991) nawet radykalnie,
test cechy, ale w stopniu.
analiza teoretycznej powinna zarówno oce-
zasadniczej badanej zmiennej na wynik testu, jak i
zmiennych.
Niektórzy autorzy (Jakubowski, 1983) je-
test jest trafny oraz spójny (co oceniamy ba-
istotnie mierzy on to, co stanowi
a zatem jest trafny teoretycznie. Zasada ta pozwala na potwierdzenie
pomiaru testem po badaniu, bez stosowania kryteriów
nych i powinna stosowana z

5.2.4. pomiaru testowego a od standardowej


procedury badania
Testy ze sposobów badania psychologicznego. Nigdy nie
jedynym ani nawet wiedzy o badanym. Konieczne jest
ich wywiadem, zbieraniem danych
i dokumentów. z testów, ich
badana dla pewnej konkretnej standaryzacji i obiektywizacji, oraz
obejmuje tylko pewien zakres wniosków, poza który nie
Powstaje pytanie o wnioskowania z testów zastosowanych niezgod-
nie ze standardem. Przed takim problemem psycholog, który zain-
teresowany u badanego jedynie podtest Powtarzanie
Cyfr z testu WAIS instrukcja nakazuje zawsze test w
wynik jest dramatycznie niski i z wskazuje na zaburzenia
Czy psychologowi wolno
Wydaje istnieje taka Jednak takiego wyniku, psy-
cholog nie na test WAIS ijego
badania, nie z zaufaniem do
norm testowych. Jego argumentacja w diagnozy musi
fakt nietypowego z kontekstu zadania i jest dokonywana na 139
Adam Tarnowski, Krzysztof Fronczyk

psychologa. stosujemy test zgodnie


z za wnioski przenosi na autora te-
stu.
Dlatego, do maksymalizacji metod testowych, nie wolno za-
o tym, nawet najdoskonalszy test nie skutecznym
w psychologa zasady diagnostyki.
danym z pomiaru testem, nie cudownych, bli-
korelacji testem a kryterium Test ma wspo-
a nie psychologa.

5.2.5. Szacowanie
Przy szacowaniu pomiarów testowych wykorzystuje znane me-
tody statystyczne w innych celach. Zwykle nie ma potrzeby sto-
sowania specjalnych procedur, tak jak w przypadku szacowania po-
miaru za testów, do której wykorzystuje np. wzory alfa Cronbacha
czy Spearmana-Browna. metod stosowanych do szacowania
pomiarów przeprowadzanych przy testów jest powszechnie znana lub zo-
opisana przy okazji omawiana szacowania (por. 5.1.).
W rozdziale niniejszym zaprezentowano tylko wybrane, stosO'\va-
ne, metody statystyczne zastosowanie przy szacowaniu po-
miarów testowych. W praktyce badawczej Czytelnik z
mi metodami, których tu nie z powodu ograniczonego charakteru
Przy z metod podano o tym, jaki rodzaj
oszacowany przy danej metody.

5.2.5.1.
W cclu oszacowania stosuje kom-
petentnych. W celu
W-Kendalla. ten stosowany jest jako jedna z metod szaco-
wania (rozdz. 5.1.7.4.).
Zastosowanie metody kompetentnych oraz obliczanie
zaprezentowane zostanie przy wykorzystaniu danych z przy-
omówionego w rozdziale 5.2.2.1.
W celu obliczenia W-Kendalla konieczne jest, w pierwszej kolejno-
nadanie rang ocenom przypisanym przez kompetentnych. W tym
celu pozycje testowe ocen przyznanych przed danego
dziego w od najmniejszej do i im kolejne ran-
gi. Rangami tymi kolejne liczby od liczby jeden. Jako
rozpatrzmy rangowanie ocen przyznanych przez pewnego
140 on pozycjom testowym oceny: 4, 3, 1, 5. Po
5. Jakich informacji o dostarcza testowanie?

w otrzymujemy: 1,3,4, 5. Teraz


poszczególnym ocenom odpowiednio kolejne rangi, tj.:

Oceny przyznane przez 3 4 5


Rangi 2 3 4

Sposób rangowania nieco bardziej komplikuje, jednej pozy-


cji testowej przyznano tak jak w przypadku I w tabeli 5.5.
Jak z tej tabeli, ten czterem pozycjom testowym
5. W tej sytuacji sposób jest Podobnie jak po-
przednio, oceny od najmniejszej do i
im kolejne liczby Otrzymujemy

Oceny przyznane przez I z tabeli 5.5. 3 4 5 5 5 5


Liczby 2 3 4 5 6

Nie to jednak jeszcze rangi, sposób ich obliczania w tym przypadku


wymaga jeszcze liczby przypi-
sane tym samym ocenom przyznanym przez W opisywanym przypad-
ku do siebie liczby 3,4,5 i 6, one nadane
ocenom 5. Suma liczb przypisanych tym samym ocenom wynosi 3+4+5+6=18.
W celu obliczenia rang przez pozycji testowych,
którym W naszym przypadku jest to liczba cztery
(czterem pozycjom testowym przypisano 5). Liczba 18 podzielona na czte-
ry daje 4,5. Ostatecznie otrzymujemy:

Oceny przyznane przez I z tabeli 5.5. 3 4 5 5 5 5


Liczby 2 3 4 5 6
Rangi 2 4,5 4,5 4,5 4,5

Rangi przypisane pozycjom testov.'Ym, które jednakowe oceny na-


zywane rangami W opisany sposób
oceny nich rangi Po
przypisaniu rang ocenom dokonanym przez wszystkim otrzymujemy
zamieszczone w tabeli 5.9

141
Adam Tarnowski, Krzysztof Fronczyk

Tabel;:l 5.9. Porangowane dane z tabeli 5.5

Pozycja Suma
I II III M-Rj (M-Rj)2
testowa rang Rj
1 4,5 5 5 14,5 -4 16
2 4,5 2,5 5 12 -1,5 2,25
3 4,5 5 2,5 12 -1,5 2,25
4 4,5 5 5 14,5 -4 16
5 1 1 2,5 4,5 6 36
6 2 2,5 1 5,5 5 25
Suma 63 97,5

Po dokonaniu rangowania, do obliczania


W-Kendalla, z wzoru:

w= S
l
12 ;=1
gdzie:
k - liczba
N. - liczba ocenianych pozycji testowych;
S - suma kwadratów sumy rang i sumy rang j-tej pozycji te-
stowej;
k
L T; - poprawka na rangi
i=l

W celu skorzystania z tego wzoru, konieczne jest wykonanie szeregu


pomocniczych, które opisane.
Jak w celu obliczenia W-Kendala potrzebna S.
w sposób. dla pozycji testowej
rang, tak jak uczyniono to w tabeli 5.9. Sumy rang dla j-tej pozycji testo-
wej oznaczone symbolem Rj (kolumna "Suma rang R/'). W dalszej
wszystkie Rj' W omawianym suma ta wynosi
63. przez wszystkich pozycji testowych.
Jest to suma rang oznaczana symbolem M:
k

.LJ }
N
W naszym przypadku M=63/6=10,5.
W M-Rj, czyli dla pozy-
142 cji testowej obliczamy rang a rang tej pozycji
5. Jakich informacji o dostarcza testowanie?

testowej. Dla pierwszej pozycji testowej z tabeli 5.9. obliczenie to polega to na


od liczby 10,5 liczby 14,5. Daje to -4. ta wpisana jest
w odpowiedniej kolumnie tabeli 5.9. Podobnie z pozy-
cjami testowymi zawartymi w tabeli 5.9.
Kolejny krok polega na podniesieniu do kwadratu przed obli-
czonych Tak dla pierwszej pozycji testowej podnosimy -4
do kwadratu i otrzymujemy 16, co wpisujemy do kolejnej kolumny tabeli 5.9.
Podobnie z pozycjami testowymi.
wszystkie ostatniej kolumny tabe-
li 5.9. W ten sposób S w liczniku wzoru na
W-Kendalla. W naszym przypadku S=97,5.
W celu obliczenia W, konieczne jest jeszcze obliczenie
k

L 1'; . Jest to tzw. poprawka na rangi


;=1
Oblicza jedynie wtedy,

gdy rangi takich rang nie ma, to ta równa jest


O. 1; oddzielnie dla z z
wzoru:

gdzie
t - liczba ocen

tym wzorem, obliczmy 1; dla poszczególnych

T. = (43 - 4) = 60 =5
\ 12 12
T = (3 3 - 3) + (2 3 - 2) = 30 =2 5
2 12 12'
T = (3 3 - 3) + (2 3 - 2) = 30 = 2 5
3 12 12'
W dalszej sumujemy wszystkie 1;:
k
L. 7; = 5 + 2,5 + 2,5 = 10
;=\

Obecnie wszystkie potrzebne do wzoru.


143
Adam Tarnowski, Krzysztof Fronczyk

w= 97,5 =0765
_13 2 (6 3 -6)-3*10 '
12

Te same obliczenia programem SPSS.


W celu skorzystania z SPSS, odpowiednio zbiór danych.
Dane z tabeli 5.5. w komputera tak, aby wpisa-
ny w wierszu, a pozycja testowa - w kolumnie, a odwrotnie w tabeli
5.5. Odpowiednio przygotowany plik danych zaprezentowano na rys. 5.16. Dane
te zawarte w pliku zgodnosc_sedziow_trafnosc.sav.

Rysunek 5.16. Sposób organizacji pliku danych do obliczania

z menu "Analiza" wybieramy "Testy nieparametryczne", dalej "K


prób w okienku dialogowym wprowadzamy zmienne (wszystkie po-
zycje' testowe) i zaznaczamy "W-Kendalla" (rys. 5.13. i 5.l4.). Po wykonaniu
operacji, otrzymamy wydruk przedstawiony na rys. 5.17.

Statystytd testu
N 3
W Kendalla a ,765
Chi-kwadrat 11,471
df 5
asymptotyczna ,043
a. Kendall«

Rysunek 5.17. Okno wyników W-Kedndalla

Jak z wydruku, W-Kedndalla jest


taka sama, jak wyliczona i wynosi 0,765. to o znacznej
ocen
W-Kendalla testowana jest za statystyki chi 2,
która zaprezentowana jest na wydruku. W naszym przypadku wynosi
ona 11,471 ijest istotna statystycznie p wynosi 0,043). Oznacza to,
144
5. Jakich informacji o dostarcza testowanie?

W-Kedndalla jest zbyt by za


rezultat czysto losowego oceniania pozycji testowych przez

5.2.5.2. korelacji
lub zachodzi koniecz-
obliczenia wynikami testu, którego nas inte-
resuje i pewnej innej zmiennej albo kryterium albo teoretyczne
z wynikami testu.
W pewnym badaniu jego uczestnicy wy-
kwestionariusz EPQ-R oraz Kwestionariusz Aprobaty (KAS).
(por. 5.2.2.2.), wyniki skal P i KAS ze
W celu sprawdzenia tej hipotezy, kore-
lacji obu skal. Dane do tego w pliku korelacje.sav.
Obecnie przejdziemy do omówienia sposobu obliczania ko-
relacji za programu SPSS. W celu obliczenia nas kore-
lacji, z menu "Analiza", "Korelacje"
i wreszcie "Parami" (rys. 5.18.). Pojawi wówczas okno dialogowe ukazane
na rys. 5.19.

Rysunek 5.18. Wybór okna "Korelacja parami" z menu SPSS

145
Adam Tarnowski, Krzysztof Fronczyk

Rysunek 5.19. Okno "Korelacja parami"

dokonujemy wyboru zmiennych do analizy przez ich


nazw na po lewcj stronie okna lub zaznaczenie
zmiennych, a po okna.
Wybranie dwóch zmiennych spowoduje obliczenie
korelacji dla z par zmiennych. Po wybraniu zmiennych do analizy, nale-
jaki korelacji nas interesuje. Przy wyborze dwóch
utworzone odpowiednio dwie lub trzy macierze
czynników.
W polu "Test testu ko-
relacji. mamy jakiekolwiek hipotezy co do kierunku (znaku) korelacji
test jednostronny. Z mamy do czynienia
w przypadku obliczania posiadamy konkretne przypuszczenia co
do nas W przeciwnym wypadku, gdy przeprowadzamy
np. a naszym celem jest zbadanie, czy zmiennymi
zachodzi jakikolwiek wybieramy test dwustronny.
Po przycisku OK, komputer obliczy korelacji. Ich
w oknie wyników przedstawionym na rys. 5.20.

Korelacje
aprobata

(1<'\8) pSYChOtyzm
aprobata WAS) KOrelacja Peat'sona 1 ·,351'"
uednostronna) ,000
N 100 100
psycl101yzm Korelacja Pearsona -,351*' 1
(Jednostronna) ,000
N 100 100
... jest istotna na poziomie 0.01 (jednostronnie).

146 Rysunek 5.20. Okno wyników korelacji Pearsona


5. Jakich informacji o do.starcza testowanie?

Jak utworzona przez komputer tabelka zawiera korelacji po-


szczególnych par zmiennych oraz poziomy korelacji, jak rów-
(N), próby na jakiej obliczono Korelacje istotne
statystycznie na poziomie p<O,Ol gwiazdkami
przy korelacji.

5.2.5.3. Analiza czynnikowa


Analiza czynnikowa od strony obliczeniowej jest
przedstawionych jest kilka które w przypadków powinny po-
na uzyskanie wiarygodnych wyników, jednak przy planowaniu
nych jest zapoznanie z przedmiotu (np.
Zakrzewska, 1994).
planuje zastosowanie analizy czynnikowej w pewnym badaniu, to
próba osób w nim powinna niepi-
sanej umowy, aby przyjmujemy,
liczba osób powinna przynajmniej od liczby ba-
danych zmiennych. Próba powinna pod
analizowanych zmiennych i maksymalnie jednorodna pod pozosta-
zmiennych ubocznych.
obliczanie analizy wariancji zaprezentowane zostanie przy wy-
korzystaniu pliku danych analiza_czynnikowa.sav, zmienne wy-
korzystane w tabeli 5.8. W celu przeprowadzenia w programie SPSS,
wybieramy polecenia "Analiza", a w dalszej "Redukcja danych", na-
"Analiza czynnikowa". Spowoduje to okna przedstawione-
go na rys. 5.21. W stosunku do ustawie11 procedury warto wprowa-
kilka zmian.

Rysunek 5.21. Uruchamianie analizy czynnikowej w SPSS

Po przycisku "Rotacja" okno przedstawione na rys. 5.22.


W oknie tym z metod rotowania czynników. Jest to za- 147
Adam Tarnowski, Krzysz tof Froncz yk

bieg uzyskanego Istota rotacji polega na


obrocie tworzonego przez czynniki. Sprawia on,
dunki czynnikowe poszczególnych zmiennych bardzo lub bardzo
co upraszcza znanych zmiennych nowym czynnikom.
Metoda Varimax rotowania czynników jest
tego
typu i wybieramy w naszym

Rysunek 5.22. Wybór metody rotowania czynników w SPSS

Po powrocie do okna "Analiza czynnik owa" w "Opcjach" wybieramy


sorto-
wanie i pomijanie mniejszych 0,1 (rys.
5.23). to zabiegi wydruku.

Rysunek 5.23. Wybór opcji W analizie czynnikowej

w opisie analizy czynnikowej wymiennie stosuje


"wariancja", oraz "informacja". wyni-
ków, czyli ich jest informacji, która
poprzez procedury statystyczne. Gdyby wszyscy badani mieli identyczne
wyniki w pewnej zmiennej (np. postawie), taki zbiór danych nie
148 infonnacji o niej. Nie by co na
5. Jakich informacji o dostarcza testowanie?

i co jest jej skutkiem. Dlatego im bardziej dane, tym


infom1acji o postawie one Wariancja oznacza, z jednej strony,
ze statystyki wyników, z dru-
giej - niekiedy bywa jako synonim takich jak czy
wyników.
Wykonanie opisanej analizy spowoduje uzyskanie wyników przedstawionych
w tabeli 5.8. Na wydruku zwracamy na (rys. 5.24.) przed-
zasoby wspólnej, które powinny jak dla
ze zmiemlych w analizie. Warto
zmiennych, dla których te Dla zmiennej zasób zmien-
wspólnej, to proporcja informacji zawartej w tej zmiennej, która
z zmiennymi w analizie. ta jest niewielka
oznacza to, zmienna nie ma wiele wspólnego z innymi zmiennymi i prawdo-
podobnie w prowadzonej analizie czynnikowej raczej utrudnia uzyskanie czytel-
nego

Po

leniu
Skala BRO 1,000 .771
Nieuwaga 1.000 .505
1,000 .669
1,000 ,785
sensoryczna 1,000 ,69B
r•• 1,000 ,S05
1,000 ,725
1,000 ,636
Metod. C2IInnlków· OIownych skl3aoWyth.

wariancja

Sumy kwadratów po
tl«>we Sumy po rotacji
% % %
skumulowany % wariancJi skumulowany %w3rliill1cji SkumulOwany
l 2,192 34,902 34,902 2,792 34,902 34,902 2,426 30,325 30,325
2 1,689 21,118 56,020 1,639 21,118 56,020 1,612 20,145 50,470
3 1,093 13,660 69,680 1,093 13,860 69,6BO 1,537 19,210 69,a80
4 ,776 9,694 19,374
5 ,542 6,161 86,155
6 ,450 5.621 91,775
7 ,388 4,853 96.628
a ,270 3,312 100,000
Metoda
.
czynmk.w- OIownl'th

Rysunek 5.24. Wyniki analizy czynnikowej

W drugiej tabeli (rys. 5.24.) zwracamy na skumulowany


procent wariancji dla ostatniego czynnika (powinno jak
cej, analiza ma sens jest mniejsza od 50), ta informu-
je, jaka informacji zawartej w zmiennych jest
przez utworzone czynniki. ta jest zbyt to o tym, 149
Ad,am Tarnowski, Krzysztof Fronczyk

nie czynników wprowadzone zmienne i ana-


za '
Kolejne tabele wydruku wyników (rys. 5.25.) macierze czynni-
ków nierotowanego oraz rotowanego.

Macierz

1 2 3
",859 ,148 ,213
.849
,692 ,129 ,417
",667 ,566
BRD ,803 -,355
Nieuwaga -,258 -,661
,502 -,612
sensoryczna ,302 ,440 ,643
Metoda cl\Innlków -
a, 3 - liczba

Macierz ro1owanych

1 2 3
,875 -,182
,841 ,187 ,149
",720 ,455
Skala BRD ",876
Nieuwaga ,144 ,623 -,310
-,490 ,619 ,115
sensoryczna -,169 ,813
-,403 ,710

MetOda czYnników -
Metoda rotaCji - Varimax z Kaisera.
a. Rotacja w 5 iteracjach.

Macierz
1 2 3
1 -.881 ,025 ,472
2 ,151 -,931 ,331
3 ,448 ,363 ,817
Me10da cl\Innlków - Glownych

Metoda rolacji " Varimax z Kaisera.

150 Rysunek 5.25. Wyniki analizy czynnikowej - c.d.


5. Jakich informacji o dostarcza testowanie?

W omawianym nie interesuje nas macierz czynników nierotowa-


nych. Ostatecznie interpretujemy macierz czynnikowych po ro-
tacji. Dla czynnika wyszukujemy zmienne z nim najsilniej.
Wspólna tych zmiennych pozwala utworzony czynnik tak,
jak uczyniono to w rozdziale 5.2.2.2.

5.2.5.4. Analiza
W badaniach nad lub zachodzi niekiedy ko-
porównania wyników danego testu uzyskanych w dwóch lub
grupach ze na kryterium kryterialna)
z teoretycznego punktu widzenia teoretyczna).
Do porównywania arytmetycznymi dwóch grup
test t-Studenta dla prób W przypadku liczby grup
wariancji.
W celu omówienia zastosowania SPSS do obliczania testu t-Studenta, a
jednoczynnikowej analizy wariancji,
sobie, trzy grupy (w wieku 8, 10 i 12 lat)
pewnym testem inteligencji. test ten jest trafny, to przypusz-
wyniki wraz z wiekiem badanych. Naszym zadaniem jest
sprawdzenie tego przypuszczenia. tego
wyniki w poszczególnych grupach wieku.
Odpowiednie dane do tego zawiera plik o nazwie porówny-
wanie_grup.sav. W pliku tym zmienna "intel" zawiera wyniki testu inteligencji,
a zmienna "wiek" reprezentuje wiek osób badanych.

5.2.5.4.1. Test t-Studenta


na chcemy pod wyników testu in-
teligencji tylko dwie grupy: i dwunastolatków. Zgodnie z
inteligencji wyniki
dwunastolatkowie.
W celu przeprowadzenia w SPSS, z menu "Analiza" wybieramy po-
lecenie "Porównywanie a "Test t dla prób
(rys. 5.26.).
Spowoduje to na ekranie monitora okna przedstawionego na
rys. 5.27. W celu wyboru zmiennej wyniki testu, którego
(w naszym przypadku wynik testu inteligencji - intel), klikamy jej
a tak aby zmiem1a ta przeniesiona
do okna "Zmienne testowane".

151
Adam Tarnowski, Krzysztof Fronczyk

Rysunek 5.26. Wybór okna "Test t dla prób z menu SPSS

Rysunek 5.27. Okno "Test t dla prób

W dalszej musimy W naszym przy-


jest do grupy wieku. Zmienna w programie
SPSS nosi tzw. zmiennej Musi ona odpo-
do porównywanych grup. np. porównujemy dwie
grupy ze na to zarówno kobietom, jak i
kod liczbowy. on dowolny.
np. wszystkim kobietom przypisujemy 1, a - O.
W ten sposób W naszym przy-
padku grupom konkretne wiek bada-
nych.
Zdarza jednak tak, chcemy dwie grupy na podstawie
zmiennej czy o wielu dwóch).
152 w naszym w bardzo
5. Jakich informacji o dostarcza testowanie?

nym wieku, a zmienna wiek przybiera np. 7, 8, 9, 10,


11, 12, 13 i 14. teraz jaka wszystkich
badanych na dwie grupy. np. wszystkich 10 roku
zaliczamy do grupy pierwszej (czyli do grupy a
badanych do grupy drugiej (czyli grupy starszej).
W oknie z rys. 5.27. wzbiera przez zaznaczenie jej na-
zwy i odpowiedniej tak, aby jej nazwa w polu
"Zmienna Teraz jakie zmiennej
analizowane .grupy, które chcemy W tym celu
klikamy przycisk "Definiuj grupy", po czym okno przedstawione na
rys. 5.28. W od tego, czy zmienna ma charakter nominal-
ny czy nie, wybieramy (odpowiednio: warto-
lub Punkt W naszym wpisujemy dla grupy
1 -liczba 12, a dla grupy 2 -liczba 10.

Rysunek 5.28. Okno definiowania grup

Po "Dalej", a "OK", program wykona której re-


zultaty zamieszczone w edytorze wyników (rys. 5.29.).

Odehylenie: standardtlVvy
wiek N standardowe $fednie
it)tel 12,00 30 5,,9000 2,48235 ,45321
10,00 30 50,6000 3,13600 ,57255

Tei! L9'/ene-'a
jednOfOClt1o$cl
wariant I Test I

95% ufrtOstl ['jla


stanliartlowy
df (dWustronna rOilrlicv Doh18 aranICa Góro'i liioj(a
mtel
wariancji
1,508 ,224 3,HiO sa ,003 2,30000 ,73022 ,83831 3,78169
Nie
3,150 55,09. ,00"3 2,30000 ,13022 ,93667 3,76333

Rysunek 5.29, Okno wyników testu t-Studenta

153
Adam Tarnowski, Krzysztof Fronczyk

Na wydruku dwie tabele. W pierwszej gómej (Statystyki dla grup)


statystyki opisowe dla porównywanych grup (ich
nie, odchylenie standardowe i standardowy pomiaru). Z tabeli tej
dwunastolatkowie wyniki (52,9)
(50,6).
Informacje tego, czy ta jest istotna statystycznie zamiesz-
czone w kolejnej tabeli (Test dla prób Dwie pierwsze kolumny
tej tabeli testu wariancji Levene'a. Jest to sprawdzanie
jednego z testu t-Studenta. test Levene'ajest nieistotny statystycz-
nie, to wariancje homogeniczne, a co za tym idzie - test
t. Wyniki tego testu w pierwszym wierszu tabeli (wiersz
ten nazwany jest: wariancji). W przeciwnym wypadku, gdy
wariancje nie patrzymy na dolny wiersz tabeli, dane
na temat testu Cochrana-Coxa, który jest odpowiednikiem testu t-Sudenta dla sy-
tuacji, w której nie jest o wariancji (wiersz
ten nazwany jest: Nie wariancji).
W naszym przypadku test Levene'a jest nieistotny statycznie (F=I,508;
p=O,224). Oznacza to, wyniki testu t-Studenta odczytamy z pierwszego wier-
sza tabeli. Jak widzimy, tego testu wynosi t=3,15. Przy 58 stopniach
swobody wynik ten jest istotny statystycznie na poziomie p=0,003. Oznacza to,
testu inteligencji w dwóch porównywanych grupach wieku istotnie

5.2.5.4.2. Jednoczynnikowa analiza wariancji


W przypadku testu t-Studenta porównania wyników
dwóch grup. natomiast chcemy grup, musimy za-
inne metody analizy danych, np. wariancji. Taka
zachodzi w naszym chcemy wyniki nie
tylko i dwunastolatków, ale
Istotny statystycznie wynik analizy wariancji oznacza, przynajmniej dwie
z porównywanych grup Nie wiemy jednak w dalszym
gu, o które grupy chodzi. Jak tego Do tego celu
metody wielokrotnych.
tzw. wielokrotne porównania zaplanowane (czy analiza kontrastów zaplano-
wanych) oraz porównania post hoc.
Analiza kontrastów zaplanowanych testowanie statystycznej istot-
prognozowanych Chodzi tu o takie
nie którego przed przeprowadzeniem badania.
W psychologii rzadko zdarza badacz dysponuje na tyle
aby móc tak hipotezy. Zwykle przewidujemy, tylko dany
154 czynnik wyniki zmiennej Nie potrafimy jednak
5. Jakich informacji o dostarcza testowanie?

w jaki sposób. Z tego powodu porównania zaplanowane dla psy-


chologów mniejsze znaczenie praktyczne. W naszym przypadku ocze-
wszystkie trzy grupy wieku pod
wyników testu inteligencji nie wiemy jednak o
Natomiast w przeprowadzonym badaniu natrafiamy na
których albo nie albo nie sprecyzowanych hipo-
tez co do ich istnienia. W takim przypadku dokonujemy wszystkich
par bez jakichkolwiek co do sposoby ich
Najpopularniejszymi testami post-hoc testy Bonferoniego oraz Tukeya.
Aby wariancji w programie SPSS,
ce polecania. Z menu "Analiza" polecenie "Porównywanie
nich", a "Jednoczynnikowa Anova" (rys. 5.30.).

Rysunek 5.30. Wybór okna "Jednoczynnikowa Anova'! z menu SP SS

Spowoduje to ukazanie okienka dialogowego przedstawionego na rys. 5.31.


W okienku tym musimy (lub zmienne) oraz zmien-
na (czynnik). Wyboru zmiennych dokonujemy z listy
w polu w lewej okna. Za odpowiednich przenosimy wy-
brane zmienne do pola "Zmienne oraz do pola "Czynnik". W naszym
jest wynik testu inteligencji, a czynni-
kiem - wiek badanych ..

155
Adam Tarnowski, Krzysztof Fronczyk

Rysunek 5.31. Okno "Jednoczynnikowa Anova"

Po przycisku "Opcje", okno przedstawione na


rys. 5.32. Zaznaczenie odpowiednich opcji w tym oknie
statystyk opisowych i testu Levene'a wariancji (tak jak zaznaczono na
rys. 5.32.). aby program obliczenia dla wielo-
krotnych zaplanowanych (przycisk "Kontrasty").
wynik testu jest istotny statystycznie, powtórnie,
z testów post-hoc. Do tego celu przycisk "Post hoc".

Rysunek 5.32. Okno opcji analizy wariancji

Po "OK", program SPSS obliczy wyniki analizy wariancji, a tak-


inne statystyki, które w "Opcjach". Wyniki te przedstawiono na
rys. 5.33.-5.35. Tabela z rys. 5.33, przedstawia statystyki opisowe analizowa-
nych danych. Oprócz i dla i dwunastolatków,
156 które znamy z rys. 5.29, zaprezentowano tu dane
5. Jakich informacji o dostarcza testowanie?

Jak widzimy, kolejne grupy wieku wynikami testu


inteligencji.

staIystyId opisowe
inlel
95% dla

N> standardowe slandardol'll' Dolna aranica Górna granica Minimum Maksimum


8,00 3D 49,2661 2,12831 ,49a12 47,2479 49,2854 42,00 54,00
10,00 30 50,6000 3,13600 ,57255 49.4290 51,7710 45,00 56,00
12,00 30 52,9000 2,48235 ,45321 51,9731 53,8269 50,00 5&,00
90 50,5989 3,35500 ,35365 49,8862 51.2916 42,00 58,00

Rysunek 5.33. Okno wyników analizy wariancji - statystyki opisowe

Aby czy te istotne statystycznie, musimy


testu F oraz poziom jego (rys. 5.34,). jest on
0,05, to analizowany przez nas czynnik na poziom
zmiennej Tak jest w naszym

ANOVA
intel
Suma
kwadratów df kwadrat F
MiedZY grupami 322,022 2 161,011 20,607 ,000
grup 679,76.7 9T 7,813
1001,789 89

Rysunek 5.34. Wyniki analizy wariancji

. Wnioski z analizy wariancji uprawnione, sprawdzimy


jeszcze jedno z analizy wariancji, jakim jest wariancji
w analizowanych grupach. to weryfikuje test Levene'a (rys. 5.35.).
W przypadku, gdy testu Levene'ajest istotna statystycznie, to we wnio-
skowaniu nie na wynikach analizy wariancji. Nie jest bo-
wiem o wariancji. W naszym przypadku
ta jest jednak nieistotna statystycznie, a o
wariancji jest

Test wariancji
intel
Test Levene'a Istotnost
,831 ,439

Rysunek 5.35. Wyniki testu Levene'a 157


Adam Tarnowski, Krzysz tof Froncz yk

testu inteligencji w porównywa-


nych grupach, a ta jest istotna statystycznie. jest
analizy wariancji o wariancji. Nie wiemy jedna k w dal-
szym która (lub które) ze grupowych od ogól-
nej. tego metody porównania post hoc.
Jak wspomniano, w celu obliczenia z testów post-hoc w SPSS
przycisk "Post hoc" w oknie przedstawionym na
rys. 5.30. Przycisk ten okno na rys. 5.36.

Rysunek 5.36. Okno wyboru testów post-hoc

W okienku zaprezentowanym na rys. 5.36. zaznaczono dwa rodzaje


testów
post-hoc. W od rodzaju wybranego testu wy-
niki, z nich opiera na innym sposobie oceny Po
przycisku "Dalej", a "OK" , komputer wykona przed-
wyniki analizy wariancji wynikami testów post-hoc. Dla
omawianego wyniki testów post-hoc zaprezentowano na rys. 5.37.

158
5. Jakich informacji o dostarcza testowanie?

Testy post hoc

Porównania wielokrotne
Zmienna intel

95%
(I) wiek {Jlwiek
srednich (I·J) standardowy Dolna granica
Test Tukey'a HSD Górna granica
B,OO 10,00 ·2,33333" ,72173 ,005 -4,0543 -,6124
12,00 -4,63333 ' ,72173 ,000 -6,3543 -2,9124
10,00 8,00 2,33333 ' ,72173 ,005 ,6124 4,0543
'12,00 ·2.30000 ' ,72173 ,006 ·4,0210 -,5790
12,00 S,OO 4,63333 ' ,72173 ,000 2,9124 6,3543
10,00 2,30000 ' .72173 ,006 ,5790 4,0210
Test 90nferroniego 8,00 10,00 -2,33333 ' ,72173 ,005 ·4,0952 -,5715
12,00 -4,63333 ' ,72'173 ,000 -6,3952 -2,2715
10,00 8,00 2,33333* ,72173 ,005 ,5715 4,0952
12,00 -2,30000 ' ,72173 ,006 -4,0619 ',5331
12,00 a,oo 4,63333' ,72173 ,000 2,8115 6,3952
10,00 2,30000' ,72173 ,00& ,5381 4,0619
Y. sredmch jest istotna na poziomie .05.

Grupy jednorodne

inlt'
Podzbiór dla alfa = .05
wiek N 1 2 3
Test Tukey'a HSD' 8,00 30 48,2667
10,00 30 50,6000
12,00 30 52,9000
1,000 1,000 1,000
sredm8 dla grup jednorodnych.
3. \f\IyKot2Ys\';wana iest harmoniczna próby" 30,000.

Rysunek 5.37. Wyniki testów post-hoc

Z wyników przedstawionych na rys. 5.37. z porównywanych


w porównaniu z Wszystkie bowiem warto-
testów post-hoc (zarówno Tukeya, jak i Bonferroniego) istotne statys
tycz-
me.
testu inteligencji
w porównywanych grupach, a wszystkie istotne statystycznie.

Pytania
1. Czym jest pomiaru testem?
2, W jaki sposób pomiaru testem od teorii psycholo-
gicznej, na której jest oparty?
3, W jaki sposób od pomiaru testem? 159
Adam Tarnowski, Krzysztof Fronczyk

4. Dlaczego od standaryzacji, normalizacji i te-


stu?
5. W jaki sposób badana jest
6. O czym kompetentnych?
7. Jakie dla stanowi optymalizacja

8. Jakie strategie badania teoretycznej?


9. Jak teoretycznej skali
10. Scharakteryzuj wielu cech - wielu metod.
11. Czy jest wysoki poziom i
wej testu?
12. W jaki sposób analiza czynnikowa potwierdza testu?
13. Jakie rodzaje kryterialnej?
14. Na czym polega (kontaminacja) kryterium?
15. Dlaczego jest fasadowa?
16. Czy wysoka teoretyczna gwarantuje wysoki poziom w po-
aspektach
17. W jakiej sytuacji trafnego testu do nietrafnej dia-
gnozy?
18. W jakich sytuacjach poszczególne rodzaje szczególnie
19. Omów zastosowania analizy czynnikowej jako metody sprawdzania
pomiaru testem.

160
Ewa Witkowska
PSYCHOLOGII
UNIWERSYTET WARSZAWSKI
Krzysztof Fronczyk
PSYCHOLOGII
FINANSÓW I W WARSZAWIE

5.3. Analiza pozycji testowych


ten psychometrycznych pozycji
testowych oraz poszczegóhlych pozycji
testowych a testu jako Do tej pory
pomiaru testem, takimi jak i
o tym, jak "dobry" jest test jako pozycji testowych informu-
natomiast o "dobroci" poszczególnych pozycji.
znanych testów psychologicznych zbudowana jest z wielu pozycji
testowych, z których ma w
W typowym takim jak Bateria Testów
API S (Matczak, Jaworowska, Szustrowa i Ciechanowicz, 2006) dla za-
dania testowego istnieje jedna dobra za udzielenie której przyzna-
wany jest 1 punkt. Za odpowiedzi punkty nie przyznawane.
wynik w jest liczby poprawnych odpowiedzi na poszcze-
gólne zadania testowe.
Analiza pozycji testowych pozwala lepiej te-
stów psychologicznych. Zbadanie charakterystyk pozycji testu jest kluczowe dla
zrozumienia, dlaczego charakteryzuje go poziom i trafno-
pomiaru. W informuje o pomiaru na
wyniki w pomiaru. W pomiaru o do-
budowanych przez psychologów na podstawie wyników
testu. Dobrze przeprowadzona analiza pozycji testowych nie tyl-
ko pomóc dlaczego test charakteryzuje rze-
lub pomiaru, ale - zaradcze
w takiej sytuacji (Murphy i Davidshofer, 2005).
Zdarza lub pomiaru testem wynika z nie-
pozycji testowych lub ze zbyt skomplikowanej formy.
Poza tym pozornie dobre pozycje testowe spoza obszaru za-
przez konstruktora testu. i pomiaru testem z
poprawia gdy wyeliminuje takie pozycje. Na pierwszy rzut oka
elimInowanie jakichkolwiek pozycji testowych
pomiaru testem. Wiadomo bowiem, im test, tym pomIar
dokonany za jego jest bardziej rzetelny. ta doty- 161
Ewa Witkowska, Krzysztof Fronczyk

czy jedynie W nie ma sprzecz-


usuwania z testów wadliwych pozycji a o maksyma-
lizowanie pomiaru testem. Teoria wszystkie
pozycje w Analiza pozycji testo-
wych pozwala pozycje, które nie tego warunku, za-
tem ich pomiaru testem ulega poprawie (Murphy
i Davidshofer, 2005).
W sensie metodologicznym, pozycja testowa jest to sformalizowany
nik danej cechy psychicznej, a zdanie (twierdzenie lub pytanie)
zachowanie (lub zdanie zachowanie) oraz ska-
la to zachowanie opcje odpowiedzi o danym
formacie oraz odpowiedzi w wynik liczbowy).

5.3.1. pozycji testowych

to po które na
(zgodnej z kluczem i diagt)Qstycznej) odpowiedzi, do
przebadanej liczby proporcja . •. ..

pozycji testowej jest zazwyczaj jako odsetek osób, które


na pytanie. W sposób sformalizowany matema-
tycznie to jako:
n.
- ' 100%
P ,· = N

gdzie:
Pi - i-tej pozycji testowej;
ni - liczba osób, które zgodnie z kluczem na te-

N - liczba wszystkich osób dany test.

Pi zawiera w przedziale od Odo 1.


na sposób interpretacji Wysoka jego
wskazuje na pytania, a jego niska - na pytania trudne.
o pozycji testowych mówi w zasa-
dzie w przypadku testów czy inteligencji, w których istnieje jedna pra-
W przypadku kwestionariuszy nie
o w takim sensie, w jakim tu opisano, nie
w nich odpowiedzi poprawne i niepoprawne.
niki dla kwestionariuszy o dwukategorialnym formacie odpowiedzi,
162 przy czym jest to wtedy proporcja osób odpowiedzi zgodnych
5. Jakich informacji o dostarcza testowanie?

z kluczem. Dla pozycji kwestionariuszowych o wielu kategoriach, odpowiedzi


odpowiednikiem pozycji jest
Warto pozycji (rozumiana jako proporcja, a nie jako
procent) w testach czy inteligencji równa wyników tcj po-
zycji pod warunkiem, odpowiedzi poprawnej przypisze l, a odpo-
wiedzi niepoprawnej - O.
Jako obliczania pozycji testowych przyjrzyjmy wyni-
kom trzech pozycji na pewien test, którym przebadano
30 osób (tabela 5.10.). Dla z pozycji cztery odpowiedzi-
A, B, C i D. W przypadku pierwszej pozycji 24 osoby odpo-
C. Dzielimy zatem 24 (liczba odpowiedzi) przez 30 (liczba
przebadanych osób), co daje nam 0,8=80%. Jest to wynik wysoki,
o tym, pytanie jest Zastosowanie tej samej procedury wobec drugiego
pytania daje nam 12/30=0,4, co pozwala charakteryzu-
je poziom Z kolei pytanie trzecie, na które
tylko 5 przebadanych 30 osób, ma
0,17), czyli trudne.

Tabela 5.10. odpowiedzi na trzy pytania fikcyjnego testu

Pytanie
A B C D
#1 O 3 24* 3
#2 12* 13 3 2
#3 5 5* 17 3
oznaczono odpowiedzi

W a w przypadku innego testu


niki od poziomu mierzonej cechy charakterystycznego dla
zbadanej próby. Innymi to samo zadanie bardzo trudne w jednej
grupie badanych i bardzo w innej grupie badanych.
sobie na zmian rozwojowych wyników te-
stów czy inteligencji. To samo zdanie (np. matematyczne), które
problem np. dla 10-latków (a
jest bardzo niski - niewiele osób potrafi zadanie)
bardzo dla osób (bardzo lub niemal wszyscy
zadanie - wysoki).
Najlepiej pytaniami pytania o stopniu
czyli takie, na które odpowiada 50% badanych. to jedno-
pozycje o wariancji (Magnusson, 1991). Tego typu pozycje
na dokonanie liczby osobami w próbie.
Test powinien z pozycji testowych o wariancjach 163
Ewa Witkowska, Krzysztof Fronczyk

i Inne to takie, w którym


test zawiera pozycje testowe o poziomie jednak
nia ich powinna 50%. je zwykle w
w od do najtrudniejszego.
Aby pozycji testowych i ich wariancji,
uproszczonym wzorem na pozycji testowych:

gdzie:
Si2 wariancja i-tej pozycji testowej;
Pi - i-tej pozycji testowej;

Inaczej pozycji testowej jako jej trud-

Si2 = pj(l- Pi)


z ostatniego wzoru, na wykresie
pozycji testowej a jej ilustruje wy-
kres 5.1. '

0,3

l 0,25:
o
-gj 02
'

0,15
c.
'"
'[ 0.1'
'"
'1::

0,05

0.2 0,4 0,6 0,8

pozvcii testowej

Wykres 5.1. pozycji testowej a jej wyników

Wykres 5.1. wskazuje, wraz ze spadkiem pozycji testowych


(a wzrostem szybko wzrasta wariancja pozycji
testowych, ale tylko do pewnego momentu. 0,4-0,5
nika przyrosty wariancji bardzo niewielkie. Od 0,5
zaczyna stopniowy spadek wariancji pozycji testowych. spadki
wariancji nie ale od 0,6 na znaczeniu.
164
5. Jakich informacji o dostarcza testowanie?

5.3.2. Moc dyskryminacyjna pozycji testowych


Podstawowym celem stosowania testów psychologicznych jest uzyskanie in-
formacji o indywidualnych w zakresie mierzonej zmiennej,
nieobserwowalny konstrukt lub kryterium które chcemy
na podstawie wyników. Z tego powodu test powinien
z pozycji osoby o niskim poziomie mierzonej cechy od osób o wy-
sokim poziomie mierzonej cechy (Hornowska, 2001). Innymi osoby o ni-
skim poziomie mierzonej cechy rzadziej dobrze czy diagnostycz-
nie na osoby o wysokim poziomie mierzonej cechy
- takich odpowiedzi. Na osoby o poziomie
matematycznych w stanie pewne
zadanie matematyczne, np. dwóch z dwiema niewiadomymi,
osoby o poziomie tych

i testowych·· 6 tymc wJakim stopniu dana


pozycja na jest mocdyskrymi-
nacyJna (Homówska, 200

w czasie tworzenia testu, jego autorzy nic do


innej miary badanej zmiennej (czyli w przypadku - mate-
matycznych) poza samym wynikiem w W konsekwencji,
ten wynik traktujemy jak o zmien-
nej u badanego, a mocy dyskryminacyjnej oparte tym wyni-
ku. W sensie operacyjnym moc dyskryminacyjna jest to po prostu korelacja linio-
wa a Wyniki poszczególnych pozycji dodatnio
lub ujemnie skorelowane z wynikiem ogólnym testu. W efekcie do
czynienia odpowiednio z dwojakiego rodzaju pozycjami - o dodatniej i ujemnej
mocy dyskryminacyjnej. Pozycje testowe o dodatniej mocy dyskryminacyjnej to
takie, które poprawnie (diagnostycznie) przez osoby
badane o wysokich wynikach ogólnych. Pozycje te zatem badanych
w zgodzie z innymi pozycjami testu. pozycja z naszego
moc to poprawnie "dobrzy
matematycy", czyli tak, jak sobie tego Z kolei pozycje
o ujemnej mOcy dyskryminacyjnej przez osoby bada-
ne o niskich ogólnych wynikach w a te osoby przeciwnie
inne pozycje testu. W naszym przypadku wspomniany
matematycy" poprawnie osoby "mate-
matycznie co z naszej perspektywy jest pozbawione sensu i
takiego pytania testowego po prostu
Dodatkowo moce dyskryminacyjne powinny nie tylko
dodatnie, ale odpowiednio wysokie. Zwyczajowo przyjmuje moc 165
Ewa Witkowska, Krzysztof Fronczyk

dyskryminacyjna powinna 0,20, aby uzasadnione


czenie pozycji do skali. ostateczna wersja testu powimla
te pozycje, które testowania, a o dodatniej,
wysokiej mocy dyskryminacyjnej (Homowska, 200 l).
Wysokie moce dyskryminacyjne wszystkich pozycji w
pozycje te silnie ze skorelowane. w znajduje
pozycji o wysokich mocach dyskryminacyjnych to test cechuje
(por. 5.1.4.). Bowiem wysoka we-
to nic innego jak wysoki skorelowania poszczególnych pozycji
testowych.
Istnieje mocy dyskryminaGyjnej.
stosuje korelacji biseryjnej, kore-
lacji punktowo-dwuseryjnej i korelacji punktowo-czteropolowej.
Nie one jednak opisywane od strony matematycz-
nej. Zainteresowany Czytelnik znajdzie ich omówienie pracach
(1999), HOTIlowskiej (2001) czy Fergusona i Takane (1999).
Najbardziej rozpowszechnionym obecnie i
kiem mocy dyskryminacyjnej jest tzw. skorygowany korelacji po-
zycja - skala. Korekta polega na tym, nas w danym
momencie z wyniku ogólnego dla skali. Tak dla danej pozycji te-
stowej oblicza oraz wynikiem testu pomniejszo-
nym o Innymi wynik testu sumuje odpowiedzi
na pozycje testowe z odpowiedzi na dla której oblicza
moc takiemu zabiegowi jak bardzo
konkretna pozycja jest z pozycjami. Co wynik
ogólny testu nie jest przez pozycji testowej, dla której
obliczana jest moc dyskryminacyjna. Sposób obliczania tego typu
mocy dyskryminacyjnej nie opisywany, a jedynie w dalszej
niniejszego zostanie przedstawione wykorzystanie komputera
w tym celu.
Ograniczymy do zaprezentowania najprostszego mocy dyskry-
minacyjnej,jakimjest tzw. dyskryminacji, który tylko
w wypadku pozycji dwukategorialnych. Zostanie on omówiony nieco
ze na jego obliczania, która powinna lepsze
zrozumienie istoty mocy dyskryminacyjnej.
W celu obliczenia dyskryminacji, wszystkich ba-
danych na dwie grupy ze na ogólny wynik testowy.
osoby o wynikach wysokich (góma oraz osoby o wynikach niskich
(dolna Punktem np. mediana. W takiej sytuacji uzyska
dwie badanej grupy. bardziej ostre kryte-
ria tych grup np. 25% osób o wynikach i 25% osób
166 o wynikach (Homowska, 2001).
5. Jakich informacji o dostarcza testowanie?

W dalszej dla danej pozycji testowej oblicza osobno w


z osób, które odpowiedzi zgodnej z klu-
czem. dzieli osób zgodnie z kluczem na
w górnej przez wszystkich osób w tej
W ten sposób uzyskuje odpowiedzi zgodnych z kluczem w górnej
Podobnie, zgodnie z kluczem na po-
w dolnej przez wszystkich osób w tej uzyskuje
odpowiedzi zgodnych z kluczem w dolnej Teraz pozostaje
tylko z prostego wzoru obliczenie dys-
kryminacji:
D = Pll - Pl
gdzie:
D - dyskryminacji;
Pu - proporcja odpowiedzi zgodnych z kluczem w górnej
Pl - proporcja odpowiedzi zgodnych z kluczem w dolnej

Jak wspomniano, dodatnia dyskryminacji wskazuje,


dana pozycja testowa dobrze badanych. Ze wzoru tego
D przybiera tylko wtedy, gdy Pu>Pl' Jest to zrozumia-
pod oczekujemy, w górnej znajdzie
osób zgodnie z kluczem w dolnej. na-
tomiast D to w dolnej znajduje
osób zgodnie z kluczem w górnej. Takiej
sytuacji chcemy jednak lub zmody-
(np. przez odwrócenie klucza) w taki sposób, aby dyskrymina-
cji obliczony na podstawie kolejnego badania z zastosowaniem zmodyfikowanej
pozycji, dodatni
prosty wyliczania mocy dyskryminacyjnej przy wyko-
rzystaniu miary D. Obliczenia wykonane na podstawie dwóch
grup ze na Tabela 5.11. zawiera wyniki ogólne
10 studentów w pewnym oraz informacje o ich odpowiedziach na trzy
pytania tego testu. W kolumnach poszczególnym
pytaniom cyfra l oznacza, badany odpowiedzi zgodnej z kluczem,
a O - niezgodnej .

167
Ewa Witkowska, Krzysztof Fronczyk

Tabela 5.11. Wyniki fikcyjnego badania grupy studentów pewnym testem

Pytanie
Student Wynik ogólny
#1 #2 #3
Jan 90 1 O 1
Krzysztof 90 1 O 1
Joanna 80 O O 1
Wojtek 80 1 O 1
Jacek 70 1 O 1
Piotr 60 1 O O
Julia 60 1 O 1i
Agata 50 1 1 O
Matylda 50 1 1 O
Mateusz 40 O 1 O

Proponowana procedura obliczania mocy dyskryminacyjnej przedstawia

1. W pierwszej osoby badane na dwie grupy: osoby


o wysokich wynikach i osoby o niskich wynikach. W naszym
takiego dokonamy na podstawie mediany wyników ogólnych testu.
W tym celu wystarczy badanych na dwie równe po uszere-
gowaniu wyników studentów od do naj pod
wyniku ogólnego (takjak uczyniono to w tabeli 5.11.). W jednej (tzw.
górna osoby o wysokich wynikach, a w drugiej (tzw. dolna
- o niskich. W naszym do górnej przydzieleni
zostali Jan, Krzysztof, Joanna, Wojtek i Jacek, a do dolnej - pozostali.
2. obliczamy, ilu studentów z wysokimi i ilu z niskimi wynikami
dane zadanie. Np. dla zadania # 1 jest to po 4 studentów
z obu grup. Dane te zaprezentowano w tabeli 5.12.
3. W obliczamy proporcje osób
dane zadanie, czyli Pll i PI' Polega to na podzieleniu liczby osób roz-
dane zadanie przez wszystkich osób w tej po-
Dla zadania #1 Pll = 4/5 = 0,8.
4. mocy dyskryminacyjnej D,
studentów z niskimi wynikami, którzy zadanie od
proporcji studentów z wysokimi wynikami, którzy zadanie prawi-
Dla zadania #1 oznacza to 0,8 od 0,8, co daje
mocy dyskryminacyjnej równy O. Dla Czytelnik zechce
sam Di je z obliczonymi zapre-
zentowanymi w tabeli 5.12.
168
5. Jakich informacji o dostarcza testowanie?

5. Dodatkowo osób, które


zadanie w próbie przez wszystkich bada-
nych. Dla zadania #1 jest to 8/10=0,8
Jak z tabeli 5.12. moce dyskryminacyjne uzyskujemy dla
o stopniu Zagadnienie to opisano

Tabela 5.12. i moc dyskryminacyjna hipotetycznych testowych

Liczba Liczba
poprawnych poprawnych Moc
Pytanie
odpowiedzi odpowiedzi dyskryminacyjna
(górna (dolna polowa)
#1 4 4 0,80 O
#2 O 3 0,30 -0,6
#3 5 1 0,60 0,8

5.3.3. pozycji testowych a wyników testu


wyników testu, podobnie jak wszystkie inne te-
stu jako od poszczególnych pozycji testowych.
"Modelowym" w psychometrii jest normalny, co wynika
z o (teoretycznym) normalnym cech (porównaj 3).
Idealny normalny przedstawiony na wykresie 5.2. zatem
do tego, empiryczny wyników testowych jak najbardziej
do nonnalnego. Aby to test powinien zbudowany z po-
zycji o i dodatnio ze skorelowanych.
Innym wariantem do tego jest zbudowanie testu z po-
zycji o bardzo poziomie (zarówno "trudnych", jak
i trudnych"), które dodatnio ze sko-
relowane.

0,45
o 0,4'
0.35
-c
1lo 0,3
'O 0.25'
o
n. O,i
o
0,15
a.. 0,1
0.05:
O'
-5 -4 -3
standaryzowane z

Wykres 5.2. normalny 169


Ewa Witkowska, Krzysztof Fronczyk

od tej zasady do tego, otrzymuje wyni-


ków od normalnego. w praktyce ba-
dawczej empiryczny nie ma nigdy teoretycznego
normalnego. Jednak ten w stopniu do
nonnalnego, Skorelowanie pozycji testowych decyduje o stopniu sku-
pienia wyników czyli tzw. kurtozie pozycje
o jego Przyjmuje kurtozy
w przedziale od -1 do + 1 oraz
w przedziale od -1 do + 1 charakterystyczne dla
w sposób znaczny od normalnego,
Gdy korelacje poszczególnymi pozycjami zbyt silne, wyni-
ków ulega nadmiernego (mówimy, staje platokurtyczny), co
zaprezentowano na wykresie 5.3.

0.45:

j 0,4
'" 0,35
'c: ,
.!!! 0,3'
.CI
.g 0,25
&. 0,2
o
0,15
l! 0,1
CL. 0.05:

-4 -1 o :2 34 5
wystandaryzowane z

Wykres 5.3. platokurtyczny

W przypadkach skrajnie wysokich korelacji dwumodal-


ny czy litery "U" (wykres 5.4.).
du opisuje kurtoza, która w omawianej sytuacji przyjmuje bardzo
i znajduje -1,

0,45
o 0,4'
!
'c
0,35
0,3
.g 0,25
o
g. 0,2
... 0.15
Il. 0,1
0,05

-4 -3 -2 ·1 ° l 2
wyslandaryzowane z
3 4 5

170 Wykres 5.4, dwumodalny


5. Jakich informacji o dostarcza testowanie?

Gdy korelacje pozycji niskie albo ujemne, to wyników za-


czyna nadmiernie skoncentrowany (staje leptokurtyczny),
co przedstawiono na wykresie 5.5. W sytuacji skrajnego braku korelacji
dzy pozycjami testowymi staje jednomianowy (wszyscy uczestnicy
badania identyczny wynik). W tej sytuacji kurtozy jest
znacznie l.

0,8

0,7

!
Ol
0,6
·c
0.5
-8 0.4
8-
o

lo..
0.3·
0,2

0.1

·4 ·3 -2 o 2 3 4 5
wystandaryzowane z

Wykres 5.5. leptokurtyczny

test zawiera zbyt wiele trudnych czyli wielu pozycji testo-


wych niskie, to otrzymujemy niesymetryczny,
taki przedstawia wykres 5.6. W tym przypadku stosunkowo osób badanych
uzyskuje wyniki wysokich, a - wyniki niskie.

0,45.
0,4;
! 0,35:
.!!l 0.3!
..,.g 0,25:

...§ 0,2;
0,15j
a. 0,1;
0.05'
O'
-5 -4 -3 -2 -1 o 1 2 3 4 5
wystandaryzowane z

Wykres 5.6.

zdarzy sytuacja odwrotna, gdy test zawiera zbyt wiele


czyli jest wysokich wyników, a - niskich, otrzymujemy niesymetrycz-
ny,
171
Ewa Witkowska, Krzysztof Fronczyk

0,45,
0,4:

i
'c
0,35:
0,3:
:!o
0,25:
'8...
o 0,2'

i
11.
0,15'
0,1 :
0.05:
o'
-5 -4 4 o 1 234 5
wystandaryzowane z

Wykres 5.7.

Wszystkie opisane anomalie wyników test


jako pomiarowe nie odzwierciedla badanej cechy na skali. W efekcie
prowadzi to do braku w obszarach
du cechy: albo nadmiernie w
obszarach (blisko lub na albo w jednego
z Testy o "zaburzonych" co prawda zastoso-
wanie do specyficznych zadaJl diagnostycznych, ale w przypadków
optimum diagnostycznym jest uzyskanie normalnego wyników.

5.3.4. Obliczanie pozycji testowych i wyników


wSPSS

5.3.4.1. Obliczanie i mocy dyskryminacyjnych przy


SPSS
Pakiet statystyczny SPSS, przy okazji szacowania pomiaru
alfy Cronbacha oblicza pozycja-skala. W niniej-
szym rozdziale opisany zostanie sposób obliczania mocy dyskryminacyjnej na
podstawie tego typu W tym cclu zostanie wykorzystany
opisany w rozdziale 5.1.7.3. Obliczenia wykonane na podstawie
wykorzystanego w tym rozdziale pliku danych tj, alfa,sav,
W celu obliczenia mocy dyskryminacyjnych, tak samo, jak
opisano to w rozdziale 5, l. 7.3, z tym, w oknie "Analiza rzetelno-
Statystyki" (rys. 5.10.) dodatkowo "Pozycja testowa".
niej nie tylko moc i Cronbacha, ale
poszczególnych pozycji. Po "Dalej" i "OK",
wydruki przeprowadzonej analizy, co przedstawiono na rys. 5.38.

172
5. Jakich informacji o dostarcza testowanie?

StatJ/$1Yld

StalYStllki I)Ozycjl
Odchylenie
standardowe N
pl 2.80 ,798 60
p2 2,45 ,746 60
p3 Ul8 ,976 60
1)4 2,10 ,752 60
p5 2,22 ,993 60
p6 3,05 ,790 60
p7 2,35 1,039 60
pB VO ,696 60
pS 2,05 ,946 60
plO 2.'57 ,7B9 60
pll 2,42 .787 60
p12 2,08 ,787 60
p13 2,72 ,739 60
p14 3,13 ,965 60
p15 2,07 ,972 60
p16 3,13 ,769 60
p17 2,55 ,999 60
p18 2,82 ,624 60
p19 2,43 ,745 60
p20 2,97 ,367 60

StatySlykl pozycJi
WarianCja Alfa
skali skali po Korelacja Cronbacha
po pozycji po
PQ?,Ycji pozycji Q>!.ó/em _pozyt:jl
p1 47,68 37,881 ,442 ,691
pl 48,03 41,423 ,092 ,720
p3 48,60 36,922 ,421 ,690
p4 48,38 37,529 ,517 ,685
p5 4B,27 37,962 ,320 ,701
p6 47,43 37,131 ,530 ,683
p7 48,13 40,21 g ,119 ,723
p8 47,78 38,545 ,443 ,593
pe 48,43 37,741 ,364 ,696
plO 47,92 37,400 ,502 ,685
pll 46,01 41,758 ,046 ,724
p12 48,40 40,447 ,179 ,713
p13 47,77 42,555 ',025 ,728
1114 4/,35 38,062 ,325 ,700
p15 48,42 38,145 ,314 ,702
p15 47,35 40,638 ,167 ,714
p17 47,93 38,572 ,266 ,707
p18 47,67 39,446 ,386 ,698
p19 48,05 41,913 ,041 ,724
p20 47,52 41,000 ,368 ,705

Rysunek 5.38, Okno wyników analizy pozycji testowych

173
Ewa Witkowska, Krzysztof Fronczyk

W tabeli "Statystyki pozycji" przedstawiono i odchylenia standardowe


pozycjitestu. nie mieli do czynienia z kwestionariuszem o wielokate-
gorialnych odpowiedziach, a z testem inteligencji czy z
to pozycji testowych.
W tabeli "Statystyki pozycji w kolumnie "Korelacja pozycji
skorygowanych korelacji
pozycja-skala, które mocy dyskryminacyjnych. Jak jedna
z pozycji (p 13) ma moc i powinna z testu.
Oprócz niej niektóre z stosunkowo niskie i nie
0,2. Takimi niskimi mocami dyskryminacyjnymi pozycje testowe p2,
p7, pll, p12, p16 i p19. Te pozycje, podobnie jak pozycja p13, powinny
usu-
z testu. z daje to siedem pozycji testowych, czyli
pod wszystkich pozycji jest tylko 20.
charakteryzuje natomiast pozycja p6.
Warto tego kwestionariusza
najbardziej, gdyby wymienionych pozycji
-, p13. Jest to pozyc ja
o najmniejszej (ujemnej) mocy dyskryminacyjnej, czyli jest ona naj sko-
relowana z pozycjami. innych pozycji o niskich mocach
powinno alfy Cronbacha. zgod-
poprzez eliminowanie kolejnych pozycji o niskich mocach, na-
jednak aby krok po kroku, tzn.
tylko za razem,
i znów bez której skali najbardziej.

5.3.4.2. Obliczanie podstawowych charakterystyk


wyników testu przy zastosowaniu SPSS
obliczenia kurtozy oraz wyników testu zapre-
zentowane przy opisanego w rozdziale 5.2.5.4. pliku porównywa-
nas wyników testu inteligencji (zmien-
na o nazwie intel) przeprowadzonego na próbie W celu uzyskania
miar oraz kurtozy z menu wybieramy "Analiza",
a "Opis statystyczny", a w jeszcz e dalszej "Statystyki opi-
sowe". Po wybraniu tego polecenia, na ekranie monitora zobaczymy okno
przed-
stawione na rys. 5.39.

174
5. Jakich informacji o dostarcza testowanie?

Rysunek 5.39. Okno "Statystyki opisowe"

W celu wybrania zmiennych do analizy, dwukrotne ich nazwy


(w naszym przypadku intel) na po lewej stronie okna lub
zmienne, a po
okna. Po wykonaniu tej w prawej okna, nazwanej "Zmienne",
zmienne, dla których chcemy statystyki opisowe.
Po przycisku "Opcje" na ekranie okno przedstawione na
rys. 5.40. ono jakie charakterystyki
obliczone. Standardowo ustawione jest obliczanie odchylenia
standardowego oraz najmniejszej i jest obli-
czenie sumy wszystkich wariancji i standardowego
niej. Nas najbardziej obliczenie kurtozy i
Zaznaczamy kwadraciki przy tych

Rysunek 5.40. Okno wyboru opcji statystyk opisowych 175


Ewa Witkowska, Krzysztof Fronczyk

Po zaznaczeniu do obliczenia i przycisku


"Dalej", powrócimy do poprzedniego okna. Teraz przycisku "OK".
spowoduje otwarcie okna z nas obliczeniami, co zaprezentowano
na rys. 5.41.

StIll)/lllyldQPIoOW.

N Minimum MakSimum OdChylenie

Blaty.1ika SI.ty.M;, Sta1\'s1\ll<a Slot;s1Vka Sta1Vs1Vka Stalyslika itandardowy SI,tys_


intel 90 42,00 SS,OO 50,5999 ",114 ,254
I
",083 ,503
N
obserwiciamO 90

Rysunek 5.41. Okno arkusza wyników statystyk opisowych

Jak z wyników, ma -0,114±O,254, a kurtoza


-O,083±O,503. Obie te w przedziale <-1; l>, a
wyników testu inteligencji nie odbiega zasadniczo od normalnego.

5.3.5. Forma pozycji testowych


W dobrym psychologicznym pozycje testowe przede wszyst-
kim dla osób badanych. Koniecznym, aczkolwiek
warunkiem, który musi pozycja testowa dobrze
jest jej odpowiednia forma czyli gramatyczna,
czy itp.
Wykazano (por. Zawadzki, 2006), pozycje bardziej skomplikowane
kowo charakterystyki psychometryczne. Na w kwestio-
nariuszu FCZ-KT pozycji koreluje ujemnie z
(r=-0,23). Oznacza to, im pozycja testowa, tym moc dyskry-
minacyjna. Wynika pytania czy stwierdzenia w kwestionariuszach nie
powinny zbyt
Ponadto zbytnia gramatyczna nie jest w przy-
padku pozycji testowych. W testach strony biernej,
wielokrotnie stosowania podwójnych czy
negacji. skomplikowane konstrukcje gramatyczne (takie jak na przy-
ojciec brata) odczytanie sensu pytania i brak
w odpowiedziach u badanych. Wymienione konstrukcje grama-
tyczne (np. podwójne negacje) moc pozycji kwestio-
nariusza (Zawadzki, 2006).
Stosowany w kwestionariuszach powinien prosty.
pokusy stosowania naukowego czy pseudonauko-
wego, a rzadko
pozycji testowych ma zasadnicze znaczenie dla odnoszenia pozycji
176 do Pozycje zbyt ogólne interin-
5. Jakich informacji o dostarcza testowanie?

i W odnoszeniu pozycji do do-


(Zawadzki, 2006). Innymi pytania czy stwierdzenia bardzo
ogólne badani, odpowiedzi, tylko infor-
macje fragmentaryczne lub do wybranej dowolnie przez
siebie kategorii sytuacji czy czasu wszystkich zawar-
tych w ogólnie pozycji testowej. Aby tego
o zachowania w szerokiej grupie badanych
oraz z przesadnych i abstrakcyjnych (Zawadzki,
2006).
Trzeba wraz ze wzrostem pozycji czas od-
powiedzi i liczba Ma to znaczenie jedynie w przy-
padku kwestionariuszy, w przypadku testów (przede wszystkim
werbalnych), psycholog celowo tego typu zadania w celu po-
miaru poziomu werbalnych.

Pytania
1. Co to jest pozycji testowej?
2. Jak interpretuje p?
3. Jaka jest optymalna, z punktu widzenia psychometrycznego,
czynnika pozycji testowej? Czy zawsze testy powinny
z pozycji o optymalnej uzasadnij.
4. Jaka zachodzi pozycji testowej
a jej
5. dowolny aspekt inteligencji psychometrycznej i 5
pozycji testowych go
6. Co to jest moc dyskryminacyjna pozycji testowej?
7. Dlaczego na podstawie mocy dyskryminacyjnej eliminuje niektóre pozy-
cje testowe?
8. Czy moc dyskryminacyjna pozycji testowych jest z
pomiaru testem? uzasadnij.
9. moc ma zadanie poprawnie przez
wszystkich badanych?
10. Omów wariancji i mocy dyskryminacyjnej pozycji testo-
wych.

Zadania
1. osób pewien test z czterech Uzyskane
wyniki w tabeli.

177
Ewa Witkowska, Krzysztof Fronczyk

Pozycje testowe
Osoby badane
1 2 3 4
1 1 O O O
2 O 1 1 1
3 1 1 1 1
4 O O O O
5 O O 1 1

Na podstawie wyników zebranych w tabeli oblicz:


a) poszczególnych pozycji testowych;
b) wariacnje poszczególnych pozycji testowych;
c) dyskryminacji D, która z pozycji testowych
cechuje si't Do obliczenia D
skonstruuj tak grupy osób o wysokich i niskich wynikach, aby one rów-
noliczne.

2. Osiem osób w si't z wyniki przed-


stawione w tabeli.

Osoby Pozycje testowe


badane 1 2 3 4 5 6
A 1 1 1 1 1 1
B 1 O 1 1 O 1
C 1 1 1 1 O O
D 1 O 1 1 O 1
E 1 O 1 1 O O
F 1 1 O O 1 O
G O 1 O O O 1
H O 1 O O O O

Na podstawie tych wyników oraz odpowiednich odpowiedz na


pytania:
a) Czy pozycja testowa nr 2 ma moc
b) Czy pozycja testowa nr 3 jest trudniejsza pozycja testowa nr 6?
c) Ile wynosi zadania 5?
d) Ile wynosi moc dyskryminacyjna pozycji testowej nr l?
e) Ile wynosi moc dyskryminacyjna pozycji testowej nr 3?
f) Czy z dwu pozycji testowych o numerach 3 i 4 jedno by bez szkody
dla testu (F)
178
5. Jakich informacji o dostarcza testowanie?

Odpowiedzi do
1.
a)
0,4 0,4 0,6 0,6

b)
0,24 0,24 0,24 0,24

c)
O 1 0,5 0,5

2.
a) tak
b) nie
c) 6/8
d) 0,5
e) 0,75
f) nie

179
6. JAKICH INFORMACJI O OSOBIE BADANEJ
DOSTARCZA TESTOWANIE?

Andrzej Rynkiewicz
PSYCHOLOGII
UNIWERSYTET WARSZAWSKI

6.1. standardowe i
Wynik prawdziwy to hipotetyczna rzeczywiste nasilenie
mierzonej cechy. Ze na pomiarowych
nie precyzyjnie tego wyniku. W praktyce wykorzystuje
jego estymatory, czyli Wynik w a tzw. wynik
otrzymany, jest pewnego rodzaju estymatorem wyniku prawdziwego. Jego do-
jest raczej co oznacza, czasem wynik otrzymany
wyniku prawdziwego, a czasem Tak w sy-
tuacji diagnozy nigdy nie ma po której stronie i w jakiej od
konkretnego wyniku otrzymanego znajduje wynik prawdziwy.
teoretycznie jest, w pomiarze wynik prawdziwy
dzie równy wynikowi otrzymanemu, ale jest to bardzo prawdo-
podobne.
uwagi bardzo implikacje praktyczne. w re-
alnej diagnozie poziomu inteligencji osoba badana wynik typowy na tle
w wieku 23 lat. Wynik typowy oznacza, jest to wynik najbardziej
powszechny w tej grupie osób, czyli równy Zatem powie-
jest to osoba o typowym poziomie inteligencji. Jednak praw-
dopodobiel1stwo tego, jest to wniosek prawdziwy jest bardzo Wynik
otrzymany równy wyników otrzymanych nie musi wynik
prawdziwy osoby równy wyników prawdziwych w tcj grupie.
Ze na losowy pomiaru, rzeczywi-
ste nasilenie poziomu inteligencji jest nieco lub nieco nasilenia
typowego dla 23-letnich pomiaru zatem sprawia, diagnosta
nigdy nie pewien wniosków na
podstawie wyników bada6 testowych.
Aby nieco prawdopodobie6stwo wnioskowania i diagnozie
testowej wyznacza tzw. Jest to
symetryczny wyniku testowego i on estymato-
ra Najego podstawie ze znanym i akceptowalnym praw-
dopodobie6stwem wyniku prawdziwego osoby, a
nasilenie badanej cechy. jest jego
I Praca nad finansowana ze na badania statutowe Psychologii
180 UW w 2008 roku.
6. Jakich informacji o osobie badanej dostarcza testowanie?

stosunkowo zakres. diagnosta jest ska-


zany na wniosków np. poziom inteligencji osoby
jest typowy lub nieco typowego dla 23-letnich dla
osób badanych ten brak precyzji to jednak przy
obecnym stanie wiedzy psychometria nie oferuje technik bardziej
W tym rozdziale omówione dwa stosowane sposoby esty-
macji wyniku prawdziwego, czyli dwa rodzaje ufno-
- dla wyniku otrzymanego i dla estymowanego wyniku
prawdziwego. z nich jest konstruowany na bazie nieco inaczej definiowa-
nego standardowego. Ponadto zaprezentowana zostanie bardzo
metoda porównywania dwóch wyników testowych przy ufuo-
dla wynikami otrzymanymi.

6.1.1. Standardowy pomiaru


standardowy to szeroko w statystyce do oznaczania
odchylenia standardowego w dowolnej statystyki. Znaczenie tego po-
sobie na podstawie
z populacji kolejno próbki o takiej samej iw
dej z nich zmiennej (np. eks-
trawersji), to uzyskamy wiele pewien
w losowanych próbkach do populacyjnej. Efekt
ten najlepiej widoczny, gdy z populacji wylosujemy bardzo próbek.
ich nieskOl1czenie wiele, powstanie o nor-
malnym. Odchylenie standardowe tego to standardowy
standardowy informuje o estymatorów
(np. w losowanych próbkach) od parametru (np. w po-
pulacji). Im standardowy, tym dalej od populacyjnej
zlokalizowana w próbce wylosowanej z tej populacji.
Podobnie standardowy pomiaru. Jest to
wszystkich potencjalnych wyników otrzymanych przez
od wyniku prawdziwego. Wynik otrzymany jest tu
rozumiany jako estymator wyniku prawdziwego. Im
szy standardowy pomiaru tym dalej od wyniku prawdziwego
wynik otrzymany przez
Standardowy pomiaru jest a w praktyce
jego estymatorem, czyli Jego
wzór zapisany jest w równaniu 6.1. Stosowane tu oznaczenie (s E) sugeruje, jest
to odchylenie standardowe w a nie wyników otrzymanych.
Jednak wszystkich potencjalnych wyników otrzymanych przez
i taki sam ksztah, a
one takie same odchylenia standardowe. tego zagadnienia i wy- 181
Andrzej Rynkiewicz

prowadzenie wzoru w rozdziale klasycznej


teorii testów 4.).

. ·pra\Yd#-·.
wym·········.···.·····i.»·· .• • •. • • •>......... . . ............................................. . ·........i . . · .· . · ... ............................... ·. . iii.·.>·
•.
niki .
... •.• •.
. . . .

SE = r" (6.1)

Standardowy pomiaru charakteryzuje test, a nie Wynika to z za-


klasycznej teorii Gulliksena. Oznacza to, przy opisie osób
dziemy wykorzystywali ten sam standardowy pomiaru, pod warunkiem,
pomiarów dokonamy tym samym testem. W praktyce jednak, te osoby
populacje - np. i kobieta, to ze na
w wariancji cechy w tych populacjach test nieco
estymatora standardowego pomiaru w z nich.
Test, który charakteryzuje standardowym pomiaru, to test
dobry. Jest to z jego Ogólnie mniejszy standar-
dowy pomiaru zwykle oznacza Tak
im lepsze tym bardziej wyniki otrzymane przy jego zbli-
do wyników prawdziwych.

6.1.2. dla wyniku otrzymanego


Podstawowym, praktycznym przeznaczeniem standardowych jest
konstrukcja W na podstawie standardowego
pomiaru buduje dla wyników otrzymanych.
Ogólnie w statystyce jest zwykle symetryczny es-
teoretycznej. Uznajemy, ta teoretyczna (pa-
rametr) z wysokim znajduje w granicach
jest estymacji parametrów, czyli
wyznaczania ich estymacji sta-
tystycy np. cukru przez wszystkich Polaków
Gest to parametru) na podstawie cukru przez
Polaków Gest to estymatora). estymacji
psychometrzy wynik prawdziwy
parametru) na podstawie pojedynczego wyniku otrzymanego
182 estymatora).
6. Jakich informacji o osobie badanej dostarcza testowanie?

Zanim do opisu praktycznego sposobu wyznaczania ufno-


teoretyczne tego rodzaju estymacji. Punktem wyj-
powinien tu teoretyczny potencjalnych wyników otrzymanych
dla pojedynczej osoby. on tylko w sytuacji hipotetycznej, gdy jed-
badamy tym samym testem nieskol1czenie wiele razy. tu przy-
pomiary w sposób tzn. osoba ta nie uczy
nie i nie nudzi kolejnymi badaniami. nie-
badanie traktuje tak, jakby wykonane po raz pierwszy.
taki przedstawiony jest na rys. 6.1.

T x
T+z;SEM

,,
.
,, X,.Z;SEM x,
,,
dla X,
X,'J:;SEM xa X,.. z;SEM

dla Xz

Rysunek 6.1. wszystkich potencjalnych wyników otrzymanych dla jednej osoby


i ilustracja

Pojedyncza osoba o wyniku prawdziwym T w hi-


potetycznych kolejnych badaniach tym samym testem wyniki
otrzymane, bo w ten sposób losowe pomiaru. W konsekwcn-
cji takich wyników otrzymanych ma
jednak wyniki otrzymane tej osoby ulokowane w blisko-
jej wyniku prawdziwego, tzn. tam, gdzie na rys. 6.1. linia wykresu przebega
z rys. 6.1. jest normalny
hipotetyczny symetryczny (czyli wyniku
prawdziwego), procent potencjalnie do uzy-
skania przez wyników zaznaczony w gómej
rysunku). Granice takiego oddalone od wyniku prawdziwego
o z,,'SEM, bo rys. 6.1. przedstawia wyników otrzymanych osoby i jego
odchylenie standardowe to standardowy pomiaru. Symbol Za oznacza wy- 183
Andrzej Rynkiewicz

która jest z
wyników obejmowa-
nych przez ten np. z tablic normal-
nego. Jest to wynik wystandaryzowany, dla którego dystrybuanty wynosi
l-a/2, gdzie a to omówiony tzw. poziom z"
dla stosowanych poziomów podane w tabeli 6.1.

Tab. 6.1. stosowane w psychometrii wystandaryzowane granice


Za

a 1- a za
0,01 0,99 2,58
0,05 0,95 1,96
0,10 0,90 1,64
0,15 0,85 1,44

zaznaczony w górnej rys. 6.1. obejmuje znaczny


procent wyników, które potencjalnie osoba. Zatem ze znacznym
(ale zawsze mniejszym od l) wynik, który otrzy-
ta osoba znajdzie w omawianym przedziale. sy-
metryczny T ze znacznym
wynik otrzymany X, to tak samo szeroki
symetryczny dowolnego wyniku X otrzymanego przez ze
znacznym prawdopodobiellstwem jej wynik prawdziwy T.
Inaczej narysowany obejmuje wynik
X, to tak samo szeroki zbudowany tego wyniku X (narysowany
musi wynik T. zaznaczone w dolnej'
rys. 6.1. to

PRZYKLAD'l
•. . T·.
• wynilj.ó",(a

•. • rYs, • •
to jegQpdchYlenie fó",ne •
.• .
.. taki, .·. M9f)' . .

on ...:l .•
• .. .• • X:;
J .• .
.• .• 6.r.•.
.• . .
184
6. Jakich informacji o osobie badanej dostarcza testowanie?

Przedstawiona na rys. 6.1. sytuacja ma charakter teoretyczny, w real-


nych warunkach nigdy nie wiadomo, gdzie znajduje wynik prawdziwy osoby
badanej. jedynie on w wyniku otrzymane-
go z badania testem. Aby sobie to na
rys. 6.1. sytuacja hipotetyczna. To co na widoku, to
sytuacja realna, a dwa wyniki Xl i X 2 , które
w badaniu omawiana osoba. dla z nich zbudowali
to zgodnie z przedstawionym rozumowaniem,
ze znacznym one wynik praw-
dziwy. Po górnej rysunku dla wyniku Xl
obejmuje wynik prawdziwy, ale dla wyniku X 2 nie.
Zatem przy wnioskowaniu na podstawie zawsze
takiej to a, czyli poziom Na
jest to zwykle znacznie tzw. po-
ziom oznaczany przez l-a. Dla a=0,05, to oznacza,
w 5 diagnozach na 100 diagnosta wnioskowania, czyli
pomyli w opisie nasilenia cechy osoby.

tego, zewr:nik prawdziwy· rze-


.> ......•...........••.....</......( .• . . . •.•. . .•.•. • •
.poziorp t!s?,ze wynik prawdziwy
•. otrzymanego.

wnioskowania.

6.1.2.1. Obliczanie dla wyniku otrzymanego


Omawiany w tym rozdziale zawsze budujemy symetrycznie
wyniku otrzymanego. Wzór taki przedstawia rów-
nanie 6.2.

p(x -Za ·SEM:S; T:S;X +Z" ·SEM)=l-a (6.2)

Wzór ten w sposób: (litera


P) tego, wynik prawdziwy T znajduje w przedziale wynosi l-a.
budujemy poprzez od wyniku otrzymanego X
iloczynu zn'SEM, który nazywany jest bo jest równy
Górna granica powstaje w spo-
sób analogiczny - do wyniku otrzymanego dodajemy
185
Andrzej Rynkiewicz

6.1.2.2. Interpretacja dla wyniku otrzymanego


Zgodnie z wynik prawdziwy z jed-
nakowym równym l-a w miejscu
z jcgo granicami. jest obu-
stronnie Nie jest interpretacji
wyniku tylko do przedziahl Z tego szerokie
raczej niewygodne, bo bardzo dia-
gnozy. Warto sobie z czynników, które
Pierwszy z nich to testu. Im jest
tym mniejsze pomiarom. W konsekwencji zmniej-
sza standardowy pomiaru i jest
Drugi istotny czynnik to odchylenie standardowe wyników otrzymanych
w próbie. Imjest ono mniejsze tym
próby walidacyjne powinny jak najbardziej jednolite pod
dem mierzonej cechy. Jednak dobór takich prób powoduje
a co za tym idzie standardowego
pomiaru i rozszerzanie Sposobem na utrzymanie stosunkowo
niskiego odchylenia standardowego wyników i
go test jest dobry) jest losowanie
186 prób reprezentatywnych dla populacji.
6. Jakich informacji o osobie badanej dostarcza testowanie?

Kolejny czynnik na to po-


ziom Im poziom a, tym Jest on usta-
lany przez ale trzeba wysoka a oznacza wysokie
postawienia diagnozy. Z kolei niska a (np. 0,01)
daje czasem tak szerokie na podstawie wyników badania bardzo
trudno jest jakiekolwiek decyzje np. terapeutyczne. tak
gdy wszystkie zakresy od wyników
tzw. do na tle populacji. Interpretacja diagnosty,
formalnie poprawna, wtedy wielu osobom co najmniej
Z tego w diagnozie indywidualnej przyjmuje
czasami a=0,15. Jest to poziom niedopuszczalny w badaniach nauko-
wych, ale w badaniach indywidualnych przy testów o raczej niewysokiej
tylko taki zabieg daje na tyle aby interpre-
tacja

6.1.3. Standardowy wynikami otrzymanymi


W praktyce diagnostycznej zachodzi potrzeba oceny wy-
nikami otrzymanymi przez jedna w dwóch testach lub przez dwie osoby
w jednym Nie w takich przypadkach na wyni-
kach otrzymanych, bo z nich obarczony
dla z nich nie jest dobrym bo
do decyzji. Najlepszym sposobem jest zastosowanie
wyznaczonego dla wynikami otrzymanymi.
Konstruuje go na podstawie specjalnie definiowanego standardowego,
który zostanie opisany w tej
Definicja standardowego i dla do-
tyczy zarówno sytuacji, gdy badamy dwoma testami jak i jednym
testem dwie osoby. W obu przypadkach porównujemy dwa wyniki otrzymane.
Jednak dla uproszczenia opisu go tylko do sytuacji badania poje-
dynczej osoby.
Tak jak standardowy standardowy
wynikami otrzymanymi jest odchyleniem standardowym w pewnej
statystyki. W tym przypadku chodzi o otrzymanych, czyli
wynikami otrzymanymi (Xd=XI-XZ)' Taki teoretyczny
w efekcie dla wielu tej samej osoby dwoma
testami. wyników otrzymanych z z tych pomia-
rów normalpe (rys. 6.2., a)), to wynikami otrzymany-
mi normalny przedstawiony w b) rys. 6.2.
takiego to prawdziwa, czyli wynikami
prawdziwymi dla jednej osoby z dwóch testów (T d= T 1 - T z). Odchylenie standar-
dowe to standardowy wynikami otrzymany- 187
Andrzej Rynkiewicz

mi (O"Ed). Jest ono talde samo, jak Qdchylenie standardowe w


wynikami otrzymanymi (E d) dla pojedynczej osoby, co
stosowane oznaczenie (litera E w indeksie sugeruje z

a)

b)

Rysunek 6.2. wszystkich wyników otrzymanych jednej osoby z po-


miarów dwoma testami (a) oraz tych wyników (b). T 1 i T 2 - wyniki prawdziwe
osoby w testach 1 i 2; X 11 i X 12 - wyniki otrzymane przez w testach;
Td - wynikami prawdziwymi; X d1 - wynikami otrzymanymi

Analogicznie do opisywanego w' poprzednkh pomiaru,


sobie wynikami otrzymanymi - jest
to i (równanie 6.3).
nawiasy w równaniu 6.3, do prostego rów-
nania 6.4. wynikiem otrzymanym i prawdziwym to
pomiaru, do równania 6.5
pomiarami to pomiaru.

(6.3)

(6.4)

(6.5)

188
6. Jakich informacji o osobie badanej dostarcza testowanie?

wynikami to '-
(np. otrzymanymi z dwÓch testów) a
wynikami prawdziwymi w tych testach),.
do prostej pomiaru w dwóch badaniach .
.
'

Na podstawie równania 6.5 wzór odchy-


lenie standardowe w wielu wy-
nikami otrzymanymi, czyli standardowy wynikami otrzy-
manymi. W równaniu 6.6 wykorzystany opisywany sposób na
wyliczanie wariancji dwóch Wariancja czyli
wariancja pomiaru w dwóch testach to suma wariancji po-
miaru w tych testach pomniejszona o (cov = PEIEP Elu E2)
tych pomiaru.

2
2
U &1 =U El-n
2
= U El2 + U E2
2
- PEln u ElU E2 (6.6)

Z podstawowych koncepcji Gulliksena wynika, dwa losowe


powinny od siebie Zatem korelacja
(PEIE2) oraz kowariancja powinna zero. W konsekwencji
takiego powstaje równanie 6.7. Opisuje ono w
niesk011czenie wielu wynikami otrzymanymi.
standardowy wynikami otrzymanymi trzeba obie
strony równania 6.7 pod pierwiastek (równanie 6.8).
2
U Ed =U El2 + U E22 (6.7)

(6.8)

Standardowy wynikami otrzymanymi (CJEd lub SEMD) -


otrzymane od prawdziwej. Jest to
odchylenie standardowe wTOzkladziewszystkichpotencjalnych wyni-
kamiotrzymanymi prZez Vi dwóch testach lub W
czeniewielu wynikami otrzymanymi.
" ' . . '.
w praktyce estymator standardowego (SEMD)
na dwóch wzorów zapisanych w równaniach
6.9 i 6.10.

(6.9)
189
Andrzej Rynkiewicz

SEMD = (1- + (1- (6.10)

Wzór 6.10 w niektórych warunkach nieco Wiadomo, po-


wyniki testów elementami jednej baterii (np. podtesty bate-
rii Wechslera) wykorzystuje zwykle tzw. wyniki przeliczone. one
w rodzaju skali znormalizowanej i w z tym jednakowe dla
wszystkich podtestów odchylenie standardowe (odchylenie standardowe wyni-
ków przeliczonych w baterii Wechslera wynosi 3). porównywane
wyniki jednej osoby uzyskane z dwóch testów takiej baterii to
prostszym od poprzednich wzorem zapisanym w równaniu 6.11.

(6.11)

zarówno sytuacji, gdy porównywane


wyniki jednej osoby z badania dwoma testami, jak i dwóch osób z badania jed-
nym testem. W obu przypadkach definicja standardowego
taka sama. jednak porównywane wyniki badania jednym testem dwóch
osób do tej samej populacji (np. dwóch studentów w wieku 22 lat) to
wzór na SEMD jeszcze bardziej bo w takim przypadku jedna-
kowe zarówno odchylenia standardowe, jak i Wzór
taki zapisany jest w równaniu 6.12.

(6.12)
gdy SXl = SX2 oraz =
sytuacja jest niejasna i nie wiadomo, którego ze wzorów na SEMD
to najbezpieczniejszy ogólny wzór zapisany w równaniu 6.10.

6.1.4. dla wynikami otrzymanymi


teoretyczne jest tutaj takie samo, jak w przypadku prze-
dla pojedynczego wyniku otrzymanego. jednak pod
nie wyników otrzymanych dla pojedynczej osoby, ale
nic dwoma wynikami otrzymanymi dla tej osoby, który przedsta-
wiony na rys. 6.3.

190
6. Jakich informacji o osobie badanej dostarcza testowanie?

x.
T•.z;SEMD ..
T+z 'SEMD

, X".z;SEMD Xd1 X.,+z:.-SEMD


<

1-----.... ---. -<-----.----


X..-z.·SEMO
<

X(12
--'1
X.....z:SEMD
dla Xdf

dla X",

Rysunek 6.3. wszystkich potencjalnych dwoma wynikami otrzy-


manymi przez w dwóch testach i ilustracja dla
wyników

Dla uproszczenia opisu wynikami otrzymanymi (X d) na-


a wynikami prawdziwymi (Td) -
symetryczny prawdziwej (na
rys. 6.3. zaznaczony obejmuje znaczny procent wszystkich
wynikami dla pojedynczej osoby, to zbudowany
symetrycznie dowolnej otrzymanej (na rys. 6.3. zaznaczony li-
ze znacznym
Tutaj znów rys. 6.3. pokazuje hi-
W diagnosta ma tylko do tych informacji, które
w dolnej rys. 6.3. Dysponuje dwoma wynikami otrzymanymi,
na podstawie których (X d=X]-X 2) i
symetryczny niej ten ze znacznym praw-
równym poziomowi (l-a)
diagnosta uzyska w konkretnym badaniu dwoma testami
to jego w
jednak w badaniu pojawi otrzymana, taka
jak Xd2 ' to prawdziwa poza Diagnosta jednak
nigdy nie wie, czy myli przy wnioskowaniu na podstawie
bo nie zna lokalizacji prawdziwej. Poziom czyli a,
to prawdopodobieó.stwo tego, jego wnioski tzn. praw-
dziwa w poza Poziom a jest
diagnozy. 191
Andrzej Rynkiewicz

6.1.4.1. Obliczanie dla wynikami


otrzymanymi
Wzór taki zapisany jest w równaniu
6.13. Konstruujemy go w bardzo podobny sposób, jak ilme -
symetrycznie uzyskanej empirycznie, w tym przypadku
jest otrzymana. uzyskujemy od otrzy-
manej tzw. który tutaj jest iloczynem wystandaryzowanej
Za i standardowego wynikami otrzymanymi SEMD.
uzyskujemy do otrzymanej.

(6.13)

Równanie 6.13 w sposób:


tego, prawdziwa (T d) znajduje granicami uf-
wynosi l-u.

192
6. Jakich informacji o osobie badanej dostarcza testowanie?

6.1.4.2. wynikami otrzymanymi


dla wynikami otrzymanymi wykorzysty-
wany jest do oceny tzw. statystycznej wyników. Z
koncepcji Gulliksena wynika, dwie osoby o identycznych poziomach cechy
(czyli o identycznych wynikach prawdziwych) w tym samym te-
wyniki otrzymane. Jest to z losowym i nieprzewidywalnym
pomiaru. dwie osoby wyniki otrzymane w
to niekoniecznie oznacza to, nasilenie cechy. Aby móc
wnioski o nasileniu cechy u tych osób, ich wynikami
otrzymanymi musi czyli istotna statystycznie.

istnieje
.prawdziwymi. Wtakim przypadkumoznan;tó"
o w pasilenh.l cechy lub cech. .

Do oceny statystycznej wyników wykorzystujemy opisany


dla (równanie 6.13). Wiadomo, ze znacz-
nym taki obejmuje
ona w miejscu tego zjego granicami.
taka prawdziwa w inna zero, to zero naj-
prawdopodobniej poza granicami (rys. 6.4.).

o x d
zero poza
I

,.
la
I istotna
x
,
I
O
I I
d I
.. zero w przedziale
nieistotna
I I
dla X.

Rysunek 6.4. Ilustracja statystycznej wynikami otrzymanymi.


Na górnej osi jest znaczna i zero poza otrzy-
mana jest istotna statystycznie. Na dolnej osi jest nieznaczna i zero
przedzialu - otrzymana nie jest istotna statystycznie

procedury opisanej wyni-


kamiotrzymanymi uznamy za statystycznie, gdy obie granice
taki sam znak, tzn. albo obie dodatnie, albo obie ujemne. Tylko
w takim przypadku nie zera. W 3
ca wynikami otrzymanymi jest istotna statystycznie.
Przy porównywaniu wyników bardzo tylko
czyli iloczynem zu·SEMD. Aby zero poza 193
Andrzej Rynkiewicz

i aby dwóch wyników za statystycznie, to jej


musi od (równanie 6.14).

Ix] -X 2 1> za ·SEMD (6.14)


to jest istotna statystycznie

zero poza granicami dla to z


wynikami prawdzi-
wymi istnieje. Natomiast w odwrotnej sytuacji, gdy zero przedzia-
to nie wynikami prawdziwymi nie
istnieje. Jest to typowy problem z jednostronnym wnioskowaniem na podstawie
nieistotna statystycznie nie musi dwa
wyniki prawdziwe takie same. takiego zdarzenia w me-
todzie jest nieznane i raczej

6.1.5. Estymowany wynik prawdziwy


Na najprostszy i najpopularniejszy sposób
wyniku prawdziwego na podstawie wyznacza-
nego dla wyniku otrzymanego. Ostatnio coraz uznanie zdobywa alter-
natywna metoda, której jest cstymowany wynik prawdziwy. Na jego
podstawie wyznacza który jest a wygodniej-
szy konsttuowany na podstawie wyniku otrzymanego.
test psychologiczny ma to
nie zerowej korelacji wynikami otrzymanymi i prawdzi-
wymi. Im takiego testu, tym silniejsza
to korelacja. W przypadku testu idealnego pomiar powinien wynik
otrzymany równy wynikowi prawdziwemu. Przy serii pomiarów takim
testem np. grupy osób wszystkie wyniki otrzymane z wynikami
prawdziwymi. przy pomocy
nych, na którym pozioma odpowiada wynikom otrzymanym, a pionowa -
prawdziwym. Na rys. 6.5. punkt reprezentuje która uzy-
wynik otrzymahy na osi poziomej) i ma
wynik prawdziwy na osi pionowej). Gdy test ma
to wszystkie punkty linii prostej, bo zawsze wyniko-
wi otrzymanemu odpowiada taki sam wynik prawdziwy. Ta linia pokazuje trend
wynikami - im wynik otrzymany (X), tym
wynik prawdziwy (T) osoby. Jest to linia regresji. Gdy testu nie jest
idealna, ale znaczna, to punkty w niezbyt od linii regresji
tak, jak na rysunku 6.5., a). Przy jeszcze punkty
194 mocno linii (rysunek 6.5., b)).
6. Jakich informacji o osobie badanej dostarcza testowanie?

regresji wyznacza metodami analitycznymi na podstawie


punktów. Dla chmury punktów zwykle istnieje tylko jedna linia regresji.
w postaci równania znanego ze (równanie 6.15),
gdzie parametry a i b jej przebieg.

a) b)

20 20

18 18

16 16
• •
14 14
T T
12 12

10 10


10 12 14 16 18 20 10 12 14 16 18 20
X X

Rysunek 6.5. Linia regresji dla hipotetycznej wynikami otrzymanymi


(X) i wynikami prawdziwymi (T) w grupie osób. Rysunek a) pokazuje
(test o wysokiej a rysunek b) (test o niskiej

T' =bX +a (6.15)

równanie 6.15 i rys. 6.5. charakter hipotetyczny,


bo w realnych warunkach nigdy nic jest znany wynik prawdziwy osoby.
jednak parametry równania 6.15 na podstawie oszacowanych parame-
trów testu. Powstaje w ten sposób bardzo równanie 6.16 przy-
teoretycznego równania 6.15.

(6.16)

równaniem 6.16 wyniki prawdziwe na


podstawie wyników otrzymanych. Szacowana w ten sposób wyniku
prawdziwego oznaczona symbolem T', raczej nie to
rzeczywisty wynik prawdziwy, tylko jego ta na-
zwana estymowanym wynikiem prawdziwym. Stanowi on tym lepsze przybli-
wyniku prawdziwego im linii regresji na rys. 6.5. punkty.
A a) rys. 6.5. przedstawia estymowane wyniki prawdziwe
obarczone mniejszymi na b) rys. 6.5. 195
Andrzej Rynkiewicz

tstyrnowany
stosowany czasem.
prawdziwy, . . .11a.podstawie •.
niowej. dla ..••..

PRZYKLAD4
Osoba . ""ynik . otrzymany 15 .• .o
wynikówotrzyIllanych w prÓbie osób adekwatfieJ dla·
20. Zatemestyl110wanywynikprawdziwy

r ,sr X+(1--r )x=O,8 bI5 +(1...,0,81)


i
tt tt

Na podstawie równania 6.16 charakterystyki estymowanego


wyniku prawdziwego: .
a) estymowany wynik prawdziwy prawie zawsze znajduje wyni-
kiem otrzymanym i wyników otrzymanych;
b) im pomiaru testem, tym wyniku otrzymanego znaj-
duje estymowany wynik prawdziwy;
c) im mniejsza pomiaru testem, tym wyników otrzyma-
nych znajduje estymowany wynik prawdziwy;
d) pomiaru testem wynosi l, to estymowany wynik prawdziwy
jest równy wynikowi otrzymanemu (bo pomiar jest
e) pomiaru testem wynosi O, to estymowany wynik prawdziwy
jest równy wyników otrzymanych (bo pomiar jest loso-
wy);
f) im bardziej od jest wynik otrzymany, tym bardziej
sza dystans wynikiem otrzymanym i estymowanym wynikiem
prawdziwym;
g) wynik otrzymany jest równy wyników otrzymanych, to estymo-
wany wynik prawdziwy jest równy wynikowi otrzymanemu.
charakterystyka wynika z matematycznego re-
gresji prostoliniowej, ale w prosty sposób: estymo-
wany wynik prawdziwy jest przez wyników otrzy-
manych. To jest tym silniejsze, im ma test i im
dalej od znajduje wynik otrzymany. Szczególne znaczenie
nie powinno przyjmie o normalnym
wyników otrzymanych i prawdziwych w populacji. wyników otrzyma-
nych to najbardziej prawdopodobny wynik w próbie i w populacji. Oznacza to,
osób uzyskuje wyniki blisko
w badaniu wynik w od to istnie-
196 je pewne jest to osoba mocno nietypowa (o skrajnym
6. Jakich informacji o osobie badanej dostarcza testowanie?

nasileniu cechy). jest, wynik otrzymany tej osoby jest w


stopniu przez pomiaru. tak, to jej wynik prawdziwy
z po tej stronie wyniku otrzyma-
nego, która jest Innymi wyniki skrajne prawdo-
podobne w populacji. uda nam o takim wyniku, to
albo jest to zbieg albo konsekwencja znacznego
pomiaru. Im bardziej skrajny wynik, tym mniejsze budzi zaufanie. to
jest w oczywisty sposób sprzeczne z Gulliksena o
du pomiaru od wyniku prawdziwego osoby.

6.1.6. Standardowy estymacji wyniku prawdziwego


Standardowy estymacji wyniku prawdziwego (SEE) jest odchyleniem
standardowym w wszystkich potencjalnych estymowanych wyników
prawdziwych dla jednej osoby. takiego to wynik prawdziwy,
a im standardowy estymacji, tym odle-
estymowanych wyników prawdziwych od wyniku prawdziwego.
Standardowy estymacji jako odchylenie standardowe
w estymacji wyniku prawdziwego. Przez zwykle rozu-
miemy i W tym przy-
padku estymacji estymowanym wynikiem prawdzi-
wym a wynikiem prawdziwym (równanie 6.17).

E'=T'-T (6.17)

{E/) •
i . . . ... •.. . . ••. . ...... . • .• . •. . . .•.•.• •.• • • •.•. .• . . .\
(SEE)
.'.Vyniku prawdziwego. Jesttq od-

·wynikówprawdzjwy.c.h... 1u.bw
" - '" ",
e. stymacji wynHmpr.aw.·•..•.dz.i.w.eg. o.

Standardowy estymacji wyznacza na podstawie aparatu matematycz-


nego charakterystycznego dla analizy regresji prostoliniowej. W konsekwencji
dostaj emy prosty wzór zapisany w równaniu 6.18.

SEE=F,;SEM (6.18)

korelacji rtt jest zwykle od je-


dynki, standardowy estymacji (SEE) zwykle
mniejszy standardowy pomiaru (SEM). To sprawia, w tym 197
Andrzej Rynkiewicz

samym i dla tej samej osoby wyznaczony na podstawie


standardowego estymacji wyznaczony na pod-
stawie standardowego pomiaru. obu standardowych od
pokazana na rys. 6.6. na nim, linia
wykresu dla standardowego estymacji jest prawie zawsze linii dla
standardowego pomiaru.
Intuicyjnie ten efekt estymowanego
wyniku prawdziwego. Zgodnie z jego on zwykle
wynik otrzymany. W wszystkich potencjalnych wyników otrzy-
manych dla jednej osoby to wynik prawdziwy. dla
z tych wyników otrzymanych obliczyli estymowany wynik prawdziwy, to zwykle
on czyli wyniku prawdziwego. W efekcie
wyników estymowanych mniejsze odchylenie standardowe, czyli mniej-
szy standardowy, wyników otrzymanych.

o 0,5
r.

Rysunek 6.6. Standardowy pomiaru (SEM) i standardowy estymacji wyniku


prawdziwego (SEE) w funkcji (rtt )

Wykres dla standardowego pomiaru (SEM) z rys. 6.6. pokazuje typo-


'c
standardowym a pomiaru testem.
Natomiast pokazywana przez wykres dla standardowego esty-
macji (SEE) jcst z pewnych nietypowa. Zgodnie z
standardowego wykorzystywanego w psychometrii powinna monotonicz-
nie wraz ze wzrostem pomiaru testem - im test,
tym mniejsze przy jego i tym mniejsze odchylenia
wyników otrzymanych od wyniku prawdziwego. W przypadku standardowego
estymacji tego rodzaju widoczna jest tylko w prawej
wykresu dla 0,50. Gdy jest
198 mniejsza 0,50, wtedy wraz ze wzrostem pomiaru testem wzra-
6. Jakich informacji o osobie badanej dostarcza testowanie?

sta standardowego Na raczej nie stosujemy


w praktyce testów o mniejszej 0,50, ale takim testem
dysponowali, to paradoksalnie on
lepszy test o 0,50.

6.1.7. dla estymowanego wyniku prawdziwego


ten wyznaczamy analogicznej metody co inne omawiane wcze-
ona zilustrowana na rys. 6.7. opisane w
dla wyniku otrzymanego (por. 6.1.2.).

T T'
,,
i - - - - - - - - - - - - - - -.......
.
T.z;SEE T+z:SEE

_____
,,, T'·z
1 G
'SEE T'1 T'1+zII 'SEE ",::5
,,
ltcs:'
1 r..------------, t;
...........

1'·z 'SEE
............. w __ .1.

T':2
M _ w _ - ...... .....

T'2+z:CI 'SEE
przedzial ufnosci dla T', a:: a: o
li: d:

S
dla T'z

Rysunek 6.7. wszystkich potencjalnych estymowanych wyników prawdziwych


dla jednej osoby i ilustracja dla estymowanego wyniku praw-
dziwego

symetryczny wyniku prawdziwego (oznaczony na


rys. 6.7. z l-a obejmuje
do uzyskania przez estymowany wynik prawdziwy, to
o takiej samej ale symetryczny dowolnego esty-
mowanego wyniku prawdziwego (oznaczony na rys. 6.7.
dzie z takim samym l-a wynik prawdziwy.
dla diagnosty jest tylko dolna rysunku, ale na podsta-
wie obu - dolnej empirycznej i górnej hipotetycznej - niektóre
wynik prawdziwy (prawy zazna-
czony a inne nie (lewy zaznaczony linia przerywa-
Zatem diagnosta musi z tym, czasem wyznaczony przez niego 199
Andrzej Rynkiewicz

nie rzeczywistego nasilenia mierzonej cechy.


Jego wnioski na podstawie wyników testowych wtedy
takiego jest przez poziom a.

6.1.7.1. Obliczanie dla estymowanego wyniku


prawdziwego
ten oblicza równie jak dla wyniku otrzymanego.
tylko jest to symetryczny estymowa-
nego wyniku prawdziwego. Zanim do wyznaczania samego
estymowany wynik prawdziwy
równaniem 6.16. obliczamy sam równa-
nia 6.19. obliczell pokazany jest w

P(T' -Za ·SEE s;. T s;. T' + Za ·SEE) = l-a (6.19)

PRZYKLAD5
wieku 22 lat w wynik równy 39 punktom. Z
do testu jego obliczoriy dla pró-
by w tym wieku wynosi na 0,69, odchylenie standardowe wyni-
ków otrzymanych jest równe 3,50, a wyników otrzymanych wynosi 25. Na tej
podstawie estymowany wynik prawdziwy osoby (równanie 16)

T' = 0,69· 39+ (1-'- 0,69)·25,=:34,66


standardowy pomiaru (równanie 6.1)

SEM =3 r 50.jl-O,69 =1,95


oraz standardowy estymaej i wyniku prawdziwego (równanie 6.18)

SEE=.jO,69·1.95=1,62. '
poziom 0,10. Odpowiada mu wystandaryzowana
zo==1,64. teraz dla wyniku otrzymanego tej oso-
by.

P(34,66-1,64 . X,., ::; 34,66+ 1,64.1,62) == l-a

X= 37,32) = l-a
Granice zwykle do Zatem
nik prawdziwy osoby w przedziale od 32 do 37 punktów z praw-
0,90.
200
6. Jakich informacji o osobie badanej dostarcza testowanie?

dla estymowanego wyniku prawdziwego zwykle nie jest


symetryczny wyniku otrzymanego, bo jest symetryczny
estymowanego wyniku prawdziwego. Czasem jednak tak jak
w tego typu nie
dzie wyniku otrzymanego. Taka sytuacja wtedy, gdy
estymowany wynik prawdziwy bardzo oddalony od wyniku otrzymanego,
a wtedy, gdy test ma oraz wynik otrzymany znajduje
daleko od wyników otrzymanych. W oba te
warunki
dla estymowanego wyniku prawdziwego interpretuje
tak samo, jak dla wyniku otrzymanego. Z prawdopodobieIl-
stwem l-a ufamy, ten zawiera wynik prawdziwy.

Literatura zalecana
Anastasi A., Urbina, S. (1999). Testy psychologiczne. Warszawa: Pracownia Testów
Psychologicznych PTP. (Str. 150 - 155).
J. (1996). Metodologia psychologicznych. Warszawa: PWN.
(Str. 461-466).
Homowska E. (2005). Testy psychologiczne. Teoria i praktyka. Wydawnictwo Scholar.
(Str. 63 - 69).
Magnusson D. (1991). Wprowadzenie do teorii teslów. Warszawa: PWN. (Wydanie 2:
str. 119-147).

Zadania
1.
Wynik otrzymany osoby w o 0,87 wynosi 48.
Oblicz przy a=O, l, gdy wiadomo, odchylenie standardowe
wyników otrzymanych w próbie walidacyjnej 11,5. Zinterpretuj wy-
nik.

2.
dla podanych wyników przy a=0,05:
a) st=10; r tt=O,90; X t=55;
b) st=15; r tt=0,95; X t=60;
c) s(=2; r tt =O,85; X t=6.

3.
dla wyniku otrzymanego obliczony przy a=O,05 wynOSI
<11; 19>.
a) Oblicz wynik otrzymany tej osoby.
201
Andrzej Rynkiewicz

b) Oblicz
c) Oblicz SEM.
d) Oblicz dla tej osoby przy a=O, l O.
e) Oblicz dla innej osoby o wyniku otrzymanym X=17 przy a=0,15.

4.
Wyniki otrzymane dwóch osób X A =12 i X B =17. Dane rItA=0,90;
rItB=0,87; sXA=4. Jakie musi odchylenie standardowe wyników dla osoby B
(SXB)' aby górna granica dla osoby A z
dla osoby B, gdyby oba te wyzna-
czone przy a=O, 1O?

5.
testu wynosi 0,91. W próbie walidacyjnej
wyników otrzymanych równa 41, a odchylenie standardowe 9,3. Wyznacz
dla estymowanego wyniku prawdziwego tej osoby przy a=O, 10,
gdy wynik otrzymany wynosi 49. Zinterpretuj wynik.

6.
dla estymowanego wyniku prawdziwego obliczony przy a=0,05
wynosi <24; 36>.
a) Oblicz estymowany wynik prawdziwy tej osoby.
b) Oblicz
c) Oblicz SEE.
d) Oblicz przy a=0,15.
e) Oblicz dla innej osoby o estymowanym wyniku prawdziwym T'= 18
przya=0,10.

7.
Estymowany wynik prawdziwy osoby w o 0,88
wynosi 34. Oblicz wynik otrzymany tej osoby, gdy wiadomo, wyni-
ków otrzymanych w próbie walidacyjnej równa 30.

8.
Wynik otrzymany przy badaniu testem o 0,79 wynosi 17. Jaka musi
sx, aby wynik otrzymany poza granicami dla
SEE, gdy wyników otrzymanych w próbie równa 12, a a=0,10?

9.
zbudowany na podstawie SEM dla a=0,10 wynosi <24,3;
29,7>. jest równy 0,893, a wyni-
202 ków otrzymanych w próbie 31 oblicz dla SEE.
6. Jakich informacji o osobie badanej dostarcza testowanie?

10.
Dwie kobiety w tym samym wieku w wyniki 19 i 16. Czy
one pod mierzonej cechy na poziomie O, l O, gdy st=3,2; rtt=0,86?

11.
Standardowy wynosi 1,7. Ile musi wynika-
mi otrzymanymi, aby za na poziomie 0,15?

Odpowiedzi do
1. <43,85; 52,15>; po <44; 52>. Wynik prawdziwy osoby znaj-
duje w przedziale wynikami 44 i 52 z
0,90.

2a. SEM=3,2; <48,73; 61,27>; po <49; 61>.


2b. SEM=3,35; <53,43; 66,57>; po <53; 67>.
2c. SEM=O,77; <4,49; 7,51>; po <4; 8>.

3a. X=15
3b. z"SEM=4
3c. SEM=2,04.
3d. <11,65; 18,35>; po <12; 18>.
3e. <14,06; 19,94>; po <14; 20>.

4. sXB=4,96.

5. T'=48,28; SEM=2,79; SEE=2,66; <43,92; 52,64>; po <44;


53>. Wynik prawdziwy osoby badanej znajduje w przedziale
wynikami 44 i 53 z prawdopodobiellstwem 0,90.

6a. T'=30
6b. zaSEE=6
6c. SEE=3,06.
6d. <25,59; 34,41>; po <26; 34>.
6e. <12,98; 23,02>; po <13; 23>.

7. X=34,55.

8. sx<1,56.

9. <24,87; 29,99>; po <25; 30>; 203


Andrzej Rynkiewicz

10. SEM[=SEM2=1,2; SEMD=1,69; z"SEMD=2,78; otrzymaila równa


3 jest istotna statystycznie na poziomie 0,10, a dwie kobiety
pod mierzonej cechy z 0,90.

11. otrzymanej musi 2,45.

204
Andrzej Rynkiewicz
PSYCHOLOGII
UNIWERSYTET WARSZAWSKI

6.2. Normy i normalizacja!

6.2.1. Norma i normy


Norma diagnostyczna to nasilenie cechy, które w populacji
powszechne cech psychicznych
ma w populacji normalny, w psychometrii sta-
nowi wynik równy lub blisko niej (rys. 6.8.). Zwykle bierze
tu pod wyników, norma nie
tylko do pojedynczej równej arytmetycznej. Jest to
zawsze symetryczny ale jego jest raczej uznanio-
wa. W medycynie, dziedzinie wykrywaniem i leczeniem zabu-
rzell, o nasileniu cechy poza uznaje za
Zatem w tym przypadku jako norma musi dostatecznie
szeroki i osób z populacji. W obszarach psychologii,
które nie zagadnieniami klinicznymi norma zakres nieco
ona wtedy Diagnosta ma do
czynienia z na tle populacji, gdy jej wynik znajduje w przedzia-
le normy, lub z o nasileniu cechy nieco lub typowe.
Nie jest to jednak równoznaczne z na wymiarze zdrowy-chory. W tego
rodzaju sytuacjach wyników do
jako wyników Unika w ten sposób
charakteru "norma" i skojarzenia z epitetem "nienormalny".
W diagnostyce psychologicznej zwykle przyjmuje
ny obejmuje wyniki oddalone od nie bardziej o jedno odchylenie
standardowe. sobie jednak w
diagnosta przyjmie inne granice normy. one usytuowane
nieco dalej od i wtedy norma charakter bardziej liberalny.
W takiej sytuacji osób zwykle uznamy za typowe. Natomiast za odbie-
od nonny pod uznamy o skrajnym
wyniku.
Granice normy Wtedy powstanie norma elitarna - tylko
stosunkowo grupa osób zostanie uznana za Manipulowanie szc-
wyników typowych nie jest
ale w ona podyktowana o cha-
rakterze ekonomicznym, formalnym, politycznym lub innym.
IPraca nad finansowana ze na badania statutowe 1fYdzialu Psychologii
UW w 2008 roku. 205
Andrzej Rynkiewicz

-3 -2 -1 o 2

Rysun ek 6.8. Normalny hipotetycznej cechy psychicznej i ilustracja nor-


my

Norm a - nasilenie cechy, które w .


Norm y - odnitlsienia, kt6ryp ozwal a precyzyjnie nasile-
nie Normy
tabel wyników surowych na

granice uznanego za na podstawie


wyniku testowego, nasilenie cechy danej osoby jest typowe, lub
typowe. Czasami jedna k zachodzi potrzeba bardziej precyzyjnego
wania. Nie zawsze jest stwierdzenie, nasilenie cechy osoby ba-
danej jest na typowe.
to, o ile jest tu i za
odchylenie standardowe. Stwierdzenie, wynik konkretnej osoby jest
od o 2 odchylenia standardowe daje uchwy-
cenia wynikiem otrzymanym a wyników w próbie czy
populacji. Jest to infonnacja precyzyjna, ale bardziej
Na podstawie charakterystyki normalnego
wyniki takie, jak ta osoba lub jeszcze uzyskuje zaledwie
nieco ponad 2,5% osób z populacji. Jest to wynik bardzo wysoki na tle
tej populacji. Dla takich precyzyjnych diagnoz musimy
nonnami,
czyli statystycznym odniesienia, a proces, który stworzenie
systemu norm, to tak zwana norm alizac ja. Jest on tylko wtedy, gdy
empiryczny wyników testowych w próbie jest co najmniej podobny do
normalnego. tak nie jest, to nam kwan tyle, czyli normy
o charakterze procentowym frakcje wyników w próbie.
Wszystkie te rodzaje norm opisane dalej.
206
6. Jakich informacji o osobie badanej dostarcza testowanie?

6.2.2. Standaryzacja
Z racji tego, normy
statystyczny odniesienia, przy ich kon-
strukcji do wyników testowych uzyskanych przez
osób (próba reprezentatywna). Próba taka powinna
osób wylosowanych z populacji. Tylko czyste
losowanie liczby osób daje ze
du na wszystkie zmienne. Jednak losowania
i mniej metodami doboru kwotowego, gdzie z góry
próby pod najbardziej
zmiennych (np. W konsekwencji próba taka jest mniejsza
(a wygodniejsza), ale niekoniecznie reprezentatywna ze na pomi-
przy jej planowaniu zmienne.

,osóh .(takZeosobriików . ··lub . które


(np .. wSzyscy Polacy 20-40 ·Iat).
(np •. wszyscy Polacywwiektl pOwyzej nO lat), ale ata"'
(ylkopbpuhtcjathi bardzo w których pomiar
jest .•. tt;tc\py • .• •.

....... ,.... •. ,..... . .. . ,. . . . . . . . .......... . . . . ····.·..i •.


Próba izwy .
.-•• próba:.którajest odzwiercied1enieth. populacjif)od
. dem struktury wszystkich UzyskUjemy np:poprzez los0-wanie
l1ej>liczby . ..

do do testu,

Pierwszy etap procedury normalizacyjnej sprowadza do prostej standary-


zacji wszystkich wyników z próby. wynik otrzymany Xi zamieniamy na
wynik wy standaryzowany Zj równania 6.20.

X-x
Zi = ----'l __ (6.20)
S

. •. ..odle.
.

Wynik wystandaryzowany Zj pokazuje nam, jak daleko od i w któ-


rym kierunku wynik otrzymany osoby. Jako jednostki odchylenia
standardowego. Wynik wystandaryzowany z= 1 oznacza, mu
207
Andrzej Rynkiewicz

wynik surowy jest od o l odchyleniu standar-


dowemu. Analogicznie wynik wystandaryzowany z=-1,5 oznacza, wynik su-
rowy znajduje po lewej stronie w równej 1,5
odchylenia standardowego. wynik surowy jest równy to odpowia-
mu wynik wystandaryzowany równy o. Zatem to,jakajest pozycja
wyniku surowego na tle próby zarówno od jak i od odchylenia
standardowego wyników w tej próbie. Ilustruje to 1.

1
Porównanie. W grupach' o srednich .
i kobieta tak:lsam wynik surowy w. róWny. 30.
wszystkich wynik 'równy 33, a: kobiet
27. w obu próbach takie samo rÓwne 3.
obu tych osób na tle ich grup,naleZy
ich wyniki równaniem 6.20. .

30-33 .. . 3 0 - 2 7 ..
zm.:;;:;
, .. . .d3. ..=-1 kobieta:
' Zk ;;:;
.. 3· ='+1
Wynik dla od a wynik kobie-
.. Pomimo obie osoby
ten sam wynik surowy w to z powódu w poziom
cechy jest nit poziom cechy kobiety.
PorÓwnanie wyni){ów wystandaryzowanych w grupach o

kobieta· Uzyskali taki sam· wynik surowy w· rówrty30


W!:izystkicqbaganych Qsób wyp,iktówny 27.
w równe a W próbie kobiet 6. ZtlQw
obu tych osób na tle ich
c. '
gmp,
, • • • • '. ,. ' •• , .' •
wyniki.
.,

. '30-27 ... 30..:..27


yzna.: zm··.=:t····
. 3 ·=+1
...
· kobieta:>. Zk =. . 6. .. ::::;; +0,5
,.

jest dla od a wyntIc ko-


biety. dla kobiet POluimo tego, obie osoby
ten wynik surowy w to z powodu w odchyletliach stan-
poziom· cechy poziom
cechy kobiety.· . . . . ..

Odchylenie standardowe, którym przy ocenie po-


zycji osoby na wymiarze cechy jest dla
208 od tego, czy zna podstawy statystyki czy nie, to do-
6. Jakich informacji o osobie badanej dostarcza testowanie?

intuicyjnie
wania w grupie odniesienia, czyli do odchylenia standardowego.
obserwujemy dwie grupy osób, w których wzrost jest
taki sam, ale one odchyleniem standardowym - w grupie A osoby
wzrost bardzo podobny w granicach od 170 cm do 174 cm, a w grupie B osoby
wzrostem w granicach od 164 cm do 180 cm. W tych warun-
kach o 178 cm uznamy na tle grupy A za bardzo a na tle
grupy B po prostu za To, czy opiszemy jako bardzo
od reszty osób w mierze od cechy w grupie, która
stanowi odniesienia.

6.2.3. Normalizacja
Wyniki wystandaryzowane w wyniku
otrzymanego osoby badanej od w próbie. Interpretacja jesz-
cze bardziej gdy normalnego.
Pojawia wtedy wyznaczenia lub
które precyzyjnie pokazuje osoby badanej wszystkich osób w po-
pulacji. zatem wyniki otrzymane z danego testu w po-
pulacji nonnalny. jest w próbie
wyników nieco od nonnalnego, ale to
jest z niedosko-
losowania próby.
Normalizacja jest nieliniowym wyników.
sobie graficznie jako empirycznego tak,
nonnalnego. Z tego aby nie
nym o manipulowanie wynikami nie powinno by to
zbyt ono gdy empiryczny przypomina mode-
lowy nonnalny. Nie zaleca wykonywania nonnalizacji, gdy
empiryczny wyników testowych w próbie nonnalizacyjnej jest mocno

Typowa procedura nonnalizacji wyników hipotetycznego testu przedstawiona


jest w tabeli 6.2.
W kolumnie (1) tabeli 6.2. zapisano wyniki otrzymane w Na ich podsta-
wie przebadane osoby wyników, ponie-
nikt w grupie nie mniej 24 ani 33 W kolumnie
(2) zapisana jest poszczególnych wyników (jak osób
konkretny wynik). Kolumna (3) to skumulowana, czyli liczba osób,
które dany wynik lub skumulowana 18 dla wyniku
27 oznacza, w sumie 18 osób wynik 27 lub 27. Ostatnia
w kolumnie (3) to próby.
209
Andrzej Rynkiewicz

Tabela 6.2. Normalizacja wyników testu. Przebadano 50 osób. Test ma 60 a


osoba odO do 60 punktów. Opis w

wyniki w próbie normalizacja


(1 ) (2) (3) (4) (5) (6)

X skiJmulo- I.s. proporcja z


wana
24 1 1 0,5 0,01 -2,33
25 3 4 2,5 0,05 -1,65
26 5 9 6,5 0,13 -1,13
27 9 18 13,5 0,27 -0,61
28 12 30 24 0,48 -0,05
29 8 38 34 0,68 0,47
30 6 44 41 0,82 0,92
31 3 47 45,5 0,91 1,34
32 2 49 48 0,96 1,75
33 1 50 49,5 0,99 2,33

(4) zawiera skumulowane liczone dla


Kolumna ta jest konieczna, gdy mierzona zmienna ma w rzeczy-
charakter Wtedy wynik uzyskany w badaniu trakto-
jak teoretycznych Np. wynik 28 jest dla wszyst-
kich w granicach od 27,5 do 28,5. tego od
jednostki pomiaru - im jednostka, tym szerszy Jest to
naturalna konsekwencja pomiaru zmiennej o nieidealnej
a nie ogranicza ona do testów psychologicznych.
w przypadku pomiaru wzrostu osób zostanie zastosowana miarka z
w centymetrach, to kilku osobom przypiszemy wynik 172
cm. Nie musi to jednak wszystkie te osoby identyczny wzrost.
nimi tak miarka o jednostce równej 1 cm ich
nie wykryje. wynik 172 cm oznacza wzrost w zakresie
od 171,5 do 172,5, bo w przypadku wszystkich osób o rzeczywistym
w tym zakresie zastosowana miarka wynik 172.
Dodatkowo jest tu o równomiernym wszyst-
kich teoretycznych wyników Np. wynik 28 przypisano
w sumie 12 osobom. Ich wyniki teoretyczne równomiernie rozrzucone na od-
cinku od 27,5 do 28,5. Na rys. 6.9.
tego wynik osób. Zatem
trzeba w kolumnie (4) dla wyniku 28 to liczba osób, których wyniki
210 w przedziale 28 (jest ich 6) i we (jest
6. Jakich informacji o osobie badanej dostarcza testowanie?

ich W sumie 18). zawsze do z kolumny (2)


dla danego wyniku dodaje z kolumny (3) dla
wyniku

27 28 29
27,5 28,5

II IIIIIii IIIIIII
Rysunek 6.9. Równomierny wyników w teoretycznym przedziale dla wyniku 28
z tabeli 6.2.

dowolnymi znajduje zawsze co

Zmienna (skokoWll)-tozmiel1l1tl, kt6ta ll1oz.e

zmienneJdysktetnej', b poc
t6znica. Póiniar jakiej-
sprawia, staje

W kolumnie (5) tabeli 6.2. znajduje proporcja stanowi zapisana w ko-


lumnie (4) skumulowana dla próby.
Aby z kolumny (4) przez
próby w ostatnim wierszu kolumny (3). Dla wyniku 28
ta proporcja to 24/50=0,48. ona traktowana jak
wylosowania z próby osoby z wynikiem równym lub danego

Do tego miejsca wszystkie obliczenia wykonywane na bazie


empirycznych wyników z próby. Nie one z nieliniowymi
Oznacza to, proporcje z kolumny (5) odzwier-
z kolumny (2). Jednak nOffi1alizacja prawie zawsze
powoduje Zachodzi ono na tym etapie procedury, który
w tabeli 6.2. zaznaczony jest Po jej lewej stronie zapi-
sany jest realny obraz wyników w próbie, a po prawej obraz teoretyczny
normalizacji.
W kolumnie (6) zapisane Zi
z kolumny (5) w teoretycznej dystrybuancie normalnego. Dystrybuanta
to funkcja, która dla podanego nasilenia cechy zwraca prawdopodobiellstwo
tego, z populacji wylosujemy o takim nasileniu cechy lub
szym. dystrybuanty jest skumulowanym.
W procedurze normalizacji to ze skumulo- 211
Andrzej Rynkiewicz

która w tabeli 6.2. zapisana jest w kolumnie (5).


Na podstawie tablic dystrybuanty normalnego w
do statystyki
skumulowane, mu na-
silenie cechy. ono przedstawione w postaci Zj, a w postaci
wyniku znormaliilOwanego.

•. . • ·S8\Myn i1u · ·
. •
WyWkó\M.

Warto wyniki znormalizowane wyznaczane na podstawie


obserwowanych w próbie frekwencji. Na podstawie charakterystyki dystrybuan-
ty wiadomo, wynik znormalizowany równy prawdopo-
skumulowanemu 0,5. Zostanie on przypisany ta-
kiemu wynikowi surowemu, którego skumulowana
równa w próbie. Ten wynik surowy to mediana.
Innyl1Ji wynik znonnalizowany jest zawsze równy medianie wyni-
ków surowych. W specyficznych sytuacjach wy-
nik znonnalizowany nie równy wynikowi surowemu.
tak wtedy, gdy wyników surowych nie z
a wtedy, gdy wyników surowych nie symetryczny. W przy-
padku normalizacji zawsze trzeba z tym, w konsekwencji dostanie
nonnalny, ale niekoniecznie dopasowany do rzeczywistych
wyników surowych. takich o mniejszym lub nie-
dopasowaniu pokazane na rys. 6.10.

212
6. Jakich informacji o osobie badanej dostarcza testowanie?

25

!}
!. 15

al 10

30

i' 25

b)
!20
·u
'3" .
c:
1110 .

1
1·1,6
>5 O,tl5
Ci'
0.40

i'20 0.35 i
<:;:.

li

i
0,30 ..

c)
'c>
15,
'0.26 'm
'3 020
10
0,15
...
S 0, 10 1
0,05 ; .

Rysunek 6.10. empiryczne wyników surowych (s/.upki) o prawie nor-


malnym (a), (b) i (c) oraz im wy-
ników znormalizowanych (linia). Pod wykresem podane wyniki surowe oraz
im wyniki znormalizowane, Na lewej osi pionowej zaznaczone liczeb-
poszczególnych wyników surowych a na prawej dla
wyników znormalizowanych (linia). Dolna pionowa na wykresach pokazuje
dla a górna dla (linia)

Na rys. 6.10. której nie zawiera tabela 6.2. Jest to za-


znaczone na prawej osi pionowej uzyskania
wyniku znormalizowanego. na wykresie w a) rys. 6.10. wynikowi
surowemu 5 odpowiada 22 (lewa pionowa), to w pozo-
wyników odpowiada mu wynik znormalizowany z=O. Jest tak dlatego,
wynik surowy 5 stanowi zbioru wyników. W tablicach
du normalnego (funkcja lub krzywej znormalizowanej)
wynikowi znormali- 213
Andrzej Rynkiewicz

zowanemu z==O. Ta to ok. 0,39. W podobny sposób wyznaczo-


ne dla wyników. Na ich podstawie
wykres liniowy na rys. 6.10. Rysunek ten pokazuje dopasowanie
wyników surowych do odpo-
im wyników znonnalizowanych (linia).
Na rys. 6.10. najlepsze dopasowanie widoczne jest na wykresie (a).
Jest to przypadek najkorzystniejszy, bo wyniki surowe w próbie
prawie normalny. Normalizacja stanowi wtedy tylko nieznaczne
obrazu wyników znormalizowanych (z=O) jest idealnie
równa wyników surowych (x=5).
pienia poszczególnych wyników znormalizowanych do liczeb-
dla odpowiednich wyników surowych. Np. w a) rys. 6.10. wynikowi
surowemu równemu 5 odpowiada
w znormalizowanym (linia) oraz w
empirycznym temu wynikami znonnalizowanymi
prawie idealnie obraz przedstawiony w postaci
wyników empirycznych.
Dppasowanie wykresów nie jest natomiast takie dobre w przypadku opi-
sywanym w b) rys. 6.10. Wyniki surowe tutaj prawo-
Oznacza to, w próbie wyników niskich
wysokich. Przyczyny takiego zjawiska test
jest zbyt trudny, to osób tylko stosunkowo
zadania, a nie poradzi sobie z kwestionariusz zawiera pozy-
cje do spraw wstydliwych, to osób
oporem lub i odpowiedzi "NIE",
tym samym wyniki niskie. W przypadków wyników
pojawia jako konsekwencja w konstrukcji testu lub w doborze pró-
by nonnalizacyjnej. ale raczej rzadka, jest jednak sytuacja, w której
wyników w próbie odzwierciedleniem rzeczywistego roz-
zmiennej w populacji. takiej zmiennej jest
w koncepcji PEN Hansa Eysencka, mierzy przy popularnego
kwestionariusza EPQ-R.
Gdy wykonuje wyników surowych o
(jak na rys. 6.10., b», to wyników znormalizowanych rów-
na medianie wyników surowych, ale nie równa ich W
z tym wyników znonnalizowanych nie
proporcjonalne do odpowiednich wyników surowych. Na
znonnalizowanym (linia) najbardziej prawdopodobny jest wynik równy
(z=O), a na empirycznym najliczniejsze wyniki równe modalnej
(x=2). W konsekwencji na podstawie nonn diagnosta uzna za typowy wynik,
214 który w rzeczywistym odniesienia wcale typowy niejest.
6. Jakich informacji o osobie badanej dostarcza testowanie?

Efekt jest jeszcze silniejszy w sytuacji zilustrowanej w


c) rys. 6.10. Przedstawiony jest tu wyników
surowych. Powstaje on gdy próba nie jest jednolita pod
istotnego dla mierzonej zmiennej czynnika. to np. próba
prawie z dzieci 7-letnich i 14-letnich. przedmiotem pomiaru
inteligencja, to oczywiste jest, 7-latkowie jej poziom
14-latkowie. Lewy empirycznego w c) rys.
6.10. odpowiada poziomowi inteligencji dzieci 7-letnich, a pra-
wy poziomowi inteligencji dzieci 14-letnich. konstruktor
testu powinien na tej podstawie próby na dwie podgrupy we-
wieku, bo wiek dzieci z oczywistych ma olbrzymie znaczenie dla
mierzonej inteligencji.
Normalizacja wyników surowych O daje
znaczne niedopasowanie norm do obrazu znor-
malizowanego (z=O) odpowiada w tym przypadku empirycz-
nego (x=5), bo jest tutaj symetryczny, ale prawdo-
wcale nie proporcjonalne do Na podstawic norm
(wykres liniowy na rys. 6.10, c)) diagnosta uzna za typowy dla populacji
wynik surowy 5, któremu przypisano z=O. Natomiast
z rysunku wynik ten jest jednym z naj rzadszych w próbie.

6.2.4. Skale znormalizowane


Wyniki znormalizowane w postaci jednostek Zi czasem niewygodne
w Po pierwsze dlatego, z oznaczanymi w ten sam sposób wy-
nikami wystandaryzowanymi. nimi jest zasadnicza i
Po drugie, wyniki znormalizowane ze
znakiem ujenmym. Gdy w tej postaci nasilenia cechy,
to nasilenie jest mniejsze od zera. Nie jest to wielki bo
do takiej konwencji ale u nmiej wprawnych diagnostów
w takich sytuacjach mylne ujemne nasilenie cechy
jest gorsze dodatnie. Po trzecie, wyniki znormalizowane
bardzo Paradoksalnie to ich bo
wyników w tym przypadku wcale nie odzwierciedla po-
miarowych. Efekt mniej tak, próbowali
przedmiotu "na oko", wynik w mikrometrach. Uzasadnione jest
w przypadku testów psychologicznych jednostki pomiarowej.
Z opisanych powodów, autorzy testów na przed-
stawienie norm testowych w postaci tzw. skal znormalizowanych. Zakres takich
skal zwykle zaczyna od zera lub jedynki. Ich jednostki prze-
a Z grubsza
obejmuje taki sam zakres wyników znormalizowanych, ale ten 215
Andrzej Rynkiewicz

zakres dla skal (np. pojedyncza jednostka skali znor-


malizowanej wyniki znormalizowane od z=0,5 do z=I). Bez
problemu dowoh1Y wynik znormalizowany podany w jed-
nostkach Zj na i odwrotnie. Jest to
nie liniowe i nie zmienia wyników.
Jednostki skali znonnalizowanej, niepodzielne dia-
gnosta decyduje na stosowanie takiej skali, to powinien jej
za W konsekwencji sens tutaj ma tylko
liczbami Wyników w ze skal znormalizowanych nie
w
Dalej przedstawiona jest charakterystyka najpopularniejszych skal znormali-
zowanych.

6.2.4.1. Skala staninowa


Skala ta ma zakres od l do 9 - jej nazwa (ang. standard nine).
skali zawsze wypada w jej a dla skali staninowej jest równa
5-tej staninie. Odchylenie standardowe skali wynosi 2, tak pojedyncza sta-
nina ma odchylenia standardowego. Na tej podstawie
granicom staniny im wyniki znormalizo-
wane (rys. 6.11.).

..
z -1,75 -1,25 -0,75 -0,25 J,0,25 0,75 1,25 1.+5
stan/na 2 3 4 5 6 1 7.t.."._."
1__8 1 9 w ••• ___ . . __ • • __

O,5z O,5z

Rysunek 6.11. Skala staninowa

W innym miejscu tego za uzna-


je wyniki w jednego odchylenia standardowego od
Na skali staninowej nie da jednoznacznie takiego
on staniny od 3 do 7 - wtedy wyników
zakres nie od -lz do + lz, tylko od -1,25z do + l ,25z. Inna
to staniny od 4 do 6 i wtedy zakres odpowiednio mniejszy od -0,75z do
+0,75z. Decyzja, z opcji w tym przypadku do diagnosty.
jednostki skali, a staniny l i 9 otwartymi.
Wszystkie wyniki oddalone od o 1,74z w lewo zaliczamy do
l staniy, a wszytkie oddalone o 1,75z w prawo do 9 staniny. Zatem za-
kres skali staninowej, czyli zakres, w którym skala jest w stanie dwie
osoby o nasileniu cechy, obejmuje wyniki znonnalizowane od z=--I,75
216 do z=I,75.
6. Jakich informacji o osobie badanej dostarcza testowanie?

6.2.4.2. Skala stenowa


Skala ta ma zakres od 1 do la (ang. standard ten). Odchylenie standardo-
we podobnie jak w skali staninowej wynosi 2. natomiast zlokalizowana
jest w skali, a stenem 5 i 6 (rys. 6.12.).
zapis, skali stenowej wynosi 5,5. Jest to
jednak tylko oznaczenie statusu liczby, bo
jednostki skal znormalizowanych niepodzielne i w tym przypadku
nie interpretacji. Co granica stenami ma tylko znaczenie
teoretyczne. Nie ma takiego wyniku, który stenami.
wynik musi do stena. Zgodnie z która zosta-
nie przedstawiona wynikowi znormalizowanemu z=O, a wynikowi
zostanie przypisany 6 sten.

z -2 -1,5 -1 -0,5
; 0,5 r .. ..
1z. 2 steny

I I I I
sten 2 3 4 5
O,5z 0,5z

Rysunek 6.12. Skala stenowa

W przypadku skali stenowej bardzo jest


cy wyniki typowe - od 4 do 6 stena. Takie wyniki w diagnozie psychologicznej
uznane za
Podobnie jak w skali staninowej, jednostki, a steny 1 i 10,
otwartymi. W z tym skala stenowa wyniki osób,
nie oddalone od bardziej o 2 odchylenia standardowe.

6.2.4.3. Skala tenowa


Skala tenowa ma bardzo zakres i bardzo i
Jest to skala 100 punktowa (od 1 do 100). jest równa 50 tenowi.
50 i 51 tenem, ale
pojedynczego tena jest tak sobie na
zapis Odchylenie standardowe skali wynosi 10.
Tak pojedynczy ten to o równej O,lz. Jak ob-
zakres obejmuje wyniki od -5z do +5z. Prawdopodobnie nie
istnieje test psychologiczny, który w stanie osoby o wynikach
od bardziej o 3 odchylenia standardowe. Osób o tak skraj-
nych wynikach (bardzo niskich i bardzo wysokich) jest w populacji zaledwie
0,26%. napotka na ulicy jest raczej
psycholodzy z osobami o bardzo nasileniach cech
(np. osoby lub osoby szczególnie inteligentne), ale do 217
Andrzej Rynkiewicz

badania takich osób konstruuje specjalne testy do po-


pulacji generalnej. Tak skala tenowa skonstruowana jakby na wyrost
iw jej zakres nie zostaje wykorzystany.
nie ma sensu stosowanie skali tenowej w przypadku testów,
w których punktów surowych jest mniejsza 60. W
cym tylko 40 ocenianych na skali O-l, osoba maksymalnie
40 punktów. pod realny zakres skali od 20 do 80 tena,
jednostek w takim przypadku niewykorzystana.
wyników na tej skali ma zakres od 40 do 60 tena.
Podobnie jak w innych skalach, najbardziej skrajne teny, czyli l i 100, prze-
otwartymi, ale przy skali o tak zakresie nie ma to
praktycznego znaczenia.

lz = 10 tenów
! i
% -4.9 -2 -1
:
O
,+,. , r.-,.
,
2 4,9
i I II I II III IIIII11111 i
ten 1 10 " 30 60 90 100

-0.1
I

O
I
0,1
I
! 64 l 65 !
•••. "•••• ".... •.•••••••••••• +.
1/102 l/lOr
50 51

Rysunek 6.13. Skala tenowa

6.2.4.4. Skala tetronowa


rzadko stosowana w praktyce skala o zakresie od O do 20. Jej
jest równa 10 tetronowi, a odchylenie standardowe wynosi 4. Zakres
obejmuje wyniki znormalizowane od -2,5z do +2,5z. wyników prze-
to te trony od 6 do 14 nieco szerszy zwykle lub
od 7 do 13 nieco

r2
C"1 __ M .......
lO
..... '"coN '".....
z
N N ..... ""ej ej '"ej
tetron o
I
1
SS; 5
I
6
I
7
I
8
I
9 10 11 i 12 i 13 i 14 15 19 20
....... ........
1/4z 1/4z

Rysunek 6.14. Skala tetronowa


6. Jakich informacji o osobie badanej dostarcza testowanie?

6.2.4.5. Iloraz inteligencji


Jest to skala o 100 i odchyleniu standardowym 15. Jej nazwa i para-
metry charakter historyczny. ilorazu inteligencji na po-
XX wieku. je niemiecki psycholog Wiliam Steru, modyfi-
mniej poziomu inteligencji przez
Alfreda Bineta. Oryginalna rozwojowy iloraz in-
teligencji zapisana jest w równaniu 6.21.

wiek 100
IQ = . kb' l .
WIe 10 oglczny (6.21)

Wiek uzyskiwano w wyniku badania testem. Wynik podawany


nic w punktach, lecz w latach i poziomowi wyko-
nania poziom inteligencji dziecka typowy w jego gru-
pie wiekowej, czyli typowy dla grupy dzieci starszych, to iloraz inteligencji
100. Gorszy poziom wykonania testu u
iloraz inteligencji mniejszy 100. Zatem IQ= 100 typowy w odnie-
sieniu do grupy poziom rozwoju intelektualnego.
Dzisiaj oryginalnego ilorazu inteligencji raczej nie stosuje, bo staje on
w przypadku osób w wieku ok. 18 lat. U osób
wiek biologiczny czas jednostajnie wzrasta, ale poziom inteligencji, a
wiek nie tak szybko. Iloraz inteligencji w oryginalnej postaci znaj-
duje zastosowanie jedynie w testach rozwojowych, czyli testach do ba-
dania poziomu rozwoju funkcji (poznawczych, motorycznych) u
dzieci. Nazywany jest wtedy ilorazem rozwoju. W testach przeznaczonych dla
starszych dzieci i w miejsce rozwojowego ilorazu inteligencji stosuje
dewiacyjny iloraz inteligencji. Jest to skala znormalizowana o charakterze
podobnym do innych skal omawianych w tym rozdziale, ale para-
metrami.
Jednostka ilorazu inteligencji ma jeszcze jednostka
skali tenowej. odchylenie standardowe skali jest równel5, to jednajednost-
ka ilorazu inteligencji obejmuje o 1/15 odchylenia standar-
dowego (co daje w 0,067z). Zakres jest olbrzymi, bo
skala ilorazów inteligencji jest w stanie osoby o wynikach
od nawet o 6 standardowych. W praktyce jednak tak skrajne
sektory skali nie wyników to ilorazy
inteligencji od 85 do 115.

219
Andrzej Rynkiewicz

1z = 15 jednostek
... _------ --- _____!
-2 1 2
IQ 70

I , . I I
! 110 i 111 i
•• -.- •••••. -.............
·1/152 . 1/15z .
99 100. 101

Rysunek 6.15. Iloraz inteligencji

Tabela 6.3. Podsumowanie parametrów najpopularniejszych skal znormalizo-


wanych. W ostatniej kolumnie zapisany jest wzór wyniki
znormalizowane na jednostki danej skali
skala odchylenie standardowe wzór przeliczania
staninowa 5 2 5+2z
5,5 2 5,5+2z
ten owa 50 10 50+10z
tetronowa 10 4 10+4z
iloraz inteligencji 100 15 100+15z

6.2.4.6. Przeliczanie wyników na skale znormalizowane


Procedura normalizacji wyników surowych omówiona wczesme]
i przedstawiona w tabeli 6.2. W ostatniej kolumnie tabeli zapisane wyniki
znormalizowane, które na
W tym celu trzeba wzory przeliczania zapisane w ostatniej kolum-
nie tabeli 6.3. Jednostki skal znormalizowanych niepodzielne i dlatego wyniki
do liczby 2 pokazuje
tego rodzaju

PRZYKLAD2
Przeliczanie wyniku znormalizowanego na (na podstawie wzoru
z tabeli 6.3.)
wynik surowy osoby=27
wynik znonnalizowany=-O,61

ten"" 50+ l 0·( -0,61) ==43,9 44


Na podstawie norm wynikowi surowemu 27 przypisanyzostanie44 ten.

Do wyników znormalizowanych na wykorzy-


220 przedstawione w tym rozdziale "drabinki". Jest to sposób w przy-
6. Jakich informacji o osobie badanej dostarcza testowanie?

padku skal o staninowej (rys. 6.11.), stenowej (rys. 6.12.).


Pozwala on proces i
z wynik znormalizowany jest rów-
ny granicy dwiema jednostkami skali, zaliczamy go do jednostki
szej. Oznacza to, jednostki skal znormalizowanych to
od Tylko w takim przypadku za "drabinki" da taki
sam rezultat jak przy pomocy wzorów z tabeli 6.3. tego rodzaju poka-
zuje 3.

PRZYJ{LAD3
Przeliczanie wyniku znorlUalizowanego na sten (na podstawie "drabin-
ki" Z rys. (i.12.)
wyniksurowyosoby=21
"Yynik .' ' •. '
wynikten znajduje wprzedziale oznaczonym na rys, 6.12.jako 4 sten
Na podstawie norm wynikowi surowemu 21 przypisany zostanie 4 stert.

Tabela 6.4. Przeliczanie wyników znormalizowanych z tabeli 6.2. na jednostki skal znor-
malizowanych

z staniny steny ten y tetrony IQ


-2,33 1 1 27 1 65
-1,65 2 2 34 3 75
-1,13 3 3 39 5 83
-0,61 4 4 44 8 91
-0,05 5 5 50 10 99
0,47 6 6 55 12 107
0,92 7 7 59 14 114
1,34 8 8 63 15 120
1,75 9 9 68 17 126
2,33 9 10 73 19 135

wyniki znormalizowane na jednostki dowolnej ska-


li znormalizowanej, to zwykle wybiera lub dwie najbardziej odpowied-
nie. tu dwoma kryteriami. Po pierwsze, istotna jest rozdziel-
skali. Im jednostka jest mniejsza, tym Zatem skale
IQ i tenowa a skale stenowa i staninowa - Po dru-
gie, pod bierze zakres skali. zakres skale
IQ i tenowa, bo osoby o wynikach od nawet
o 4 odchylenia standardowe. Skale staninowa i stenowa 221
Andrzej Rynkiewicz

nicowania wyników zlokalizowanych nie dalej 2 odchylenia standardowe od


Oba te parametry skal znormalizowanych powinny dopasowane do
parametrów skali wyników surowych testu. A skale o wysokiej rozdziel-
i szerokim zakresie stosuje wtedy, gdy wyniki surowe
i szeroki zakres. Jest tak zwykle w testach, które
z liczby pozycji. jest, by osoby badane w nich
wyniki z zakresu (np. od O do 300 punktów) oraz
lub prawie ten zakres realizowany. Nie ma bowiem sensu stosowanie
skali tenowej w o zakresie punktów surowych od O do 300, gdy
osób w uzyskuje wyniki w zakresie od 150 do 200.
Konsekwencje zastosowania skali tenowej w o zakresie wyników
surowych w tabeli 6.4. - tylko niektóre jednostki skali tenowej tu
wykorzystane. Nie jest to ale w tym przypadku
skala stenowa lub staninowa o mniejszej
Testy o wyników surowych ale nic
szerokiego zakresu sobie test inteligencji, któ-
ry ma bardzo ustawionych w od do naj-
trudniejszego, ale w kolejnych nicznaczne. Taki test
raczej w praktyce zostanie ona prawdo-
podobnie zatarta przez pomiaru), ale niezbyt szeroki zakres. Osoba, która
tylko kilka i osoba, która prawie wszyst-
kie zadania pod inteligencji raczej Aby ten test
i i zakres, musi z liczby
zadali znacznie
Tcsty o ale nie szerokiego zakresu
Za test inteligencji tylko
z trzech to zadania o ekstremalnie to test ten
(bo tylko osoby
poziomem inteligencji), ale szeroki zakres. Gdyby
zadania wtedy test i i
zakres.
gdy testu jest lub jego zakres
jest szeroki, wtedy IQ lub Gdy natomiast oba
te parametry i najwygodniejsza skala stenowa lub
staninowa.

6.2.5. Normy centylowe


Normalizacja wyników surowych jest sensowna tylko wtedy, gdy wyniki te
co najmniej do normalnego. Gdy wyników
z jest od normalnego, albo gdy wyniki testu nie
222 interpretowane w odniesieniu do populacji (np. wyniki egzaminu kwalifika-
6. Jakich informacji o osobie badanej dostarcza testowanie?

cyjnego), wtedy jest zastosowanie norm centylowych. W psychometrii


z korzysta nie z tradycyjnie rozumianych centyli, tylko z jednostek,
które centylowymi. W trosce o tenninolo-
giczny obie te skale zasadnicze nimi.
Klasyczne centyle to rodzaj tzw. kwantyli, czyli powszechnie
w statystyce które szereg wyników w równych
proporcjach. Centyle taki szereg na 100 równych pod liczebno-
a rozstawione co l % wyników. Pierwszy centyl to wy-
nik o numerze równym l % próby, drugi centyl to wynik o numerze
równym 2% próby itd. Istota klasycznych centyli zilustrowa-
na w 4.

. l OOró""nych z tych

. •.
muje 10/0 ""yników surowych. O i 100, które
pqO!5%wyników.

4
.• .
)wynikqw •. t:stoWych. z. . ljczebno-
. ·co
Q itd, Wyniki cent'1:-
•. . zaznaczone.
1':,":-, ,':'_.' _"_'/_, : ;':' --,<:::- ,:",,:<c,.,_;<;,,;. ,,;', ". ,:_,', - :;'1'

aJkftZrur ód· 0.d6 360


tyli) .

Z 4 wynika, liczba punktów do uzyskania w te-


jest 100 4a), wtedy nie wynikowi od-
centyl i fonnalnie niektóre wyniki centylami.
natomiast wyników testowych jest mniej 100 4b), wtedy niektórym 223
Andrzej

wynikom jeden centyl. W takim przypadku wyniko-


wi przypisuje z mu centyli. Na tej podstawie wy-
nikowi 2 z 4b przypisany zostanie 2 centyl. Klasyczna skala centylowa
zaczyna od l centyla, a 100 centyl to wynik w próbie.
Jak to wynika z opisu, centyle w klasycznym pojedyn-
czymi wynikami, co w warunkach opisywanie osób
badanych testami. Przy odrobinie wprawy do tej ich przy-
ale o wiele wygodniejsze w zastosowaniu skale, których jednostki
wyników. Taki charakter opisywane skale znor-
malizowane oraz tzw. centylowe, które
W tabeli 6.5. pokazany jest sposób obliczania centylowych dla fik-
cyjnych danych, których przedstawiona w 4a.

Tabela 6.5. Wyznaczanie centylowych

(1 ) (2) (3) (4) (5)


wynik
proporcja
surowy skumulowana centylowy
8 2 2 0,005
1
9 1 3 0,008
12 4 7 0,018
14 1 8 0,020 2
18 1 9 0,023
19 2 11 0,028
3
21 1 12 0,030
25 2 14 0,035
4
29 3 17 0,043
31 1 18 0,045
5
35 3 21 0,053

289 5 400 1,000 100

W tabeli 6.5. kolumny (1), (2) i (3) wyznaczane tak samo, jak w tabeli 6.2.
W kolumnie (4) obliczona jest proporcja skumulowanej
próby skumulowana podzielona przez próby). W ko-
lumnie (5) wyznaczone centylowe, a proporcja z kolumny (4)
przcz 100. w kolumnie (5) powinny do
liczby W ten sposób one charaktem przedzia-
co oznacza, jeden wynik. Warto
224 proporcja w kolumnie (4) tabeli 6.5. mniej 0,005, to wte-
6. Jakich informacji o osobie badanej dostarcza testowanie?

dy zgodnie z zasadami jej centylowy O.


Obejmuje on nie l %, tylko 0,5% wyników surowych. Tak samo jest
z centylowym 100, który przypisywany jest wynikom surowym
co najmniej 0,995. A skala
centylowych, w do klasycznych centyli, ma 101 jednostek. Jej
odpowiada medianie wyników surowych.
centylowe zasadnicze z opisywanymi
skalami znormalizowanymi. Nie ma tu zastosowania odchylenie standardowe,
skala centylowych ma charakter procentowy. Oznacza
to, osoby ocenia na podstawie jej lokalizacji w
szeregu. na wynikowi osoby odpowiada 92 centylowy,
92 procent osób w próbie wyniki takie same,
jak ta osoba, lub na jednostki
standardowych przy odpowiednich tabel lub programu staty-
stycznego, ale ma to sens tylko wtedy, gdy wyników surowych jest rze-
normalny.
Skala centylowych ma charakter ccnty-
lowe jak rangi, bo dwoma
rzadkimi wynikami w próbie (np. bardzo niskimi) a wyni-
kami (typowymi) ten efekt warto na
do tabeli 6.2. W tabeli tej nie ma co prawda
policzonych centylowych, ale bardzo je
proporcje z kolumny (5) przez 100. wtedy, wynikami
24 i 25 z dolnego skali wynosi 6 centylowych, a
dzy wynikami 27 i 28 ze skali to 24 centylowe. Trudno
centylowe jako w zakresie skali
wyników. Efekt ten pokazany jest na rys. 6.16.
Skala centylowych nie wyników.
Jest to konsekwencja jej procentowego charakteru. na-
wet w przypadku wyników o bardzo dziwacznych bez
na w interpretacjach. Skala centylowych stanowi alter-
dla skal znormalizowanych w przypadkach, gdy wyników su-
rowych nie jest 'normalny. Sytuacja tego rodzaju gdy próba
normalizacyjna jest i nieprzypadkowa. Gdy nauczyciel chce
konkretnego ucznia na tle klasy szkolnej, to powinien raczej
centylowymi, bo trudno wyników egzaminu
w klasie do normalnego. Podobnie, gdy test psy-
chologiczny wykorzystywany jest do selekcji i chodzi jedynie o ustalenie miejsca
kandydata innych pod mierzonych W obu tych
przypadkach odniesienia dla interpretacji wyników jest próba,
a nie populacja. Czasami nonny tego rodzaju, gdy nie na podsta-
wie reprezentatywnej próby, nazywa normami lokalnymi. 225
Andrzej Rynkiewicz

z
-3
!
1
,
·2

2 3
·1

4
i
5
,6 O

! 7
i
8 9
2

! 10
3
steny
i !i 1
i I I I I I I I staniny
1 2 3 4 5 6 7 8 9
: : : i I

i,f i i I: I i i I: i i i i: i I I i! I i
o 2 4 6 8 10 12 14 16 18 20 tetrony
li I i Iii I li h Iii li li II i I i I i I i li iii i i .. IIIII 1111' li li i i li II
20; 30 40 50 60 70 80 teny
lilii .nil ltiil II i I n.'lliliti liii I I iiln i lilii iii iI li ';'111 III 111111111
55 70 85 100 130115 145 IQ
! i l i iillliiiillililliHlililiiiliilliiiiu*mWiII!illiilliiililli:l!iiililfi i, i j i przedziBly
2 16 50 84 98 centy/owe

Rysunek 6.16. Porównanie naj popularniejszych skal znormalizowanych i skali przedzia-


centylowych z normalnym.

jednak i tak, centylowe zastosowane do sfor-


interpretacji wyniku testowego na tle populacji. nimi
popularne skale znormalizowane, gdy oczekiwany cechy w populacji nie
jest nonnalny. Jest to raczej rzadka bo tylko niewiele cech psy-
chicznych przyjmuje na tyle nie zaleca stosowania wobec
nich normalizacji. Ponadto przez wielu diagnostów skali przedzia-
centylowych jest prosta i intuicyjna interpretacja. Wnioski na
podstawie centylowych bardzo na informacje
zwrotne. one nawet dla osób bez specjalistycznego
innymi z tego tak popularne siatki centylowe, czyli normy
na centylowych i dodatkowo przedstawione w postaci gra-
ficznej.

Zalecana literatura
Anastasi A., Urbina S. (1999). Testy psychologiczne. Warszawa: Pracownia Testów
Psychologicznych PTP. (Str. 76 - 108).
J. (1996). Metodologia psychologicznych. Warszawa: PWN.
226 (Str. 539-547).
6. Jakich informacji o osobie badanej dostarcza testowanie?

Ferguson G.A., Takane Y. (1999). Analiza statystyczna w psychologii i pedagogice.


Warszawa: PWN. (Str. 504-515).
Hornowska E. (2005). Testy psychologiczne. Teoria i praktyka. Wydawnictwo Scholar.
(Str. 128-157).
Magnusson D. (1991). Wprowadzenie do teorii testów. Warszawa: PWN. (Wydanie 2:
str. 342-364).
Matuszewski A. (1984). Interpretacja formalna wyników w testach psychologicznych.
W: J. (red.) Wybrane zagadnienia z psychometrii i diagnostyki psycholo-
gicznej, str. 47-72. Wydawnictwo UAM.
Zawadzki B. (2006). Kwestionariusze - strategie i procedura konstruowa-
nia. Warszawa: Scholar. (Str. 258-264).

Zadania

1.
Podaj wystandaryzowane wyniki wynikom surowym 12 i 18, gdy
w próbie wynosi 14, a odchylenie standardowe 4.

2.
podane wyniki surowe na wyniki znormalizowane oraz na jednostki skali
stenowej, staninowej, tenowej, tetronowej, ilorazów inteligencji.

wyniki 1 2 3 4 5 6 7 8 9 10
3 8 10 13 17 16 13 10 7 3

3.
podane wyniki na centyle i narysuj wykres
wyniki 10 I 11 12 13 14 15 16 17 18 I 19
5 I 11 15 20 16 12 9 6 4 I 2
4.
Przelicz wyniki podane w tenach na staniny, steny i tetrony.
I teny 125 I 38 145 I 50 151 159 162 166 170 173

5.
Przelicz wyniki podane w jednostkach ilorazu inteligencji na staniny, steny i te-
trony.
IIQ 165 173 182 199 1107 1115 1121 1135 1140 1141

227
Andrzej Rynkiewicz

6.
Podaj granice 3 staniny w jedno stkac h ilorazu inteligencji i w te-
nach.

7.
Podaj granice 7 stena w jedno stkac h ilorazu inteligencji i w tenach.

8.
Jaki procent osób z teoretycznej o norm alnym cechy uzysk a
wynik znonn alizow any równy
a) 2 staninie;
b) 5 staninie;
c) 8 staninie;
d) 3 stenowi;
e) 6 stenowi;
f) 9 stenowi?

Odpowiedzi do
1. Z12=-{},5; ZlS=1.

2.
wyniki 1 2 3 4 5 6 7 8 9 10
staniny 1 2 3 4 5 5 6 7 8 9
steny 1 3 4 4 5 6 7 8 9 10
tetrony 1 4 6 8 9 11 13 14 16 19
teny 28 35 40 44 48 52 56 60 65 72
IQ 67 78 85 91 97 103 109 116 123 133
3.
wyniki 10 11 12 13 14 15 16 17 18 19
centyle 5 16 31 51 67 79 88 94 98 100
4.
teny 25 38 45 50 51 59 62 66 70 73
staniny 1 3 4 5 5 7 7 8 9 9
steny 1 3 5 6 6 7 8 9 10 10
tetrony O 5 8 10 10 14 15 16 18 19

228
6. Jakich informacji o osobie badanej dostarcza testowanie?

5.
IQ 65 73 82 99 107 115 121 129 135 141
staniny 1 1 3 5 6 7 8 9 9 9
, steny 1 2 3 5 6 8 8 9 10 10
tetrony 1 3 5 10 12 14 16 18 19 20

6. Od 38 do 43 tena; od 81 do 89 jednostki ilorazu inteligencji.

7. Od 55 do 60 tena; od 108 do 115 jednostki ilorazu inteligencji.

8a. 0,106 - 0,040=0,066; 6,6%;


8b. 0,599 - 0,401=0,198; 19,8%;
8c. 0,960 - 0,894=0,066; 6,6%;
8d. 0,159 - 0,067=0,092; 9,2%;
8e. 0,691 - 0,500=0,191; 19,1 %;
8f. 0,977 - 0,933=0,044; 4,4%.
7. ETYKA TESTOWYCH

Ewa Witkowska
PSYCHOLOGII
UNIWERSYTET WARSZAWSKI

Celem tego jest prezentacja zasad


praktyki diagnozowania psychologicznego na podstawie metod standardow
ych,
tak, aby po jego lekturze Czytelnik dobrze których musi
odpowiedzialny testu. Oprócz strony etycznej stosowania testów,
która jest kluczowa dla wykonywania zawodu psychologa-diagno-
sty, do prawnych, z tym obszarem pracy.
Szczególnie nam na tego, w gruncie rzeczy "prawa osób
badanych" oraz psychologów - testów", to dwie stro-
ny tej samej monety.
Panuje powszechna zgoda co do tego, zawód psychologa jest zawodem
szczególnym (por. Chyrowicz, Poznaniak i Toeplitz-Winiewska,
2008). Psychologowie z powierza im niejednokrotnie poufne
infonnacje. Jest oczywiste, psycholog powinien zatem bardzo skrupulat-
ny w przestrzeganiu zasad etyki zawodowej, tak aby nie osób, które
mu Oprócz swojego kompasu etycznego, który doradza,
w jaki sposób w sytuacji,
punkty odniesienia. nimi: Ustawa z dnia 8 czerwca 2001 r. o zawodzie psy-
chologa i zawodowym psychologów, Kodeks Etyczno-Zawodowy
Psychologa Polskiego Towarzystwa Psychologicznego, oraz - w odnie
sieniu do
wykorzystania testowych - Standardy dla testów stosowanych w psy-
chologii i pedagogice (2007). Dokumenty te zarówno
jak i statusem. Ustawa jest aktem prawnym, zatem psycholog jest for-
malnie zobligowany do przestrzegania jej zapisów. Kodeks Etyczno-Za
wodowy
Psychologa Polskiego Towarzystwa Psychologicznego to spis zasad deont
ologii
zawodowej, do przestrzegania którego formalnie
kowie Towarzystwa. Z kolei Standardy dla lesIów stosowanych w psych
ologii
i pedagogice (2007) to spis rekomendacji
standard"
testów. Dodatkowo, test psychologiczny jest
utworem w rozumieniu ustawy Prawo autorskie i z tego
podlega ochronie.

7 .1. Prawa osoby badanej i psychologa-diagnosty


Tak jak ze na zawodu psychologa, kwestie
230 etyczne przy jego wykonywaniu szczególnie istotne. wykonywa-
7. Etyka testowych

nie zawodu psychologa tragiczne w skutkach - wy-


starczy sobie w której psycholog wyda pozwolenie na posia-
danie broni osobie, która takiego pozwolenia nie powinna.

Ametykatiskie· Towarzystwo· Psychologiczne (APA,Z003)


ne Osoby badanej. Na
. .. . . ..... .. . . . ..
a) . powinien testdokortkretllego·
.•. .•••••.•. .•. . . . • , . •. . . •.•.••..••..•. ,
test6'-Vy,
. . • p0'-Vinien •
...... . . ' .•.•. ••.. . . .••.••.. .•••.. . •. . • >i·•.. .•. •.•. . . . , . .• . . .• .• . . . . . . . . . . . . . . . .•. •· · •. ·. ·• ·....i . . . . . . . . . . . . ..
•.
kaneJ sytj)acji-;-rodzic()l11 padanych dzieAi)infonnacji o. ich pra i.·
. e)· ma badanym lub ich pmwnYl11opiekunominfonnacjiosposobie
•. .
• • · ·•·•· • · .· • •· •· · • ··.·.··.·.··.·.···.···.i . ······i • .• 'i
< .•..•.. i.··· •.•· .• ·... . . . . . . . . . . ..
1) • .·osobie badanej
.... . .. ... . . . . .. . . . . • . . • • . . . . •. . ....•. H •..•••••• •• • •••••.•••••••..•••••••••.•••> .... ·•.·..i . . . . . . . . . . .
TOWarzystwo . Psychologiczne
... . . .. . •.
a) ... .• iobiektywhie, . hiezaleZhieodwieku, .• llie-
. religii,prientacjiseksualnej· czy
..innychóech osobistych, . . ...•..... . . . .•••.•. . ..••.. . . . . . . . . . . .......
profesjonalne
9dP?Wiedt1ip!i. oraz. we wy spo-
sól:>, .i .....i . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..i.· . . . . . ....... . . . . . . . . . . . . . . . . . . . . . . . . . . :. . . ... . . . . .. . . . . . . . . . . . . . . .. . .
• (1.tstnej ··hlb pisemnej).
i •. czy .Jest . planowane
ich osobom trzecim) zgody na .w proce-
.•. •. . . . .•. . . . . .. . . . • .•. .• . •. .. . . . . . ..•. .• ...... ...... .... . ..... . . . . •. .•. .• ..i
stosownYl11 kiedyzostaoie.poddanadanej .proc
.cedurzediagnostyczn.ejorazkiedy temat swoich
riików, • • · · .· .· ·•·•·. •.•·•·· • .•· ••..••• · .· •.•.• · • •. •· .••• i;·. • . •. . . . . . . . ... .••. ..< ...............
e) .przez . .•
testu oraz zgodnie z

W sytuacji diagnozy psychologicznej, kwestie etyczne do


dwóch nierozerwalnie ze elementów - tego, osoba badana
ma w tej sytuacji prawa i psycholog jest do
zywania z wobec niej. Jako w procesie diagno-
stycznym psycholog zbiera i analizuje infonnacje, osoby
badanej, konieczne jest, to za badanego i w taki sposób,
który gwarantuje, informacje te nie w osób 231
Ewa Witkowska

Ponadto, osoba badana ma prawo dlaczego ma


poddana badaniu psychologicznemu, w jaki sposób przebiega proces diagno-
styczny, a z niego wnioski (por. in., 2008).
strony etycznej diagnozowania ustala w momencie zawierania
kontraktu diagnostycznego. zasady, których psycholog-diagnosta zo-
jest to: uzyskanie od osoby badanej zgody
na w badaniu, o zachowanie uzyskanych danych oraz
informowanie osoby badanej o uzyskanych wynikach.
na poziomie zasady etyczne w kontakcie diagnostycz-
nym do poszanowania badanego (por. in.,
2008).

7.2. Przygotowanie do diagnozowania


Odpowiedzialny testu to taki, który wie, czego w wyniku
cia konkretnego testu oraz jakim celom taka informacja
ma Zatem planujemy diagnozowanie konkretnego
problemu. uzyskanie odpowiedzi na zadane pytania diagnostyczne
wymaga zastanowienia, zanim zaczniemy kontakt z badanym.
czy wybrana przez nas metoda informacji
zgodnych z celem diagnostycznym, który sobie na czy
na podstawie wyników Skali inwentarza NEO-PI-R, znormalizo-
wanego dla populacji ogólnej poziom kandyda-
tów na Refleksja na temat tego, czy wybrany test jest
ze na to, czego chcemy o osobie badanej, jest
dopiero po poznaniu dodanego testu. Jego wni-
kliwa lektura powinna zawsze pierwszym elementem do dia-
gnozowal11a.
Ponadto, musimy czy na podstawie wyniku w
o innych nas zachowaniach badanego.
czy na podstawie wyniku o wysokim poziomie ekstrawersji u kan-
dydatów na przedstawicieli handlowych jaka efek-
ich pracy. I wreszcie musimy czy wybrany test
mierzy to, co nas interesuje oraz czy w stanie wyniki te-
stowe, co nie musi oczywiste w odniesieniu do osób badanych o specjalnych
potrzebach czy cechach (por. Standardy, 2007).
N przy tym badanie psychologiczne nie musi tym lepsze,
im informacji zbierzemy. o
celu i to on powinien nasz sposób za-
tem mamy na pytanie o problemów emocjonalnych u dzie-
Jasia, wiemy, nauka nie sprawia Jasiowi
232 problemów, to diagnozowanie go Inteligencji Wechslera dla Dzieci (por.
7. Etyka testowych

Matczak, Piotrowska, Ciarkowska, 1998) nie ma sensu. Niestety, takie


nieuzasadnione wykorzystanie tego testu jest czasem prakty-
psychologów w niektórych poradniach.
W przygotowywania do diagnozowania warto na
procedury badania testami psychologicznymi.
przeprowadzenie badania prostymi takimi jak Test Matryc Ravena
czy Kwestionariusz NEO-PI-R nie powinno nawet
psychologowi Jednak Skali Inteligencji
Wechslera, niejednokrotnie jednoczesnego sprawnego operowania
stoperem, prezentowania testowego (np. test we
zapisywania wyników testowych oraz utrzymywania kontaktu z oso-
nie jest (por. i Toeplitz- 2004). Wymaga
to starannego przygotowania oraz odpowiednich procedur.
temu jest zachowanie standardowych wyników badania.

7.3. Zawieranie kontraktu oraz zgoda na


w badaniu diagnostycznym
Podstawowym psychologa postawienie indywi-
dualnej diagnozy albo badania naukowe czy z testów psy-
chologicznych nie), jest uzyskanie od potencjalnego badanego/badanych
zgody na w badaniu. Aby
psycholog musi klienta (klientów) w
sposób o tym, jak diagnostyczne i co
w jego ramach Psycholog ma badanego z przebie-
giem procedury - z tym, ile zajmie czasu, jakie charakterystyki psychologiczne
przedmiotem diagnozowania, do jakiego rodzaju wniosków pozwoli
oraz w jaki sposób i komu prezentowane wyniki. Konieczne jest ustale-
nie z badanym (badanymi), ile planujemy ile czasu
de z nich, co podczas nich jakiego rodzaju informacje zwrotne
od nas na koniec. wprost osobie badanej,
ma prawo w dowolnym momencie z badania. Trzeba przy tym
oile mamy osobie
badanej, na czym diagnozowanie, to nie to w razie
do pokazywania oryginalnego testowego. W sytuacji,
gdy badany nalega na zapoznanie go z testowym przed badaniem,
jedyne co to mu podobny - na
planujemy z wykorzystaniem Formalnej Charakterystyki Zachowania
- Kwestionariusza Temperamentu (por. Zawadzki i Strelau, 1997), po-
badanie na udzielaniu odpowiedzi tak lub nie na
proste pytania typu: przychodzi mi zabranie najorum grupy. Jest to
233
Ewa Witkowska

stwierdzenie podobne do wy kor zys


tyw any ch w kwestionariuszu, ale
nie jes t to zac yto wa na poz ycj a tes jednoc:
towa.
Kwestie przez klienta zgo dy na
przepisy prawne. Formalnie w bad ani u tak
dia gno zow ani a lub badali. I
ukowych reguluje art. 12. Ustawy
o zawodzie psychologa i
wym psychologa, który stanowi, zawow
za psy cho log icz nych
osoby (klienta) lub grupy osób (kli
entów) pod mio t dl
gnozowania i psychologicznego. Za tem bra k zgo
nie tylko sum ien ie psychologa, ale dy na badan
konsekwencjami prawnymi. z
Podobnie kwestia udzielania informacji o uzy
ona regulowana nie tylko na poz iom ska nyc h wy nik ach - je
ie etycznym, ale pra wn ym . O zak res
informacji udzielanej osobie badane
j czy ust nik om mó wi art. 13. Ustaw.
w którym stwierdza Psycholog poinformuje klienta o cel
jego przebiegu, wynikach i sposob u
ie ich ora z powinien uzyska
planowanych Do dat kow o, ten
o ile wyniki ust aw y pre cyz uje ,
nie tylko do informacji klienta stosuj
Ustawy z dnia 29 sierpnia 199 7 r. o e przepis.
ochronie danych osobowych.
w prz ypa dku osób o ograniczonej
prawnych do
lub
daniu na w ba
opiekunowie prawni, któ rym i w prz
rodzice. Za tem w prz ypa dku pla now ypa dku dzieci naj
ani a w szk ole , pom im o
osoby
wó wc zas pod pra cow nik ów pla ców
ki, nie wystarczy jed yni e zgo da nau
czy cie la czy dyrektora, ale kon iec
uzyskanie zgody od rodziców zne jesl
z dzieci. W tym wy pad ku zgo da rod
czy opiekuna pra wn ego jes t klu czo zic2
wa z pow odó w formalnych. Jed nak
padku wszystkich osób bad any ch, w przy-
od tego, czy do
pra wn ych czy nie, diagnosta ma
pos zan ow ani a ich god-
teg o faktu jes t zap yta nia
samych zainteresowanych, czy
w przypadku w badaniu. Po dob nie jak
innego bad ani a diagnostycznego,
psycholog powinien najpierw w takiej sytuacji
bad any ch, w jak i spo sób bad ani e
dO' cze go wyniki oraz jak ich inf orm acj i zw
badani rot nyc h
na koniec,
w sposób dla oso by badanej. te kw est ie
Na koniec warto psy cho log pow ini en
sytuacji, gdy zgo da oso by badane ws zel kic h
j tylko poz orn ie jes t
Tego typu sytuacja
pod cza s gru pow ych , kiedy
ludzie tak nie och oty w nic h
im ale jes t
gdy
badanie. na
7. Etyka testowych

7.4. Tajemnica zawodowa


Jak pisano wykonywanie zawodu psychologa polega w
mierze na zbieraniu i analizowaniu informacji na temat prywatnego osób
badanych. Niejednokrotnie to informacje bardzo intymne, którymi osoba ba-
dana w wypadku nic z kimkolwiek i to, wyja-
wia je psychologowi, wynika z jej przekonania, utrzymane w tajemni-
cy. przy tym z punktu widzenia osoby badanej, informacja
o tym, jaki ma poziom inteligencji ogólnej czy ekstrawersji, niemniej
"prywatna", intymnego. O na nas
ku - zarówno moralnym, jak i prawnym - przestrzegania tajemnicy informujemy
klienta w momencie zawierania kontraktu, przed pracy
z klientem.
Z punktu widzenia prawa, przepisy o tajemnicy zawodowej z jed-
nej strony, dla klientów psychologa, informacje go nie
upublicznione i dla psychologa, nikt go nie
do ujawnienia informacji poufnych, o kliencie. Po raz kolejny wi-
tu, jak silnie prawa osób badanych z psychologa.
Sytuacje, kiedy psycholog ma prawo czy wyjawienia tego, co
w praktyce tak rzadko,
tajemnica zawodowa nigdy nie wyjawiona i jej zacho-
wania na nas do kOl1ca na
wszelkie z klientem informacje, które psycholog
w z wykonywaniem zawodu.
Z punktu widzenia konsekwencji dla osoby badanej, nie ma zna-
czenia, czy naruszenie tajemnicy zawodowej wynikiem celowego
przez psychologa zasad etycznych, czy do takiego zdarzenia w spo-
sób niezamierzony, na przez zaniedbanie z prze-
chowywania wyników testowych. Psycholog jest
zarówno same testowe, jak i wyniki testowe (tzn. testy,
gotowe diagnozy, kartoteki infonnacje na temat osób badanych, pliki
z danymi) w taki sposób, nie w (por. Standardy,
2007). Czytelnikowi to oczywiste, jednak w praktyce zdarza
niestety, wyniki badal1 testowych przechowywane przez psychologów
w pokojach, co powoduje, do nich oso-
by Warto w tym miejscu na poziomie prawnym,
kwestie przechowywania danych o osobach badanych, oprócz tego,
regulowane zapisami ustawy o zawodzie psychologa i zawo-
dowym psychologów, reguluje - podobnie jak sprawy z przechowy-
waniem wszystkich innych danych osobowych osób fizycznych -
Ustawa o ochronie danych osobowych.
235
Ewa Witkowska

Tajemnica zawodowa, mimo jak wczesmej nieograniczo-


na w czasie i wszystkie informacje z klientem uzyskane
w z wykonywaniem zawodu - nie wyklucza jednak udzielania
nych informacji na temat osób badanych, czy to innym profesjonalistom - innym
psychologom, psychiatrom, pedagogom, nauczycielom czy instytucjom, ta-
kim jak ewentualny pracodawca. Dotykamy tu, oprócz
zagadnienia tajemnicy zawodowej, jeszcze jednego problemu,
cego z konsekwencjami diagnozowania, bo
przygotowane przez nas diagnozy i niekoniecznie to
psycholog, z na temat testów. W takiej
sytuacji bardzo starannie informacje, zebrane przez nas
w procesie diagnostycznym, w którym osoba badana powie-
nam w zaufaniu co nie z celem diagnozy (na
uczestnik rekrutacyjnego na stanowisko przedstawiciela medycz-
nego nam w przerwie o swoich
instytucja powinna jedynie o tym,
co cel diagnozy. Dodatkowo, psycholog wykonuje
dla organizacji (na w roli eksperta prowadzi proces
rekrutacyjny na stanowisko kasjera w banku), powinien, z jednej strony,
o to, uzyskane dane w postaci diagnoz poszczegól-
nych kandydatów) przechowywane w sposób
pu do nich (por. Czamota-Bojarska, 1999), z drugiej - je w taki
sposób, nawet w sytuacji, gdy je niepsycholog nie
one pola do czy nadinterpretacji. Temu, co powinno, a co nie
powinno w informacji zwrotnej udzielanej osobie badanej, a zatem
temu, co powimla diagnoza czy opinia przeznaczona dla odbiorcy
nie psychologiem jest kolejny

7.5. Komunikowanie wyników testowych


psychologów przekonanie, osoba badana w procesie
diagnostycznym powinna jak najmniej na swój temat.
to w informacji negatywnych. Dzisiaj uznaje udzielenie
osobie badanej informacji zwrotnej o uzyskanych przez wynikach - nieza-
czy pozytywnych, czy negatywnych - jest elementem dia-
gnozy testowej (Anastasi i Urbina, 1999; Homowska, 2001). W zasadzie
w praktyce psychologicznej nie udziela informacji o wynikach
jedynie w sytuacji, gdy osoba badana sobie tego nie I nawet mamy
przekonanie, taka informacja dla osoby badanej pomocna, to
osoba badana nie chce od nas, jakie wyniki w na-
szym jest jej i nie takiej informacji za
236
7. Etyka testowych

która ma psychologowi
mu do udzielenia osobie badanej informacji zwrotnej jest to, inf01111acje
zwrotne na celu udzielenie odpowiedzi na pytanie diagnostyczne. Zakres
tego, co powiemy osobie badanej wyznacza zawarty na kontrakt na
badanie. Udzielana przez nas informacja nie ani poza to, co
na ani tylko do wybranych kwestii ustalo-
nych w kontrakcie. W tym ostatnim przypadku bowiem na ryzy-
ko, osoba badana nabierze przekonania, podczas badania
na jej temat tak negatywnego, boimy jej o tym
np. skierowano do nas ucznia po to, postarali dociec, dlacze-
go ma on problemy z i na taki cel badania zgodzili wszyscy
zainteresowani (czyli oraz jego rodzice) w kontrakcie diagnostycznym, to
tylko informacje tego problemu w procesie dia-
gnostycznym i tylko informacji zwrotnych tej sfery funkcjonowania

Psychologowie powinni jako fachowcy spostrzegani


jako autorytet przez osoby badane. W konsekwencji, badani
znacznie do tego, co od psychologa do tego, eo
szeliby od innej osoby, nawet gdyby te informacje z
lub gdyby badanego laik w stanie bardziej
czy Musimy zatem bardzo w sy-
tuacji komunikowania badanym informacji zwrotnych, aby nie do nie-
konsekwencji. Jednym z mechanizmów, które psycholog-diagnosta
jest mechanizm przepowiedni.
Gdy osoba badana na ma problemy z uczeniem to
jej oczekiwania, co do uzyskiwanych rezultatów nauki
bo dojdzie do wniosku, od jej i tak nie ma szans
zbyt wiele i w rezultacie wyniki gorsze od
Oprócz starannego udzielanej informacji zwrotnej, na-
na w jakiej te komunikujemy osobie
badanej. Po pierwsze, którego powinien dostosowany do
badanego. Nie wszelkiego rodzaju "psycholo-
gizmów" i "etykietek" - takich jak termin "ekstrawersja" -nawet
wydaje nam na w potocznym.
przy tym terminy psychologiczne, z którymi jako profesjo-
obeznani inaczej w potocznym, w
przez psychologów. "neurotyzmu" i "reak-
emocjonalnej" czy "temperamentu". Mimo w psychologii
"neurotyzmu" i emocjonalnej" do bardzo podobnych
zmiennych i z nich nie powinno prosto bo nawet skraj-
ne tych cech nie w sposób o zaburzonej to
jednak w powszechnym odbiorze, osoba "neurotyczna" jest kto ma proble- 237
Ewa Witkowska

my z podczas gdy osoba o wysokiej emocjonalnej to


zdrowy". W razie,
w rozmowie z znacznie lepszym od którego-
kolwiek z tych w pewnym sensie skrót
wy, jest opisem funkcjonowania typowego dla osób z wysokimi
czy niskimi wynikami. Z kolei temperamentu, przez psycholo-
gów w diagnozy testowej na biologicznych
w potocznym wydaje raczej z
w dziedzinie seksualnej (por. Uniwersalny
polskiego, 2004).
Nigdy nie osobie badanej jakichkolwiek infonnacji licz-
bowych, które i tak dla badanych, punktem od-
niesienia, pozbawione jakiegokolwiek znaczenia. Jako psychologowie doskonale
znamy diagnozy testowej". Wiemy, testy na prób-
kach ukrytych cech i tak nie interesuje nas,
czy osoba badana zna na konkretne pytanie (np. o to, jakie
miasto jest Boliwii). jest natomiast to, na podstawie odpowiedzi
na to i inne pytania staramy o poziomie badanej cechy
np. inteligencji ogólnej. Zdajemy sobie pomiar którymi
w praktyce nigdy nie jest rzetelny, co powoduje,
nie punktowo wyniku otrzymanego. w diagnozie
indywidualnej zmuszeni w których
z zawiera wynik prawdziwy osoby bada-
nej (Anastasi i Urbina, 1999, Hornowska, 2001, Murphy i Davidshofer, 2004).
Mamy wynik jedynie w odniesieniu do
norm, bo tylko one nam punkt odniesienia i wy-
nik osoby badanej - a co zatem idzie - u niej badanej cechy. Osoby
badane nie zatem poda-
wanie im wyników liczbowych prowadzi jedynie do w wyniku
których ludzie informacjami typu: "W Mensy 107
punktów, a kolega 104, lepszy", nie oba te
wyniki o takim samym poziomie inteligencji.
chodzi o prezentacji wyników, to in-
formowanie osoby badanej o wynikach nie fonny naszego monologu
(Anastasi, Urbina, 1999), ale to raczej rozmowa z która
tym samym do informacji. Po lektu-
rze poprzednich tego Czytelnik jest zapewne
w praktyce stosowanych przez nas testów nigdy nie charakteryzuje ich 100%
pomiaru, a - w konsekwencji - nie w 100% trafue,
co powoduje, stawiane przez nas diagnozy w stopniu
Jednak osoba badana, nawet jest starannie
238 nie dysponuje i nie jest stosowa-
7. Etyka testowych

nych w diagnozie testowej Zatem psycholog powinien jasno


badanemu, uzyskane wyniki nie zawsze adekwatnie go
pomiarowe nie bynajmniej psycholo-
gicznych i nie czy przed badanym, stoso-
wane przez nas testy nie zawsze tak dobrze, jak sobie tego
w sytuacji, gdy infonnacje o badanym z innych (ta-
kich jak wywiad czy obserwacja) w z wynikami
testowymi, psycholog powinien w ich przekazy-
waniu i badanemu ustosunkowania do tego, co
tego, co osoba badana od nas zro-
tak, aby informacja negatywna dwiema informacjami
pozytywnymi. Tworzymy dla osoby badanej z
dodaniu dwóch informacji pozytywnych osobie ba-
danej przyjdzie jej. informacja jest negatywna, bo na
informujemy uczestnika rekrutacyjnego, nie
go na stanowisko, o które to dobrze jest, oprócz
cych dyskomfort z samej sytuacji (na Pana/Pani
kwaftfikacje oceniamy wysoko, ale niestety kandydaci lepiej
oczekiwania pracodawcy) konkretny powód dlaczego tak (na
Pracodawca z w
farmaceutycznej), co badanemu w na poszukiwanie
bardziej adekwatnych ofert (Czamota-Bojarska, 1999).
Czasem mimo najlepszej woli psychologa-diagnosty,
z uwagi na pewne (np. gdy starszym testem,
bo nie mamy innej uzyskane wyniki w pewnym sensie niedo-
czyli mniej trafne, sobie tego to
na normy do testu lub gdy nie dysponujemy normami
stworzonymi na podstawie wyników grupy odniesienia, do której osoba badana
nie w "pasuje". tak na gdy interesuje nas po-
równanie wyniku osoby badanej z wynikami innych studentów, a mamy
jedynie do norm dla studentów z wysokimi aka-
demickimi, jak w przypadku Testu Matryc Ravena Dla Zaawansowanych (por.
Jaworowska i Szustrowa, 1992). W takiej sytuacji, informowanie osoby badanej
o wyniku, takim, którym sami nie ufamy, do-
datkowo o mamy do niego
o tym, o wynikach i ich
konsekwencjach, w taki sposób, jej dobrych rad.
diagnoza jest tylko opisem funkcjonowania badanego i do niego
decyzja, w jaki sposób (i czy w ogóle) wykorzysta.
udzielanie osobie badanej informacji zwrotnej w wypad-
ku nie oznacza, psycholog ma jej informacje o samym który
Jak psycholog nigdy nie powinien prezen- 239
Ewa Witkowska

osobie badanej poszczególnych pozycji testów przed przeprowadzenie


m
badania. osoba badan a ma prawo swoje wyniki zinterpre-
towane na podstawie teorii psychologicznej, ale nie zastosowane

7.6. Ochrona diagnostycznych


Testy psychologiczne to metody, do których jest z zasady ograniczony.
Wynika to z faktu, testy, efektywnie
jedynie w sytuacji, gdy testowy jest nieznany osobom
badanym. Obecnie w Polsce testy psychologiczne a w konsekwen-
cji jedynie osoba dyplomem magisterskich
studiów psychologicznych. To ograniczenie wynika z faktu, pozornie niezwy-
kle proste, diagnozowanie z wykorzystaniem testów psychologicznyc
h wymaga,
aby oraz z zakresu
psychometrii. temu jest adekwatne i zinterpreto-
wanie uzyskanych w wyników. oprócz wiedzy o charakterze
ogólnym, konieczne jest zapoznanie z konkretnym
jego psychometrycznymi, teoretycznym oraz
badania, móc je w diagnozie.
W sytuacji, gdy pozycje, z których jest zbudowany test, powszech-
nie znane, test bo nie na
cowanie ludzi w zakresie mierzonej cechy. to stwo-
rzenia nowego testu, co jest procesem niezwykle
i finansowych. Brak
. o chronienie przez psychologów jest na
psychologicznego. testy powszechnie
i to psychologowie tym
samym im trafne diagnozy. W Kodeksie Etyczno-
-Zawodowym Psychologa czytamy, psycholog nie specyficznych
technik diagnozy psychologicznej osobom nieprzygotowanym do ich
kompe-
tentnego stosowania. Psycholog przeciwstawia podejmowaniu
psychologicznej, a stosowaniu specyficznych technik diagnostycznych
i terapeutycznych przez osoby kwalifikacji psychologicznych.
Natomiast Ustawa o zawodzie psychologa i zawodowym psycho-
logów mówi w artykule 33., zadaniem psychologów jest w szcze-
( ... ) ochrona prawna metod i psychologicznych (punkt 3.).
Dodatkowo, testy jak wszystkie inne utwory utwory muzyczne czy pla-
styczne) chronione przez Prawo autorskie, a - chroni jest Ustawa o za-
wodzie psychologa i zawodowym psychologów.
testy zagraniczne chronionymi, co oznacza, psycholog
nie ma prawa bez uzyskania zgody praw autorskich proce-
dury adaptacyjnej oryginalnego
7. Etyka testowych

Warto w tym miejscu ograniczenie do testów psycho-


logicznych jest znacznie bardziej restrykcyjne w Polsce w innych krajach.
W wielu z nich mamy bowiem do czynienia z testy podzielone
na podgrupy i w efekcie nie tylko dla psycho-
logów, ale na dla nauczycieli, którzy przeszli specjalne przeszko-
lenie takiego testu jest Test Matryc Ravena), z których
tylko psychologowie oraz do stosowania których
psychologowie, którzy dodatkowo przeszli specjalne
szkolenie - tutaj sztandarowym jest Skala Inteligencji Wechslera.
W Polsce dwa rodzaje testów psychologicznych - testy komer-
cyjne i testy nieskomercjalizowane. Testy komercyjne to takie, które opu-
blikowane i sprzedawane przez ich Z kolei testy niekomercyjne to
testy, które autor albo czy z o konkretnym badaniu,
albo po prostu nie mu energii i na przeprowadzeni pro-
cedury konstrukcji/adaptacji i test na nie ma norm, ale
z powodzeniem wykorzystywany w badaniach grupowych. jeden i drugi
rodzaj testów podlega ochronie, w tym ochronie przepisów prawa autorskiego,
to zasady korzystania z testów w od tego, czy test
skomercjalizowany czy nie.
Testy komercyjne wystarczy móc ich
my, konieczny jest zakup kompletu testowych - czyli ar-
kuszy, klucza, ewentualnie zeszytów z zadaniami testowymi. Warto
tutaj - testu musi takie testy bez
wprowadzania do nich jakichkolwiek modyfikacji, nie ich w wy-
padku czy na w Internecie.
zatem w badaniach, jakie planujemy w ramach pracy magisterskiej
interesuje nas wymiar - jedna z cech mierzonych przez
Zachowania - Kwestionariusz Temperamentu (Zawadzki
i Strelau, 1997), to i tak musimy kwestionariusz i dopiero na
poziomie analizy danych tylko do jednej, nas
cechy. chcieli takiego na
testu w formie "papier i to nie mamy
prawa bez zgody wydawcy testu lub innego praw
autorskich. w prowadzonych ba-
daniach musimy oryginalnymi arkuszami testowymi - powielanie
ich w jakikolwiek sposób jest naruszeniem prawa autorskiego!
czas spoczywa na nas chronienia testu, zatem z przyczyn orga-
nizacyjnych decydujemy na badanie, w którym uczestnikom testy
musimy grozi nam utrata kontroli nad nimi.
Informacje o testach nieskomercjalizowanych w fachowej li-
teraturze psychologicznej, gdzie autorzy swoje badania
prowadzone z ich wykorzystaniem. jednak same nie 241
Ewa Witkowska

publikowane w tego typu wydawnictwach. Czasem jest jedna k wyko-


rzystanie takich w planowanych przez nas badaniach, o ile uzyskamy je
od autora na jego wykorzystanie w konkretnym badaniu.

7.7. Podsumowanie
Ten ma charakter jedyn ie wprowadzenia w etycznych
i prawnych aspektów ze stosowaniem testów psychologicznych.
Jego lektura nie powinna zatem w wypadku do nabra-
nia przekonania, uzyskane informacje aby pewnie
w sytuacjach testowych w odniesieniu do ludzi oraz z wykorzy-
staniem diagnostycznych.
jest, tego jako w
z opisanymi w poprzednich testów, a tak-
- w sobie nawyk wnikliwej analizy testowego, za-
nim zdecydujemy nowe w procesie diagnostycznym.
do swojej wiedzy w zakresie etycz-
nych i prawnych aspektów korzystania z testów, na poprzez po-
pozycji:

Zalecana literatura
American Educational Research Association & American Psychologic
al Association &
National Council on Measurement in Education (2007). Standardy dla
testów stosowa-
nych w psychologii i pedagogice. Wydawnictwo Psychologiczne.
Polskie Towarzystwo Psychologiczne (1992). Kodeks Etyczno - Zawod
owy Psychologa.
Warszawa: PTP. [przedmk w: J. Strelau (red.) (2000). Psychologia.
akade-
micki (t. 3, str. 839-843). Wydawnictwo Psychologiczne.]
l, Toep1itz-Winiewska, M. (2004). Etyczne dylematy psychologii. Warsz
awa:
Wydawnictwo SWPS Akademia.
J., Chyrowicz, B., Poznaniak, w., Toeplitz-Winiewska, M. (2008). Etyka
za-
wodu psychologa. Warszawa: Wydawnictwo Naukowe PWN.
Ustawa z dnia 8 czerwca 2001 r. o zawodzie psych ologa i
zawod owym psy-
chologów (Dz. U. Nr 73, poz. 763) hitp://www.ptp.org.pl/modules.php?na-
me=News&file=articJe&sid=47

Pytania
1. Dlaczego kwestie etyczne tak przy wykonywaniu zawodu psycholo-
ga?
2. jakich prawach osoby badanej musi psycholog-diagnosta?
3. Jak psycholog jest w tajemnicy infonnacje uzy-
·242 skane w z wykonywaniem zawodu?
7. Etyka testowych

4. Jaki jest kluczowy etap przygotowania do diagnozowania z nowopo-


znanego testu psychologicznego?
5. Jakie w Polsce ustawy testy psychologiczne?
6. Co móc komercyjnego testu psychologicznego?
7. Jaki warunek musimy niekomercyjny test psycholo-
giczny?
8. Jakie zasady powinny przestrzegane przy udzielaniu osobie badanej in-
formacji zwrotnej?

243
LITERATURA

American Educational Reasearch Association & American Psychological Association&


National Council on Measurement in Education (2007). Standardy dla testów stosowa-
nych w psychologii i pedagogice. Wydawnictwo Psychologiczne.
American Psychological Association (2000). Report of the Task Force on Test User
Qualifications. Practice and Science Directorates. on-line: http://www.apa.
org/science/tuq.pdf.
American Psychological Association (2003). The Ethical Principles of Psychologists and
Code of Conduct.
Anastasi A., Urbina S. (1999). Testy psychologiczne. Warszawa: Pracownia Testów
Psychologicznych PTP.
Angleitner A., Riemann R. (1991). What can we leam jrom the discussion ofperson-
ality questionnaires for the construction of temperament inventories? W: J. Strelau,
A. Angleitner (red.), Explorations in temperament (s. 191-204). New York; Plenum.
J. (1996). Metodologia psychologicznych. Warszawa: PWN.
J., Toeplitz-Winiewska M. (2004). Etyczne dylematy psychologii. Warszawa:
Wydawnictwo SWPS Akademia.
l, Gaul M., Hornowska E., Machowski A, Zakrzewska M. (2005). Skala
Inteligencji D Wechslera dla - wersja zrewidowana. Polska adaptacja
WAIS-R(PL). Warszawa: Pracownia Testów Psychologicznych PTP.
Brzozowski P. (1989). Skala (SW). Polska adaptacja Value Survey M Rokeacha.
Warszawa: Laboratorium Technik Diagnostycznych im. Bohdana
Zawadzkiego (II wydanie - 1996).
Brzozowski P., Drwal (1995). Kwestionariusz Eysencka. Polska ada-
ptac-ja EPQ-R. Warszawa: Pracownia Testów Psychologicznych PTP.
CampbelI D.T., Fiske D.W. (2005). Analiza i za
macierzy wielu cech - wielu metod. W: J. (red.), i te-
slów psychologicznych. wybór tekstów (s. 431--459). GWP.
Choynowski M. (1971). Podstawy i zastosowania teorii testów psycholo-
gicznych. W: J. Kozielecki (red.), Problemy psychologii matematycznej (s. 65-118).
Warszawa: PWN.
Choynowski M. (1972). Skrócony do testu Nastroje i Humory. Warszawa:
Wydawnictwo Ministerstwa i Wychowania.
Ciechanowicz A. (1992). Skala Columbia. Polska
standa/yzacja 1990. Warszawa: PTP.
Cronbach L.J. (2005). W alfa a struktura testów. W: J.
(red.), i testów psychologicznych. wybór tekstów (s. 177-212).
GWP.
Cronbach L.J., Meehl P.E. (2005). teoretyczna testów psychologicznych W:
J. (red.), i testów psychologicznych. tekstów
244 (s. 404-430). GWP.
Literatura

Czamota-Bojarska J. (1999). Selekcja zawodowa. Przygotowanie, prowadzenie i podsta-


wowe metody. Warszawa: Pracownia Testów Psychologicznych Polskiego Towarzystwa
Psychologicznego.
Drwal R.K. (1995). i czterech inwentarzy agresji. W:
P. Brzozowski (red.), Adaptacja kwestionariuszy (s. 36-54). Warszawa:
PWN.
Eysenck H.J., Eysenck S.B.G., Barrett P. (1985). A revised version of the psychoticism
scale. Personality and Individual Differences, 6, 21-29.
Frydrychowicz A., Jaworska J., Woynarowska T., Matuszewski A. (1994). Inwentarz
Warszawa: Centrum Metodyczne Pomocy Psychologiczno-
-Pedagogicznej.
E. (2005). Przymiotnikowa Skala Nastroju UMACL. Warszawa:
Pracownia Testów Psychologicznych PTP.
Homowska E. (2001). Testy psychologiczne. Teoria i praktyka. Warszawa: Wydawnictwo
Naukowe "Scholar".
Homowska E. (2004). Skale inteligencji dla doroslych Davida Wechslera WAJS-R oraz
WAIS-III. Warszawa: Scholar.
Jakubowski J. (1983). Elementy klasycznej teorii testów psychologicznych, w:
J. Paluchowski (red.), Z diagnostyki (s. 223-247).
OssolinewTI.
Jaworowska A., Matczak A. (2008). Test Niedokollczonych Rottera (RISB).
Warszawa: Pracownia Testów Psychologicznych PTP.
JaworowskaA., MatczakA., Szustrowa T; (1996). Wykonaniowa Skala
Leitera P-93. Polska standaryzacja: populacja ogólna 3-15 lat, dzieci
6-14 lat. Warszawa: PTP.
Jaworowska A. Szustrowa T. (1992). do Testu Matryc Ravena. Wersja dla
Zaawansowanych. Warszawa: Pracownia Testów Psychologicznych PTP.
JaworowskaA. Szustrowa T; (2000). Test Matryc Ravena w wersji Standard TMS: formy:
Klasyczna, Plus: polskie standaryzacje. Warszawa: Pracownia Testów
Psychologicznych Polskiego Towarzystwa Psychologicznego,.
Jurkowski A. (1997). Test Leksykon. Warszawa: Pracownia Testów
Psychologicznych Polskiego Towarzystwa Psychologicznego.
Kofta M., J., Ignaczak M. (1977). Konstrukcja i charakterystyka psychome-
tryczna kwestionariusza poczucia winy KPW. Studia Psychologiczne, 15, 93-113.
Krasowicz G., Kurzyp-Wojnarska A. (1990). Kwestionariusz do badania poczucia kon-
troli (KBPK). Warszawa: PTP.
Kuder F., Richardson M. (2005). Teoria estymacji testu. W: J.
(red.), i testów psychologicznych. WYbór tekstów (s. 167-176).
GWP.
E., J. (2007). Test figuralnej RujJa (RFFT).
Warszawa: Pracownia Testów Psychologicznych PTP.
Magnusson D. (1991). Wprowadzenie do teorii testów. Warszawa: PWN.
Markowska B., Kotas A. (1971). Badania nad Inwentarza
Psychologicznego H.G. Gougha. Psychologiczny, 21, 225-236. 245
Literatura

Marody M. (1976). Sens teoretyczny a sens empiryczny postawy. Warszawa:


Wydawnictwo PWN.
MatczakA. (1992). Diagnoza intelektualnych (DMI). Warszawa:
Pracownia Testów Psychologicznych Polskiego Towarzystwa Psychologicznego.
Matczak A. (2001). Testy diagnoza intelektualnych
dziecka DMI-2 DMI-2S. Warszawa: Pracownia Testów Psychologicznych PTP.
Matczak A. (200 l). Testy diagnoza intelektualnych
dziecka. Warszawa: Pracownia Testów Psychologicznych.
Malczak A. (1994). Diagnoza intelektu. Warszawa: Wydawnictwo Instytutu Psychologii
PAN.
Matczak A., Jaworowska A., Szustrowa T., Ciechanowicz A. (2006). Bateria Testów
APIS-Z. Warszawa: Pracownia Testów Psychologicznych PTP.
Matczak A., Jaworowska A., Ciechanowicz A., 1., Zalewska E. (2005). Bateria
Testów APIS-P(R). Warszawa: Pracownia Testów Psychologicznych PTP.
Matczak A., Piotrowska A., Ciarkowska W. (1998). Skala Inteligencji D. Wechslera dla
Dzieci - wersja zmodyfikowana. WISC-R. Warszawa: Pracownia Testów
Psychologicznych PTP.
McCrae R.R., Costa P.T. (2005). Kraków: Wydawnictwo
WAM.
Murphy K.R., DavidshoferC. O. (2005). Psychological Testing. Principles andApplications
(6'" edition). Upper Saddle River, New Jersey: Pearson Education International.
E. (2003). Inteligencja. Geneza, struktura, fimkcje.
Wydawnictwo Psychologiczne.
Nowakowska M. (1970). Polska adaptacja 16-czynnikowego Kwestionariusza
R.B. CaUella. Psychologia Wychowawcza. 13,478-500.
Nowakowska M. (1975). Psychologia ilo/iciowa z elementami naukometrii. Warszawa:
PWN.
Paluchowski W.J. (2006). Diagnoza psychologiczna. i
Warszawa: Wydawnictwo Naukowe "Scholar".
Parnowski T., Jernajczyk W. (1977). Inwentarz Depresji Becka w ocenie nastroju osób
zdrowych i chorych na choroby afektywne (ocena Psychiatria Polska,
11: 417-425.
Piaget J. (1966). Narodziny inteligencji dziecka. Warszawa: PWN.
Piaget 1. (1981). stmktur poznawczych. Warszawa: PWN.
Piaget 1. (2006). Jak sobie dziecko Warszawa: PWN.
Polskie Towarzystwo Psychologiczne (1992). Kodek> Etyczno - Zawodowy Psychologa.
Warszawa: PTP. [przedmk w: J. Strelau (red.) (2000). Psychologia. akade-
micki (t. 3, str. 839-843). Wydawnictwo Psychologiczne.]
Reykowski J. (1992). Procesy emocjonalne. Motywacja. Warszawa: PWN.
Sanocki W. (1986). Kwestionariusze w psychologii. Warszawa: PWN.
Siuta 1. (2006). Inwentarz NEO - PI Costy i McCrae. Adaptacja polska.
Warszawa: Pracownia Testów Psychologicznych PTP.
Strelau 1. (2001). Psychologia temperamentu. Wyd. 2 zm. Warszawa: Wydawnictwo
246 Naukowe PWN.
Literatura

Strelau J., Jaworowska A., K., Szczepaniak P. (2005). Kwestionariusz


radzenia sobie w sytuacjach stresowych CISS. Endler, J.D.A. Parker
Warszawa: Pracownia Testów Psychologicznych PTP.
Szustrowa T. (2003). Raport o stanie orzecznictwa psychologicznego w Polsce. Raport
Polskiego Towarzystwa Psychologicznego on line: http://www.ptp.org.pl/
teksty/raport_ orzecznictwo.doc
Terelak J., Tarnowski A., Kwasucki J. (1993). Psychometryczna ocena kwestionariuszy
Zunga i Hendlera do oceny psychologicznego komponentu bólu
Psychologiczny, 36,81-97.
Uniwersalny polskiego (2004). Warszawa: Wydawnictwo Naukowe
PWN.
Ustawa z dnia 8 czerwca 2001 r. o zawodzie psychologa i zawodowym psy-
chologów (Dz. U. Nr 73, poz. 763) http://www.ptp.org.pl/modules.php?na-
me=N ews&file=article&sid=4 7
Werner P.D., Pervin L.A. (1986). The content ofpersonality inventory items. Journal 0/
Personality and Social Psychology, 51, 622-628.
J., Drwal (1995). Opracowanie Kwestionariusza Aprobaty
(KAS). W: Drwal (J. Brzozowski, red.), Adaptacja kwestionariuszy osobowo-
Wybrane zagadnienia i techniki (s. 57-66). Warszawa: Wydawnictwo Naukowe
PWN.
K., Sosnowski T., Matusik D, (2002). inwentarz stanu i cechy pol-
ska adaptacja STAJ: Warszawa: Pracownia Testów Psychologicznych
Polskiego Towarzystwa Psychologicznego.
Zakrzewska M. (1994) Analiza czynnikowa w budowaniu i sprawdzaniu modeli psycho-
logicznych. wyd. UAM.
ZalewskaA. (2001). "Arkusz Opisu Pracy" O. Neubergera i M. Allerbeck- adaptacja do
warunków polskich. Studia Psychologiczne, 39, 197-217.
Zawadzki B. (2006). Kwestionariusze Strategie i procedura konstruowania.
Warszawa: Wydawnictwo Naukowe Scholar.
Zawadzki B., Strelau J. (1997). Formalna Charakterystyka Zachowania - Kwestionariusz
Temperamentu (FCZ-KT). Warszawa: Pracownia Testów Psychologicznych
PTP.
Zawadzki B., Strelau J., Szczepaniak P., M. (1998). Inwentarz Osobowo.§ci
NEO-FFI Costy i McCrae. Adaptacja polska. Warszawa: Pracownia
Testów Psychologicznych PTP.

247
INDEKS

A 138, 139, 162, 163, 165, 169, 172,


180, 182, 185, 186, 193, 197, 200,
aksjomaty klasycznej teorii 205,206, 208, 209, 211, 212, 215,
65 216,2 17,22 6,231 ,237, 238,2 40,
alfa Cronbacha 94-96 , 104-106, 140, 241
172, 174 centy l223- 225
analiza czynnikowa 124-127, 147-
150 D
analiza pozycji 162
dewiacyjny iloraz inteligencji 219-
aprobata 43, 119, 121, 139, 220
145
testu 91, 103
B dystraktor 15
dystrybuanta 184,2 11-21 2
bateria 24, 30, 35, 36, 37, 38, 39, 96,
123, 128, 161, 190 E
estymacji 197 estymator 66,80 -81, 180-182, 189
losowy 68-69 , 70-71 , 73-75 , 76- estymator 180
78,18 0,183 ,189, 193 estymator punktowy 196
pomiaru 66-68 , 71, 73, 74, 76, 78, estymowany wynik prawdziwy 181,
79, 80, 85, 113, 180, 182, 188, 193, 194-201
197,2 22
188-189 H
systematyczny 68-69 124
wnioskowania 185

C
idiograficzne 18, 56
cecha (psychiczna) 10, 12, 13, 14, 16, iloraz inteligencji, patrz dewiacyjny
17,18 ,21,2 3,40, 41,43 ,44,4 5,46, iloraz inteligencji
50,51 ,52,5 4-58, 59,60 ,61,6 2-63, informacji zwrotnych udzielanie 137,
65,66 ,67,6 8,71, 74,75 ,76,7 7,78, 234,2 37
79, 80, 84, 86-87 , 90, 93, 96, 98, inwentarze, patrz kwestionariusze
112, 113,114, 115, 116, 117, 118, iq, patrz dewiacyjny iloraz inteligencji
248 119, 120, 121, 122, 123, 124, 134, 193
Indeks

J nomotetyczne 18, 55-56, 62


96, 113 nonna 16, 205-206
normalizacja 112, 113,205-206,209-
K 212,214-215,220,222,225-226
normy 13, 16-17, 113, 205, 206, 225,
klasyczna teoria 65, 69, 71,
239
76, 78, 182
normy lokalne 225
klucz 13, 14,93,94,97,106, 162, 167,
241 o
konstrukt 12, 19,84,96, 115, 119-120,
obiektywny test 16-17,
165
112-113
kontaminacja kryterium
diagnosty 15,230-236,242
135
ograniczenie czasu 15,23,27,31,34,
kontinuum 54-55, 64
38,39,43,44
kontrakt diagnostyczny 232-237
kowariancja 72-73, 189 p
KR 2D 93-94 parametr 65-66, 70, 76-77, 181-182,
KR21 93-94 195,219-220,222
kryterium 131-136, 138, 140, pomiary 74-75, 81, 84, 86,
145,151,165 187
krzywa normalna, patrz nor- populacja 13, 16, 18,62-63,66,70-72,
malny 76-79, 81-83, 113, 165, 181-182,
kwestionariusz 13, 18,21,39-52 186-187, 190, 196-197, 205-207,
L 209,211,214,215,217,218,222,
225,226,232
linia regresji 194-195 poziom 101, 108, 184-187,
191-192,200
M
poziom 185, 191
metoda 84,90-93,94,99, 185, 192-194
102-104 prawa osoby badanej 230-232
metoda powtarzanego pomiaru (testu), próba 63,70-71,79,96, 100, 101,107,
patrz 128, 130, 144, 147, 151, 152, 154,
metoda testów (wersji) alternatywnych, 163, 169, 174, 181, 182, 186, 192,
patrz testy 196, 200, 206, 207-212, 214, 215,
metoda testów patrz te- 223-225
sty próba normalizacyjna 15, 16,207,209,
moc dyskryminacyjna 117, 124, 165- 214,223,225
169, 172, 174, 176 próba reprezentatywna 66, 81, 82, 115,
186,207,209,225
N próbka zachowania 12,17-19,21,238,
diagnostycznych ochrona 17, 240
230,240-241 centylowy 223-226 249
Indeks

10, 78, 81, 180-187, skale znormalizowane 215-222, 224-


190-194,198-201,238 226
Spearmana-Brown wzór 91-92, 102-
R 103, 140
rangi 52, 140-143,225 84-90, 98, 99,
dwumodalny 170, patrz 100-101
87,89-90,98,99
2l3, 215, testu, patrz bez-
patrz dwumodalny
Gaussa, patrz normal- w czasie 66, 86-88
ny standardowy estymacji, patrz SEE
normalny 55-56, 61, 63, 74, standardowy pomiaru 182, 184
76,169 - 170,176,184,187,205, 186,198
206,209,211-213,226 standardowy pomiaru, patrz SEM
170-172, 174-176, standardowy 187-190,
213-214,226 192
rozwojowy iloraz inteligencji 25, 219 standardowy patrz SEMD
testowa 89-90, standaryzacja (procedury badania) 15,
98,99 112,
13, 14, 16, 17,22,65,67-69, standaryzacja wyników)
71, 73, 76-82, 84-87, 89-94, 96- 206-209
106, 108, 112, 113, 117, 135, 139, stanina 216, 221
140, 161-162, 172, 182, 186-187, sten 217,221
190, 192, 194-196, 198-20 l
T
S tajemnica zawodowa 235-236
SEE 197-198,200 ten 217,221
selekcja 19,22,30,38,41,42,43,45, test mocy 23, 27,
225 test 23, 68
SEM 16,74-75,77, 80-82, 181-186, test 13, 18,21,23-39
189,192,197-198,200 testowy 12-13,15-16,22-23,
SEMD 187, 189-190,192-194 26-35,114,233,240,24]
kompetentny 84, 97-98, 115- testowy 12-13, 15-16, 81,
117, 121, 133, 140 119-120, 123, 128, 186, 192, 200,
siatka centylowa 226 232,242
skala centylowa, patrz centyl, siatka test-retest, patrz
centylowa, centylowy na
skala iq, patrz dewiacyjny iloraz inte- testy niewerbalne 15, 23, 24, 25, 26,
ligencji 29,30,31
skala staninowa, patrz stanin testy 14,84-86,88,89,90,
skala stenowa, patrz sten 92,98
250 skala tenowa, patrz ten testy werbalne 23, 30, 31
Indeks

testy wykonaniowe, patrz testy niewer- 80


balne pozycji, patrz trud-
tetron 218,221 pozycji testowej
diagnostyczna 132, 134, 138 (cechy psychicznej) 57-61,
13, 14, 16, 17,68, 111-159, 63, 66, 85, 112, 117, 125, 130, 139,
161 162
dywergencyjna, patrz 118, 120-121, 123,
131
fasadowa 136-137 alfa Cronbacha, patrz
konwergencyj na, patrz traf- alfa Cronbacha
determinacji 79-80
112,114,131-136, korelacji 84, 85, 86, 87,
137, 138, 151 88, 89, 90, 91, 97, 103, 118, 120,
prognostyczna 132-136 122, 128, 131, 145-146, 166, 174,
120-123, 134 198,
teoretyczna 87, 114, 118-131,
134, 136, 137, 138, 139, 145, 151 testowej, patrz testy
114-117, 140 79, 81, 85,
patrz 91,92,99,113,161,186,191,192,
196,198,199,200
120-123, 134 Spearmana-Brown, patrz
patrz Spearmana-Brown wzór
kryterialna
pozycji testowej 23, 24, 26, nej, patrz
27, 29, 30, 34, 91, 92, 94, 99, 162-
164, 169, 171, 172, 174,222 patrz testy
patrz
W
wariancja 72, 78-80, 189 W-Kendalla, patrz
wariancja 72, 78, 80 W-Kendalla
wariancja prawdziwa, patrz wariancja patrz
wyników prawdziwych W-Kendalla
wariancja wyników otrzymanych 72,
78-80,84 patrz
wariancja wyników prawdziwych 72, wynik otrzymany 67, 69-72, 74, 79,
78-80,84 95,99,180-182,184-186,188,190,
testu 84, 85, 89, 98, 99 194,196-201,206,207,209,238
W-Kendalla97-98, ]07-108, 116, 140, wynik prawdziwy 66-68, 70-72, 74-
142-145 76,81,84,180-186,194-201,238
dyskryminacj i 166-167 wynik przeliczony 96, 190
mocy dyskryminacyjnej, wynik surowy 16, 206-208,212-215,
patrz moc dyskryminacyjna 218,220-225 251
Indeks

wynik wystandaryzowany 184, 207-


z
209,212,215
wynik znormalizowany 212-2 18, 220- zgoda na w badaniu diagno-
221 styczn ym 231-2 34
wyników testowych komunikowanie ocen 97-99 , 144
236-239 84-86 , 90, 93,
wzory Kuder i Richardson, patrz KR20 94, 96, 99, 104, 105, 109, 1l3, 124,
i KR2I 160, 162, 166, 174
wzór Spearmana-Brown, patrz Spear- zmien na l36, 152,2 10,21 1
mana-Brown wzór zmienna dyskretna 211
zmienna kryterialna, patrz kryterium

252

You might also like