Psychometria Pytania 2022

1. Która z poniższych definicji jest pełną i wyczerpującą definicją testu psychologicznego?
a) jest to obiektywny i standaryzowany pomiar próbki zachowania

b) jest to kontrolowana ilościowa obserwacja zachowania
c) jest to pomiar próbki zachowania wybranej grupy ludzi
d) jest to standaryzowany zbiór bodźców dla mierzalnych reakcji
2. trafność fasadowa powinna być brana pod uwagę w przypadku testu, gdyż:
a) stanowi podstawę statystycznego doboru pozycji
b) jest częścią składową każdego rodzaju trafności
c) jest dowodem, że test mierzy to, co zmierzył jego autor
d) zapewnia zgodność wyglądu testu czym.... sądzi osoba badana
3. wyniki standardowe to
a) wyniki uzyskane w standardowych warunkach
b) wyniki wyrażone w terminach odchylenia standardowego
c) wyniki wyrażone w terminach obiektywnego standardu
d) wyniki uzyskane za pomocą wystandardyzowanego narzędzia
4. pojęcie normy w teście odnosi się do:

a) wykonania idealnego
b) wykonania maksymalnego
c) wykonania oczekiwanego
d) wykonania typowego
5. tetrony to wyniki standardowe wyrażone na skali

a) M=10 SD=2
b) M=10 SD=4
c) M=10 SD=1
d) M=10 SD=10
6. wysoki współczynnik korelacji pomiędzy dwoma testami równoległymi stosowanymi jeden po drugim,
bez przerwy czasowej, świadczy o:
a) funkcjonalnej mierzonej zmiennej w czasie
b) niskiej homogeniczności wysokiej specyficzności pozycji testowych
c) niskiej specyficzności i wysokiej specyficzności pozycji testowych
d) o dużym stopniu obiektywności
7. w metodzie testów równoległych, w odróżnieniu od metody test-retest minimalizowany jest wpływ:

a) pamięci i efektów uczenia się
b) braku stałości zmiennej
c) heterogeniczności zmiennej
d) szybkości rozwiązania zadań
8. otrzymanie różnych współczynników trafności kryterialnej dla danego testu jest najczęściej
spowodowany:
a) faktem wybrania różnych zmiennych kryterialnych
b) błędami w obliczeniach
c) niską rzetelnością testu
d) trudnościami w diagnozowaniu zachowania mierzonego przez test
9. test składa się z 10 pytań. Powinien dobrze różnicować w obrębie patologii. Która z poniższych skal
standardowych najlepiej pozwalałaby zrealizować ten cel:
a) M=10, SD=5
b) M=10 SD=1
c) M=50 SD=10
d) M=50 SD=25
10. błąd standardowy różnicy jest to:

a) różnica 2 błędów standardowych
b) suma 2 błędów standardowych podniesionych do kwadratu z których wyciągnięto
pierwiastek
c) różnica 2 błędów standardowych podniesionych do kwadratu z których wyciągnięto pierwiastek
d) suma dwóch błędów standardowych
11. aby spełnić warunek obiektywności, każdy test musi być przynajmniej:
a) stosowany i obliczany w z góry ustalonych warunkach
b) wysoko rzetelny
c) losową próbką wskaźników zmiennej teoretycznej
d) oparty na wybranej teorii mierzonej zmiennej
12. Stanina to
a) wynik surowy
b) wynik wskazujący na wiek umysłowy
c) inna nazwa centyli
d) znormalizowany wynik standardowy
13. centyle to wyniki, które wskazują jaki procent osób z badanej grupy uzyska wyniki:
a) takie same lub wyższe od danego wyniki
b) takie same lub niższe od danego wyniku
c) wyższe od średniej
d) niższe od średniej
14. określanie rzetelności testu pozwala na ustalenie:

a) jaki % wariancji otrzymanej stanowi wariancja prawdziwa
b) wielkości błędu stałego w pomiarze testowym
c) jaką część wariancji błędu stanowi wariancja prawdziwa
d) możliwych fluktuacji wielkości współczynnika R
15. trafność kryterialna to inaczej

a) trafność predykcyjna i treściowa
b) trafność diagnostyczna i treściowa
c) trafność prognostyczna i diagnostyczna
d) trafność teoretyczna i treściowa
16. rzetelność testu jest wyrażana w postaci

a) odchylenia standardowego
b) prawdopodobnego błędu wyniku testowego
c) współczynnika korelacji
d) różnicy pomiędzy 2 wynikami
17. aby znormalizowane wyniki testowe były użyteczne odnosi się je do:
a) treści pozycji tworzących test psychologiczny
b) innych metod testowych
c) zachowania wybranej, dobrze określonej grupy
d) rzetelności i trafności metody
18. kontaminacja kryterium najczęściej pojawia się, gdy:
a) test ma niską rzetelność
b) psychiatra ma dostęp do wyników testowych
c) łączy się wyniki dwóch różnych grup osób badanych
d) łączy się wyniki pomiaru dwóch różnych kryteriów
19. stosując współczynnik korelacji dwuseryjnej, jako współczynnik mocy dyskryminacyjnej, musi zostać
spełnione założenie, że zmienna zdychotomizowana jest:
a) rzeczywiście ciągła i posiada rozkład normalny,
b) ciągła lecz nie o rozkładzie normalnym
c) z natury swej dychotomiczna
d) dzieli się w punkcie mediany
20. rzetelność testu można wyrazić jako:

a) stosunek wariancji [prawdziwej do wariancji błędu
b) stosunek wariancji otrzymanej do wariancji prawdziwej
c) stosunek wariancji prawdziwej do wariancji otrzymanej
d) stosunek wariancji błędu do wariancji otrzymanej
21. wielkość SEM zależy od:

a) odchylenia standardowego wyników testowych,
b) współczynnika rzetelności
c) obu możliwości
d) żadnych możliwości
22. jeżeli test jest zbyt trudny dla badanej grupy osób to rozkład wyników w tym teście będzie:
a) normalny
b) prostokątny
c) skośny
d) wielo modalny
23. znajomość współczynnika mocy dyskryminacyjnej pozwala nam na

a) wskazania pozycji zbyt trudnych
b) wskazanie pozycji mierzących inną zmienną
c) wskazanie pozycji mierzącej zachowania poza testowe
d) wskazanie pozycji nietrafnych
24. jeżeli rozkład wyników surowych jest rozkładem lewo skośnym, to w celu jego normalizacji należy
zastosować następującą transformację:
a) pierwiastkową,
b) logarytmiczną
c) potęgową
d) żadną z nich
25. trafność teoretyczna testu znajduje swoje odzwierciedlenie w:

a) hipotezach wyprowadzanych z teorii mierzonej zmiennej
b) rezultatach analizy czynnikowej wyników testowych
c) obu z wymienionych możliwości
d) żadne z wymienionych możliwości
26. standardowy błąd estymacji wyniku prawdziwego jest to:

a) różnica między estymowaną wartością wyniku prawdziwego a jego rzeczywistą wartością
b) różnica między wynikiem otrzymany a wynikiem prawdziwym w teście
c) obie definicje są prawdziwe
d) żadna definicja
27. standaryzacja testu odnosi się do:

a) komercyjnej użyteczności testu
b) jednolitości procedury
c) zgodności z normami
d) określania jego rzetelności i trafności
28. współczynnik KR-20 to:

a) średnia wszystkich współczynników typu test-retest
b) średnia wszystkich współczynników typu split-half
c) średnia wszystkich współczynników splittest
d) średnia wszystkich współczynników powyżej 0,8
29. standardowy błąd pomiaru jest szczególnie użyteczny przy:

a) porównywaniu dwóch wyników testowych między sobą
b) określaniu statystycznej istotności wyniku testowego
c) porównywaniu dwóch testów między sobą
d) określaniu istotności statystycznej pozycji testowej
30. testu przeznaczone do selekcji ze względu na specyficzne kryterium, powinny składać się z pozycji
testowych, których współczynnik trudności wynosi:
a) 0,5
b) mieści się w przedziale od 0-100%
c) wyznaczony jest przez rozkład normalny
d) jest równy wyznaczonemu punktowi selekcji
31. formuła speramana - browna jako metoda szacowania rzetelności stosowana jest w technice:
a) test-retest
b) testów równoległych
c) połówkowania (split-half)
d) krudera-richardsona
32. dla którego z poniższych rodzajów testów, okre4ślenie trafności treściowej będzie najbardziej
odpowiednie
a) testów zdolności werbalnych
b) testów wiadomości z matematyki
c) testów projekcyjnych
d) testów inteligencji
33. badanie trafności metodą wielu cech-wielu metod polega na:

a) analizowaniu tylko aspektu zbieżnego trafności
b) analizowaniu tylko aspektu różnicowego trafności
c) analizowaniu jednocześnie aspektu zbieżnego i różnicowego
d) żądne z powyższych możliwości
34. formuła spearmana-browna pozwala na określenie wpływu następujących zmiennych na wielkość

współczynnika rzetelności:
a) heterogeniczności próbki badanych osób
b) homogeniczności pozycji testowych
c) trafności testu
d) długości testu
35. steny to wyniki standardowe wyrażone na skali
a) M=5 SD=2
b) M=5 SD=4
c) M=5,5 SD=2
d) M=5,5 SD=4
36. staniny to wyniki standardowe wyrażone na skali:

a) M=5 SD=2
b) M=5 SD=4
c) M=5,5 SD=2
d) M=5,5 SD=4
37. skala T to wyniki standardowe wyrażone na skali:

a) M=50 SD=2
b) M=50 SD=4
c) M=100 SD=15
d) M=50 SD=10
38. rzetelność testu to również jedno z kryteriów dobroci testów psychologicznych. Rzetelność testu oznacza
przede wszystkim następującą właściwość wyników teoretycznych
a) powtarzalność
b) obiektywność
c) istotność
d) trafność
39. badanie testowe najogólniej rzecz biorąc to:

a) w sytuacjach, w których dokonuje się ilościowej obserwacji zachowania
b) w sytuacjach, w których wywołuje się zachowania typowe dla określonej grupy osób
c) w sytuacjach, w której dokonuje się celowej obserwacji zachowań traktowanych jako
wskaźniki mierzonej charakterystyki
d) w sytuacjach, w których celem pomiaru jest określenie istotnych cech badanych cech
40. jedyny, z kryteriów normalnych, branych pod uwagę przy tworzeniu testu jest współczynnik trudności
poszczególnych pozycji testowych. Jeżeli tworzymy test dla celów selekcji i mamy dużo kandydatów, a
możemy przyjąć najwyżej 10% to większość pozycji testowych z tego testu powinna być:
a) raczej trudnych
b) raczej łatwych
c) raczej o przeciętnej trudności
d) raczej o wysokim współczynniku rzetelności niż trafności
41. wiedząc, że w klasycznej teorii testów przyjmuje się wynik obserwowany = wynik prawdziwy + błąd
pomiaru, określ co powinno być podstawowym obowiązkiem autora testu:
a) dążenie do zwiększenia wyniku prawdziwego danej osoby,
b) dążenie do zmniejszenia błędu pomiaru
c) dążenia do zwiększenia wyniku obserwowanego
d) 
1. badanie testowe to:

a) sytuacja w której dokonuje się ilościowej obserwacji zachowania
b) sytuacja w której wywołuje się zachowania typowe dla określonej grupy
c) sytuacja w której dokonuje się celowej obserwacji zachowań traktowanych jako wskaźniki
mierzonej charakterystyki
d) sytuacja w której celem pomiaru jest określenie istonych cech badanych osób
2. która z poniższych definicji jest pełną i wyczerpującą def. Testu psychologicznego:

a) jest to kontrolowana ilościowa obserwacja zachowania
b) jest to obiektywny i standaryzowany pomiar próbki zachowania
c) jest to pomiar zachowania wybranej grupy ludzi
d) jest to kontrolowany pomiar reakcji w różnych sytuacjach zadaniowych
3. obiektywność jest jedyny z tzw. kryteriów dobroci testów psychologicznych. Aby spełnić warunek
obiektywności każdy test musi przynajmniej
a) zostać oparty na teorii mierzonej zmiennej
b) dawać porównywalne wyniki niezależnie od tego gdzie i kiedy jest stosowany
c) być obliczany w ściśle określonych warunkach
d) posiadać wysokie wskaźniki rzetelności i trafności
4. warunek standaryzacji, czyli koleje kryterium dobroci testów psychologicznych zostanie spełniony wtedy
gdy:
a) test będzie stosowany w jednolity sposób w stosunku do wszystkich osób badanych
b) test zostanie wyposażony w podręcznik zawierający opis zasad jego stosowania
c) test będzie stosowany odpowiednio do możliwości osoby badanej
d) test zostanie zastosowany tylko w takich sytuacjach w których jego wyniki będą miały praktyczną
użyteczność
5. jednym z kryteriów formalnych branym przy tworzeniu testu jest współczynnik trudności poszczególnych
pozycji testowych. Jeżeli chcemy zastosować test do selekcji kandydatów uwzględniając określony punkt
odcięcia to powinniśmy wybrać taki test, który składa się z pozycji testowych, których współczynniki
trudności wynosi:
a) 0,6
b) mieści się w zakresie 0-100%
c) jego średnia wartość wynosi 50%
……………………………………………………………………………………………………….
6. znajomość współczynnika mocy dyskryminacyjnej poszczególnych pozycji testowych pozwala nam na

a) wyeliminowanie pozycji należących do innego testu
b) wyeliminowanie pozycji mierzących inna zmienną niż zmienna testowa,
c) wyeliminowanie pozycji które nie różnicują badanej populacji
d) wyeliminowanie pozycji zbyt mocno różnicujące badane osoby
7. stosując współczynnik korelacji punktowo-dwuseryjnej, jako współczynnik mocy dyskryminacyjnej

trzeba pamiętać o tym, że:
a) wynik pozycji testowej powinien być z natury swej dychotomiczny
b) rozkład wyników pozycji testowej powinien być rozkładem dwumodalnym
c) wynik pozycji testowej powinien być zmienną ciągłą
d) rozkład wyników pozycji testowej powinien być rozkładem normalnym
8. w klasycznej teorii testów przyjmuje się założenie, że

a) błąd pomiaru = wariancja wyników testowych
b) błąd pomiaru ma charakter losowy
c) błąd pomiaru jest błędem stałym
d) błąd pomiaru jest równy odchyleniu standardowemu wyników testowych
9. określanie współczynnika rzetelności testu pozwala na ustalenie:

a) jaką część wariancji błędu stanowi wariancja prawdziwa
b) jaką część wariancji prawdziwej stanowi wariancja błędu
c) jaką część wariancji otrzymanej stanowi wariancja prowadzą
d) jaką część wariancji prawdziwej stanowi wariancja otrzymana
10. rzetelność jako miara dokładności pomiaru testowego testu jest technicznie wyrażana w postaci:
a) współczynnika zmienność
b) współczynnika korelacji
c) współczynnika zgodności
d) współczynnika regresji
11. metoda testów równoległych stosowana do oszacowania rzetelności testu pozwla na wyeliminowanie
wpływu:
a) zbyt wysokiej trudności pozycji testowych
b) pamięci i efektów uczenia się
c) szybkości rozwiązywania zadań
d) błędów o charakterze losowym, ujawniających się w sytuacji testowania
12. wysoki współczynnik korelacji pomiędzy dwoma testami równoległymi stosowanymi jeden po drugim
bez przerwy czasowej, świadczy o:
a) wysokiej fluktuacji mierzonej zmiennej w czasie
b) niskiej homogeniczności i wysokiej specyficzności
c) niskiej specyficzności i wysokiej homogeniczności
d) wysokim stopniu obiektywności testu
13. formuła spermana-browna jako metoda szacowania rzetelności testu jest rutynowo stosowana w technice:
a) podwójnego testowania
c) KR
d) 
14. standardowy błąd estymacji wyniku otrzymanego jest to:

a) różnica między estymowaną wartością wyniku prawdziwego a jego rzeczywistą wartością
b) różnica między wynikiem otrzymanym a wynikiem prawdziwym w teście
c) różnica między estymowanym wynikiem otrzymanym a wynikiem rzeczywistym
d) różnica między wynikiem rzeczywistym a wynikiem, który pomniejszono o błąd pomiaru
15. błąd standardowy różnicy jest to

a) różnica dwóch błędów standardowych
b) różnica dwóch błędów standardowych podniesionych do kwadratu, z których wyciągnięto
pierwiastek
c) suma dwóch błędów standardowych
d) suma dwóch błędów standardowych podniesionych do kwadratu z której wyciągnięto
pierwiastek
16. dokonując diagnozy na podstawie wyniku testowego, należy wziąć pod uwagę standardowy błąd pomiaru
ponieważ,
a) tylko w ten sposób można określić istotność otrzymanych wyników
b) pozwala on na dokładne określenie poziomu istotności wyniku prawdziwego,
c) dzięki niemu można określić wielkość błędu jakim jest obciążony wynik testu
d) pozwala on określić wielkość błędu jaki popełniany jest przy interpretowaniu wyniku
poszczególnych pozycji testowych
17. trafność testu to również jedno z kryteriów dobroci testów psychologicznych. Klasyczny podział
obejmuje następujące rodzaje trafności:
a) trafność treściową kryterialną i teoretyczną
b) trafność treściową fasadową i kryterialną
c) trafność treściową logiczną i wewnętrzną
d) trafność treściową diagnostyczną i prognostyczną
18. często zdarza się, że autorzy przeprowadzający badania danego testu uzyskują różne współczynniki
trafności kryterialnej. Jest to najczęściej spowodowane:
a) niskimi współczynnikami pozostałych rodzajów trafności
b) niskimi współczynnikami rzetelności testu
c) trudnościami w diagnozowaniu zachowania mierzonego przez test
d) faktem wybrania różnych zmiennych kryterialnych
19. w której z przedstawionych niżej sytuacji może dojść do zjawiska kontaminacji kryteriów:
a) psychiatra dokonując oszacowania wyników badanych osób ze względu na zmienną
kryterialną miał dostęp do wyników testowych
b) psychiatra dokonując oszacowania wyników badanych osób ze względu na zmienną kryterialną
znał podręcznik testowy
c) autor testu znał procedurę szacowania badanych osób ze względu na zmienną kryterialną
d) autor testu połączy ł wyniki otrzymane dla dwóch różnych zmiennych kryterialnych
20. trafność teoretyczna uważana jest za najważniejszy rodzaj trafności. Znajduje ona swoje odzwierciedlenie
w:
a) hipotezach dotyczących zachowania badanych osób tworzonych na podstawie istotnych dla
psychologa teorii psychologicznych
b) hipotezach dotyczących zachowania badanych osób tworzonych na podstawie teorii
mierzonej zmiennej
c) rezultatach badań nad rzetelnością teorii psychologicznej, która leży u podstaw testu
d) rezultatach badań nad trafnością teorii psychologicznej, która leży u podstaw testu
21. istnieje wiele rodzajów trafności. W zależności od celu testowania niektórych z nich mają większe
znaczenie. Dla którego z poniższych rodzajów testów określenie trafności będzie najbardziej pożądane:
a) testów projekcyjnych
b) testów inteligencji
c) testów zdolności werbalnych
d) testów wiadomości z matematyki
22. pojęcie normy w teście psychometrycznym odnosi się do:

a) wykonania typowego
b) wykonania idealnego
c) wykonania maksymalnego
d) wykonania oczekiwanego
23. wyniki standardowe za pomocą których można przedstawić wyniki uzyskane w teście otrzymane przez
osoby badane to:
c) wyniki wyrażone w terminach obiektywnych standardów
d) wyniki uzyskane za pomocą wystandaryzowanego narzędzia
24. aby znormalizowane wyniki testowe były użyteczne, tzn. można je był zinterpretować należy je odnieść
do:
a) rzetelności i trafności metody
b) treści pozycji tworzących test psychologiczny
d) innych metod testowych
25. steny to:

a) wynik surowy
15.Trafność kryterialna to inaczej:

c) trafność prognostyczna i diagnostyczna ,•
16.RzeteIność testu jest wyrażana w postaci:

d) różnicy pomiędzy dwoma wynikami
17.Aby znormalizowane wyniki testowe były użyteczne
odnosi się je do:
a) treści .pozycji tworzących test psychologiczny
c) zachowania wybranej, dobrze określonej
grupy
d) rzetelności 'i trafności metody
18.Kontaminacja kryterium najczęściej pojawia się, gdy:

b) psychiatra ma dostęp do wyników
testowych
c) łączy się wyniki dwóch różnych grup osób
badanych
d) łączy się wyniki pomiaru dwóch różnych
kryteriów
23.Znajomość współczynnika mocy dyskryminacyjnej
pozwala nam na:
a) wskazanie pozycji zbyt trudnych
b) wskazanie pozycji mierzących inną zmienną ,
c) wskazanie pozycji mierzących zachowania
pozatestowe
24. Jeżeli rozkład wyników surowych jest

rozkładem lewoskośnym, to w celu jego
normalizacji należy zastosować następującą
transformację:
a) pierwiastkową
b) logarytmiczną
c) potęgową
d) żadną z nich
25.Trafność teoretyczna testu znajduje swoje odzwier-

ciedlenie w:
a) hipotezach wyprowadzanych z teorii mierzonej
zmiennej
b) rezultatach analizy czynnikowej wyników
testowych
c) obu wymienionych możliwości
d) żadnej z wymienionych możliwości
26. Standardowy błąd estymacji wyniku

prawdziwego jest to:
a) różnica miedzy estymowaną wartością wyniku
prawdziwego a jego rzeczywistą wartością
19. Stosując współczynnik korelacji dwuseryjnej jako współczynnik mocy dyskryminacyjnej, musi
zostać spełnione założenie, że zmienna zdychotomizowana jest:
a) rzeczywiście ciągła i posiada rozkład normalny
b) ciągła, lecz nie o rozkładzie normalnym
20. Rzetelność testu można wyrazić jako:

a) stosunek wariancji prawdziwej do wariancji błędu
21.Wielkość standardowego błędu pomiaru zależy od:

a) odchylenia standardowego wyników testowych
c) obu możliwości
d) żadnej z możliwości
22. Jeżeli test jest zbyt trudny dla badanej grupy osób, to rozkład wyników w tym teście
będzie:
a) normalny
b) skośny
e) prostokątny
f) wielomodalny
23.Znajomość współczynnika mocy dyskryminacyjnej pozwala nam na:

e) wskazanie pozycji zbyt trudnych
f) wskazanie pozycji mierzących inną zmienną ,
g) wskazanie pozycji mierzących zachowania pozatestowe
h) wskazanie pozycji nietrafnych
24. Jeżeli rozkład wyników surowych jest rozkładem lewoskośnym, to w celu jego
normalizacji należy zastosować następującą transformację:
a) pierwiastkową
b) logarytmiczną
g) potęgową
h) żadną z nich
25.Trafność teoretyczna testu znajduje swoje odzwierciedlenie w:

27. Standaryzacja testu odnosi się do:

28. Współczynnik KR-20 to:

c) średnia wszystkich współczynników typu split-test
d) średnia wszystkich współczynników powyżej 0.8
29. Standardowy błąd pomiaru jest szczególnie użyteczny przy:
PSYCHOMETRIA CAŁOŚĆ POPRAWIONA
Pytania – Psychometria – Dzienni 2019
1. Jeśli korelacja między wynikiem prawdziwym i testowym dla danego testu

określono jako rtt=0,81, oznacza to, że:
a)
Współczynnik rzetelności dla tego testu wynosi 0,81
b)
Współczynnik rzetelności dla tego testu wynosi 0,9
c) Współczynnik rzetelności dla tego testu wynosi 0,6561
d) Nie wiadomo, ile wynosi współczynnik rzetelności
2.
W jakim przypadku wykonuje się transformację liniową?
a) Gdy wynik w teście nie ma rozkładu normalnego, ale do normalizacji wykorzystuje

się skale, które mają …rozkład
b) Gdy cecha nie ma rozkładu normalnego, ale do normalizacji wykorzystuje się skale,
które mają taki rozkład
c) Gdy ani wynik w teście, ani cecha nie mają rozkładu normalnego
d)
Gdy wynik w teście i cecha mają rozkład normalny
3.
Co oznacza „norma” w sensie psychometrycznym?
a) Norma wyznaczana jest przez teorię (koncepcję) psychologiczną
b) Norma wyznaczana jest przez zachowania zgodne z wzorami kulturowymi
c)
Norma wyznaczana jest przez standard ilościowy wyznaczony przez miarę
tendencji centralnej dla danej grupy
d) Norma wyznaczana jest przez osoby tworzące testy psychologiczne
4.
Który z poniższych rodzajów trafności testu weryfikuje się za pomocą metody
sędziów kompetentnych?
a) Trafność fasadowa
b)
Trafność treściowa
c) Trafność kryterialna
d) Trafność teoretyczna
5
.W którym przypadku istnieje największe ryzyko, że normy dla testu
psychologicznego mierzącego cechy osobowości staną się nieaktualne?
a) Gdy diagnosta będzie wykorzystywał test ponad 10 lat od momentu jego utworzenia
b)
Gdy diagnosta będzie chciał prowadzić badania elektronicznie, a oryginalna wersja
testu jest papierowa
c) Gdy diagnosta będzie wyliczał wyniki z badania papierowego w komputerze, a nie na

kartce
d) Gdy diagnosta będzie miał coraz większe doświadczenie w posługiwaniu się testem
6.
Jeśli Autorzy piszą, że oszacowali stabilność bezwzględną jako miarę
rzetelności badania, to co zrobili?
a) Obliczyli alfy Cronbacha
b) Policzyli korelacje między wersjami równoległymi testu badanymi z odstępem czasu
c)
Policzyli korelacje między dwoma badaniami tym samym testem z odstępem czasu
d) Policzyli korelacje między dwoma badaniami tym samym testem bez odstępu czasu
7.
Które z poniższych założeń NIE jest prawdziwe w odniesieniu do klasycznej
teorii testów?
a) Błąd pomiaru ma rozkład normalny
b) Średni błąd pomiaru wynosi zero
c)
Wielkość błędu pomiaru zależy od wyniku w teście
d) Poszczególne błędy pomiaru nie są ze sobą powiązane
8.
Testy, w których czas rozwiązywania jest ograniczony, a trudność zadań jest
przeciętna to inaczej:
a) Test szybkości
b) Test mocy
c) Testy wystandaryzowane
d) Testy właściwości afektywnych
9.
Jak należy zinterpretować współczynnik rzetelności testu równy 1,8?
a) Test jest wysoko rzetelny
b) Test jest nisko rzetelny
c)
Nie jest możliwe by współczynnik rzetelności przyjmował taką wartość
d)
Za mało informacji by móc je jednoznacznie zinterpretować
10. Jeśli dwóch diagnostów opracowujących wyniki tego samego badania (testu
tej samej…) dochodzą do tego samego rezultatu, to znaczy, że wykorzystany
test jest:
a)
Obiektywny
b) Nie obiektywny
c) Wystandaryzowany
d)
Nie wystandaryzowany
11. Na czym polega dywergencyjny aspekt trafności testu?
a) Wynik w teście jest wysoko skorelowany z innymi cechami mierzącymi podobne

cechy
b)
Wynik w teście jest nisko lub wcale skorelowany z innymi cechami,
mierzącymi
inne cechy
c) Wyniki testowe wpływają na pozycję jednostki w zakresie branego pod uwagę

kryterium
d) Kryterium dla testu jest pomiar zachowania/cechy aktualnie występującej u osoby

badanej
12. Wariancja pozycji testowej w testach właściwości poznawczych:
a) Jest największa dla pozycji najtrudniejszych
b) Jest największa dla pozycji najłatwiejszych
c)
Jest największa dla pozycji o przeciętnym poziomie trudności
d)
Nie zależy od poziomu trudności pozycji testowych
13. Który z poniższych rodzajów trafności ma aspekt zbieżny i rozbieżny?
a) Trafność fasadowa
b) Trafność treściowa
c) Trafność kryterialna
d)
Trafność teoretyczna
14. Przedział ufności dla wyniku obserwowanego jest tym mniejszy, im:
a)
Niższa jest rzetelność testu
b) Wyższy jest standardowy błąd pomiaru

c) Niższa jest pewność, z którą wynik prawdziwy ma się znajdować w tym przedziale mi
się wydaje że to jest poprawna odpowiedz
d)
Niższa jest trafność testu
15. Ile osób prawidłowo odpowie na pozycję z czterema odpowiedziami (1 właściwa),

jeśli trudność to 60% (przy założeniu zgadywania losowego)
a) 60%

b) 65%
c) 70%
d) 75%
16. Metoda adaptacji testu psychologicznego, która opiera się na stworzeniu nowego
na…o ten sam model teoretyczny co narzędzie oryginalne to:
a) Transkrypcja
b) Trawestacja
c)
Rekonstrukcja
d)Translacja
17. Termin „walidacja” odnosi się do:
a)
Badań trafności testu
b) Badań rzetelności testu
c) Badań normalizacyjnych
d)
Wszystkie odpowiedzi są prawidłowe
18. Która z cech testu wyznacza ramy interpretacji wyników badania jako natężenie
określonej ..
a) Rzetelność
b) Trafność - mieliśmy sprawdzać to z książką i prezentacją a to jest napisane jak byk w

prezentacji
c)
Normalizacja
d)
Adaptacja
19. Która z poniższych skal jest przykładem norm standardowych?
a)
Skala T
b) Skala rangowa
c) Skala centylowa
d)
Skala centymetrowa
20. W jakim przypadku używa się współczynnika korelacji punktowo-czteropolowej

jako współczynnika mocy dyskryminacyjnej?
a) Gdy zarówno rozkład cechy mierzonej przez daną pozycję testową, jak i rozkład

ogólnego…teście jest normalny
b) Gdy rozkład cechy mierzonej przez daną pozycję testową nie jest normalny, ale
rozkład ….wyniku w teście jest normalny
c)
Gdy zarówno rozkład cechy mierzonej przez daną pozycje testową, jak i rozkład
ogólnego wyniku w teście (nie jest normalny) tylko jest dyskretny - zmienna
dwukategorialna
d)
Gdy rozkład cechy mierzonej przez daną pozycję testową jest normalny, ale rozkład
ogólny…teście nie jest normalny
21. Które z poniższych założeń NIE odnosi się do testów równoległych?
a) Jednakowy średni wynik

b) Jednakowa wariancja wyników
c) Jednakowa trafność zewnętrzna
d
)Jednakowe pozycje testowe
22. Która cecha testu psychologicznego jest kluczowa dla tego, czy wynik
obserwowany odzwierciedla cechę psychologiczną którą miał mierzyć test?
a)
Rzetelność
b)
Trafność
c) Obiektywność
d)
Standaryzacja
23. Które określenie pasuje do kwestionariusza NEO-FFI?
a) Test właściwości poznawczych

b)
Test właściwości afektywnych
c) Test niewerbalny
d)
Test nieobiektywny
niejest związane ze stronniczością testu
24. Które z poniższych pojęć
psychologicznego?
a)
Występowanie błędu systematycznego pomiaru strona 102 na samej górze
“stronniczość testu to błąd systematyczny”
b) Występowanie różnic w wynikach testowych, gdy nie ma różnic w zewnętrznych

kryterium…
c) Występowanie różnic w trudności pozycji testowych dla różnych grup badanych
d) Występowanie błędu losowego pomiaru- stronniczość testunie oznacza błedu

losowego bowiem jest on dla wszystkich grup taki sam.
Pytania psychometria:
- Co to znaczy, że dwaj badacze dojdą do innych wniosków w tym samym tescie

- Dwa pytania o aspekt zbiezny i rozbiezny (gdzie jest, co oznacza) teoretyczna
- Pytanie o trafnosc (tresciowa chyba) sędziów kompetantnych
- Pytanie o normalizacje ( do czego jest potrzebna)
- Co to znaczy że rzetelność 1,8 nie może wynosić więcej niż 0,999
- Która skala jest standardowa (t
, centyle, centymetry, rangowa)
- T=50 ile to stenów
- Kiedy robimy tranformację liniową gdy rozkład jest normalny
- Kiedy stosujemy wskaznik dyskryminacyjny czteropolowy
- Co to znaczy, że badacz zrobił estymację bezwzględnej stabilności testu policzył korelacje
między dwoma badaniami tym samym testem, z odstepem czasu
- Co to znaczy, że zmniejszamy przedział ufności
- Kiedy największe zagrożenie dla testu (stosowanie starych norm, wersja
elektroniczna dla testu papier owego, itp.)
- Rzeczywista trudnosc testu 60% ile osób odpowiedziało dobrze na pytanie - 4
mozliwe odpowiedzi - 0,6 + 0,4 x ¼ = 06 + 0,1 = 0,7
- Cechy testów równoległych
- Pytanie o teorie testów - które założenie nie należy do teorii
- Pytanie o błąd standardowy
- Pytanie o test szybkości -
ograniczony czas i przecietna trudnosc
- NEO- FII jaki to przykład testu (wł. poznawczych, afektywnych, itp.)
- Jaka najlepsza wariancja błędu - wskaznik trudności w testach poznawczych 50%
- Co to znaczy, że testy równoległe korelują 0,81 - jaka jest rzetelność wysoka
- Pytanie o tworzenie nowego narzedzia przy adaptacji testu
1. Paremetry skali staniowej:

a) M=5,5, SD=2
b) M=5, SD=2,5
c) M=5,5, SD=2,5
d) M=5, SD=2
2. Błąd systematyczny to błąd, który ma taką sama wartość lub jego wartość jest
proporcjonalna … siły oddziaływania czynnika zakłócającego pomiar. W teorii rzetelności ten
rodzaj błędu
a) Nie jest brany pod uwagę (systematyczny to ten, co jest zawsze taki sam, więc nie
ma znaczenia)
b) Zależy od trafności testu
c) Ma istotne znaczenie
d) Zależy to od tego, co mierzy dany test
3. Analiza czynnikowa może być wykorzystywana jako metoda określania:

a) Obiektywności testu
b) Standaryzacji testu
c) Trafności testu
d) Rzetelności testu
4. Wynik w granicach 40-60 pkt w skali T uzyskuje około:

a) 68% osób z populacji
b) 95% osób z populacji
c) 98% osób z populacji
d) 99% osób z populacji
5. Które z poniższych twierdzeń jest prawdziwe?

a) Standaryzacja testu to procedura polegająca na uwzględnieniu standardowego błędu
pomiaru w procesie interpretacji wyniku testowego
b) Standaryzacja testu to procedura interpretowania wyniku testu w terminach wybranej
skali standardowej
c) Standaryzacja testu to procedura zbierania danych standaryzowanych
d) Standaryzacja testu to procedura polegająca na tworzeniu standardowych warunków
stosowania testu
6. Która z wymienionych niżej metod nie jest metodą badania rzetelności?

a) ……. Bezwzględna (Estymacja stabilności bezwzględnej)
b) ……. Względna (Estymacja stabilności względnej)
c) ……. Wyników prawdziwych - tak
d) ……. Między połówkowa
7. Wraz ze wzrostem homogeniczności grupy badanej danym testem jego rzetelności:
a) Nie ulega zmianie ?

b) Wzrasta
c) Maleje
d) Czasami wzrasta, czasami maleje- zależy od trafności testu
Homogeniczność nie świadczy o rzetelności testu. To Hornowska podkreślała, żeby się

nauczyć, więc na pewno nie maleje
8. Trafność treściowa to zakres w jakim pozycje testowe:

a) Spełniają warunek obiektywności
b) Reprezentują dziedzinę, która ma być przedmiotem pomiaru
c) Odzwierciedlają potencjalne kierunki interpretacji wyników testowych
d) Dostarczają informacji o tzw ‘’dobroci’’ testu
9. Rekonstrukcję
jako strategię adaptacji kulturowej testu charakteryzuje:
b) Przekład dopuszczający modyfikację językowe tam gdzie dosłowne tłumaczenie nie

jest możliwe
c) Swobodne tłumaczenie oryginału z wprowadzeniem wielu modyfikacji i zmian
sugerowanych względem język… psychologicznym
d) Konieczność opracowania nowego narzędzia od fazy analizy teorii i generowania
pozycji aż po analizę psychometryczną danych – test oryginalny jest jedynie inspiracją
adaptacji
10. Moc dyskryminacyjna pozycji informuje o tym, w jakim stopniu pozycja testowa:( nie
rozumiem pytania “ Moc dyskryminacyjnapozycji w teście jest miarą, dzięki której możemy
określić
jak dana zmienna, zadanie, pytanie wpływa na ogólny wynik mierzonej przez narzędzie
cechy czy umiejętności. Miara ta pozwala odpowiedzieć, czy i na ile wyższa wartość dla danej
pozycji jest związana z wyższym poziomem ogólnego wskaźnika danej skali (w skład której
wchodzi dana pozycja).”
a) ……. test ze względu na trafność
b) ……. test ze względu na mierzoną cechę
c) ……. populacje ze względu na mierzoną cechę??
d) ……. populację ze względu na trafność testu
11. ….. tzw. ,, instrukcji i szczerości” stosowana przy kontrolowaniu zmiennej aprobaty
społec…..:
a) ….. być stosowana na etapie konstrukcji kwestionariusza
b) Powinna być stosowana na etapie stosowania kwestionariusza
c) Zakłada stosowanie wyłącznie pozycji neutralnych pod kątem aprobaty społecznej
d) Jest metodą nieskuteczną i nie powinna być stosowana
12. Które z poniższych stwierdzeń

nie jest prawdziwe:
a) Skala centylowa ma rozkład równo prawdopodobny
b) Skala centylowa nie odzwierciedla kształt rozkładu wyników surowych
c) Skala centylowa różnicuje wyniki znajdujące się na końcach rozkładu
d) pozwala no ocenę pozycji osoby badanej w stosunku do pozycji innych osób
należących do populacji
13. Testy, w których podstawą

interpretacji wyników są dane pochodzące z przebadania
dobrze określonej grupy osób, to tzw testy: (s. 25)
a) Zorientowane na kryterium
b) Zorientowane na normy
c) Zorientowane na wymagania
d) Zorientowane na standard
14. Jeżeli wynik danej osoby w teście inteligencji jest równy 12, a pół przedział ufności dla
alfa=0,15 w tym teście wynosi 2, dla alfa = 0,10 wynosi 3, a dla alfa= 0.05 wynosi 4, to wynik
prawdziwy osoby A z 95% pewnością, znajduje się w przedziale:
a) (10-14)
b) (9-15)
c) (8-16) nie wiem
d) (12-12)
15. Wynik wyrażony w jednostkach tzw. dewiacyjnego ilorazu inteligencji to:

a) Wynik surowy
b) Wynik wyrażony w centylach
c) Wyraz wskazujący na upośledzenie sprawności umysłowych
d) Wynik wyrażony w jednostkach odchylenia standardowego ( jest wskaźnikiem
pokazującym w jednostkach odchylenia standardowego, w jakim stopniu pozostaje wynik
osiągnięty przez daną osobę do przeciętnego rozkładu wyników dla jej wieku)
16. Gdy test psychologiczny jest wykorzystywany do rekrutacji w konkretnej organizacji i

wykorzystywanie w tym celu normy zostały opracowane na próbie kandydatów tej
organizacji jest przykładem zastosowania norm:
a) Lokalnych
b) Narodowych
c) Instytucjonalnych
d) Organizacyjnych
17. Przyjęcie perspektywy emikalnej jako podstawy adaptacji testu oznacza akceptację
następującego poglądu:
a) Cechy będące przedmiotem pomiaru psychologicznego mają charakter uniwersalny i
dlatego można swobodnie …. Testy z jednego obszaru kulturowego co drugiego
b) Cechy będące przedmiotem pomiaru psychologicznego są kulturowo specyficzne i
dlatego procedura adaptacji ……. …….. uwzględniając specyfikę kulturową kraju do którego
testy jest przenoszony
c) Cechy będące przedmiotem pomiaru psychologicznego można traktować jako
uniwersalne lub specyficzne ….. od przyjętej teorii cechy
d) Cechy będące przedmiotem pomiaru psychologicznego można traktować jako
uniwersalne lub specyficzne ….. od przyjętych metod ich pomiaru
18. Wynik testowy równy 55 centynowi oznacza, że:

a) ..% osób uzyskało wyniki takie same lub wyższe od danego wyniku
b) ..% osób uzyskało wyniki niższe od danego wyniku
c) ..% osób uzyskało wyniki wyższe od średniego wyniku testowego??
d) ..% osób uzyskało wyniki niższe od średniego wyniku testowego
Powinno być chyba w odpowiedzi, że 55% uzyskało takie same lub niższe od danego
wyniku
19. Jeżeli konstruujemy test przeznaczony do diagnozowania dzieci z problemami
edukacyjnymi. Który następnie ma stać się podstawą do kierowania tych dzieci na specjalne
zajęcia dodatkowe to ten test powinien zawierać:
a) Dużo zadań bardzo trudnych
b) Dużo zadań bardzo łatwych
c) Dużo zadań o przeciętnej trudności
d) Trudność zadań wgl nie powinna być brana pod uwagę
20. Procedura nadawania znaczenia empirycznego konstruktom teoretycznym, to

procedura:
a) Pomiaru według klasycznej teorii testu
b) Określenia trafności testu
c) Operacjonalizacji
d) Określeniu rzetelności testu
21. Obiektywność testu jest pierwszym kryterium dobrości testu. Dany test spełnia warunek
obiektywności, jeżeli:
a) Daje obiektywne wyniki
b) Posiada wysokie korelacje z innymi wynikami testowymi
c) Oceniany przez różnych psychologów daje porównywalne wyniki
d) Pozwala na zastosowanie obiektywnego klucza oceny odpowiedzi
22. W poniższym zdaniu brakuje jednego wyrazu. Które z poniższych określeń należałoby
wstawić w to miejsce? „ Stopień w jakim test pozwala na pomiar nasilenia u osoby badanej
hipotetycznej właściwości to…………… testu.”
a) Trafność wewnętrzna
b) Trafność teoretyczna
c) Trafność logiczna
d) Trafność diagnostyczna
23. Jeżeli interesuje nas odpowiedź na pytanie, czy wszystkie pozycje testu mierzą się tą
samą cechą psychologiczną to możemy zastosować współczynnik rzetelności typu:
a) Test- retest
b) Dla norm równoległych
c) Homogeniczności
d) Połówkowania
24. Jeżeli diagnosta chce różnicować w obrębie wyników bardzo niskich lub bardzo
wysokich, to powinien posługiwać się testem, w którym normy zostały wyróżnione w skali :
a) Tetronowej
b) Staninowej
c) Stenowej
d) T
25. Aby można było stosować test dla celów diagnozy indywidulanej, to jego rzetelność
powinna oscylować wokół:
a) 0,9
b) 0,8
c) 0,7
d) 0,6
Tak, a dla celów niediagnostycznych np. badania naukowe min. 0,6
26. Homogeniczność testu mierzona współczynnikiem alfa Crombacha jest to miara:(Alfa

Cronbacha jest statystyką. Używa się jej zwykle do mierzenia wewnętrznej
spójności albo rzetelności psychometrycznego narzędzia.)
a) Rzetelność testu
b) Trafność testu
c) Zarówno rzetelnośc testu jak i trafność testu
d) Ani rzetelność ani trafnośc testu ???
27. Które z poniższych

nie
j
est prawdziwe:
a) Norma psychometryczna jest to standard ilościowy wyznaczony przez średnią lubi
inną miarę …
b) Norma psychometryczna jest to typowy wynik w teście?? wydaje się, że ta bo norma
to nie wynik norma (Normalizacja to zabieg
statystycznypolegający na ustaleniu zależności
między wynikami uzyskanymi za pomocą danego narzędzia (np. testu, kwestionariusza) a
wynikami średnimi w danej )
populacji
c) Norma psychometryczna opisuje właściwy poziom wykonywania testu - OLA - według
mnie ta odpowiedz nie jest prawidłowa. Nie ma czegoś takiego jak “właściwy poziom”
wykonania testu.
fakt, nie wiem jednak do końca
d) Norma psychometryczna pozwala na ocenę jaką osoba badana testem wypada na
tle
28. Tak zwany styl odpowiadania w kwestionariuszu jest to:

a) Obserwowana skłonność osób badanych do udzielania odpowiedzi diagnostycznych
b) Obserwowana skłonność osób badanych do udzielania odpowiedzi nie
diagnstycznych
c) Obserwowana skłonność osób badanych do udzielania odpowiedzi zależnie od treści
pozycji testowych
d) Obserwowana skłonność osób badanych do udzielania odpowiedzi niezależnie od
treści pozycji testowych
29. Trafność teoretyczna uważana jest za najwyższy rodzaj trafności. Znajduje się ona
swoje Odzwierciedlenie m.in. w :
a) Rezultatach badań nad rzetelnością teorii psychologicznej, która leży u podstawy
testu
b) Rezultatach badań nad trafnością teorii psychologicznej która leżu u podstawy testu
c) Hipotezach dotyczących zachowań badań osób tworzonych na podstawie istotnych
dla psychologa teorii psychologicznych
d) Hipotezach dotyczących wyniku badanych osób w teście tworzonych na podstawie
teorii mierzonej
30. Skłonność osób badanych do przypisywania sobie w samoopisach takich stwierdzeń

które są społecznie pożądane i odrzucanie tych, które są społecznie niepożądane jest
wyrazem:
a) Tendencji do symulowania
b) Tendencji do dysymulowania
c) Zarówno tendencji do symulowania to zależy od sytuacji w jakiej
d) Żadna z tych tendencji
31. Który z wymienionych niżej etapów niejest etapem analizy pozycji testowych?
a) Ustalenie czy pozycje testową da się wprowadzić z teorii mierzonej właściwości
psychologicznej
b) Sprawdzenie czy pozycja testowa jest poprawnie zredagowana
c) Określenie czy pozycja testowa jest homogeniczna
d) Obliczenie statystycznych wskaźników dla pozycji testowej
32. Pozycja testowa o otwartym formacie odpowiadania to pozycja:

a) która ma więcej niż dwie kategorie odpowiedzi
b) która ma tylko dwie kategorie odpowiedzi
c) nie ma określonej kategorii odpowiedzi osoba badana udziela odpowiedzi
spontaniczne
d) Która nie jest pozycją z wymuszonym wyborem tj. zawiera kategorie typu ‘’ nie
wiem’’, ‘’ nie mam zdania ‘’
33. Uzupełnij zdanie „podstawowym powodem …… jest podtrzymanie motywacji osoby

badanej w sytuacji rozwiązywania testu
a) Trafność teoretyczna
b) Trafność prognostyczna
c) Trafność fasadowa
d) Trafność diagnostyczna
34. Która z poniższych reguł

nie
należy do podstawowych zasad redagowania pozycji
testowych
a) Pozycje testowe nie powinny być zbyt długie
b) Pozycje testowe powinny być raczej zbudowane ze zadań prostych niż złożonych
c) Pozycje testowe nie powinny być formułowane w trybie oznajmującym
d) Pozycje testowe powinny być formułowane w języku dostosowanym do przeciętych
kompetencji języka badanych osób

a) Współczynnik korelacji pomiędzy wynikiem testowym, a wynikiem zmiennej
kryterialnej
b) Współczynnik korelacji pomiędzy wynikiem danej pozycji, a wynikiem innej pozycji w
tym teście
c) Współczynnik korelacji pomiędzy dwoma wynikami uzyskanymi w dwukrotnym
badaniu tej samej grupy samym testem
d) Współczynnik korelacji pomiędzy dwoma wynikami uzyskanymi na badaniu różnymi
testami
36. Współczynnik rzetelności jest operacyjnie wyrażany za pomocą:

a) Średniej arytmetycznej
b) Odchylenia standardowego
c) Wariancji
d) Współczynnika korelacji
37. Interpretując wynik otrzymamy w teście należy wziąć pod uwagę standardowy błąd
pomiaru ponieważ można w ten sposób określić wielkość błędu dla:
a) Pozycję testu
b) Wynik ogólny w teście
c) Współczynnika trafności w teście
d) Współczynnika rzetelności testu
38. Jeżeli nie ma żadnych innych wskazań, to średni współczynnik trudności pozycji
testowych sytuacji, gdy konstruowany test ma w maksymalnym stopniu różnicować badaną
populację powinien:
a) Mieścić się w zakresie od 0% do 100%
b) Wynosić około 50%
c) Zostać wyznaczony na podstawie rozkładu normalnego
d) Odpowiadać medialnie rozkładu wyników surowych w tym teście
39. Które z podanych niżej określeń niecharakteryzują norm typu wymagań?

a) Są oparte na analizie treści nauczania
b) Umożliwiają porównanie osiągnięć badanych osób z wymaganiami programowymi
c) Ich punktem odniesienia jest określona populacja osób
d) Pozwalają na określenie minimalnego poziomu kompetencji np. do wykonywania
własnego zawodu
40. Zaletą norm typu równoważniki wieku jest to, że:
a) Są równoważne teoretycznie wyznaczanemu punktowi odniesienia
b) Dostarczają informacji o poziomie mierzonej właściwości w jednostkach odchylenia
standardowego
c) Pozwalają na wyznaczenie standardu najlepszego wykonania testu
d) Osiągniecia osób badanych są traktowane rozwojowo
1Trafnosc kryterialna to :
Prognostyczna i diagnostyczna
2. Kiedy test jest coraz trudniejszy to znaczy ze wpływ na to ma:
Moc testu
3.Jeżeli wskaźnik wynosi 0,8
Rzetelność wysoka
4.Jaka trafność ma analize czynnikowa:
Teoretyczna
5.Test konweregencyjny
Wysoka korelacja z innymi testami
6.Wierne tłumaczenie tekstu to :
Translacja
7.Stronniczosc testu
Wpływa na pozycje testowe i na blad systematyczny
8.Co musi być w diagnozie indywidualnej a nie musi w diagnozie badawczej
Standaryzacja? normalizacja?
9.Punktowo dwuseryjny ( Wskaźnik korelacji punktowo dwuseryjnej przyjmuje wartości od -1
do 1 i powinien mieć wartość dodatnią dla odpowiedzi poprawnej oraz wartości ujemne dla
odpowiedzi niepoprawnych (dystraktorów). Najogólniej ujmując wskaznik ten pokazuje
relację pomiędzy wynikiem całego testu a wyborem konkretnej odpowiedzi w danym
zadaniu) a jakie było pytanie i odpowiedzi nie wiadomo
10 Wynik 50 na skali staninowej w tescie co oznacza tego nie rozumiem i nie mam pewności
czy pyanie było takie ???
Dałam 9 ale nie wiem co ma byc
11.Gdzie są rangi
W centylach
12.Jezeli dwie osoby sprawdzaja test i wychodza te same wyniki to znaczy ze test jest :
Obiektywny
13.Bląd pomiaru zaznaczyć złą odpowiedz (Charakterystyka błędu pomiaru to jedno z
najważniejszych zadań teorii Gulliksena i wogóle teorii pomiaru. Z rownania Z=T+E wynika
że błąd pomiaru to różnica pomiędzy wynikiem otrzymanym a wynikiem prawdziwym czyli
E=X-T)
14. rAZ = rBZ od czego jest :
Testy rownoległe
15.Jak robisz test połówkowy to co robisz pozniej
Alfe Cronbacha ,
16.
im mniejszy procent tym większy przedział ufności
17. Gdzie jest walidacja:
W trafności
18.Normą jest zachowanie
Standardowe
19.Normy lokalne
Miejsce zamieszkania jakies miasto (nie duża próba)
20. Ludzie dostali pytanie gdzie było 5 odpowiedzi, jedna prawidłowa, 80% zrobiła dobrze
(losowo wybierali odpowiedz) jaka jest trudność
Dałam najniższy wynik
21.Moc dyskryminacyjny (
Moc dyskryminacyjnapozycji w teście jest miarą, dzięki której
możemy określić jak dana zmienna, zadanie, pytanie wpływa na ogólny wynik mierzonej przez
narzędzie cechy czy umiejętności. Miara ta pozwala odpowiedzieć, czy i na ile wyższa wartość
dla danej pozycji jest związana z wyższym poziomem ogólnego wskaźnika danej skali (w skład
której wchodzi dana pozycja).
Roznicuje badanych -??
PSYCHOMETRIA jpdl więcej pytań nie było? 90% się powtarza
PYTANIA YOLO
Która z metod pozwala na największe zmiany w adaptacji ?

Rekonstrukcja a może trawestacja ??
Gdy zalezy nam na motywacji osoby badanej do rozwiązywania testow, to wazna jest?
Trafność fasadowa
1. Co to sa tetrony?
Jednostki skali standardowej, skala 21 punktowa, od 0 do 20, od -2,5 do 2,5 odchylenia
standardowego w rozkładzie normalnym 40% centyle?
"40% osob ma gorsze wyniki od tej osoby, ktora otrzymała wynik rowny 40 centylowi"
2. Wskaźnik mocy dyskryminacyjnej
Wysokie, dodatnie
3. Moc dyskryminacyjna?
Korelacja miedzy wynikiem pozycji testowej a wynikiem całego testu.
5. Rzetelność testu
Wskaźnik korelacji miedzy wynikiem dwoch badan tym samym testem tym samych ludzi.
6. X=T+E??
Zmniejszyć E
7. Które w standaryzacji stwierdzenie jest mniej istotne?
Dwie odp. Prawa autorskie, Wpadnie w rece niepsychologow
8. Standaryzacja
Jednolitość
9. Niski współczynnik korelacji miedzy testami A I B ( rownolegle)
( badanie po odstępie czasu)
Wysoka specyficzność pozycji testowych
10. Normy lokalne
Ścisle określone grupy ludzi -małe niereprezentatywna grupa ludzi
11. Normy
Zachowania typowe
12.Budowanie przedziału dla wyniku otrzymanego (wynik osoby - Z*SEM ; Z*SEM + wynik
osoby). jakie odp nie wiadomo
Rzetelność ? czemu? ktoś wyjaśni?
a nie powinien tu byc przedzial ufnosci dla bledu standardowego?
13.Porównanie dwoch ludzi, aby wybrac lepszego to:
Standardowy bład roznicy (minimalny)
14. Odniesienie pozycji testu do uniwersum?
Trafność tresciowa
15. Gdzie najwieksza jest trafność?
Odp. Test z historii??? co to jest
16. Analiza korelacji macierzy to:
Zbieżna i rozbieżna
17. Test – retest (wada)
Zapamiętywanie
18. Błąd we wzorze X=T+E
Losowy
19. Co nie jest w definicji testu ?
Odp. Wystandaryzowana skala ze średnią 100
.Definicja testu psychologicznego: jest to narzędzie obiektywne, wystandaryzowane, trafne,
rzetelne i znormalizowane, wyposażone w reguły obliczania wartości mierzonej cechy
psychologicznej oraz jasno określającej zakres i rodzaj dopuszczalnych zachowań ze strony
diagnosty. (podręcznik Hornowska)
20. Współ. Trudności testu ( gdy chcemy zastosować test do SELEKCJI)

Odp. Jest równy wyznaczonemu punktowi selekcji.
21 Trafność teoretyczna jak jest weryfikowana?
Hipotezy weryfikowane za pomocą teorii stojącej za testem jeżeli pytano o analizę różnic
międzygrupowych to tak
Mamy 5 rodzajów analizy testów teoretycznych:
Analiza różnic miedzygrupowych . - Metoda ta polega na weryfikowaniu hipotez
dotyczacych różnego zachowania się dwóch grup osób. Hipotezy te wyprowadzane są z
teorii mierzonej cechy, a badane grupy różnią się ze względu na ogólny wynik w teście
Analiza macierzy korelaci - analiza współczynników korelacji wyników analizowanego testu
z innymi testami.
Analiza czynnikowa- jej podstawą jest analiza korelacji
Analiza struktury wewnętrznej testu- analiza współczynników korelacji między wynikiem
każdej pozycji testu, a ogólnym wynikiem w tym teście.
22. która z poniższych definicji jest pełną i wyczerpującą definicją testu

psychologicznego?
d) jest to standaryzowany zbiór bodźców dla mierzalnych reakcji -SERIO TO?
Trafność fasadowa opisuje, jak spostrzegają test osoby badane i czy - z ich punktu widzenia
- wydaje się on trafnie mierzyć to, co ma mierzyć.

b) wyniki wyrażone w terminach odchylenia standardowegozdecydowanie to
str. 134 Hornowska
Norma opisuje poziom typowego wykonania testu przez osoby należące do określonej
grupy.
26 tetrony to wyniki standardowe wyrażone na skali
a) M=10 SD=2
b) M=10 SD=4
c) M=10 SD=1
d) M=10 SD=10
Skala tetronowa opisywana j /est przez średnią równą 10 i odchylenie standardowe równe
4. tetron=4z+10
27. wysoki współczynnik korelacji pomiędzy dwoma testami równoległymi
stosowanymi jeden po drugim, bez przerwy czasowej, świadczy o:
c) niskiej specyficzności i wysokiej homogeniczności pozycji testowych
d) ja by tu jeszcze dała że świadczy o wysokiej rzetelności ale nie znamy ostatniej
odpowiedzi
28. w metodzie testów równoległych, w odróżnieniu od metody test-retest
minimalizowany jest wpływ:
29. otrzymanie różnych współczynników trafności kryterialnej dla danego testu
jest najczęściej spowodowany:
a) faktem wybrania różnych zmiennych kryterialnych -to??????????????
30. test składa się z 10 pytań. Powinien dobrze różnicować w obrębie patologii.
Która z poniższych skal standardowych najlepiej pozwalałaby zrealizować ten cel:
a) M=10, SD=5
b) M=10 SD=1a nie to?
c) M=50 SD=10to jest skala T ona coś mówiła że ta najlepiej różnicuje
d) M=50 SD=25
b) suma 2 błędów standardowych podniesionych do kwadratu z których
wyciągnięto pierwiastek
c) różnica 2 błędów standardowych podniesionych do kwadratu z których wyciągnięto
pierwiastek
b) wysoko rzetelny
33. stanina to
a) wynik surowy
34. centyle to wyniki, które wskazują jaki procent osób z badanej grupy uzyska
wyniki:
35. określenie rzetelności testu pozwala na ustalenie:

c
) współczynnika korelacji
b) psychiatra ma dostęp do wyników testowych ??? “kontaminacja” oznacza
“połączenie”, także raczej nie ta odpowiedź. Najprawdopodobniej D, być może C.
kontaminacja oznacza “zakażenie”
Kontaminacja kryterium: wyniki testowe nie mogą wpływać na pozycję jednostki w zakresie
branego pod uwagę kryterium
d) łączy się wyniki pomiaru dwóch różnych kryteriów nie to??
40. stosując współczynnik korelacji dwuseryjnej, jako współczynnik mocy
dyskryminacyjnej, musi zostać spełnione założenie, że zmienna zdychotomizowana
jest:
b) stosunek wariancji otrzymanej do wariancji prawdziwej każda definicja wymienia
najpierw wariancje otrzymaną a potem prawdziwą, chyba to.
c) stosunek wariancji prawdziwej do wariancji otrzymanej nie to? to
odpowiedź c

c) obu możliwości
a) normalny
b) prostokątny
c) skośny
d) wielomodalny

c) wskazanie pozycji mierzącej zachowania pozatestowe

a) różnica między estymowaną wartością wyniku prawdziwego a jego rzeczywistą
wartością
c) obie definicje są prawdziwe nie to?
d) żadna definicja


a) średnia wszytskich współczynników typu test-retest
b) średnia wszytskich współczynników typu split-half

c) porównywaniu dwóch testów między sobą a nie to? oblicza sie przecież
standardowy błąd różnicy
1. testu przeznaczone do selekcji ze względu na specyficzne kryterium, powinny składać się

z pozycji testowych, których współczynnik trudności wynosi:
a) 0,5
1. dla którego z poniższych rodzajów testów, określenie trafności treściowej będzie

najbardziej odpowiednie

1. formuła spearmana-browna pozwala na określenie wpływu następujących zmiennych na

wielkość współczynnika rzetelności:
c) trafności testu
d) długości testu

a) M=5 SD=2
b) M=5 SD=4
c) M=5,5 SD=2
d) M=5,5 SD=4

a) M=5 SD=2
b) M=5 SD=4
c) M=5,5 SD=2
d) M=5,5 SD=4

a) M=50 SD=2
b) M=50 SD=4
c) M=100 SD=15
d) M=50 SD=10

c) w sytuacjach, w której dokonuje się celowej obserwacji zachowań traktowanych jako
1. jedyny, z kryteriów normalnych, branych pod uwagę przy tworzeniu testu jest
współczynnik trudności poszczególnych pozycji testowych. Jeżeli tworzymy test dla celów
selekcji i mamy dużo kandydatów, a możemy przyjąć najwyżej 10% to większość pozycji
testowych z tego testu powinna być:
a) raczej trudnych
b) raczej łatwych
c) raczej o przeciętenj trudności ?? sama nie wiem...
wiedząc, że w klasycznej teorii testów przyjmuje się wynik obserwowany = wynik prawdziwy
+ błąd pomiaru, określ co powinno być podstawowym obowiązekim autora testu:
d) J
badanie testowe to:

c) sytuacja w której dokonuje się celowej obserwacji zachowań traktowanych jako

b) jest to obiektywny i standaryzowany pomiar próbki zachowania hmm??
2. . obiektywność jest jedyny z tzw. kryteriów dobroci testów psychologicznych. Aby

spełnić warunek obiektywności każdy test musi przynajmniej
1. warunek standaryzacji, czyli koleje kryterium dobroci testów psychologicznych zostanie

spełniony wtedy gdy:
d) test zostanie zastosowany tylko w takich sytuacjach w których jego wyniki będą miały
praktyczną użyteczność
1. jednym z kryteriów formalnych branym przy tworzeniu testu jest współczynnik trudności
poszczególnych pozycji testowych. Jeżeli chcemy zastosować test do selekcji kandydatów
uwzględniając określony punkt odcięcia to powinniśmy wybrać taki test, który składa się z
pozycji testowych, których współczynniki trudności wynosi:
a) 0,6
1. znajomość współczynnika mocy dyskryminacyjnej poszczególnych pozycji testowych

pozwala nam na
b) wyeliminowanie pozycji mierzących inna zmienną ni-ż zmienna testowa,
1. s0

1. metoda testów równoległych stosowana do oszacowania rzetelności testu pozwla na

wyeliminowanie wpływu:
1. wysoki współczynnik korelacji pomiędzy dwoma testami równoległymi stosowanymi jeden

po drugim bez przerwy czasowej, świadczy o:

wartością
d) różnica między wynikiem rzeczywistym a wynikiem, który pomniejszono o błąd
pomiaru

b) różnica dwóch błędów standardowych podniesionych do kwadratu, z których
d) suma dwóch błędów standardowych podniesionych do kwadratu z której wyciągnięto
pierwiastek
1. dokonując diagnozy na podstawie wyniku testowego, należy wziąć pod uwagę

standardowy błąd pomiaru ponieważ,
1. trafność testu to również jedno z kryteriów dobroci testów psychologicznych. Klasyczny

podział obejmuje następujące rodzaje trafności:
1. często zdarza się, że autorzy przeprowadzający badania danego testu uzyskują różne
współczynniki trafności kryterialnej. Jest to najczęściej spowodowane:
b) niskimi współcz ynnikami rzetelności testu

b) psychiatra dokonując oszacowania wyników badanych osób ze względu na zmienną
kryterialną znał podręcznik testowy
c) autor testu znał procedurę szacowania badanych osób ze względu na zmienną
kryterialną
1. istnieje wiele rodzajów trafności. W zależności od celu testowania niektórych z nich mają
większe znaczenie. Dla którego z poniższych rodzajów testów określenie trafności będzie
najbardziej pożądane?

1. wyniki standardowe za pomocą których można przedstawić wyniki uzyskane w teście
otrzymane przez osoby badane to:
1. aby znormalizowane wyniki testowe były użyteczne, tzn. można je był zinterpretować
należy je odnieść do:
1. steny to:
a) wynik surowy
Jeśli współczynnik rzetelności wynosi 0,8, to znaczy, że:

- zmienna wyjaśnia 80% wariancji, a 20% to błąd
Jaką miarę statystyczną wykorzystujemy do badania rzetelności?

- współczynnik korelacji
Jak na rzetelność testu wpływa homogeniczność badanej grupy?

- ujemnie
Oblicz przedział ufności jeżeli alfa wynosi 0,9.

- przedział ufności = 1 - alfa = 1 - 0,9 = 0,1
Zbuduj standardowy błąd pomiaru, jeżeli zα/2 = 2, a SEM = 0,4.

- błąd pomiaru = zα/2 x SEM = 2 x 0,4 = 0,8
Kiedy wykorzystujemy błąd standardowy różnicy?

- gdy chcemy porównać 2 wyniki ze sobą
Co to jest kontaminacja kryterium?

zanieczyszczenie - wyniki testowe nie mogą wpływać na pozycję jednostki w zakresie
Jakieś nazwisko mamy zapamiętać Kennet P...
Co to jest symulacja i dysymulacja?

dysymulowania • Jest to świadoma lub nieświadoma tendencja osoby badanej do
przedstawiania się w nieprawdziwie korzystnym świetle
symulowania • Jest to świadome lub nieświadome udzielanie odpowiedzi, bezpodstawnie
przedstawiających osobę badaną w niekorzystnym świetle, np. wskazujących na istnienie
określonych zaburzeń zachowania czy niepożądanych cech osobowości
Jeżeli współczynnik trudności testu wynosi t = 90%, to test jest:

- łatwy (90% osób potrafi na niego odpowiedzieć)
Optymalny współczynnik trudności testu wynosi:

- t=ok.50%
Do analizy różnic międzygrupowych wykorzystujemy:

- test t studenta
Co mierzą korelacyjne współczynniki mocy dyskryminacyjnej?

- korelacje danej pozycji z ogólnym wynikiem w teście
Jakie wartości tych korelacji nas interesują?

- wysokie dodatnie
Czym jest test psychologiczny? - definicja
Pomiar testowy jest pomiarem:

- pośrednim (mierzymy zachowanie - wnioskujemy o konstrukcie)
Prawa osoby badanej:

- ma być poinformowany o tym, że ktoś go ocenia (czynniki motywacyjne)
Prawa badającego:
- ściśle określony zakres dopuszczalnych zachowań
Podział testów wg. kryteriów formalnych
Co to jest obiektywność, standaryzacja, rzetelność, itd.
Na czym polega metoda badania obiektywności "ślepa diagnoza"?
Znać wzór X = T + E - co oznaczają
Dobra rzetelność:
- gdy współczynnik rzetelności wynosi conajmniej 0,8.
Metody badania rzetelności
Czym się kierować ustalając długość przerwy czasowej między testem a retestem?
- żeby zminimalizować skutki zapamiętywania swoich odpowiedzi i zminimalizować efekty
uczenia się nowych rzeczy (optymalny czas - od 2 tyg. do 6 miesięcy)
Jak uczenie się wpływa na wielkość współczynnika rzetelności?

- nie doszacowuje go
Gdy alfa Cronbacha (współczynnik zgodności) jest duża:

- jednowymiarowa struktura testu
Gdy jest mała:

- wielowymiarowa struktura testu
Rodzaje trafności
Do analizy homogeniczności testu (trafność teoretyczna) wykorzystujemy:

alfę Cronbacha - tą samą co przy rzetelności
Podział norm ze względu na grupę odniesienia

- ogólnokrajowe i lokalne
Podział norm ze względu na sposób konstruowania - dokładnie się nauczyć z interpretacją

przedziałów liczbowych
Norma w psychometrii ma charakter:

- statystyczny
Sposoby konstruowania testów
Poza tym trzeba znać dokładnie tą tabelkę o skalach T, stenach, Staninach, itp. - może być
pytanie np. ile % wariancji wyjaśniają wyniki znajdujące się pomiędzy 40 a 60 na skali T,
albo pomiędzy 3 a 7 na skali staninowej (68,26%).
1. Rozkład leptokurtyczny wyników testu zdolności wskazuje, że zawiera on dużo:

a) Wyłącznie pozycji o dużej trudności
b) Wyłącznie pozycji o małej trudności
c) Wyłącznie pozycji o przeciętnej trudności
d) Wyłącznie pozycji o dużej i małej trudności
2. Rozkład platokurtyczny wyników testu wykazuje :

a) Pozycje wykazują zbyt niskie dodatnie skorelowanie
b) Pozycje wykazują zbyt wysokie dodatnie skorelowanie
c) Pozycje wykazują ujemne skorelowanie
d) Pozycje są praktycznie nieskorelowane
3. Rzetelnośc pomiaru testem jest w klasycznej teorii testów determinowana jako:

a) Stosunek wariancji wyników prawdziwych do wyników otrzymanych
4. Zgodnie z klasyczną teorią testów źródłem wariancji prawdziwej są:

a) Wariancje pozycji testowych
b) Kowariancje pozycji testowych
c) Średnia pozycji testowych raczej to
d) Wskaźnik trudności pozycji testowych
5. Zastosowanie wzoru Rulona do oszacowania rzetelności pomiaru testem wymaga

spełnienia założenia
a) o równoległości połówek testowych
b) o równoważności połówek testowych
c) o quasi – równoważności połówek testowych
d) o quasi – trudności połówek testowych
6. Do strategii kulturowej adaptacji testów zaliczamy:

a) Transedukcję
b) Translakację
c) Transportację
d) Translacja
7. Tranwersacja jest metodą adaptacji kulturowej testu, która zakłada,

a) Wierne tłumaczenie pozycji testowych
b) Opracowanie całkiem nowego narzędzia na podstawie oryginalnego testu
c) Swobodne tłumaczenie testu oryginalnego z wprowadzeniem wielu modyfikacji
d) Opracowanie nowego narzędzia opierającego się na oryginalnej teorii
8. W przypadku rekonstrukcji przyjmowane są założenia o kulturowej:

a)
Równoważności konstruktu teoretycznego i równoważności pozycji testowych
b) Równoważności konstruktu, ale nie równoważności pozycji testowych
c) Nie równoważności konstruktu ale równoważności pozycji testowych
d) Nie równoważności konstruktu i nie równoważności pozycji tekstowych
9. Metoda badania struktury czynnikowe pozycji jest stosowana do badania

a) Trafności kryterialnej pomiaru testem
b) Trafności teoretycznej pomiaru testem
c) Trafności treściowej pomiaru testem
d) Rzetelności pomiaru testem
10. W celu skonstruowania testu o najwyższej trafności kryterialnej najbardziej

adekwatna jest
a) Strategia wewnętrzna
b) Strategia teoretyczna
c) Strategia zewnętrzna
d) Strategia teoretyczno-indukcyjna
11. Jeżeli wyniki skali badającej tendencję do poszukiwania wrażeń są istotne
statystycznie wyższe u alpinistów niż bibliotekarzy, to świadczy to o jego wysokiej
trafności pomiaru :
a) Teoretycznej
b) Treściowej
c) Prognostycznej
d) fasadowej
12. analiza tzw. zmian nieprzypadkowych jest stosowana do oszacowania:
a) trafności fasadowej pomiaru testu
b) trafności teoretycznej pomiaru testu
c) trafności treściowej pomiaru testu
d) rzetelności pomiaru testem
Jednym ze sposobów określenia trafności diagnostycznej pewnego testu jest:

- zbadanie korelacji tego testu z innym testem badającym tę samą ceche
Jaki sposób szacowania trafności teoretycznej dotyczy liczby wymiarow opisujących dane
zjawisko psychologiczne?
- analiza struktury czynnikowej testu
Wyobraz sobie, ze w tescie wiadomości który wlasnie rozwiązujesz znajduja się jedynie
pytania dotyczące trafności. Taki test ma NIEwystarczajaca trafność:
- tresciową
Krzywa charakterystyczna pozycji, która jest wyjatkowo stroma:

- obrazuje taka pozycje testowa która dobrze roznicuje badanych.
Które z poniższych pojec odnosi się dop korelacji pomiedzy dana pozycja testowa a
ogolnym wynikiem testu?
- moc dyskryminacyjna
Tesu Test psychologiczny:

-sklada się z pozycji testowych, sposobu ich wykorzystania i regul obliczania
wynikow.
W strategii zewnętrznej tworzenia kwestionariuszy kryterium danej cechy może Stanowic:

- inna zmienna zewnetrzna względem tworzonego kwestionariusza
Standaryzacja testu oznacza:

- jednolitość warunkow i instrukcji badania a także pomocy testowych i zasad
oblicznia wynikow.
Czy w indywidualnej diagnozie testowej zawsze konieczne jest wyznaczanie przedzialu
ufności dla wyniku prawdziwego?
- tak, zawsze
Błąd systematyczny:
- nie ma nic wspolnego z mierzona cecha psych. I wynika ze stalych cech narzędzia.
Pozycje testowe w narzędziu o wysokiej rzetelności szacowanej na podstawie zgodności
wewnętrznej sa:
- skorelowane ze soba
Rzetelność testu to:

- stopien dokładności, z jaka określony test dokonuje pomiaru
Metoda test- retest szacowania rzetelności polega na:

- dwukrotnym badaniu tym samym testem tej samej grupy osob
Szacowanie rzetelności na podstawie zgodności wewnętrznej polega na:

- określaniu zgodności odpowiedzi na wszystkie pozycje testowe w danym tescie.
Jaki sposób szacowania rzetelności testu rozwiazuje problem zapamietywania przez

badanych swoich odpowiedzi z poprzednich badan?
- formy rownolegle
Im wieksza rzetelności testu tym szerokość przedzialu ufności obliczonego dla dowodlnego
wyniku otrzymanego:
- jest mniejsza
Zaleta metody połówkowej w porównaniu z innymi metodami szacowania rzetelności jest:

- wieksza ekonomiczność gdyz wystarczy tu pojedyncze badania jednym testem
podzielonym na dwie czesci
W której z poniższych sytuacji info o trafności prognostycznej testu jest szczególnie istotna?
- przewidywanie powodzenia kandydatow w przyszłej pracy.
Jaki sposób szacowania trafności teoretycznej dotyczy liczby wymiarow opisujących dane
zjawisko psychologiczne?
- analiza struktury czynnikowej testu
Wyobraz sobie, ze w tescie wiadomości który wlasnie rozwiązujesz znajduja się jedynie
pytania dotyczące trafności. Taki test ma NIEwystarczajaca trafność:
-tresciową
Jeżeli wyniki uzyskane na podst. Jednego testu pozostaja w silnym związku z wynikami
uzyskanymi w innym tescie przeznaczonym do pomiaru podobnej cechy, wówczas można
przypuszczac ze test ma wysoka:
- trafność zbiezna
Jakie własności ma rozklad standardowy z?

- jest to rozklad normalny o średniej 0 i odchyleniu standardowym 1.
Stronniczość testow psych.:

- oznacza ze grupy wyodrebione ze względu na pochodzenie społeczne roznia się miedzy
soba ze względu na przeciętne wyniki otrzymane w danym tescie, podczas gdy przeciętne
wyniki prawdziwe tych grup nie roznia się ????
Wykonales pewien test inteligencji, a Twój wynik wyniosl 43 punkty. Liczba ta nie ma
zadnego znaczenia bez znajomości:
- standardu statystycznego, czyli normy.
Skala stenowa sklada się z:

- 10 jednostek (stenow)
Średni wynik wyrażony w skali stenowej pewnego testu inteligencji jest:

- jest taki sam dla populacji Polaków i Niemców
Normy empiryczne:
- ukazuja pozycje jednostki w probie normalizacyjnek i pozwalaja na ocene jej
wynikow z innymi osobami
Rezultat IQ= 115 oznacza, że:

- Jest to wynik o jedno odchylenie stand. Lepszy od wyniku średniego.
W diagnozie indywidualnej konieczne jest:

- wyrażenie wyniku OB. Odwołując się do aktualnych norma dla określonej populacji.
W którym odchyleniu standardowym znajduje się wynik rowny 3 stenowi?

- w drugim poniżej średniej
Test mocy to:

- test składający się z pozycji o rosnącej trudnosci; często bez ograniczenia
czasowego.
Krzywa charakterystyczna pozycji, która jest wyjatkowo stroma:

- obrazuje taka pozycje testowa która dobrze roznicuje badanych.
Które z poniższych pojec odnosi się dop korelacji pomiedzy dana pozycja testowa a
ogolnym wynikiem testu?
- moc dyskryminacyjna
Przekonanie badanych na temat tego co test mierzy to:

- trafność fasadowa
Czy w Polsce osoba nie bedaca psychologiem może stosowac testy psych.?
- nie
Trafność testu to:

- Stopien w jakim test jest zdolny miezryc to co w zalozeniu miał mierzyc.
Test psychologiczny:
-sklada się z pozycji testowych, sposobu ich wykorzystania i regul obliczania
wynikow.
W strategii zewnętrznej tworzenia kwestionariuszy kryterium danej cechy może Stanowic:

- inna zmienna zewnetrzna względem tworzonego kwestionariusza
Standaryzacja testu oznacza:

- jednolitość warunkow i instrukcji badania a także pomocy testowych i zasad
oblicznia wynikow.
Każdy test psych. Daje:

- oszacowanie wyniku prawdziwego określone z pewnym prawdopodobieństwem.
Czy w indywidualnej diagnozie testowej zawsze konieczne jest wyznaczanie przedzialu

- tak, zawsze
Błąd losowy:
- wpływa na rzetelność narzędzia
Duza wartość standardowego bledu pomiaru SEM wskazuje na:

- niska rzetelność testu
Jedno z założeń klasycznej teorii testow mowi o nieskorelowaniu Bledu pomiaru i wyniku
prawdziwego. Oznacza to ze:
- mierzac rozne wartości danej cechy nie można określić wielkości Bledu
Jaki jest związek miedzy rzetelnością testu a jego trafnością?

- test trafny jest zawsze rzetelny, ale test rzetelny nie zawsze jest trafny
Co to jest „wynik prawdziwy” testu?

- srednia rozkładu nieskończonej liczby pomiarow jednej osoby wykonanych przy
uzyciu tego samego testu
Szacowanie rzetelności na podstawie zgodności wewnętrznej polega na:

- określaniu zgodności odpowiedzi na wszystkie pozycje testowe w danym tescie.
Im wieksza rzetelności testu tym szerokość przedzialu ufności obliczonego dla dowodlnego
wyniku otrzymanego:
- jest mniejsza
Zaleta metody połówkowej w porównaniu z innymi metodami szacowania rzetelności jest:

- wieksza ekonomiczność gdyz wystarczy tu pojedyncze badania jednym testem
podzielonym na dwie czesci
Który z poniżej wymienionych testow obciążony jest najmniejszym Bledem pomiaru w
zalozeniu ze wariancje wynikow [prawdziwych i otrzymanych sa jednakowe we wszystkich
przypadkach?
- test o rzetelności 0.93.???
nie wiem jakie są inne warianty.
· Test psychologiczny to:

- narzedzie składające się z pozycji testowych, sposobu ich wykorzystania i reguł
obliczania wynikow.
· Każdy dobry test psychologiczny powinien cechowac się:
– wysoka rzetelnością, trafnością i aktualnymi normami
Celem standaryzacji procedury testowania jest:

- możliwość porównywania wynikow roznych osob
Czy w indywidualnej diagnozie testowej zawsze konieczne jest wyznaczanie przedzilau

- tak zawsze
Pozycje testowe w narzędziu o niskiej rzetelności szacowanej na podstawie zgodności

wewnętrznej sa:
- slabo ze soba skorelowane
Bład systematyczny:
- ma stala wartość dla roznych osob badanych
Wysoka wartość Bledu losowego pomiaru zawsze zwiazana jest z:

- niska rzetelnością tego testu
Standardowy bład pomiaru to:

- bład który popełniamy wtedy, gdy zakladamy ze prawdziwym wynikiem osoby
badanej jest sredni wynik nieskończonej liczby pomiarow
Po co użytkownikowi testu potrzebne sa informacje o jego rzetelnosci?

- aby zorientowac się jak dokładny jest pomiar wykonany tym testem
Jeżeli test jest trafny to wynika stad, ze jest również:

- rzetelny
Wedlug klasycznej teorii testow srednia arytmetyczna bledow pomiaru nieskończenie

wielkiej liczby pomiarow wynosi 0. Oznacza to, ze:
-??? – Nie wiem
w klasycznej teorii testów badacz powinien zakładać, że błąd pomiaru ma średnią zero i

rozkład normalny i zależy jedynie od błędu losowego
Wynik prawdziwy to:

- wynik obciążony bledem pomiaru.
Wynik otrzymany:
- to wg, klasycznej teorii testow suma wyniku prawdziwego i Bledu pomiaru
W trakcie opracowywania psychometrycznego kwestionariusza objawowo nerwicowych

przeprowadzono badanie w którym jego uczestnicy dwukrotnie w odstępie sześciu miesięcy
wypelniali opracowany kwestionariusz. W ten sposób określono:
- stabilność bezwgledna kwestionariusza
Metoda testow równoległych szacowania rzetelności polega na:

- opracowaniu dwoch wersji tego samego narzędzia mierzacych te sama ceche w ten
sam sposób, ale z zastosowaniem innej tresci pozycji testowych.
W jakiego typu analizie stosowany jest wzor α- Cronbacha?

- oszacowanie zgodności wewnętrznej à bookreślaja spójność pozycji wchodzących w
skład danej skali
Metoda polowkowa pozwala na ocene:

- rzetelnosci testu
· Po co oblicza się przedzial ufności?
- gdyz każdy wynik testowy jest obciążony błędem
· Im wyzsza wartość wskaźnika rzetelności:
- tym wyzsza rzetelność
· Psycholog bioracy udzial w procesie rekrutacji do pracy w policji na stanowisko

detektywa jest zainteresowany tym aby wybrac kandydatow, którzy najlepiej poradza
sobie na tym stanowisku pracy. Jedna z metod Selekcji jest kwestionariusz psych. Jaki
rodzaj trafności będzie w tym przypadku najważniejszy dla psychologa?
- trafność prognostyczna
1) Normy są to wyniki przeliczone pozwalające określić natężenie cechy u badanej

osoby w odniesieniu do natężenia typowego dla:
a) próby, z której pochodzi badana osoba
b) próby, z której pochodzą inne badane osoby
c) populacji, z której pochodzi badana osoba
d) żadna z powyższych odpowiedzi nie jest prawidłowa
2) „Procedura wiązania terminów teoretycznych (dotyczących własności

nieobserwowalnych) z terminami obserwacyjnymi” - jest to definicja:
a) pomiaru według klasycznej teorii testu
b) pomiaru według teorii odpowiedzi na pytania testowe
c) operacjonalizacji
d) diagnozy
3) Badanie aspektu zbieżnego i różnicowego jest metodą określania trafności:

a) diagnostycznej
b) teoretycznej
c) prognostycznej
d) treściowej
4) Skala stenowa ma:

a) średnią 5 i odchylenie standardowe 2
b) średnią 5,5 i odchylenie standardowe 2
c) średnią 5 i odchylenie standardowe 1
d) średnią 5,5 i odchylenie standardowe 1
5) Sten pierwszy w skali stenowej to wyniki mieszczące się:

a) pół odchylenia standardowego poniżej średniej
b) jedno odchylenie standardowe poniżej średniej
c) dwa odchylenia standardowe poniżej średniej
d) trzy odchylenia standardowe poniżej średniej
sten pierwszy jest mieści się od -4 do -2.

SD = 2 więc dwa odchylenia mieszczą się właśnie od -2 do -4
6) „Dokładność, z jaką mogą być przeprowadzane sensowne i istotne pomiary, w tym

znaczeniu, że dokonywane pomiary dotyczą rzeczywiście cech, które chciano mierzyć” - jest
to definicja:
a) rzetelności
b) trafności
c) dokładności
d) mocy dyskryminacyjnej
7) W psychometrii, „normalne” znaczy tyle co:

a) zdrowe, niezaburzone, niekliniczne
b) przeciętne, typowe, najczęstsze
c) pożądane, zalecane, poszukiwane
d) idealne, wartościowe, doskonałe
8) Tłumaczenie, w którym tłumacz zobowiązany jest zadbać o odpowiedniość zarówno

pomiędzy morfemami, jak i strukturami gramatycznymi, zwiemy tłumaczeniem:
a) pragmatycznym
b) estetycznym
c) etnograficznym
d) lingwistycznym
9) Wskaźnik „alfa Cronbacha” nadaje się do badania testów, w których odpowiedzi dokonuje
się:
a) tylko na skali dychotomicznej Tak - Nie
b) tylko na skali porządkowej z najmniej pięcioma kategoriami
c) zarówno na skali dychotomicznej, jak i porządkowej z co najmniej pięcioma kategoriami
d) zarówno na skali dychotomicznej, jak i porządkowej z dowolną liczbą kategorii
10) Metodą adaptacji testu, którą cechuje największa możliwa wierność oryginałowi, jest
a) transkrypcja
b) translacja
c) trawestacja
d) rekonstrukcja
11) Wynik w granicach 85-115 w dewiacyjnym ilorazie inteligencji uzyskuje około:

a) 68% populacji
b) 95% populacji
c) 98% populacji
d) 99% populacji
12) Rzetelność testu jest to stosunek:

a) wariancji prawdziwej do wariancji ogólnej
b) wariancji otrzymanej do wariancji ogólnej
c) wariancji prawdziwej do wariancji otrzymanej
d) wariancji otrzymanej do wariancji prawdziwej
13) W teorii odpowiedzi na pozycje testu, parametr theta dotyczy:

a) prawdopodobieństwa określonej odpowiedzi
b) natężenia cechy
c) trudności pozycji testowej
d) losowości odpowiedzi
14) Które z poniższych stwierdzeń jest prawdziwe?

a) Trafność kryterialna dzieli się na diagnostyczną i prognostyczną
b) Trafność treściowa dzieli się na teoretyczną i kryterialną
c) Trafność prognostyczna dzieli się na kryterialną i diagnostyczną
d) Trafność teoretyczna dzieli się na kryterialną i treściową
15) Analiza różnic międzygrupowych, zastosowana do badania trafności, służy do określania

trafności:
a) treściowej
b) teoretycznej
c) związanej ze zmianami nie przypadkowymi testu
d) jeszcze innej
1. Kto ustala narzędzia pomiarów wg ustawy

-
Ustawa o zawodzie psychologa i samorządzie zawodowym psychologas.220 Hornowska
2. Diagnoza nomotetyczna / idiograficzna

Przedmiot pomiaru psychologicznego
• Podejście nomotetyczne do kultur (uniwersalistyczne – etic approach)
• Podejście idiograraficzne do kultur (specyficzne – emic approach)
Podejście nomotetyczne
• Do porównywania wpływu kultury potrzebne są pojęcia ogólne, będące aproksymacją pojęć
specyficznych, lecz oparte na wspólnym układzie odniesienia
• Uzasadnione są takie działania, jak:
- adaptacja narzędzi diagnostycznych, przenoszonych z innej kultury wraz z zapleczem teoretycznym i
literaturowym,
- przyswajanie teorii psychologicznych (o których się apriorycznie zakłada, iż są na tyle ogólne, że trafne są w
każdych warunkach społeczno-kulturowych),
- stosowanie „podkulturowych” technik terapeutycznych, itd.
Podejście idiograficzne
• Analizy wpływów kultury należy dokonywać bazując na pojęciach wypracowanych przez daną społeczność,
gdyż kultura jest integralną częścią ludzkich zachowań
• Uznaje się istnienie specyficznych kulturowo czynników etiologicznych, czynników (kultur)
immunizujących członków danej społeczności przeciwko zaburzeniom psychicznym lub im
sprzyjających
• Wiąże się to także z przekonaniem o kulturowo specyficznych rodzajach osobowości, uzdolnień,
rodzajach zaburzeń i/lub specyficznych ich manifestacji, ich terapii;
• Wiąże się z niezgodą na implantację obcych (kulturowo) narzędzi diagnostycznych, teorii, systemów
klasyfikacji zaburzeń itp.
3. Student uczył się tylko 3 wykładu z psychometrii a tego nie było na egzaminie. Odczuwa
teraz: trafność treściowa...stronniczość pytań. raczej nie stronniczość pytań
wydaje mi się że chodzi tu o błąd losowy -> konstrukcja testu

s.42 Hornowska
4. Do korelacji czego używamy: w Kendalla.. też pearsona i spearmana ale nie wiem gdzie
przykleić to pytanie
4. Jeśli zwiększymy ilość pytań to rzetelność : zwiększy się s. 60 H
5. Co to jest rzetelność pomiaru - rzetelność oznacza zgodność wyników otrzymanych

przez te same osoby, które zostały przebadane kilka razy tym samym testem
6. Co to błąd standardowy pomiaru… wiem co to systematyczny i losowy
7. Jakie są prawidłowe nazwy: zewnętrzna (kryterialna) wewnętrzna (indukcyjna)
8.Co to jest moc dyskryminacyjna -współczynnik mocy dyskryminacyjnejto stopień, w jaki

pozycja testowa różnicuje daną populacje. Moc dyskryminacyjna pozycji w teście jest miarą, dzięki
której możemy określić jak dana zmienna, zadanie, pytanie wpływa na ogólny wynik mierzonej przez
narzędzie cechy czy umiejętności. Miara ta pozwala odpowiedzieć, czy i na ile wyższa wartość dla
danej pozycji jest związana z wyższym poziomem ogólnego wskaźnika danej skali (w skład której
wchodzi dana pozycja).
9. Co to jest analiza czynnikowa- C

elem analizy czynnikowej jest zredukowanie dużej
liczby zmiennych losowych do mniejszego zbioru, Założenie - grupy zmiennych losowych
reprezentują zmienność tych samych czynników, czyli zmienne losowe w danej grupie są od
siebie w pewnym stopniu zależne.
10. Co to jest format odpowiedzi
11. Jaka trudność pytań w mocy dyskryminacyjnej - W

praktyce - średnia trudność testu
powinna oscylować wokół 50%. Jeśli test ma służyć do celów selekcyjnych - trudność
powinna być dostosowana do pożądanego współczynnika selekcji
12. Co to jest trafność treściowa

- TREŚCIOWA (inaczej wewnętrzna, logiczna; content validity)
Ocena (na podstawie pomiaru testowego) całokształtu zachowań, których próbkę pobiera test np.
ocena wiadomości z matematyki na przykładzie konkretnego zadania
13. Metoda wielu cech wielu metod zbieżna i różnicowa

Analiza macierzy korelacji Macierz Wielu Cech – Wielu Metod
Pomiar kilku cech przy użyciu kilku kwestionariuszy.
Aspekt zbieżny i różnicowy trafności: ZBIEŻNY (konwergencyjny) - gdy można wykazać wysoką korelację
z innymi testami, mierzącymi podobne cechy R
ÓŻNICOWY (dywergencyjny) - gdy można wykazać niską
korelację z innymi testami, mierzącymi inne cechy
14. Aprobatę społeczną można traktować jako styl LUB cechę osobowościową
15. Wartości ważne dla stenów:M = 5,5, SD = 2
16. Wartości dla tetronów:M = 10, SD = 4
17. Co to jest błąd bliskości - ?błąd szacowania?
18. Najlepszy najbardziej dokładny test będzie miał badacz co przyjmie

prawdopodobieństwo 0,1 ; 0,5; 0,15, ;
0,01 (niby zaznacza się najniższy wynik ale nie wiem)
w klasycznej teorii testów badacz powinien zakładać, że błąd pomiaru ma średnią zero i
rozkład normalny i zależy jedynie od błędu losowego s.44
19. Były podane dwie rzetelność jedna 0,5 druga 0,8 ile razy więcej trzeba dać pytań aby
wzrosła rzetelność : dwukrotnie, pięciokrotnie
s.61
1. Który test ma coraz trudniejsze zadania ? mocy: nieograniczony czas i zadania coraz
trudniejsze. W teście mocy czas jest ograniczony a zadania średnie, zadań jest dużo i nikt
nie kończy rozwiązywać go przed upływem czasu.
2. Co to są normy lokalne? wytłumaczone na stronie 133

klasa -> budynek -> system (klasa i budynek są bardziej lokalne niż system)
3. 50 na skali T to ile na skali staniowej? Odp. 5
4. Jeśli zbadali metoda połowkową a chca dowiedziec się więcej to czym badać: odp. alfa
Cronbacha i richardsona
5.Jak rtt= 0,8 to jaki współczynnik rzetelności –wysoki
6.Jeśli korelacja między wynikiem prawdziwym a testowym dla danego testu określono jako
rttt=0,81 - współczynnik rzetelności tego testu wynosi 0,81
7. przedział ufności : musi być szerszy im chcemy mieć większą pewność
Co to jest walidacja. Określenie trafności danego testu - O

kreślanie trafności danego testu.
Zbieranie i ocena danych świadczących o trafności określonej interpretacji wyników testu. Im więcej
przeprowadzonych danych, tym szerszy potencjał zastosowania testu
8. Trafność diagnostyczna i prognostyczna - w trafności kryterialnej
9. Sposoby badania trafności teoretycznej - różnice międzygrupowe
10.Która z wymienionych jest skalą rangową ? odp centylowa
11.ZBIEŻNY (konwergencyjny) - gdy można wykazać wysoką korelację z innymi testami,

mierzącymi podobne cechy
12.Współczynnik trudności :jedna odpowiedź poprawna chyba z 4 możliwych, 70% dobrych

odpowiedzi to jaki poziom trudności? 60%
13.Najbardziej dokładne przetłumaczenie testu: transkrypcja
14.Co to znaczy czy rAZ=rBZ

testy są równoległe
1. Steny to wyniki standardowe wyrażone na skali

a
)M=5 SD=2
b) M=5 SD=4
c) M=5,5 SD=2
d) M=5,5 SD=4
2. jednym z kryteriów formalnych branym przy tworzeniu testu jest współczynnik trudności poszczególnych
pozycji testowych. Jeżeli chcemy zastosować test do selekcji kandydatówuwzględniając określony punkt
odcięciato powinniśmy wybrać taki test, który składa się z pozycji testowych, których współczynnik trudności
wynosi:
a) 0,6
d)
jest równy wyznaczonemu punktowi selekcji
jeszcze było pytanie takie samo jak to, tylko “ ”

jeśli chcemy zróżnicowania dużego odp. :największe
zróżnicowanie jest przy 50%.
Prezentacja: W praktyce - średnia trudność testu powinna oscylować wokół 50%. Jeśli test ma służyć do celów selekcyjnych
- trudność powinna być dostosowana do pożądanego współczynnika selekcji
3. jedyny, z kryteriów normalnych, branych pod uwagę przy tworzeniu testu jest współczynnik trudności poszczególnych pozycji
testowych. Jeżeli tworzymy test dla celów selekcji i mamy dużo kandydatów, a możemy przyjąć najwyżej 10% to większość
pozycji testowych z tego testu powinna być:
a) raczej trudnych
b) raczej łatwych
4. Tworzymy test, na potrzebę organizacji, by zbadać jakie osoby są najlepsze. Tylko wewnątrz organizacji.
Jakiego typu normy będą
- norma organizacyjna
- norma lokalna
-norma globalna
- norma instytucjonalna
Normy są tylko ogólnokrajowe i lokalne s.133
5. Pytanie o prawidłowy(?) wskaźnik rzetelności:

a) 0,6
b) 0,7
c) 0,8
d) 0,9
każdy z nich jest prawidłowy chociaż w testach psychologicznych wynik oscyluje w granicach 0,8
6. Ktoś otrzymał w teście wynik 12. Przedział ufności 90 miał wynik 6, przedział inny miał wynik 8; a przedział 95
miał wynik 4 (czy cos takiego) i w jakim przedziale mieści się osoba, gdy p=0,05
a) (6; 8)
b)
(8,16)
c) 10, 14
d) 12; 12
7) im większa homogeniczność grupy tym:

a) rzetelność wzrasta
B) rzetelność maleje
C) cos o trafności
D) nie ma związku
im bardziej homogeniczna – pod względem mierzonej cechy- grupa, tym mniejszy będzie otrzymany przez nas
współczynnik rzetelności testu .62
8. Chcemy zbadać dzieci wybitnie inteligentne, by przydzielić je do różnych zajęć dodatkowych, Jakie powinny
być pytania?
a) Bardzo trudnych zadań
b) bardzo łatwe
c) Trochę łatwych trochę trudnych
d) Trudność pytań nie ma znaczenia
9. Badanie naukowe (test naukowy) to:

a). wskaźniki mówiące o charakterystykach (coś takiego)
10. Pytanie o etikalne

Etikalne=uniwersalne kulturowo -> tylko takie zachowania wchodzą do finalnego etapu adaptacji testu
11. Która odpowiedź jest prawdziwa: Wynik prawdziwy

a) koreluje z błędem
b) nie koreluje z wynikiem obserwowanym
c) wynik prawdziwy nie koreluje z błędem
d) że wynik prawdziwy zależy od błędu
błąd pomiaru nie ma nic wspólnego z mierzoną cechą psychologiczną ale wpływa na wynik testowania
(prezentacja)
12. coś o nadawanie znaczenia wynikom testowym…

a) operacjonalizacja
b) rzetelność
c) trafnosc
d) normalizacja
Normalizacja - nadawanie znaczenia wynikom testowym
13. Uzupełniana o tym przewidywaniu wyników ? Jaka to trafność ?

(nie wiem co to za pytanie)
a) diagnostyczna
b) prognostyczna
c) treściowa
d) teoretyczną
Trafność diagnostyczna - w jakim stopniu test diagnozuje poziom określonej cechy występujący u
danej jednostki
Trafność prognostyczna - w jakim stopniu test przewiduje zachowanie jednostki w sytuacji poza
testowej
Trafność treściową - zwaną też trafnością wewnętrzną - określana jest poprzez stwierdzenie, czy
test jako całość ujawnia takie zachowanie osoby badanej, które będzie zgodne z tą cechą, którą
objęto badaniami.
Trafność teoretyczną - czy dany test został zredagowany zgodnie z daną teorią psychologiczną,
która legła u podstaw jego tworzenia
14Na skali … dane zawarte między 6-14 zawierają się w przedziale: (TO BĘDZIE ZALEŻEĆ OD SKALI,
6SIGMA: albo 66%, albo 95% albo 99,99%)
a) 68%
b) 85
c) 95
15. Międzygrupowa korelacja to trafność

a) tresciowa
b) teorytyczna
c) krytyczna
16. Alfa cronbacha do

a) rzetelności
b) trafności
c) jedno i drugie
17) Pytanie o rzetelność, ktore

nie dotyczy
:
a) stabilność względna
b) stabilność bezwzględna
c) międzypołówkowe cos tam
d) cos tam wynikow prawdziwych
estymacja stabilności względnej i bezwzględnej; analiza równoważności między połówkowej - to dotyczy

rzetelności
18. Miara czego jest (czy o czym mówi) dewiacyjny iloraz inteligencji:
b) wyniku surowego.
c) niedorozwój umysłowy
Dewiacyjny iloraz inteligencji (standaryzowany) jest wskaźnikiem pokazującym w jednostkach odchylenia

standardowego, w jakim stopniu pozostaje wynik osiągnięty przez daną osobę do przeciętnego rozkładu
wyników dla jej wieku.
18. Jeśli chcemy zmierzyć wyniki skrajne (największy rozstrzał wyników to używamy )
a) T
b) staniny
c) steny
d) Tetrony
19. Pytanie o błąd systematyczny w stosunku do rzetelności, czy jest:

a) istotny
b) nieistotny
c) to zależy od celu testowania (czy coś takiego)
wynik w teście zawsze jest obarczony pewnym błędem. W różnych sytuacjach testowania w taki sam sposób wpływa na
wyniki testowania. Czyli wpływa na rzetelność ale nie jest istotne bo nie nie ma nic wspólnego z mierzoną cechą
psychologiczną.
20. Które zdanie jest nieprawdziwe o centylach

a) różnicują na końcach rozkładu s.148
b) nie porównuje wyników surowych
21. Które zdanie jest nieprawdziwe o normach
a) dobry wynik
nie jest „dobry” tylko typowy
23. O czym mówi parafraza- jako narzędzie adaptacji

a) swobodne tłumaczenie .... jako narzędzie adaptacji
b) maksymalne wierne tłumaczenie
c) konieczność opracowania narzędzia, które wzoruje sie na wersji pierwotnej
Parafraza - Konieczność opracowania nowego narzędzia od fazy analizy teorii i generowania pozycji, aż po
analizę psychometryczną danych - test oryginalny jest jedynie inspiracją adaptacji. Celem adaptacji jest
maksymalne wierne oddanie intencji autora odnośnie treści konstruktu psychologicznego (rola teorii
psychologicznej). Zakłada się, że konstrukty psychologiczne są uniwersalne kulturowo, ale z reguły nie są
uniwersalne zachowania (tylko część z nich ma charakter etikalny, tj. równoważny kulturowo i tylko te mogą
wejść do finalnej wersji adaptacji).
24. test afektywny

a) brak dobrej odpowiedzi
Testy właściwości afektywnych: bada czucia, postawy, osobowość, emocje, wierzenia itd.
Brak odpowiedzi obiektywnie prawidłowej
25. Jak konstruować pytania o szczerość, czyli o APROBATĘ społeczną:

a) dać pozycje neutralne
b) w trakcie badania kwestionariuszem (to trochę też pasuje ale instrukcje jednak tworzy się wcześniej więc jeśli
miałabym wybrać to zaznaczyłabym D)
c) w trakcie tworzenia kwestionariusza
Na etapie konstrukcji kwestionariusza:

• Pozycje neutralne
• Pozycje subtelne pod względem trafności fasadowej
• Specjalne formułowanie językowe pozycji
• Wprowadzanie odpowiedniej instrukcji
• Analiza korelacji pozycji ze skalami mierzącymi aprobatę społeczną
Na etapie stosowania kwestionariusza:
• Wprowadzanie odpowiedniej instrukcji, tzw. instrukcja "szczerości"
• Skala kontrolna aprobaty społecznej (odrzucanie respondentów o wysokich wynikach lub
korygowanie wyników skal treściowych przez doliczanie tzw. poprawek korekcyjnych
26. Kontaminacja kryterium pojawia się najczęściej, gdy:

b) badający ma dostęp do wyników
kiedy znajomość wyników jakie osoba badana uzyskała w teście może wpływać na ocenę wyniku tej osoby względem
analizowanej zmiennej kryterialnej s. 91 Hornowska
27. Coś o wartości 55 centyli

a) że świadczy o 55% wyniku i wyższym… nie pamiętam dokładnie
b)45%
c) uzyskali wynik 55 bądź mniejszy
28. w metodzie testów równoległych w odróżnieniu od metody test-retest minimalizowany jest

wpływ(albo coś w tym stylu)
a)
b)
pamięci i uczenia się
c)
d)
29) moc dyskryminacyjna

a)
jak dobrze rónicuje populacje
b) różnicuje wynik testu na poziomie mierzonej cechy
30) Style odpowiadania

a)odpowiada niezależnie od treści pytań
31) Standaryzacja
a)
posiada podrecznik
b) jednolitość przeprowadzania procedury badania NIE BYŁO TAKIEJ ODP (
było coś o jednolitym
stosowaniu testu wobec wszystkich badanych ale to zle) - dlaczego?
dlaczego jednolite stosowanie wobec kazdej osoby badanej to zlaodp??
bo Standaryzacja procedury badania
testem :Stosując test należy dokładnie
przestrzegać wszystkich zasad
i procedur opisanych w podręczniku
a do czego by było to jednolite stosowanie?
32) Standaryzacja
a
) polegającą na tworzeniu standardowych warunków stosowania testu
33) Standaryzacja
b) jednoliotość
34) Analiza macierzy korelacji

a)trafność teoretyczna
35) Procedura nadawania znaczenia empirycznego konstruktom teoretycznym

36) Zgodnie z klasyczna koncepcja wyniku prawdziwego, wynik otrzymany:

a) jest wiekszy od wariancji bledu to
?bo wariancja wyniku otrzymanego = wariancja wyniku
prawdziwego + wariancja bledu, wiec logicznie otrzymany jest wiekszy od samego bledu?A to nie tak ze
prawdziwy powinien być większy od błędu (który powinien być najmniejszy) ? Niezbyt mi to jako pasuje, bo to tak jakby
definiować pojęcie innym pojęciem do zdefiniowania. Ja bym dała któraś odp z tych innych
b) jest oszacowaniem czegos tam- wyniku prawdziwego…?
`PSYCHOMETRIA jpdl więcej pytań nie było? 90% się powtarza

PYTANIA YOLO
Która z metod pozwala na największe zmiany w adaptacji ?f

Rekonstrukcja
Gdy zalezy nam na motywacji osoby badanej do rozwiązywania testow, to wazna jest?
Trafność fasadowa
40% cen
tyle?
"40% osob ma gorsze wyniki od tej osoby, ktora otrzymała wynik rowny 40 centylowi"

Wysokie, dodatnie
1. X=T+E
Zmniejszyć E
1. Standaryzacja
Jednolitość
1. Niski współczynnik korelacji miedzy testami A I B ( rownolegle)

( badanie po odstępie czasu)
1. Normy lokalne
Ścisle określone grupy ludzi
1. Normy
Zachowania typowe
Rzetelność ? czemu? ktoś wyjaśni?

a nie powinien tu byc przedzial ufnosci dla bledu standardowego?

Standardowy bład roznicy (minimalny)


Odp. Test z historii

Zapamiętywanie

Losowy


Hipotezy weryfikowane za pomocą teorii stojącej za testem
1. która z poniższych definicji jest pełną i wyczerpującą definicją testu psychologicznego?

a) jest to obiektywny i standaryzowany pomiar próbki zachowaniaja bym dala to ja tez
d) jest to standaryzowany zbiór bodźców dla mierzalnych reakcji -SERIO TO?
b) wyniki wyrażone w terminach odchylenia standardowego zdecydowanie to
1. wysoki wspólczynnik korelaccji pomiędzy dwoma testami równoległymi stosowanymi

jeden po drugim, bez przerwy czasowej, świadczy o:
1. w metodzie testów równoległych, w odróżnieniu od metody test-retes minimalizowany jest
wpływ:
1. otrzymanie różnych współczynników trafności kryterialnej dla danego testu jest
najczęściej spowodowany:
a) faktem wybrania różnych zmiennych kryterialnych -to??????????????

pierwiastek
pierwiastek
b) wysoko rzetelny
1. stanina to
a) wynik surowy

b) psychiatra ma dostęp do wyników testowych ??? “kontaminacja” oznacza
“połączenie”, także raczej nie ta odpowiedź. Najprawdopodobniej D, być może C.
kontaminacja oznacza “zakażenie”
Kontaminacja kryterium: wyniki testowe nie mogą wpływać na pozycję jednostki w zakresie
d) łączy się wyniki pomiaru dwóch różnych kryteriów nie to??
1. stosując współczynnik korelacji dwuseryjnej, jako współczynnik mocy dyskryminacyjnej,
musi zostać spełnione założenie, że zmienna zdychotomizowana jest:
Czym jest test psychologiczny? - definicja
a) osoba uczestniczy dobrowolnie

- świadoma w jakim celu
- sytuacja tworzona do celów w której wywołuje się zachowania typowe pod
względem tej charakterystyki jaka ma być przedmiotem celowej obserwacji
- od diagnosty nie wymaga się osobistego zaangażowania jasno okreslony czas i
rodzaj
zachowań


Prawa badającego:
Podział testów wg. kryteriów formalnych
Co to jest obiektywność, standaryzacja, rzetelność, itd.

standaryzacja- dokładne , szczegółowe określenie procedury
procedura badaniem testóem
procedura obliczaniem wyników
procedura interpretowania wyników
obiektywność - niezależność wyników testowania( kto , gdzie i kiedy ich dokonuje)
- test jest obiektywny jeżeli dwie osoby dochodzą do tego samego rezultatu
- test musi posiadać klucz oceniania odpowiedzi zmniejszający do minimum wpływ
subiektywnych interpretacji
rzetelność- dokładność pomiarów( niezawodność) zgodność otrzymanych przez te same
osoby , które badane były kilka razy tym samym testem
powtarzalność wyników - psychometrii
trafność - określenie obszaru testu , dokładność z jaką test mierzy to co ma mierzyć
- wskazuje na wielkość błędu
- odzwierciedla relację jaka zachodzi między ( adekwatność operacjonalizacji wielkości
psychologicznej
Na czym polega metoda badania obiektywności "ślepa diagnoza"?

- Techniką badania stopnia obiektywności jest technika tzw. ślepej diagnozy.
Znać wzór X = T + E - co oznaczają
Dobra rzetelność:
- gdy współczynnik rzetelności wynosi co najmniej 0,8.
Metody badania rzetelności

- metoda połówkowaKudera Richardsona a Cronbacha - ( wariancja błędu - dobór
treści , liczba pozycji testowych
- powtarzanie testu jedno po drugim ( wariancję błędu - czynniki losowe)
- powtarzanie testu w odstępie czasowym( wariancja błędu - dobór treści )
- wersje alternatywne w odstępie czasu ( wariancja błędu - dobór treści i
zmienności w czasie )
- zgodność ocen sędziów( wariancję błędu różnice w ocenach między sędziami)
- żeby zminimalizować skutki zapamiętywania swoich odpowiedzi i zminimalizować
efekty uczenia się nowych rzeczy (optymalny czas - od 2 tyg. do 6 miesięcy)

Gdy jest mała:

Rodzaje trafności
- treściowa - wewnetrzna , logiczna
- kryterialna
- ocena czy osoba posiada lub bedzie włsciwośc psych.
- teoretyczna -pomiar nasilenia hipotetycznej właściwości


Podział norm ze względu na sposób konstruowania - dokładnie się nauczyć z

interpretacją przedziałów liczbowych
- typu standardowego -oparte o rozkład normalny
- typu rangowego - oparte o częstość i rozkład jednostajny
- typu równoważnikowego
- normy wymagań

- statystyczny
- jest standard ilościowy, wyznaczony przez średnią , mediane lub inna miare
tendencji centralnej obliczona dla grupy przedstawicieli danego typu
Sposoby konstruowania testów
Poza tym trzeba znać dokładnie tą tabelkę o skalach T, stenach, Staninach, itp. -
może być pytanie np. ile % wariancji wyjaśniają wyniki znajdujące się pomiędzy 40 a
60 na skali T, albo pomiędzy 3 a 7 na skali staninowej (68,26%).
1. Kto ustala narzędzia pomiarów wg ustawy

2. Diagnoza nomotet/ idiograficzna
3. Student uczył się tylko 3 wykładu z psychometrii a tego nie było na egzaminie.
Odczuwa teraz: trafność treściowa...stronniczość pytań
4. Do korelacji czego używamy: w kendalla
5. Jeśli zmniejszymy ilość pytań to rzetelność
- się zmniejszy
- zwiększy
- nie zmieni się
6. Zadanie na poprawkę zgadywania
8. Co to jest rzetelność pomiaru

- wynik obserwowany ( otrzymany w tescie ) nigdy nie jest idealnym odzwierciedleniem
rzeczywistej wartości mierzonej cechy - zawsze jest oabrczony pewnym błedem
9. Co to błąd standardowy pomiary
- SEM=S XV 1 - r tt
- SEM - STANDARDOWY bład pomiaru
- S x odchylenie standardowe wyników testowych
- r
tt-rzetelność testu
10. Obliczyć przedział ufność wyników podane było z jakim prawdopodobieństwem i
sem
11. Jakie są prawidłowe nazwy: ze kryterialna to zewnętrzna a wewnętrzna do
indukcyjna
12. Co to jest moc dyskryminacyjna
13. Co to jest analiza czynnikowa
14. Co to jest format odpowiedzi
15. Jaka trudność pytań w mocy dyskryminacyjnej
16. Co to jest trafność treściowa
17. Metoda wielu cech wielu metod zbieżna i różnicowa
18. Aprobatę społ można traktować jako styl LUB cechę osobowościową
19. Wartości ważne dla stenow 5,5, i 2
20. Wartości dla tetronów 10,4
21. Transkrypcja – wierna kopia
22. Wierność tłumaczenia co zawiera a właściwie były cechy podane i trzeba było
wybrać pod jaka to wierność
23. Pytanie do rozwiązania coś o inteligencji w jakiej się ktoś połówce mieści z
wynikami
24. Co to jest błąd bliskości
25. Najlepszy najbardziej dokładny test będzie miał badacz co przyjmie
prawdopodobieństwo 0,1 ; 0,5; 0,15, ;0,01
26. Były podane dwie rzetelność jedna 0,5 druga 0,8 ile razy więcej trzeba dać pytań
aby wzrosła rzetelność : dwukrotnie, pięciokrotnie
27. Diagnostyczna brak odstepstw czasowych
28. Było pytanie o coś co najlepiej opisuje i były odp walidacja krzyżowa , sama
walidacja
29. Co będzie skutkiem jeśli pomiary z jednego badania naniesiemy na drugie :
zmieni się trafność, rzetelność , wszystkie czynniki
30. Pytanie i odp prawidłowa, że własność pomiaru a nie cecha narzędzie
31. Jakieś zadanie do pomyślenia z kwestionariuszem FCZ-KT.
1. Transkrypcja– odp. Bierność formy i treści

2. co decyduje że narzędzie jest testem ustawy: odp. Komisja ekspertów
3. Analiza czynnikowa – wyłonienie wymiarów
4. co zrobić żeby określić że pozycje są treściowo związane z czynnikiem – odp:
walidacja (prawda)
5. Leon 16, Ervin 12, SD 10, rtt – 0,98 – odp: istotnie wyższe od Ervina (nie
rozumiem tego???)
6. wynika w teście 25, 15 błędów, liczba możliwych 4, poprawka na zgadywanie
– odp: 20 (nie rozumiem tego???)
7. poziom istotności wskazujący na najmniejszy błąd wnioskowania - odp: 0,01
(prawda)
8. czym będzie rozczarowany student jeżeli na egzaminie nie pojawi się pytanie
z rozdziału którego się uczył? – odp: trafnością treściową egzaminu (raczej prawda)
9. format odpowiedzi – odp: liczba kategorii odpowiedzi (nie rozumiem tego???)
10. policzyć przedział ufności prawdopodobieństwo 0,95 SEM przy 0,6 wynik
otrzymamy 20 – odp: 14,26
12. zwielokrotnienie testu rtt – 0,5, Uttn – 0,8 – odp 4
13. co oznacza rzetelność – odp: stosunek wariancji prawdopodobieństwa do
otrzymania (wg mnie i wg ksiazki to jest rzetelność- dokładność pomiarów
(niezawodność) zgodność otrzymanych przez te same osoby , które badane były
kilka razy tym samym testem)
14. co oznacza SEM – standard odchylenie błędu pomiaru wokół wyniku
otrzymanego (standardowy błąd pomiaru po prostu)
15. przeniesienie pomiaru z jednej na drugą – odp. To nie własność testu tylko
pomiaru,
16. steny – M=10, SD=2
17. tetrony – M=10, SD=4
18. teoretyczna – dedukcyjna, wewnętrzna – indukcyjna (prawda)
19. potrzeba aprobaty społecznej – cecha i styl odpowiedzi
20. moc dyskryminacyjna różnicuje populację ze względu na cechę (prawda)
22. najwyższa moc dyskryminacyjna – odp przeciętna trudność pytania
23. ładunek czynnikowy – operacyjny, korelacja pyt z czynnikiem
24. w jakiej metodzie nie odnosi się do prób reprezentantów – zewnętrzna
kryterialna
25. co oznacza że ktoś uzyskał wynik w skali ekstrawersji – odp: można
szacować że jest ekstrawertykiem (prawda)
26. żeby podwyższyć rzetelność – maksymalizacja wariancji wyników prow.
Błędu / wariancji błędu
27. zgodność sędziów kompetentnych – W. Kendalla
28. diagnoza psychometryczna – nomotetyczna
29. metoda w. Prób i w. Metod – zbieżna i rozbieżna
30. teoria rzetelności – suma błędów pomiaru = 0
31. trafność teoretyczna – odnosi się do teorii i może ją zmienić
32. wierność tłumaczenia
33. metoda kryterialna – dobroć dopasowania z kryteriami zewnętrznymi
34. trafność diagnostyczna – w tym samym czasie
35. nie przeprowadzenie badań zgodnie ze standaryzacją – psuje wszystkie
czynniki
tPsychometria 2015 , zaoczni
1. rzetelność dla wyniku indywidualnego powinna oscylować wokół:

a. 0,6
b. 0,7
c. 0,8
d. 0,9
2. Która z metod nie jest metodą badania rzetelności (wybrać jedną z czterech
podanych).
Rzetelność BADA: metoda połówkowa, test-retest, testy równoległe, analiza
zgodności wewnętrznej czyli alpha Cronbacha
3. Na jakim etapie stosuje się “instrukcję szczerości”?

Na etapie stosowania kwestionariusza
4. Co to jest dysymulacja? Tendencja do przedstawiania się w nieprawdziwie

korzystnym świetle.
(Ale to nie było pytanie o dysymulację, co to jest, tylko dysymulacja była
odpowiedzią. Ogolnie to bylo to pytanie o aprobatę społeczną i trzeba bylo wskazac
w odp społecznie pożądane cechy, a te niepożądane odrzucic, czy jakos tak)
a. symulacja
b. dysymulacja
c. trochę symulacja, trochę dysymulacja (czy coś w tym stylu)
d. żadna z tych
4. Który z poniższych opisów to perspektywa emikalna (wybrac jeden z czterech).

(Nawet Google nie wie co to jest :O)
5.Przy której trafności trzeba dążyć do maksymalizowania (podtrzymania) motywacji

u OB.
a. fasadowa
b. wewnętrzna (tresciowa)
6. Etapy analizy zadań - wskazać jeden nie wchodzący w analizę

Etapy analizy zadań: 1. ustalenie czy pozycja testowa jest poprawna rzeczowo (czy
da się ją wyprowadzić z teorii), 2. sprawdzenie czy pozycja testowa jest poprawnie
zredagowana, 3. obliczenie statystycznych wskaźników dla poszczególnych pozycji
testowych.
7. W jakim przedziale procentowym mieściłyby się osoby, które uzyskają od 40-60

punktów na skali T?
a. 99%
b. 98%
c. 68%
9. 55 centyl to
a. wynik niższy bądź równy 55%
b. wynik niższy 55%
c. wyższy bądź równy 45%
d. wyższy 45%
10. Zaleta norm wymagań:

umożliwiają porównywanie osiagnięć badanych osób z
wymaganiami programowymi.
12. Zasady redagowania pozycji testowych - wskazać jedną nieprawidłową
13. Budowanie przedziału ufności - wynik 12, podane wartości odchylenia dla trzech
alfa, z czego trzeba była wybrać jedną dla 90% przedziału i wskazać ten przedział
14. Pytanie o trafność treściową, czym się charakteryzuje?

Trafność treściowa (logiczna, wewnętrzna)- ocenianie na podstawie pomiaru
testowego całokształtu zachowań, których próbkę pobiera test, np. test z geografii
15. Pytanie o badanie rzetelności, trzeba wybrać nieprawidłową.

Rzetelnosc- dokladnosc pomiaru, rzetelnosc mowi nam o tym, w jakim stopniu wynik
danego testu odzwierciedla poziom mierzonej cechy u danej osoby, a nie wplyw
czynnikow losowych, bierze sie pod uwage wielkosc bledu, jaki popelnia psycholog
przy interpretacji wynikow danego testu oraz wiaze sie z umiejetnoscia zbudowania
przedzialu ufnosci dla tzw. wyniku prawdziwego danej osoby.
17. Co to jest standaryzacja? Jednolitosc regul i warunkow badania, tzn aby wyniki
danego testu mozna bylo ze soba porownywac, dany test zawsze powinien byc
przeprowadzony w identycznych warunkach, bo tylko wtedy roznice w wynikach osob
badanych mozna przypisac czynnikom indywidualnym a nie zewnetrznym warunkom
badania
19. Zalety norm typu równoważnikowego:

osiągnięcia badanych są traktowane rozwojowo, pokazują opóźnienia bądź
przyśpieszenia w uczeniu się, można dostosować do każdego miesiąca nauki.
20. Pytanie o normy - zaznaczyć nieprawdziwą (nie rozumiem tego???)
21. Jakie zdanie nie należy do prawdziwych jeśli chodzi o centyle

a. różnicuje wyniki na końcach rozkładu
b. jest rozkładem równoprawdopodobnym
c. nie można porównać wyników surowych
22. Co to są style odpowiadania?

Badany odpowiada bez względu na treści pytań
23. Która zasada równoważności nie jest brana pod uwagę przy adaptacji?
Założenia adaptacji kulturowej: zasada równoważności konstruktu, funkcjonalnych
zachowań, wskaźników konstruktu teoretycznego, psychometryczna ???
24. Kontaminacja kryterium najczęściej pojawia się, gdy:

25. Pytanie o błąd systematyczny (chyba odnosił sie do rzetelności):

a. jest istotny
b. nie jest brany pod uwagę
c. to zależy od mierzonej cechy
d. ?
26. Homogeniczność grupy w stosunku do rzetelności

a. maleje
b. rośnie a nie przypadkiem to ??? → rośnie gdy homogeniczne są pozycje testowe
28. Pytanie o analize czynnikowa

Za pomocą analizy czynnikowej mozna: redukowac ilość dostępnych informacji,
łączyc podobne do siebie zmienne w grupy, wyodrębniac podobieństwa pomiędzy
zmiennymi. Służy ona temu, aby sensownie połączyć ze sobą grupy podobnych
zmiennych w jedną grupę.
30. Wynik typowy

(nie rozumiem tego???)
31. Co różnicuje moc dyskryminacyjną?

Współczynnik mocy dyskryminacyjnej (to stopień w jakim dana pozycja testowa
różnicuje badaną populację).
32. Po co wprowadza się przedziały wiekowe?

Testy z przedzialami wiekowymi zazwyczaj badaja dana populacje, np. dzieci,
mlodziezy, doroslych...
33. Etapy analizy pozycji testowych
34. Jaki jest optymalny wskaźnik rzetelności

Minimum 0,8 w diagnozie indywidualnej, ale optymalny???
35. Pytanie o skali T - że ma dużą rozpiętość (No ma :D)
36. Pytanie o trafność fasadowa

Dotyczy tego, co wydaje sie mierzyc test, a nie tego, co rzeczywiscie mierzy; opisuje
jak test spostrzegaja osoby badane i czy z ich punktu widzenia dany test faktycznie
mierzy to, co ma mierzyc
37. Dzieci z problemami w nauce mają być przydzielone na zajęcia dodatkowe,

wyrównawcze. Do zakwalifikowania trzeba je przebadać testami; jakie zadania im
dać?
a. bardzo łatwe
b. przeciętne
c. trudne
d. bardzo trudne
Obszary treści
funk- społeczne – ekonomiczne reklamy
-wyobraźnia -brak wyob, ciekawość brak zainter , kreatywność,
powierzchowność, spostrzegawczość
Obszary manifestacji
- - obszar poznawczy , emocjonalny, behawioralny
- przekonania i emocje
testy włsci poznawczych
- afektywnych – wierzenia emocje zachowania
1.czy operacjonalizacja potrzebna jest do definicji mierzonego

testu
- tak jest częścią operacjonalizacji
2.w jakiej skali postaw wobec reklamy założono ,że pytania
będą dotyczyły przekonań o działaniu reklamy i emocji jakie
ona wzbudza to przekonanie i emocje stanowią
-obszary manifestacji
3.jak powinna być sformułowana pozycja testowa w twoim
kwestionariuszu
- format zamknięty
4. jaka forma gramatyczna powinna mieć pozycja w twoim
kwestionariuszu
- zdania twierdzące
5. obszary treści
- wynikają z definicji stanowią merytoryczna zawartość
6. obszary manifestacji
-wskazują gdzie i wjaki sposób mogą przejawiać sie
manifestować obszary treści które określmy w poprzednim
punkcie
7.testy właściwe afektywne – metoda samo-opisowa
-nie ma obiektywnych wskaźników mierzonych cech, moga byc
wierzenia , przekonania , emocje
8. mierzenia postaw
- zwykle obszary manifestacji , 3 kompetentny postawy –
przekonania , emocje , zachowania
9. czy zawsze w projekcie kwestionariusza warto umieszczać
wszystkie możliwe obszary manifestacji
-trzeba sie zastanowic czy maja sens w naszej ofercie
10.pozycje testowe
- poszczególne zadanie dla osoby badanej składającej sie z tresci
i polecanie czyli tego co ma
11. format otwarty
- wymagaja zarówno wysiłku od osoby badanej jak i sa bardzo
trudne w ocenie – w przyporządkowanej wartosci liczbowej
12. format zakmniety - ( będziemy używać formy zamkniętej )
- poz. -alternatywne
- poz. Wieloalternatywne
- poz z dopasowaniem
-rangowanie
skala likerta
- dwubiegunowe skale przymiotnikowe
13,jak powinna byc sformułowana pozycja testowa w twoim
kwestionariuszu
- format zamkniety
14. pytania w kwestionariuszach, jaka forme powinna miec
pozycja testowa
- twierdzoce , oznajmujace 1 l. P
15 do każdej pozycji testowej osoba badana powinna
ustosunkować sie
-takiej samej skali ( nie możemy dopasowywać skali do treści
pozycji)
16. jakie skale
-skala z wyborem alternatywnym
- skala liberta
skala częstości
17. skala dwupunktowa
trzeba mieć dużo pytań
18. skala wielopunktowa
- mniejsza ilość pytan \]
19.skala dwupunktowa-- alternatywna - wady
- mniej dokładna
- niektórych kwestii nie da sie rozstrzygnąć
20 zalety skali dwupunktowej
-szybka dobrze zrozumiała , łatwa dla osób badanych skraca
zcas pracy
21. skala wielopunktowa – częstości -wady
- wolniejsza trudniejsza wydłuża czas pracy
22. skala wielopunktowa zalety
-dokładniejsza , daje oceny stanów pośrednich nie jest czarno
biała
23. przykład skali dwupunktowej
- tak nie , prawda fałsz
24. przykład wielopunktowej
zdecydowanie nie , nigdy rzadko
25. wielopunktowa – to ile stopni na skali
- parzysta czy nie parzysta ? - nie ma jasnego zalecenia
26. skala parzysta z liczba punktów- wada
- jeśli osoba nie potrafi sie ustosunkować – wybierze
przypadkowe odpowiedzi
zalety
- wybieranie odpwoeidzi srodkowej która nic nie znaczy
27. skala nieparzystaliczab punktów- wada
- wybieranie nadmierne czseto nic nie znaczacej odpowiedzi
zaleta
- jeśli się nie umie ustosunkować zawsze ma możliwość
wybrania odp środkowej
28. jak zinterpretować wielkość współczynnika
- 64% zmienności wyników testowych zależy od rzeczywistego
zróżnicowania
- 36% zmienników wyników testowych zależy oda warjacji
błedów
29aby przeprowadzić analizę czynnikowa nasze dane musza
spełniać kilka warunków
- wszystkie pyatnia musza byc mierzone na tej samej skali
30. jesli na jakies pytania wszystkie osoby badane
odpowiedzaiły tak samo to nie ma sensu włączać ich do analizy
- osób pytanych musi byc przynajmniej tyle ile pytań a najlepiej
5 razy wiecej pytan
Psychometria 2015 , zaoczni
1. rzetelność dla wyniku indywidualnego powinna oscylować wokół:

a. 0,6
b. 0,7
c. 0,8
d. 0,9
2. Która z metod nie jest metodą badania rzetelności (wybrać jedną z czterech podanych)
- Rzetelność BADA - metoda połówkowa, test-retest, testy równoległe, analiza zgodności

wewnętrznej czyli alpha Cronbacha
3. na jakim etapie stosuje się “instrukcję szczerości”

- na etapie stosowania kwestionariusza
4. Dysymulacja - co to jest? tendencja do przedstawiania się w nieprawdziwie korzystnym

świetle To nie było pytanie o dysymulację co to jest tylko dysymulacja była odpowiedzią. Tak.
było to pytanie o aprobatę społeczną? chyba tak, bo osoba ta wskazywała w odp. społecznie
pożądane cechy, a te niepożądane odrzucała
a. symulacja
b. dysymulacja
c. trochę symulacja, trochę dysymulacja (czy coś w tym stylu)
d. żadna z tych
4. który z poniższych opisów to perspektywa emikalna (wybrac jeden z czterech)
5.Przy której trafności trzeba dążyć do maksymalizowania (podtrzymania) motywacji u

OB.
a. fasadowa
b. wewnętrzna
6. Etapy analizy zadań - wskazać jeden nie wchodzący w analizę

a. redagowanie pozycji testowych
b. w jednym chodziło o to by odnieść pytania do teorii
Etapy analizy zadań: ustalenie czy pozycja testowa jest poprawna rzeczowo (czy da się ją
wyprowadzić z teorii), sprawdzenie czy pozycja testowa jest poprawnie zredagowana,
obliczenie statystycznych wskaźników dla poszczególnych pozycji testowych
7. W jakim przedziale procentowym mieściłyby się osoby, które uzyskają od 40-60

punktów na skali T?
a. 99%
b. 98%
c. 68%
8. skala staninowa:
a. 2z + 5
9. 55 centyl to
a. wynik niższy bądź równy 55%
b. wyniż niższy 55%
c. wyższy bądź równy 45%
d. wyższy 45%
10. zaleta norm wymagań

Umożliwiają porównywanie osiagnięć badanych osób z wymaganiami programowymi
11. O rekonstrukcji też coś było - wskazać zdanie prawdziwe dot. rekonstrukcji
a. trzeba stworzyć nowe narzędzie a oryginał ma być tylko inspiracją
b.
c.
d. maksymalnie wierne tłumaczenie- transkrypcja
e. wierne tłumaczenie z małymi poprawkami-translacja
f. swobodne łumaczenie-trawestacja
12. zasady redagowania pozycji testowych - wskazać jedną nieprawidłową
13. budowanie przedziału ufnośći - wynik 12, podane wartości odchylenia dla trzech alfa, z
czego trzeba była wybrać jedną dla 90% przedziału i wskazać ten przedział
czy ktos ogarnia jak sie liczy takie rzeczy? ;)
tak to jest 3 wykład na prezentacji, ale jeśli nie ma podanej rzetelnosci, to tego sie nie da
zrobic;/ a do tego bez kalkulatora to powodzenia;) a “nie korzystać z żadnych funkcji telefonu
komórkowego” pewnie obowiązuje, wiec polecam zaopatrzyc sie w kalkulatory:)
14. Pytanie o trafność treściową, czym się charakteryzuje
trafność treściowa (logiczna, wewnętrzna)- ocenianie na podstawie pomiaru testowego

całokształtu zachowań, których próbkę pobiera test, np. test z geografii
15. pytanie o badanie rzetelności, trzeba wybrać nieprawidłową
16. dobór trudności pytań przy badaniu dzieci upośledzonych nie było pytania o dzieci
upośledzone tylko jaki stopien trudnosci powinno sie dobrac w momencie gdy dzieci maja
kiepskie wyniki i na podstawie testu trzeba je przydzielić do zajęć dodatkowych (a nie szkoły
specjalnej?)
a. większość łatwych pytań
b. większość trudnych
c. trochę trudne ,trochę łatwe ??
d. rodzaj zadań nie ma znaczenia
17. co to jest standaryzacja

Jednolitość warunków badania
18. co bada homogeniczność alfa Cronbacha
a. trafność
b. Rzetelność
c. trafność i rzetelność (moim zdaniem odpowiedz prawidłowa to sama rzetelność, TA
NA BANK JEST DOBRA, MAM TO GDZIEŚ W NOTATKACH)
d. żadne z powyższych
19. zalety norm typu równoważnikowego

osiągnięcia badanych są traktowane rozwojowo, pokazują opóźnienia bądź przyśpieszenia w
uczeniu się, można dostosować do każdego mięsiąca nauki
20. pytanie o normy - zaznaczyć nieprawdziwą
21. Jakie zdanie nie należy do prawdziwych jeśli chodzi o centyle

a. różnicuje wyniki na końcach rozkładu- a nie to?
b. jest rozkładem równoprawdopodobnym
c. nie można porównać wyników surowych (CHYBA TO→ może ktoś potwierdzić?)
22. co to są style odpowiadania

a. badany odpowiada bez względu na treści pytań
23. pytanie o zasadę równoważności przy adaptacji Która zasada równoważności nie jest brana
pod uwagę przy adaptacji
Założenia adaptacji kulturowej: zasada równoważności konstruktu, funkcjonalnych zachowań,

wskaźników konstruktu teoretycznego, psychometryczna
24.kontaminacja kryterium najczęściej pojawia się, gdy:

b) psychiatra ma dostęp do wyników testowych dlaczego?bo tak
hueheuheuheuheue
25. pytanie o błąd systematyczny (ale nie pamiętam do czego się odnosił - rzetelności? tak)
a. jest istotny
b. nie jest brany pod uwagę (chyba to)
c. to zależy od mierzonej cechy
d. ?
- Błąd systematyczny to błąd, który nie ma nic wspólnego z mierzoną cechą psychologiczną i jest
spowodowany stałymi cechami badanej osoby lub narzędzia pomiarowego.
26.homogeniczność grupy w stosunku do rzetelności

a. maleje
b. rośnie a nie przypadkiem to ??? → rośnie gdy homogeniczne są pozycje testowe
JEST O TYM W JEJ KSIĄŻCE, MALEJE NA 100% Signed.
28.O analizie czynnikowej
30. Wynik typowy
31. Co różnicuje moc dyskryminacyjnąodp: badaną populację
współczynnik mocy dyskryminacyjnej to stopień w jakim dana pozycja testowa różnicuje

badaną populację
32. Po co wprowadza się przedziały wiekowe
33. Etapy analizy pozycji testowych
34. Jaki jest optymalny wskaźnik rzetelności
-Minimum 0,8 w diagnozie indywidualnej, a optymalny to nie wiem.
35. O skali T - że ma dużą rozpiętość (10z+50)

36. Trafność fasadowa- to co wydaje sie mierzyć, opinia badanych
37. Dzieci z problemami w nauce mają być przydzielone na zajęcia dodatkowe,

wyrównawcze.Do zakwalifikowania trzeba je przebadać testami; jakie zadania im dać?
a. bardzo łatwe
b. przeciętne
c. trudne
d. bardzo trudne ;)

d) wyniki uzyskane za pomocą wystandardyzowanego narzędzia


a) M=10 SD=2
b) M=10 SD=4
c) M=10 SD=1
d) M=10 SD=10
1. wysoki współczynnik korelacji pomiędzy dwoma testami równoległymi stosowanymi jeden po

drugim, bez przerwy czasowej, świadczy o:
1. w metodzie testów równoległych, w odróżnieniu od metody test-retest minimalizowany jest

wpływ:
1. otrzymanie różnych współczynników trafności kryterialnej dla danego testu jest najczęściej
spowodowany:
1. test składa się z 10 pytań. Powinien dobrze różnicować w obrębie patologii. Która z poniższych
skal standardowych najlepiej pozwalałaby zrealizować ten cel:
a) M=10, SD=5
b) M=10 SD=1
c) M=50 SD=10
d) M=50 SD=25

pierwiastek
pierwiastek
b) wysoko rzetelny
1. Stanina to
a) wynik surowy




,c) zachowania wybranej, dobrze określonej grupy

1. stosując współczynnik korelacji dwuseryjnej, jako współczynnik mocy dyskryminacyjnej, musi
zostać spełnione założenie, że zmienna zdychotomizowana jest:


c) obu możliwości
a) normalny
b) prostokątny
c) skośny
d) wielo modalny

1. jeżeli rozkład wyników surowych jest rozkładem lewo skośnym, to w celu jego normalizacji
należy zastosować następującą transformację:
a) pierwiastkową,
b) logarytmiczną
c) potęgową
d) żadną z nich

wartością
d) żadna definicja



1. testu przeznaczone do selekcji ze względu na specyficzne kryterium, powinny składać się z

pozycji testowych, których współczynnik trudności wynosi:
a) 0,5
=
1. formuła speramana - browna jako metoda szacowania rzetelności stosowana jest w technice:
a) test-retest
d) krudera-richardsona
1. dla którego z poniższych rodzajów testów, okre4ślenie trafności treściowej będzie najbardziej
odpowiednie

1. formuła Spearmana-Browna pozwala na określenie wpływu następujących zmiennych na

wielkość współczynnika rzetelności:
c) trafności testu
d) długości testu

a) M=5 SD=2
b) M=5 SD=4
c) M=5,5 SD=2
d) M=5,5 SD=4
a) M=5 SD=2
b) M=5 SD=4
c) M=5,5 SD=2
d) M=5,5 SD=4

a) M=50 SD=2
b) M=50 SD=4
c) M=100 SD=15
d) M=50 SD=10
1. rzetelność testu to również jedno z kryteriów dobroci testów psychologicznych. Rzetelność testu
oznacza przede wszystkim następującą właściwość wyników teoretycznych
a) powtarzalność
b) obiektywność
c) istotność
d) trafność

c) w sytuacjach, w której dokonuje się celowej obserwacji zachowań traktowanych
jako wskaźniki mierzonej charakterystyki
1. jedyny, z kryteriów normalnych, branych pod uwagę przy tworzeniu testu jest współczynnik
trudności poszczególnych pozycji testowych. Jeżeli tworzymy test dla celów selekcji i mamy
dużo kandydatów, a możemy przyjąć najwyżej 10% to większość pozycji testowych z tego testu
powinna być:
a) raczej trudnych
b) raczej łatwych
1. wiedząc, że w klasycznej teorii testów przyjmuje się wynik obserwowany = wynik prawdziwy +
błąd pomiaru, określ co powinno być podstawowym obowiązkiem autora testu:
d) J
1. badanie testowe to:

c) sytuacja w której dokonuje się celowej obserwacji zachowań traktowanych jako

b) jest to obiektywny i standaryzowany pomiar próbki zachowania
1. obiektywność jest jedyny z tzw. kryteriów dobroci testów psychologicznych. Aby spełnić
warunek obiektywności każdy test musi przynajmniej

d) test zostanie zastosowany tylko w takich sytuacjach w których jego wyniki będą miały
praktyczną użyteczność
poszczególnych pozycji testowych. Jeżeli chcemy zastosować test do selekcji kandydatów
uwzględniając określony punkt odcięcia to powinniśmy wybrać taki test, który składa się z
pozycji testowych, których współczynniki trudności wynosi:
a) 0,6
1. znajomość współczynnika mocy dyskryminacyjnej poszczególnych pozycji testowych pozwala
nam na
1. stosując współczynnik korelacji punktowo-dwuseryjnej, jako współczynnik mocy

dyskryminacyjnej trzeba pamiętać o tym, że:


c) jaką część wariancji otrzymanej stanowi wariancja prowadzą
1. rzetelność jako miara dokładności pomiaru testowego testu jest technicznie wyrażana w postaci:
1. metoda testów równoległych stosowana do oszacowania rzetelności testu pozwla na

wyeliminowanie wpływu:
1. wysoki współczynnik korelacji pomiędzy dwoma testami równoległymi stosowanymi jeden po

drugim bez przerwy czasowej, świadczy o:
1. formuła Spearmana-Browna jako metoda szacowania rzetelności testu jest rutynowo stosowana w
technice:
c) KR
d) J

wartością
pomiaru

d) suma dwóch błędów standardowych podniesionych do kwadratu z której
1. dokonując diagnozy na podstawie wyniku testowego, należy wziąć pod uwagę standardowy błąd
pomiaru ponieważ,
1. trafność testu to również jedno z kryteriów dobroci testów psychologicznych. Klasyczny podział
obejmuje następujące rodzaje trafności:
a) psychiatra dokonując oszacowania wyników badanych osób ze względu na
zmienną kryterialną miał dostęp do wyników testowych
b) psychiatra dokonując oszacowania wyników badanych osób ze względu na zmienną
kryterialną znał podręcznik testowy
kryterialną
1. trafność teoretyczna uważana jest za najważniejszy rodzaj trafności. Znajduje ona swoje
odzwierciedlenie w :
a) hipotezach dotyczących zachowania badanych osób tworzonych na podstawie istotnych
dla psychologa teorii psychologicznych
b) hipotezach dotyczących zachowania badanych osób tworzonych na podstawie
teorii mierzonej zmiennej
c) rezultatach badań nad rzetelnością teorii psychologicznej, która leży u podstaw testu
d) rezultatach badań nad trafnością teorii psychologicznej, która leży u podstaw testu
1. istnieje wiele rodzajów trafności. W zależności od celu testowania niektórych z nich mają
większe znaczenie. Dla którego z poniższych rodzajów testów określenie trafności treściowej
będzie najbardziej pożądane:

1. wyniki standardowe za pomocą których można przedstawić wyniki uzyskane w teście otrzymane
przez osoby badane to:
1. aby znormalizowane wyniki testowe były użyteczne, tzn. można je był zinterpretować należy je
odnieść do:
1. steny to:
a) wynik surowy
19. Stosując współczynnik korelacji dwuseryjnej jako współczynnik mocy

dyskryminacyjnej, musi zostać spełnione założenie, że zmienna zdychotomizowana jest:

b) wariancji otrzymanej do wariancji prawdziwej

c) obu możliwości
22. Jeżeli test jest zbyt trudny dla badanej grupy osób, to rozkład wyników w tym teście będzie:
a) normalny
b) skośny
a) prostokątny
b) wielomodalny

c) wskazanie pozycji mierzących zachowania pozatestowe
24. Jeżeli rozkład wyników surowych jest rozkładem lewoskośnym, to w celu jego normalizacji należy
a) pierwiastkową
b) logarytmiczną
c) potęgową
d) żadną z nich



15.Trafność kryterialna to inaczej:

c) trafność prognostyczna i diagnostyczna ,•
16.RzeteIność testu jest wyrażana w postaci:

d) różnicy pomiędzy dwoma wynikami
17.Aby znormalizowane wyniki testowe były użyteczne odnosi się je do:

a) treści .pozycji tworzących test psychologiczny
d) rzetelności 'i trafności metody


-wskazanie pozycji mierzących inną zmienną ,
-wskazanie pozycji mierzących zachowania pozatestowe
-wskazanie pozycji nietrafnych
24. Jeżeli rozkład wyników surowych jest rozkładem lewoskośnym, to w celu jego normalizacji należy
a) pierwiastkową
b) logarytmiczną
c) potęgową
d)żadną z nich

26. Standardowy błąd estymacji wyniku prawdziwego jest to:

a) różnica miedzy estymowaną wartością wyniku prawdziwego a jego rzeczywistą wartością

e) komercyjnej użyteczności testu
f) jednolitości procedury
g) zgodności z normami
h) określania jego rzetelności i trafności

d) średnia wszystkich współczynników typu test-retest
e) średnia wszystkich współczynników typu split-half
f) średnia wszystkich współczynników typu split-test

c) porównywaniu dwóch wyników testowych między sobą
d) określaniu statystycznej istotności wyniku testowego
Psychometria ZAOCZNI 09.02.2014
1. Staniny to wyniki standardowe wyrażone na skali

a) M=5 SD=2
b) M=5 SD=4
2. Tworzymy test, na potrzebę organizacji, by zbadać jakie osoby sa najlepsze. Tylko wewnątrz
organizacji. Jakiego typu normy będą
- norma organizacyjna
- norma lokalna
-norma globalna
-norma instytucjonalna
3. Pytanie o prawidłowy wskaźnik rzetelności:

a) 0,6
b) 0,7
c) 0,8
d) 0,9
4. Ktoś otrzymał w teście wynik 12. Przedzial ufności 90 miał wynik 6, przedział inny miał wynik 8;
a przedzial 95 miał wynik 4 (czy cos takiego) i w jakim przedziale mieści sie osoba, gdy p=0,05
a) (6; 8)
b) (8,16)
c) 10, 14
d) (12; 12)
5) im wieksza homogenicznosc grupy tym:

B) rzetelnosc maleje
C) cos o trafności
D) nie ma zwiazku
6. Pytanie o etikalne
a) uniwersalne kulturowo
7. Która odpowiedź jest prawdziwa: Wynik prawdziwy

a) koreluje z błędem
b) nie koreluje z wynikiem obserwowanym
c) wynik prawdziwy nie koreluje z błędem
8. Uzupelnianka o tym przewidywaniu wyników ? Jaka to trafnosc ?

a) diagnostyczna
b) prognostyczna
9 Na skali tetronowej dane zawarte między 6-14 zawierają sie w przedziale:
a) 68%
b) 85
c) 95
10. Miedzygrupowa korelacja to trafnosc
a) treściowa
b) teoretyczna
c) krytyczna
11. Alfa cronbacha do

a) rzetelnośc i trafnosc
12. Miara czego jest (czy o czym mówi) dewiacyjny iloraz inteligencji:
13. Jeśli chcemy zmierzyć wyniki skrajne (największy rozstrzal wyników to używamy )
a) T (M=50 SD= 10)
b) staniny (M=5 SD=2)
c) steny (M=5.5 SD= 2)
d) Tetrony (M= 10 SD=4)
14. Pytanie o błąd systematyczny w stosunku do rzetelności? - czy jest

a) istotny
b) nieistotny
15. Które zdanie jest nieprawdziwe o centylach

a) roznicuja na koncach rozkladu.
16. O czym mówi parafraza- jako narzędzie adaptacji

c) konieczność opracowania narzędzia, ktie na wersji pierwotnej
d)
17. Kontaminacja kryterium pojawia się najczęściej, gdy:

b) badający ma dostęp do wynikow
18. Coś o wartości 55 centyli

a) że świadczy o 55% wyniku i wyższym… nie pamiętam dokładnie
b)45%
c) uzyskali wynik 55 bądź mniejszy
19. w metodzie testów równoległych w odróżnieniu od metody test-retest minimalizowany jest

wpływ (albo coś w tym stylu)
b) pamięci i uczenia się
20) Standaryzacja (ale czego? bo jeśli wyniki standardowe to dobrą odpowiedzią będzie b - zobacz pytanie Izy Fischer na
forum i odpowiedź, co prof. mówiła na wykładzie)
a) polegającą na tworzeniu standardowych warunków stosowania testu
d) wyniki uzyskane za pomocą wystandaryzowanego narzęd
21) Standaryzacja
b) jednoliotość warunków
22) Analiza macierzy korelacji

a) trafność teoretyczna
23) Procedura nadawania znaczenia empirycznego konstruktom teoretycznym

24) Zgodnie z klasyczna koncepcja wyniku prawdziwego, wynik otrzymany:

a) jest wiekszy od wariancji bledu

d)różnicy pomiędzy 2 wynikami

a) Prawa autorskie.
b) stosowanie testu przez osobę niedoświadczoną może spowodować złe efekty
27. rzetelność testu to również jedno z kryteriów dobroci testów psychologicznych. Rzetelność
testu oznacza przede wszystkim następującą właściwość wyników teoretycznych
a) powtarzalność
b) obiektywność
c) istotność
d) trafność
b) psychiatra dokonując oszacowania wyników badanych osób ze względu na zmienną kryterialną
znał podręcznik testowy
c) autor testu znał procedurę szacowania badanych osób ze względu na zmienną kryterialną
29. trafność teoretyczna uważana jest za najważniejszy rodzaj trafności. Znajduje ona swoje
odzwierciedlenie w
a) hipotezach dotyczących zachowania badanych osób tworzonych na podstawie istotnych dla
psychologa teorii psychologicznych
ykonania maksymalnego
.


a) M=10 SD=2
b) M=10 SD=4
c) M=10 SD=1
d) M=10 SD=10
1. wysoki współczynnik korelacji pomiędzy dwoma testami równoległymi stosowanymi

jeden po drugim, bez przerwy czasowej, świadczy o:
1. w metodzie testów równoległych, w odróżnieniu od metody test-retest minimalizowany

jest wpływ:
1. otrzymanie różnych współczynników trafności kryterialnej dla danego testu jest

najczęściej spowodowany:
1. test składa się z 10 pytań. Powinien dobrze różnicować w obrębie patologii. Która z
poniższych skal standardowych najlepiej pozwalałaby zrealizować ten cel:
a) M=10, SD=5
b) M=10 SD=1
c) M=50 SD=10 , jak poniżej (Hornowska, str. 138 “Testy Psychologiczne”)
d) M=50 SD=25
skalę T stosuje się głównie w testach przeznaczonych do diagnozowania patologii
Bo jest to skala bardzo długa i sięga od -5 do +5 odchyleń standardowych . T = 10z + 50

b) suma 2 błędów standardowych podniesionych do kwadratu z których
wyciągnięto pierwiastek (patrz wzór)
c) różnica 2 błędów standardowych podniesionych do kwadratu z których

b) wysoko rzetelny
1. Stanina to
a) wynik surowy



lanie

b) psychiatra ma dost
ęp do wyników testowych
Kontaminacja:tj. możliwe źródło błędu przy walidacji testu, gdy oceny kryterialne
zostają „skażone” na skutek tego, że osoba oceniająca zna wyniki testu
(Np. przy wystawianiu ocen szkolnych( kryteriów trafności testu) nauczyciel
rozstrzyga wątpliwości na korzyść osoby, o której wie, że uzyskała wysoki wynik
w teście zdolność).
Kontaminacja kryterium:
wyniki testowe nie mogą wpływać
na pozycję jednostki w zakresie
1. stosując współczynnik korelacji dwuseryjnej, jako współczynnik mocy dyskryminacyjnej,

musi zostać spełnione założenie, że zmienna zdychotomizowana jest:
1.

c) obu możliwości
1. jeżeli test jest zbyt trudny dla badanej grupy osób to rozkład wyników w tym teście
będzie:
a) normalny
b) prostokątny
c) skośny
d) wielomodalny

1. jeżeli rozkład wyników surowych jest rozkładem lewoskośnym, to w celu jego

normalizacji należy zastosować następującą transformację:
a) pierwiastkową,
b) logarytmiczną
c) potęgową
d) żadną z nich


a) różnica między estymowaną wartością wyniku prawdziwego a jego
rzeczywistą wartością
d) żadna definicja


b) określaniu statystycznej istotności wyniku
1. testy przeznaczone do selekcji ze względu na specyficzne kryterium, powinny składać

się z pozycji testowych, których współczynnik trudności :
a) wynosi 0,5
1. formuła Spearmana - Browna jako metoda szacowania rzetelności stosowana jest w

technice:
a) test-retest
d) Krudera-Richardsona
1. dla którego z poniższych rodzajów testów, określenie trafności treściowej będzie

najbardziej odpowiednie

1. formuła spearmana-browna pozwala na określenie wpływu następujących zmiennych
na wielkość współczynnika rzetelności:
c) trafności testu
d) długości testu

a) M=5 SD=2 (staniny)
b) M=5 SD=4
c) M=5,5 SD=2
d) M=5,5 SD=4

a) M=5 SD=2
b) M=5 SD=4
c) M=5,5 SD=2
d) M=5,5 SD=4

a) M=50 SD=2
b) M=50 SD=4
c) M=100 SD=15
d) M=50 SD=10
1. rzetelność testu to również jedno z kryteriów dobroci testów psychologicznych.

Rzetelność testu oznacza przede wszystkim następującą właściwość wyników
teoretycznych
a) powtarzalność
b) obiektywność
c) istotność
d) trafność
1. jedyny, z kryteriów normalnych, branych pod uwagę przy tworzeniu testu jest
współczynnik trudności poszczególnych pozycji testowych. Jeżeli tworzymy test dla
celów selekcji i mamy dużo kandydatów, a możemy przyjąć najwyżej 10% to większość
pozycji testowych z tego testu powinna być:
a) raczej trudnych
b) raczej łatwych
1. wiedząc, że w klasycznej teorii testów przyjmuje się wynik obserwowany = wynik

prawdziwy + błąd pomiaru, określ co powinno być podstawowym obowiązkiem autora
testu:
d) J
1. obiektywność jest jeden z tzw. kryteriów dobroci testów psychologicznych. Aby spełnić
warunek obiektywności każdy test musi przynajmniej
b) dawać porównywalne wyniki niezależnie od tego gdzie i kiedy jest
stosowany

a) test będzie stosowany w jednolity sposób w stosunku do wszystkich osób
badanych
d) test zostanie zastosowany tylko w takich sytuacjach w których jego wyniki będą
miały praktyczną użyteczność
poszczególnych pozycji testowych. Jeżeli chcemy zastosować test do selekcji
kandydatów uwzględniając określony punkt odcięcia to powinniśmy wybrać taki test,
który składa się z pozycji testowych, których współczynniki trudności wynosi:
a) 0,6
1. znajomość współczynnika mocy dyskryminacyjnej poszczególnych pozycji testowych

pozwala nam na
1. ???????stosując współczynnik korelacji punktowo-dwuseryjnej, jako współczynnik mocy

dyskryminacyjnej trzeba pamiętać o tym, że:

c) jaką część wariancji otrzymanej stanowi wariancja prowadzą Wynik otrzymany =
prawdziwy + błąd
1. rzetelność jako miara dokładności pomiaru testowego testu jest technicznie wyrażana w
postaci:
1. formuła Spermana-Browna jako metoda szacowania rzetelności testu jest rutynowo

stosowana w technice:
c) KR
d) połówkowania

a) różnica między estymowaną wartością wyniku prawdziwego a jego
rzeczywistą wartością
pomiaru

d) suma dwóch błędów standardowych podniesionych do kwadratu z której
1. dokonując diagnozy na podstawie wyniku testowego, należy wziąć pod uwagę

c) dzięki niemu można określić wielkość błędu jakim jest obciążony wynik
testu
d) pozwala on określić wielkość błędu jaki popełniany jest przy interpretowaniu
wyniku poszczególnych pozycji testowych
1. trafność testu to również jedno z kryteriów dobroci testów psychologicznych. Klasyczny

podział obejmuje następujące rodzaje trafności:
1. w której z przedstawionych niżej sytuacji może dojść do zjawiska kontaminacji

kryteriów:
a) psychiatra dokonując oszacowania wyników badanych osób ze względu na
zmienną kryterialną miał dostęp do wyników testowych
b) psychiatra dokonując oszacowania wyników badanych osób ze względu na
zmienną kryterialną znał podręcznik testowy
kryterialną
d) autor testu połączy ł wyniki otrzymane dla dwóch różnych zmiennych
kryterialnych
1. trafność teoretyczna uważana jest za najważniejszy rodzaj trafności. Znajduje ona

swoje odzwierciedlenie w :
a) hipotezach dotyczących zachowania badanych osób tworzonych na podstawie
istotnych dla psychologa teorii psychologicznych
b) hipotezach dotyczących zachowania badanych osób tworzonych na
podstawie teorii mierzonej zmiennej
c) rezultatach badań nad rzetelnością teorii psychologicznej, która leży u podstaw
testu
d) rezultatach badań nad trafnością teorii psychologicznej, która leży u podstaw
testu
1. istnieje wiele rodzajów trafności. W zależności od celu testowania niektórych z nich

mają większe znaczenie. Dla którego z poniższych rodzajów testów określenie trafności
treściowej będzie najbardziej pożądane:

1. wyniki standardowe za pomocą których można przedstawić wyniki uzyskane w teście

otrzymane przez osoby badane to:
1. aby znormalizowane wyniki testowe były użyteczne, tzn. można je był zinterpretować
należy je odnieść do:
1. steny to:
a) wynik surowy


c) wskazanie pozycji mierzących zachowania pozatestowe
19. Stosując współczynnik korelacji dwuseryjnej jako współczynnik mocy dyskryminacyjnej, musi zostać
spełnione założenie, że zmienna zdychotomizowana jest:

b) wariancji otrzymanej do wariancji prawdziwej

c) obu możliwości
22. Jeżeli test jest zbyt trudny dla badanej grupy osób, to rozkład wyników w tym teście
będzie:
a) normalny
b) skośny
e) prostokątny
f) wielomodaln
24. Jeżeli rozkład wyników surowych jest rozkładem lewoskośnym, to w celu jego normalizacji
należy zastosować następującą transformację:
a) pierwiastkową
b) logarytmiczną
g) potęgową
h) żadną z nich


Ja mam jeszcze takie pytania -> więc dopisuję: (prosze o weryfikacje)

1. Która z metod pozwala na największe zmiany w adaptacji ?
REKONSTRUKJCJA bo zarówno zachowania jak i konstrukty nie sa uniwersalne kulturowo
a nie parafraza? gdzieś wy pytaniach innych było, że parafraza. K. NIE
1. Gdy zalezy nam na motywacji osoby badanej do rozwiązywania testow, to wazna

jest?
Trafność fasadowa
1. Co to sa tetrony?
Jednostki skali standardowej
1. 40% centyle?
"40% osob ma gorsze lub takie same ? wyniki od tej osoby, ktora otrzymała wynik rowny 40
centylowi"

Wysokie, dodatnie ← są bardziej pożądane
1. Trafność kryterialna
Prognostyczna i diagnostyczna
1. Rzetelność testu
Wskaźnik korelacji miedzy wynikiem dwoch badan tym samym testem tym samych ludzi.
1. X=T+E
Zmniejszyć E
1. Standaryzacja
Jednolitość
1. Niski współczynnik korelacji miedzy testami A I B ( rownolegle) ( badanie po

odstępie czasu)
1. Normy lokalne
Ścisle określone grupy ludzi
1. Normy
Zachowania typowe
15.Budowanie przedziału dla wyniku otrzymanego
Rzetelność ? SEM?
Standardowy bład roznicy


Odp. Test z historii
19. Analiza korelacji macierzy to:

Zbieżna i rozbieżna

Zapamiętywanie

Losowy


Hipotezy weryfikowane za pomocą teorii stojącej za testem
1Jeśli współczynnik rzetelności wynosi 0,8, to znaczy, że:

- zmienna wyjaśnia 80% wariancji, a 20% to błąd
Jaką miarę statystyczną wykorzystujemy do badania rzetelności?

- współczynnik korelacji
Który test jest bardziej rzetelny: o współczynniku rzetelności -0,90, +0,90, -0,30, +0,30?
- +0,90
Jeżeli znamy rzetelność połowy testu, to do obliczenia rzetelności całego testu użyjemy:
- wzór Spearmana-Browna
Jak na rzetelność testu wpływa jego dlugość?

- dodatnio (im dłuższy test ty większa rzetelność)
Jak na rzetelność testu wpływa homogeniczność badanej grupy?

- ujemnie
Oblicz przedział ufności jeżeli alfa wynosi 0,9.
- przedział ufności = 1 - alfa = 1 - 0,9 = 0,1
Zbuduj standardowy błąd pomiaru, jeżeli zα/2 = 2, a SEM = 0,4.

- błąd pomiaru = zα/2 x SEM = 2 x 0,4 = 0,8
Kiedy wykorzystujemy błąd standardowy różnicy?

- gdy chcemy porównać 2 wyniki ze sobą
-
Co to są emiki i etyki?
Jeżeli współczynnik trudności testu wynosi t = 90%, to test jest:

- łatwy (90% osób potrafi na niego odpowiedzieć)
Optymalny współczynnik trudności testu wynosi:

- t=ok.50%
Do analizy różnic międzygrupowych wykorzystujemy:

- test t studenta
Co mierzą korelacyjne współczynniki mocy dyskryminacyjnej?

- korelacje danej pozycji z ogólnym wynikiem w teście
Jakie wartości tych korelacji nas interesują?

- wysokie dodatnie


Prawa badającego:
Dobra rzetelność:
- gdy współczynnik rzetelności wynosi conajmniej 0,8.
- żeby zminimalizować skutki zapamiętywania swoich odpowiedzi i zminimalizować efekty
uczenia się nowych rzeczy (optymalny czas - od 2 tyg. do 6 miesięcy)
Jak zapamiętywanie wpływa na wielkość współczynnika rzetelności:

- przeszacowuje go (wychodzi za duży)

Gdy jest mała alfa Cronbacha:




- statystyczny
technika ślepej diagnozy:

- arkusz jednej osoby rozsyłany jest do różnych psychologów (slepa bo nie ma kontakty z OB i
dane z kontaktu moga byc zaklocajace)
1.Test psychologiczny: sytuacja w ktorej wywolujemy zachowanie, ktore jest wskaznikiem

danej cechy
Test obiektywny (wyrazny klucz)

test mocy (rozwiazuje sie wszystkie zadania)
test szybkosci (czas odpowiedzi wyznacza liczbe zadan - mierzy poziom mierzonej cechy
+szybkosc myslenia)
Standaryzacja:
-odtworzenie osobie badanej arunkow jakie byly w gr.normalizacyjnej + pozwala na porownanie
wynikow miedzy soba
Test obiektywny: wyniki niezalezne od osob, ktore je opracowuja

Test wystandaryzowany: jednolitosc procedury badania testem
rzetelnosc -= powtarzalnosc
wynik otrzymany = wynik prawdziwy + błąd (błąd ma charakter losowy)
żródła błędów o charakterze losowym:

osoba badana
osoba badajaca
sytuacja badania (w kazdje sytuacji badanej pojawia sie blad)
Badacz dazy do - minimalizowania błędu (E)

RZETELNOSC TESTU DEFINICJE:
> definicja nieoperracyjna - wielkosc wspolczynnika korelacji pomiedzy wynikiem

otrzymanym a prawdziwym
>definicja operacyjna - wspolczynnik korelacji miedzy dwoma poziomami wykonywania tego

samego testu w tej samej grupie
MOZNA UDOWODNIC< ZE DRUGI WSPOLCZYNNIK JEST ROWNY KWADRATOWI

KORELACJI MIEDZY WYNIKIEM OBSERWOWANYM A PRAWDZIWYM ( jest korelacja min.O,
max1, nie moze byc -1)
min.rzetelnosc testu pozwalajaca na stosowanie go w diagnozie indywidualnej = 0,8
najmniejsza rzetelnosc = 0
wspolczynnik korelacji = 0,6 , okresl jaki % wariancji wyjasnia wynik prawdziwy a ile %
blad pomiaru
60 prawdziwy, 40 blad
TRZY SPOSOBY ROZUMIENIA RZETELNOSCI:

1) stabilnosc (powtarzalnosc wynikow)
2)powtarzalnosc tresci
3 homogenicznosc - zgodnosc wewnetrzna
>>>>>szczegolowo:<<<<<<<<
1)stabilnosc - powtarzalnosc wynikow
( 2 razy badamy te sama gr osob tym samym testem - badanie stabilnosci bezwzglednej)
- z przerwa (od 2 do 6 miesiecy) -> zrodla bledu: wyniki testowe nie sa stabilne w czasie
- bez przerwy (badanie wiarygodnosci testu) - >zrodla bledu - czynniki losowe2)
2)powtarzalnosc tresci
> technika testow rownoleglych
- z przerwa (badanie stabilnosci wzglednej)
- bez przerwy (rownowaznosc miedzytestowa)
> połówkowanie (porownujemy parzyste itemy z nieparzystymi)
- wzor Spearmana Browna (słuzy do oszacowania rzetelnosci testu na

podstawie rzetelnosci jego polowy)
3)homogenicznosc - zgodnosc wewnetrzna
------alfa cronbacha - srednia interkorelacja miedzy wszystkimi pozycjami testowymi

1.TEsty równoległe - te same M, SD, i korelacje z innym testem
2. SEM
- błąd standardowy pomiaru - opisuje wielkosc bledu ktora zwiazana jest z danym narzedziem
pomiarowym
SEM zalezy od : rzetelnosci testu , sd wynikow w tym tescie
SEM wykorzystuje sie do budowania przedzialow ufnosci dla wyniku OTRZYMANEGo

56z
3.BŁAD STANDARDOWY RÓŻNICY (mowi o tym, czy roznicy miedzy dwoma wynikami
mozna przypisac znaczenie diagnostyczne)
BLAD STANDARDOWY ROZNICY -> stosuje sie gdy chcemy porownac ze soba 2 wyniki
w selekcji i rekrutacji
->gdy chcemy porownac 2 wskazniki w tym samym tescie
4.TRAFNOSC:
● dokonując diagnozy na podstawie wyniku testowego, należy wziąć pod uwagę
c) dzięki niemu można określić wielkość błędu jakim jest obciążony wynik
testu??? tez mi sie tak wydaje TEŻ TAK MYŚLE
d) pozwala on określić wielkość błędu jaki popełniany jest przy interpretowaniu
wyniku poszczególnych pozycji testowych
tersciowa (czy tresc testu mozemy traktowac jako reprezentacja dla uniwersum
tresci opisujacego dany konstrukt)
● kryterialna ( o jakich innych zmiennych bezposrednio niezwiazanych z testem mozna
wnioskowac na podstawie wynikow testu )
○ TRAFNOSC KDZIELI SIE NA (diagnostyczna i prognostyczna)
● teoretyczna (badanie roznic miedzy grupowych, analiza korelacji, analiza czynnikowa,

analiza zgodnosc wewnetrzenj, analiza nieprzypadkowych zmian w wynikach testu ,
analiza sposobu odpowiadania)
○ TRAFNOSC TEORETYCZNA DZIELI SIĘ NA zbiezna i roznicowa
TRAFNOSC fasadowa -> opisuje to co o tescie sadzi osoba badana (ta trafnosc jest zawsze
wazna, dot. motywacji)
1.BADANIA TRAFNOSCI KRYTERIALNEJ SLUZA:
-rozszezreniu mozliwosci zastosowania testu
2.TRAFNOSC Ze wzgledu na waznosc dla uzytkownika :

teoretyczna > kryterialna > tresciowa
3/kontaminacja: przenoszenie wiedzy o tym jak OB wypadla w tescie na ocene poziomu

wykonania tej osoby w zmiennej kryterialnej
4/sposoby wyelimoinowania kontaminacji kryteriow?v - inne osoby oceniaja wyniki testu a

inne wyniki w miennej kryterialnej
5.rodzaje trafnosci kryterialnej : korelacja

diagnostyczna - miedzy testem i zmienna kryterialna w tym samym czasie
prognostyczna - miedzy testem i kryterium mija czas (czesto b.długi)
6.NORMA - typowosc
norma statystyczna - sredni poziom wykonania testu przez pewna grupe odniesienia
7.NORMY MUSZĄ BYĆ (ADEKWATNE, AKTUALNE, REPREZENTATYWNE)

ADEKWATNE - SPOSOB DEFINIWANIA GRUPY ODNIESIENIA
REPREZENTATYWNE - WPROST ZWIAZANE Z ZAKRESEM UOGOLNIANIA WYNIKOW
8.NORMY LOKALNE - dla wasko zdefiniowanych grup

9.NORMY OGÓLNOKRAJOWE - sporzadzane dla calej populacji
10.CENTYLE - mówią o tym ile osób ma wyniki rowne lub niższe od osoby badanej.
SKALA CENTYLOWA=skala porządkowa
11.Dlaczego stosuje się skalę T do diagnozowania patologii?

- bo jest bardzo długa (tzn ze pozwala na dokladne roznicowanie miedzy osobami ktore maja
skrajne wyniki)
12.Dlaczego skale standardowe sa popularne?

- po pozwalaja okreslac miedzy poziomem mierzonych cech
13.Dlaczego przed wsytarndaryzowaniem trzeba normalizowac?

- bo do interpretacji wynikow w sklalach standardowych wykorzystujemy wlasciwosci rozkladu
normalnego (wynik typowy 68%)
14. Dla czego obliczamy moc dyskryminacyjna przed wlaczeniem zadan do ostatecznej
wersji testu?
- bo chcemy wlaczyc tylko takie pozycje ktore prowadzic beda do maksymalnego
zroznicowania wynikow testu
15.Jakich specyficznych informacji dostarcza analiza zadan?
-w jakim stopniu kazda pozycja testowa oddzielnie roznicuje badana populacje
16.Jaki jest sposob szacowania mocy dyskryminacyjnej zadan?

- oparte na wspolczyniku trudnosci
- opartne na wspolczynniku korelacji miedzy wynikiem danego zadania a ogolnym wynikiem w
tescie
- opartne na roznicy miedzy wynikami otrzymanymi w tzw. dolnej i górnej grupie osob badanych
(wyniki najnizsze i najwyzsze)
17.Style odpowiadania - stałe, podmiotowe, atreściowe strategie odpowiadania

przykłady:
- tendencja do potakiwania
-błąd tendencji centralnej
-aprobata społęczna
18.Empiryczna procedura konstrukcji testu:

- podstawa jest stwierdzona empirycznie korelacja miedzy wynikiem testu a tym co ma byc
przedmiotem pomiaru (zmienna kryterialna)
test spełnia warunek obiektywnosci jezeli:
- oceniany przez roznych psychologow daje podobne wyniki
J
ak moż
na uznac test za rzetelny?
- współczynnik korelacji pomiedzy dwoma wynikami uzyskanymi w badaniu tym samym testem
tej samej grupy osob
1.najwyzsza rzetelnosc odp.
gdy skala jest 5, 7 stopniowa;
2.wskaznik mglistości odp.

bierze pod uwage ilosc wyrazow w pytaniach;
3.co mierzy macierz korelacji WCWM odp.

trafnosc teoretyczna,
test wlasciwosci afektywnych odp.

brak odpowiedzi prawidlowej obiektywnie;
4. Strategia empiryczna odp.

Albo trzeba robić definicję, albo nie wiem cześć dała, ze strategia empiryczna wymaga dużej liczby
badanych osób
5.coś tam wartość powyżej 1 odp.

Kaisera;
6.obszary manifestacji odp.

sa wywodza sie z obszaru tresci,
7. co robimy gdy wartość ładunku wskazuje 0,005 odp.

wywalamy go w ogóle przypuszczalnie chodzi o "nie pasuje do skali";
8.trafnossc zbiezna i rozbiezna odp.

jest mierzona przy trafnosci teoretycznej;
9. Jesli wspolczynnik rzetelnosci wynosi 0,81 to odp.

35% zmienności wynikow zalezy od bledu;
10.na wynik alfa Cronbacha ma wpływ odp.

czynniki losowe, heteroenicznosc pozycji testowych
11.dwa razy tego samego testu uzywamy odp.

w testretest;
12.cos o tescie do diagnozy indywidualne ja dałam, że trzeba

lepiej zbadac trafność i rzetelność
13. obszary manifestacji dotyczą tego

w jaki sposób mogą się przejawiać obszary treści np. obszar poznawczy, emocjonalny, itd.
1.Badacz planuje opracowanie kwestionariusza do badania strategii radzenia sobie ze
stresem, całkowicie opierając się na definicjach strategii zaproponowanych przez Lazarus i
Folkman (1984). W tym celu zastosuje:
A. Wewnętrzną strategię konstruowania narzędzia

B. Zewnętrzną strategię konstruowania narzędzia
C. Nie zastosuje żadnej ze strategii wskazanych w pozostałych punktach
D. Teoretyczną strategię konstruowania narzędzia (Ala)
2. Ładunek czynnikowy:
A. Jego ujemny znak wskazuje na pytania najmniej rzetelne

B. W sensie teoretycznym to znaczenie psychologiczne czynnika
C. W sensie operacyjnym to korelacja między pytaniem a czynnikiem
D. Wszystkie powyższe odpowiedzi są prawidłowe (chyba)
3. Od czego zależy wartość alfy Cronbacha?
A. Tylko od czynników losowych

B. Od czynników losowych, zmienności wyniku w czasie i podobieństwa do siebie
pozycji testowych
C. Od czynników losowych i podobieństwa do siebie pozycji testowych
D. Od czynników losowych i zmienności wyniku w czasie
4. Strategia racjonalna budowy testu
A wymaga empirycznej weryfikacji wrażliwości testu

B. Stosowana jest jedynie do testów właściwości afektywnych
C. Jest obowiązkowa przy konstruowaniu testów do diagnozy indywidualnej
D. Wymaga sformułowania teorii leżącej u jego podstaw
5. Jeśli wartość współczynnika rzetelności dla testu wyniosła 0,19 oznacza to, że:
A. Jest on rzetelny
B. Żadna z odpowiedzi nie jest prawidłowa
C. Nie wiadomo co to znaczy, jeśli nie znamy szczegółów na temat badania rzetelności -
a nie to?
D. Jest on nisko rzetelny
6. Wykres osypiska w analizie czynnikowej służy do:

a. Określania, ile czynników należy wyodrębnić tak
b. Określania, ile osób badanych ma wyniki powyżej średniej
c. Interpretacji czynników
d. Rotacji czynników
7. Aby móc poprawnie wykonać analizę czynnikową:
A. Współczynnik KMO musi być większy od 1

B. Wszystkie wymiary muszą być ortogonalne
C. Wszystkie pytania w kwestionariuszu muszą być mierzone na tej samej skali
D. Musi być spełnione kryterium Cattella
8. Które badanie może być podstawą do analizy trafności zbieżnej i różnicowej za pomocą
macierzy "wielu cech - wielu metod":
a. Dwukrotne badanie samoopisu Inwentarzem Osobowości NEO-FFI bez przerwy

czasowej
b. Dwukrotne badanie samoopisu Skalą samooceny (SES) Rosenberga przed i po
pozytywnej interwencji ukierunkowanej na wzrost samoakceptacji
c. Badanie samoopisu i szacowania jednowymiarową Skalą Samooceny (SES)
Rosenberga
d. Badanie samoopisu i szacowania Inwentarzem Osobowości NEO-FFI (tak mi się
wydaje)
9. Obszary manifestacji w projekcie testu powinny pochodzić
a. Wszystkie odpowiedzi są prawidłowe

b. Z tego, jak mogą się przejawiać poszczególne obszary treści
c. Z definicji mierzonej cechy
d. Ze standardów APA
10. Jeśli test ma służyć tylko do badań naukowych, ale nie do diagnozy indywidualnej, to:
a. Nie trzeba przygotowywać podręcznika do testu

b. Można zrezygnować z robienia normalizacji tak
c. Można robić badania trafności tylko na grupach klinicznych
d. Musi być lepiej zweryfikowany pod względem trafności i rzetelności niż test tylko do
diagnozy
11. Jeśli budując kwestionariusz mierzący skłonność do kupowania impulsywnego
poprosimy sędziów kompetentnych o to, by ocenili czy ułożone przez nas pozycje testowe
faktycznie odnoszą się do tego zjawiska, to znaczy, że chcemy najprawdopodobniej
oszacować
A. Trafność fasadową
B. Trafność teoretyczną
C. Trafność treściową tak
D. Trafność kryterialną
12. W której z poniższych pozycji testowych możemy spodziewać się najwyższego

zróżnicowania odpowiedzi osób badanych?
a. Racjonalne jest robić przemyślane zakupy

b. Zdarzyło mi się kiedyś kupić coś bez przemyślenia
c. Zwykle robię zakupy bez ich przemyślenia tak
d. Zdarzyło mi się kiedyś kupić coś po drugim namyśle
13. Jeśli test ma służyć do diagnozy indywidualnej (a nie tylko do badań naukowych) to:
A. Można robić badania trafności tylko na grupach klinicznych

B. Nie trzeba przygotowywać podręcznika do testu
C. Musi być lepiej zweryfikowany pod względem trafności i rzetelności niż test tylko do
diagnozy
D. Można zrezygnować z robienia normalizacji
14. Kryterium oparte o wartości własne macierzy większe od 1 w analizie czynnikowej to

inaczej
a. Kryterium Cattella
b. Kryterium Kaisera
c. Kryterium KMO
d. Kryterium czynnikowe
15. Gdy układamy pozycje testowe do kwestionariusza, stopień skomplikowania języka,

który używamy powinien być dostosowany do:
a. Poziomu B2
b. Stylu odpowiadania badanych
c. Poziomu przeciętnego badanego
d. Poziomu badanych o najniższym poziomie językowym tak
16. Który spośród poniższych przykładów uważany jest za niewłaściwe podejście do

tworzenia pozycji kwestionariuszy:
A. Zaczerpnięcie pozycji z innych kwestionariuszy po uzyskaniu zgody

autorów/wydawców tych narzędzi
B. Zaczerpnięcie pozycji z psychotestów ogólnodostępnych w internecie
C. Samodzielne opracowanie pozycji (Ala)
D. Opracowanie pozycji na podstawie wyników badania wstępnego, dotyczącego analizy
przejawów cech/y, zgłaszanych przez grupę osób zrekrutowanych z populacji, dla
której tworzony jest kwestionariusz
17. Jeśli oczekujemy, że wymiary tworzonego przez nas testu będą tworzyć jedną, nadrzędną
cechę (są różnymi aspektami tej samej cechy), to którą z poniższych rodzajów rotacji
powinniśmy wykorzystać wykonując eksploracyjną analizę czynnikową?
a. W takim przypadku nie robi się rotacji

b. Rotację Ortomax
c. Rotację Varimax
d. Rotację Promax
18.Przystępując do oceny trafności treściowej pozycji testowych należy
a. Dokonać analizy trafności kryterialnej

b. Dokonać analizy statystycznej pozycji
c. Przeprowadzić badanie pilotażowe
d. Zapoznać sędziów kompetentnych z definicją mierzonej przez nas cechy
19.Przy badaniach trafności i rzetelności testu, grupy osób badanych:
a. Powinny być bardzo homogeniczne, by lepiej dopasować badanych do mierzonej

cechy
b. Powinny być bardzo homogeniczne, bo to podnosi trafność i rzetelność metody
c. Powinny być bardzo zróżnicowane, bo to pozwala na szersze zastosowanie testu w
przyszłości - a nie to?
d. Powinny być bardzo zróżnicowane, bo to pozwala później na lepsze uogólnianie
wyniku ja myślę, że to- Alicja
20.Metodą szacowania trafności teoretycznej nie jest analiza:
a. Różnic międzygrupowych
b. Zmian nieprzypadkowych
c. Procesu rozwiązywania testu
d. Logicznej treści testu tak
21.Jeśli wartość współczynnika rzetelności dla testu wyniosła 0,9 oznacza to, że:
A. Jest on rzetelny
C. Nie wiadomo co to znaczy, jeśli nie znamy szczegółów na temat badania rzetelności -
a nie to? też myślę, że to- Alicja
D. Jest on nisko rzetelny
22.Podczas tworzenia wielowymiarowego testu w oparciu o analizę czynnikową zazwyczaj

włącznie do skali są pytania:
a. Mające wysokie ładunki jednego z czynników i niskie lub zerowe pozostałych

b. Wszystkie o wartościach własnych większych od 0,30
c. Opisane przez przeciętne ładunki wszystkich czynników, zatem mierzące wszystkie
ważne aspekty zachowania
d. Wszystkie o bezwzględnych wartościach własnych większych od 0,30
23. Przystępując do oceny trafności treściowej pozycji testowych najpierw należy:
a. Dokonać analizy poprawności językowej

b. Dokonać analizy trafności teoretycznej
c. Dokonać analizy statystycznej pozycji
d. Przeprowadzić badanie pilotażowe
24. Które z podanych pojęć statystycznych NIE są związane z analizą czynnikową?
A. Rotacja
B. Dendrogram
C. Wykres osypiska
D. Wartość własna
25. Jeśli wartość współczynnika trafności dla testu wyniosła 0,19 oznacza to, że
A. Jest on trafny
C. Nie wiadomo co to znaczy jeśli nie znamy szczegółów na temat badania trafności
D. Jest on nisko trafny (Ala)
26.
27. Przy użyciu pakietu statystycznego obliczającego korelacje pozycja-skala korekta polega
na:
a. Włączeniu sumy wyniku ogólnego dowolnego pytania

b. Włączeniu z sumy wyniku ogólnego pytania, dla którego obliczana jest moc
dyskryminacyjna
c. Wyłączeniu z sumy wyniku ogólnego dowolnego pytania
d. Włączeniu do sumy wyniku ogólnego pytania, dla którego obliczana jest moc
dyskryminacyjna
28.Która metoda weryfikuje hipotezę teoretyczną o zróżnicowaniu grup - najczęściej

skrajnych, kontrastowych - w zakresie mierzonej zmiennej lub zmiennych?
a. Metoda sprawdzania różnic międzygrupowych

b. Metoda badania procesu rozwiązywania testu
c. Żadna odpowiedź nie jest prawidłowa
d. Metoda badania zmian nieprzypadkowych
29. Przy stosowaniu macierzy "wielu cech - wielu metod", aby dany test uznać za trafny
należy wykazać zarówno:
a. Trafność zbieżną, jak i diagnostyczną

b. Trafność zbieżną, jak i różnicową - to?
c. Trafność prognostyczna, jak i diagnostyczną
d. Trafność prognostyczną, jak i dyskryminowaną
30. W strategii teoretycznej, kluczowym etapem konstrukcji jest:
a. Identyfikacja podstawowych wymiarów zachowania

b. Empiryczny dobór wskaźników
c. Analiza definicji cech
d. Analiza czynnikowa
31. Wybór konkretnej metody rotacji w analizie czynnikowej zależy przede wszystkim od:
a. Tego, jak silnie skorelowane są pozycje w obrębie określonych czynników

b. Liczby pozycji wchodzących w skład czynników
c. Liczby wyodrębnionych czynników
d. Tego, czy zakładamy, że czynniki są ze sobą skorelowane czy nie
32. Jeśli w jednym badaniu autorzy wykorzystali do analizy rzetelności Alfę Cronbacha, to
co powinni zrobić w dalszych badaniach, żeby dowiedzieć się czegoś nowego o rzetelności
testu?
a. Także wykorzystać alfę Cronbacha

b. Wykorzystać metodę połówkową
c. Wykorzystać korelację bireryjną
d. Wykorzystać test-retest
33. Ładunek czynnikowy:

a. Jego ujemny znak wskazuje na pytania najmniej rzetelne
b. Wszystkie powyższe odpowiedzi są prawidłowe tak mi się wydaje (Ala)
c. W sensie operacyjnym to korelacja między pytaniem a czynnikiem
d. W sensie teoretycznym to znaczenie psychologiczne czynnika
34.Jeśli ładunek czynnikowy w analizie czynnikowej wyniósł -0,005, oznacza to, że:
a. Żadna z odpowiedzi nie jest prawidłowa

b. Pytanie na pewno nie pasuje do danego wymiaru
c. Trzeba sprawdzić, czy pytanie w kluczu nie powinno być odwrócone
d. Trzeba takie pytanie przeformułować przed kolejną turą badań
35. Jeśli budując test mierzący inteligencję obliczymy korelację między wynikiem w naszym
teście i wynikiem w teście matryc Ravena, to znaczy, że najprawdopodobniej chcemy
oszacować:
a. Trafność kryterialną
b. Trafność treściową
c. Trafność fasadową
d. Trafność teoretyczną
36.Jeśli test ma służyć do diagnozy indywidualnej (a nie tylko do badań naukowych) to:
a. Można zrezygnować z robienia normalizacji

b. Musi być lepiej zweryfikowany pod względem trafności i rzetelności niż test tylko do
badań naukowych
c. Można robić badania trafności tylko na grupach klinicznych
d. Nie trzeba przygotowywać podręcznika do testu
37.Po przeprowadzeniu analizy mocy dyskryminacyjnych poszczególnych pozycji autor

zidentyfikował w swojej skali pozycję testową o najsłabszym współczynniku mocy
dyskryminacyjnej - równym 0,04. Co się stanie z wysokością parametru Alfą Cronbacha,
jeśli autor usunie tę pozycję ze skali?
A. Najprawdopodobniej się nie zmieni

B. Najprawdopodobniej się zmniejszy
C. Najprawdopodobniej się zwiększy
D. Wszystko może się zdarzyć, bo moc dyskryminacyjna nie jest bezpośrednio
powiązana ze zgodnością wewnętrzną
38.Która z poniższych metod analizy rzetelności wymaga podwójnego badania tym samym
testem?
a. Alfą Cronbacha
b. Test-retest
c. Metoda połówkowa
d. Wersje równoległe
39.Jeśli oczekujemy, że wszystkie pozycje tworzonego przez nas testu będą wchodzić w
skład jednej skali, bez podwymiarów, to którą z poniższych rodzajów rotacji powinniśmy
wykorzystać wykonując eksploracyjną analizę czynnikową?
a. W takim przypadku nie robi się rotacji

b. Rotację Varimax
c. Rotację Promax
d. Rotację Ortomax
40. Przy stosowaniu macierzy "wielu cech - wielu metod", aby dany test uznać za trafny
należy wykazać zarówno:
a. Trafność zbieżną, jak i różnicową

b. Trafność zbieżną, jak i diagnostyczną
c. Trafność prognostyczną, jak i diagnostyczną
d. Trafność prognostyczną, jak i dyskryminatywną
41. Obszary treści w projekcie testu powinny pochodzić
a. Wszystkie odpowiedzi są prawidłowe

b. Ze standardów APA
c. Z definicji mierzonej cechy
d. Z tego, jak mogą się przejawiać poszczególne obszary manifestacji
42.Jeśli budując test mierzący inteligencję obliczymy korelację między wynikiem w naszym
teście i wynikami w kwestionariuszu NEO-FFI, to znaczy, że chcemy najprawdopodobniej
oszacować:
a. Trafność treściową
b. Trafność teoretyczną
c. Trafność kryterialną
d. Trafność fasadową
43. Aby autor kwestionariusza mógł poprawnie wykonać analizę metodą wielu cech-wielu
metod:
A. część osób badanych wypełnia jeden kwestionariusz, a pozostała część-inny

B. Kwestionariusz, który służy do weryfikacji trafności musi mierzyć tę samą cechę, co
kwestionariusz który weryfikuje
C. Każda osoba badana musi wypełnić kilka kwestionariuszy
D. Musi przebadać co najmniej 5-10 osób na każde pytanie w kwestionariuszu
44. Jeśli badacz wykonując eksploracyjną analizę czynnikową wykorzystał rotację

VARIMAX, to znaczy że oczekiwał, że:
A) wymiary kwestionariusza będą nieskorelowane

B) Wymiary kwestionariusza będą składały się na jedną nadrzędna cechę
C) kwestionariusz będzie miał tylko jeden wymiar
D) wymiary kwestionariusza będą nieortogralne
45. Najlepsze parametry rzetelności (przy tych samych pytaniach) mają skale odpowiedzi:
a. 5-7 punktowe
b. Nieparzyste
c. Parzyste
d. Które zawierają odpowiedź NIE WIEM
46. Jeśli wartość alfy Cronbacha w teście wyniosła 0,9 oznacza to, że:
A. jest on nisko rzetelny

B. Jest on nisko trafny
C. Jest on rzetelny
D. Jest on trafny
47. Jeśli wartość współczynnika trafności dla testu wyniosła 0,9 oznacza to, że:
a. jest on trafny
b. Jest on nisko trafny
c. Żadna z odpowiedzi nie jest prawidłowa
d. Nie wiadomo co to znaczy jeśli nie znamy szczegółów na temat badania trafności
48. .Po przeprowadzeniu analizy mocy dyskryminacyjnych poszczególnych pozycji autor
zidentyfikował w swojej skali pozycję testową o najwyższym współczynniku mocy
dyskryminacyjnej - równym 0,70. Co się stanie z wysokością parametru Alfą Cronbacha,
jeśli autor usunie tę pozycję ze skali?
A. Najprawdopodobniej się nie zmieni

B. Najprawdopodobniej się zmniejszy
C. Najprawdopodobniej się zwiększy
D. Wszystko może się zdarzyć, bo moc dyskryminacyjna nie jest bezpośrednio
powiązana ze zgodnością wewnętrzną
Psychometria.
Podstawy teoretyczne
dr hab. Agata Gąsiorowska, prof. Uniwersytetu SWPS
agasiorowska@swps.edu.pl
1
Literatura
• American Psychological Association, APA (2007).
Standardy dla testów stosowanych w psychologii i w
pedagogice. Gdańsk: Gdańskie Wydawnictwo
Psychologiczne.
• Hornowska, E. (2001). Testy psychologiczne: teoria i

praktyka. Warszawa: Wydawnictwo Naukowe
SCHOLAR.
• Anastasi A., Urbina, S (1999). Testy psychologiczne.

Warszawa: Pracownia Testów Psychologicznych.
2
Wprowadzenie
3
Co to w ogóle jest psychometria?
(inaczej - teoria testów)
• „… dział psychologii zajmujący się teorią i opracowywaniem testów
psychologicznych” (Szymczak, 1979)
• „dział metodologii psychologicznej zajmujący się pomiarem
zachowań ludzkich w aspekcie psychologicznym” (Szewczyk,
1979)
• „dziedzina obejmująca badania psychometryczne (…) na ogół
odnoszące się do różnych aspektów procesów psychicznych, w
tym badania osobowości, inteligencji, określania zdolności” (Reber,
2000)
• „gałąź psychologii zajmująca się określaniem warunków, jakie
powinny spełniać narzędzia wykorzystywane do pomiaru cech
psychologicznych, oraz budowaniem modeli wiążących wyniki
takich pomiarów z rzeczywistymi wartościami mierzonych
cech” (Hornowska, 2007)
4
Tworzenie i korzystanie
z testów psychologicznych
• Znajomość podstaw psychometrii to warunek adekwatnego

stosowania i właściwego interpretowania wyników
psychologicznych narzędzi diagnostycznych
• Cele stosowania testów
• opisanie pewnych cech jednostki oraz przewidywanie jej
zachowań w przyszłości
• ewentualna zmiana psychospołecznego stanu jednostki
• Testy psychologiczne są atrakcyjne, bo:
• redukują do minimum subiektywnego czynnika w diagnozie
• przeprowadzanie diagnozy za pomocą testów jest sprawne,
szybkie i tanie – diagnozowanych może być równocześnie
wiele osób, w jednym lub różnych miejscach
5
Źródła nadużyć związane z korzystaniem
z testów psychologicznych
• Wadliwie/nieprofesjonalne konstruowanie,
stosowanie (obliczanie) i interpretowanie wyników
testu
• Wadliwie/nieprofesjonalne/nietrafne decyzje,
mające wpływ na losy osoby poddanej badaniu
testowemu (np. oddziaływania terapeutyczne czy
selekcyjne)
• Wadliwe (nietrafne i nierzetelne) rezultaty badań
naukowych przeprowadzonych z wykorzystaniem
wadliwych testów psychologicznych i „niby-testów”
6
Test psychologiczny (1)
• Amerykańskie Towarzystwo Psychologiczne (APA):
• “Testem jest narzędzie czy procedura służące ocenie.

Ich istotą zaś - otrzymanie w określonych warunkach
próbki zachowania osób badanych i następnie
dokonanie ich oceny zgodnie z wystandaryzowanymi
regułami”
• Test nie służy do tego, aby poznać klienta „w ogóle”.

Jego stosowanie wymaga jasnego wskazania problemu
diagnostycznego i równie jasnego określenia podstaw
interpretacji otrzymanych wyników.
7
• Badanie testowe to taka sytuacja, w której osoba
badana uczestniczy dobrowolnie, świadoma celu jakim
jest jej ocena
• Jest to sytuacja tworzona specjalnie dla celów

diagnostycznych, w której wywołuje się zachowania
typowe pod względem tej charakterystyki jaka ma być
przedmiotem celowej obserwacji
• Jest to sytuacja, która od diagnosty nie wymaga

osobistego zaangażowania i w której jasno jest
określony zakres i rodzaj dopuszczalnych zachowań
8
• Test psychologiczny jest specyficzną procedurą

diagnozowania. Może on być zbiorem zadań lub
pytań, które – w standardowych warunkach – mają
wywoływać określone rodzaje zachowań i
dostarczać wyników o pożądanych właściwościach
psychometrycznych
9
Każda próba sformułowania precyzyjnej definicji
„testu” lub „testowania” jako procesu jest
prawdopodobnie skazana na niepowodzenie,
ponieważ będzie przypuszczalnie wyłączać pewne
procedury, które powinny być włączone, i włączać
inne, które powinny być wyłączone.
10
Wytyczne Międzynarodowej Komisji ds.
Testów (International Test Commission
– ITC) z 2000
• Testowanie obejmuje szeroki zakres procedur stosowanych w diagnozie
psychologicznej, zawodowej i szkolnej.
• Testowanie może obejmować procedury pomiaru zarówno zachowań
normalnych, jak i odbiegających od normy czy zaburzonych.
• Zazwyczaj procedury testowania przewidują badanie w starannie kontrolowanych
lub ujednoliconych warunkach, ujętych w formalnych protokołach oceny.
• Procedury te dostarczają miar wykonania i wymagają wnioskowania na podstawie
próbek zachowań
• Obejmują one także procedury, których wynikiem może by jakościowa
klasyfikacja lub uporządkowanie osób badanych (np. w kategoriach typów).
• Każda procedura stosowana do „testowania” w powyższym rozumieniu tego
słowa, powinna by traktowana jako „test”, niezależnie od sposobu prowadzenia
badania; niezależnie od tego, czy została opracowana przez profesjonalnego
autora testów; i niezależnie od tego, czy zawiera zestaw pytań, czy te wymaga
wykonania zada lub czynności (np. próbki pracy, testy psychomotoryczne).
11
Rodzaje testów (1)
• Testy standaryzowane
• Testy niestandaryzowane
12
Rodzaje testów (2)
• Testy indywidualne
• Testy grupowe
13
Rodzaje testów (3)
• Testy szybkości
• Testy mocy
14
Rodzaje testów (4)
• Testy obiektywne
• Testy nieobiektywne
15
Rodzaje testów (5)
• Testy słowne (werbalne)
• Testy bezsłowne (niewerbalne)
16
Rodzaje testów (6)
• Testy właściwości poznawczych
• Wiedza, umiejętności, zdolności (także czasy reakcji)
• Istnieje odpowiedź obiektywnie prawidłowa/lepsza/gorsza
• Zagrożenie: zgadywanie
• Testy właściwości afektywnych
• Uczucia, postawy, osobowość, emocje, wierzenia itd.
• Autoekspresja, brak odpowiedzi obiektywnie prawidłowej
• Zagrożenie: trafność samoopisu
17
Rodzaje testów (7)
• Testy zorientowane na normy
• interpretacja - względem grupy odniesienia
• Testy zorientowane na kryterium (standard

wykonania)
• interpretacja - względem np. specyficznej wiedzy

czy umiejętności jakie udało się opanować
18
Rodzaje testów wg APA (2000)
• Kryterium - złożoność i wymagana wiedza
psychologiczna i umiejętności posługiwania się
danym testem
• Poziom A: testy przydatności zawodowej
• Poziom B: testy do grupowego badania inteligencji

i kwestionariusze zainteresowań
• Poziom C: testy do indywidualnego badania

inteligencji, testy osobowości i techniki projekcyjne
19
Co definiuje kryteria oceny jakości i
zasady wykorzystywania testów
psychologicznych?
• Podstawowy dokument: Standardy dla testów

stosowanych w psychologii i w pedagogice (APA
2007)
• Zasadą naczelną tego dokumentu jest promowanie

uzasadnionego i etycznego stosowania testów oraz
dostarczanie podstaw do oceny jakości praktyki
badania testami
20
Zawartość Standardów
Wprowadzenie Cz. II Bezstronność testowania
Strony uczestniczące w procesie testowania 7. Bezstronne badanie testem i stosowanie
Cel Standardów testu
Kategorie Standardów 8. Prawa i odpowiedzialność osób

badanych
Testy i wykorzystanie testów, do których
stosują się te standardy 9. Testowanie osób o różnym rodowodzie
językowym
Na co należy zwrócić uwagę stosując
Standardy? 10. Badania testowe osób
niepełnosprawnych
Liczba standardów
Testy jako miary konstruktów
Cz. III Zastosowania testów
Cz. I Tworzenie testu, jego ocena oraz
prezentacja wyników 11. Odpowiedzialność użytkowników testów
1. Trafność 12. Testowanie i diagnoza psychologiczna
2. Rzetelność i błędy pomiaru 13. Diagnoza i testowanie w obszarze

edukacji
3. Tworzenie testu i jego rewizje
14. Testowanie dla celów zatrudnienia oraz
4. Skale, normy oraz porównywanie wyników przyznawania licencji
5. Procedura badania testem, ocenianie i 15. Testowanie dla celów ewaluacji oraz
przedstawianie wyników testowych polityki społecznej
6. Dokumentacja testu
21
Kryteria oceny jakości
testów psychologicznych
• Obiektywność
• Standaryzacja i bezstronne stosowanie
• Rzetelność
• Trafność
• Normalizacja, korzystanie z norm
• Adaptacja kulturowa
22
Obiektywność
• Niezależność wyników testowania (od tego kto,
gdzie i kiedy dokonuje ich oceny)
• Test jest obiektywny, jeżeli dwie różne osoby

opracowujące jego wyniki dochodzą do tego
samego rezultatu
• Aby było to możliwe, test musi posiadać jasno

określony klucz oceniania odpowiedzi,
zmniejszający do minimum wpływ subiektywnych
interpretacji
23
Standaryzacja
• Jednolitość reguł i warunków badania
• Aby wyniki danego testu można było ze sobą

porównywać, dany test powinien być zawsze
przeprowadzany w identycznych warunkach
• Tylko wtedy różnice w wynikach testowych

badanych osób można przypisać czynnikom
indywidualnym a nie np. zewnętrznym warunkom
badania
24
Rzetelność
• Dokładność pomiaru
• W języku potocznym termin rzetelność oznacza

niezawodność (dokładność)
• W psychometrii termin ten utożsamiany jest z

powtarzalnością otrzymanych wyników
• Rzetelność oznacza zgodność wyników

otrzymanych przez te same osoby, które zostały
przebadane kilka razy tym samym testem
25
Trafność
• Określenie obszaru zastosowania testu
• Trafność jest to dokładność z jaką test mierzy to, co ma
mierzyć
• Trafność jest to stopień, w jakim test jest w stanie osiągnąć
stawiane mu cele
• Trafność testu wskazuje na wielkość błędu
spowodowanego rozbieżnością między zamierzeniami
autora testu a tym, co test faktycznie mierzy
• Trafność odzwierciedla relację jaka zachodzi między
koncepcją właściwości psychologicznej a użytymi
wskaźnikami tej właściwości, czyli adekwatność
operacjonalizacji wielkości psychologicznej
26
Normalizacja (1)
• Nadawanie znaczenia wynikom testowym
• Zgodnie z kryterium teoretycznym norma wyznaczona jest przez

jakąś teorię (koncepcję) psychologiczną. Zasadniczym
znaczeniem terminu norma jest pewien wzór (model) wynikający
z przyjętej teorii, pozostałe zaś znaczenia mieszczą się w tych
ramach.
• Według kryterium kulturowego normę określają przepisy i wzory

kulturowe. Bez względu na treść tych wzorów istotą normy jest
zgodność z takim przepisem.
• Według kryterium statystycznego normą jest to, co jest

opisywane jako „zachowanie większości” czy jako „zachowanie
średnie lub przeciętne”
27
Normalizacja (2)
• W psychometrii przyjmuje się statystyczne rozumienie normy.
• UWAGA! Norma nie oznacza standardu „dobrego”

wykonania testu; norma opisuje poziom typowego wykonania
testu przez osoby należące do określonej grupy.
• Normą – w sensie psychometrycznym – jest standard

ilościowy, wyznaczony przez średnią, medianę lub inną
miarę tendencji centralnej obliczoną dla grupy
przedstawicieli danego typu (gatunku).
• Normą jest typowe zachowanie (typowy wynik w teście)

otrzymany dla określonej grupy osób.
28
Adaptacja
• Proces przystosowania wersji pierwotnej do

specyfiki kultury lokalnej
• Adaptacja nie sprowadza się ona tylko do

właściwego przetłumaczenia tekstu oryginału.
• Uwaga! Spora część testów stosowanych w Polsce

to testy oryginalnie obcojęzyczne
29
Jak odróżnić
dobry test od testu złego?
• Autor testu: Test ma autora. Test zagraniczny ma również autora polskiej adaptacji
• Podręcznik zawiera:
• Opis teorii lub sposobu doboru grup empirycznych
• Opis grupy, na której przeprowadzono badania standaryzacyjne
• Opis procedury badania i interpretowania wyniku
• Opis badań dotyczących rzetelności i błędu standardowego pomiaru
• Opis badań dotyczących trafności zalecanej interpretacji
• Opis procedury normalizacji i normy
• Pomoce: Dostępny jest opis materiałów testowych, pomocy, arkusza pytań,
arkusza odpowiedzi
• Zabezpieczanie testu: Zostały podjęte wszelkie możliwe kroki, aby materiał
testowy został właściwie zabezpieczony.
• Ochrona prawna: Legalna dystrybucja.
30
Standaryzacja
31
Na czym polega
standaryzacja?
• Dokładne i szczegółowe określenie procedury
prowadzenia badań testowych, czyli
• procedury badania testem
• procedury obliczania wyników
• procedury interpretowania wyników
• Dla każdego testu opracowuje się podręcznik, w
którym dokładnie opisana jest procedura
przeprowadzenia badań
32
Elementy podręcznika
• Kolejność czynności, które wykonuje osoba prowadząca
badania
• Dokładny tekst instrukcji podawanej osobie badanej
• Arkusz odpowiedzi (jeśli jest taki przewidziany ), przygotowany
i stosowany w każdym badaniu w identycznym kształcie
• Klucz, przy pomocy którego dokonuje się punktacji
uzyskanych rezultatów badań
• Normy oceny uzyskanych wyników surowych
• Podanie zasad, przy pomocy których interpretuje się uzyskane
rezultaty badań testowych zgodnie z duchem teorii, w oparciu
o którą test został opracowany
33
Procedura badania testem
• Zasady ogólne
• Wskazówki dotyczące badania testem powinny być przedstawione na tyle jasno i
wyraźnie, aby testujący mógł i chciał powtórzyć sposób badania zastosowany przy
ustalaniu norm
• Stosując metody testowe należy dokładnie przestrzegać procedury badania testem
opisanej w podręczniku
• Instrukcja
• W instrukcji należy omówić takie zagadnienia jak fakt badania indywidualnego czy
grupowego, liczebność badanej grupy, limity czasowe, sposoby zaznaczania
odpowiedzi na arkuszach, możliwość powrotu do poprzednich zadań lub pytań,
problem zgadywania, kolejność stosowania testów lub zadań, zakres pomocy
udzielanej badanemu
• Jeżeli dopuszcza się możliwość rozszerzania lub uszczegóławiania instrukcji
przedstawionej w podręczniku testowym, to należy przedstawić warunki w jakich
postępowanie to jest dopuszczalne
• Pomoce
• Aby utrzymać standaryzację metody testowej należy okresowo sprawdzać materiał
testu, wyposażenie oraz stosowaną procedurę
34
Procedura obliczania
wyników
• Klucz do oceny odpowiedzi
• Osoby stosujące testy są odpowiedzialne za dokładne
obliczanie, sprawdzanie, kodowanie i rejestrowanie
wyników testowych
• Należy okresowo kontrolować stosowany system
obliczania wyników
• Obliczanie wyników
• Procedura obliczania wyników testowych powinna
zostać przedstawiona w podręczniku testowym na tyle
szczegółowo i dokładnie, aby prawdopodobieństwo
popełnienia błędu było jak najmniejsze
35
Procedura interpretowania
norm
• Normy przedstawione w podręczniku testowym
powinny zostać opracowane dla wyraźnie
zdefiniowanych i opisanych populacji
• Populacje te muszą odpowiadać tym grupom osób,

z którymi badający testem będzie zazwyczaj
porównywał osoby badanej
• Należy brać pod uwagę normy właściwe dla osoby

badanej
36
Potencjalne zagrożenia
(czyli czego nie wolno robić)
• Stosowanie testu przeznaczonego do badań
indywidualnych w sposób grupowy
• Tworzenia swoich własnych, samodzielnie wykonanych

materiałów/pomocy testowych (w szczególności,
stosowanie testu przeznaczonego do badań papier-i-
ołówek w sposób internetowy/elektroniczny)
• Podawania instrukcji w różny sposób
• Zadawania tylko części pytań zawartych w danym

teście który jest całością
37
Proces wnioskowania
psychometrycznego
• Proces wyprowadzania wniosków o wartościach
cech psychologicznych badanych osób na
podstawie wyników, jakie otrzymały one w testach
psychologicznych
• Możliwość wnioskowania o nieobserwowalnych

właściwościach psychologicznych na podstawie
obserwowalnego zachowania w kontrolowanych
warunkach oraz wyrażającego go wyniku
testowego
38
Cecha psychologiczna
i jej pomiar
• Każdej cesze odpowiada kontinuum na którym
można rozmieścić wszystkie osoby badane
zgodnie z jej natężeniem
• Pozycja jednostki na tym kontinuum jest względnie

stała, i wyjaśnia stałość zachowania w podobnych
sytuacjach
• Częstość określonych zachowań -> wyższy poziom

cechy która manifestuje się w tych zachowaniach
39
Wynik obserwowany
a wynik prawdziwy (1)
• Wynik obserwowany to wynik otrzymany w teście
psychologicznym
• odzwierciedla poziom wykonania danych zadań/

pozycji tworzących test (prawidłowy/
nieprawidłowy, diagnostyczny/niediagnostyczny)
• może - ale nie musi odzwierciedlać rzeczywisty

poziom mierzonej cechy u osoby badanej
40
Wynik obserwowany
a wynik prawdziwy (2)
• Wynik prawdziwy to wynik odzwierciedlający

rzeczywistą wartość mierzonej cechy u danej
osoby
• model platoński vs model statystyczny
41
Test
pomiar
Wynik otrzymany
rzetelność
Wynik prawdziwy
trafność
Cecha
psychologiczna
42
Rzetelność
Jak dobrze mierzymy? Jaki popełniamy błąd pomiaru?
43
• W pewnym sensie, wszystkie pomiary
psychologiczne są nierzetelne
• Wynik obserwowany (otrzymany w teście) nigdy nie

jest idealnym odzwierciedleniem rzeczywistej
wartości mierzonej cechy - zawsze jest obarczony
pewnym błędem
44
Rodzaje błędów pomiaru
• Błąd systematyczny
• Wynika ze stałych cech osoby badanej lub narzędzia
• Nie ma nic wspólnego z mierzoną cechą
psychologiczną
• W różnych sytuacjach testowania w taki sam sposób
wpływa na wyniki testowania
• Błąd losowy
• Powstaje w wyniku działania przyczyn przypadkowych
• W różnych sytuacjach testowania może w różny
sposób wpływać na wyniki testowania
45
Źródła błędu losowego
• Konstrukcja testu/dobór treści

• Sytuacja testowania (czynniki sytuacyjne,
czynniki związane z osobą badaną, czynniki
związane z osobą badającą)
• Sposób oceny wyników (niedokładne kryteria
oceny wyników, błędy mechaniczne przy
zliczaniu)
46
Klasyczna teoria testów
Wynik w teście Błąd pomiaru
X=T+E
Wynik
prawdziwy
• Podstawowe założenia:
• Błąd pomiaru ma rozkład normalny
• ME = 0 (założenie o nieobciążoności narzędzia)
• rTE=0 (założenie o niezależności)
• rE1E2=0
47
• Wskaźnikiem rzetelności jest wielkość
współczynnika korelacji między wynikiem
obserwowanym a wynikiem prawdziwym (𝜌XT)
• ALE - jak ją obliczyć, skoro nie znamy wyniku
prawdziwego?
48
σ XT σ (T +E )T σ + σ TE
2
σ2
σT
ρ XT = = = T
= T
=
σ Xσ T σ Xσ T σ Xσ T σ Xσ T σ X
49
2
σ2
σT
ρ XT = = = T
= T
=
49
X=T+E
2
σ2
σT
ρ XT = = = T
= T
=
49
X=T+E
2
σ2
σT
ρ XT = = = T
= T
=
49
X=T+E
2
σ2
σT
ρ XT = = = T
= T
=
49
X=T+E rTE=0
2
σ 2
σT
ρ XT = = = T
= T
=
49
X=T+E rTE=0
2
σ 2
σT
ρ XT = = = T
= T
=
49
X=T+E rTE=0
2
σ 2
σT
ρ XT = = = T
= T
=
49
Definicja rzetelności testu
σ 2
ρ 2
= T
XT
σ 2
X
50
σ 2
ρ 2
= T
XT
σ 2
X
Rzetelność
testu
50
σ 2
ρ 2
= T
XT
σ 2
X
Rzetelność
testu Wariancja
wyników
testowych
50
Wariancja
wyników
prawdziwych
σ 2
ρ 2
= T
XT
σ 2
X
Rzetelność
testu Wariancja
wyników
testowych
50
Testy równoległe
• Testy A i B są równoległe jeśli mierzą to samo i tak
samo, ale składają się z różnych pozycji testowych
• XA=XB
• 𝝈A = 𝝈B
• riAjA = riBjB
• rAZ = rBZ
51
σ XA XB σ (T +EA )(T +EB ) σ + σ TEA + σ TEB + σ EAEB
2
rAB = = =
T
σ X Aσ X B σ X Aσ X B σ X Aσ X B
σ2
σ 2
rAB = T
= = ρ XT
T 2
σ Xσ X σ 2
X
52
X=T+E

2
rAB = = =
T
σ2
σ 2
rAB = T
= = ρ XT
T 2
σ Xσ X σ 2
X
52
X=T+E

2
rAB = = =
T
𝝈A = 𝝈B
σ2
σ 2
rAB = T
= = ρ XT
T 2
σ Xσ X σ 2
X
52
X=T+E

2
rAB = = =
T
𝝈A = 𝝈B
σ2
σ 2
rAB = T
= = ρ XT
T 2
σ Xσ X σ 2
X
Rzetelność
testu
52
Metody badania
rzetelności
Wymagana liczba wersji testu

Wymagana liczba badań
Jedna Dwie
Metoda połówkowa,
Jedno Kudera Richardsona, ——————
α Cronbacha
Dwa, jedno od razu po Powtarzanie testu Wersje alternatywne

drugim (test-retest) (równoległe)
Powtarzanie testu Wersje alternatywne

Dwa w odstępie czasu
(test-retest) (równoległe)
53
Metody badania
rzetelności
Estymacja spójności
wewnętrznej

Jedna Dwie
Metoda połówkowa,
α Cronbacha


53
Metody badania
rzetelności
wewnętrznej

Jedna Dwie
Metoda połówkowa,
α Cronbacha


Estymacja wiarygodności
testu
53
Metody badania
rzetelności
wewnętrznej

Jedna Dwie
Metoda połówkowa,
α Cronbacha


Estymacja wiarygodności Estymacja stabilności

testu bezwzględnej
53
Metody badania
rzetelności
Estymacja spójności Estymacja równoważności
wewnętrznej międzytestowej

Jedna Dwie
Metoda połówkowa,
α Cronbacha


Estymacja wiarygodności Estymacja stabilności

testu bezwzględnej
53
Metody badania
rzetelności

Jedna Dwie
Metoda połówkowa,
α Cronbacha


Estymacja wiarygodności Estymacja stabilności Estymacja stabilności

testu bezwzględnej względnej
53
Metody badania
rzetelności

Jedna Dwie
Metoda połówkowa,
α Cronbacha


Estymacja wiarygodności Estymacja stabilności Estymacja stabilności

testu bezwzględnej względnej
Jedna osoba badana - wielu oceniających

53 - Zgodność ocen sędziów
Metoda połówkowa
• Formy równoległe w obrębie tego samego testu
• Podział
• losowy
• parzyste/nieparzyste
• z uwzględnieniem treści i trudności pozycji
• Obliczenie współczynnika równoważności międzypołówkowej rpp
• Szacowanie rzetelności całego testu (rtt) na odstawie rzetelności
połówki - wzór Spearmana-Browna
2rpp
rtt =
1+ rpp
54
Analiza zgodności
wewnętrznej (1)
• Wzór Kudera-Richardsona - wzór KR20
k
k ∑pq i i
KR20 = (1− i=1
)
k −1 σX2
55
Analiza zgodności
wewnętrznej (1)
• Wzór Kudera-Richardsona - wzór KR20
k
k ∑pq i i
KR20 = (1− i=1
)
k −1 σX2
rzetelność testu
55
Analiza zgodności
wewnętrznej (1)
proporcja
odpowiedzi
• Wzór Kudera-Richardsona - wzór KR20 diagnostycznych
(poprawnych)
k
k ∑pq i i
KR20 = (1− i=1
)
k −1 σX2
rzetelność testu
55
Analiza zgodności
wewnętrznej (1)
proporcja
odpowiedzi
(poprawnych)
k
k ∑pq i i proporcja
odpowiedzi
KR20 = (1− i=1
) niediagnostycznych
k −1 σX2 (niepoprawnych)
rzetelność testu
55
Analiza zgodności
wewnętrznej (1)
proporcja
odpowiedzi
(poprawnych)
k
odpowiedzi
KR20 = (1− i=1
rzetelność testu
liczba pozycji
testowych
55
Analiza zgodności
wewnętrznej (1)
proporcja
odpowiedzi
(poprawnych)
k
odpowiedzi
KR20 = (1− i=1
rzetelność testu
liczba pozycji wariancja

testowych wyników w teście
55
Analiza zgodności
wewnętrznej (2)
• Alfa Cronbacha - rozszerzenie wzoru KR20
k
k ∑σ 2
i
α= (1− i=1
)
k −1 σX 2
56
Analiza zgodności
wewnętrznej (2)
k
k ∑σ 2
i
α= (1− i=1
)
k −1 σX 2
rzetelność testu
56
Analiza zgodności
wewnętrznej (2)
k
k ∑σ 2
i
α= (1− i=1
)
k −1 σX 2
rzetelność testu
liczba pozycji
testowych
56
Analiza zgodności
wewnętrznej (2)
k
k ∑σ 2
i
wariancja dla
każdej pozycji
α= (1− i=1
) testowej
k −1 σX 2
rzetelność testu
liczba pozycji
testowych
56
Analiza zgodności
wewnętrznej (2)
k
k ∑σ 2
i
wariancja dla
każdej pozycji
α= (1− i=1
) testowej
k −1 σX 2
rzetelność testu
liczba pozycji wariancja

testowych wyników w teście
56
Różne metody mierzą różne
źródła wariancji błędu
Metoda szacowania współczynnika
Wariancja błędu
rzetelności
Metoda połówkowa, Kudera Dobór treści, liczba pozycji testowych
Richardsona, α Cronbacha
Powtarzanie testu (jedno po drugim) Czynniki losowe
Powtarzanie testu (w odstępie czasu) Czynniki losowe, zmienność w czasie
Wersje alternatywne (jedno po drugim) Dobór treści
Wersje alternatywne (w odstępie

Dobór treści i zmienność w czasie
czasu)
Zgodność ocen sędziów Różnice w ocenach między sędziami

57
Jak interpretować wielkość
współczynnika rzetelności?
rtt=0,79 rtt=0,39
150
rtt=0,95 rtt=0,999
140
130
120
110
100
100 110 120 130 140 150
58
Jak interpretować wielkość
współczynnika rzetelności?
Procent wariancji wyniku, który można przypisać

różnym źródłom, np
rtt = 0,64
64% zmienności 36% zmienności

wyników testowych wyników testowych
zależy od rzeczywistego zależy od wariancji błędu
zróżnicowania
59
Przykład - rzetelność Inwentarza
Rzetelno Osobowości
Inwentarza osobowo ci NEO-FFI
NEO-FFI Costy i McCrae
wspó czynnik alfa Cronbacha
Neurotyczno Ekstrawersja Otw. na do w. Ugodowo Sumienno

15-19 0,80 0,80 0,69 0,66 0,81
20-29 0,82 0,77 0,71 0,61 0,79
30-39 0,84 0,74 0,64 0,72 0,81
40-49 0,76 0,71 0,58 0,60 0,80
50-80 0,73 0,77 0,47 0,60 0,76
• U osób starszych homogeniczność zachowań konstytuujących
Dane te cechy
podstawowe prowadz do wniosku,
osobowości e teza o uniwersalno
jest znacznie mniejsza niż ci
u osób
demograficznej Wielkiej Pi tki ma pe ne uzasadnienie jedynie w
młodych
przypadku p ci, a w odniesieniu do wieku – raczej u osób m odych.
•Ograniczona możliwość stosowania polskiej adaptacji NEO-FFI do
Uindywidualnej
osób starszychdiagnozy
bowiem osobowości
homogeniczno zachowa
- raczej konstytuuj
dla osób młodych, cych
w
podstawowe
grupach starszych cechy
należyosobowo
się liczyćcizejest znaczniepogorszeniem
znacznym mniejsza.
rzetelności i związanym z tym bardzo dużym błędem pomiaru
60
Standardowy błąd pomiaru
dla wyniku otrzymanego
Standardowy b d pomiaru dla wyniku otrzymanego
SEM S X 1 rtt
gdzie: SEM to standardowy b d pomiaru
Sx to odchylenie standardowe ogólnych wyników testowych
rtt to rzetelno testu
Rzetelność testu
Standardowy błąd
pomiaru
Odchylenie
standardowe wyników
testowych
61
Przedział ufności dla
wyniku obserwowanego
X − Zα /2 SEM; X + Zα /2 SEM
półprzedział ufności
X
Zα/2*SEM Zα/2*SEM
85% przedział ufności Zα/2 = 1,44
62
Przykład budowania przedziału
ufności
• Badanie skalą WAIS-R(PL)

• Osoba w grupie wiekowej 20-24 lata, uzyskała 93 pkt w skali
pełnej
• 90% przedział ufności, Zα/2 = 1,64
• rzetelność testu na tym poziomie wieku - 0.902
• SX = 15
SEM = 15 1− 0.902 = 15 × 0, 313 = 4,696

Zα /2 SEM = 1,64 × 4,696 = 7, 701 → 8 pkt
X − Zα /2 SEM; X + Zα /2 SEM → 93 − 8; 93 + 8 → 85; 101

63
Porównywanie dwóch
przedziałów ufności
SEM X−Y = SEM + SEM2
X
2
Y
Standardowy błąd Standardowy błąd

dla wyniku X dla wyniku Y
• Minimalna statystycznie istotna różnica wynosi
Zα /2 SEM X−Y
64
Porównywanie dwóch przedziałów
ufności
Osoba A - 50 pkt Osoba B - 100 pkt
65
ufności
90% przedział ufności, Z=1,64
SEM=20
Zα /2 SEM = 1,64 × 20 = 32,8 → 33pkt
65
ufności
SEM=20
Zα /2 SEM = 1,64 × 20 = 32,8 → 33pkt

<17 ; 83> <67 ; 133>
65
ufności
SEM=20
Zα /2 SEM = 1,64 × 20 = 32,8 → 33pkt

<17 ; 83> <67 ; 133>
SEM X−Y = 20 + 20 = 28,285

2 2
65
ufności
SEM=20
Zα /2 SEM = 1,64 × 20 = 32,8 → 33pkt

<17 ; 83> <67 ; 133>
SEM X−Y = 20 + 20 = 28,285

2 2
Zα /2 SEM X−Y = 1,64 × 28,285 = 46, 386 → 47 pkt

65
ufności
SEM=20
Zα /2 SEM = 1,96 × 20 = 39,2 → 40 pkt

<10 ; 90> <60 ; 140>
SEM X−Y = 20 + 20 = 28,285

2 2
Zα /2 SEM X−Y = 1,96 × 28,285 = 55, 437 → 56 pkt

66
Dlaczego rzetelność testu
jest ważna w diagnozie?
• Niska rzetelność wyników zawsze ogranicza
możliwość zastosowania testu, i to do wszystkich
celów - ale zwłaszcza do diagnozy indywidualnej
67
niskie przeciętne wysokie

68
1 2 3 4 5 6 7 8 9 10

68
1 2 3 4 5 6 7 8 9 10

68
Półprzedział ufności
3 steny
1 2 3 4 5 6 7 8 9 10

68
1 sten
3 steny
1 2 3 4 5 6 7 8 9 10

68
Trafność
Czy mierzymy to, co chcieliśmy mierzyć?
69
Trafność testu (1)
• Trafność to dokładność z jaką test mierzy to co ma mierzyć
• Trafność jest to stopień, w jakim test jest w stanie osiągnąć

stawiane mu cele
• Trafność testu wskazuje na wielkość błędu

spowodowanego rozbieżnością między zamierzeniami
autora testu a tym co test faktycznie mierzy
• Trafność odzwierciedla relację jaka zachodzi między

koncepcją właściwości psychologicznej a użytymi
wskaźnikami tej właściwości, czyli adekwatność
operacjonalizacji wielkości psychologicznej
70
Trafność testu (2)
• Trafność testu a trafność interpretacji wyników
danego testu
• Trafność to zintegrowany proces oceny stopnia, w

jakim dowody empiryczne i rozważania natury
teoretycznej potwierdzają adekwatność i
poprawność wniosków wyprowadzanych na
podstawie wyników testowych czy innych narzędzi
pomiaru (Messick, 1989)
71
Walidacja
• Określanie trafności danego testu
• Zbieranie i ocena danych świadczących o trafności

określonej interpretacji wyników testu
• Im więcej przeprowadzonych danych, tym szerszy

potencjał zastosowania testu
72
Test
pomiar
Wynik otrzymany
rzetelność
Wynik prawdziwy
trafność
Cecha
psychologiczna
73
Rodzaje/aspekty trafności
• TREŚCIOWA (inaczej wewnętrzna, logiczna; content validity)
• Ocena (na podstawie pomiaru testowego) całokształtu zachowań,
których próbkę pobiera test
• np. ocena wiadomości z matematyki na przykładzie konkretnego
zadania
• KRYTERIALNA (criterion-related validity)
• Ocena czy osoba posiada lub będzie posiadać pewną określoną
właściwość psychologiczną (inną niż bezpośrednio ta, którą mierzy test)
• TEORETYCZNA (construct validity)
• Pomiar nasilenia hipotetycznej właściwości (czyli psychologicznego
konstruktu, o którym mają świadczyć odpowiedzi na bodźce testowe)
• Relacje między aspektami trafności
74
Uwaga!
Trafność fasadowa
• Trafność treściowa to nie trafność fasadowa (face validity).
• Trafność fasadowa dotyczy tego, co wydaje się mierzyć

test, a nie tego co test rzeczywiście mierzy
• Trafność fasadowa opisuje, jak spostrzegają test osoby

badane i czy – z ich punktu widzenia – wydaje się on
trafnie mierzyć to, co ma mierzyć
• Trafność fasadowa zapewnia, że dany test wydaje się – w

opinii osób badanych – adekwatny do określonego celu
• Czy warto jest dbać o trafność fasadową?
75
Trafność treściowa
• Zakres w jakim pozycje testowe właściwie reprezentują
uniwersum pozycji testowych lub interesujący nas konstrukt
• Zakres, w jakim treść testu stanowi reprezentatywną próbę

dziedziny, która ma być przedmiotem pomiaru
• Aby potwierdzić trafność treściową zbioru wyników

otrzymanych w teście należy wykazać, że zachowania
demonstrowane w badaniu testowym są reprezentatywną
próbką zachowań ujawniających się w interesującej
badacza sferze
• Najczęściej - metoda sędziów kompetentnych
76
Trafność kryterialna
• Kryterium jest to zachowanie czy właściwość, o której chcemy
wnioskować z wyniku ocenianego testu.
• Kryterium jest to zmienna pozatestowa, zewnętrzna w stosunku

do testu, inna niż ta która mierzy interesujący nas test
• Kontaminacja (zanieczyszczenie) kryterium: wyniki testowe nie

mogą wpływać na pozycję jednostki w zakresie branego pod
uwagę kryterium
• Trafność kryterialna jest to stopień zgodności pomiarów

otrzymanych za pomocą testu, którego trafność oceniamy oraz
pomiarów otrzymanych w wyniku oceny kryterium
77
Rodzaje
trafności kryterialnej
• Trafność diagnostyczna (concurrent validity) - kryterium dla testu jest pomiar
zachowania czy cechy aktualnie występującej u osoby badanej
• Trafność prognostyczna (predictive validity) - kryterium dla testu jest pomiar

zachowania czy cechy mającej wystąpić w przyszłości u osoby badanej
• Różnica pomiędzy trafnością diagnostyczną a trafnością prognostyczną nie

polega na różnicy w czasie zbierania danych kryterialnych, lecz na tym, że
różne są przedmioty badania
• Przy diagnozie obchodzi nas stwierdzenie stanu istniejącego
• Przy prognozie - prawdopodobieństwo wystąpienia pewnych skutków stanu

aktualnego
• Wysoka trafność diagnostyczna nie gwarantuje wysokiej trafności
prognostycznej
78
Trafność kryterialna
• wyniki testu rozwoju poznawczego → postępy
szkolne dziecka
• wynik w teście rysowania figur geometrycznych →

stopień uszkodzenia ośrodkowego układu
nerwowego
• test koordynacji wzrokowej → przydatność do

zawodu pilota
• test sumienności → wyniki w pracy

79
Trafność teoretyczna
• Ocena stopnia w jakim wnioski wyprowadzane na

podstawie wyników testowych odzwierciedlają
pozycję osoby na danym kontinuum (konstrukcie)
• Konieczność określenia trafności teoretycznej

występuje wtedy, kiedy test ma być interpretowany
jako miara pewnego atrybutu lub pewnej
właściwości
80
Sposoby badania trafności
teoretycznej
• Analiza struktury czynnikowej testu
• Analiza struktury wewnętrznej testu
• Analiza różnic międzygrupowych
• Analiza macierzy korelacji (macierz WCWM)
• Analiza zmian nieprzypadkowych
• Analiza procesu rozwiązywania testu

81
Analiza czynnikowa (1)
• Celem analizy czynnikowej jest zredukowanie dużej liczby zmiennych
losowych do mniejszego zbioru,
• Założenie - grupy zmiennych losowych reprezentują zmienność tych

samych czynników, czyli zmienne losowe w danej grupie są od siebie w
pewnym stopniu zależne.
• W analizie czynnikowej istnieją dwa podejścia:
• eksploracyjna analiza czynnikowa (EFA - ang. Exploratory Factor

Analysis)
• konfirmacyjna analiza czynnikowa (CFA - ang. Confirmatory Factor

Analysis)
• Teoria → weryfikacja empiryczna struktury kwestionariuszy
82
Analiza czynnikowa (2)
• Wielka Piątka → NEO-PI-R, NEO-FFI, TIPI itd.

• Neurotyczność, Ekstrawersja, Sumienność,
Ugodowość, Otwartość
• Teoria inteligencji → WAIS-R

• Rozumowanie werbalne, Organizacja
percepcyjna, Odporność na dystraktory i pamięć
83
Analiza struktury
wewnętrznej testu (1)
• Zgodność wewnętrzna (homogeniczność) -
stopień, w jakim dany test można uznać za miarę
jednego konstruktu (cechy psychologicznej)
• Jeśli w świetle teorii mierzona cecha jest

homogeniczna, to wysoki współczynnik zgodności
wewnętrznej może być traktowany jako dowód
trafności teoretycznej testu
84
jakim dany test mo na uzna za miar jednego konstruktu
(cechy psychologicznej). Je eli mo na przyj w wietle
teorii, e mierzona cecha jest cech homogeniczn , to
Analiza struktury
wysoki wspó czynnik zgodno ci wewn trznej mo e by
traktowany jako dowód trafno ci teoretycznej testu.
wewnętrznej testu (2)

• Wyniki Wspó
korelacji
czynniki między
korelacji mi poszczególnymi
dzy poszczególnymi testamitestami
a a
ogólnym wynikiem w Skali Pe nej, Skali S ownej
ogólnym wynikiem w ownej
i Skali Bezs Skali w tePełnej, Skali Słownej i
cie WAIS-R
Skali Bezsłownej w WAIS-R
Grupa wiekowa 20-24 lata
Skala Skala Skala
Test
Pe na S owna Bezs owna
Wiadomo ci 0,789 0,864 0,551
Powtarzanie Cyfr 0,675 0,733 0,481
S ownik 0,836 0,882 0,631
Arytmetyka 0,781 0,793 0,633
Rozumienie 0,806 0,816 0,656
Podobie stwa 0776 0,805 0,606
Braki w Obrazkach 0,681 0,575 0,717
Porz dkowanie Obrazków 0,675 0,571 0,710
Klocki 0,645 0,506 0,734
Uk adanki 0,534 0,368 0,680
Symbole Cyfr 0,629 0,527 0,668
85
Analiza różnic
międzygrupowych
• Analiza hipotez dotyczących zachowania się grup różniących
się ze względu na mierzony konstrukt
• Hipotezy wyprowadzone z teorii mierzonej cechy
• Badane grupy powinny różnić się ze względu na ogólny wynik
w teście
• Istnienie różnic w odpowiednim kierunku potwierdza trafność
testu
• Kwestionariusz Potrzeby Poznania (Traczyk, Matusz,
Gąsiorowska, 2011)
• Studenci (M = 134,7; SD = 17,6) i pracownicy naukowi (M =
144,1; SD = 16,5), t(114) = -2,929; p < 0,001
86
Analiza macierzy korelacji
Macierz Wielu Cech – Wielu Metod (1)
• Pomiar kilku cech przy użyciu kilku kwestionariuszy
• Aspekt zbieżny i różnicowy trafności
• ZBIEŻNY (konwergencyjny) - gdy można

wykazać wysoką korelację z innymi testami,
mierzącymi podobne cechy
• RÓŻNICOWY (dywergencyjny) - gdy można

wykazać niską korelację z innymi testami,
mierzącymi inne cechy
87
(Zawadzki i in., 1998)

88

88

89

89
Analiza nieprzypadkowych
zmian wyników testu (1)
• Porównanie wyników dwóch badań, między którymi
wprowadza się oddziaływanie eksperymentalne
związane z cechą
• Wynik porównania powinien być zgodny z założonymi

efektami manipulacji - Istnienie różnic w odpowiednim
kierunku potwierdza trafność testu
• Co może być taką manipulacją?
• np. formalne kształcenie, terapia, farmakoterapia,

zwiększanie doświadczeń
90
Analiza nieprzypadkowych
zmian wyników testu (2)
• poziom lęku w T1 → stresory → ↑ poziom lęku w T2
• poziom lęku w T1 → Xanax → ↓ poziom lęku w T2
• introwersja w T1 (silniejsze procesy pobudzenia
korowego od procesów hamowania) → leki
uspokajające (wzmocnienie procesów hamowania) →
↓ introwersja w T2
• introwersja w T1 (silniejsze procesy pobudzenia
korowego od procesów hamowania) → leki
pobudzające (osłabienie procesów hamowania) → ↑
introwersja w T2
91
Analiza procesu
rozwiązywania testu
• Polega na analizowaniu zadań z punktu widzenia
przetwarzania informacji
• Obserwuje się kolejność wykonania, elementy sprawiające

trudności, pomijane elementy, czas poświęcony na
rozwiązanie poszczególnych zadań, popełniane błędy
• Stosuje się także technikę dekompozycji zadania

polegającą na manipulowaniu cechami zadania
• Podejście inne od koncentracji na analizie samych

odpowiedzi
92
Dlaczego trafność jest ważna
w diagnozie psychologicznej?
• Trafność wyznacza ramy interpretacji wyników
badania
93
Normy i normalizacja
Jak to zinterpretować?
94
Normalizacja (1)
• Nadawanie znaczenia wynikom testowym
• Zgodnie z kryterium teoretycznym norma wyznaczona jest przez

jakąś teorię (koncepcję) psychologiczną. Zasadniczym
znaczeniem terminu norma jest pewien wzór (model) wynikający
z przyjętej teorii, pozostałe zaś znaczenia mieszczą się w tych
ramach.
• Według kryterium kulturowego normę określają przepisy i wzory

kulturowe. Bez względu na treść tych wzorów istotą normy jest
zgodność z takim przepisem.
• Według kryterium statystycznego normą jest to, co jest

opisywane jako „zachowanie większości” czy jako „zachowanie
średnie lub przeciętne”
95
Normalizacja (2)
• W psychometrii przyjmuje się statystyczne rozumienie normy.
• UWAGA! Norma nie oznacza standardu „dobrego” wykonania testu;

norma opisuje poziom typowego wykonania testu przez osoby
należące do określonej grupy.
• Normą – w sensie psychometrycznym – jest standard ilościowy,

wyznaczony przez średnią, medianę lub inną miarę tendencji
centralnej obliczoną dla grupy przedstawicieli danego typu (gatunku).
• Normą jest typowe zachowanie (typowy wynik w teście) otrzymany dla

określonej grupy osób.
• Odniesienie do norm - ocena jak konkretny badany wypada na tle

innych osób (grupy odniesienia)
96
Znaczenie grupy
odniesienia
• Znajomość grupy odniesienia jest kluczem do
prawidłowego interpretowania wyników testowych
• Prawidłowa grupa odniesienia (normalizacyjna)
• dobrze dobrana
• dobrze opisana
• odpowiednio duża
• przebadana w sposób aktualny
97
Rodzaje norm w testach
psychologicznych
• Ze względu na sposób definiowania grupy odniesienia
• normy ogólnokrajowe
• normy lokalne
• Ze względu na sposób ich konstrukcji
• typu standardowego - oparte o rozkład normalny
• typu rangowego - oparte o częstość i rozkład jednostajny
• typu równoważnikowego
• normy wymagań
98
Normy standardowe (1)
• Powstają przez przekształcenie wyników surowych
w teście na wyniki standardowe Z
Wynik surowy Średnia w grupie
osoby badanej odniesienia
w teście
Xi − X
Z=
SD
Wynik
standardowy osoby
badanej Odchylenie
w teście
Z ∼ N(0,1) standardowe w grupie
odniesienia
99
Normy standardowe
• Ale - interpretowanie wyników na skali Z może być

uciążliwe
100
Skale oparte na rozkładzie
normalnym
• Transformacja liniowa - przekształcenie wyników Z na inne skale
jednostka nowej skali = SD × Z + M

• Skala T
• Skala stenowa
• Skala staninowa
• Skala IQ
• Skala tetronowa
• ….
101
Skala T (McCall, 1939)
• Nazwana na cześć E.L. Thordike’a
• M = 50, SD = 10
• obejmuje zasięgiem przedział od -5 do +5 odchyleń

standardowych w rozkładzie normalnym
• 101 jednostek, od 0 do 100
• T = 10 × Z + 50
• Wykorzystywana np. w MMPI
102
Skala stenowa
• Standard ten
• M = 5,5, SD = 2
• obejmuje zasięgiem przedział od -2,25 do +2,25

odchyleń standardowych w rozkładzie normalnym
• sten = 2 × Z + 5,5
• Wykorzystywana np. w NEO-FFI
103
Skala staninowa
• Standard nine
• M = 5, SD = 2
• obejmuje zasięgiem przedział od -2 do +2 odchyleń

standardowych w rozkładzie normalnym
• sten = 2 × Z + 5
• Wykorzystywana np. w FCZ-KT
104
Skala IQ
• zaproponowana przez Wechslera
• M = 100, SD = 15
• obejmuje zasięgiem przedział teoretycznie

nieograniczony, dowolne jednostki
• IQ = 15 × Z + 100
• Wykorzystywana w WAIS
105
Skala tetronowa
• Opracowana przez Maruszewskiego (1984)
• M = 10, SD = 4
• obejmuje zasięgiem przedział od -2,5 do +2,5

odchyleń standardowych w rozkładzie normalnym
• tetron = 4 × Z + 10
• Wykorzystywana np. w wielu testach pedagogicznych
106
Porównanie skal standardowych
107
Etapy procedury wyznaczania norm
108
Normy rangowe
• Odzwierciedlają
uporządkowanie
osób badanych
• Nie
odzwierciedlają
wielkości różnic
między wynikami
osób badanych
109
Skala centylowa
CENTYL 50
110
Normy centylowe
Liczebność
Liczebność prosta dla danego
skumulowana wyniku surowego
obserwacji poniżej
danego wyniku
surowego
cfi−1 + 0,5 × fi
centyl(C) = × 100%
N
Łączna liczba
badanych
• Np. N = 40, jedna osoba 34 + 0,5 × 1

która ma 120 punktów, jest C= × 100% = 86,25%
35 w kolejności 40
111
Skala centylowa a rozkład normalny
1 10 20 30 40 50 60 70 80 99 99
112
Siatka centylowa
113
Normy równoważnikowe
• Obecnie stosowane dość rzadko
• Inaczej normy rozwojowe - określające, jak daleko

na drodze rozwoju (normalnego) znalazła się dana
osoba
• Równoważniki wieku
• Równoważniki klasy
114
Normy równoważnikowe
Zalety Wady
• osiągnięcia badanych są traktowane • przyjmuje się w nich założenie o

rozwojowo równomiernym rozwoju
• równoważniki klasy bądź wieku pokazują • normy takie nadają się tylko do niektórych
opóźnienia/przyspieszenie w uczeniu się treści nauczania
np. w stosunku do średnich osiągnięć
uczniów tej samej klasy, albo w stosunku • bywają mylnie uważane za rejestry
do rówieśników wymagań programowych
• rok szkolny i rok życia stanowią naturalne, • bywają podstawą daleko idących
dobrze znane wszystkim użytkownikom uogólnień
testów, jednostki miary
• ustalanie ich jest pracochłonne i kosztowne
• normy te można dostosować do każdego
miesiąca nauki • wartość norm typu równoważnikowego
zależy od przedmiotu nauczania i polityki
władz szkolnych
115
Analiza zadań
Zasady włączania pozycji testowych
do ostatecznej wersji testu
116
Rodzaje testów
• Testy właściwości poznawczych
• Wiedza, umiejętności, zdolności (także czasy reakcji)
• Istnieje odpowiedź obiektywnie prawidłowa/lepsza/gorsza
• Zagrożenie: zgadywanie
• Testy właściwości afektywnych
• Uczucia, postawy, osobowość, emocje, wierzenia itd.
• Autoekspresja, brak odpowiedzi obiektywnie prawidłowej
• Zagrożenie: trafność samoopisu
117
Analiza zadań
• Analiza treściowa - ustalenie, czy pozycja testowa
jest poprawna rzeczowo, tzn. czy da się ją
wyprowadzić z teorii mierzonej cechy
• Analiza językowa - sprawdzenie, czy pozycja
testowa jest poprawnie sformułowana
• Analiza statystyczna - na podstawie wyników
badań pilotażowych
• współczynnik trudności pozycji testowych
• współczynnik mocy dyskryminacyjnej
118
Współczynnik trudności
(wskaźnik łatwości)
Liczba osób które
odpowiedziały poprawnie
na i-tą pozycję
Współczynnik
ni
trudności
T = = pi
n
Proporcja osób które
na i-tą pozycję
Ogólna liczba
osób badanych
119
Wariancja pozycji testowej
na i-tą pozycję
Wariancja i-tej
pozycji
δ = pi (1− pi ) = pi qi
i
2

odpowiedziały niepoprawnie
na i-tą pozycję
120
Jak powinny być dobierane pozycje
testowe na podstawie wsp. trudności?
• Jeśli test ma dobrze różnicować osoby na całym
kontinuum
• Optymalne są takie pozycje, dla których wskaźnik

trudności oscyluje o 50% - pod warunkiem że pozycje
testowe nie są ze sobą powiązane
• W praktyce - średnia trudność testu powinna oscylować

wokół 50%
• Jeśli test ma służyć do celów selekcyjnych - trudność

powinna być dostosowana do pożądanego współczynnika
selekcji
121
Trudność testów a zgadywanie (1)
• Model losowego zgadywania
1
T0 = p0 + q0 × Liczba kategorii
odpowiedzi
Poprawiony
współczynnik
m
trudności
Proporcja osób które Proporcja osób które

odpowiedziały poprawnie odpowiedziały niepoprawnie
na i-tą pozycję na i-tą pozycję
122
Trudność testów a zgadywanie (2)
1
T0 = p0 + q0 ×
m
Proporcja osób Proporcja osób Wartości
Liczba kategorii
odpowiedzi
odpowiadających zgadujących T0 podane przez
prawidłowo odpowiedź Lorda (1952)
2 0,5 0,5/2=0,25 0,75 0,85
3 0,5 0,5/3=0,17 0,67 0,77
4 0,5 0,5/4=0,125 0,623 0,74
5 0,5 0,5/5=0,1 0,60 0,70
123
Poprawka na zgadywanie
przy interpretacji wyniku indywidualnego (1)
Zarejestrowana
częstość niepoprawnych
odpowiedzi
na i-tą pozycję
Wi
Ci = Ri −
Liczba osób,
które rzeczywiście m −1
znały odpowiedź
Liczba kategorii
odpowiedzi
Zarejestrowana
częstość poprawnych
odpowiedzi
na i-tą pozycję
124
Poprawka na zgadywanie
przy interpretacji wyniku indywidualnego (2)
Liczba niepoprawnych
odpowiedzi
dla tej osoby
W
C = R−
Skorygowany wynik
danej osoby
m −1
Liczba kategorii
odpowiedzi
Liczba poprawnych
odpowiedzi
dla tej osoby
125
Np. dla testów
egzaminacyjnych……
• 4 kategorie
• 20 pytań
• osoba odpowiedziała prawidłowo na 11 pytań
9
C = 11− =8
4 −1
126
Współczynnik mocy dyskryminacyjnej
• Stopień, w jaki pozycja testowa różnicuje daną

populację
• pozycja testowa o dodatniej mocy dyskryminacyjnej
• jest częściej rozwiązywana przez badanych o
wysokich wynikach
• różnicuje badanych w zgodzie z innymi pozycjami
testu
• zwiększa wariancję wyników testowania
• pozycja testowa o ujemnej mocy dyskryminacyjnej
jest częściej rozwiązywana przez badanych o niskich
wynikach
127
Rodzaje współczynników
mocy dyskryminacyjnej
• Proste wskaźniki dyskryminacji
• Współczynniki oparte na analizie korelacji między

wynikiem danej pozycji i ogólnym wynikiem w
teście
• Współczynniki oparte na analizie różnic między

skrajnymi grupami
128
Wskaźnik dyskryminacji (1)
Badany
D = pu − pl
A B C D E F G H I J
P1 0 1 1 1 0 1 1 0 1 0 D = 2/3-1/3 = 1/3
P2 1 1 1 1 0 0 0 1 0 1 D = 3/3-3/3 = 0
P3 1 0 1 1 0 1 1 1 1 1 D = 2/3-1 = -1/3
…..
Wynik 25 27 15 24 20 18 16 14 22 10
129
Wskaźnik dyskryminacji (2)
• D≥ 0.40 - pozycję testową można włączyć do testu
• 0.30 ≤ D < 0.40 - pozycja testowa wymaga

niewielkich zmian
• 0.20 ≤ D < 0.30 - pozycja testowa ma niewielkie

znaczenie i wymaga poważnych zmian
• D < 0.20 - pozycja testowa powinna zostać

wyeliminowana z testu lub całkowicie zmieniona
130
Korelacyjne współczynniki
dyskryminacji
• Oparte o korelację pomiędzy wynikiem danej pozycji
testowe i łącznym wynikiem w teście
• Im wyższy dodatni współczynnik korelacji, tym lepsze

właściwości różnicujące (w pożądanym kierunku) ma dana
pozycja
• Wsp. korelacji dwuseryjnej (biserial correlation)
• Wsp. korelacji punktowo-dwuseryjnej (point-biserial

correlation)
• Wsp. korelacji punktowo-czteropolowej (phi coefficient)
131
Założenia
Rozkład cechy która jest
Rozkład ogólnego
Współczynnik mierzona przez daną
wyniku w teście
pozycję testową
korelacji dwuseryjnej normalny normalny
korelacji punktowo- dyskretny (zmienna

normalny
dwuseryjnej dwukategorialna)
korelacji punktowo- dyskretny (zmienna dyskretny (zmienna

czteropolowej dwukategorialna) dwukategorialna)
132
Od czego zależą wysokości
współczynników?
• Od rodzaju współczynnika
• Od proporcji między odpowiedziami prawidłowymi

i nieprawidłowymi (p/q)
• Od rodzaju populacji z której pobrano próbę
133
Współczynniki oparte na analizie
różnic między skrajnymi grupami
• Grupy o niskim i wysokim wyniku w danym teście

(po 27% badanych osób)
• Porównanie pod względem średniego wyniku dla

danej pozycji testem t dla prób niezależnych
134
Jak obliczać wynik ogólny przy
wyliczaniu współczynników mocy
dyskryminacji?
1 2
Wynik ogólny = 1+2+3

135
dyskryminacji?
1 2
Wynik ogólny = 1+2+3

135
dyskryminacji?
1
X 1 2
Wynik ogólny = 2+3

135
Czynniki wpływające
na wyniki testu
136
Czynniki zniekształcające
wyniki testowe
• Na wyniki testowe wpływają nie tylko zmienne

treściowe - np. określone rodzaje zdolności czy
cech osobowości
• Wyniki testowe mogą też być zniekształcane przez

określone czynniki pozatreściowe
137
Strategie (style) odpowiadania
na pozycje kwestionariusza
• Obserwowana skłonność osób badanych do

udzielania odpowiedzi niezależnie od treści pozycji
testowych
• Trwała dyspozycja do reagowania w określony

sposób w różnych obszarach treściowych
138
• Strategie są stałe i trwałe
• Strategie odpowiadania powodują, że wyniki

testowe są bardziej wieloznaczne
• Strategie odpowiadania są silniejsze w sytuacjach

niejednoznacznych i nieustrukturowanych
• Testy trudne wyzwalają strategie odpowiadania
139
• Tendencja do potakiwania
• Strategia semantyczna
• Tendencja do unikania konkretnej odpowiedzi
• Tendencja do odpowiedzi dewiacyjnych
140
Tendencja do potakiwania
• Skłonność osób badanych do uznawania, że

charakteryzują je różne twierdzenia danego
kwestionariusza, niezależnie od tego jaka jest ich
treść
• Stała dyspozycja do odpowiadania ”prawda",

"zgadzam się", "tak"
141
Strategia semantyczna
• Każda osoba badana może inaczej interpretować

kategorie odpowiedzi typu "czasami", "nie lubię"
czy "trochę się zgadzam".
• Tworzące się w ten sposób stałe błędy mogą się

kumulować i obciążać wyniki
142
Tendencja do unikania
konkretnej odpowiedzi
• Niektóre osoby badane, częściej niż inne
kategorie, wybierają kategorię neutralną ("nie
wiem", "?")
• Tendencja ta może okazać się stałym sposobem

odpowiadania
• Prawdopodobnie zjawisko to oznacza

nieumiejętność podjęcia decyzji w sytuacji
testowania lub niski wgląd - ale także niską
motywację do badania
143
Tendencja do odpowiedzi
dewiacyjnych (Berg, 1967)
• Tendencja do udzielania odpowiedzi wyjątkowych

lub niezwykłych
144
Jak kontrolować style
odpowiadania?
• Odpowiednia budowa kwestionariusza
• wyrównanie liczby pozycji diagnostycznych na "tak" i "nie",

(tendencja do zgadzania się i zaprzeczania)
• eliminowanie odpowiedzi pośrednich (centralny styl odpowiadania)
• stosowanie skal kontrolnych:
• zliczanie odpowiedzi centralnych, niezdecydowanych;
• skali konsekwencji (nieuważności);
• porównanie proporcji odpowiedzi, np. potakujących czy

negujących w skalach treściowych
145
Zmienna aprobaty społecznej
(Edwards, 1957; Crowne i Marlow, 1964)
• Skłonność osób badanych do przypisywania sobie

w samoopisach takich stwierdzeń, które są
społecznie pożądane, a odrzucanie tych, które są
społecznie niepożądane
• Nie jest to świadome oszukiwanie, ale skłonność

do pokazywania się od jak najlepszej strony
146
Kontrolowanie zmiennej
aprobaty społecznej
• Na etapie konstrukcji kwestionariusza:
• Pozycje neutralne
• Pozycje subtelne pod względem trafności fasadowej
• Specjalne formułowanie językowe pozycji
• Wprowadzanie odpowiedniej instrukcji
• Analiza korelacji pozycji ze skalami mierzącymi aprobatę społeczną
• Na etapie stosowania kwestionariusza:
• Wprowadzanie odpowiedniej instrukcji, tzw. instrukcja "szczerości"
• Skala kontrolna aprobaty społecznej (odrzucanie respondentów o
wysokich wynikach lub korygowanie wyników skal treściowych
przez doliczanie tzw. poprawek korekcyjnych
147
Kontrolowanie zmiennej
aprobaty społecznej
aprobata (+) aprobata (-)
Myślę czasem o rzeczach, o Myślę czasem o rzeczach, o

których nie wypada mówić których nie wypada mówić
(NIE) (TAK)
cecha (+)
Histeria + Paranoja +
SD + SD -
Czasem mam ochotę kląć Zdarza mi się śmiać z

(NIE) nieprzyzwoitych dowcipów
(TAK)
cecha (-)
Depresja - Depresja -
SD + SD -
148
Tendencja do dysymulowania i
symulowania a aprobata społeczna
• Tendencja do dysymulowania
• Jest to świadoma lub nieświadoma tendencja osoby badanej do
przedstawiania się w nieprawdziwie korzystnym świetle
• Dysymulacja najczęściej wiązana jest ze zmienną aprobaty
społecznej
• Tendencja do symulowania
• Jest to świadome lub nieświadome udzielanie odpowiedzi,
bezpodstawnie przedstawiających osobę badaną w
niekorzystnym świetle, np. wskazujących na istnienie określonych
zaburzeń zachowania czy niepożądanych cech osobowości
• Kontrolowanie tendencji do symulacji umożliwiają specjalne skale
kontrolne
149
Strategie konstrukcji
testów
• Strategia teoretyczna
• Analiza definicji badanego konstruktu oraz

definicji cech, bowiem określają one zakresy
oraz specyfikę zachowań będących ich opisem
• Strategia empiryczna (instrumentalna)
• Analiza definicji danego kryterium oraz

wyodrębnienie i klasyfikacja podstawowych
wskaźników związanych z kryterium
150
Konstruowanie testu według strategii
empirycznej (instrumentalnej)
Dobranie dwóch grup

Sformułowanie puli pozycji osób
testowych (grupy kryterialnej – osób
(nie muszą wywodzić się z jednej posiadających cechę
spójnej teorii) i grupy kontrolnej – osób nie
posiadających cechy)
Określenie, jakie
pozycje testowe
różnicują te dwie grupy
151
Eksperyment Gougha (1954)
nad klinicznym pojęciem neurotyzmu
• Grupa zaawansowanych studentów i klinicystów miała
na pozycje testu odpowiadać tak, jak ich zdaniem,
odpowiadałby pacjent „doświadczający reakcji
psychoneurotycznej”
• Życie źle obchodzi się ze mną
• Symulanci – 79%; Neurotycy – 14%
• Zazwyczaj uważam, że warto żyć
• Symulanci – 25%; Neurotycy – 68%

152
Częstość odpowiedzi na
wybrane pozycje MMPI
• Czasem drażnię zwierzęta
Odpowiedź FAŁSZ – częściej pacjenci depresyjni niż
niedepresyjni
• Chętnie czytam powieści kryminalne i sensacyjne

Odpowiedź FAŁSZ – częściej hospitalizowani histerycy
• Zdarza mi się czasem poplotkować

Odpowiedź PRAWDA – częściej inteligentni niż nieinteligentni
• Nie lubię widoku palącej kobiety

Odpowiedź FAŁSZ – częściej pacjenci z bólami krzyża
pochodzenia funkcjonalnego
153
Adaptacja testów
Kiedy test “zagraniczny” nadaje się do używania
w naszych warunkach?
154
Adaptacja testu
• Adaptacja testu to opracowanie go w taki sposób,

aby mógł być stosowany w kraju adaptacji czyli był
nadal trafnym i rzetelnym narzędziem diagnozy
psychologicznej.
• Kulturowa adaptacja testu oznacza przystosowanie

czy dopasowanie wersji oryginalnej testu do innej
specyfiki kulturowej.
155
Test “wolny kulturowo”
• Pierwszy raz terminu culture free test użył Cattell
(1940)
• A comprehensive dictionary of psychological and

psychoanalitical terms (1958):
• Culture free jest to test ogólnej inteligencji, z

którego wyeliminowano – na tyle, na ile to było
możliwe – wszystkie zadania zależne od
doświadczeń występujących częściej w jednej
kulturze, niż innej.
156
Przedmiot pomiaru psychologicznego
- uniwersalny czy specyficzny?
• Podejście nomotetyczne do kultur (uniwersalistyczne –
etic approach)
• Podejście idiograficzne do kultur (specyficzne – emic
approach)
157
Podejście nomotetyczne
• Do porównywania wpływu kultury potrzebne są pojęcia ogólne,
będące aproksymacją pojęć specyficznych, lecz oparte na
wspólnym układzie odniesienia
• Uzasadnione są takie działania, jak:
• adaptacja narzędzi diagnostycznych, przenoszonych z innej
kultury wraz z zapleczem teoretycznym i literaturowym,
• przyswajanie teorii psychologicznych (o których się
apriorycznie zakłada, iż są na tyle ogólne, że trafne są w
każdych warunkach społeczno-kulturowych),
• stosowanie „ponadkulturowych” technik terapeutycznych, itd.
158
Podejście idiograficzne
• Analizy wpływów kultury należy dokonywać bazując na pojęciach
wypracowanych przez daną społeczność, gdyż kultura jest
integralną częścią ludzkich zachowań
• Uznaje się istnienie specyficznych kulturowo czynników
etiologicznych, czynników (kultur) immunizujących członków
danej społeczności przeciwko zaburzeniom psychicznym lub im
sprzyjających
• Wiąże się to także z przekonaniem o kulturowo specyficznych
rodzajach osobowości, uzdolnień, rodzajach zaburzeń i/lub
specyficznych ich manifestacji, ich terapii;
• Wiąże się z niezgodą na implantację obcych (kulturowo) narzędzi
diagnostycznych, teorii, systemów klasyfikacji zaburzeń itp.
159
Założenia adaptacji kulturowej.
Zasada równoważności
• Problemy przy adaptacji kulturowej narzędzia
diagnostycznego:
• czy przedmiot pomiaru ma charakter emikalny czy
etikalny
• jeśli przedmiot pomiaru ma charakter etikalny - czy
przejawia się on w drugiej kulturze tak samo lub
podobnie
• Równoważność konstruktu
• Równoważność funkcjonalna zachowań
• Równoważność wskaźników konstruktu teoretycznego
160
Równoważność
konstruktu
• Czy to, co ma być przedmiotem pomiaru (konstrukt
teoretyczny) istnieje nie tylko w kulturze oryginalnej,
ale także w kulturze docelowej?
• Czy pochodzący z kultury oryginalnej konstrukt daje

sensowne i porównywalne informacje w kulturze
docelowej?
• Jeśli TAK—> adaptacja jest możliwa
• Jeśli NIE —> lepiej jest skonstruować nowe narzędzie
161
Równoważność
funkcjonalna zachowań
• Zachowania są funkcjonalnie równoważne wtedy,

gdy członkowie różnych kultur zachowują się
podobnie w podobnych sytuacjach, by zrealizować
równoważne cele.
• Badane zachowania powinny być odpowiedzią na

podobne problemy w analizowanych kulturach
162
Równoważność wskaźników
konstruktu teoretycznego
• Równoważność wskaźników to inaczej

równoważność definicji operacyjnych
• W jaki sposób interesujące nas konstrukty

przejawiają się na poziomie manifestacji?
• Jaki jest wpływ kontekstu kultury rodzimej na treść

pozycji testowych?
163
Strategia adaptacji
• Transkrypcja Etikalny
charakter konstruktu
• Translacja
• Trawestacja
• Parafraza
• Rekonstrukcja Emikalny
charakter konstruktu
164
Transkrypcja
• Maksymalnie wierne tłumaczenie oryginalnych
pozycji. Wprowadza się tylko takie poprawki
językowe, które są niezbędne
• Zakłada się, że zarówno konstrukty, jak i

zachowania są uniwersalne kulturowo
• Transkrypcja jest najbardziej zachowawczą

strategią adaptacji testów - “chroni” nie tylko
oryginalne konstrukty, ale i wskaźniki służące do
ich pomiaru
165
Translacja
• Wierne tłumaczenie finalnej puli oryginalnych pozycji,
ale z możliwością wprowadzenia niezbędnych
modyfikacji, gdy specyfika kulturowa oryginału może
powodować nierównoważność testu
• Zakłada się, że konstrukty, jak i zachowania są

uniwersalne kulturowo, ale nie są uniwersalne pojęcia
używane w danej kulturze do opisu zachowania
• Przed adaptatorem stoi zadanie zaproponowania takiej

modyfikacji językowej lub logicznej pozycji, by była ona
funkcjonalnie zbliżonym do oryginału bodźcem
166
Trawestacja
• Swobodne tłumaczenie oryginału z wprowadzaniem wielu
modyfikacji i zmian, sugerowanych względami językowymi
i psychologicznymi
• Istnieje możliwość wymiany części pozycji ze względów

językowych, treściowych (wymiana opisywanej formy
zachowania na inną, bardziej specyficzną kulturowo) lub
psychometrycznych (lepsza miara danej cechy).
• Zakłada się, że konstrukty psychologiczne są uniwersalne,

ale nie są uniwersalne pojęcia używane w danej kulturze
do opisu zachowania i nie zawsze uniwersalne są same
zachowania (część zachowań ma charakter emikalny).
167
Parafraza
• Konieczność opracowania nowego narzędzia od fazy
analizy teorii i generowania pozycji, aż po analizę
psychometryczną danych - test oryginalny jest jedynie
inspiracją adaptacji
• Celem adaptacji jest maksymalne wierne oddanie intencji

autora odnośnie treści konstruktu psychologicznego (rola
teorii psychologicznej)
• Zakłada się, że konstrukty psychologiczne są uniwersalne

kulturowo, ale z reguły nie są uniwersalne zachowania
(tylko część z nich ma charakter etikalny, tj. równoważny
kulturowo i tylko te mogą wejść do finalnej wersji adaptacji).
168
Rekonstrukcja
• Konieczność opracowania całkowicie nowego narzędzia,
dla którego inspiracją jest oryginalny model teoretyczny i
strategia konstrukcji.
• Przy rekonstrukcji pozycje testu są generowane w danym

języku, zgodnie z regułami przyjętymi w wersji oryginalnej.
• Celem adaptacji jest maksymalne wierne oddanie intencji

autora odnośnie treści konstruktu psychologicznego i
procedury tworzenia testu.
• Zakłada się, że zarówno zachowania jak i konstrukty

psychologiczne mogą nie być uniwersalne kulturowo.
169
Wybór odpowiedniej strategii zależy
przede wszystkim od celu adaptacji
• Bezpośrednie ilościowe porównania

międzykulturowe - transkrypcja, translacja,
trawestacja
• Bezpośrednie ilościowe porównania

wewnątrzkulturowe - parafraza i rekonstrukcja
170
Stronniczość
testów
psychologicznych
171
„Testy psychologiczne mierzą cechy, które nie są
bezpośrednio obserwowalne, które różnie są
definiowane i które mierzone są jedynie w sposób
pośredni. Z tej perspektywy, problem stronniczości
testów inteligencji jest częścią szerszego – w sposób
oczywisty ważniejszego – problemu
niejednoznaczności. Problem stronniczości dotyczy
generalnie wszelkich testów psychologicznych.
Stronniczość bowiem, może się ujawnić nie tylko w
przypadku testów inteligencji, ale również testów
osobowości, testów psychopatologicznych czy testów
zawodowych”.
Reynolds i Brown (1984, s. 15)

172
Co oznacza stronniczość
testu psychologicznego?
• Błąd systematyczny
• W sensie statystycznym, stronniczość wpływa na

wyniki testowania zawsze w stały sposób
• W sensie psychometrycznym, stronniczość wyraża

się w tym, że poszczególne pozycje testowe są mniej
lub bardziej trudne dla osób należących do różnych
podgrup wyodrębnianych (na przykład ze względu
na wiek, czy płeć) w ramach tej samej populacji
173
Kiedy występuje
stronniczość testu?
• Wtedy (i tylko wtedy) gdy dana grupa osiąga

niższe wyniki w teście, a nie osiąga niższych
wyników w kryterium
• Stronniczość to nietrafna różnica grupowa - test

diagnozuje różnice nieobiektywne, nieistniejące lub
nie mające znaczenia dla danego kryterium
174
Stronniczość ≠ Uczciwość
• Stronniczość to cecha formalna testu
• Uczciwość to termin odnoszący się do strony etycznej
testowania
• Uczciwość odwołuje się zawsze do jakiegoś systemu
wartości
• Pojęcie uczciwości, społecznej sprawiedliwości i jednakowej
ochrony przez prawo to pojęcia moralne i prawne i w tym
sensie należy je odróżniać od pojęcia stronniczości testu,
traktowanej jako cecha testu
• Uczciwość stosowania testu to kwestia kompetencji
psychologa, polityki społecznej, rozwiązań prawnych,
konsekwencji praktycznych
175
Czynniki, ze względu na które
test może być stronniczy
• Wiek
• Płeć
• Rasa
• Status socjoekonomiczny (klasa społeczna)
• …Ale nie tylko
176
Wiek
• Test jest zwykle przeznaczony do badania
odpowiedniej populacji (dzieci, młodzież, dorośli)
• Próba zmiany przeznaczenia testu pod tym

względem wymaga dostosowania samego testu,
nieraz nawet ingerencji na poziomie pozycji
• Zazwyczaj adaptacja testu do różnych grup wieku

polega na tworzeniu odrębnych wersji wiekowych
testu oraz w najprostszej postaci - na tworzeniu
norm wiekowych
177
Płeć
• Testy często faworyzują jedną z płci (zwykle mężczyzn)
• Testy powinny być opracowywane tak by czynnik ten

neutralizować
• Procedura decentracji - podtesty neutralne, równe

proporcje skal faworyzujących i dyskryminujących
daną płeć
• Jeśli test wykazuje różnice płciowe, to stronniczości

można uniknąć wprowadzając odrębne normy
178

Psychometria Pytania 2022

Uploaded by

Copyright:

Available Formats

You might also like

Psychometria Pytania 2022

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Psychometria Pytania 2022

Uploaded by

Copyright:

Available Formats

1. Która z poniższych definicji jest pełną i wyczerpującą definicją testu psychologicznego?

a) jest to obiektywny i standaryzowany pomiar próbki zachowania

4. pojęcie normy w teście odnosi się do:

5. tetrony to wyniki standardowe wyrażone na skali

7. w metodzie testów równoległych, w odróżnieniu od metody test-retest minimalizowany jest wpływ:

10. błąd standardowy różnicy jest to:

14. określanie rzetelności testu pozwala na ustalenie:

15. trafność kryterialna to inaczej

16. rzetelność testu jest wyrażana w postaci

20. rzetelność testu można wyrazić jako:

21. wielkość SEM zależy od:

23. znajomość współczynnika mocy dyskryminacyjnej pozwala nam na

25. trafność teoretyczna testu znajduje swoje odzwierciedlenie w:

26. standardowy błąd estymacji wyniku prawdziwego jest to:

27. standaryzacja testu odnosi się do:

28. współczynnik KR-20 to:

29. standardowy błąd pomiaru jest szczególnie użyteczny przy:

33. badanie trafności metodą wielu cech-wielu metod polega na:

34. formuła spearmana-browna pozwala na określenie wpływu następujących zmiennych na wielkość

36. staniny to wyniki standardowe wyrażone na skali:

37. skala T to wyniki standardowe wyrażone na skali:

39. badanie testowe najogólniej rzecz biorąc to:

1. badanie testowe to:

2. która z poniższych definicji jest pełną i wyczerpującą def. Testu psychologicznego:

6. znajomość współczynnika mocy dyskryminacyjnej poszczególnych pozycji testowych pozwala nam na

7. stosując współczynnik korelacji punktowo-dwuseryjnej, jako współczynnik mocy dyskryminacyjnej

8. w klasycznej teorii testów przyjmuje się założenie, że

9. określanie współczynnika rzetelności testu pozwala na ustalenie:

14. standardowy błąd estymacji wyniku otrzymanego jest to:

15. błąd standardowy różnicy jest to

22. pojęcie normy w teście psychometrycznym odnosi się do:

25. steny to:

15.Trafność kryterialna to inaczej:

16.RzeteIność testu jest wyrażana w postaci:

18.Kontaminacja kryterium najczęściej pojawia się, gdy:

24. Jeżeli rozkład wyników surowych jest

25.Trafność teoretyczna testu znajduje swoje odzwier-

26. Standardowy błąd estymacji wyniku

20. Rzetelność testu można wyrazić jako:

21.Wielkość standardowego błędu pomiaru zależy od:

23.Znajomość współczynnika mocy dyskryminacyjnej pozwala nam na:

25.Trafność teoretyczna testu znajduje swoje odzwierciedlenie w:

27. Standaryzacja testu odnosi się do:

28. Współczynnik KR-20 to:

Pytania – Psychometria – Dzienni 2019

1. Jeśli korelacja między wynikiem prawdziwym i testowym dla danego testu

c) Współczynnik rzetelności dla tego testu wynosi 0,6561

d) Nie wiadomo, ile wynosi współczynnik rzetelności

a) Gdy wynik w teście nie ma rozkładu normalnego, ale do normalizacji wykorzystuje

a) Norma wyznaczana jest przez teorię (koncepcję) psychologiczną

b) Norma wyznaczana jest przez zachowania zgodne z wzorami kulturowymi

d) Norma wyznaczana jest przez osoby tworzące testy psychologiczne

c) Gdy diagnosta będzie wyliczał wyniki z badania papierowego w komputerze, a nie na

a) Obliczyli alfy Cronbacha

b) Policzyli korelacje między wersjami równoległymi testu badanymi z odstępem czasu

a) Błąd pomiaru ma rozkład normalny

b) Średni błąd pomiaru wynosi zero

d) Poszczególne błędy pomiaru nie są ze sobą powiązane

d) Występowanie błędu losowego pomiaru- stronniczość testunie oznacza błedu

12. Które z poniższych stwierdzeń

13. Testy, w których podstawą

15. Wynik wyrażony w jednostkach tzw. dewiacyjnego ilorazu inteligencji to:

16. Gdy test psychologiczny jest wykorzystywany do rekrutacji w konkretnej organizacji i

18. Wynik testowy równy 55 centynowi oznacza, że:

20. Procedura nadawania znaczenia empirycznego konstruktom teoretycznym, to

26. Homogeniczność testu mierzona współczynnikiem alfa Crombacha jest to miara:(Alfa

27. Które z poniższych

28. Tak zwany styl odpowiadania w kwestionariuszu jest to:

30. Skłonność osób badanych do przypisywania sobie w samoopisach takich stwierdzeń

32. Pozycja testowa o otwartym formacie odpowiadania to pozycja:

33. Uzupełnij zdanie „podstawowym powodem …… jest podtrzymanie motywacji osoby

34. Która z poniższych reguł

35. Rzetelność testu można wyrazić jako:

36. Współczynnik rzetelności jest operacyjnie wyrażany za pomocą:

39. Które z podanych niżej określeń niecharakteryzują norm typu wymagań?