Psychometria Pytania 2022

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 336

1. Która z poniższych definicji jest pełną i wyczerpującą definicją testu psychologicznego?

a) jest to obiektywny i standaryzowany pomiar próbki zachowania


b) jest to kontrolowana ilościowa obserwacja zachowania
c) jest to pomiar próbki zachowania wybranej grupy ludzi
d) jest to standaryzowany zbiór bodźców dla mierzalnych reakcji

2. trafność fasadowa powinna być brana pod uwagę w przypadku testu, gdyż:
a) stanowi podstawę statystycznego doboru pozycji
b) jest częścią składową każdego rodzaju trafności
c) jest dowodem, że test mierzy to, co zmierzył jego autor
d) zapewnia zgodność wyglądu testu czym.... sądzi osoba badana

3. wyniki standardowe to
a) wyniki uzyskane w standardowych warunkach
b) wyniki wyrażone w terminach odchylenia standardowego
c) wyniki wyrażone w terminach obiektywnego standardu
d) wyniki uzyskane za pomocą wystandardyzowanego narzędzia

4. pojęcie normy w teście odnosi się do:


a) wykonania idealnego
b) wykonania maksymalnego
c) wykonania oczekiwanego
d) wykonania typowego

5. tetrony to wyniki standardowe wyrażone na skali


a) M=10 SD=2
b) M=10 SD=4
c) M=10 SD=1
d) M=10 SD=10

6. wysoki współczynnik korelacji pomiędzy dwoma testami równoległymi stosowanymi jeden po drugim,
bez przerwy czasowej, świadczy o:
a) funkcjonalnej mierzonej zmiennej w czasie
b) niskiej homogeniczności wysokiej specyficzności pozycji testowych
c) niskiej specyficzności i wysokiej specyficzności pozycji testowych
d) o dużym stopniu obiektywności

7. w metodzie testów równoległych, w odróżnieniu od metody test-retest minimalizowany jest wpływ:


a) pamięci i efektów uczenia się
b) braku stałości zmiennej
c) heterogeniczności zmiennej
d) szybkości rozwiązania zadań

8. otrzymanie różnych współczynników trafności kryterialnej dla danego testu jest najczęściej
spowodowany:
a) faktem wybrania różnych zmiennych kryterialnych
b) błędami w obliczeniach
c) niską rzetelnością testu
d) trudnościami w diagnozowaniu zachowania mierzonego przez test

9. test składa się z 10 pytań. Powinien dobrze różnicować w obrębie patologii. Która z poniższych skal
standardowych najlepiej pozwalałaby zrealizować ten cel:
a) M=10, SD=5
b) M=10 SD=1
c) M=50 SD=10
d) M=50 SD=25

10. błąd standardowy różnicy jest to:


a) różnica 2 błędów standardowych
b) suma 2 błędów standardowych podniesionych do kwadratu z których wyciągnięto
pierwiastek
c) różnica 2 błędów standardowych podniesionych do kwadratu z których wyciągnięto pierwiastek
d) suma dwóch błędów standardowych

11. aby spełnić warunek obiektywności, każdy test musi być przynajmniej:
a) stosowany i obliczany w z góry ustalonych warunkach
b) wysoko rzetelny
c) losową próbką wskaźników zmiennej teoretycznej
d) oparty na wybranej teorii mierzonej zmiennej

12. Stanina to
a) wynik surowy
b) wynik wskazujący na wiek umysłowy
c) inna nazwa centyli
d) znormalizowany wynik standardowy

13. centyle to wyniki, które wskazują jaki procent osób z badanej grupy uzyska wyniki:
a) takie same lub wyższe od danego wyniki
b) takie same lub niższe od danego wyniku
c) wyższe od średniej
d) niższe od średniej

14. określanie rzetelności testu pozwala na ustalenie:


a) jaki % wariancji otrzymanej stanowi wariancja prawdziwa
b) wielkości błędu stałego w pomiarze testowym
c) jaką część wariancji błędu stanowi wariancja prawdziwa
d) możliwych fluktuacji wielkości współczynnika R

15. trafność kryterialna to inaczej


a) trafność predykcyjna i treściowa
b) trafność diagnostyczna i treściowa
c) trafność prognostyczna i diagnostyczna
d) trafność teoretyczna i treściowa

16. rzetelność testu jest wyrażana w postaci


a) odchylenia standardowego
b) prawdopodobnego błędu wyniku testowego
c) współczynnika korelacji
d) różnicy pomiędzy 2 wynikami

17. aby znormalizowane wyniki testowe były użyteczne odnosi się je do:
a) treści pozycji tworzących test psychologiczny
b) innych metod testowych
c) zachowania wybranej, dobrze określonej grupy
d) rzetelności i trafności metody
18. kontaminacja kryterium najczęściej pojawia się, gdy:
a) test ma niską rzetelność
b) psychiatra ma dostęp do wyników testowych
c) łączy się wyniki dwóch różnych grup osób badanych
d) łączy się wyniki pomiaru dwóch różnych kryteriów

19. stosując współczynnik korelacji dwuseryjnej, jako współczynnik mocy dyskryminacyjnej, musi zostać
spełnione założenie, że zmienna zdychotomizowana jest:
a) rzeczywiście ciągła i posiada rozkład normalny,
b) ciągła lecz nie o rozkładzie normalnym
c) z natury swej dychotomiczna
d) dzieli się w punkcie mediany

20. rzetelność testu można wyrazić jako:


a) stosunek wariancji [prawdziwej do wariancji błędu
b) stosunek wariancji otrzymanej do wariancji prawdziwej
c) stosunek wariancji prawdziwej do wariancji otrzymanej
d) stosunek wariancji błędu do wariancji otrzymanej

21. wielkość SEM zależy od:


a) odchylenia standardowego wyników testowych,
b) współczynnika rzetelności
c) obu możliwości
d) żadnych możliwości

22. jeżeli test jest zbyt trudny dla badanej grupy osób to rozkład wyników w tym teście będzie:
a) normalny
b) prostokątny
c) skośny
d) wielo modalny

23. znajomość współczynnika mocy dyskryminacyjnej pozwala nam na


a) wskazania pozycji zbyt trudnych
b) wskazanie pozycji mierzących inną zmienną
c) wskazanie pozycji mierzącej zachowania poza testowe
d) wskazanie pozycji nietrafnych

24. jeżeli rozkład wyników surowych jest rozkładem lewo skośnym, to w celu jego normalizacji należy
zastosować następującą transformację:
a) pierwiastkową,
b) logarytmiczną
c) potęgową
d) żadną z nich

25. trafność teoretyczna testu znajduje swoje odzwierciedlenie w:


a) hipotezach wyprowadzanych z teorii mierzonej zmiennej
b) rezultatach analizy czynnikowej wyników testowych
c) obu z wymienionych możliwości
d) żadne z wymienionych możliwości

26. standardowy błąd estymacji wyniku prawdziwego jest to:


a) różnica między estymowaną wartością wyniku prawdziwego a jego rzeczywistą wartością
b) różnica między wynikiem otrzymany a wynikiem prawdziwym w teście
c) obie definicje są prawdziwe
d) żadna definicja

27. standaryzacja testu odnosi się do:


a) komercyjnej użyteczności testu
b) jednolitości procedury
c) zgodności z normami
d) określania jego rzetelności i trafności

28. współczynnik KR-20 to:


a) średnia wszystkich współczynników typu test-retest
b) średnia wszystkich współczynników typu split-half
c) średnia wszystkich współczynników splittest
d) średnia wszystkich współczynników powyżej 0,8

29. standardowy błąd pomiaru jest szczególnie użyteczny przy:


a) porównywaniu dwóch wyników testowych między sobą
b) określaniu statystycznej istotności wyniku testowego
c) porównywaniu dwóch testów między sobą
d) określaniu istotności statystycznej pozycji testowej

30. testu przeznaczone do selekcji ze względu na specyficzne kryterium, powinny składać się z pozycji
testowych, których współczynnik trudności wynosi:
a) 0,5
b) mieści się w przedziale od 0-100%
c) wyznaczony jest przez rozkład normalny
d) jest równy wyznaczonemu punktowi selekcji

31. formuła speramana - browna jako metoda szacowania rzetelności stosowana jest w technice:
a) test-retest
b) testów równoległych
c) połówkowania (split-half)
d) krudera-richardsona
32. dla którego z poniższych rodzajów testów, okre4ślenie trafności treściowej będzie najbardziej
odpowiednie
a) testów zdolności werbalnych
b) testów wiadomości z matematyki
c) testów projekcyjnych
d) testów inteligencji

33. badanie trafności metodą wielu cech-wielu metod polega na:


a) analizowaniu tylko aspektu zbieżnego trafności
b) analizowaniu tylko aspektu różnicowego trafności
c) analizowaniu jednocześnie aspektu zbieżnego i różnicowego
d) żądne z powyższych możliwości

34. formuła spearmana-browna pozwala na określenie wpływu następujących zmiennych na wielkość


współczynnika rzetelności:
a) heterogeniczności próbki badanych osób
b) homogeniczności pozycji testowych
c) trafności testu
d) długości testu
35. steny to wyniki standardowe wyrażone na skali
a) M=5 SD=2
b) M=5 SD=4
c) M=5,5 SD=2
d) M=5,5 SD=4

36. staniny to wyniki standardowe wyrażone na skali:


a) M=5 SD=2
b) M=5 SD=4
c) M=5,5 SD=2
d) M=5,5 SD=4

37. skala T to wyniki standardowe wyrażone na skali:


a) M=50 SD=2
b) M=50 SD=4
c) M=100 SD=15
d) M=50 SD=10

38. rzetelność testu to również jedno z kryteriów dobroci testów psychologicznych. Rzetelność testu oznacza
przede wszystkim następującą właściwość wyników teoretycznych
a) powtarzalność
b) obiektywność
c) istotność
d) trafność

39. badanie testowe najogólniej rzecz biorąc to:


a) w sytuacjach, w których dokonuje się ilościowej obserwacji zachowania
b) w sytuacjach, w których wywołuje się zachowania typowe dla określonej grupy osób
c) w sytuacjach, w której dokonuje się celowej obserwacji zachowań traktowanych jako
wskaźniki mierzonej charakterystyki
d) w sytuacjach, w których celem pomiaru jest określenie istotnych cech badanych cech

40. jedyny, z kryteriów normalnych, branych pod uwagę przy tworzeniu testu jest współczynnik trudności
poszczególnych pozycji testowych. Jeżeli tworzymy test dla celów selekcji i mamy dużo kandydatów, a
możemy przyjąć najwyżej 10% to większość pozycji testowych z tego testu powinna być:
a) raczej trudnych
b) raczej łatwych
c) raczej o przeciętnej trudności
d) raczej o wysokim współczynniku rzetelności niż trafności

41. wiedząc, że w klasycznej teorii testów przyjmuje się wynik obserwowany = wynik prawdziwy + błąd
pomiaru, określ co powinno być podstawowym obowiązkiem autora testu:
a) dążenie do zwiększenia wyniku prawdziwego danej osoby,
b) dążenie do zmniejszenia błędu pomiaru
c) dążenia do zwiększenia wyniku obserwowanego
d) 

1. badanie testowe to:


a) sytuacja w której dokonuje się ilościowej obserwacji zachowania
b) sytuacja w której wywołuje się zachowania typowe dla określonej grupy
c) sytuacja w której dokonuje się celowej obserwacji zachowań traktowanych jako wskaźniki
mierzonej charakterystyki
d) sytuacja w której celem pomiaru jest określenie istonych cech badanych osób

2. która z poniższych definicji jest pełną i wyczerpującą def. Testu psychologicznego:


a) jest to kontrolowana ilościowa obserwacja zachowania
b) jest to obiektywny i standaryzowany pomiar próbki zachowania
c) jest to pomiar zachowania wybranej grupy ludzi
d) jest to kontrolowany pomiar reakcji w różnych sytuacjach zadaniowych

3. obiektywność jest jedyny z tzw. kryteriów dobroci testów psychologicznych. Aby spełnić warunek
obiektywności każdy test musi przynajmniej
a) zostać oparty na teorii mierzonej zmiennej
b) dawać porównywalne wyniki niezależnie od tego gdzie i kiedy jest stosowany
c) być obliczany w ściśle określonych warunkach
d) posiadać wysokie wskaźniki rzetelności i trafności

4. warunek standaryzacji, czyli koleje kryterium dobroci testów psychologicznych zostanie spełniony wtedy
gdy:
a) test będzie stosowany w jednolity sposób w stosunku do wszystkich osób badanych
b) test zostanie wyposażony w podręcznik zawierający opis zasad jego stosowania
c) test będzie stosowany odpowiednio do możliwości osoby badanej
d) test zostanie zastosowany tylko w takich sytuacjach w których jego wyniki będą miały praktyczną
użyteczność

5. jednym z kryteriów formalnych branym przy tworzeniu testu jest współczynnik trudności poszczególnych
pozycji testowych. Jeżeli chcemy zastosować test do selekcji kandydatów uwzględniając określony punkt
odcięcia to powinniśmy wybrać taki test, który składa się z pozycji testowych, których współczynniki
trudności wynosi:
a) 0,6
b) mieści się w zakresie 0-100%
c) jego średnia wartość wynosi 50%
d) jest równy wyznaczonemu punktowi selekcji

……………………………………………………………………………………………………….

6. znajomość współczynnika mocy dyskryminacyjnej poszczególnych pozycji testowych pozwala nam na


a) wyeliminowanie pozycji należących do innego testu
b) wyeliminowanie pozycji mierzących inna zmienną niż zmienna testowa,
c) wyeliminowanie pozycji które nie różnicują badanej populacji
d) wyeliminowanie pozycji zbyt mocno różnicujące badane osoby

7. stosując współczynnik korelacji punktowo-dwuseryjnej, jako współczynnik mocy dyskryminacyjnej


trzeba pamiętać o tym, że:
a) wynik pozycji testowej powinien być z natury swej dychotomiczny
b) rozkład wyników pozycji testowej powinien być rozkładem dwumodalnym
c) wynik pozycji testowej powinien być zmienną ciągłą
d) rozkład wyników pozycji testowej powinien być rozkładem normalnym

8. w klasycznej teorii testów przyjmuje się założenie, że


a) błąd pomiaru = wariancja wyników testowych
b) błąd pomiaru ma charakter losowy
c) błąd pomiaru jest błędem stałym
d) błąd pomiaru jest równy odchyleniu standardowemu wyników testowych

9. określanie współczynnika rzetelności testu pozwala na ustalenie:


a) jaką część wariancji błędu stanowi wariancja prawdziwa
b) jaką część wariancji prawdziwej stanowi wariancja błędu
c) jaką część wariancji otrzymanej stanowi wariancja prowadzą
d) jaką część wariancji prawdziwej stanowi wariancja otrzymana

10. rzetelność jako miara dokładności pomiaru testowego testu jest technicznie wyrażana w postaci:
a) współczynnika zmienność
b) współczynnika korelacji
c) współczynnika zgodności
d) współczynnika regresji

11. metoda testów równoległych stosowana do oszacowania rzetelności testu pozwla na wyeliminowanie
wpływu:
a) zbyt wysokiej trudności pozycji testowych
b) pamięci i efektów uczenia się
c) szybkości rozwiązywania zadań
d) błędów o charakterze losowym, ujawniających się w sytuacji testowania

12. wysoki współczynnik korelacji pomiędzy dwoma testami równoległymi stosowanymi jeden po drugim
bez przerwy czasowej, świadczy o:
a) wysokiej fluktuacji mierzonej zmiennej w czasie
b) niskiej homogeniczności i wysokiej specyficzności
c) niskiej specyficzności i wysokiej homogeniczności
d) wysokim stopniu obiektywności testu

13. formuła spermana-browna jako metoda szacowania rzetelności testu jest rutynowo stosowana w technice:
a) podwójnego testowania
b) testów równoległych
c) KR
d) 

14. standardowy błąd estymacji wyniku otrzymanego jest to:


a) różnica między estymowaną wartością wyniku prawdziwego a jego rzeczywistą wartością
b) różnica między wynikiem otrzymanym a wynikiem prawdziwym w teście
c) różnica między estymowanym wynikiem otrzymanym a wynikiem rzeczywistym
d) różnica między wynikiem rzeczywistym a wynikiem, który pomniejszono o błąd pomiaru

15. błąd standardowy różnicy jest to


a) różnica dwóch błędów standardowych
b) różnica dwóch błędów standardowych podniesionych do kwadratu, z których wyciągnięto
pierwiastek
c) suma dwóch błędów standardowych
d) suma dwóch błędów standardowych podniesionych do kwadratu z której wyciągnięto
pierwiastek

16. dokonując diagnozy na podstawie wyniku testowego, należy wziąć pod uwagę standardowy błąd pomiaru
ponieważ,
a) tylko w ten sposób można określić istotność otrzymanych wyników
b) pozwala on na dokładne określenie poziomu istotności wyniku prawdziwego,
c) dzięki niemu można określić wielkość błędu jakim jest obciążony wynik testu
d) pozwala on określić wielkość błędu jaki popełniany jest przy interpretowaniu wyniku
poszczególnych pozycji testowych

17. trafność testu to również jedno z kryteriów dobroci testów psychologicznych. Klasyczny podział
obejmuje następujące rodzaje trafności:
a) trafność treściową kryterialną i teoretyczną
b) trafność treściową fasadową i kryterialną
c) trafność treściową logiczną i wewnętrzną
d) trafność treściową diagnostyczną i prognostyczną

18. często zdarza się, że autorzy przeprowadzający badania danego testu uzyskują różne współczynniki
trafności kryterialnej. Jest to najczęściej spowodowane:
a) niskimi współczynnikami pozostałych rodzajów trafności
b) niskimi współczynnikami rzetelności testu
c) trudnościami w diagnozowaniu zachowania mierzonego przez test
d) faktem wybrania różnych zmiennych kryterialnych

19. w której z przedstawionych niżej sytuacji może dojść do zjawiska kontaminacji kryteriów:
a) psychiatra dokonując oszacowania wyników badanych osób ze względu na zmienną
kryterialną miał dostęp do wyników testowych
b) psychiatra dokonując oszacowania wyników badanych osób ze względu na zmienną kryterialną
znał podręcznik testowy
c) autor testu znał procedurę szacowania badanych osób ze względu na zmienną kryterialną
d) autor testu połączy ł wyniki otrzymane dla dwóch różnych zmiennych kryterialnych

20. trafność teoretyczna uważana jest za najważniejszy rodzaj trafności. Znajduje ona swoje odzwierciedlenie
w:
a) hipotezach dotyczących zachowania badanych osób tworzonych na podstawie istotnych dla
psychologa teorii psychologicznych
b) hipotezach dotyczących zachowania badanych osób tworzonych na podstawie teorii
mierzonej zmiennej
c) rezultatach badań nad rzetelnością teorii psychologicznej, która leży u podstaw testu
d) rezultatach badań nad trafnością teorii psychologicznej, która leży u podstaw testu

21. istnieje wiele rodzajów trafności. W zależności od celu testowania niektórych z nich mają większe
znaczenie. Dla którego z poniższych rodzajów testów określenie trafności będzie najbardziej pożądane:
a) testów projekcyjnych
b) testów inteligencji
c) testów zdolności werbalnych
d) testów wiadomości z matematyki

22. pojęcie normy w teście psychometrycznym odnosi się do:


a) wykonania typowego
b) wykonania idealnego
c) wykonania maksymalnego
d) wykonania oczekiwanego

23. wyniki standardowe za pomocą których można przedstawić wyniki uzyskane w teście otrzymane przez
osoby badane to:
a) wyniki uzyskane w standardowych warunkach
b) wyniki wyrażone w terminach odchylenia standardowego
c) wyniki wyrażone w terminach obiektywnych standardów
d) wyniki uzyskane za pomocą wystandaryzowanego narzędzia
24. aby znormalizowane wyniki testowe były użyteczne, tzn. można je był zinterpretować należy je odnieść
do:
a) rzetelności i trafności metody
b) treści pozycji tworzących test psychologiczny
c) zachowania wybranej, dobrze określonej grupy
d) innych metod testowych

25. steny to:


a) wynik surowy
b) wynik wskazujący na wiek umysłowy
c) inna nazwa centyli
d) znormalizowany wynik standardowy

15.Trafność kryterialna to inaczej:


a) trafność predykcyjna i treściowa
b) trafność diagnostyczna i treściowa
c) trafność prognostyczna i diagnostyczna ,•
d) trafność teoretyczna i treściowa

16.RzeteIność testu jest wyrażana w postaci:


a) odchylenia standardowego
b) prawdopodobnego błędu wyniku testowego
c) współczynnika korelacji
d) różnicy pomiędzy dwoma wynikami
17.Aby znormalizowane wyniki testowe były użyteczne
odnosi się je do:
a) treści .pozycji tworzących test psychologiczny
b) innych metod testowych
c) zachowania wybranej, dobrze określonej
grupy
d) rzetelności 'i trafności metody

18.Kontaminacja kryterium najczęściej pojawia się, gdy:


a) test ma niską rzetelność
b) psychiatra ma dostęp do wyników
testowych
c) łączy się wyniki dwóch różnych grup osób
badanych
d) łączy się wyniki pomiaru dwóch różnych
kryteriów
23.Znajomość współczynnika mocy dyskryminacyjnej
pozwala nam na:
a) wskazanie pozycji zbyt trudnych
b) wskazanie pozycji mierzących inną zmienną ,
c) wskazanie pozycji mierzących zachowania
pozatestowe
d) wskazanie pozycji nietrafnych

24. Jeżeli rozkład wyników surowych jest


rozkładem lewoskośnym, to w celu jego
normalizacji należy zastosować następującą
transformację:
a) pierwiastkową
b) logarytmiczną
c) potęgową
d) żadną z nich

25.Trafność teoretyczna testu znajduje swoje odzwier-


ciedlenie w:
a) hipotezach wyprowadzanych z teorii mierzonej
zmiennej
b) rezultatach analizy czynnikowej wyników
testowych
c) obu wymienionych możliwości
d) żadnej z wymienionych możliwości

26. Standardowy błąd estymacji wyniku


prawdziwego jest to:
a) różnica miedzy estymowaną wartością wyniku
prawdziwego a jego rzeczywistą wartością
19. Stosując współczynnik korelacji dwuseryjnej jako współczynnik mocy dyskryminacyjnej, musi
zostać spełnione założenie, że zmienna zdychotomizowana jest:
a) rzeczywiście ciągła i posiada rozkład normalny
b) ciągła, lecz nie o rozkładzie normalnym
c) z natury swej dychotomiczna
d) dzieli się w punkcie mediany

20. Rzetelność testu można wyrazić jako:


a) stosunek wariancji prawdziwej do wariancji błędu
b) stosunek wariancji otrzymanej do wariancji prawdziwej
c) stosunek wariancji prawdziwej do wariancji otrzymanej
d) stosunek wariancji błędu do wariancji otrzymanej

21.Wielkość standardowego błędu pomiaru zależy od:


a) odchylenia standardowego wyników testowych
b) współczynnika rzetelności
c) obu możliwości
d) żadnej z możliwości

22. Jeżeli test jest zbyt trudny dla badanej grupy osób, to rozkład wyników w tym teście
będzie:
a) normalny
b) skośny
e) prostokątny
f) wielomodalny

23.Znajomość współczynnika mocy dyskryminacyjnej pozwala nam na:


e) wskazanie pozycji zbyt trudnych
f) wskazanie pozycji mierzących inną zmienną ,
g) wskazanie pozycji mierzących zachowania pozatestowe
h) wskazanie pozycji nietrafnych

24. Jeżeli rozkład wyników surowych jest rozkładem lewoskośnym, to w celu jego
normalizacji należy zastosować następującą transformację:
a) pierwiastkową
b) logarytmiczną
g) potęgową
h) żadną z nich

25.Trafność teoretyczna testu znajduje swoje odzwierciedlenie w:


a) hipotezach wyprowadzanych z teorii mierzonej zmiennej
b) rezultatach analizy czynnikowej wyników testowych
c) obu wymienionych możliwości
d) żadnej z wymienionych możliwości

27. Standaryzacja testu odnosi się do:


a) komercyjnej użyteczności testu
b) jednolitości procedury
c) zgodności z normami
d) określania jego rzetelności i trafności

28. Współczynnik KR-20 to:


a) średnia wszystkich współczynników typu test-retest
b) średnia wszystkich współczynników typu split-half
c) średnia wszystkich współczynników typu split-test
d) średnia wszystkich współczynników powyżej 0.8
29. Standardowy błąd pomiaru jest szczególnie użyteczny przy:
a) porównywaniu dwóch wyników testowych między sobą
b) określaniu statystycznej istotności wyniku testowego
c) porównywaniu dwóch testów między sobą
d) określaniu istotności statystycznej pozycji testowej
PSYCHOMETRIA CAŁOŚĆ POPRAWIONA

Pytania – Psychometria – Dzienni 2019

1. Jeśli korelacja między wynikiem prawdziwym i testowym dla danego testu


określono jako rtt=0,81, oznacza to, że:

a) ​
Współczynnik rzetelności dla tego testu wynosi 0,81

b)​​
Współczynnik rzetelności dla tego testu wynosi 0,9

c) Współczynnik rzetelności dla tego testu wynosi 0,6561

d) Nie wiadomo, ile wynosi współczynnik rzetelności

2.​​
​ W jakim przypadku wykonuje się transformację liniową?

a) Gdy wynik w teście nie ma rozkładu normalnego, ale do normalizacji wykorzystuje


się skale, które mają …rozkład

b) Gdy cecha nie ma rozkładu normalnego, ale do normalizacji wykorzystuje się skale,
które mają taki rozkład

c) Gdy ani wynik w teście, ani cecha nie mają rozkładu normalnego

d) ​
Gdy wynik w teście i cecha mają rozkład normalny

3.​​
Co oznacza „norma” w sensie psychometrycznym?

a) Norma wyznaczana jest przez teorię (koncepcję) psychologiczną

b) Norma wyznaczana jest przez zachowania zgodne z wzorami kulturowymi

c) ​
Norma wyznaczana jest przez standard ilościowy wyznaczony przez miarę
tendencji centralnej dla danej grupy

d) Norma wyznaczana jest przez osoby tworzące testy psychologiczne

4.​​
Który z poniższych rodzajów trafności testu weryfikuje się za pomocą metody
sędziów kompetentnych?

a) Trafność fasadowa

b) ​
Trafność treściowa

c) Trafność kryterialna

d) Trafność teoretyczna

5​
.​W którym przypadku istnieje największe ryzyko, że normy dla testu
psychologicznego mierzącego cechy osobowości staną się nieaktualne?

a) Gdy diagnosta będzie wykorzystywał test ponad 10 lat od momentu jego utworzenia
b) ​
Gdy diagnosta będzie chciał prowadzić badania elektronicznie, a oryginalna wersja
testu jest papierowa

c) Gdy diagnosta będzie wyliczał wyniki z badania papierowego w komputerze, a nie na


kartce

d) Gdy diagnosta będzie miał coraz większe doświadczenie w posługiwaniu się testem

6.​​
​ Jeśli Autorzy piszą, że oszacowali stabilność bezwzględną jako miarę
rzetelności badania, to co zrobili?

a) Obliczyli alfy Cronbacha

b) Policzyli korelacje między wersjami równoległymi testu badanymi z odstępem czasu

c) ​
Policzyli korelacje między dwoma badaniami tym samym testem z odstępem czasu

d) Policzyli korelacje między dwoma badaniami tym samym testem bez odstępu czasu

7.​​
Które z poniższych założeń NIE jest prawdziwe w odniesieniu do klasycznej
teorii testów?

a) Błąd pomiaru ma rozkład normalny

b) Średni błąd pomiaru wynosi zero

c) ​
Wielkość błędu pomiaru zależy od wyniku w teście

d) Poszczególne błędy pomiaru nie są ze sobą powiązane

8.​​
Testy, w których czas rozwiązywania jest ograniczony, a trudność zadań jest
przeciętna to inaczej:

a) Test szybkości

b) Test mocy

c) Testy wystandaryzowane

d) Testy właściwości afektywnych

9.​​
​ Jak należy zinterpretować współczynnik rzetelności testu równy 1,8?

a) Test jest wysoko rzetelny

b) Test jest nisko rzetelny

c) ​
Nie jest możliwe by współczynnik rzetelności przyjmował taką wartość

d)​​
Za mało informacji by móc je jednoznacznie zinterpretować
10. Jeśli dwóch diagnostów opracowujących wyniki tego samego badania (testu
tej samej…) dochodzą do tego samego rezultatu, to znaczy, że wykorzystany
test jest:

a) ​
Obiektywny

b) Nie obiektywny

c) Wystandaryzowany

d)​​
Nie wystandaryzowany

11. Na czym polega dywergencyjny aspekt trafności testu?

a) Wynik w teście jest wysoko skorelowany z innymi cechami mierzącymi podobne


cechy

b)​​
Wynik w teście jest nisko lub wcale skorelowany z innymi cechami,
mierzącymi ​
inne cechy

c) Wyniki testowe wpływają na pozycję jednostki w zakresie branego pod uwagę


kryterium

d) Kryterium dla testu jest pomiar zachowania/cechy aktualnie występującej u osoby


badanej

12. Wariancja pozycji testowej w testach właściwości poznawczych:

a) Jest największa dla pozycji najtrudniejszych

b) Jest największa dla pozycji najłatwiejszych

c) ​
Jest największa dla pozycji o przeciętnym poziomie trudności

d)​​
Nie zależy od poziomu trudności pozycji testowych

13. Który z poniższych rodzajów trafności ma aspekt zbieżny i rozbieżny?

a) Trafność fasadowa

b) Trafność treściowa

c) Trafność kryterialna

d)​​
Trafność teoretyczna

14. Przedział ufności dla wyniku obserwowanego jest tym mniejszy, im:

a) ​
​ Niższa jest rzetelność testu

b) Wyższy jest standardowy błąd pomiaru


c) Niższa jest pewność, z którą wynik prawdziwy ma się znajdować w tym przedziale ​mi
się wydaje że to jest poprawna odpowiedz

d)​​
Niższa jest trafność testu

15. Ile osób prawidłowo odpowie na pozycję z czterema odpowiedziami (1 właściwa),


jeśli trudność to 60% (przy założeniu zgadywania losowego)

a) 60%

b) 65%

c) 70%

d) 75%

16. Metoda adaptacji testu psychologicznego, która opiera się na stworzeniu nowego
na…o ten sam model teoretyczny co narzędzie oryginalne to:

a) Transkrypcja

b) Trawestacja

c) ​
Rekonstrukcja

d)Translacja

17. Termin „walidacja” odnosi się do:

a) ​
Badań trafności testu

b) Badań rzetelności testu

c) Badań normalizacyjnych

d)​​
Wszystkie odpowiedzi są prawidłowe

18. Która z cech testu wyznacza ramy interpretacji wyników badania jako natężenie
określonej ..

a) Rzetelność

b) Trafność - mieliśmy sprawdzać to z książką i prezentacją a to jest napisane jak byk w


prezentacji

c) ​
Normalizacja

d)​​
Adaptacja

19. Która z poniższych skal jest przykładem norm standardowych?

a) ​
Skala T
b) Skala rangowa

c) Skala centylowa

d)​​
Skala centymetrowa

20. W jakim przypadku używa się współczynnika korelacji punktowo-czteropolowej


jako współczynnika mocy dyskryminacyjnej?

a) Gdy zarówno rozkład cechy mierzonej przez daną pozycję testową, jak i rozkład

ogólnego…teście jest normalny

b) Gdy rozkład cechy mierzonej przez daną pozycję testową nie jest normalny, ale
rozkład ….wyniku w teście jest normalny

c) ​
Gdy zarówno rozkład cechy mierzonej przez daną pozycje testową, jak i rozkład
ogólnego wyniku w teście (nie jest normalny) tylko jest dyskretny - zmienna
dwukategorialna

d)​​
Gdy rozkład cechy mierzonej przez daną pozycję testową jest normalny, ale rozkład
ogólny…teście nie jest normalny

21. Które z poniższych założeń NIE odnosi się do testów równoległych?

a) Jednakowy średni wynik


b) Jednakowa wariancja wyników

c) Jednakowa trafność zewnętrzna

d​
)​Jednakowe pozycje testowe

22. Która cecha testu psychologicznego jest kluczowa dla tego, czy wynik
obserwowany odzwierciedla cechę psychologiczną którą miał mierzyć test?

a)​​
Rzetelność

b) ​
Trafność

c) Obiektywność

d)​​
Standaryzacja

23. Które określenie pasuje do kwestionariusza NEO-FFI?

a) Test właściwości poznawczych


b) ​
Test właściwości afektywnych

c) Test niewerbalny

d)​​
Test nieobiektywny
nie​jest związane ze stronniczością testu
24. Które z poniższych pojęć ​
psychologicznego?

a) ​
Występowanie błędu systematycznego pomiaru ​strona 102 na samej górze
“stronniczość testu to błąd systematyczny”

b) Występowanie różnic w wynikach testowych, gdy nie ma różnic w zewnętrznych


kryterium…

c) Występowanie różnic w trudności pozycji testowych dla różnych grup badanych

d) Występowanie błędu losowego pomiaru​- stronniczość testunie oznacza błedu


losowego bowiem jest on dla wszystkich grup taki sam.

Pytania psychometria:

- Co to znaczy, że dwaj badacze dojdą do innych wniosków w tym samym tescie


- Dwa pytania o aspekt zbiezny i rozbiezny (gdzie jest, co oznacza) ​teoretyczna
- Pytanie o trafnosc (tresciowa chyba) ​sędziów kompetantnych
- Pytanie o normalizacje ( do czego jest potrzebna)
- Co to znaczy że rzetelność 1,8 ​ nie może wynosić więcej niż 0,999
- Która skala jest standardowa ​ (t​
, centyle, centymetry, rangowa)
- T=50 ile to stenów
- Kiedy robimy tranformację liniową ​ gdy rozkład jest normalny
- Kiedy stosujemy wskaznik dyskryminacyjny czteropolowy
- Co to znaczy, że badacz zrobił estymację bezwzględnej stabilności testu ​policzył korelacje
między dwoma badaniami tym samym testem, z odstepem czasu
- Co to znaczy, że zmniejszamy przedział ufności
- Kiedy największe zagrożenie dla testu (stosowanie starych norm, wersja
elektroniczna dla testu papier​ owego, itp.)
- Rzeczywista trudnosc testu 60% ile osób odpowiedziało dobrze na pytanie - 4
mozliwe odpowiedzi - ​ 0,6 + 0,4 x ¼ = 06 + 0,1 = 0,7
- Cechy testów równoległych
- Pytanie o teorie testów - które założenie nie należy do teorii
- Pytanie o błąd standardowy
- Pytanie o test szybkości - ​
ograniczony czas i przecietna trudnosc
- NEO- FII jaki to przykład testu (wł. poznawczych, ​afektywnych​, itp.)
- Jaka najlepsza wariancja błędu - wskaznik trudności w testach poznawczych ​50%
- Co to znaczy, że testy równoległe korelują 0,81 - jaka jest rzetelność ​wysoka
- Pytanie o tworzenie nowego narzedzia przy adaptacji testu

1. Paremetry skali staniowej:


a) M=5,5, SD=2
b) M=5, SD=2,5
c) M=5,5, SD=2,5
d) M=5, SD=2
2. Błąd systematyczny to błąd, który ma taką sama wartość lub jego wartość jest
proporcjonalna … siły oddziaływania czynnika zakłócającego pomiar. W teorii rzetelności ten
rodzaj błędu
a) Nie jest brany pod uwagę ​(systematyczny to ten, co jest zawsze taki sam, więc nie
ma znaczenia)
b) Zależy od trafności testu
c) Ma istotne znaczenie
d) Zależy to od tego, co mierzy dany test

3. Analiza czynnikowa może być wykorzystywana jako metoda określania:


a) Obiektywności testu
b) Standaryzacji testu
c) Trafności testu
d) Rzetelności testu

4. Wynik w granicach 40-60 pkt w skali T uzyskuje około:


a) 68% osób z populacji
b) 95% osób z populacji
c) 98% osób z populacji
d) 99% osób z populacji

5. Które z poniższych twierdzeń jest prawdziwe?


a) Standaryzacja testu to procedura polegająca na uwzględnieniu standardowego błędu
pomiaru w procesie interpretacji wyniku testowego
b) Standaryzacja testu to procedura interpretowania wyniku testu w terminach wybranej
skali standardowej
c) Standaryzacja testu to procedura zbierania danych standaryzowanych
d) Standaryzacja testu to procedura polegająca na tworzeniu standardowych warunków
stosowania testu

6. Która z wymienionych niżej metod nie jest metodą badania rzetelności?


a) ……. Bezwzględna ​ (Estymacja stabilności bezwzględnej)
b) ……. Względna ​ (Estymacja stabilności względnej)
c) ……. Wyników prawdziwych - tak
d) ……. Między połówkowa

7. Wraz ze wzrostem homogeniczności grupy badanej danym testem jego rzetelności:

a) Nie ulega zmianie ?


b) Wzrasta
c) Maleje
d) Czasami wzrasta, czasami maleje- zależy od trafności testu

Homogeniczność nie świadczy o rzetelności testu. To Hornowska podkreślała, żeby się


nauczyć, więc na pewno nie maleje

8. Trafność treściowa to zakres w jakim pozycje testowe:


a) Spełniają warunek obiektywności
b) Reprezentują dziedzinę, która ma być przedmiotem pomiaru
c) Odzwierciedlają potencjalne kierunki interpretacji wyników testowych
d) Dostarczają informacji o tzw ‘’dobroci’’ testu
9. Rekonstrukcję ​
jako strategię adaptacji kulturowej testu charakteryzuje:

b) Przekład dopuszczający modyfikację językowe tam gdzie dosłowne tłumaczenie nie


jest możliwe
c) Swobodne tłumaczenie oryginału z wprowadzeniem wielu modyfikacji i zmian
sugerowanych względem język… psychologicznym
d) Konieczność opracowania nowego narzędzia od fazy analizy teorii i generowania
pozycji aż po analizę psychometryczną danych – test oryginalny jest jedynie inspiracją
adaptacji

10.​ ​Moc dyskryminacyjna pozycji informuje o tym, w jakim stopniu pozycja testowa:( nie
rozumiem pytania “​ Moc dyskryminacyjna​pozycji w teście jest miarą, dzięki której możemy
określić ​
jak dana zmienna, zadanie, pytanie wpływa na ogólny wynik mierzonej przez narzędzie
cechy czy umiejętności​. Miara ta pozwala odpowiedzieć, czy i na ile wyższa wartość dla danej
pozycji jest związana z wyższym poziomem ogólnego wskaźnika danej skali (w skład której
wchodzi dana pozycja).”
a) ……. test ze względu na trafność
b) ……. test ze względu na mierzoną cechę
c) ……. populacje ze względu na mierzoną cechę??
d) ……. populację ze względu na trafność testu

11.​ ​….. tzw. ,, instrukcji i szczerości” stosowana przy kontrolowaniu zmiennej aprobaty
społec…..:
a) ….. być stosowana na etapie konstrukcji kwestionariusza
b) Powinna być stosowana na etapie stosowania kwestionariusza
c) Zakłada stosowanie wyłącznie pozycji neutralnych pod kątem aprobaty społecznej
d) Jest metodą nieskuteczną i nie powinna być stosowana

12.​ ​Które z poniższych stwierdzeń ​


nie ​jest prawdziwe:
a) Skala centylowa ma rozkład równo prawdopodobny
b) Skala centylowa nie odzwierciedla kształt rozkładu wyników surowych
c) Skala centylowa różnicuje wyniki znajdujące się na końcach rozkładu
d) pozwala no ocenę pozycji osoby badanej w stosunku do pozycji innych osób
należących do populacji

13.​ ​Testy, w których podstawą ​


interpretacji ​wyników są dane pochodzące z przebadania
dobrze określonej grupy osób, to tzw testy: (s. 25)
a) Zorientowane na kryterium
b) ​​Zorientowane na normy
c) Zorientowane na wymagania
d) Zorientowane na standard

14.​ ​Jeżeli wynik danej osoby w teście inteligencji jest równy ​12​, a pół przedział ufności dla
alfa=0,15 w tym teście wynosi 2, dla alfa = 0,10 wynosi 3, a dla alfa= 0.05 wynosi 4, to wynik
prawdziwy osoby A z 95% pewnością, znajduje się w przedziale:
a) (10-14)
b) (9-15)
c) (8-16) nie wiem
d) (12-12)

15.​ ​Wynik wyrażony w jednostkach tzw. dewiacyjnego ilorazu inteligencji to:


a) Wynik surowy
b) Wynik wyrażony w centylach
c) Wyraz wskazujący na upośledzenie sprawności umysłowych
d) Wynik wyrażony w jednostkach odchylenia standardowego ( ​jest wskaźnikiem
pokazującym w jednostkach odchylenia standardowego, w jakim stopniu pozostaje wynik
osiągnięty przez daną osobę do przeciętnego rozkładu wyników dla jej wieku)

16.​ ​Gdy test psychologiczny jest wykorzystywany do rekrutacji w konkretnej organizacji i


wykorzystywanie w tym celu normy zostały opracowane na próbie kandydatów tej
organizacji jest przykładem zastosowania norm:
a) Lokalnych
b) Narodowych
c) Instytucjonalnych
d) Organizacyjnych

17.​ ​Przyjęcie perspektywy emikalnej jako podstawy adaptacji testu oznacza akceptację
następującego poglądu:
a) Cechy będące przedmiotem pomiaru psychologicznego mają charakter uniwersalny i
dlatego można swobodnie …. Testy z jednego obszaru kulturowego co drugiego
b) Cechy będące przedmiotem pomiaru psychologicznego są kulturowo specyficzne i
dlatego procedura adaptacji ……. …….. uwzględniając specyfikę kulturową kraju do którego
testy jest przenoszony
c) Cechy będące przedmiotem pomiaru psychologicznego można traktować jako
uniwersalne lub specyficzne ….. od przyjętej teorii cechy
d) Cechy będące przedmiotem pomiaru psychologicznego można traktować jako
uniwersalne lub specyficzne ….. od przyjętych metod ich pomiaru

18.​ ​Wynik testowy równy 55 centynowi oznacza, że:


a) ..% osób uzyskało wyniki takie same lub wyższe od danego wyniku
b) ..% osób uzyskało wyniki niższe od danego wyniku
c) ..% osób uzyskało wyniki wyższe od średniego wyniku testowego??
d) ..% osób uzyskało wyniki niższe od średniego wyniku testowego
Powinno być chyba w odpowiedzi, że 55% uzyskało takie same lub niższe od danego
wyniku
19.​ ​Jeżeli konstruujemy test przeznaczony do diagnozowania dzieci z problemami
edukacyjnymi. Który następnie ma stać się podstawą do kierowania tych dzieci na specjalne
zajęcia dodatkowe to ten test powinien zawierać:
a) Dużo zadań bardzo trudnych
b) Dużo zadań bardzo łatwych
c) Dużo zadań o przeciętnej trudności
d) Trudność zadań wgl nie powinna być brana pod uwagę

20.​ ​Procedura nadawania znaczenia empirycznego konstruktom teoretycznym, to


procedura:
a) Pomiaru według klasycznej teorii testu
b) Określenia trafności testu
c) Operacjonalizacji
d) Określeniu rzetelności testu

21.​ ​Obiektywność testu jest pierwszym kryterium dobrości testu. Dany test spełnia warunek
obiektywności, jeżeli:
a) Daje obiektywne wyniki
b) Posiada wysokie korelacje z innymi wynikami testowymi
c) Oceniany przez różnych psychologów daje porównywalne wyniki
d) Pozwala na zastosowanie obiektywnego klucza oceny odpowiedzi

22.​ ​W poniższym zdaniu brakuje jednego wyrazu. Które z poniższych określeń należałoby
wstawić w to miejsce? „ Stopień w jakim test pozwala na pomiar nasilenia u osoby badanej
hipotetycznej właściwości to…………… testu.”
a) Trafność wewnętrzna
b) Trafność teoretyczna
c) Trafność logiczna
d) Trafność diagnostyczna

23.​ ​Jeżeli interesuje nas odpowiedź na pytanie, czy wszystkie pozycje testu mierzą się tą
samą cechą psychologiczną to możemy zastosować współczynnik rzetelności typu:
a) Test- retest
b) Dla norm równoległych
c) Homogeniczności
d) Połówkowania

24.​ ​Jeżeli diagnosta chce różnicować w obrębie wyników bardzo niskich lub bardzo
wysokich, to powinien posługiwać się testem, w którym normy zostały wyróżnione w skali :
a) Tetronowej
b) Staninowej
c) Stenowej
d) T

25.​ ​Aby można było stosować test dla celów diagnozy indywidulanej, to jego rzetelność
powinna oscylować wokół:
a) 0,9
b) 0,8
c) 0,7
d) 0,6
Tak, a dla celów niediagnostycznych np. badania naukowe min. 0,6

26.​ ​Homogeniczność testu mierzona współczynnikiem alfa Crombacha jest to miara:​(Alfa


Cronbacha jest statystyką. Używa się jej zwykle do mierzenia wewnętrznej
spójności albo rzetelności psychometrycznego narzędzia.)

a) Rzetelność testu
b) Trafność testu
c) Zarówno rzetelnośc testu jak i trafność testu
d) Ani rzetelność ani trafnośc testu ??​?

27.​ ​Które z poniższych​​


nie ​
j​
est prawdziwe:
a) Norma psychometryczna jest to standard ilościowy wyznaczony przez średnią lubi
inną miarę …
b) Norma psychometryczna jest to typowy wynik w teście?? wydaje się, że ta bo norma
to nie wynik norma (​Normalizacja to zabieg​​
statystyczny​polegający na ustaleniu zależności
między wynikami uzyskanymi za pomocą danego narzędzia (np. testu, kwestionariusza) a
wynikami średnimi w danej ​ )
populacji​
c)​ ​Norma psychometryczna opisuje właściwy poziom wykonywania testu - OLA - według
mnie ta odpowiedz nie jest prawidłowa. Nie ma czegoś takiego jak “właściwy poziom”
wykonania testu.​
fakt, nie wiem jednak do końca
d) Norma psychometryczna pozwala na ocenę jaką osoba badana testem wypada na
tle

28.​ ​Tak zwany styl odpowiadania w kwestionariuszu jest to:


a) Obserwowana skłonność osób badanych do udzielania odpowiedzi diagnostycznych
b) Obserwowana skłonność osób badanych do udzielania odpowiedzi nie
diagnstycznych
c) Obserwowana skłonność osób badanych do udzielania odpowiedzi zależnie od treści
pozycji testowych
d) Obserwowana skłonność osób badanych do udzielania odpowiedzi niezależnie od
treści pozycji testowych

29.​ ​Trafność teoretyczna uważana jest za najwyższy rodzaj trafności. Znajduje się ona
swoje Odzwierciedlenie m.in. w :
a) Rezultatach badań nad rzetelnością teorii psychologicznej, która leży u podstawy
testu
b) Rezultatach badań nad trafnością teorii psychologicznej która leżu u podstawy testu
c) Hipotezach dotyczących zachowań badań osób tworzonych na podstawie istotnych
dla psychologa teorii psychologicznych
d) Hipotezach dotyczących wyniku badanych osób w teście tworzonych na podstawie
teorii mierzonej

30.​ ​Skłonność osób badanych do przypisywania sobie w samoopisach takich stwierdzeń


które są społecznie pożądane i odrzucanie tych, które są społecznie niepożądane jest
wyrazem:
a) Tendencji do symulowania
b) Tendencji do dysymulowania
c) Zarówno tendencji do symulowania to zależy od sytuacji w jakiej
d) Żadna z tych tendencji

31.​ ​Który z wymienionych niżej etapów ​nie​jest etapem analizy pozycji testowych?
a) Ustalenie czy pozycje testową da się wprowadzić z teorii mierzonej właściwości
psychologicznej
b) Sprawdzenie czy pozycja testowa jest poprawnie zredagowana
c) Określenie czy pozycja testowa jest homogeniczna
d) Obliczenie statystycznych wskaźników dla pozycji testowej

32.​ ​Pozycja testowa o otwartym formacie odpowiadania to pozycja:


a) która ma więcej niż dwie kategorie odpowiedzi
b) która ma tylko dwie kategorie odpowiedzi
c) nie ma określonej kategorii odpowiedzi osoba badana udziela odpowiedzi
spontaniczne
d) Która nie jest pozycją z wymuszonym wyborem tj. zawiera kategorie typu ‘’ nie
wiem’’, ‘’ nie mam zdania ‘’

33.​ ​Uzupełnij zdanie „podstawowym powodem …… jest podtrzymanie motywacji osoby


badanej w sytuacji rozwiązywania testu
a) Trafność teoretyczna
b) Trafność prognostyczna
c) Trafność fasadowa
d) Trafność diagnostyczna

34.​ ​Która z poniższych reguł ​


nie ​
należy do podstawowych zasad redagowania pozycji
testowych
a) Pozycje testowe nie powinny być zbyt długie
b) Pozycje testowe powinny być raczej zbudowane ze zadań prostych niż złożonych
c) Pozycje testowe nie powinny być formułowane w trybie oznajmującym
d) Pozycje testowe powinny być formułowane w języku dostosowanym do przeciętych
kompetencji języka badanych osób

35.​ ​Rzetelność testu można wyrazić jako:


a) Współczynnik korelacji pomiędzy wynikiem testowym, a wynikiem zmiennej
kryterialnej
b) Współczynnik korelacji pomiędzy wynikiem danej pozycji, a wynikiem innej pozycji w
tym teście
c) Współczynnik korelacji pomiędzy dwoma wynikami uzyskanymi w dwukrotnym
badaniu tej samej grupy samym testem
d) Współczynnik korelacji pomiędzy dwoma wynikami uzyskanymi na badaniu różnymi
testami

36.​ ​Współczynnik rzetelności jest operacyjnie wyrażany za pomocą:


a) Średniej arytmetycznej
b) Odchylenia standardowego
c) Wariancji
d) Współczynnika korelacji

37.​ ​Interpretując wynik otrzymamy w teście należy wziąć pod uwagę standardowy błąd
pomiaru ponieważ można w ten sposób określić wielkość błędu dla:
a) Pozycję testu
b) Wynik ogólny w teście
c) Współczynnika trafności w teście
d) Współczynnika rzetelności testu

38.​ ​Jeżeli nie ma żadnych innych wskazań, to średni współczynnik trudności pozycji
testowych sytuacji, gdy konstruowany test ma w maksymalnym stopniu różnicować badaną
populację powinien:
a) Mieścić się w zakresie od 0% do 100%
b) Wynosić około 50%
c) Zostać wyznaczony na podstawie rozkładu normalnego
d) Odpowiadać medialnie rozkładu wyników surowych w tym teście

39.​ ​Które z podanych niżej określeń ​nie​charakteryzują norm typu wymagań?


a) Są oparte na analizie treści nauczania
b) Umożliwiają porównanie osiągnięć badanych osób z wymaganiami programowymi
c) Ich punktem odniesienia jest określona populacja osób
d) Pozwalają na określenie minimalnego poziomu kompetencji np. do wykonywania
własnego zawodu
40.​ ​Zaletą norm typu równoważniki wieku jest to, że:
a) Są równoważne teoretycznie wyznaczanemu punktowi odniesienia
b) Dostarczają informacji o poziomie mierzonej właściwości w jednostkach odchylenia
standardowego
c) Pozwalają na wyznaczenie standardu najlepszego wykonania testu
d) Osiągniecia osób badanych są traktowane rozwojowo

1Trafnosc kryterialna to :
Prognostyczna i diagnostyczna
2. Kiedy test jest coraz trudniejszy to znaczy ze wpływ na to ma:
Moc testu
3.Jeżeli wskaźnik wynosi 0,8
Rzetelność wysoka
4.Jaka trafność ma analize czynnikowa:
Teoretyczna
5.Test konweregencyjny
Wysoka korelacja z innymi testami
6.Wierne tłumaczenie tekstu to :
Translacja
7.Stronniczosc testu
Wpływa na pozycje testowe i na blad systematyczny
8.Co musi być w diagnozie indywidualnej a nie musi w diagnozie badawczej
Standaryzacja? ​ normalizacja?
9.Punktowo dwuseryjny (​ Wskaźnik korelacji punktowo dwuseryjnej przyjmuje wartości od -1
do 1 i powinien mieć wartość dodatnią dla odpowiedzi poprawnej oraz wartości ujemne dla
odpowiedzi niepoprawnych (dystraktorów). Najogólniej ujmując wskaznik ten pokazuje
relację pomiędzy wynikiem całego testu a wyborem konkretnej odpowiedzi w danym
zadaniu) ​a jakie było pytanie i odpowiedzi nie wiadomo
10 Wynik 50 na skali staninowej w tescie co oznacza ​tego nie rozumiem i nie mam pewności
czy pyanie było takie ???
Dałam 9 ale nie wiem co ma byc
11.Gdzie są rangi
W centylach
12.Jezeli dwie osoby sprawdzaja test i wychodza te same wyniki to znaczy ze test jest :
Obiektywny
13.Bląd pomiaru zaznaczyć złą odpowiedz (​Charakterystyka błędu pomiaru to jedno z
najważniejszych zadań teorii Gulliksena i wogóle teorii pomiaru. Z rownania Z=T+E wynika
że błąd pomiaru to różnica pomiędzy wynikiem otrzymanym a wynikiem prawdziwym czyli
E=X-T)
14. rAZ = rBZ od czego jest :
Testy rownoległe
15.Jak robisz test połówkowy to co robisz pozniej
Alfe Cronbacha ​ ,
16. ​
im mniejszy procent tym większy przedział ufności
17. Gdzie jest walidacja:
W trafności
18.Normą jest zachowanie
Standardowe
19.Normy lokalne
Miejsce zamieszkania jakies miasto (nie duża próba)
20. Ludzie dostali pytanie gdzie było 5 odpowiedzi, jedna prawidłowa, 80% zrobiła dobrze
(losowo wybierali odpowiedz) jaka jest trudność
Dałam najniższy wynik
21.Moc dyskryminacyjny ​ (​
Moc dyskryminacyjna​pozycji w teście jest miarą, dzięki której
możemy określić jak dana zmienna, zadanie, pytanie wpływa na ogólny wynik mierzonej przez
narzędzie cechy czy umiejętności. Miara ta pozwala odpowiedzieć, czy i na ile wyższa wartość
dla danej pozycji jest związana z wyższym poziomem ogólnego wskaźnika danej skali (w skład
której wchodzi dana pozycja).
Roznicuje badanych -??

PSYCHOMETRIA jpdl więcej pytań nie było? 90% się powtarza

PYTANIA YOLO

Która z metod pozwala na największe zmiany w adaptacji ?


Rekonstrukcja a może trawestacja ??
Gdy zalezy nam na motywacji osoby badanej do rozwiązywania testow, to wazna jest?
Trafność fasadowa
1. Co to sa tetrony?
Jednostki skali standardowej, skala 21 punktowa, od 0 do 20, od -2,5 do 2,5 odchylenia
standardowego w rozkładzie normalnym 40% centyle?
"40% osob ma gorsze wyniki od tej osoby, ktora otrzymała wynik rowny 40 centylowi"
2. Wskaźnik mocy dyskryminacyjnej
Wysokie, dodatnie
3. Moc dyskryminacyjna?
Korelacja miedzy wynikiem pozycji testowej a wynikiem całego testu.

5. Rzetelność testu
Wskaźnik korelacji miedzy wynikiem dwoch badan tym samym testem tym samych ludzi.
6. X=T+E​??
Zmniejszyć E
7. Które w standaryzacji stwierdzenie jest mniej istotne?
Dwie odp. Prawa autorskie, Wpadnie w rece niepsychologow
8. Standaryzacja
Jednolitość
9. Niski współczynnik korelacji miedzy testami A I B ( rownolegle)
( badanie po odstępie czasu)
Wysoka specyficzność pozycji testowych
10. Normy lokalne
Ścisle określone grupy ludzi -małe niereprezentatywna grupa ludzi
11. Normy
Zachowania typowe
12.Budowanie przedziału dla wyniku otrzymanego (wynik osoby - Z*SEM ; Z*SEM + wynik
osoby). jakie odp nie wiadomo
Rzetelność ? czemu? ktoś wyjaśni?
a nie powinien tu byc przedzial ufnosci dla bledu standardowego?
13.Porównanie dwoch ludzi, aby wybrac lepszego to:
Standardowy bład roznicy (minimalny)
14. Odniesienie pozycji testu do uniwersum?
Trafność tresciowa
15. Gdzie najwieksza jest trafność?
Odp. Test z historii??? co to jest
16. Analiza korelacji macierzy to:
Zbieżna i rozbieżna
17. Test – retest (wada)
Zapamiętywanie
18. Błąd we wzorze X=T+E
Losowy
19. Co nie jest w definicji testu ?
Odp. Wystandaryzowana skala ze średnią 100
.Definicja testu psychologicznego: jest to narzędzie obiektywne, wystandaryzowane, trafne,
rzetelne i znormalizowane, wyposażone w reguły obliczania wartości mierzonej cechy
psychologicznej oraz jasno określającej zakres i rodzaj dopuszczalnych zachowań ze strony
diagnosty. (podręcznik Hornowska)

20. Współ. Trudności testu ( gdy chcemy zastosować test do SELEKCJI)


Odp. Jest równy wyznaczonemu punktowi selekcji.
21 Trafność teoretyczna jak jest weryfikowana?
Hipotezy weryfikowane za pomocą teorii stojącej za testem jeżeli pytano o analizę różnic
międzygrupowych to tak
Mamy 5 rodzajów analizy testów teoretycznych:
Analiza różnic miedzygrupowych​ . - Metoda ta polega na weryfikowaniu hipotez
dotyczacych różnego zachowania się dwóch grup osób. Hipotezy te wyprowadzane są z
teorii mierzonej cechy, a badane grupy różnią się ze względu na ogólny wynik w teście
Analiza macierzy korelaci ​ - analiza współczynników korelacji wyników analizowanego testu
z innymi testami.
Analiza czynnikowa​- jej podstawą jest analiza korelacji
Analiza struktury wewnętrznej testu​- analiza współczynników korelacji między wynikiem
każdej pozycji testu, a ogólnym wynikiem w tym teście.

22. która z poniższych definicji jest pełną i wyczerpującą definicją testu


psychologicznego?
a) jest to obiektywny i standaryzowany pomiar próbki zachowania
b) jest to kontrolowana ilościowa obserwacja zachowania
c) jest to pomiar próbki zachowania wybranej grupy ludzi
d) jest to standaryzowany zbiór bodźców dla mierzalnych reakcji -SERIO TO?

23. trafność fasadowa powinna być brana pod uwagę w przypadku testu, gdyż:
a) stanowi podstawę statystycznego doboru pozycji
b) jest częścią składową każdego rodzaju trafności
c) jest dowodem, że test mierzy to, co zmierzył jego autor
d) zapewnia zgodność wyglądu testu czym.... sądzi osoba badana
Trafność fasadowa opisuje, jak spostrzegają test osoby badane i czy - z ich punktu widzenia
- wydaje się on trafnie mierzyć to, co ma mierzyć.

24. wyniki standardowe to


a) wyniki uzyskane w standardowych warunkach
b) wyniki wyrażone w terminach odchylenia standardowego​zdecydowanie to
c) wyniki wyrażone w terminach obiektywnego standardu
d) wyniki uzyskane za pomocą wystandaryzowanego narzędzia
str. 134 Hornowska
25. pojęcie normy w teście odnosi się do:
a) wykonania idealnego
b) wykonania maksymalnego
c) wykonania oczekiwanego
d) wykonania typowego
Norma opisuje poziom typowego wykonania testu przez osoby należące do określonej
grupy.
26 tetrony to wyniki standardowe wyrażone na skali
a) M=10 SD=2
b) M=10 SD=4
c) M=10 SD=1
d) M=10 SD=10
Skala tetronowa opisywana j /est przez średnią równą 10 i odchylenie standardowe równe
4. tetron=4z+10
27. wysoki współczynnik korelacji pomiędzy dwoma testami równoległymi
stosowanymi jeden po drugim, bez przerwy czasowej, świadczy o:
a) funkcjonalnej mierzonej zmiennej w czasie
b) niskiej homogeniczności wysokiej specyficzności pozycji testowych
c) niskiej specyficzności i wysokiej homogeniczności pozycji testowych
d) ja by tu jeszcze dała że świadczy o wysokiej rzetelności ale nie znamy ostatniej
odpowiedzi
28. w metodzie testów równoległych, w odróżnieniu od metody test-retest
minimalizowany jest wpływ:
a) pamięci i efektów uczenia się
b) braku stałości zmiennej
c) heterogeniczności zmiennej
d) szybkości rozwiązania zadań
29. otrzymanie różnych współczynników trafności kryterialnej dla danego testu
jest najczęściej spowodowany:
a) faktem wybrania różnych zmiennych kryterialnych -to??????????????
b) błędami w obliczeniach
c) niską rzetelnością testu
d) trudnościami w diagnozowaniu zachowania mierzonego przez test
30. test składa się z 10 pytań. Powinien dobrze różnicować w obrębie patologii.
Która z poniższych skal standardowych najlepiej pozwalałaby zrealizować ten cel:
a) M=10, SD=5
b) M=10 SD=1a nie to?
c) M=50 SD=10​to jest skala T ona coś mówiła że ta najlepiej różnicuje
d) M=50 SD=25
31. błąd standardowy różnicy jest to​:
a) różnica 2 błędów standardowych
b) suma 2 błędów standardowych podniesionych do kwadratu z których
wyciągnięto pierwiastek
c) różnica 2 błędów standardowych podniesionych do kwadratu z których wyciągnięto
pierwiastek
d) suma dwóch błędów standardowych
32. aby spełnić warunek obiektywności, każdy test musi być przynajmniej:
a) stosowany i obliczany w z góry ustalonych warunkach
b) wysoko rzetelny
c) losową próbką wskaźników zmiennej teoretycznej
d) oparty na wybranej teorii mierzonej zmiennej
33. stanina to
a) wynik surowy
b) wynik wskazujący na wiek umysłowy
c) inna nazwa centyli
d) znormalizowany wynik standardowy
34. centyle to wyniki, które wskazują jaki procent osób z badanej grupy uzyska
wyniki:
a) takie same lub wyższe od danego wyniki
b) takie same lub niższe od danego wyniku
c) wyższe od średniej
d) niższe od średniej
35. określenie rzetelności testu pozwala na ustalenie:
a) jaki % wariancji otrzymanej stanowi wariancja prawdziwa
b) wielkości błędu stałego w pomiarze testowym
c) jaką część wariancji błędu stanowi wariancja prawdziwa
d) możliwych fluktuacji wielkości współczynnika R

37. rzetelność testu jest wyrażana w postaci


a) odchylenia standardowego
b) prawdopodobnego błędu wyniku testowego
c​
) współczynnika korelacji
d) różnicy pomiędzy 2 wynikami
38. aby znormalizowane wyniki testowe były użyteczne odnosi się je do:
a) treści pozycji tworzących test psychologiczny
b) innych metod testowych
c) zachowania wybranej, dobrze określonej grupy
d) rzetelności i trafności metody
39. kontaminacja kryterium najczęściej pojawia się, gdy:
a) test ma niską rzetelność
b) psychiatra ma dostęp do wyników testowych ??? “kontaminacja” oznacza
“połączenie”, także raczej nie ta odpowiedź. Najprawdopodobniej D, być może C.
kontaminacja oznacza “zakażenie”
Kontaminacja kryterium: wyniki testowe nie mogą wpływać na pozycję jednostki w zakresie
branego pod uwagę kryterium
c) łączy się wyniki dwóch różnych grup osób badanych
d) łączy się wyniki pomiaru dwóch różnych kryteriów nie to??
40. stosując współczynnik korelacji dwuseryjnej, jako współczynnik mocy
dyskryminacyjnej, musi zostać spełnione założenie, że zmienna zdychotomizowana
jest:
a) rzeczywiście ciągła i posiada rozkład normalny,
b) ciągła lecz nie o rozkładzie normalnym
c) z natury swej dychotomiczna
d) dzieli się w punkcie mediany
41. rzetelność testu można wyrazić jako:
a) stosunek wariancji [prawdziwej do wariancji błędu
b) stosunek wariancji otrzymanej do wariancji prawdziwej każda definicja wymienia
najpierw wariancje otrzymaną a potem prawdziwą, chyba to.
c) stosunek wariancji prawdziwej do wariancji otrzymanej nie to? to
d) stosunek wariancji błędu do wariancji otrzymanej
odpowiedź c
1.​ wielkość SEM zależy od:

a) odchylenia standardowego wyników testowych,
b) współczynnika rzetelności
c) obu możliwości
d) żadnych możliwości

1. jeżeli test jest zbyt trudny dla badanej grupy osób to rozkład wyników w tym teście będzie:
a) normalny
b) prostokątny
c) skośny
d) wielomodalny

1. znajomość współczynnika mocy dyskryminacyjnej pozwala nam na


a) wskazania pozycji zbyt trudnych
b) wskazanie pozycji mierzących inną zmienną
c) wskazanie pozycji mierzącej zachowania pozatestowe
d) wskazanie pozycji nietrafnych

1. standardowy błąd estymacji wyniku prawdziwego jest to:


a) różnica między estymowaną wartością wyniku prawdziwego a jego rzeczywistą
wartością
b) różnica między wynikiem otrzymany a wynikiem prawdziwym w teście
c) obie definicje są prawdziwe nie to?
d) żadna definicja

1. standaryzacja testu odnosi się do:


a) komercyjnej użyteczności testu
b) jednolitości procedury
c) zgodności z normami
d) określania jego rzetelności i trafności

1. współczynnik KR-20 to:


a) średnia wszytskich współczynników typu test-retest
b) średnia wszytskich współczynników typu split-half
c) średnia wszystkich współczynników splittest
d) średnia wszystkich współczynników powyżej 0,8

1. standardowy błąd pomiaru jest szczególnie użyteczny przy:


a) porównywaniu dwóch wyników testowych między sobą
b) określaniu statystycznej istotności wyniku testowego
c) porównywaniu dwóch testów między sobą a nie to? oblicza sie przecież
standardowy błąd różnicy
d) określaniu istotności statystycznej pozycji testowej

1. testu przeznaczone do selekcji ze względu na specyficzne kryterium, powinny składać się


z pozycji testowych, których współczynnik trudności wynosi:
a) 0,5
b) mieści się w przedziale od 0-100%
c) wyznaczony jest przez rozkład normalny
d) jest równy wyznaczonemu punktowi selekcji

1. dla którego z poniższych rodzajów testów, określenie trafności treściowej będzie


najbardziej odpowiednie
a) testów zdolności werbalnych
b) testów wiadomości z matematyki
c) testów projekcyjnych
d) testów inteligencji

1. badanie trafności metodą wielu cech-wielu metod polega na:


a) analizowaniu tylko aspektu zbieżnego trafności
b) analizowaniu tylko aspektu różnicowego trafności
c) analizowaniu jednocześnie aspektu zbieżnego i różnicowego
d) żądne z powyższych możliwości

1. formuła spearmana-browna pozwala na określenie wpływu następujących zmiennych na


wielkość współczynnika rzetelności:
a) heterogeniczności próbki badanych osób
b) homogeniczności pozycji testowych
c) trafności testu
d) długości testu

1. steny to wyniki standardowe wyrażone na skali


a) M=5 SD=2
b) M=5 SD=4
c) M=5,5 SD=2
d) M=5,5 SD=4

1. staniny to wyniki standardowe wyrażone na skali:


a) M=5 SD=2
b) M=5 SD=4
c) M=5,5 SD=2
d) M=5,5 SD=4

1. skala T to wyniki standardowe wyrażone na skali:


a) M=50 SD=2
b) M=50 SD=4
c) M=100 SD=15
d) M=50 SD=10

1. badanie testowe najogólniej rzecz biorąc to:


a) w sytuacjach, w których dokonuje się ilościowej obserwacji zachowania
b) w sytuacjach, w których wywołuje się zachowania typowe dla określonej grupy osób
c) w sytuacjach, w której dokonuje się celowej obserwacji zachowań traktowanych jako
wskaźniki mierzonej charakterystyki
d) w sytuacjach, w których celem pomiaru jest określenie istotnych cech badanych cech

1. jedyny, z kryteriów normalnych, branych pod uwagę przy tworzeniu testu jest
współczynnik trudności poszczególnych pozycji testowych. Jeżeli tworzymy test dla celów
selekcji i mamy dużo kandydatów, a możemy przyjąć najwyżej 10% to większość pozycji
testowych z tego testu powinna być:
a) raczej trudnych
b) raczej łatwych
c) raczej o przeciętenj trudności ?? sama nie wiem...
d) raczej o wysokim współczynniku rzetelności niż trafności

wiedząc, że w klasycznej teorii testów przyjmuje się wynik obserwowany = wynik prawdziwy
+ błąd pomiaru, określ co powinno być podstawowym obowiązekim autora testu:
a) dążenie do zwiększenia wyniku prawdziwego danej osoby,
b) dążenie do zmniejszenia błędu pomiaru
c) dążenia do zwiększenia wyniku obserwowanego
d) J

badanie testowe to:


a) sytuacja w której dokonuje się ilościowej obserwacji zachowania
b) sytuacja w której wywołuje się zachowania typowe dla określonej grupy
c) sytuacja w której dokonuje się celowej obserwacji zachowań traktowanych jako
wskaźniki mierzonej charakterystyki
d) sytuacja w której celem pomiaru jest określenie istonych cech badanych osób

1. która z poniższych definicji jest pełną i wyczerpującą def. Testu psychologicznego:


a) jest to kontrolowana ilościowa obserwacja zachowania
b) jest to obiektywny i standaryzowany pomiar próbki zachowania hmm??
c) jest to pomiar zachowania wybranej grupy ludzi
d) jest to kontrolowany pomiar reakcji w różnych sytuacjach zadaniowych

2.​ . obiektywność jest jedyny z tzw. kryteriów dobroci testów psychologicznych. Aby

spełnić warunek obiektywności każdy test musi przynajmniej
a) zostać oparty na teorii mierzonej zmiennej
b) dawać porównywalne wyniki niezależnie od tego gdzie i kiedy jest stosowany
c) być obliczany w ściśle określonych warunkach
d) posiadać wysokie wskaźniki rzetelności i trafności

1. warunek standaryzacji, czyli koleje kryterium dobroci testów psychologicznych zostanie


spełniony wtedy gdy:
a) test będzie stosowany w jednolity sposób w stosunku do wszystkich osób badanych
b) test zostanie wyposażony w podręcznik zawierający opis zasad jego stosowania
c) test będzie stosowany odpowiednio do możliwości osoby badanej
d) test zostanie zastosowany tylko w takich sytuacjach w których jego wyniki będą miały
praktyczną użyteczność

1. jednym z kryteriów formalnych branym przy tworzeniu testu jest współczynnik trudności
poszczególnych pozycji testowych. Jeżeli chcemy zastosować test do selekcji kandydatów
uwzględniając określony punkt odcięcia to powinniśmy wybrać taki test, który składa się z
pozycji testowych, których współczynniki trudności wynosi:
a) 0,6
b) mieści się w zakresie 0-100%
c) jego średnia wartość wynosi 50%
d) jest równy wyznaczonemu punktowi selekcji

1. znajomość współczynnika mocy dyskryminacyjnej poszczególnych pozycji testowych


pozwala nam na
a) wyeliminowanie pozycji należących do innego testu
b) wyeliminowanie pozycji mierzących inna zmienną ni-ż zmienna testowa,
c) wyeliminowanie pozycji które nie różnicują badanej populacji
d) wyeliminowanie pozycji zbyt mocno różnicujące badane osoby

1. s0
a) wynik pozycji testowej powinien być z natury swej dychotomiczny
b) rozkład wyników pozycji testowej powinien być rozkładem dwumodalnym
c) wynik pozycji testowej powinien być zmienną ciągłą
d) rozkład wyników pozycji testowej powinien być rozkładem normalnym

1. w klasycznej teorii testów przyjmuje się założenie, że


a) błąd pomiaru = wariancja wyników testowych
b) błąd pomiaru ma charakter losowy
c) błąd pomiaru jest błędem stałym
d) błąd pomiaru jest równy odchyleniu standardowemu wyników testowych

1. metoda testów równoległych stosowana do oszacowania rzetelności testu pozwla na


wyeliminowanie wpływu:
a) zbyt wysokiej trudności pozycji testowych
b) pamięci i efektów uczenia się
c) szybkości rozwiązywania zadań
d) błędów o charakterze losowym, ujawniających się w sytuacji testowania

1. wysoki współczynnik korelacji pomiędzy dwoma testami równoległymi stosowanymi jeden


po drugim bez przerwy czasowej, świadczy o:
a) wysokiej fluktuacji mierzonej zmiennej w czasie
b) niskiej homogeniczności i wysokiej specyficzności
c) niskiej specyficzności i wysokiej homogeniczności
d) wysokim stopniu obiektywności testu

1. standardowy błąd estymacji wyniku otrzymanego jest to:


a) różnica między estymowaną wartością wyniku prawdziwego a jego rzeczywistą
wartością
b) różnica między wynikiem otrzymanym a wynikiem prawdziwym w teście
c) różnica między estymowanym wynikiem otrzymanym a wynikiem rzeczywistym
d) różnica między wynikiem rzeczywistym a wynikiem, który pomniejszono o błąd
pomiaru

1. błąd standardowy różnicy jest to


a) różnica dwóch błędów standardowych
b) różnica dwóch błędów standardowych podniesionych do kwadratu, z których
wyciągnięto pierwiastek
c) suma dwóch błędów standardowych
d) suma dwóch błędów standardowych podniesionych do kwadratu z której wyciągnięto
pierwiastek

1. dokonując diagnozy na podstawie wyniku testowego, należy wziąć pod uwagę


standardowy błąd pomiaru ponieważ,
a) tylko w ten sposób można określić istotność otrzymanych wyników
b) pozwala on na dokładne określenie poziomu istotności wyniku prawdziwego,
c) dzięki niemu można określić wielkość błędu jakim jest obciążony wynik testu
d) pozwala on określić wielkość błędu jaki popełniany jest przy interpretowaniu wyniku
poszczególnych pozycji testowych

1. trafność testu to również jedno z kryteriów dobroci testów psychologicznych. Klasyczny


podział obejmuje następujące rodzaje trafności:
a) trafność treściową kryterialną i teoretyczną
b) trafność treściową fasadową i kryterialną
c) trafność treściową logiczną i wewnętrzną
d) trafność treściową diagnostyczną i prognostyczną

1. często zdarza się, że autorzy przeprowadzający badania danego testu uzyskują różne
współczynniki trafności kryterialnej. Jest to najczęściej spowodowane:
a) niskimi współczynnikami pozostałych rodzajów trafności
b) niskimi współcz ynnikami rzetelności testu
c) trudnościami w diagnozowaniu zachowania mierzonego przez test
d) faktem wybrania różnych zmiennych kryterialnych

1. w której z przedstawionych niżej sytuacji może dojść do zjawiska kontaminacji kryteriów:


a) psychiatra dokonując oszacowania wyników badanych osób ze względu na zmienną
kryterialną miał dostęp do wyników testowych
b) psychiatra dokonując oszacowania wyników badanych osób ze względu na zmienną
kryterialną znał podręcznik testowy
c) autor testu znał procedurę szacowania badanych osób ze względu na zmienną
kryterialną
d) autor testu połączy ł wyniki otrzymane dla dwóch różnych zmiennych kryterialnych

1. istnieje wiele rodzajów trafności. W zależności od celu testowania niektórych z nich mają
większe znaczenie. Dla którego z poniższych rodzajów testów określenie trafności będzie
najbardziej pożądane?
a) testów projekcyjnych
b) testów inteligencji
c) testów zdolności werbalnych
d) testów wiadomości z matematyki

1. pojęcie normy w teście psychometrycznym odnosi się do:


a) wykonania typowego
b) wykonania idealnego
c) wykonania maksymalnego
d) wykonania oczekiwanego
1. wyniki standardowe za pomocą których można przedstawić wyniki uzyskane w teście
otrzymane przez osoby badane to:
a) wyniki uzyskane w standardowych warunkach
b) wyniki wyrażone w terminach odchylenia standardowego
c) wyniki wyrażone w terminach obiektywnych standardów
d) wyniki uzyskane za pomocą wystandaryzowanego narzędzia

1. aby znormalizowane wyniki testowe były użyteczne, tzn. można je był zinterpretować
należy je odnieść do:
a) rzetelności i trafności metody
b) treści pozycji tworzących test psychologiczny
c) zachowania wybranej, dobrze określonej grupy
d) innych metod testowych

1. steny to:
a) wynik surowy
b) wynik wskazujący na wiek umysłowy
c) inna nazwa centyli
d) znormalizowany wynik standardowy

Jeśli współczynnik rzetelności wynosi 0,8, to znaczy, że:


- zmienna wyjaśnia 80% wariancji, a 20% to błąd

Jaką miarę statystyczną wykorzystujemy do badania rzetelności?


- współczynnik korelacji

Jak na rzetelność testu wpływa homogeniczność badanej grupy?


- ujemnie

Oblicz przedział ufności jeżeli alfa wynosi 0,9.


- przedział ufności = 1 - alfa = 1 - 0,9 = 0,1

Zbuduj standardowy błąd pomiaru, jeżeli zα/2 = 2, a SEM = 0,4.


- błąd pomiaru = zα/2 x SEM = 2 x 0,4 = 0,8

Kiedy wykorzystujemy błąd standardowy różnicy?


- gdy chcemy porównać 2 wyniki ze sobą

Co to jest kontaminacja kryterium?


zanieczyszczenie - wyniki testowe nie mogą wpływać na pozycję jednostki w zakresie
branego pod uwagę kryterium

Jakieś nazwisko mamy zapamiętać Kennet P...

Co to jest symulacja i dysymulacja?


dysymulowania ​ • Jest to świadoma lub nieświadoma tendencja osoby badanej do
przedstawiania się w nieprawdziwie korzystnym świetle
symulowania ​ • Jest to świadome lub nieświadome udzielanie odpowiedzi, bezpodstawnie
przedstawiających osobę badaną w niekorzystnym świetle, np. wskazujących na istnienie
określonych zaburzeń zachowania czy niepożądanych cech osobowości

Jeżeli współczynnik trudności testu wynosi t = 90%, to test jest:


- łatwy (90% osób potrafi na niego odpowiedzieć)

Optymalny współczynnik trudności testu wynosi:


- t=ok.50%

Do analizy różnic międzygrupowych wykorzystujemy:


- test t studenta

Co mierzą korelacyjne współczynniki mocy dyskryminacyjnej?


- korelacje danej pozycji z ogólnym wynikiem w teście

Jakie wartości tych korelacji nas interesują?


- wysokie dodatnie

Czym jest test psychologiczny? - definicja

Pomiar testowy jest pomiarem:


- pośrednim (mierzymy zachowanie - wnioskujemy o konstrukcie)

Prawa osoby badanej:


- ma być poinformowany o tym, że ktoś go ocenia (czynniki motywacyjne)

Prawa badającego:
- ściśle określony zakres dopuszczalnych zachowań

Podział testów wg. kryteriów formalnych

Co to jest obiektywność, standaryzacja, rzetelność, itd.

Na czym polega metoda badania obiektywności "ślepa diagnoza"?

Znać wzór X = T + E - co oznaczają

Dobra rzetelność:
- gdy współczynnik rzetelności wynosi conajmniej 0,8.

Metody badania rzetelności

Czym się kierować ustalając długość przerwy czasowej między testem a retestem?
- żeby zminimalizować skutki zapamiętywania swoich odpowiedzi i zminimalizować efekty
uczenia się nowych rzeczy (optymalny czas - od 2 tyg. do 6 miesięcy)

Jak uczenie się wpływa na wielkość współczynnika rzetelności?


- nie doszacowuje go

Gdy alfa Cronbacha (współczynnik zgodności) jest duża:


- jednowymiarowa struktura testu

Gdy jest mała:


- wielowymiarowa struktura testu

Rodzaje trafności

Do analizy homogeniczności testu (trafność teoretyczna) wykorzystujemy:


alfę Cronbacha - tą samą co przy rzetelności

Podział norm ze względu na grupę odniesienia


- ogólnokrajowe i lokalne

Podział norm ze względu na sposób konstruowania - dokładnie się nauczyć z interpretacją


przedziałów liczbowych

Norma w psychometrii ma charakter:


- statystyczny

Sposoby konstruowania testów

Poza tym trzeba znać dokładnie tą tabelkę o skalach T, stenach, Staninach, itp. - może być
pytanie np. ile % wariancji wyjaśniają wyniki znajdujące się pomiędzy 40 a 60 na skali T,
albo pomiędzy 3 a 7 na skali staninowej (68,26%).

1. Rozkład leptokurtyczny wyników testu zdolności wskazuje, że zawiera on dużo:


a) Wyłącznie pozycji o dużej trudności
b) Wyłącznie pozycji o małej trudności
c) Wyłącznie pozycji o przeciętnej trudności
d) Wyłącznie pozycji o dużej i małej trudności

2. Rozkład platokurtyczny wyników testu wykazuje :


a) Pozycje wykazują zbyt niskie dodatnie skorelowanie
b) Pozycje wykazują zbyt wysokie dodatnie skorelowanie
c) Pozycje wykazują ujemne skorelowanie
d) Pozycje są praktycznie nieskorelowane

3. Rzetelnośc pomiaru testem jest w klasycznej teorii testów determinowana jako:


a) Stosunek wariancji wyników prawdziwych do wyników otrzymanych

4. Zgodnie z klasyczną teorią testów źródłem wariancji prawdziwej są:


a) Wariancje pozycji testowych
b) Kowariancje pozycji testowych
c) Średnia pozycji testowych raczej to
d) Wskaźnik trudności pozycji testowych

5. Zastosowanie wzoru Rulona do oszacowania rzetelności pomiaru testem wymaga


spełnienia założenia
a) o równoległości połówek testowych
b) o równoważności połówek testowych
c) o quasi – równoważności połówek testowych
d) o quasi – trudności połówek testowych

6. Do strategii kulturowej adaptacji testów zaliczamy:


a) Transedukcję
b) Translakację
c) Transportację
d) Translacja

7. Tranwersacja jest metodą adaptacji kulturowej testu, która zakłada,


a) Wierne tłumaczenie pozycji testowych
b) Opracowanie całkiem nowego narzędzia na podstawie oryginalnego testu
c) Swobodne tłumaczenie testu oryginalnego z wprowadzeniem wielu modyfikacji
d) Opracowanie nowego narzędzia opierającego się na oryginalnej teorii

8. W przypadku rekonstrukcji przyjmowane są założenia o kulturowej:


a) ​
Równoważności konstruktu teoretycznego i równoważności pozycji testowych
b) Równoważności konstruktu, ale nie równoważności pozycji testowych
c) Nie równoważności konstruktu ale równoważności pozycji testowych
d) Nie równoważności konstruktu i nie równoważności pozycji tekstowych

9. Metoda badania struktury czynnikowe pozycji jest stosowana do badania


a) Trafności kryterialnej pomiaru testem
b) Trafności teoretycznej pomiaru testem
c) Trafności treściowej pomiaru testem
d) Rzetelności pomiaru testem

10. W celu skonstruowania testu o najwyższej trafności kryterialnej najbardziej


adekwatna jest
a) Strategia wewnętrzna
b) Strategia teoretyczna
c) Strategia zewnętrzna
d) Strategia teoretyczno-indukcyjna
11. Jeżeli wyniki skali badającej tendencję do poszukiwania wrażeń są istotne
statystycznie wyższe u alpinistów niż bibliotekarzy, to świadczy to o jego wysokiej
trafności pomiaru​ :
a) Teoretycznej
b) Treściowej
c) Prognostycznej
d) fasadowej
12. analiza tzw. zmian nieprzypadkowych jest stosowana do oszacowania:
a) trafności fasadowej pomiaru testu
b) trafności teoretycznej pomiaru testu
c) trafności treściowej pomiaru testu
d) rzetelności pomiaru testem

Jednym ze sposobów określenia trafności diagnostycznej pewnego testu jest:


- zbadanie korelacji tego testu z innym testem badającym tę samą ceche

Jaki sposób szacowania trafności teoretycznej dotyczy liczby wymiarow opisujących dane
zjawisko psychologiczne?
- analiza struktury czynnikowej testu

Wyobraz sobie, ze w tescie wiadomości który wlasnie rozwiązujesz znajduja się jedynie
pytania dotyczące trafności. Taki test ma NIEwystarczajaca trafność:
- tresciową

Krzywa charakterystyczna pozycji, która jest wyjatkowo stroma:


- obrazuje taka pozycje testowa która dobrze roznicuje badanych.

Które z poniższych pojec odnosi się dop korelacji pomiedzy dana pozycja testowa a
ogolnym wynikiem testu?
- moc dyskryminacyjna

Tesu Test psychologiczny:


-sklada się z pozycji testowych, sposobu ich wykorzystania i regul obliczania
wynikow.

W strategii zewnętrznej tworzenia kwestionariuszy kryterium danej cechy może Stanowic:


- inna zmienna zewnetrzna względem tworzonego kwestionariusza

Standaryzacja testu oznacza:


- jednolitość warunkow i instrukcji badania a także pomocy testowych i zasad
oblicznia wynikow.
Czy w indywidualnej diagnozie testowej zawsze konieczne jest wyznaczanie przedzialu
ufności dla wyniku prawdziwego?
- tak, zawsze

Błąd systematyczny:
- nie ma nic wspolnego z mierzona cecha psych. I wynika ze stalych cech narzędzia.
Pozycje testowe w narzędziu o wysokiej rzetelności szacowanej na podstawie zgodności
wewnętrznej sa:
- skorelowane ze soba

Rzetelność testu to:


- stopien dokładności, z jaka określony test dokonuje pomiaru

Metoda test- retest szacowania rzetelności polega na:


- dwukrotnym badaniu tym samym testem tej samej grupy osob

Szacowanie rzetelności na podstawie zgodności wewnętrznej polega na:


- określaniu zgodności odpowiedzi na wszystkie pozycje testowe w danym tescie.

Jaki sposób szacowania rzetelności testu rozwiazuje problem zapamietywania przez


badanych swoich odpowiedzi z poprzednich badan?
- formy rownolegle

Im wieksza rzetelności testu tym szerokość przedzialu ufności obliczonego dla dowodlnego
wyniku otrzymanego:
- jest mniejsza

Zaleta metody połówkowej w porównaniu z innymi metodami szacowania rzetelności jest:


- wieksza ekonomiczność gdyz wystarczy tu pojedyncze badania jednym testem
podzielonym na dwie czesci

W której z poniższych sytuacji info o trafności prognostycznej testu jest szczególnie istotna?
- przewidywanie powodzenia kandydatow w przyszłej pracy.

Jaki sposób szacowania trafności teoretycznej dotyczy liczby wymiarow opisujących dane
zjawisko psychologiczne?
- analiza struktury czynnikowej testu
Wyobraz sobie, ze w tescie wiadomości który wlasnie rozwiązujesz znajduja się jedynie
pytania dotyczące trafności. Taki test ma NIEwystarczajaca trafność:
-​tresciową

Jeżeli wyniki uzyskane na podst. Jednego testu pozostaja w silnym związku z wynikami
uzyskanymi w innym tescie przeznaczonym do pomiaru podobnej cechy, wówczas można
przypuszczac ze test ma wysoka:
- trafność zbiezna

Jakie własności ma rozklad standardowy z?


- jest to rozklad normalny o średniej 0 i odchyleniu standardowym 1.

Stronniczość testow psych.:


- oznacza ze grupy wyodrebione ze względu na pochodzenie społeczne roznia się miedzy
soba ze względu na przeciętne wyniki otrzymane w danym tescie, podczas gdy przeciętne
wyniki prawdziwe tych grup nie roznia się ????

Wykonales pewien test inteligencji, a Twój wynik wyniosl 43 punkty. Liczba ta nie ma
zadnego znaczenia bez znajomości:
- standardu statystycznego, czyli normy​.

Skala stenowa sklada się z:


- 10 jednostek (stenow)

Średni wynik wyrażony w skali stenowej pewnego testu inteligencji jest:


- jest taki sam dla populacji Polaków i Niemców

Normy empiryczne:
- ukazuja pozycje jednostki w probie normalizacyjnek i pozwalaja na ocene jej
wynikow z innymi osobami

Rezultat IQ= 115 oznacza, że:


- Jest to wynik o jedno odchylenie stand. Lepszy od wyniku średniego.

W diagnozie indywidualnej konieczne jest:


- wyrażenie wyniku OB. Odwołując się do aktualnych norma dla określonej populacji.

W którym odchyleniu standardowym znajduje się wynik rowny 3 stenowi?


- w drugim poniżej średniej

Test mocy to:


- test składający się z pozycji o rosnącej trudnosci; często bez ograniczenia
czasowego.

Krzywa charakterystyczna pozycji, która jest wyjatkowo stroma:


- obrazuje taka pozycje testowa która dobrze roznicuje badanych.

Które z poniższych pojec odnosi się dop korelacji pomiedzy dana pozycja testowa a
ogolnym wynikiem testu?
- moc dyskryminacyjna

Przekonanie badanych na temat tego co test mierzy to:


- trafność fasadowa

Czy w Polsce osoba nie bedaca psychologiem może stosowac testy psych.?
- nie

Trafność testu to:


- Stopien w jakim test jest zdolny miezryc to co w zalozeniu miał mierzyc.
Test psychologiczny:
-sklada się z pozycji testowych, sposobu ich wykorzystania i regul obliczania
wynikow.

W strategii zewnętrznej tworzenia kwestionariuszy kryterium danej cechy może Stanowic:


- inna zmienna zewnetrzna względem tworzonego kwestionariusza

Standaryzacja testu oznacza:


- jednolitość warunkow i instrukcji badania a także pomocy testowych i zasad
oblicznia wynikow.

Każdy test psych. Daje:


- oszacowanie wyniku prawdziwego określone z pewnym prawdopodobieństwem.

Czy w indywidualnej diagnozie testowej zawsze konieczne jest wyznaczanie przedzialu


ufności dla wyniku prawdziwego?
- tak, zawsze

Błąd losowy:
- wpływa na rzetelność narzędzia

Duza wartość standardowego bledu pomiaru SEM wskazuje na:


- niska rzetelność testu

Jedno z założeń klasycznej teorii testow mowi o nieskorelowaniu Bledu pomiaru i wyniku
prawdziwego. Oznacza to ze:
- mierzac rozne wartości danej cechy nie można określić wielkości Bledu

Jaki jest związek miedzy rzetelnością testu a jego trafnością?


- test trafny jest zawsze rzetelny, ale test rzetelny nie zawsze jest trafny

Co to jest „wynik prawdziwy” testu?


- srednia rozkładu nieskończonej liczby pomiarow jednej osoby wykonanych przy
uzyciu tego samego testu

Szacowanie rzetelności na podstawie zgodności wewnętrznej polega na:


- określaniu zgodności odpowiedzi na wszystkie pozycje testowe w danym tescie.

Im wieksza rzetelności testu tym szerokość przedzialu ufności obliczonego dla dowodlnego
wyniku otrzymanego:
- jest mniejsza

Zaleta metody połówkowej w porównaniu z innymi metodami szacowania rzetelności jest:


- wieksza ekonomiczność gdyz wystarczy tu pojedyncze badania jednym testem
podzielonym na dwie czesci
Który z poniżej wymienionych testow obciążony jest najmniejszym Bledem pomiaru w
zalozeniu ze wariancje wynikow [prawdziwych i otrzymanych sa jednakowe we wszystkich
przypadkach?
- test o rzetelności 0.93.??? ​
nie wiem jakie są inne warianty.

·​ ​Test psychologiczny to:


-​ ​narzedzie składające się z pozycji testowych, sposobu ich wykorzystania i reguł
obliczania wynikow.
·​ ​Każdy dobry test psychologiczny powinien cechowac się:
– wysoka rzetelnością, trafnością i aktualnymi normami

Celem standaryzacji procedury testowania jest:


- możliwość porównywania wynikow roznych osob

Czy w indywidualnej diagnozie testowej zawsze konieczne jest wyznaczanie przedzilau


ufności dla wyniku prawdziwego?
- tak zawsze

Pozycje testowe w narzędziu o niskiej rzetelności szacowanej na podstawie zgodności


wewnętrznej sa:
- slabo ze soba skorelowane

Bład systematyczny:
- ma stala wartość dla roznych osob badanych

Wysoka wartość Bledu losowego pomiaru zawsze zwiazana jest z:


- niska rzetelnością tego testu

Standardowy bład pomiaru to:


- bład który popełniamy wtedy, gdy zakladamy ze prawdziwym wynikiem osoby
badanej jest sredni wynik nieskończonej liczby pomiarow

Po co użytkownikowi testu potrzebne sa informacje o jego rzetelnosci?


- aby zorientowac się jak dokładny jest pomiar wykonany tym testem

Jeżeli test jest trafny to wynika stad, ze jest również:


- rzetelny

Wedlug klasycznej teorii testow srednia arytmetyczna bledow pomiaru nieskończenie


wielkiej liczby pomiarow wynosi 0. Oznacza to, ze:
-??? – Nie wiem
w klasycznej teorii testów badacz powinien zakładać, że błąd pomiaru ma średnią zero i

rozkład normalny i ​zależy jedynie od błędu losowego

Wynik prawdziwy to:


- wynik obciążony bledem pomiaru.
Wynik otrzymany:
- to wg, klasycznej teorii testow suma wyniku prawdziwego i Bledu pomiaru

W trakcie opracowywania psychometrycznego kwestionariusza objawowo nerwicowych


przeprowadzono badanie w którym jego uczestnicy dwukrotnie w odstępie sześciu miesięcy
wypelniali opracowany kwestionariusz. W ten sposób określono:
- stabilność bezwgledna kwestionariusza

Metoda testow równoległych szacowania rzetelności polega na:


- opracowaniu dwoch wersji tego samego narzędzia mierzacych te sama ceche w ten
sam sposób, ale z zastosowaniem innej tresci pozycji testowych.

W jakiego typu analizie stosowany jest wzor α- Cronbacha?


- oszacowanie zgodności wewnętrznej à ​bo​​określaja spójność pozycji wchodzących w
skład danej skali

Metoda polowkowa pozwala na ocene:


- rzetelnosci testu
·​ ​Po co oblicza się przedzial ufności?
- gdyz każdy wynik testowy jest obciążony błędem
·​ ​Im wyzsza wartość wskaźnika rzetelności:
- tym wyzsza rzetelność

·​ ​Psycholog bioracy udzial w procesie rekrutacji do pracy w policji na stanowisko


detektywa jest zainteresowany tym aby wybrac kandydatow, którzy najlepiej poradza
sobie na tym stanowisku pracy. Jedna z metod Selekcji jest kwestionariusz psych. Jaki
rodzaj trafności będzie w tym przypadku najważniejszy dla psychologa?
- trafność prognostyczna

1) Normy są to wyniki przeliczone pozwalające określić natężenie cechy u badanej


osoby w odniesieniu do natężenia typowego dla:
a) próby, z której pochodzi badana osoba
b) próby, z której pochodzą inne badane osoby
c) populacji, z której pochodzi badana osoba
d) żadna z powyższych odpowiedzi nie jest prawidłowa

2) „Procedura wiązania terminów teoretycznych (dotyczących własności


nieobserwowalnych) z terminami obserwacyjnymi” - jest to definicja:
a) pomiaru według klasycznej teorii testu
b) pomiaru według teorii odpowiedzi na pytania testowe
c) operacjonalizacji
d) diagnozy

3) Badanie aspektu zbieżnego i różnicowego jest metodą określania trafności:


a) diagnostycznej
b) teoretycznej
c) prognostycznej
d) treściowej

4) Skala stenowa ma:


a) średnią 5 i odchylenie standardowe 2
b) średnią 5,5 i odchylenie standardowe 2
c) średnią 5 i odchylenie standardowe 1
d) średnią 5,5 i odchylenie standardowe 1

5) Sten pierwszy w skali stenowej to wyniki mieszczące się:


a) pół odchylenia standardowego poniżej średniej
b) jedno odchylenie standardowe poniżej średniej
c) dwa odchylenia standardowe poniżej średniej
d) trzy odchylenia standardowe poniżej średniej

sten pierwszy jest mieści się od -4 do -2.


SD = 2 więc dwa odchylenia mieszczą się właśnie od -2 do -4

6) „Dokładność, z jaką mogą być przeprowadzane sensowne i istotne pomiary, w tym


znaczeniu, że dokonywane pomiary dotyczą rzeczywiście cech, które chciano mierzyć” - jest
to definicja:
a) rzetelności
b) trafności
c) dokładności
d) mocy dyskryminacyjnej

7) W psychometrii, „normalne” znaczy tyle co:


a) zdrowe, niezaburzone, niekliniczne
b) przeciętne, typowe, najczęstsze
c) pożądane, zalecane, poszukiwane
d) idealne, wartościowe, doskonałe

8) Tłumaczenie, w którym tłumacz zobowiązany jest zadbać o odpowiedniość zarówno


pomiędzy morfemami, jak i strukturami gramatycznymi, zwiemy tłumaczeniem:
a) pragmatycznym
b) estetycznym
c) etnograficznym
d) lingwistycznym

9) Wskaźnik „alfa Cronbacha” nadaje się do badania testów, w których odpowiedzi dokonuje
się:
a) tylko na skali dychotomicznej Tak - Nie
b) tylko na skali porządkowej z najmniej pięcioma kategoriami
c) zarówno na skali dychotomicznej, jak i porządkowej z co najmniej pięcioma kategoriami
d) zarówno na skali dychotomicznej, jak i porządkowej z dowolną liczbą kategorii

10) Metodą adaptacji testu, którą cechuje największa możliwa wierność oryginałowi, jest
a) transkrypcja
b) translacja
c) trawestacja
d) rekonstrukcja

11) Wynik w granicach 85-115 w dewiacyjnym ilorazie inteligencji uzyskuje około:


a) 68% populacji
b) 95% populacji
c) 98% populacji
d) 99% populacji

12) Rzetelność testu jest to stosunek:


a) wariancji prawdziwej do wariancji ogólnej
b) wariancji otrzymanej do wariancji ogólnej
c) wariancji prawdziwej do wariancji otrzymanej
d) wariancji otrzymanej do wariancji prawdziwej

13) W teorii odpowiedzi na pozycje testu, parametr theta dotyczy:


a) prawdopodobieństwa określonej odpowiedzi
b) natężenia cechy
c) trudności pozycji testowej
d) losowości odpowiedzi

14) Które z poniższych stwierdzeń jest prawdziwe?


a) Trafność kryterialna dzieli się na diagnostyczną i prognostyczną
b) Trafność treściowa dzieli się na teoretyczną i kryterialną
c) Trafność prognostyczna dzieli się na kryterialną i diagnostyczną
d) Trafność teoretyczna dzieli się na kryterialną i treściową

15) Analiza różnic międzygrupowych, zastosowana do badania trafności, służy do określania


trafności:
a) treściowej
b) teoretycznej
c) związanej ze zmianami nie przypadkowymi testu
d) jeszcze innej

1. Kto ustala narzędzia pomiarów wg ustawy


-​
Ustawa o zawodzie psychologa i samorządzie zawodowym psychologa​​s.220 Hornowska

2. Diagnoza nomotetyczna / idiograficzna


Przedmiot pomiaru psychologicznego
• Podejście nomotetyczne do kultur (uniwersalistyczne – etic approach)
• Podejście idiograraficzne do kultur (specyficzne – emic approach)

Podejście nomotetyczne
• Do porównywania wpływu kultury potrzebne są pojęcia ogólne, będące aproksymacją pojęć
specyficznych, lecz oparte na wspólnym układzie odniesienia
• Uzasadnione są takie działania, jak:
- adaptacja narzędzi diagnostycznych, przenoszonych z innej kultury wraz z zapleczem teoretycznym i
literaturowym,
- przyswajanie teorii psychologicznych (o których się apriorycznie zakłada, iż są na tyle ogólne, że trafne są w
każdych warunkach społeczno-kulturowych),
- stosowanie „podkulturowych” technik terapeutycznych, itd.
Podejście idiograficzne
• Analizy wpływów kultury należy dokonywać bazując na pojęciach wypracowanych przez daną społeczność,
gdyż kultura jest integralną częścią ludzkich zachowań
• Uznaje się istnienie specyficznych kulturowo czynników etiologicznych, czynników (kultur)
immunizujących członków danej społeczności przeciwko zaburzeniom psychicznym lub im
sprzyjających
• Wiąże się to także z przekonaniem o kulturowo specyficznych rodzajach osobowości, uzdolnień,
rodzajach zaburzeń i/lub specyficznych ich manifestacji, ich terapii;
• Wiąże się z niezgodą na implantację obcych (kulturowo) narzędzi diagnostycznych, teorii, systemów
klasyfikacji zaburzeń itp.

3. Student uczył się tylko 3 wykładu z psychometrii a tego nie było na egzaminie. Odczuwa
teraz: trafność treściowa...stronniczość pytań. ​raczej nie stronniczość pytań

wydaje mi się że chodzi tu o błąd losowy -> konstrukcja testu


s.42 Hornowska

4. Do korelacji czego używamy: w Kendalla.. też ​pearsona i spearmana ale nie wiem gdzie
przykleić to pytanie

4. Jeśli zwiększymy ilość pytań to rzetelność : zwiększy się​ s. 60 H

5. Co to jest rzetelność pomiaru ​ - r​zetelność oznacza zgodność wyników otrzymanych


przez te same osoby, które zostały przebadane kilka razy tym samym testem

6. Co to błąd standardowy pomiaru… ​wiem co to systematyczny i losowy

7. Jakie są prawidłowe nazwy: zewnętrzna (kryterialna) wewnętrzna (indukcyjna)

8.Co to jest moc dyskryminacyjna -​​współczynnik mocy dyskryminacyjnej​​to stopień, w jaki


pozycja testowa różnicuje daną populacje. Moc dyskryminacyjna pozycji w teście jest miarą, dzięki
której możemy określić jak dana zmienna, zadanie, pytanie wpływa na ogólny wynik mierzonej przez
narzędzie cechy czy umiejętności. Miara ta pozwala odpowiedzieć, czy i na ile wyższa wartość dla
danej pozycji jest związana z wyższym poziomem ogólnego wskaźnika danej skali (w skład której
wchodzi dana pozycja).

9. Co to jest analiza czynnikowa​- C


​ elem analizy czynnikowej jest zredukowanie dużej
liczby zmiennych losowych do mniejszego zbioru, Założenie - grupy zmiennych losowych
reprezentują zmienność tych samych czynników, czyli zmienne losowe w danej grupie są od
siebie w pewnym stopniu zależne.

10. Co to jest format odpowiedzi

11. Jaka trudność pytań w mocy dyskryminacyjnej ​- W


​ praktyce - średnia trudność testu
powinna oscylować wokół 50%. Jeśli test ma służyć do celów selekcyjnych - trudność
powinna być dostosowana do pożądanego współczynnika selekcji

12. Co to jest trafność treściowa ​


- ​TREŚCIOWA (inaczej wewnętrzna, logiczna; content validity)
Ocena (na podstawie pomiaru testowego) całokształtu zachowań, których próbkę pobiera test n​p.
ocena wiadomości z matematyki na przykładzie konkretnego zadania

13. Metoda wielu cech wielu metod ​zbieżna i różnicowa


Analiza macierzy korelacji Macierz Wielu Cech – Wielu Metod
Pomiar kilku cech przy użyciu kilku kwestionariuszy.
A​spekt zbieżny i różnicowy trafności: ​ZBIEŻNY (konwergencyjny) - gdy można wykazać wysoką korelację
z innymi testami, mierzącymi podobne cechy R
​ ÓŻNICOWY (dywergencyjny) - gdy można wykazać niską
korelację z innymi testami, mierzącymi inne cechy

14. Aprobatę społeczną można traktować jako styl LUB cechę osobowościową

15. Wartości ważne dla stenów:​M = 5,5, SD = 2

16. Wartości dla tetronów:​M = 10, SD = 4

17. Co to jest błąd bliskości - ?błąd szacowania?

18. Najlepszy najbardziej dokładny test będzie miał badacz co przyjmie


prawdopodobieństwo 0,1 ; 0,5; 0,15, ;​
0,01​ (niby zaznacza się najniższy wynik ale nie wiem)

w klasycznej teorii testów badacz powinien zakładać, że błąd pomiaru ma średnią zero i
rozkład normalny i zależy jedynie od błędu losowego s.44

19. Były podane dwie rzetelność jedna 0,5 druga 0,8 ile razy więcej trzeba dać pytań aby
wzrosła rzetelność : dwukrotnie, pięciokrotnie
s.61
1.​ ​Który test ma coraz trudniejsze zadania ? ​mocy: ​nieograniczony czas i zadania coraz
trudniejsze. W teście mocy czas jest ograniczony a zadania średnie, zadań jest dużo i nikt
nie kończy rozwiązywać go przed upływem czasu.

2.​ ​Co to są normy lokalne? wytłumaczone na stronie 133


klasa -> budynek -> system (klasa i budynek są bardziej lokalne niż system)

3.​ ​50 na skali T to ile na skali staniowej? Odp. 5

4.​ ​Jeśli zbadali metoda połowkową a chca dowiedziec się więcej to czym badać: odp. alfa
Cronbacha i richardsona

5.​​Jak rtt= 0,8 to jaki współczynnik rzetelności –​wysoki

6.​​Jeśli korelacja między wynikiem prawdziwym a testowym dla danego testu określono jako
rttt=0,81 - współczynnik rzetelności tego testu wynosi 0,81

7.​ ​przedział ufności : musi być szerszy im chcemy mieć większą pewność

Co to jest walidacja. Określenie trafności danego testu - O


​ kreślanie trafności danego testu.
Zbieranie i ocena danych świadczących o trafności określonej interpretacji wyników testu. Im więcej
przeprowadzonych danych, tym szerszy potencjał zastosowania testu

8.​ ​Trafność diagnostyczna i prognostyczna - ​w trafności kryterialnej

9.​ ​Sposoby badania trafności teoretycznej - ​różnice międzygrupowe

10.​​Która z wymienionych jest skalą rangową ? odp centylowa

11.​​ZBIEŻNY (konwergencyjny) - gdy można wykazać wysoką korelację z innymi testami,


mierzącymi podobne cechy

12.​​Współczynnik trudności :jedna odpowiedź poprawna chyba z 4 możliwych, 70% dobrych


odpowiedzi to jaki poziom trudności? ​60%

13.​​Najbardziej dokładne przetłumaczenie testu: transkrypcja

14.​​Co to znaczy czy rAZ=rBZ ​


testy są równoległe

1. Steny to wyniki standardowe wyrażone na skali


a​
)​M=5 SD=2
b) M=5 SD=4
c) M=5,5 SD=2
d) M=5,5 SD=4
2. jednym z kryteriów formalnych branym przy tworzeniu testu jest współczynnik trudności poszczególnych
pozycji testowych. Jeżeli chcemy zastosować test ​ do selekcji kandydatów​uwzględniając ​ określony punkt
odcięcia​to powinniśmy wybrać taki test, który składa się z pozycji testowych, których współczynnik trudności
wynosi:
a) 0,6
b) mieści się w zakresie 0-100%
c) jego średnia wartość wynosi 50%
d) ​
jest równy wyznaczonemu punktowi selekcji

jeszcze było pytanie takie samo jak to, tylko “​ ” ​​


jeśli chcemy zróżnicowania dużego​ odp. :​największe
zróżnicowanie jest przy 50%.

Prezentacja: W praktyce - średnia trudność testu powinna oscylować wokół 50%. Jeśli test ma służyć do celów selekcyjnych
- trudność powinna być dostosowana do pożądanego współczynnika selekcji

3. jedyny, z kryteriów normalnych, branych pod uwagę przy tworzeniu testu jest współczynnik trudności poszczególnych pozycji
testowych. Jeżeli tworzymy test dla celów selekcji i mamy dużo kandydatów, a możemy przyjąć najwyżej 10% to większość
pozycji testowych z tego testu powinna być:
a) raczej trudnych
b) raczej łatwych
c) raczej o przeciętnej trudności
d) raczej o wysokim współczynniku rzetelności niż trafności

4. Tworzymy test, na potrzebę organizacji, by zbadać jakie osoby są najlepsze. Tylko wewnątrz organizacji.
Jakiego typu normy będą
- norma organizacyjna
- norma lokalna
-​norma globalna
- norma instytucjonalna

Normy są tylko ogólnokrajowe i lokalne s.133

5. Pytanie o prawidłowy(?) wskaźnik rzetelności:


a) 0,6
b) 0,7
c) 0,8
d) 0,9

każdy z nich jest prawidłowy chociaż w testach psychologicznych wynik oscyluje w granicach 0,8

6. Ktoś otrzymał w teście wynik 12. Przedział ufności 90 miał wynik 6, przedział inny miał wynik 8; a przedział 95
miał wynik 4 (czy cos takiego) i w jakim przedziale mieści się osoba, gdy p=0,05
a) (6; 8)
b) ​
(8,16)
c) 10, 14
d) 12; 12

7) im większa homogeniczność grupy tym:


a) rzetelność wzrasta
B) rzetelność maleje
C) cos o trafności
D) nie ma związku
im bardziej homogeniczna – pod względem mierzonej cechy- grupa, tym mniejszy będzie otrzymany przez nas
współczynnik rzetelności testu .62

8. Chcemy zbadać dzieci wybitnie inteligentne, by przydzielić je do różnych zajęć dodatkowych, Jakie powinny
być pytania?
a) Bardzo trudnych zadań
b) bardzo łatwe
c) Trochę łatwych trochę trudnych
d) Trudność pytań nie ma znaczenia

9. Badanie naukowe (test naukowy) to:


a). wskaźniki mówiące o charakterystykach (coś takiego)

10. Pytanie o etikalne


Etikalne=uniwersalne kulturowo -> tylko takie zachowania wchodzą do finalnego etapu adaptacji testu

11. Która odpowiedź jest prawdziwa: Wynik prawdziwy


a) koreluje z błędem
b) nie koreluje z wynikiem obserwowanym
c) wynik prawdziwy nie koreluje z błędem
d) że wynik prawdziwy zależy od błędu

błąd pomiaru nie ma nic wspólnego z mierzoną cechą psychologiczną ale wpływa na wynik testowania
(prezentacja)

12. coś o nadawanie znaczenia wynikom testowym…


a) operacjonalizacja
b) rzetelność
c) trafnosc
d) normalizacja

Normalizacja - nadawanie znaczenia wynikom testowym

13. Uzupełniana o tym przewidywaniu wyników ? Jaka to trafność ? ​


(nie wiem co to za pytanie)
a) diagnostyczna
b) prognostyczna
c) treściowa
d) teoretyczną
Trafność diagnostyczna​ - w jakim stopniu test diagnozuje poziom określonej cechy występujący u
danej jednostki
Trafność prognostyczna ​- w jakim stopniu test przewiduje zachowanie jednostki w sytuacji poza
testowej
Trafność treściową - ​zwaną też trafnością wewnętrzną - określana jest poprzez stwierdzenie, czy
test jako całość ujawnia takie zachowanie osoby badanej, które będzie zgodne z tą cechą, którą
objęto badaniami.
Trafność teoretyczną ​- czy dany test został zredagowany zgodnie z daną teorią psychologiczną,
która legła u podstaw jego tworzenia
14​​Na skali … dane zawarte między 6-14 zawierają się w przedziale: (TO BĘDZIE ZALEŻEĆ OD SKALI,
6SIGMA: albo 66%, albo 95% albo 99,99%)
a) 68%
b) 85
c) 95

15. Międzygrupowa korelacja to trafność


a) tresciowa
b) teorytyczna
c) krytyczna

16. Alfa cronbacha do


a) rzetelności
b) trafności
c) jedno i drugie

17) Pytanie o rzetelność, ktore ​


nie dotyczy​
:
a) stabilność względna
b) stabilność bezwzględna
c) międzypołówkowe cos tam
d) cos tam wynikow prawdziwych

estymacja stabilności względnej i bezwzględnej; analiza równoważności między połówkowej - to dotyczy


rzetelności

18. Miara czego jest (czy o czym mówi) dewiacyjny iloraz inteligencji:
a) odchylenia standardowego
b) wyniku surowego.
c) niedorozwój umysłowy

Dewiacyjny iloraz inteligencji (standaryzowany) jest wskaźnikiem pokazującym w jednostkach odchylenia


standardowego, w jakim stopniu pozostaje wynik osiągnięty przez daną osobę do przeciętnego rozkładu
wyników dla jej wieku.

18. Jeśli chcemy zmierzyć wyniki skrajne (największy rozstrzał wyników to używamy )
a) T
b) staniny
c) steny
d) Tetrony

19. Pytanie o błąd systematyczny w stosunku do rzetelności, czy jest:


a) istotny
b) nieistotny
c) to zależy od celu testowania (czy coś takiego)

wynik w teście zawsze jest obarczony pewnym błędem. W różnych sytuacjach testowania w taki sam sposób wpływa na
wyniki testowania. Czyli wpływa na rzetelność ale nie jest istotne bo nie nie ma nic wspólnego z mierzoną cechą
psychologiczną.

20​. Które zdanie jest nieprawdziwe o centylach


a) różnicują na końcach rozkładu s.148
b) nie porównuje wyników surowych
21. Które zdanie jest nieprawdziwe o normach
a) dobry wynik

nie jest „dobry” tylko typowy

23. O czym mówi parafraza- jako narzędzie adaptacji


a) swobodne tłumaczenie .... jako narzędzie adaptacji
b) maksymalne wierne tłumaczenie
c) konieczność opracowania narzędzia, które wzoruje sie na wersji pierwotnej

Parafraza - Konieczność opracowania nowego narzędzia od fazy analizy teorii i generowania pozycji, aż po
analizę psychometryczną danych - test oryginalny jest jedynie inspiracją adaptacji. Celem adaptacji jest
maksymalne wierne oddanie intencji autora odnośnie treści konstruktu psychologicznego (rola teorii
psychologicznej). Zakłada się, że konstrukty psychologiczne są uniwersalne kulturowo, ale z reguły nie są
uniwersalne zachowania (tylko część z nich ma charakter etikalny, tj. równoważny kulturowo i tylko te mogą
wejść do finalnej wersji adaptacji).

24. test afektywny


a) brak dobrej odpowiedzi

Testy właściwości afektywnych: bada czucia, postawy, osobowość, emocje, wierzenia itd.
Brak odpowiedzi obiektywnie prawidłowej

25. Jak konstruować pytania o szczerość, czyli o APROBATĘ społeczną:


a) dać pozycje neutralne
b) w trakcie badania kwestionariuszem (to trochę też pasuje ale instrukcje jednak tworzy się wcześniej więc jeśli
miałabym wybrać to zaznaczyłabym D)
c) w trakcie tworzenia kwestionariusza

Na etapie konstrukcji kwestionariusza:


• Pozycje neutralne
• Pozycje subtelne pod względem trafności fasadowej
• Specjalne formułowanie językowe pozycji
• Wprowadzanie odpowiedniej instrukcji
• Analiza korelacji pozycji ze skalami mierzącymi aprobatę społeczną
Na etapie stosowania kwestionariusza:
• Wprowadzanie odpowiedniej instrukcji, tzw. instrukcja "szczerości"
• Skala kontrolna aprobaty społecznej (odrzucanie respondentów o wysokich wynikach lub
korygowanie wyników skal treściowych przez doliczanie tzw. poprawek korekcyjnych

26. Kontaminacja kryterium pojawia się najczęściej, gdy:


a) test ma niską rzetelność
b) badający ma dostęp do wyników

kiedy znajomość wyników jakie osoba badana uzyskała w teście może wpływać na ocenę wyniku tej osoby względem
analizowanej zmiennej kryterialnej s. 91 Hornowska

27. Coś o wartości 55 centyli


a) że świadczy o 55% wyniku i wyższym… nie pamiętam dokładnie
b)45%
c) uzyskali wynik 55 bądź mniejszy

28. w metodzie testów równoległych w odróżnieniu od metody test-retest minimalizowany jest


wpływ(albo coś w tym stylu)
a)
b) ​
pamięci i uczenia się
c)
d)

29) moc dyskryminacyjna


a) ​
jak dobrze rónicuje populacje
b) różnicuje wynik testu na poziomie mierzonej cechy

30) Style odpowiadania


a)​odpowiada niezależnie od treści pytań

31) Standaryzacja
a) ​
posiada podrecznik
b) jednolitość przeprowadzania procedury badania NIE BYŁO TAKIEJ ODP (​
było coś o jednolitym
stosowaniu testu wobec wszystkich badanych ale to zle) - dlaczego?
dlaczego jednolite stosowanie wobec kazdej osoby badanej to zlaodp??
bo Standaryzacja procedury badania
testem :Stosując test należy dokładnie
przestrzegać wszystkich zasad
i procedur opisanych w podręczniku
a do czego by było to jednolite stosowanie?

32) Standaryzacja
a​
) polegającą na tworzeniu standardowych warunków stosowania testu

33) Standaryzacja
b) jednoliotość

34) Analiza macierzy korelacji


a)​trafność teoretyczna

35) Procedura nadawania znaczenia empirycznego konstruktom teoretycznym


a) operacjonalizacja

36) Zgodnie z klasyczna koncepcja wyniku prawdziwego, wynik otrzymany:


a) jest wiekszy od wariancji bledu to​
?​bo wariancja wyniku otrzymanego = wariancja wyniku
prawdziwego + wariancja bledu, wiec logicznie otrzymany jest wiekszy od samego bledu?​A to nie tak ze
prawdziwy powinien być większy od błędu (który powinien być najmniejszy) ? Niezbyt mi to jako pasuje, bo to tak jakby
definiować pojęcie innym pojęciem do zdefiniowania. Ja bym dała któraś odp z tych innych
b) jest oszacowaniem czegos tam- wyniku prawdziwego…?

`PSYCHOMETRIA jpdl więcej pytań nie było? 90% się powtarza


PYTANIA YOLO

Która z metod pozwala na największe zmiany w adaptacji ?f


Rekonstrukcja

Gdy zalezy nam na motywacji osoby badanej do rozwiązywania testow, to wazna jest?
Trafność fasadowa

40% cen
tyle?
"40% osob ma gorsze wyniki od tej osoby, ktora otrzymała wynik rowny 40 centylowi"

1. Wskaźnik mocy dyskryminacyjnej


Wysokie, dodatnie

1. Moc dyskryminacyjna?
Korelacja miedzy wynikiem pozycji testowej a wynikiem całego testu.

1. X=T+E
Zmniejszyć E

1. Które w standaryzacji stwierdzenie jest mniej istotne?

Dwie odp. Prawa autorskie, Wpadnie w rece niepsychologow

1. Standaryzacja
Jednolitość

1. Niski współczynnik korelacji miedzy testami A I B ( rownolegle)


( badanie po odstępie czasu)
Wysoka specyficzność pozycji testowych

1. Normy lokalne
Ścisle określone grupy ludzi

1. Normy
Zachowania typowe

Rzetelność ? czemu? ktoś wyjaśni?


a nie powinien tu byc przedzial ufnosci dla bledu standardowego?

16.Porównanie dwoch ludzi, aby wybrac lepszego to:


Standardowy bład roznicy (minimalny)

17. Odniesienie pozycji testu do uniwersum?


Trafność tresciowa

18. Gdzie najwieksza jest trafność?


Odp. Test z historii

20. Test – retest (wada)


Zapamiętywanie

21. Błąd we wzorze X=T+E


Losowy

22. Co nie jest w definicji testu ?


Odp. Wystandaryzowana skala ze średnią 100

23. Współ. Trudności testu ( gdy chcemy zastosować test do SELEKCJI)


Odp. Jest równy wyznaczonemu punktowi selekcji.

24 Trafność teoretyczna jak jest weryfikowana?

Hipotezy weryfikowane za pomocą teorii stojącej za testem

1. która z poniższych definicji jest pełną i wyczerpującą definicją testu psychologicznego?


a) jest to obiektywny i standaryzowany pomiar próbki zachowaniaja bym dala to ja tez
b) jest to kontrolowana ilościowa obserwacja zachowania
c) jest to pomiar próbki zachowania wybranej grupy ludzi
d) jest to standaryzowany zbiór bodźców dla mierzalnych reakcji -SERIO TO?
1. trafność fasadowa powinna być brana pod uwagę w przypadku testu, gdyż:
a) stanowi podstawę statystycznego doboru pozycji
b) jest częścią składową każdego rodzaju trafności
c) jest dowodem, że test mierzy to, co zmierzył jego autor
d) zapewnia zgodność wyglądu testu czym.... sądzi osoba badana
1. wyniki standardowe to
a) wyniki uzyskane w standardowych warunkach
b) wyniki wyrażone w terminach odchylenia standardowego zdecydowanie to
c) wyniki wyrażone w terminach obiektywnego standardu
d) wyniki uzyskane za pomocą wystandaryzowanego narzędzia
1. pojęcie normy w teście odnosi się do:
a) wykonania idealnego
b) wykonania maksymalnego
c) wykonania oczekiwanego
d) wykonania typowego

1. wysoki wspólczynnik korelaccji pomiędzy dwoma testami równoległymi stosowanymi


jeden po drugim, bez przerwy czasowej, świadczy o:
a) funkcjonalnej mierzonej zmiennej w czasie
b) niskiej homogeniczności wysokiej specyficzności pozycji testowych
c) niskiej specyficzności i wysokiej homogeniczności pozycji testowych
1. w metodzie testów równoległych, w odróżnieniu od metody test-retes minimalizowany jest
wpływ:
a) pamięci i efektów uczenia się
b) braku stałości zmiennej
c) heterogeniczności zmiennej
d) szybkości rozwiązania zadań
1. otrzymanie różnych współczynników trafności kryterialnej dla danego testu jest
najczęściej spowodowany:
a) faktem wybrania różnych zmiennych kryterialnych -to??????????????
b) błędami w obliczeniach
c) niską rzetelnością testu
d) trudnościami w diagnozowaniu zachowania mierzonego przez test

1. błąd standardowy różnicy jest to:


a) różnica 2 błędów standardowych
b) suma 2 błędów standardowych podniesionych do kwadratu z których wyciągnięto
pierwiastek
c) różnica 2 błędów standardowych podniesionych do kwadratu z których wyciągnięto
pierwiastek
d) suma dwóch błędów standardowych
1. aby spełnić warunek obiektywności, każdy test musi być przynajmniej:
a) stosowany i obliczany w z góry ustalonych warunkach
b) wysoko rzetelny
c) losową próbką wskaźników zmiennej teoretycznej
d) oparty na wybranej teorii mierzonej zmiennej
1. stanina to
a) wynik surowy
b) wynik wskazujący na wiek umysłowy
c) inna nazwa centyli
d) znormalizowany wynik standardowy
1. centyle to wyniki, które wskazują jaki procent osób z badanej grupy uzyska wyniki:
a) takie same lub wyższe od danego wyniki
b) takie same lub niższe od danego wyniku
c) wyższe od średniej
d) niższe od średniej

1. aby znormalizowane wyniki testowe były użyteczne odnosi się je do:


a) treści pozycji tworzących test psychologiczny
b) innych metod testowych
c) zachowania wybranej, dobrze określonej grupy
d) rzetelności i trafności metody
1. kontaminacja kryterium najczęściej pojawia się, gdy:
a) test ma niską rzetelność
b) psychiatra ma dostęp do wyników testowych ??? “kontaminacja” oznacza
“połączenie”, także raczej nie ta odpowiedź. Najprawdopodobniej D, być może C.
kontaminacja oznacza “zakażenie”
Kontaminacja kryterium: wyniki testowe nie mogą wpływać na pozycję jednostki w zakresie
branego pod uwagę kryterium
c) łączy się wyniki dwóch różnych grup osób badanych
d) łączy się wyniki pomiaru dwóch różnych kryteriów nie to??
1. stosując współczynnik korelacji dwuseryjnej, jako współczynnik mocy dyskryminacyjnej,
musi zostać spełnione założenie, że zmienna zdychotomizowana jest:
a) rzeczywiście ciągła i posiada rozkład normalny,
b) ciągła lecz nie o rozkładzie normalnym
c) z natury swej dychotomiczna
d) dzieli się w punkcie mediany

Czym jest test psychologiczny? - definicja

a) osoba uczestniczy dobrowolnie


- świadoma w jakim celu
- sytuacja tworzona do celów w której wywołuje się zachowania typowe pod
względem tej charakterystyki jaka ma być przedmiotem celowej obserwacji
- od diagnosty nie wymaga się osobistego zaangażowania jasno okreslony czas i
rodzaj
zachowań

Pomiar testowy jest pomiarem:


- pośrednim (mierzymy zachowanie - wnioskujemy o konstrukcie)

Prawa osoby badanej:


- ma być poinformowany o tym, że ktoś go ocenia (czynniki motywacyjne)
Prawa badającego:
- ściśle określony zakres dopuszczalnych zachowań

Podział testów wg. kryteriów formalnych

Co to jest obiektywność, standaryzacja, rzetelność, itd.


standaryzacja​- dokładne , szczegółowe określenie procedury
procedura badaniem testóem
procedura obliczaniem wyników
procedura interpretowania wyników
obiektywność ​ - niezależność wyników testowania( kto , gdzie i kiedy ich dokonuje)
- test jest obiektywny jeżeli dwie osoby dochodzą do tego samego rezultatu
- test musi posiadać klucz oceniania odpowiedzi zmniejszający do minimum wpływ
subiektywnych interpretacji
rzetelność​- dokładność pomiarów( niezawodność) zgodność otrzymanych przez te same
osoby , które badane były kilka razy tym samym testem
powtarzalność wyników - psychometrii
trafność ​- określenie obszaru testu , dokładność z jaką test mierzy to co ma mierzyć
- wskazuje na wielkość błędu
- odzwierciedla relację jaka zachodzi między ( adekwatność operacjonalizacji wielkości
psychologicznej

Na czym polega metoda badania obiektywności "ślepa diagnoza"?


- Techniką badania stopnia obiektywności jest technika tzw. ​ślepej diagnozy​.

Znać wzór X = T + E - co oznaczają

Dobra rzetelność:
- gdy współczynnik rzetelności wynosi co najmniej 0,8.

Metody badania rzetelności


- metoda połówkowa​Kudera Richardsona a Cronbacha - ( wariancja błędu - dobór
treści , liczba pozycji testowych
- powtarzanie testu jedno po drug​im ( wariancję błędu - czynniki losowe)
- powtarzanie testu w odstępie czasowym​( wariancja błędu - dobór treści )
- wersje alternatywne w odstępie czasu​ ( wariancja błędu - dobór treści i
zmienności w czasie )
- zgodność ocen sędziów​( wariancję błędu różnice w ocenach między sędziami)

Czym się kierować ustalając długość przerwy czasowej między testem a retestem?
- żeby zminimalizować skutki zapamiętywania swoich odpowiedzi i zminimalizować
efekty uczenia się nowych rzeczy (optymalny czas - od 2 tyg. do 6 miesięcy)

Jak uczenie się wpływa na wielkość współczynnika rzetelności?


- nie doszacowuje go
Gdy alfa Cronbacha (współczynnik zgodności) jest duża:
- jednowymiarowa struktura testu

Gdy jest mała:


- wielowymiarowa struktura testu

Rodzaje trafności
- treściowa ​- wewnetrzna , logiczna
- kryterialna ​
- ocena czy osoba posiada lub bedzie włsciwośc psych.
- teoretyczna -​pomiar nasilenia hipotetycznej właściwości

Do analizy homogeniczności testu (trafność teoretyczna) wykorzystujemy:


alfę Cronbacha - tą samą co przy rzetelności

Podział norm ze względu na grupę odniesienia


- ogólnokrajowe i lokalne

Podział norm ze względu na sposób konstruowania - dokładnie się nauczyć z


interpretacją przedziałów liczbowych
- typu standardowego -oparte o rozkład normalny
- typu rangowego - oparte o częstość i rozkład jednostajny
- typu równoważnikowego
- normy wymagań

Norma w psychometrii ma charakter:


- statystyczny
- jest standard ilościowy, wyznaczony przez średnią , mediane lub inna miare
tendencji centralnej obliczona dla grupy przedstawicieli danego typu

Sposoby konstruowania testów

Poza tym trzeba znać dokładnie tą tabelkę o skalach T, stenach, Staninach, itp. -
może być pytanie np. ile % wariancji wyjaśniają wyniki znajdujące się pomiędzy 40 a
60 na skali T, albo pomiędzy 3 a 7 na skali staninowej (68,26%).

1. Kto ustala narzędzia pomiarów wg ustawy


2. Diagnoza nomotet/ idiograficzna
3. Student uczył się tylko 3 wykładu z psychometrii a tego nie było na egzaminie.
Odczuwa teraz: trafność treściowa...stronniczość pytań
4. Do korelacji czego używamy: w kendalla
5. Jeśli zmniejszymy ilość pytań to rzetelność
- się zmniejszy
- zwiększy
- nie zmieni się
6. Zadanie na poprawkę zgadywania

8. Co to jest rzetelność pomiaru


- wynik obserwowany ( otrzymany w tescie ) nigdy nie jest idealnym odzwierciedleniem
rzeczywistej wartości mierzonej cechy - zawsze jest oabrczony pewnym błedem
9. Co to błąd standardowy pomiary
- SEM=S X​​V 1 - r​ tt
- SEM - STANDARDOWY bład pomiaru
- S​ x ​odchylenie standardowe wyników testowych
- r​
tt-​rzetelność testu
10. Obliczyć przedział ufność wyników podane było z jakim prawdopodobieństwem i
sem
11. Jakie są prawidłowe nazwy: ze kryterialna to zewnętrzna a wewnętrzna do
indukcyjna
12. Co to jest moc dyskryminacyjna
13. Co to jest analiza czynnikowa
14. Co to jest format odpowiedzi
15. Jaka trudność pytań w mocy dyskryminacyjnej
16. Co to jest trafność treściowa
17. Metoda wielu cech wielu metod zbieżna i różnicowa
18. Aprobatę społ można traktować jako styl LUB cechę osobowościową
19. Wartości ważne dla stenow 5,5, i 2
20. Wartości dla tetronów 10,4
21. Transkrypcja – wierna kopia
22. Wierność tłumaczenia co zawiera a właściwie były cechy podane i trzeba było
wybrać pod jaka to wierność
23. Pytanie do rozwiązania coś o inteligencji w jakiej się ktoś połówce mieści z
wynikami
24. Co to jest błąd bliskości
25. Najlepszy najbardziej dokładny test będzie miał badacz co przyjmie
prawdopodobieństwo 0,1 ; 0,5; 0,15, ;0,01
26. Były podane dwie rzetelność jedna 0,5 druga 0,8 ile razy więcej trzeba dać pytań
aby wzrosła rzetelność : dwukrotnie, pięciokrotnie
27. Diagnostyczna brak odstepstw czasowych
28. Było pytanie o coś co najlepiej opisuje i były odp walidacja krzyżowa , sama
walidacja
29. Co będzie skutkiem jeśli pomiary z jednego badania naniesiemy na drugie :
zmieni się trafność, rzetelność , wszystkie czynniki
30. Pytanie i odp prawidłowa, że własność pomiaru a nie cecha narzędzie
31. Jakieś zadanie do pomyślenia z kwestionariuszem FCZ-KT.

1. Transkrypcja– odp. Bierność formy i treści


2. co decyduje że narzędzie jest testem ustawy: odp. Komisja ekspertów
3. Analiza czynnikowa – wyłonienie wymiarów
4. co zrobić żeby określić że pozycje są treściowo związane z czynnikiem – odp:
walidacja ​(prawda)
5. Leon 16, Ervin 12, SD 10, rtt – 0,98 – odp: istotnie wyższe od Ervina ​(nie
rozumiem tego???)
6. wynika w teście 25, 15 błędów, liczba możliwych 4, poprawka na zgadywanie
– odp: 20 ​ (nie rozumiem tego???)
7. poziom istotności wskazujący na najmniejszy błąd wnioskowania - odp: 0,01
(prawda)
8. czym będzie rozczarowany student jeżeli na egzaminie nie pojawi się pytanie
z rozdziału którego się uczył? – odp: trafnością treściową egzaminu ​(raczej prawda)
9. format odpowiedzi – odp: liczba kategorii odpowiedzi ​(nie rozumiem tego???)
10. policzyć przedział ufności prawdopodobieństwo 0,95 SEM przy 0,6 wynik
otrzymamy 20 – odp: 14,26
12. zwielokrotnienie testu rtt – 0,5, Uttn – 0,8 – odp 4
13. co oznacza rzetelność – odp: stosunek wariancji prawdopodobieństwa do
otrzymania ​ (wg mnie i wg ksiazki to jest ​rzetelność​- dokładność pomiarów
(niezawodność) zgodność otrzymanych przez te same osoby , które badane były
kilka razy tym samym testem)
14. co oznacza SEM – standard odchylenie błędu pomiaru wokół wyniku
otrzymanego ​ (standardowy błąd pomiaru po prostu)
15. przeniesienie pomiaru z jednej na drugą – odp. To nie własność testu tylko
pomiaru,
16. steny – M=10, SD=2
17. tetrony – M=10, SD=4
18. teoretyczna – dedukcyjna, wewnętrzna – indukcyjna ​(prawda)
19. potrzeba aprobaty społecznej – cecha i styl odpowiedzi
20. moc dyskryminacyjna różnicuje populację ze względu na cechę ​(prawda)
22. najwyższa moc dyskryminacyjna – odp przeciętna trudność pytania
23. ładunek czynnikowy – operacyjny, korelacja pyt z czynnikiem
24. w jakiej metodzie nie odnosi się do prób reprezentantów – zewnętrzna
kryterialna
25. co oznacza że ktoś uzyskał wynik w skali ekstrawersji – odp: można
szacować że jest ekstrawertykiem ​(prawda)
26. żeby podwyższyć rzetelność – maksymalizacja wariancji wyników prow.
Błędu / wariancji błędu
27. zgodność sędziów kompetentnych – W. Kendalla
28. diagnoza psychometryczna – nomotetyczna
29. metoda w. Prób i w. Metod – zbieżna i rozbieżna
30. teoria rzetelności – suma błędów pomiaru = 0
31. trafność teoretyczna – odnosi się do teorii i może ją zmienić
32. wierność tłumaczenia
33. metoda kryterialna – dobroć dopasowania z kryteriami zewnętrznymi
34. trafność diagnostyczna – w tym samym czasie
35. nie przeprowadzenie badań zgodnie ze standaryzacją – psuje wszystkie
czynniki
tPsychometria 2015 , zaoczni

1. rzetelność dla wyniku indywidualnego powinna oscylować wokół:


a. 0,6
b. 0,7
c. 0,8
d. 0,9

2. Która z metod nie jest metodą badania rzetelności (wybrać jedną z czterech
podanych).
Rzetelność BADA: metoda połówkowa, test-retest, testy równoległe, analiza
zgodności wewnętrznej czyli alpha Cronbacha

3. Na jakim etapie stosuje się “instrukcję szczerości”?


Na etapie stosowania kwestionariusza

4. Co to jest dysymulacja? ​Tendencja do przedstawiania się w nieprawdziwie


korzystnym świetle.
(Ale to nie było pytanie o dysymulację, co to jest, tylko dysymulacja była
odpowiedzią. Ogolnie to bylo to pytanie o aprobatę społeczną i trzeba bylo wskazac
w odp społecznie pożądane cechy, a te niepożądane odrzucic, czy jakos tak)
a. symulacja
b. dysymulacja
c. trochę symulacja, trochę dysymulacja (czy coś w tym stylu)
d. żadna z tych

4. Który z poniższych opisów to perspektywa emikalna (wybrac jeden z czterech).


(Nawet Google nie wie co to jest :O)

5.Przy której trafności trzeba dążyć do maksymalizowania (podtrzymania) motywacji


u OB.
a. fasadowa
b. wewnętrzna (tresciowa)

6. Etapy analizy zadań - wskazać jeden nie wchodzący w analizę


Etapy analizy zadań: 1. ustalenie czy pozycja testowa jest poprawna rzeczowo (czy
da się ją wyprowadzić z teorii), 2. sprawdzenie czy pozycja testowa jest poprawnie
zredagowana, 3. obliczenie statystycznych wskaźników dla poszczególnych pozycji
testowych.

7. W jakim przedziale procentowym mieściłyby się osoby, które uzyskają od 40-60


punktów na skali T?
a. 99%
b. 98%
c. 68%
9. 55 centyl to
a. wynik niższy bądź równy 55%
b. wynik niższy 55%
c. wyższy bądź równy 45%
d. wyższy 45%

10. Zaleta norm wymagań: ​


umożliwiają porównywanie osiagnięć badanych osób z
wymaganiami programowymi.

12. Zasady redagowania pozycji testowych - wskazać jedną nieprawidłową

13. Budowanie przedziału ufności - wynik 12, podane wartości odchylenia dla trzech
alfa, z czego trzeba była wybrać jedną dla 90% przedziału i wskazać ten przedział

14. Pytanie o trafność treściową, czym się charakteryzuje?


Trafność treściowa (logiczna, wewnętrzna)- ocenianie na podstawie pomiaru
testowego całokształtu zachowań, których próbkę pobiera test, np. test z geografii

15. Pytanie o badanie rzetelności, trzeba wybrać nieprawidłową.


Rzetelnosc- dokladnosc pomiaru, rzetelnosc mowi nam o tym, w jakim stopniu wynik
danego testu odzwierciedla poziom mierzonej cechy u danej osoby, a nie wplyw
czynnikow losowych, bierze sie pod uwage wielkosc bledu, jaki popelnia psycholog
przy interpretacji wynikow danego testu oraz wiaze sie z umiejetnoscia zbudowania
przedzialu ufnosci dla tzw. wyniku prawdziwego danej osoby.

17. Co to jest standaryzacja? ​Jednolitosc regul i warunkow badania, tzn aby wyniki
danego testu mozna bylo ze soba porownywac, dany test zawsze powinien byc
przeprowadzony w identycznych warunkach, bo tylko wtedy roznice w wynikach osob
badanych mozna przypisac czynnikom indywidualnym a nie zewnetrznym warunkom
badania

19. Zalety norm typu równoważnikowego:


osiągnięcia badanych są traktowane rozwojowo, pokazują opóźnienia bądź
przyśpieszenia w uczeniu się, można dostosować do każdego miesiąca nauki.

20. Pytanie o normy - zaznaczyć nieprawdziwą ​(nie rozumiem tego???)

21. Jakie zdanie nie należy do prawdziwych jeśli chodzi o centyle


a. różnicuje wyniki na końcach rozkładu
b. jest rozkładem równoprawdopodobnym
c. nie można porównać wyników surowych

22. Co to są style odpowiadania?


Badany odpowiada bez względu na treści pytań
23. Która zasada równoważności nie jest brana pod uwagę przy adaptacji?
Założenia adaptacji kulturowej: zasada równoważności konstruktu, funkcjonalnych
zachowań, wskaźników konstruktu teoretycznego, psychometryczna ???

24. Kontaminacja kryterium najczęściej pojawia się, gdy:


a) test ma niską rzetelność
b) psychiatra ma dostęp do wyników testowych
c) łączy się wyniki dwóch różnych grup osób badanych
d) łączy się wyniki pomiaru dwóch różnych kryteriów

25. Pytanie o błąd systematyczny (chyba odnosił sie do rzetelności):


a. jest istotny
b. nie jest brany pod uwagę
c. to zależy od mierzonej cechy
d. ?

26. Homogeniczność grupy w stosunku do rzetelności


a. maleje
b. rośnie a nie przypadkiem to ??? → rośnie gdy homogeniczne są pozycje testowe

28. Pytanie o analize czynnikowa


Za pomocą analizy czynnikowej mozna: redukowac ilość dostępnych informacji,
łączyc podobne do siebie zmienne w grupy, wyodrębniac podobieństwa pomiędzy
zmiennymi. Służy ona temu, aby sensownie połączyć ze sobą grupy podobnych
zmiennych w jedną grupę.

30. Wynik typowy ​


(nie rozumiem tego???)

31. Co różnicuje moc dyskryminacyjną?


Współczynnik mocy dyskryminacyjnej (to stopień w jakim dana pozycja testowa
różnicuje badaną populację).

32. Po co wprowadza się przedziały wiekowe?


Testy z przedzialami wiekowymi zazwyczaj badaja dana populacje, np. dzieci,
mlodziezy, doroslych...

33. Etapy analizy pozycji testowych

34. Jaki jest optymalny wskaźnik rzetelności


Minimum 0,8 w diagnozie indywidualnej, ale optymalny???

35. Pytanie o skali T - że ma dużą rozpiętość ​(No ma :D)

36. Pytanie o trafność fasadowa


Dotyczy tego, co wydaje sie mierzyc test, a nie tego, co rzeczywiscie mierzy; opisuje
jak test spostrzegaja osoby badane i czy z ich punktu widzenia dany test faktycznie
mierzy to, co ma mierzyc

37. Dzieci z problemami w nauce mają być przydzielone na zajęcia dodatkowe,


wyrównawcze. Do zakwalifikowania trzeba je przebadać testami; jakie zadania im
dać?
a. bardzo łatwe
b. przeciętne
c. trudne
d. bardzo trudne
Obszary treści
funk- społeczne – ekonomiczne reklamy
-wyobraźnia -brak wyob, ciekawość brak zainter , kreatywność,
powierzchowność, spostrzegawczość
Obszary manifestacji
- - obszar poznawczy , emocjonalny, behawioralny
- przekonania i emocje
testy włsci poznawczych
- afektywnych – wierzenia emocje zachowania

1.czy operacjonalizacja potrzebna jest do definicji mierzonego


testu
- tak jest częścią operacjonalizacji
2.w jakiej skali postaw wobec reklamy założono ,że pytania
będą dotyczyły przekonań o działaniu reklamy i emocji jakie
ona wzbudza to przekonanie i emocje stanowią
-obszary manifestacji
3.jak powinna być sformułowana pozycja testowa w twoim
kwestionariuszu
- format zamknięty
4. jaka forma gramatyczna powinna mieć pozycja w twoim
kwestionariuszu
- zdania twierdzące
5. obszary treści
- wynikają z definicji stanowią merytoryczna zawartość
6. obszary manifestacji
-wskazują gdzie i wjaki sposób mogą przejawiać sie
manifestować obszary treści które określmy w poprzednim
punkcie
7.testy właściwe afektywne – metoda samo-opisowa
-nie ma obiektywnych wskaźników mierzonych cech, moga byc
wierzenia , przekonania , emocje
8. mierzenia postaw
- zwykle obszary manifestacji , 3 kompetentny postawy –
przekonania , emocje , zachowania
9. czy zawsze w projekcie kwestionariusza warto umieszczać
wszystkie możliwe obszary manifestacji
-trzeba sie zastanowic czy maja sens w naszej ofercie
10.pozycje testowe
- poszczególne zadanie dla osoby badanej składającej sie z tresci
i polecanie czyli tego co ma
11. format otwarty
- wymagaja zarówno wysiłku od osoby badanej jak i sa bardzo
trudne w ocenie – w przyporządkowanej wartosci liczbowej
12. format zakmniety - ( będziemy używać formy zamkniętej )
- poz. -alternatywne
- poz. Wieloalternatywne
- poz z dopasowaniem
-rangowanie
skala likerta
- dwubiegunowe skale przymiotnikowe
13,jak powinna byc sformułowana pozycja testowa w twoim
kwestionariuszu
- format zamkniety
14. pytania w kwestionariuszach, jaka forme powinna miec
pozycja testowa
- twierdzoce , oznajmujace 1 l. P
15 do każdej pozycji testowej osoba badana powinna
ustosunkować sie
-takiej samej skali ( nie możemy dopasowywać skali do treści
pozycji)
16. jakie skale
-skala z wyborem alternatywnym
- skala liberta
skala częstości
17. skala dwupunktowa
trzeba mieć dużo pytań
18. skala wielopunktowa
- mniejsza ilość pytan \]
19.skala dwupunktowa-- alternatywna - wady
- mniej dokładna
- niektórych kwestii nie da sie rozstrzygnąć
20 zalety skali dwupunktowej
-szybka dobrze zrozumiała , łatwa dla osób badanych skraca
zcas pracy
21. skala wielopunktowa – częstości -wady
- wolniejsza trudniejsza wydłuża czas pracy
22. skala wielopunktowa zalety
-dokładniejsza , daje oceny stanów pośrednich nie jest czarno
biała
23. przykład skali dwupunktowej
- tak nie , prawda fałsz
24. przykład wielopunktowej
zdecydowanie nie , nigdy rzadko
25. wielopunktowa – to ile stopni na skali
- parzysta czy nie parzysta ? - nie ma jasnego zalecenia
26. skala parzysta z liczba punktów- wada
- jeśli osoba nie potrafi sie ustosunkować – wybierze
przypadkowe odpowiedzi
zalety
- wybieranie odpwoeidzi srodkowej która nic nie znaczy
27. skala nieparzystaliczab punktów- wada
- wybieranie nadmierne czseto nic nie znaczacej odpowiedzi
zaleta
- jeśli się nie umie ustosunkować zawsze ma możliwość
wybrania odp środkowej
28. jak zinterpretować wielkość współczynnika
- 64% zmienności wyników testowych zależy od rzeczywistego
zróżnicowania
- 36% zmienników wyników testowych zależy oda warjacji
błedów
29aby przeprowadzić analizę czynnikowa nasze dane musza
spełniać kilka warunków
- wszystkie pyatnia musza byc mierzone na tej samej skali
30. jesli na jakies pytania wszystkie osoby badane
odpowiedzaiły tak samo to nie ma sensu włączać ich do analizy
- osób pytanych musi byc przynajmniej tyle ile pytań a najlepiej
5 razy wiecej pytan
Psychometria 2015 , zaoczni

1. rzetelność dla wyniku indywidualnego powinna oscylować wokół:


a. 0,6
b. 0,7
c. 0,8
d. 0,9

2. Która z metod nie jest metodą badania rzetelności (wybrać jedną z czterech podanych)

- Rzetelność BADA - metoda połówkowa, test-retest, testy równoległe, analiza zgodności


wewnętrznej czyli alpha Cronbacha

3. na jakim etapie stosuje się “instrukcję szczerości”


- na etapie stosowania kwestionariusza

4. Dysymulacja - co to jest? tendencja do przedstawiania się w nieprawdziwie korzystnym


świetle To nie było pytanie o dysymulację co to jest tylko dysymulacja była odpowiedzią. Tak.
było to pytanie o aprobatę społeczną? chyba tak, bo osoba ta wskazywała w odp. społecznie
pożądane cechy, a te niepożądane odrzucała
a. symulacja
b. dysymulacja
c. trochę symulacja, trochę dysymulacja (czy coś w tym stylu)
d. żadna z tych

4. który z poniższych opisów to perspektywa emikalna (wybrac jeden z czterech)

5.Przy której trafności trzeba dążyć do maksymalizowania (podtrzymania) motywacji u


OB.
a. fasadowa
b. wewnętrzna

6. Etapy analizy zadań - wskazać jeden nie wchodzący w analizę


a. redagowanie pozycji testowych
b. w jednym chodziło o to by odnieść pytania do teorii

Etapy analizy zadań: ustalenie czy pozycja testowa jest poprawna rzeczowo (czy da się ją
wyprowadzić z teorii), sprawdzenie czy pozycja testowa jest poprawnie zredagowana,
obliczenie statystycznych wskaźników dla poszczególnych pozycji testowych

7. W jakim przedziale procentowym mieściłyby się osoby, które uzyskają od 40-60


punktów na skali T?
a. 99%
b. 98%
c. 68%

8. skala staninowa:
a. 2z + 5

9. 55 centyl to
a. wynik niższy bądź równy 55%
b. wyniż niższy 55%
c. wyższy bądź równy 45%
d. wyższy 45%

10. zaleta norm wymagań


Umożliwiają porównywanie osiagnięć badanych osób z wymaganiami programowymi

11. O rekonstrukcji też coś było - wskazać zdanie prawdziwe dot. rekonstrukcji
a. trzeba stworzyć nowe narzędzie a oryginał ma być tylko inspiracją
b.
c.
d. maksymalnie wierne tłumaczenie- transkrypcja
e. wierne tłumaczenie z małymi poprawkami-translacja
f. swobodne łumaczenie-trawestacja

12. zasady redagowania pozycji testowych - wskazać jedną nieprawidłową

13. budowanie przedziału ufnośći - wynik 12, podane wartości odchylenia dla trzech alfa, z
czego trzeba była wybrać jedną dla 90% przedziału i wskazać ten przedział
czy ktos ogarnia jak sie liczy takie rzeczy? ;)
tak to jest 3 wykład na prezentacji, ale jeśli nie ma podanej rzetelnosci, to tego sie nie da
zrobic;/ a do tego bez kalkulatora to powodzenia;) a “nie korzystać z żadnych funkcji telefonu
komórkowego” pewnie obowiązuje, wiec polecam zaopatrzyc sie w kalkulatory:)

14. Pytanie o trafność treściową, czym się charakteryzuje

trafność treściowa (logiczna, wewnętrzna)- ocenianie na podstawie pomiaru testowego


całokształtu zachowań, których próbkę pobiera test, np. test z geografii

15. pytanie o badanie rzetelności, trzeba wybrać nieprawidłową

16. dobór trudności pytań przy badaniu dzieci upośledzonych nie było pytania o dzieci
upośledzone tylko jaki stopien trudnosci powinno sie dobrac w momencie gdy dzieci maja
kiepskie wyniki i na podstawie testu trzeba je przydzielić do zajęć dodatkowych (a nie szkoły
specjalnej?)
a. większość łatwych pytań
b. większość trudnych
c. trochę trudne ,trochę łatwe ??
d. rodzaj zadań nie ma znaczenia

17. co to jest standaryzacja


Jednolitość warunków badania
18. co bada homogeniczność alfa Cronbacha
a. trafność
b. Rzetelność
c. trafność i rzetelność (moim zdaniem odpowiedz prawidłowa to sama rzetelność, TA
NA BANK JEST DOBRA, MAM TO GDZIEŚ W NOTATKACH)
d. żadne z powyższych

19. zalety norm typu równoważnikowego


osiągnięcia badanych są traktowane rozwojowo, pokazują opóźnienia bądź przyśpieszenia w
uczeniu się, można dostosować do każdego mięsiąca nauki

20. pytanie o normy - zaznaczyć nieprawdziwą

21. Jakie zdanie nie należy do prawdziwych jeśli chodzi o centyle


a. różnicuje wyniki na końcach rozkładu- a nie to?
b. jest rozkładem równoprawdopodobnym
c. nie można porównać wyników surowych (CHYBA TO→ może ktoś potwierdzić?)

22. co to są style odpowiadania


a. badany odpowiada bez względu na treści pytań

23. pytanie o zasadę równoważności przy adaptacji Która zasada równoważności nie jest brana
pod uwagę przy adaptacji

Założenia adaptacji kulturowej: zasada równoważności konstruktu, funkcjonalnych zachowań,


wskaźników konstruktu teoretycznego, psychometryczna

24.kontaminacja kryterium najczęściej pojawia się, gdy:


a) test ma niską rzetelność
b) psychiatra ma dostęp do wyników testowych dlaczego?bo tak
hueheuheuheuheue
c) łączy się wyniki dwóch różnych grup osób badanych
d) łączy się wyniki pomiaru dwóch różnych kryteriów

25. pytanie o błąd systematyczny (ale nie pamiętam do czego się odnosił - rzetelności? tak)
a. jest istotny
b. nie jest brany pod uwagę (chyba to)
c. to zależy od mierzonej cechy
d. ?
- Błąd systematyczny to błąd, który nie ma nic wspólnego z mierzoną cechą psychologiczną i jest
spowodowany stałymi cechami badanej osoby lub narzędzia pomiarowego.

26.homogeniczność grupy w stosunku do rzetelności


a. maleje
b. rośnie a nie przypadkiem to ??? → rośnie gdy homogeniczne są pozycje testowe
JEST O TYM W JEJ KSIĄŻCE, MALEJE NA 100% Signed.
28.O analizie czynnikowej
30. Wynik typowy

31. Co różnicuje moc dyskryminacyjnąodp: badaną populację

współczynnik mocy dyskryminacyjnej to stopień w jakim dana pozycja testowa różnicuje


badaną populację

32. Po co wprowadza się przedziały wiekowe

33. Etapy analizy pozycji testowych

34. Jaki jest optymalny wskaźnik rzetelności

-Minimum 0,8 w diagnozie indywidualnej, a optymalny to nie wiem.

35. O skali T - że ma dużą rozpiętość (10z+50)


36. Trafność fasadowa- to co wydaje sie mierzyć, opinia badanych

37. Dzieci z problemami w nauce mają być przydzielone na zajęcia dodatkowe,


wyrównawcze.Do zakwalifikowania trzeba je przebadać testami; jakie zadania im dać?
a. bardzo łatwe
b. przeciętne
c. trudne
d. bardzo trudne ;)

1. Która z poniższych definicji jest pełną i wyczerpującą definicją testu psychologicznego?


a) jest to obiektywny i standaryzowany pomiar próbki zachowania
b) jest to kontrolowana ilościowa obserwacja zachowania
c) jest to pomiar próbki zachowania wybranej grupy ludzi
d) jest to standaryzowany zbiór bodźców dla mierzalnych reakcji

1. trafność fasadowa powinna być brana pod uwagę w przypadku testu, gdyż:
a) stanowi podstawę statystycznego doboru pozycji
b) jest częścią składową każdego rodzaju trafności
c) jest dowodem, że test mierzy to, co zmierzył jego autor
d) zapewnia zgodność wyglądu testu czym.... sądzi osoba badana

1. wyniki standardowe to
a) wyniki uzyskane w standardowych warunkach
b) wyniki wyrażone w terminach odchylenia standardowego
c) wyniki wyrażone w terminach obiektywnego standardu
d) wyniki uzyskane za pomocą wystandardyzowanego narzędzia

1. pojęcie normy w teście odnosi się do:


a) wykonania idealnego
b) wykonania maksymalnego
c) wykonania oczekiwanego
d) wykonania typowego

1. tetrony to wyniki standardowe wyrażone na skali


a) M=10 SD=2
b) M=10 SD=4
c) M=10 SD=1
d) M=10 SD=10

1. wysoki współczynnik korelacji pomiędzy dwoma testami równoległymi stosowanymi jeden po


drugim, bez przerwy czasowej, świadczy o:
a) funkcjonalnej mierzonej zmiennej w czasie
b) niskiej homogeniczności wysokiej specyficzności pozycji testowych
c) niskiej specyficzności i wysokiej homogeniczności pozycji testowych
d) o dużym stopniu obiektywności

1. w metodzie testów równoległych, w odróżnieniu od metody test-retest minimalizowany jest


wpływ:
a) pamięci i efektów uczenia się
b) braku stałości zmiennej
c) heterogeniczności zmiennej
d) szybkości rozwiązania zadań

1. otrzymanie różnych współczynników trafności kryterialnej dla danego testu jest najczęściej
spowodowany:
a) faktem wybrania różnych zmiennych kryterialnych
b) błędami w obliczeniach
c) niską rzetelnością testu
d) trudnościami w diagnozowaniu zachowania mierzonego przez test

1. test składa się z 10 pytań. Powinien dobrze różnicować w obrębie patologii. Która z poniższych
skal standardowych najlepiej pozwalałaby zrealizować ten cel:
a) M=10, SD=5
b) M=10 SD=1
c) M=50 SD=10
d) M=50 SD=25

1. błąd standardowy różnicy jest to:


a) różnica 2 błędów standardowych
b) suma 2 błędów standardowych podniesionych do kwadratu z których wyciągnięto
pierwiastek
c) różnica 2 błędów standardowych podniesionych do kwadratu z których wyciągnięto
pierwiastek
d) suma dwóch błędów standardowych
1. aby spełnić warunek obiektywności, każdy test musi być przynajmniej:
a) stosowany i obliczany w z góry ustalonych warunkach
b) wysoko rzetelny
c) losową próbką wskaźników zmiennej teoretycznej
d) oparty na wybranej teorii mierzonej zmiennej

1. Stanina to
a) wynik surowy
b) wynik wskazujący na wiek umysłowy
c) inna nazwa centyli
d) znormalizowany wynik standardowy

1. centyle to wyniki, które wskazują jaki procent osób z badanej grupy uzyska wyniki:
a) takie same lub wyższe od danego wyniki
b) takie same lub niższe od danego wyniku
c) wyższe od średniej
d) niższe od średniej

1. określanie rzetelności testu pozwala na ustalenie:


a) jaki % wariancji otrzymanej stanowi wariancja prawdziwa
b) wielkości błędu stałego w pomiarze testowym
c) jaką część wariancji błędu stanowi wariancja prawdziwa
d) możliwych fluktuacji wielkości współczynnika R

1. trafność kryterialna to inaczej


a) trafność predykcyjna i treściowa
b) trafność diagnostyczna i treściowa
c) trafność prognostyczna i diagnostyczna
d) trafność teoretyczna i treściowa

1. rzetelność testu jest wyrażana w postaci


a) odchylenia standardowego
b) prawdopodobnego błędu wyniku testowego
c) współczynnika korelacji
d) różnicy pomiędzy 2 wynikami

1. aby znormalizowane wyniki testowe były użyteczne odnosi się je do:


a) treści pozycji tworzących test psychologiczny
b) innych metod testowych
,c) zachowania wybranej, dobrze określonej grupy
d) rzetelności i trafności metody

1. kontaminacja kryterium najczęściej pojawia się, gdy:


a) test ma niską rzetelność
b) psychiatra ma dostęp do wyników testowych
c) łączy się wyniki dwóch różnych grup osób badanych
d) łączy się wyniki pomiaru dwóch różnych kryteriów
1. stosując współczynnik korelacji dwuseryjnej, jako współczynnik mocy dyskryminacyjnej, musi
zostać spełnione założenie, że zmienna zdychotomizowana jest:
a) rzeczywiście ciągła i posiada rozkład normalny,
b) ciągła lecz nie o rozkładzie normalnym
c) z natury swej dychotomiczna
d) dzieli się w punkcie mediany

1. rzetelność testu można wyrazić jako:


a) stosunek wariancji [prawdziwej do wariancji błędu
b) stosunek wariancji otrzymanej do wariancji prawdziwej
c) stosunek wariancji prawdziwej do wariancji otrzymanej
d) stosunek wariancji błędu do wariancji otrzymanej

1. wielkość SEM zależy od:


a) odchylenia standardowego wyników testowych,
b) współczynnika rzetelności
c) obu możliwości
d) żadnych możliwości

1. jeżeli test jest zbyt trudny dla badanej grupy osób to rozkład wyników w tym teście będzie:
a) normalny
b) prostokątny
c) skośny
d) wielo modalny

1. znajomość współczynnika mocy dyskryminacyjnej pozwala nam na


a) wskazania pozycji zbyt trudnych
b) wskazanie pozycji mierzących inną zmienną
c) wskazanie pozycji mierzącej zachowania poza testowe
d) wskazanie pozycji nietrafnych

1. jeżeli rozkład wyników surowych jest rozkładem lewo skośnym, to w celu jego normalizacji
należy zastosować następującą transformację:
a) pierwiastkową,
b) logarytmiczną
c) potęgową
d) żadną z nich

1. trafność teoretyczna testu znajduje swoje odzwierciedlenie w:


a) hipotezach wyprowadzanych z teorii mierzonej zmiennej
b) rezultatach analizy czynnikowej wyników testowych
c) obu z wymienionych możliwości
d) żadne z wymienionych możliwości
1. standardowy błąd estymacji wyniku prawdziwego jest to:
a) różnica między estymowaną wartością wyniku prawdziwego a jego rzeczywistą
wartością
b) różnica między wynikiem otrzymany a wynikiem prawdziwym w teście
c) obie definicje są prawdziwe
d) żadna definicja

1. standaryzacja testu odnosi się do:


a) komercyjnej użyteczności testu
b) jednolitości procedury
c) zgodności z normami
d) określania jego rzetelności i trafności

1. współczynnik KR-20 to:


a) średnia wszystkich współczynników typu test-retest
b) średnia wszystkich współczynników typu split-half
c) średnia wszystkich współczynników splittest
d) średnia wszystkich współczynników powyżej 0,8

1. standardowy błąd pomiaru jest szczególnie użyteczny przy:


a) porównywaniu dwóch wyników testowych między sobą
b) określaniu statystycznej istotności wyniku testowego
c) porównywaniu dwóch testów między sobą
d) określaniu istotności statystycznej pozycji testowej

1. testu przeznaczone do selekcji ze względu na specyficzne kryterium, powinny składać się z


pozycji testowych, których współczynnik trudności wynosi:
a) 0,5
b) mieści się w przedziale od 0-100%
c) wyznaczony jest przez rozkład normalny
d) jest równy wyznaczonemu punktowi selekcji
=
1. formuła speramana - browna jako metoda szacowania rzetelności stosowana jest w technice:
a) test-retest
b) testów równoległych
c) połówkowania (split-half)
d) krudera-richardsona
1. dla którego z poniższych rodzajów testów, okre4ślenie trafności treściowej będzie najbardziej
odpowiednie
a) testów zdolności werbalnych
b) testów wiadomości z matematyki
c) testów projekcyjnych
d) testów inteligencji

1. badanie trafności metodą wielu cech-wielu metod polega na:


a) analizowaniu tylko aspektu zbieżnego trafności
b) analizowaniu tylko aspektu różnicowego trafności
c) analizowaniu jednocześnie aspektu zbieżnego i różnicowego
d) żądne z powyższych możliwości

1. formuła Spearmana-Browna pozwala na określenie wpływu następujących zmiennych na


wielkość współczynnika rzetelności:
a) heterogeniczności próbki badanych osób
b) homogeniczności pozycji testowych
c) trafności testu
d) długości testu

1. steny to wyniki standardowe wyrażone na skali


a) M=5 SD=2
b) M=5 SD=4
c) M=5,5 SD=2
d) M=5,5 SD=4
1. staniny to wyniki standardowe wyrażone na skali:
a) M=5 SD=2
b) M=5 SD=4
c) M=5,5 SD=2
d) M=5,5 SD=4

1. skala T to wyniki standardowe wyrażone na skali:


a) M=50 SD=2
b) M=50 SD=4
c) M=100 SD=15
d) M=50 SD=10

1. rzetelność testu to również jedno z kryteriów dobroci testów psychologicznych. Rzetelność testu
oznacza przede wszystkim następującą właściwość wyników teoretycznych
a) powtarzalność
b) obiektywność
c) istotność
d) trafność

1. badanie testowe najogólniej rzecz biorąc to:


a) w sytuacjach, w których dokonuje się ilościowej obserwacji zachowania
b) w sytuacjach, w których wywołuje się zachowania typowe dla określonej grupy osób
c) w sytuacjach, w której dokonuje się celowej obserwacji zachowań traktowanych
jako wskaźniki mierzonej charakterystyki
d) w sytuacjach, w których celem pomiaru jest określenie istotnych cech badanych cech

1. jedyny, z kryteriów normalnych, branych pod uwagę przy tworzeniu testu jest współczynnik
trudności poszczególnych pozycji testowych. Jeżeli tworzymy test dla celów selekcji i mamy
dużo kandydatów, a możemy przyjąć najwyżej 10% to większość pozycji testowych z tego testu
powinna być:
a) raczej trudnych
b) raczej łatwych
c) raczej o przeciętnej trudności
d) raczej o wysokim współczynniku rzetelności niż trafności

1. wiedząc, że w klasycznej teorii testów przyjmuje się wynik obserwowany = wynik prawdziwy +
błąd pomiaru, określ co powinno być podstawowym obowiązkiem autora testu:
a) dążenie do zwiększenia wyniku prawdziwego danej osoby,
b) dążenie do zmniejszenia błędu pomiaru
c) dążenia do zwiększenia wyniku obserwowanego
d) J

1. badanie testowe to:


a) sytuacja w której dokonuje się ilościowej obserwacji zachowania
b) sytuacja w której wywołuje się zachowania typowe dla określonej grupy
c) sytuacja w której dokonuje się celowej obserwacji zachowań traktowanych jako
wskaźniki mierzonej charakterystyki
d) sytuacja w której celem pomiaru jest określenie istonych cech badanych osób

1. która z poniższych definicji jest pełną i wyczerpującą def. Testu psychologicznego:


a) jest to kontrolowana ilościowa obserwacja zachowania
b) jest to obiektywny i standaryzowany pomiar próbki zachowania
c) jest to pomiar zachowania wybranej grupy ludzi
d) jest to kontrolowany pomiar reakcji w różnych sytuacjach zadaniowych

1. obiektywność jest jedyny z tzw. kryteriów dobroci testów psychologicznych. Aby spełnić
warunek obiektywności każdy test musi przynajmniej
a) zostać oparty na teorii mierzonej zmiennej
b) dawać porównywalne wyniki niezależnie od tego gdzie i kiedy jest stosowany
c) być obliczany w ściśle określonych warunkach
d) posiadać wysokie wskaźniki rzetelności i trafności

1. warunek standaryzacji, czyli koleje kryterium dobroci testów psychologicznych zostanie


spełniony wtedy gdy:
a) test będzie stosowany w jednolity sposób w stosunku do wszystkich osób badanych
b) test zostanie wyposażony w podręcznik zawierający opis zasad jego stosowania
c) test będzie stosowany odpowiednio do możliwości osoby badanej
d) test zostanie zastosowany tylko w takich sytuacjach w których jego wyniki będą miały
praktyczną użyteczność

1. jednym z kryteriów formalnych branym przy tworzeniu testu jest współczynnik trudności
poszczególnych pozycji testowych. Jeżeli chcemy zastosować test do selekcji kandydatów
uwzględniając określony punkt odcięcia to powinniśmy wybrać taki test, który składa się z
pozycji testowych, których współczynniki trudności wynosi:
a) 0,6
b) mieści się w zakresie 0-100%
c) jego średnia wartość wynosi 50%
d) jest równy wyznaczonemu punktowi selekcji
1. znajomość współczynnika mocy dyskryminacyjnej poszczególnych pozycji testowych pozwala
nam na
a) wyeliminowanie pozycji należących do innego testu
b) wyeliminowanie pozycji mierzących inna zmienną niż zmienna testowa,
c) wyeliminowanie pozycji które nie różnicują badanej populacji
d) wyeliminowanie pozycji zbyt mocno różnicujące badane osoby

1. stosując współczynnik korelacji punktowo-dwuseryjnej, jako współczynnik mocy


dyskryminacyjnej trzeba pamiętać o tym, że:
a) wynik pozycji testowej powinien być z natury swej dychotomiczny
b) rozkład wyników pozycji testowej powinien być rozkładem dwumodalnym
c) wynik pozycji testowej powinien być zmienną ciągłą
d) rozkład wyników pozycji testowej powinien być rozkładem normalnym

1. w klasycznej teorii testów przyjmuje się założenie, że


a) błąd pomiaru = wariancja wyników testowych
b) błąd pomiaru ma charakter losowy
c) błąd pomiaru jest błędem stałym
d) błąd pomiaru jest równy odchyleniu standardowemu wyników testowych

1. określanie współczynnika rzetelności testu pozwala na ustalenie:


a) jaką część wariancji błędu stanowi wariancja prawdziwa
b) jaką część wariancji prawdziwej stanowi wariancja błędu
c) jaką część wariancji otrzymanej stanowi wariancja prowadzą
d) jaką część wariancji prawdziwej stanowi wariancja otrzymana

1. rzetelność jako miara dokładności pomiaru testowego testu jest technicznie wyrażana w postaci:
a) współczynnika zmienność
b) współczynnika korelacji
c) współczynnika zgodności
d) współczynnika regresji

1. metoda testów równoległych stosowana do oszacowania rzetelności testu pozwla na


wyeliminowanie wpływu:
a) zbyt wysokiej trudności pozycji testowych
b) pamięci i efektów uczenia się
c) szybkości rozwiązywania zadań
d) błędów o charakterze losowym, ujawniających się w sytuacji testowania

1. wysoki współczynnik korelacji pomiędzy dwoma testami równoległymi stosowanymi jeden po


drugim bez przerwy czasowej, świadczy o:
a) wysokiej fluktuacji mierzonej zmiennej w czasie
b) niskiej homogeniczności i wysokiej specyficzności
c) niskiej specyficzności i wysokiej homogeniczności
d) wysokim stopniu obiektywności testu
1. formuła Spearmana-Browna jako metoda szacowania rzetelności testu jest rutynowo stosowana w
technice:
a) podwójnego testowania
b) testów równoległych
c) KR
d) J

1. standardowy błąd estymacji wyniku otrzymanego jest to:


a) różnica między estymowaną wartością wyniku prawdziwego a jego rzeczywistą
wartością
b) różnica między wynikiem otrzymanym a wynikiem prawdziwym w teście
c) różnica między estymowanym wynikiem otrzymanym a wynikiem rzeczywistym
d) różnica między wynikiem rzeczywistym a wynikiem, który pomniejszono o błąd
pomiaru

1. błąd standardowy różnicy jest to


a) różnica dwóch błędów standardowych
b) różnica dwóch błędów standardowych podniesionych do kwadratu, z których
wyciągnięto pierwiastek
c) suma dwóch błędów standardowych
d) suma dwóch błędów standardowych podniesionych do kwadratu z której
wyciągnięto pierwiastek

1. dokonując diagnozy na podstawie wyniku testowego, należy wziąć pod uwagę standardowy błąd
pomiaru ponieważ,
a) tylko w ten sposób można określić istotność otrzymanych wyników
b) pozwala on na dokładne określenie poziomu istotności wyniku prawdziwego,
c) dzięki niemu można określić wielkość błędu jakim jest obciążony wynik testu
d) pozwala on określić wielkość błędu jaki popełniany jest przy interpretowaniu wyniku
poszczególnych pozycji testowych

1. trafność testu to również jedno z kryteriów dobroci testów psychologicznych. Klasyczny podział
obejmuje następujące rodzaje trafności:
a) trafność treściową kryterialną i teoretyczną
b) trafność treściową fasadową i kryterialną
c) trafność treściową logiczną i wewnętrzną
d) trafność treściową diagnostyczną i prognostyczną

1. często zdarza się, że autorzy przeprowadzający badania danego testu uzyskują różne
współczynniki trafności kryterialnej. Jest to najczęściej spowodowane:
a) niskimi współczynnikami pozostałych rodzajów trafności
b) niskimi współczynnikami rzetelności testu
c) trudnościami w diagnozowaniu zachowania mierzonego przez test
d) faktem wybrania różnych zmiennych kryterialnych
1. w której z przedstawionych niżej sytuacji może dojść do zjawiska kontaminacji kryteriów:
a) psychiatra dokonując oszacowania wyników badanych osób ze względu na
zmienną kryterialną miał dostęp do wyników testowych
b) psychiatra dokonując oszacowania wyników badanych osób ze względu na zmienną
kryterialną znał podręcznik testowy
c) autor testu znał procedurę szacowania badanych osób ze względu na zmienną
kryterialną
d) autor testu połączy ł wyniki otrzymane dla dwóch różnych zmiennych kryterialnych

1. trafność teoretyczna uważana jest za najważniejszy rodzaj trafności. Znajduje ona swoje
odzwierciedlenie w :
a) hipotezach dotyczących zachowania badanych osób tworzonych na podstawie istotnych
dla psychologa teorii psychologicznych
b) hipotezach dotyczących zachowania badanych osób tworzonych na podstawie
teorii mierzonej zmiennej
c) rezultatach badań nad rzetelnością teorii psychologicznej, która leży u podstaw testu
d) rezultatach badań nad trafnością teorii psychologicznej, która leży u podstaw testu

1. istnieje wiele rodzajów trafności. W zależności od celu testowania niektórych z nich mają
większe znaczenie. Dla którego z poniższych rodzajów testów określenie trafności treściowej
będzie najbardziej pożądane:
a) testów projekcyjnych
b) testów inteligencji
c) testów zdolności werbalnych
d) testów wiadomości z matematyki

1. pojęcie normy w teście psychometrycznym odnosi się do:


a) wykonania typowego
b) wykonania idealnego
c) wykonania maksymalnego
d) wykonania oczekiwanego

1. wyniki standardowe za pomocą których można przedstawić wyniki uzyskane w teście otrzymane
przez osoby badane to:
a) wyniki uzyskane w standardowych warunkach
b) wyniki wyrażone w terminach odchylenia standardowego
c) wyniki wyrażone w terminach obiektywnych standardów
d) wyniki uzyskane za pomocą wystandaryzowanego narzędzia

1. aby znormalizowane wyniki testowe były użyteczne, tzn. można je był zinterpretować należy je
odnieść do:
a) rzetelności i trafności metody
b) treści pozycji tworzących test psychologiczny
c) zachowania wybranej, dobrze określonej grupy
d) innych metod testowych
1. steny to:
a) wynik surowy
b) wynik wskazujący na wiek umysłowy
c) inna nazwa centyli
d) znormalizowany wynik standardowy

19. Stosując współczynnik korelacji dwuseryjnej jako współczynnik mocy


dyskryminacyjnej, musi zostać spełnione założenie, że zmienna zdychotomizowana jest:
a) rzeczywiście ciągła i posiada rozkład normalny
b) ciągła, lecz nie o rozkładzie normalnym
c) z natury swej dychotomiczna
d) dzieli się w punkcie mediany

20. Rzetelność testu można wyrazić jako:


a) stosunek wariancji prawdziwej do wariancji błędu
b) wariancji otrzymanej do wariancji prawdziwej
c) stosunek wariancji prawdziwej do wariancji otrzymanej
d) stosunek wariancji błędu do wariancji otrzymanej

21.Wielkość standardowego błędu pomiaru zależy od:


a) odchylenia standardowego wyników testowych
b) współczynnika rzetelności
c) obu możliwości
d) żadnej z możliwości

22. Jeżeli test jest zbyt trudny dla badanej grupy osób, to rozkład wyników w tym teście będzie:
a) normalny
b) skośny
a) prostokątny
b) wielomodalny

23.Znajomość współczynnika mocy dyskryminacyjnej pozwala nam na:


a) wskazanie pozycji zbyt trudnych
b) wskazanie pozycji mierzących inną zmienną ,
c) wskazanie pozycji mierzących zachowania pozatestowe
d) wskazanie pozycji nietrafnych

24. Jeżeli rozkład wyników surowych jest rozkładem lewoskośnym, to w celu jego normalizacji należy
zastosować następującą transformację:
a) pierwiastkową
b) logarytmiczną
c) potęgową
d) żadną z nich
25.Trafność teoretyczna testu znajduje swoje odzwierciedlenie w:
a) hipotezach wyprowadzanych z teorii mierzonej zmiennej
b) rezultatach analizy czynnikowej wyników testowych
c) obu wymienionych możliwości
d) żadnej z wymienionych możliwości

27. Standaryzacja testu odnosi się do:


a) komercyjnej użyteczności testu
b) jednolitości procedury
c) zgodności z normami
d) określania jego rzetelności i trafności

28. Współczynnik KR-20 to:


a) średnia wszystkich współczynników typu test-retest
b) średnia wszystkich współczynników typu split-half
c) średnia wszystkich współczynników typu split-test
d) średnia wszystkich współczynników powyżej 0.8

29. Standardowy błąd pomiaru jest szczególnie użyteczny przy:


a) porównywaniu dwóch wyników testowych między sobą
b) określaniu statystycznej istotności wyniku testowego
c) porównywaniu dwóch testów między sobą
d) określaniu istotności statystycznej pozycji testowej

15.Trafność kryterialna to inaczej:


a) trafność predykcyjna i treściowa
b) trafność diagnostyczna i treściowa
c) trafność prognostyczna i diagnostyczna ,•
d) trafność teoretyczna i treściowa

16.RzeteIność testu jest wyrażana w postaci:


a) odchylenia standardowego
b) prawdopodobnego błędu wyniku testowego
c) współczynnika korelacji
d) różnicy pomiędzy dwoma wynikami

17.Aby znormalizowane wyniki testowe były użyteczne odnosi się je do:


a) treści .pozycji tworzących test psychologiczny
b) innych metod testowych
c) zachowania wybranej, dobrze określonej grupy
d) rzetelności 'i trafności metody

18.Kontaminacja kryterium najczęściej pojawia się, gdy:


a) test ma niską rzetelność
b) psychiatra ma dostęp do wyników testowych
c) łączy się wyniki dwóch różnych grup osób badanych
d) łączy się wyniki pomiaru dwóch różnych kryteriów

23.Znajomość współczynnika mocy dyskryminacyjnej pozwala nam na:


-wskazanie pozycji mierzących inną zmienną ,
-wskazanie pozycji mierzących zachowania pozatestowe
-wskazanie pozycji nietrafnych

24. Jeżeli rozkład wyników surowych jest rozkładem lewoskośnym, to w celu jego normalizacji należy
zastosować następującą transformację:
a) pierwiastkową
b) logarytmiczną
c) potęgową
d)żadną z nich

25.Trafność teoretyczna testu znajduje swoje odzwierciedlenie w:


a) hipotezach wyprowadzanych z teorii mierzonej zmiennej
b) rezultatach analizy czynnikowej wyników testowych
c) obu wymienionych możliwości
d) żadnej z wymienionych możliwości

26. Standardowy błąd estymacji wyniku prawdziwego jest to:


a) różnica miedzy estymowaną wartością wyniku prawdziwego a jego rzeczywistą wartością

27. Standaryzacja testu odnosi się do:


e) komercyjnej użyteczności testu
f) jednolitości procedury
g) zgodności z normami
h) określania jego rzetelności i trafności

28. Współczynnik KR-20 to:


d) średnia wszystkich współczynników typu test-retest
e) średnia wszystkich współczynników typu split-half
f) średnia wszystkich współczynników typu split-test
d) średnia wszystkich współczynników powyżej 0.8

29. Standardowy błąd pomiaru jest szczególnie użyteczny przy:


c) porównywaniu dwóch wyników testowych między sobą
d) określaniu statystycznej istotności wyniku testowego
c) porównywaniu dwóch testów między sobą
d) określaniu istotności statystycznej pozycji testowej
Psychometria ZAOCZNI 09.02.2014

1. Staniny to wyniki standardowe wyrażone na skali


a) M=5 SD=2
b) M=5 SD=4

2. Tworzymy test, na potrzebę organizacji, by zbadać jakie osoby sa najlepsze. Tylko wewnątrz
organizacji. Jakiego typu normy będą
- norma organizacyjna
- norma lokalna
-norma globalna
-norma instytucjonalna

3. Pytanie o prawidłowy wskaźnik rzetelności:


a) 0,6
b) 0,7
c) 0,8
d) 0,9

4. Ktoś otrzymał w teście wynik 12. Przedzial ufności 90 miał wynik 6, przedział inny miał wynik 8;
a przedzial 95 miał wynik 4 (czy cos takiego) i w jakim przedziale mieści sie osoba, gdy p=0,05
a) (6; 8)
b) (8,16)
c) 10, 14
d) (12; 12)

5) im wieksza homogenicznosc grupy tym:


B) rzetelnosc maleje
C) cos o trafności
D) nie ma zwiazku

6. Pytanie o etikalne
a) uniwersalne kulturowo

7. Która odpowiedź jest prawdziwa: Wynik prawdziwy


a) koreluje z błędem
b) nie koreluje z wynikiem obserwowanym
c) wynik prawdziwy nie koreluje z błędem

8. Uzupelnianka o tym przewidywaniu wyników ? Jaka to trafnosc ?


a) diagnostyczna
b) prognostyczna
9 Na skali tetronowej dane zawarte między 6-14 zawierają sie w przedziale:
a) 68%
b) 85
c) 95
10. Miedzygrupowa korelacja to trafnosc
a) treściowa
b) teoretyczna
c) krytyczna

11. Alfa cronbacha do


a) rzetelnośc i trafnosc

12. Miara czego jest (czy o czym mówi) dewiacyjny iloraz inteligencji:
a) odchylenia standardowego

13. Jeśli chcemy zmierzyć wyniki skrajne (największy rozstrzal wyników to używamy )
a) T (M=50 SD= 10)
b) staniny (M=5 SD=2)
c) steny (M=5.5 SD= 2)
d) Tetrony (M= 10 SD=4)

14. Pytanie o błąd systematyczny w stosunku do rzetelności? - czy jest


a) istotny
b) nieistotny

15. Które zdanie jest nieprawdziwe o centylach


a) roznicuja na koncach rozkladu.

16. O czym mówi parafraza- jako narzędzie adaptacji


c) konieczność opracowania narzędzia, ktie na wersji pierwotnej
d)

17. Kontaminacja kryterium pojawia się najczęściej, gdy:


a) test ma niską rzetelność
b) badający ma dostęp do wynikow

18. Coś o wartości 55 centyli


a) że świadczy o 55% wyniku i wyższym… nie pamiętam dokładnie
b)45%
c) uzyskali wynik 55 bądź mniejszy

19. w metodzie testów równoległych w odróżnieniu od metody test-retest minimalizowany jest


wpływ (albo coś w tym stylu)
b) pamięci i uczenia się

20) Standaryzacja (ale czego? bo jeśli wyniki standardowe to dobrą odpowiedzią będzie b - zobacz pytanie Izy Fischer na
forum i odpowiedź, co prof. mówiła na wykładzie)
a) polegającą na tworzeniu standardowych warunków stosowania testu
b) wyniki wyrażone w terminach odchylenia standardowego
c) wyniki wyrażone w terminach obiektywnych standardów
d) wyniki uzyskane za pomocą wystandaryzowanego narzęd
21) Standaryzacja
b) jednoliotość warunków

22) Analiza macierzy korelacji


a) trafność teoretyczna

23) Procedura nadawania znaczenia empirycznego konstruktom teoretycznym


a) operacjonalizacja

24) Zgodnie z klasyczna koncepcja wyniku prawdziwego, wynik otrzymany:


a) jest wiekszy od wariancji bledu

25. rzetelność testu jest wyrażana w postaci


a) odchylenia standardowego
b) prawdopodobnego błędu wyniku testowego
c) współczynnika korelacji
d)różnicy pomiędzy 2 wynikami

26. Które w standaryzacji stwierdzenie jest mniej istotne?


a) Prawa autorskie.
b) stosowanie testu przez osobę niedoświadczoną może spowodować złe efekty

27. rzetelność testu to również jedno z kryteriów dobroci testów psychologicznych. Rzetelność
testu oznacza przede wszystkim następującą właściwość wyników teoretycznych
a) powtarzalność
b) obiektywność
c) istotność
d) trafność

28. w której z przedstawionych niżej sytuacji może dojść do zjawiska kontaminacji kryteriów:
a) psychiatra dokonując oszacowania wyników badanych osób ze względu na zmienną
kryterialną miał dostęp do wyników testowych
b) psychiatra dokonując oszacowania wyników badanych osób ze względu na zmienną kryterialną
znał podręcznik testowy
c) autor testu znał procedurę szacowania badanych osób ze względu na zmienną kryterialną
d) autor testu połączy ł wyniki otrzymane dla dwóch różnych zmiennych kryterialnych

29. trafność teoretyczna uważana jest za najważniejszy rodzaj trafności. Znajduje ona swoje
odzwierciedlenie w
a) hipotezach dotyczących zachowania badanych osób tworzonych na podstawie istotnych dla
psychologa teorii psychologicznych
ykonania maksymalnego
d) wykonania oczekiwanego

.
1. Która z poniższych definicji jest pełną i wyczerpującą definicją testu psychologicznego?
a) jest to obiektywny i standaryzowany pomiar próbki zachowania
b) jest to kontrolowana ilościowa obserwacja zachowania
c) jest to pomiar próbki zachowania wybranej grupy ludzi
d) jest to standaryzowany zbiór bodźców dla mierzalnych reakcji

1. trafność fasadowa powinna być brana pod uwagę w przypadku testu, gdyż:
a) stanowi podstawę statystycznego doboru pozycji
b) jest częścią składową każdego rodzaju trafności
c) jest dowodem, że test mierzy to, co zmierzył jego autor
d) zapewnia zgodność wyglądu testu czym.... sądzi osoba badana

1. wyniki standardowe to
a) wyniki uzyskane w standardowych warunkach
b) wyniki wyrażone w terminach odchylenia standardowego
c) wyniki wyrażone w terminach obiektywnego standardu
d) wyniki uzyskane za pomocą wystandaryzowanego narzędzia

1. pojęcie normy w teście odnosi się do:


a) wykonania idealnego
b) wykonania maksymalnego
c) wykonania oczekiwanego
d) wykonania typowego

1. tetrony to wyniki standardowe wyrażone na skali


a) M=10 SD=2
b) M=10 SD=4
c) M=10 SD=1
d) M=10 SD=10

1. wysoki współczynnik korelacji pomiędzy dwoma testami równoległymi stosowanymi


jeden po drugim, bez przerwy czasowej, świadczy o:
a) funkcjonalnej mierzonej zmiennej w czasie
b) niskiej homogeniczności wysokiej specyficzności pozycji testowych
c) niskiej specyficzności i wysokiej homogeniczności pozycji testowych
d) o dużym stopniu obiektywności

1. w metodzie testów równoległych, w odróżnieniu od metody test-retest minimalizowany


jest wpływ:
a) pamięci i efektów uczenia się
b) braku stałości zmiennej
c) heterogeniczności zmiennej
d) szybkości rozwiązania zadań

1. otrzymanie różnych współczynników trafności kryterialnej dla danego testu jest


najczęściej spowodowany:
a) faktem wybrania różnych zmiennych kryterialnych
b) błędami w obliczeniach
c) niską rzetelnością testu
d) trudnościami w diagnozowaniu zachowania mierzonego przez test

1. test składa się z 10 pytań. Powinien dobrze różnicować w obrębie patologii. Która z
poniższych skal standardowych najlepiej pozwalałaby zrealizować ten cel:
a) M=10, SD=5
b) M=10 SD=1
c) M=50 SD=10 , jak poniżej (Hornowska, str. 138 “Testy Psychologiczne”)
d) M=50 SD=25
skalę T stosuje się głównie w testach przeznaczonych do diagnozowania patologii
Bo jest to skala bardzo długa i sięga od -5 do +5 odchyleń standardowych . T = 10z + 50

1. błąd standardowy różnicy jest to:


a) różnica 2 błędów standardowych
b) suma 2 błędów standardowych podniesionych do kwadratu z których
wyciągnięto pierwiastek (patrz wzór)
c) różnica 2 błędów standardowych podniesionych do kwadratu z których
wyciągnięto pierwiastek
d) suma dwóch błędów standardowych

1. aby spełnić warunek obiektywności, każdy test musi być przynajmniej:


a) stosowany i obliczany w z góry ustalonych warunkach
b) wysoko rzetelny
c) losową próbką wskaźników zmiennej teoretycznej
d) oparty na wybranej teorii mierzonej zmiennej

1. Stanina to
a) wynik surowy
b) wynik wskazujący na wiek umysłowy
c) inna nazwa centyli
d) znormalizowany wynik standardowy

1. centyle to wyniki, które wskazują jaki procent osób z badanej grupy uzyska wyniki:
a) takie same lub wyższe od danego wyniki
b) takie same lub niższe od danego wyniku
c) wyższe od średniej
d) niższe od średniej

1. określanie rzetelności testu pozwala na ustalenie:


a) jaki % wariancji otrzymanej stanowi wariancja prawdziwa
b) wielkości błędu stałego w pomiarze testowym
c) jaką część wariancji błędu stanowi wariancja prawdziwa
d) możliwych fluktuacji wielkości współczynnika R
1. trafność kryterialna to inaczej
a) trafność predykcyjna i treściowa
b) trafność diagnostyczna i treściowa
c) trafność prognostyczna i diagnostyczna
d) trafność teoretyczna i treściowa

1. rzetelność testu jest wyrażana w postaci


a) odchylenia standardowego
b) prawdopodobnego błędu wyniku testowego
c) współczynnika korelacji
d) różnicy pomiędzy 2 wynikami

1. aby znormalizowane wyniki testowe były użyteczne odnosi się je do:


lanie
a) treści pozycji tworzących test psychologiczny
b) innych metod testowych
c) zachowania wybranej, dobrze określonej grupy
d) rzetelności i trafności metody

1. kontaminacja kryterium najczęściej pojawia się, gdy:


a) test ma niską rzetelność
b) psychiatra ma dost
ęp do wyników testowych
c) łączy się wyniki dwóch różnych grup osób badanych
d) łączy się wyniki pomiaru dwóch różnych kryteriów
Kontaminacja:tj. możliwe źródło błędu przy walidacji testu, gdy oceny kryterialne
zostają „skażone” na skutek tego, że osoba oceniająca zna wyniki testu
(Np. przy wystawianiu ocen szkolnych( kryteriów trafności testu) nauczyciel
rozstrzyga wątpliwości na korzyść osoby, o której wie, że uzyskała wysoki wynik
w teście zdolność).

Kontaminacja kryterium:
wyniki testowe nie mogą wpływać
na pozycję jednostki w zakresie
branego pod uwagę kryterium

1. stosując współczynnik korelacji dwuseryjnej, jako współczynnik mocy dyskryminacyjnej,


musi zostać spełnione założenie, że zmienna zdychotomizowana jest:
a) rzeczywiście ciągła i posiada rozkład normalny,
b) ciągła lecz nie o rozkładzie normalnym
c) z natury swej dychotomiczna
d) dzieli się w punkcie mediany

1.
2. rzetelność testu można wyrazić jako:
a) stosunek wariancji [prawdziwej do wariancji błędu
b) stosunek wariancji otrzymanej do wariancji prawdziwej
c) stosunek wariancji prawdziwej do wariancji otrzymanej
d) stosunek wariancji błędu do wariancji otrzymanej

1. wielkość SEM zależy od:


a) odchylenia standardowego wyników testowych,
b) współczynnika rzetelności
c) obu możliwości
d) żadnych możliwości

1. jeżeli test jest zbyt trudny dla badanej grupy osób to rozkład wyników w tym teście
będzie:
a) normalny
b) prostokątny
c) skośny
d) wielomodalny

1. znajomość współczynnika mocy dyskryminacyjnej pozwala nam na


a) wskazania pozycji zbyt trudnych
b) wskazanie pozycji mierzących inną zmienną
c) wskazanie pozycji mierzącej zachowania poza testowe
d) wskazanie pozycji nietrafnych

1. jeżeli rozkład wyników surowych jest rozkładem lewoskośnym, to w celu jego


normalizacji należy zastosować następującą transformację:
a) pierwiastkową,
b) logarytmiczną
c) potęgową
d) żadną z nich

1. trafność teoretyczna testu znajduje swoje odzwierciedlenie w:


a) hipotezach wyprowadzanych z teorii mierzonej zmiennej
b) rezultatach analizy czynnikowej wyników testowych
c) obu z wymienionych możliwości
d) żadne z wymienionych możliwości

1. standardowy błąd estymacji wyniku prawdziwego jest to:


a) różnica między estymowaną wartością wyniku prawdziwego a jego
rzeczywistą wartością
b) różnica między wynikiem otrzymany a wynikiem prawdziwym w teście
c) obie definicje są prawdziwe
d) żadna definicja
1. standaryzacja testu odnosi się do:
a) komercyjnej użyteczności testu
b) jednolitości procedury
c) zgodności z normami
d) określania jego rzetelności i trafności

1. współczynnik KR-20 to:


a) średnia wszystkich współczynników typu test-retest
b) średnia wszystkich współczynników typu split-half
c) średnia wszystkich współczynników splittest
d) średnia wszystkich współczynników powyżej 0,8

1. standardowy błąd pomiaru jest szczególnie użyteczny przy:


a) porównywaniu dwóch wyników testowych między sobą
b) określaniu statystycznej istotności wyniku
c) porównywaniu dwóch testów między sobą
d) określaniu istotności statystycznej pozycji testowej

1. testy przeznaczone do selekcji ze względu na specyficzne kryterium, powinny składać


się z pozycji testowych, których współczynnik trudności :
a) wynosi 0,5
b) mieści się w przedziale od 0-100%
c) wyznaczony jest przez rozkład normalny
d) jest równy wyznaczonemu punktowi selekcji

1. formuła Spearmana - Browna jako metoda szacowania rzetelności stosowana jest w


technice:
a) test-retest
b) testów równoległych
c) połówkowania (split-half)
d) Krudera-Richardsona

1. dla którego z poniższych rodzajów testów, określenie trafności treściowej będzie


najbardziej odpowiednie
a) testów zdolności werbalnych
b) testów wiadomości z matematyki
c) testów projekcyjnych
d) testów inteligencji

1. badanie trafności metodą wielu cech-wielu metod polega na:


a) analizowaniu tylko aspektu zbieżnego trafności
b) analizowaniu tylko aspektu różnicowego trafności
c) analizowaniu jednocześnie aspektu zbieżnego i różnicowego
d) żądne z powyższych możliwości
1. formuła spearmana-browna pozwala na określenie wpływu następujących zmiennych
na wielkość współczynnika rzetelności:
a) heterogeniczności próbki badanych osób
b) homogeniczności pozycji testowych
c) trafności testu
d) długości testu

1. steny to wyniki standardowe wyrażone na skali


a) M=5 SD=2 (staniny)
b) M=5 SD=4
c) M=5,5 SD=2
d) M=5,5 SD=4

1. staniny to wyniki standardowe wyrażone na skali:


a) M=5 SD=2
b) M=5 SD=4
c) M=5,5 SD=2
d) M=5,5 SD=4

1. skala T to wyniki standardowe wyrażone na skali:


a) M=50 SD=2
b) M=50 SD=4
c) M=100 SD=15
d) M=50 SD=10

1. rzetelność testu to również jedno z kryteriów dobroci testów psychologicznych.


Rzetelność testu oznacza przede wszystkim następującą właściwość wyników
teoretycznych
a) powtarzalność
b) obiektywność
c) istotność
d) trafność

1. jedyny, z kryteriów normalnych, branych pod uwagę przy tworzeniu testu jest
współczynnik trudności poszczególnych pozycji testowych. Jeżeli tworzymy test dla
celów selekcji i mamy dużo kandydatów, a możemy przyjąć najwyżej 10% to większość
pozycji testowych z tego testu powinna być:
a) raczej trudnych
b) raczej łatwych
c) raczej o przeciętnej trudności
d) raczej o wysokim współczynniku rzetelności niż trafności

1. wiedząc, że w klasycznej teorii testów przyjmuje się wynik obserwowany = wynik


prawdziwy + błąd pomiaru, określ co powinno być podstawowym obowiązkiem autora
testu:
a) dążenie do zwiększenia wyniku prawdziwego danej osoby,
b) dążenie do zmniejszenia błędu pomiaru
c) dążenia do zwiększenia wyniku obserwowanego
d) J

1. obiektywność jest jeden z tzw. kryteriów dobroci testów psychologicznych. Aby spełnić
warunek obiektywności każdy test musi przynajmniej
a) zostać oparty na teorii mierzonej zmiennej
b) dawać porównywalne wyniki niezależnie od tego gdzie i kiedy jest
stosowany
c) być obliczany w ściśle określonych warunkach
d) posiadać wysokie wskaźniki rzetelności i trafności

1. warunek standaryzacji, czyli koleje kryterium dobroci testów psychologicznych zostanie


spełniony wtedy gdy:
a) test będzie stosowany w jednolity sposób w stosunku do wszystkich osób
badanych
b) test zostanie wyposażony w podręcznik zawierający opis zasad jego stosowania
c) test będzie stosowany odpowiednio do możliwości osoby badanej
d) test zostanie zastosowany tylko w takich sytuacjach w których jego wyniki będą
miały praktyczną użyteczność

1. jednym z kryteriów formalnych branym przy tworzeniu testu jest współczynnik trudności
poszczególnych pozycji testowych. Jeżeli chcemy zastosować test do selekcji
kandydatów uwzględniając określony punkt odcięcia to powinniśmy wybrać taki test,
który składa się z pozycji testowych, których współczynniki trudności wynosi:
a) 0,6
b) mieści się w zakresie 0-100%
c) jego średnia wartość wynosi 50%
d) jest równy wyznaczonemu punktowi selekcji

1. znajomość współczynnika mocy dyskryminacyjnej poszczególnych pozycji testowych


pozwala nam na
a) wyeliminowanie pozycji należących do innego testu
b) wyeliminowanie pozycji mierzących inna zmienną niż zmienna testowa,
c) wyeliminowanie pozycji które nie różnicują badanej populacji
d) wyeliminowanie pozycji zbyt mocno różnicujące badane osoby

1. ???????stosując współczynnik korelacji punktowo-dwuseryjnej, jako współczynnik mocy


dyskryminacyjnej trzeba pamiętać o tym, że:
a) wynik pozycji testowej powinien być z natury swej dychotomiczny
b) rozkład wyników pozycji testowej powinien być rozkładem dwumodalnym
c) wynik pozycji testowej powinien być zmienną ciągłą
d) rozkład wyników pozycji testowej powinien być rozkładem normalnym
1. w klasycznej teorii testów przyjmuje się założenie, że
a) błąd pomiaru = wariancja wyników testowych
b) błąd pomiaru ma charakter losowy
c) błąd pomiaru jest błędem stałym
d) błąd pomiaru jest równy odchyleniu standardowemu wyników testowych

1. określanie współczynnika rzetelności testu pozwala na ustalenie:


a) jaką część wariancji błędu stanowi wariancja prawdziwa
b) jaką część wariancji prawdziwej stanowi wariancja błędu
c) jaką część wariancji otrzymanej stanowi wariancja prowadzą Wynik otrzymany =
prawdziwy + błąd
d) jaką część wariancji prawdziwej stanowi wariancja otrzymana

1. rzetelność jako miara dokładności pomiaru testowego testu jest technicznie wyrażana w
postaci:
a) współczynnika zmienność
b) współczynnika korelacji
c) współczynnika zgodności
d) współczynnika regresji

1. formuła Spermana-Browna jako metoda szacowania rzetelności testu jest rutynowo


stosowana w technice:
a) podwójnego testowania
b) testów równoległych
c) KR
d) połówkowania

1. standardowy błąd estymacji wyniku otrzymanego jest to:


a) różnica między estymowaną wartością wyniku prawdziwego a jego
rzeczywistą wartością
b) różnica między wynikiem otrzymanym a wynikiem prawdziwym w teście
c) różnica między estymowanym wynikiem otrzymanym a wynikiem rzeczywistym
d) różnica między wynikiem rzeczywistym a wynikiem, który pomniejszono o błąd
pomiaru

1. błąd standardowy różnicy jest to


a) różnica dwóch błędów standardowych
b) różnica dwóch błędów standardowych podniesionych do kwadratu, z których
wyciągnięto pierwiastek
c) suma dwóch błędów standardowych
d) suma dwóch błędów standardowych podniesionych do kwadratu z której
wyciągnięto pierwiastek

1. dokonując diagnozy na podstawie wyniku testowego, należy wziąć pod uwagę


standardowy błąd pomiaru ponieważ,
a) tylko w ten sposób można określić istotność otrzymanych wyników
b) pozwala on na dokładne określenie poziomu istotności wyniku prawdziwego,
c) dzięki niemu można określić wielkość błędu jakim jest obciążony wynik
testu
d) pozwala on określić wielkość błędu jaki popełniany jest przy interpretowaniu
wyniku poszczególnych pozycji testowych

1. trafność testu to również jedno z kryteriów dobroci testów psychologicznych. Klasyczny


podział obejmuje następujące rodzaje trafności:
a) trafność treściową kryterialną i teoretyczną
b) trafność treściową fasadową i kryterialną
c) trafność treściową logiczną i wewnętrzną
d) trafność treściową diagnostyczną i prognostyczną

1. często zdarza się, że autorzy przeprowadzający badania danego testu uzyskują różne
współczynniki trafności kryterialnej. Jest to najczęściej spowodowane:
a) niskimi współczynnikami pozostałych rodzajów trafności
b) niskimi współczynnikami rzetelności testu
c) trudnościami w diagnozowaniu zachowania mierzonego przez test
d) faktem wybrania różnych zmiennych kryterialnych

1. w której z przedstawionych niżej sytuacji może dojść do zjawiska kontaminacji


kryteriów:
a) psychiatra dokonując oszacowania wyników badanych osób ze względu na
zmienną kryterialną miał dostęp do wyników testowych
b) psychiatra dokonując oszacowania wyników badanych osób ze względu na
zmienną kryterialną znał podręcznik testowy
c) autor testu znał procedurę szacowania badanych osób ze względu na zmienną
kryterialną
d) autor testu połączy ł wyniki otrzymane dla dwóch różnych zmiennych
kryterialnych

1. trafność teoretyczna uważana jest za najważniejszy rodzaj trafności. Znajduje ona


swoje odzwierciedlenie w :
a) hipotezach dotyczących zachowania badanych osób tworzonych na podstawie
istotnych dla psychologa teorii psychologicznych
b) hipotezach dotyczących zachowania badanych osób tworzonych na
podstawie teorii mierzonej zmiennej
c) rezultatach badań nad rzetelnością teorii psychologicznej, która leży u podstaw
testu
d) rezultatach badań nad trafnością teorii psychologicznej, która leży u podstaw
testu

1. istnieje wiele rodzajów trafności. W zależności od celu testowania niektórych z nich


mają większe znaczenie. Dla którego z poniższych rodzajów testów określenie trafności
treściowej będzie najbardziej pożądane:
a) testów projekcyjnych
b) testów inteligencji
c) testów zdolności werbalnych
d) testów wiadomości z matematyki

1. pojęcie normy w teście psychometrycznym odnosi się do:


a) wykonania typowego
b) wykonania idealnego
c) wykonania maksymalnego
d) wykonania oczekiwanego

1. wyniki standardowe za pomocą których można przedstawić wyniki uzyskane w teście


otrzymane przez osoby badane to:
a) wyniki uzyskane w standardowych warunkach
b) wyniki wyrażone w terminach odchylenia standardowego
c) wyniki wyrażone w terminach obiektywnych standardów
d) wyniki uzyskane za pomocą wystandaryzowanego narzędzia

1. aby znormalizowane wyniki testowe były użyteczne, tzn. można je był zinterpretować
należy je odnieść do:
a) rzetelności i trafności metody
b) treści pozycji tworzących test psychologiczny
c) zachowania wybranej, dobrze określonej grupy
d) innych metod testowych

1. steny to:
a) wynik surowy
b) wynik wskazujący na wiek umysłowy
c) inna nazwa centyli
d) znormalizowany wynik standardowy

18.Kontaminacja kryterium najczęściej pojawia się, gdy:


a) test ma niską rzetelność
b) psychiatra ma dostęp do wyników testowych
c) łączy się wyniki dwóch różnych grup osób badanych
d) łączy się wyniki pomiaru dwóch różnych kryteriów

23.Znajomość współczynnika mocy dyskryminacyjnej pozwala nam na:


a) wskazanie pozycji zbyt trudnych
b) wskazanie pozycji mierzących inną zmienną ,
c) wskazanie pozycji mierzących zachowania pozatestowe
d) wskazanie pozycji nietrafnych

19. Stosując współczynnik korelacji dwuseryjnej jako współczynnik mocy dyskryminacyjnej, musi zostać
spełnione założenie, że zmienna zdychotomizowana jest:
a) rzeczywiście ciągła i posiada rozkład normalny
b) ciągła, lecz nie o rozkładzie normalnym
c) z natury swej dychotomiczna
d) dzieli się w punkcie mediany

20. Rzetelność testu można wyrazić jako:


a) stosunek wariancji prawdziwej do wariancji błędu
b) wariancji otrzymanej do wariancji prawdziwej
c) stosunek wariancji prawdziwej do wariancji otrzymanej
d) stosunek wariancji błędu do wariancji otrzymanej

21.Wielkość standardowego błędu pomiaru zależy od:


a) odchylenia standardowego wyników testowych
b) współczynnika rzetelności
c) obu możliwości
d) żadnej z możliwości

22. Jeżeli test jest zbyt trudny dla badanej grupy osób, to rozkład wyników w tym teście
będzie:
a) normalny
b) skośny
e) prostokątny
f) wielomodaln

24. Jeżeli rozkład wyników surowych jest rozkładem lewoskośnym, to w celu jego normalizacji
należy zastosować następującą transformację:
a) pierwiastkową
b) logarytmiczną
g) potęgową
h) żadną z nich

27. Standaryzacja testu odnosi się do:


a) komercyjnej użyteczności testu
b) jednolitości procedury
c) zgodności z normami
d) określania jego rzetelności i trafności

28. Współczynnik KR-20 to:


a) średnia wszystkich współczynników typu test-retest
b) średnia wszystkich współczynników typu split-half
c) średnia wszystkich współczynników typu split-test
d) średnia wszystkich współczynników powyżej 0.8

Ja mam jeszcze takie pytania -> więc dopisuję: (prosze o weryfikacje)


1. Która z metod pozwala na największe zmiany w adaptacji ?
REKONSTRUKJCJA bo zarówno zachowania jak i konstrukty nie sa uniwersalne kulturowo

a nie parafraza? gdzieś wy pytaniach innych było, że parafraza. K. NIE

1. Gdy zalezy nam na motywacji osoby badanej do rozwiązywania testow, to wazna


jest?
Trafność fasadowa

1. Co to sa tetrony?
Jednostki skali standardowej

1. 40% centyle?
"40% osob ma gorsze lub takie same ? wyniki od tej osoby, ktora otrzymała wynik rowny 40
centylowi"

1. Wskaźnik mocy dyskryminacyjnej


Wysokie, dodatnie ← są bardziej pożądane

1. Moc dyskryminacyjna?
Korelacja miedzy wynikiem pozycji testowej a wynikiem całego testu.

1. Trafność kryterialna
Prognostyczna i diagnostyczna

1. Rzetelność testu
Wskaźnik korelacji miedzy wynikiem dwoch badan tym samym testem tym samych ludzi.

1. X=T+E
Zmniejszyć E

1. Które w standaryzacji stwierdzenie jest mniej istotne?

Dwie odp. Prawa autorskie, Wpadnie w rece niepsychologow

1. Standaryzacja
Jednolitość

1. Niski współczynnik korelacji miedzy testami A I B ( rownolegle) ( badanie po


odstępie czasu)
Wysoka specyficzność pozycji testowych

1. Normy lokalne
Ścisle określone grupy ludzi

1. Normy
Zachowania typowe

15.Budowanie przedziału dla wyniku otrzymanego

Rzetelność ? SEM?
16.Porównanie dwoch ludzi, aby wybrac lepszego to:
Standardowy bład roznicy

17. Odniesienie pozycji testu do uniwersum?


Trafność tresciowa

18. Gdzie najwieksza jest trafność?


Odp. Test z historii

19. Analiza korelacji macierzy to:


Zbieżna i rozbieżna

20. Test – retest (wada)


Zapamiętywanie

21. Błąd we wzorze X=T+E


Losowy

22. Co nie jest w definicji testu ?


Odp. Wystandaryzowana skala ze średnią 100

23. Współ. Trudności testu ( gdy chcemy zastosować test do SELEKCJI)


Odp. Jest równy wyznaczonemu punktowi selekcji.

24 Trafność teoretyczna jak jest weryfikowana?

Hipotezy weryfikowane za pomocą teorii stojącej za testem

1Jeśli współczynnik rzetelności wynosi 0,8, to znaczy, że:


- zmienna wyjaśnia 80% wariancji, a 20% to błąd

Jaką miarę statystyczną wykorzystujemy do badania rzetelności?


- współczynnik korelacji

Który test jest bardziej rzetelny: o współczynniku rzetelności -0,90, +0,90, -0,30, +0,30?
- +0,90

Jeżeli znamy rzetelność połowy testu, to do obliczenia rzetelności całego testu użyjemy:
- wzór Spearmana-Browna

Jak na rzetelność testu wpływa jego dlugość?


- dodatnio (im dłuższy test ty większa rzetelność)

Jak na rzetelność testu wpływa homogeniczność badanej grupy?


- ujemnie
Oblicz przedział ufności jeżeli alfa wynosi 0,9.
- przedział ufności = 1 - alfa = 1 - 0,9 = 0,1

Zbuduj standardowy błąd pomiaru, jeżeli zα/2 = 2, a SEM = 0,4.


- błąd pomiaru = zα/2 x SEM = 2 x 0,4 = 0,8

Kiedy wykorzystujemy błąd standardowy różnicy?


- gdy chcemy porównać 2 wyniki ze sobą
-
Co to są emiki i etyki?

Jeżeli współczynnik trudności testu wynosi t = 90%, to test jest:


- łatwy (90% osób potrafi na niego odpowiedzieć)

Optymalny współczynnik trudności testu wynosi:


- t=ok.50%

Do analizy różnic międzygrupowych wykorzystujemy:


- test t studenta

Co mierzą korelacyjne współczynniki mocy dyskryminacyjnej?


- korelacje danej pozycji z ogólnym wynikiem w teście

Jakie wartości tych korelacji nas interesują?


- wysokie dodatnie

Pomiar testowy jest pomiarem:


- pośrednim (mierzymy zachowanie - wnioskujemy o konstrukcie)

Prawa osoby badanej:


- ma być poinformowany o tym, że ktoś go ocenia (czynniki motywacyjne)

Prawa badającego:
- ściśle określony zakres dopuszczalnych zachowań

Dobra rzetelność:
- gdy współczynnik rzetelności wynosi conajmniej 0,8.

Czym się kierować ustalając długość przerwy czasowej między testem a retestem?
- żeby zminimalizować skutki zapamiętywania swoich odpowiedzi i zminimalizować efekty
uczenia się nowych rzeczy (optymalny czas - od 2 tyg. do 6 miesięcy)

Jak zapamiętywanie wpływa na wielkość współczynnika rzetelności:


- przeszacowuje go (wychodzi za duży)
Jak uczenie się wpływa na wielkość współczynnika rzetelności?
- nie doszacowuje go

Gdy alfa Cronbacha (współczynnik zgodności) jest duża:


- jednowymiarowa struktura testu

Gdy jest mała alfa Cronbacha:


- wielowymiarowa struktura testu

Do analizy homogeniczności testu (trafność teoretyczna) wykorzystujemy:


alfę Cronbacha - tą samą co przy rzetelności

Podział norm ze względu na grupę odniesienia


- ogólnokrajowe i lokalne

Norma w psychometrii ma charakter:


- statystyczny

technika ślepej diagnozy:


- arkusz jednej osoby rozsyłany jest do różnych psychologów (slepa bo nie ma kontakty z OB i
dane z kontaktu moga byc zaklocajace)

1.Test psychologiczny: sytuacja w ktorej wywolujemy zachowanie, ktore jest wskaznikiem


danej cechy

Test obiektywny (wyrazny klucz)


test mocy (rozwiazuje sie wszystkie zadania)
test szybkosci (czas odpowiedzi wyznacza liczbe zadan - mierzy poziom mierzonej cechy
+szybkosc myslenia)

Standaryzacja:
-odtworzenie osobie badanej arunkow jakie byly w gr.normalizacyjnej + pozwala na porownanie
wynikow miedzy soba

Test obiektywny: wyniki niezalezne od osob, ktore je opracowuja


Test wystandaryzowany: jednolitosc procedury badania testem

rzetelnosc -= powtarzalnosc

wynik otrzymany = wynik prawdziwy + błąd (błąd ma charakter losowy)

żródła błędów o charakterze losowym:


osoba badana
osoba badajaca
sytuacja badania (w kazdje sytuacji badanej pojawia sie blad)

Badacz dazy do - minimalizowania błędu (E)


RZETELNOSC TESTU DEFINICJE:

> definicja nieoperracyjna - wielkosc wspolczynnika korelacji pomiedzy wynikiem


otrzymanym a prawdziwym

>definicja operacyjna - wspolczynnik korelacji miedzy dwoma poziomami wykonywania tego


samego testu w tej samej grupie

MOZNA UDOWODNIC< ZE DRUGI WSPOLCZYNNIK JEST ROWNY KWADRATOWI


KORELACJI MIEDZY WYNIKIEM OBSERWOWANYM A PRAWDZIWYM ( jest korelacja min.O,
max1, nie moze byc -1)
min.rzetelnosc testu pozwalajaca na stosowanie go w diagnozie indywidualnej = 0,8

najmniejsza rzetelnosc = 0

wspolczynnik korelacji = 0,6 , okresl jaki % wariancji wyjasnia wynik prawdziwy a ile %
blad pomiaru
60 prawdziwy, 40 blad

TRZY SPOSOBY ROZUMIENIA RZETELNOSCI:


1) stabilnosc (powtarzalnosc wynikow)
2)powtarzalnosc tresci
3 homogenicznosc - zgodnosc wewnetrzna

>>>>>szczegolowo:<<<<<<<<
1)stabilnosc - powtarzalnosc wynikow
( 2 razy badamy te sama gr osob tym samym testem - badanie stabilnosci bezwzglednej)

- z przerwa (od 2 do 6 miesiecy) -> zrodla bledu: wyniki testowe nie sa stabilne w czasie
- bez przerwy (badanie wiarygodnosci testu) - >zrodla bledu - czynniki losowe2)
2)powtarzalnosc tresci
> technika testow rownoleglych
- z przerwa (badanie stabilnosci wzglednej)
- bez przerwy (rownowaznosc miedzytestowa)

> połówkowanie (porownujemy parzyste itemy z nieparzystymi)

- wzor Spearmana Browna (słuzy do oszacowania rzetelnosci testu na


podstawie rzetelnosci jego polowy)

3)homogenicznosc - zgodnosc wewnetrzna

------alfa cronbacha - srednia interkorelacja miedzy wszystkimi pozycjami testowymi


1.TEsty równoległe - te same M, SD, i korelacje z innym testem

2. SEM
- błąd standardowy pomiaru - opisuje wielkosc bledu ktora zwiazana jest z danym narzedziem
pomiarowym

SEM zalezy od : rzetelnosci testu , sd wynikow w tym tescie

SEM wykorzystuje sie do budowania przedzialow ufnosci dla wyniku OTRZYMANEGo


56z

3.BŁAD STANDARDOWY RÓŻNICY (mowi o tym, czy roznicy miedzy dwoma wynikami
mozna przypisac znaczenie diagnostyczne)

BLAD STANDARDOWY ROZNICY -> stosuje sie gdy chcemy porownac ze soba 2 wyniki
w selekcji i rekrutacji
->gdy chcemy porownac 2 wskazniki w tym samym tescie

4.TRAFNOSC:
● dokonując diagnozy na podstawie wyniku testowego, należy wziąć pod uwagę
standardowy błąd pomiaru ponieważ,
a) tylko w ten sposób można określić istotność otrzymanych wyników
b) pozwala on na dokładne określenie poziomu istotności wyniku prawdziwego,
c) dzięki niemu można określić wielkość błędu jakim jest obciążony wynik
testu??? tez mi sie tak wydaje TEŻ TAK MYŚLE
d) pozwala on określić wielkość błędu jaki popełniany jest przy interpretowaniu
wyniku poszczególnych pozycji testowych
tersciowa (czy tresc testu mozemy traktowac jako reprezentacja dla uniwersum
tresci opisujacego dany konstrukt)
● kryterialna ( o jakich innych zmiennych bezposrednio niezwiazanych z testem mozna
wnioskowac na podstawie wynikow testu )
○ TRAFNOSC KDZIELI SIE NA (diagnostyczna i prognostyczna)

● teoretyczna (badanie roznic miedzy grupowych, analiza korelacji, analiza czynnikowa,


analiza zgodnosc wewnetrzenj, analiza nieprzypadkowych zmian w wynikach testu ,
analiza sposobu odpowiadania)
○ TRAFNOSC TEORETYCZNA DZIELI SIĘ NA zbiezna i roznicowa

TRAFNOSC fasadowa -> opisuje to co o tescie sadzi osoba badana (ta trafnosc jest zawsze
wazna, dot. motywacji)
1.BADANIA TRAFNOSCI KRYTERIALNEJ SLUZA:
-rozszezreniu mozliwosci zastosowania testu

2.TRAFNOSC Ze wzgledu na waznosc dla uzytkownika :


teoretyczna > kryterialna > tresciowa

3/kontaminacja: przenoszenie wiedzy o tym jak OB wypadla w tescie na ocene poziomu


wykonania tej osoby w zmiennej kryterialnej

4/sposoby wyelimoinowania kontaminacji kryteriow?v - inne osoby oceniaja wyniki testu a


inne wyniki w miennej kryterialnej

5.rodzaje trafnosci kryterialnej : korelacja


diagnostyczna - miedzy testem i zmienna kryterialna w tym samym czasie
prognostyczna - miedzy testem i kryterium mija czas (czesto b.długi)

6.NORMA - typowosc
norma statystyczna - sredni poziom wykonania testu przez pewna grupe odniesienia

7.NORMY MUSZĄ BYĆ (ADEKWATNE, AKTUALNE, REPREZENTATYWNE)


ADEKWATNE - SPOSOB DEFINIWANIA GRUPY ODNIESIENIA
REPREZENTATYWNE - WPROST ZWIAZANE Z ZAKRESEM UOGOLNIANIA WYNIKOW

8.NORMY LOKALNE - dla wasko zdefiniowanych grup


9.NORMY OGÓLNOKRAJOWE - sporzadzane dla calej populacji

10.CENTYLE - mówią o tym ile osób ma wyniki rowne lub niższe od osoby badanej.
SKALA CENTYLOWA=skala porządkowa

11.Dlaczego stosuje się skalę T do diagnozowania patologii?


- bo jest bardzo długa (tzn ze pozwala na dokladne roznicowanie miedzy osobami ktore maja
skrajne wyniki)

12.Dlaczego skale standardowe sa popularne?


- po pozwalaja okreslac miedzy poziomem mierzonych cech

13.Dlaczego przed wsytarndaryzowaniem trzeba normalizowac?


- bo do interpretacji wynikow w sklalach standardowych wykorzystujemy wlasciwosci rozkladu
normalnego (wynik typowy 68%)

14. Dla czego obliczamy moc dyskryminacyjna przed wlaczeniem zadan do ostatecznej
wersji testu?
- bo chcemy wlaczyc tylko takie pozycje ktore prowadzic beda do maksymalnego
zroznicowania wynikow testu
15.Jakich specyficznych informacji dostarcza analiza zadan?
-w jakim stopniu kazda pozycja testowa oddzielnie roznicuje badana populacje

16.Jaki jest sposob szacowania mocy dyskryminacyjnej zadan?


- oparte na wspolczyniku trudnosci
- opartne na wspolczynniku korelacji miedzy wynikiem danego zadania a ogolnym wynikiem w
tescie
- opartne na roznicy miedzy wynikami otrzymanymi w tzw. dolnej i górnej grupie osob badanych
(wyniki najnizsze i najwyzsze)

17.Style odpowiadania - stałe, podmiotowe, atreściowe strategie odpowiadania


przykłady:
- tendencja do potakiwania
-błąd tendencji centralnej
-aprobata społęczna

18.Empiryczna procedura konstrukcji testu:


- podstawa jest stwierdzona empirycznie korelacja miedzy wynikiem testu a tym co ma byc
przedmiotem pomiaru (zmienna kryterialna)
test spełnia warunek obiektywnosci jezeli:
- oceniany przez roznych psychologow daje podobne wyniki

J
ak moż
na uznac test za rzetelny?
- współczynnik korelacji pomiedzy dwoma wynikami uzyskanymi w badaniu tym samym testem
tej samej grupy osob
1.najwyzsza rzetelnosc odp.
gdy skala jest 5, 7 stopniowa;

2.wskaznik mglistości odp.


bierze pod uwage ilosc wyrazow w pytaniach;

3.co mierzy macierz korelacji WCWM odp.


trafnosc teoretyczna,

test wlasciwosci afektywnych odp.


brak odpowiedzi prawidlowej obiektywnie;

4. Strategia empiryczna odp.


Albo trzeba robić definicję, albo nie wiem cześć dała, ze strategia empiryczna wymaga dużej liczby
badanych osób

5.coś tam wartość powyżej 1 odp.


Kaisera;

6.obszary manifestacji odp.


sa wywodza sie z obszaru tresci,

7. co robimy gdy wartość ładunku wskazuje 0,005 odp.


wywalamy go w ogóle przypuszczalnie chodzi o "nie pasuje do skali";

8.trafnossc zbiezna i rozbiezna odp.


jest mierzona przy trafnosci teoretycznej;

9. Jesli wspolczynnik rzetelnosci wynosi 0,81 to odp.


35% zmienności wynikow zalezy od bledu;

10.na wynik alfa Cronbacha ma wpływ odp.


czynniki losowe, heteroenicznosc pozycji testowych

11.dwa razy tego samego testu uzywamy odp.


w testretest;

12.cos o tescie do diagnozy indywidualne ja dałam, że trzeba


lepiej zbadac trafność i rzetelność

13. obszary manifestacji dotyczą tego


w jaki sposób mogą się przejawiać obszary treści np. obszar poznawczy, emocjonalny, itd.
1.Badacz planuje opracowanie kwestionariusza do badania strategii radzenia sobie ze
stresem, całkowicie opierając się na definicjach strategii zaproponowanych przez Lazarus i
Folkman (1984). W tym celu zastosuje:

A. Wewnętrzną strategię konstruowania narzędzia


B. Zewnętrzną strategię konstruowania narzędzia
C. Nie zastosuje żadnej ze strategii wskazanych w pozostałych punktach
D. Teoretyczną strategię konstruowania narzędzia (Ala)

2. Ładunek czynnikowy:

A. Jego ujemny znak wskazuje na pytania najmniej rzetelne


B. W sensie teoretycznym to znaczenie psychologiczne czynnika
C. W sensie operacyjnym to korelacja między pytaniem a czynnikiem
D. Wszystkie powyższe odpowiedzi są prawidłowe (chyba)

3. Od czego zależy wartość alfy Cronbacha?

A. Tylko od czynników losowych


B. Od czynników losowych, zmienności wyniku w czasie i podobieństwa do siebie
pozycji testowych
C. Od czynników losowych i podobieństwa do siebie pozycji testowych
D. Od czynników losowych i zmienności wyniku w czasie

4. Strategia racjonalna budowy testu

A wymaga empirycznej weryfikacji wrażliwości testu


B. Stosowana jest jedynie do testów właściwości afektywnych
C. Jest obowiązkowa przy konstruowaniu testów do diagnozy indywidualnej
D. Wymaga sformułowania teorii leżącej u jego podstaw

5. Jeśli wartość współczynnika rzetelności dla testu wyniosła 0,19 oznacza to, że:

A. Jest on rzetelny
B. Żadna z odpowiedzi nie jest prawidłowa
C. Nie wiadomo co to znaczy, jeśli nie znamy szczegółów na temat badania rzetelności -
a nie to?
D. Jest on nisko rzetelny

6. Wykres osypiska w analizie czynnikowej służy do:


a. Określania, ile czynników należy wyodrębnić tak
b. Określania, ile osób badanych ma wyniki powyżej średniej
c. Interpretacji czynników
d. Rotacji czynników

7. Aby móc poprawnie wykonać analizę czynnikową:

A. Współczynnik KMO musi być większy od 1


B. Wszystkie wymiary muszą być ortogonalne
C. Wszystkie pytania w kwestionariuszu muszą być mierzone na tej samej skali
D. Musi być spełnione kryterium Cattella

8. Które badanie może być podstawą do analizy trafności zbieżnej i różnicowej za pomocą
macierzy "wielu cech - wielu metod":

a. Dwukrotne badanie samoopisu Inwentarzem Osobowości NEO-FFI bez przerwy


czasowej
b. Dwukrotne badanie samoopisu Skalą samooceny (SES) Rosenberga przed i po
pozytywnej interwencji ukierunkowanej na wzrost samoakceptacji
c. Badanie samoopisu i szacowania jednowymiarową Skalą Samooceny (SES)
Rosenberga
d. Badanie samoopisu i szacowania Inwentarzem Osobowości NEO-FFI (tak mi się
wydaje)

9. Obszary manifestacji w projekcie testu powinny pochodzić

a. Wszystkie odpowiedzi są prawidłowe


b. Z tego, jak mogą się przejawiać poszczególne obszary treści
c. Z definicji mierzonej cechy
d. Ze standardów APA

10. Jeśli test ma służyć tylko do badań naukowych, ale nie do diagnozy indywidualnej, to:

a. Nie trzeba przygotowywać podręcznika do testu


b. Można zrezygnować z robienia normalizacji tak
c. Można robić badania trafności tylko na grupach klinicznych
d. Musi być lepiej zweryfikowany pod względem trafności i rzetelności niż test tylko do
diagnozy
11. Jeśli budując kwestionariusz mierzący skłonność do kupowania impulsywnego
poprosimy sędziów kompetentnych o to, by ocenili czy ułożone przez nas pozycje testowe
faktycznie odnoszą się do tego zjawiska, to znaczy, że chcemy najprawdopodobniej
oszacować

A. Trafność fasadową
B. Trafność teoretyczną
C. Trafność treściową tak
D. Trafność kryterialną

12. W której z poniższych pozycji testowych możemy spodziewać się najwyższego


zróżnicowania odpowiedzi osób badanych?

a. Racjonalne jest robić przemyślane zakupy


b. Zdarzyło mi się kiedyś kupić coś bez przemyślenia
c. Zwykle robię zakupy bez ich przemyślenia tak
d. Zdarzyło mi się kiedyś kupić coś po drugim namyśle

13. Jeśli test ma służyć do diagnozy indywidualnej (a nie tylko do badań naukowych) to:

A. Można robić badania trafności tylko na grupach klinicznych


B. Nie trzeba przygotowywać podręcznika do testu
C. Musi być lepiej zweryfikowany pod względem trafności i rzetelności niż test tylko do
diagnozy
D. Można zrezygnować z robienia normalizacji

14. Kryterium oparte o wartości własne macierzy większe od 1 w analizie czynnikowej to


inaczej

a. Kryterium Cattella
b. Kryterium Kaisera
c. Kryterium KMO
d. Kryterium czynnikowe

15. Gdy układamy pozycje testowe do kwestionariusza, stopień skomplikowania języka,


który używamy powinien być dostosowany do:

a. Poziomu B2
b. Stylu odpowiadania badanych
c. Poziomu przeciętnego badanego
d. Poziomu badanych o najniższym poziomie językowym tak

16. Który spośród poniższych przykładów uważany jest za niewłaściwe podejście do


tworzenia pozycji kwestionariuszy:

A. Zaczerpnięcie pozycji z innych kwestionariuszy po uzyskaniu zgody


autorów/wydawców tych narzędzi
B. Zaczerpnięcie pozycji z psychotestów ogólnodostępnych w internecie
C. Samodzielne opracowanie pozycji (Ala)
D. Opracowanie pozycji na podstawie wyników badania wstępnego, dotyczącego analizy
przejawów cech/y, zgłaszanych przez grupę osób zrekrutowanych z populacji, dla
której tworzony jest kwestionariusz

17. Jeśli oczekujemy, że wymiary tworzonego przez nas testu będą tworzyć jedną, nadrzędną
cechę (są różnymi aspektami tej samej cechy), to którą z poniższych rodzajów rotacji
powinniśmy wykorzystać wykonując eksploracyjną analizę czynnikową?

a. W takim przypadku nie robi się rotacji


b. Rotację Ortomax
c. Rotację Varimax
d. Rotację Promax

18.Przystępując do oceny trafności treściowej pozycji testowych należy

a. Dokonać analizy trafności kryterialnej


b. Dokonać analizy statystycznej pozycji
c. Przeprowadzić badanie pilotażowe
d. Zapoznać sędziów kompetentnych z definicją mierzonej przez nas cechy

19.Przy badaniach trafności i rzetelności testu, grupy osób badanych:

a. Powinny być bardzo homogeniczne, by lepiej dopasować badanych do mierzonej


cechy
b. Powinny być bardzo homogeniczne, bo to podnosi trafność i rzetelność metody
c. Powinny być bardzo zróżnicowane, bo to pozwala na szersze zastosowanie testu w
przyszłości - a nie to?
d. Powinny być bardzo zróżnicowane, bo to pozwala później na lepsze uogólnianie
wyniku ja myślę, że to- Alicja
20.Metodą szacowania trafności teoretycznej nie jest analiza:

a. Różnic międzygrupowych
b. Zmian nieprzypadkowych
c. Procesu rozwiązywania testu
d. Logicznej treści testu tak

21.Jeśli wartość współczynnika rzetelności dla testu wyniosła 0,9 oznacza to, że:

A. Jest on rzetelny
B. Żadna z odpowiedzi nie jest prawidłowa
C. Nie wiadomo co to znaczy, jeśli nie znamy szczegółów na temat badania rzetelności -
a nie to? też myślę, że to- Alicja
D. Jest on nisko rzetelny

22.Podczas tworzenia wielowymiarowego testu w oparciu o analizę czynnikową zazwyczaj


włącznie do skali są pytania:

a. Mające wysokie ładunki jednego z czynników i niskie lub zerowe pozostałych


b. Wszystkie o wartościach własnych większych od 0,30
c. Opisane przez przeciętne ładunki wszystkich czynników, zatem mierzące wszystkie
ważne aspekty zachowania
d. Wszystkie o bezwzględnych wartościach własnych większych od 0,30

23. Przystępując do oceny trafności treściowej pozycji testowych najpierw należy:

a. Dokonać analizy poprawności językowej


b. Dokonać analizy trafności teoretycznej
c. Dokonać analizy statystycznej pozycji
d. Przeprowadzić badanie pilotażowe

24. Które z podanych pojęć statystycznych NIE są związane z analizą czynnikową?

A. Rotacja
B. Dendrogram
C. Wykres osypiska
D. Wartość własna

25. Jeśli wartość współczynnika trafności dla testu wyniosła 0,19 oznacza to, że
A. Jest on trafny
B. Żadna z odpowiedzi nie jest prawidłowa
C. Nie wiadomo co to znaczy jeśli nie znamy szczegółów na temat badania trafności
D. Jest on nisko trafny (Ala)

26.

27. Przy użyciu pakietu statystycznego obliczającego korelacje pozycja-skala korekta polega
na:

a. Włączeniu sumy wyniku ogólnego dowolnego pytania


b. Włączeniu z sumy wyniku ogólnego pytania, dla którego obliczana jest moc
dyskryminacyjna
c. Wyłączeniu z sumy wyniku ogólnego dowolnego pytania
d. Włączeniu do sumy wyniku ogólnego pytania, dla którego obliczana jest moc
dyskryminacyjna

28.Która metoda weryfikuje hipotezę teoretyczną o zróżnicowaniu grup - najczęściej


skrajnych, kontrastowych - w zakresie mierzonej zmiennej lub zmiennych?

a. Metoda sprawdzania różnic międzygrupowych


b. Metoda badania procesu rozwiązywania testu
c. Żadna odpowiedź nie jest prawidłowa
d. Metoda badania zmian nieprzypadkowych

29. Przy stosowaniu macierzy "wielu cech - wielu metod", aby dany test uznać za trafny
należy wykazać zarówno:

a. Trafność zbieżną, jak i diagnostyczną


b. Trafność zbieżną, jak i różnicową - to?
c. Trafność prognostyczna, jak i diagnostyczną
d. Trafność prognostyczną, jak i dyskryminowaną

30. W strategii teoretycznej, kluczowym etapem konstrukcji jest:

a. Identyfikacja podstawowych wymiarów zachowania


b. Empiryczny dobór wskaźników
c. Analiza definicji cech
d. Analiza czynnikowa

31. Wybór konkretnej metody rotacji w analizie czynnikowej zależy przede wszystkim od:

a. Tego, jak silnie skorelowane są pozycje w obrębie określonych czynników


b. Liczby pozycji wchodzących w skład czynników
c. Liczby wyodrębnionych czynników
d. Tego, czy zakładamy, że czynniki są ze sobą skorelowane czy nie

32. Jeśli w jednym badaniu autorzy wykorzystali do analizy rzetelności Alfę Cronbacha, to
co powinni zrobić w dalszych badaniach, żeby dowiedzieć się czegoś nowego o rzetelności
testu?

a. Także wykorzystać alfę Cronbacha


b. Wykorzystać metodę połówkową
c. Wykorzystać korelację bireryjną
d. Wykorzystać test-retest

33. Ładunek czynnikowy:


a. Jego ujemny znak wskazuje na pytania najmniej rzetelne
b. Wszystkie powyższe odpowiedzi są prawidłowe tak mi się wydaje (Ala)
c. W sensie operacyjnym to korelacja między pytaniem a czynnikiem
d. W sensie teoretycznym to znaczenie psychologiczne czynnika

34.Jeśli ładunek czynnikowy w analizie czynnikowej wyniósł -0,005, oznacza to, że:

a. Żadna z odpowiedzi nie jest prawidłowa


b. Pytanie na pewno nie pasuje do danego wymiaru
c. Trzeba sprawdzić, czy pytanie w kluczu nie powinno być odwrócone
d. Trzeba takie pytanie przeformułować przed kolejną turą badań

35. Jeśli budując test mierzący inteligencję obliczymy korelację między wynikiem w naszym
teście i wynikiem w teście matryc Ravena, to znaczy, że najprawdopodobniej chcemy
oszacować:

a. Trafność kryterialną
b. Trafność treściową
c. Trafność fasadową
d. Trafność teoretyczną

36.Jeśli test ma służyć do diagnozy indywidualnej (a nie tylko do badań naukowych) to:

a. Można zrezygnować z robienia normalizacji


b. Musi być lepiej zweryfikowany pod względem trafności i rzetelności niż test tylko do
badań naukowych
c. Można robić badania trafności tylko na grupach klinicznych
d. Nie trzeba przygotowywać podręcznika do testu

37.Po przeprowadzeniu analizy mocy dyskryminacyjnych poszczególnych pozycji autor


zidentyfikował w swojej skali pozycję testową o najsłabszym współczynniku mocy
dyskryminacyjnej - równym 0,04. Co się stanie z wysokością parametru Alfą Cronbacha,
jeśli autor usunie tę pozycję ze skali?

A. Najprawdopodobniej się nie zmieni


B. Najprawdopodobniej się zmniejszy
C. Najprawdopodobniej się zwiększy
D. Wszystko może się zdarzyć, bo moc dyskryminacyjna nie jest bezpośrednio
powiązana ze zgodnością wewnętrzną
38.Która z poniższych metod analizy rzetelności wymaga podwójnego badania tym samym
testem?

a. Alfą Cronbacha
b. Test-retest
c. Metoda połówkowa
d. Wersje równoległe

39.Jeśli oczekujemy, że wszystkie pozycje tworzonego przez nas testu będą wchodzić w
skład jednej skali, bez podwymiarów, to którą z poniższych rodzajów rotacji powinniśmy
wykorzystać wykonując eksploracyjną analizę czynnikową?

a. W takim przypadku nie robi się rotacji


b. Rotację Varimax
c. Rotację Promax
d. Rotację Ortomax

40. Przy stosowaniu macierzy "wielu cech - wielu metod", aby dany test uznać za trafny
należy wykazać zarówno:

a. Trafność zbieżną, jak i różnicową


b. Trafność zbieżną, jak i diagnostyczną
c. Trafność prognostyczną, jak i diagnostyczną
d. Trafność prognostyczną, jak i dyskryminatywną

41. Obszary treści w projekcie testu powinny pochodzić

a. Wszystkie odpowiedzi są prawidłowe


b. Ze standardów APA
c. Z definicji mierzonej cechy
d. Z tego, jak mogą się przejawiać poszczególne obszary manifestacji

42.Jeśli budując test mierzący inteligencję obliczymy korelację między wynikiem w naszym
teście i wynikami w kwestionariuszu NEO-FFI, to znaczy, że chcemy najprawdopodobniej
oszacować:

a. Trafność treściową
b. Trafność teoretyczną
c. Trafność kryterialną
d. Trafność fasadową

43. Aby autor kwestionariusza mógł poprawnie wykonać analizę metodą wielu cech-wielu
metod:

A. część osób badanych wypełnia jeden kwestionariusz, a pozostała część-inny


B. Kwestionariusz, który służy do weryfikacji trafności musi mierzyć tę samą cechę, co
kwestionariusz który weryfikuje
C. Każda osoba badana musi wypełnić kilka kwestionariuszy
D. Musi przebadać co najmniej 5-10 osób na każde pytanie w kwestionariuszu

44. Jeśli badacz wykonując eksploracyjną analizę czynnikową wykorzystał rotację


VARIMAX, to znaczy że oczekiwał, że:

A) wymiary kwestionariusza będą nieskorelowane


B) Wymiary kwestionariusza będą składały się na jedną nadrzędna cechę
C) kwestionariusz będzie miał tylko jeden wymiar
D) wymiary kwestionariusza będą nieortogralne

45. Najlepsze parametry rzetelności (przy tych samych pytaniach) mają skale odpowiedzi:

a. 5-7 punktowe
b. Nieparzyste
c. Parzyste
d. Które zawierają odpowiedź NIE WIEM

46. Jeśli wartość alfy Cronbacha w teście wyniosła 0,9 oznacza to, że:

A. jest on nisko rzetelny


B. Jest on nisko trafny
C. Jest on rzetelny
D. Jest on trafny

47. Jeśli wartość współczynnika trafności dla testu wyniosła 0,9 oznacza to, że:

a. jest on trafny
b. Jest on nisko trafny
c. Żadna z odpowiedzi nie jest prawidłowa
d. Nie wiadomo co to znaczy jeśli nie znamy szczegółów na temat badania trafności
48. .Po przeprowadzeniu analizy mocy dyskryminacyjnych poszczególnych pozycji autor
zidentyfikował w swojej skali pozycję testową o najwyższym współczynniku mocy
dyskryminacyjnej - równym 0,70. Co się stanie z wysokością parametru Alfą Cronbacha,
jeśli autor usunie tę pozycję ze skali?

A. Najprawdopodobniej się nie zmieni


B. Najprawdopodobniej się zmniejszy
C. Najprawdopodobniej się zwiększy
D. Wszystko może się zdarzyć, bo moc dyskryminacyjna nie jest bezpośrednio
powiązana ze zgodnością wewnętrzną
Psychometria.
Podstawy teoretyczne
dr hab. Agata Gąsiorowska, prof. Uniwersytetu SWPS

agasiorowska@swps.edu.pl

1
Literatura
• American Psychological Association, APA (2007).
Standardy dla testów stosowanych w psychologii i w
pedagogice. Gdańsk: Gdańskie Wydawnictwo
Psychologiczne.

• Hornowska, E. (2001). Testy psychologiczne: teoria i


praktyka. Warszawa: Wydawnictwo Naukowe
SCHOLAR.

• Anastasi A., Urbina, S (1999). Testy psychologiczne.


Warszawa: Pracownia Testów Psychologicznych.

2
Wprowadzenie

3
Co to w ogóle jest psychometria?
(inaczej - teoria testów)
• „… dział psychologii zajmujący się teorią i opracowywaniem testów
psychologicznych” (Szymczak, 1979)
• „dział metodologii psychologicznej zajmujący się pomiarem
zachowań ludzkich w aspekcie psychologicznym” (Szewczyk,
1979)
• „dziedzina obejmująca badania psychometryczne (…) na ogół
odnoszące się do różnych aspektów procesów psychicznych, w
tym badania osobowości, inteligencji, określania zdolności” (Reber,
2000)
• „gałąź psychologii zajmująca się określaniem warunków, jakie
powinny spełniać narzędzia wykorzystywane do pomiaru cech
psychologicznych, oraz budowaniem modeli wiążących wyniki
takich pomiarów z rzeczywistymi wartościami mierzonych
cech” (Hornowska, 2007)

4
Tworzenie i korzystanie
z testów psychologicznych

• Znajomość podstaw psychometrii to warunek adekwatnego


stosowania i właściwego interpretowania wyników
psychologicznych narzędzi diagnostycznych
• Cele stosowania testów
• opisanie pewnych cech jednostki oraz przewidywanie jej
zachowań w przyszłości
• ewentualna zmiana psychospołecznego stanu jednostki
• Testy psychologiczne są atrakcyjne, bo:
• redukują do minimum subiektywnego czynnika w diagnozie
• przeprowadzanie diagnozy za pomocą testów jest sprawne,
szybkie i tanie – diagnozowanych może być równocześnie
wiele osób, w jednym lub różnych miejscach

5
Źródła nadużyć związane z korzystaniem
z testów psychologicznych

• Wadliwie/nieprofesjonalne konstruowanie,
stosowanie (obliczanie) i interpretowanie wyników
testu
• Wadliwie/nieprofesjonalne/nietrafne decyzje,
mające wpływ na losy osoby poddanej badaniu
testowemu (np. oddziaływania terapeutyczne czy
selekcyjne)
• Wadliwe (nietrafne i nierzetelne) rezultaty badań
naukowych przeprowadzonych z wykorzystaniem
wadliwych testów psychologicznych i „niby-testów”

6
Test psychologiczny (1)
• Amerykańskie Towarzystwo Psychologiczne (APA):

• “Testem jest narzędzie czy procedura służące ocenie.


Ich istotą zaś - otrzymanie w określonych warunkach
próbki zachowania osób badanych i następnie
dokonanie ich oceny zgodnie z wystandaryzowanymi
regułami”

• Test nie służy do tego, aby poznać klienta „w ogóle”.


Jego stosowanie wymaga jasnego wskazania problemu
diagnostycznego i równie jasnego określenia podstaw
interpretacji otrzymanych wyników.

7
Test psychologiczny (2)
• Badanie testowe to taka sytuacja, w której osoba
badana uczestniczy dobrowolnie, świadoma celu jakim
jest jej ocena

• Jest to sytuacja tworzona specjalnie dla celów


diagnostycznych, w której wywołuje się zachowania
typowe pod względem tej charakterystyki jaka ma być
przedmiotem celowej obserwacji

• Jest to sytuacja, która od diagnosty nie wymaga


osobistego zaangażowania i w której jasno jest
określony zakres i rodzaj dopuszczalnych zachowań

8
Test psychologiczny (3)

• Test psychologiczny jest specyficzną procedurą


diagnozowania. Może on być zbiorem zadań lub
pytań, które – w standardowych warunkach – mają
wywoływać określone rodzaje zachowań i
dostarczać wyników o pożądanych właściwościach
psychometrycznych

9
Każda próba sformułowania precyzyjnej definicji
„testu” lub „testowania” jako procesu jest
prawdopodobnie skazana na niepowodzenie,
ponieważ będzie przypuszczalnie wyłączać pewne
procedury, które powinny być włączone, i włączać
inne, które powinny być wyłączone.

10
Wytyczne Międzynarodowej Komisji ds.
Testów (International Test Commission
– ITC) z 2000
• Testowanie obejmuje szeroki zakres procedur stosowanych w diagnozie
psychologicznej, zawodowej i szkolnej.
• Testowanie może obejmować procedury pomiaru zarówno zachowań
normalnych, jak i odbiegających od normy czy zaburzonych.
• Zazwyczaj procedury testowania przewidują badanie w starannie kontrolowanych
lub ujednoliconych warunkach, ujętych w formalnych protokołach oceny.
• Procedury te dostarczają miar wykonania i wymagają wnioskowania na podstawie
próbek zachowań
• Obejmują one także procedury, których wynikiem może by jakościowa
klasyfikacja lub uporządkowanie osób badanych (np. w kategoriach typów).
• Każda procedura stosowana do „testowania” w powyższym rozumieniu tego
słowa, powinna by traktowana jako „test”, niezależnie od sposobu prowadzenia
badania; niezależnie od tego, czy została opracowana przez profesjonalnego
autora testów; i niezależnie od tego, czy zawiera zestaw pytań, czy te wymaga
wykonania zada lub czynności (np. próbki pracy, testy psychomotoryczne).

11
Rodzaje testów (1)

• Testy standaryzowane

• Testy niestandaryzowane

12
Rodzaje testów (2)

• Testy indywidualne

• Testy grupowe

13
Rodzaje testów (3)

• Testy szybkości

• Testy mocy

14
Rodzaje testów (4)

• Testy obiektywne

• Testy nieobiektywne

15
Rodzaje testów (5)

• Testy słowne (werbalne)

• Testy bezsłowne (niewerbalne)

16
Rodzaje testów (6)
• Testy właściwości poznawczych

• Wiedza, umiejętności, zdolności (także czasy reakcji)

• Istnieje odpowiedź obiektywnie prawidłowa/lepsza/gorsza

• Zagrożenie: zgadywanie

• Testy właściwości afektywnych

• Uczucia, postawy, osobowość, emocje, wierzenia itd.

• Autoekspresja, brak odpowiedzi obiektywnie prawidłowej

• Zagrożenie: trafność samoopisu

17
Rodzaje testów (7)
• Testy zorientowane na normy

• interpretacja - względem grupy odniesienia

• Testy zorientowane na kryterium (standard


wykonania)

• interpretacja - względem np. specyficznej wiedzy


czy umiejętności jakie udało się opanować

18
Rodzaje testów wg APA (2000)
• Kryterium - złożoność i wymagana wiedza
psychologiczna i umiejętności posługiwania się
danym testem

• Poziom A: testy przydatności zawodowej

• Poziom B: testy do grupowego badania inteligencji


i kwestionariusze zainteresowań

• Poziom C: testy do indywidualnego badania


inteligencji, testy osobowości i techniki projekcyjne
19
Co definiuje kryteria oceny jakości i
zasady wykorzystywania testów
psychologicznych?

• Podstawowy dokument: Standardy dla testów


stosowanych w psychologii i w pedagogice (APA
2007)

• Zasadą naczelną tego dokumentu jest promowanie


uzasadnionego i etycznego stosowania testów oraz
dostarczanie podstaw do oceny jakości praktyki
badania testami

20
Zawartość Standardów
Wprowadzenie Cz. II Bezstronność testowania
Strony uczestniczące w procesie testowania 7. Bezstronne badanie testem i stosowanie
Cel Standardów testu

Kategorie Standardów 8. Prawa i odpowiedzialność osób


badanych
Testy i wykorzystanie testów, do których
stosują się te standardy 9. Testowanie osób o różnym rodowodzie
językowym
Na co należy zwrócić uwagę stosując
Standardy? 10. Badania testowe osób
niepełnosprawnych
Liczba standardów
Testy jako miary konstruktów
Cz. III Zastosowania testów
Cz. I Tworzenie testu, jego ocena oraz
prezentacja wyników 11. Odpowiedzialność użytkowników testów

1. Trafność 12. Testowanie i diagnoza psychologiczna

2. Rzetelność i błędy pomiaru 13. Diagnoza i testowanie w obszarze


edukacji
3. Tworzenie testu i jego rewizje
14. Testowanie dla celów zatrudnienia oraz
4. Skale, normy oraz porównywanie wyników przyznawania licencji
5. Procedura badania testem, ocenianie i 15. Testowanie dla celów ewaluacji oraz
przedstawianie wyników testowych polityki społecznej
6. Dokumentacja testu
21
Kryteria oceny jakości
testów psychologicznych

• Obiektywność
• Standaryzacja i bezstronne stosowanie
• Rzetelność
• Trafność
• Normalizacja, korzystanie z norm
• Adaptacja kulturowa

22
Obiektywność
• Niezależność wyników testowania (od tego kto,
gdzie i kiedy dokonuje ich oceny)

• Test jest obiektywny, jeżeli dwie różne osoby


opracowujące jego wyniki dochodzą do tego
samego rezultatu

• Aby było to możliwe, test musi posiadać jasno


określony klucz oceniania odpowiedzi,
zmniejszający do minimum wpływ subiektywnych
interpretacji
23
Standaryzacja
• Jednolitość reguł i warunków badania

• Aby wyniki danego testu można było ze sobą


porównywać, dany test powinien być zawsze
przeprowadzany w identycznych warunkach

• Tylko wtedy różnice w wynikach testowych


badanych osób można przypisać czynnikom
indywidualnym a nie np. zewnętrznym warunkom
badania

24
Rzetelność
• Dokładność pomiaru

• W języku potocznym termin rzetelność oznacza


niezawodność (dokładność)

• W psychometrii termin ten utożsamiany jest z


powtarzalnością otrzymanych wyników

• Rzetelność oznacza zgodność wyników


otrzymanych przez te same osoby, które zostały
przebadane kilka razy tym samym testem
25
Trafność
• Określenie obszaru zastosowania testu
• Trafność jest to dokładność z jaką test mierzy to, co ma
mierzyć
• Trafność jest to stopień, w jakim test jest w stanie osiągnąć
stawiane mu cele
• Trafność testu wskazuje na wielkość błędu
spowodowanego rozbieżnością między zamierzeniami
autora testu a tym, co test faktycznie mierzy
• Trafność odzwierciedla relację jaka zachodzi między
koncepcją właściwości psychologicznej a użytymi
wskaźnikami tej właściwości, czyli adekwatność
operacjonalizacji wielkości psychologicznej

26
Normalizacja (1)
• Nadawanie znaczenia wynikom testowym

• Zgodnie z kryterium teoretycznym norma wyznaczona jest przez


jakąś teorię (koncepcję) psychologiczną. Zasadniczym
znaczeniem terminu norma jest pewien wzór (model) wynikający
z przyjętej teorii, pozostałe zaś znaczenia mieszczą się w tych
ramach.

• Według kryterium kulturowego normę określają przepisy i wzory


kulturowe. Bez względu na treść tych wzorów istotą normy jest
zgodność z takim przepisem.

• Według kryterium statystycznego normą jest to, co jest


opisywane jako „zachowanie większości” czy jako „zachowanie
średnie lub przeciętne”

27
Normalizacja (2)
• W psychometrii przyjmuje się statystyczne rozumienie normy.

• UWAGA! Norma nie oznacza standardu „dobrego”


wykonania testu; norma opisuje poziom typowego wykonania
testu przez osoby należące do określonej grupy.

• Normą – w sensie psychometrycznym – jest standard


ilościowy, wyznaczony przez średnią, medianę lub inną
miarę tendencji centralnej obliczoną dla grupy
przedstawicieli danego typu (gatunku).

• Normą jest typowe zachowanie (typowy wynik w teście)


otrzymany dla określonej grupy osób.

28
Adaptacja

• Proces przystosowania wersji pierwotnej do


specyfiki kultury lokalnej

• Adaptacja nie sprowadza się ona tylko do


właściwego przetłumaczenia tekstu oryginału.

• Uwaga! Spora część testów stosowanych w Polsce


to testy oryginalnie obcojęzyczne

29
Jak odróżnić
dobry test od testu złego?
• Autor testu: Test ma autora. Test zagraniczny ma również autora polskiej adaptacji
• Podręcznik zawiera:
• Opis teorii lub sposobu doboru grup empirycznych
• Opis grupy, na której przeprowadzono badania standaryzacyjne
• Opis procedury badania i interpretowania wyniku
• Opis badań dotyczących rzetelności i błędu standardowego pomiaru
• Opis badań dotyczących trafności zalecanej interpretacji
• Opis procedury normalizacji i normy
• Pomoce: Dostępny jest opis materiałów testowych, pomocy, arkusza pytań,
arkusza odpowiedzi
• Zabezpieczanie testu: Zostały podjęte wszelkie możliwe kroki, aby materiał
testowy został właściwie zabezpieczony.
• Ochrona prawna: Legalna dystrybucja.

30
Standaryzacja

31
Na czym polega
standaryzacja?
• Dokładne i szczegółowe określenie procedury
prowadzenia badań testowych, czyli
• procedury badania testem
• procedury obliczania wyników
• procedury interpretowania wyników
• Dla każdego testu opracowuje się podręcznik, w
którym dokładnie opisana jest procedura
przeprowadzenia badań

32
Elementy podręcznika
• Kolejność czynności, które wykonuje osoba prowadząca
badania
• Dokładny tekst instrukcji podawanej osobie badanej
• Arkusz odpowiedzi (jeśli jest taki przewidziany ), przygotowany
i stosowany w każdym badaniu w identycznym kształcie
• Klucz, przy pomocy którego dokonuje się punktacji
uzyskanych rezultatów badań
• Normy oceny uzyskanych wyników surowych
• Podanie zasad, przy pomocy których interpretuje się uzyskane
rezultaty badań testowych zgodnie z duchem teorii, w oparciu
o którą test został opracowany

33
Procedura badania testem
• Zasady ogólne
• Wskazówki dotyczące badania testem powinny być przedstawione na tyle jasno i
wyraźnie, aby testujący mógł i chciał powtórzyć sposób badania zastosowany przy
ustalaniu norm
• Stosując metody testowe należy dokładnie przestrzegać procedury badania testem
opisanej w podręczniku
• Instrukcja
• W instrukcji należy omówić takie zagadnienia jak fakt badania indywidualnego czy
grupowego, liczebność badanej grupy, limity czasowe, sposoby zaznaczania
odpowiedzi na arkuszach, możliwość powrotu do poprzednich zadań lub pytań,
problem zgadywania, kolejność stosowania testów lub zadań, zakres pomocy
udzielanej badanemu
• Jeżeli dopuszcza się możliwość rozszerzania lub uszczegóławiania instrukcji
przedstawionej w podręczniku testowym, to należy przedstawić warunki w jakich
postępowanie to jest dopuszczalne
• Pomoce
• Aby utrzymać standaryzację metody testowej należy okresowo sprawdzać materiał
testu, wyposażenie oraz stosowaną procedurę
34
Procedura obliczania
wyników
• Klucz do oceny odpowiedzi
• Osoby stosujące testy są odpowiedzialne za dokładne
obliczanie, sprawdzanie, kodowanie i rejestrowanie
wyników testowych
• Należy okresowo kontrolować stosowany system
obliczania wyników
• Obliczanie wyników
• Procedura obliczania wyników testowych powinna
zostać przedstawiona w podręczniku testowym na tyle
szczegółowo i dokładnie, aby prawdopodobieństwo
popełnienia błędu było jak najmniejsze
35
Procedura interpretowania
norm
• Normy przedstawione w podręczniku testowym
powinny zostać opracowane dla wyraźnie
zdefiniowanych i opisanych populacji

• Populacje te muszą odpowiadać tym grupom osób,


z którymi badający testem będzie zazwyczaj
porównywał osoby badanej

• Należy brać pod uwagę normy właściwe dla osoby


badanej

36
Potencjalne zagrożenia
(czyli czego nie wolno robić)
• Stosowanie testu przeznaczonego do badań
indywidualnych w sposób grupowy

• Tworzenia swoich własnych, samodzielnie wykonanych


materiałów/pomocy testowych (w szczególności,
stosowanie testu przeznaczonego do badań papier-i-
ołówek w sposób internetowy/elektroniczny)

• Podawania instrukcji w różny sposób

• Zadawania tylko części pytań zawartych w danym


teście który jest całością
37
Proces wnioskowania
psychometrycznego
• Proces wyprowadzania wniosków o wartościach
cech psychologicznych badanych osób na
podstawie wyników, jakie otrzymały one w testach
psychologicznych

• Możliwość wnioskowania o nieobserwowalnych


właściwościach psychologicznych na podstawie
obserwowalnego zachowania w kontrolowanych
warunkach oraz wyrażającego go wyniku
testowego

38
Cecha psychologiczna
i jej pomiar
• Każdej cesze odpowiada kontinuum na którym
można rozmieścić wszystkie osoby badane
zgodnie z jej natężeniem

• Pozycja jednostki na tym kontinuum jest względnie


stała, i wyjaśnia stałość zachowania w podobnych
sytuacjach

• Częstość określonych zachowań -> wyższy poziom


cechy która manifestuje się w tych zachowaniach

39
Wynik obserwowany
a wynik prawdziwy (1)
• Wynik obserwowany to wynik otrzymany w teście
psychologicznym

• odzwierciedla poziom wykonania danych zadań/


pozycji tworzących test (prawidłowy/
nieprawidłowy, diagnostyczny/niediagnostyczny)

• może - ale nie musi odzwierciedlać rzeczywisty


poziom mierzonej cechy u osoby badanej

40
Wynik obserwowany
a wynik prawdziwy (2)

• Wynik prawdziwy to wynik odzwierciedlający


rzeczywistą wartość mierzonej cechy u danej
osoby

• model platoński vs model statystyczny

41
Test

pomiar

Wynik otrzymany

rzetelność

Wynik prawdziwy

trafność

Cecha
psychologiczna

42
Rzetelność
Jak dobrze mierzymy? Jaki popełniamy błąd pomiaru?

43
• W pewnym sensie, wszystkie pomiary
psychologiczne są nierzetelne

• Wynik obserwowany (otrzymany w teście) nigdy nie


jest idealnym odzwierciedleniem rzeczywistej
wartości mierzonej cechy - zawsze jest obarczony
pewnym błędem

44
Rodzaje błędów pomiaru
• Błąd systematyczny
• Wynika ze stałych cech osoby badanej lub narzędzia
• Nie ma nic wspólnego z mierzoną cechą
psychologiczną
• W różnych sytuacjach testowania w taki sam sposób
wpływa na wyniki testowania
• Błąd losowy
• Powstaje w wyniku działania przyczyn przypadkowych
• W różnych sytuacjach testowania może w różny
sposób wpływać na wyniki testowania
45
Źródła błędu losowego

• Konstrukcja testu/dobór treści


• Sytuacja testowania (czynniki sytuacyjne,
czynniki związane z osobą badaną, czynniki
związane z osobą badającą)
• Sposób oceny wyników (niedokładne kryteria
oceny wyników, błędy mechaniczne przy
zliczaniu)

46
Klasyczna teoria testów
Wynik w teście Błąd pomiaru
X=T+E
Wynik
prawdziwy
• Podstawowe założenia:
• Błąd pomiaru ma rozkład normalny
• ME = 0 (założenie o nieobciążoności narzędzia)
• rTE=0 (założenie o niezależności)
• rE1E2=0
47
• Wskaźnikiem rzetelności jest wielkość
współczynnika korelacji między wynikiem
obserwowanym a wynikiem prawdziwym (𝜌XT)
• ALE - jak ją obliczyć, skoro nie znamy wyniku
prawdziwego?

48
σ XT σ (T +E )T σ + σ TE
2
σ2
σT
ρ XT = = = T
= T
=
σ Xσ T σ Xσ T σ Xσ T σ Xσ T σ X

49
σ XT σ (T +E )T σ + σ TE
2
σ2
σT
ρ XT = = = T
= T
=
σ Xσ T σ Xσ T σ Xσ T σ Xσ T σ X

49
X=T+E

σ XT σ (T +E )T σ + σ TE
2
σ2
σT
ρ XT = = = T
= T
=
σ Xσ T σ Xσ T σ Xσ T σ Xσ T σ X

49
X=T+E

σ XT σ (T +E )T σ + σ TE
2
σ2
σT
ρ XT = = = T
= T
=
σ Xσ T σ Xσ T σ Xσ T σ Xσ T σ X

49
X=T+E

σ XT σ (T +E )T σ + σ TE
2
σ2
σT
ρ XT = = = T
= T
=
σ Xσ T σ Xσ T σ Xσ T σ Xσ T σ X

49
X=T+E rTE=0

σ XT σ (T +E )T σ + σ TE
2
σ 2
σT
ρ XT = = = T
= T
=
σ Xσ T σ Xσ T σ Xσ T σ Xσ T σ X

49
X=T+E rTE=0

σ XT σ (T +E )T σ + σ TE
2
σ 2
σT
ρ XT = = = T
= T
=
σ Xσ T σ Xσ T σ Xσ T σ Xσ T σ X

49
X=T+E rTE=0

σ XT σ (T +E )T σ + σ TE
2
σ 2
σT
ρ XT = = = T
= T
=
σ Xσ T σ Xσ T σ Xσ T σ Xσ T σ X

49
Definicja rzetelności testu

σ 2
ρ 2
= T
XT
σ 2
X

50
Definicja rzetelności testu

σ 2
ρ 2
= T
XT
σ 2
X
Rzetelność
testu

50
Definicja rzetelności testu

σ 2
ρ 2
= T
XT
σ 2
X
Rzetelność
testu Wariancja
wyników
testowych

50
Definicja rzetelności testu
Wariancja
wyników
prawdziwych

σ 2
ρ 2
= T
XT
σ 2
X
Rzetelność
testu Wariancja
wyników
testowych

50
Testy równoległe
• Testy A i B są równoległe jeśli mierzą to samo i tak
samo, ale składają się z różnych pozycji testowych

• XA=XB

• 𝝈A = 𝝈B

• riAjA = riBjB

• rAZ = rBZ

51
σ XA XB σ (T +EA )(T +EB ) σ + σ TEA + σ TEB + σ EAEB
2

rAB = = =
T

σ X Aσ X B σ X Aσ X B σ X Aσ X B

σ2
σ 2
rAB = T
= = ρ XT
T 2

σ Xσ X σ 2
X

52
X=T+E

σ XA XB σ (T +EA )(T +EB ) σ + σ TEA + σ TEB + σ EAEB


2

rAB = = =
T

σ X Aσ X B σ X Aσ X B σ X Aσ X B

σ2
σ 2
rAB = T
= = ρ XT
T 2

σ Xσ X σ 2
X

52
X=T+E

σ XA XB σ (T +EA )(T +EB ) σ + σ TEA + σ TEB + σ EAEB


2

rAB = = =
T

σ X Aσ X B σ X Aσ X B σ X Aσ X B

𝝈A = 𝝈B
σ2
σ 2
rAB = T
= = ρ XT
T 2

σ Xσ X σ 2
X

52
X=T+E

σ XA XB σ (T +EA )(T +EB ) σ + σ TEA + σ TEB + σ EAEB


2

rAB = = =
T

σ X Aσ X B σ X Aσ X B σ X Aσ X B

𝝈A = 𝝈B
σ2
σ 2
rAB = T
= = ρ XT
T 2

σ Xσ X σ 2
X

Rzetelność
testu

52
Metody badania
rzetelności

Wymagana liczba wersji testu


Wymagana liczba badań
Jedna Dwie
Metoda połówkowa,
Jedno Kudera Richardsona, ——————
α Cronbacha

Dwa, jedno od razu po Powtarzanie testu Wersje alternatywne


drugim (test-retest) (równoległe)

Powtarzanie testu Wersje alternatywne


Dwa w odstępie czasu
(test-retest) (równoległe)

53
Metody badania
rzetelności
Estymacja spójności
wewnętrznej

Wymagana liczba wersji testu


Wymagana liczba badań
Jedna Dwie
Metoda połówkowa,
Jedno Kudera Richardsona, ——————
α Cronbacha

Dwa, jedno od razu po Powtarzanie testu Wersje alternatywne


drugim (test-retest) (równoległe)

Powtarzanie testu Wersje alternatywne


Dwa w odstępie czasu
(test-retest) (równoległe)

53
Metody badania
rzetelności
Estymacja spójności
wewnętrznej

Wymagana liczba wersji testu


Wymagana liczba badań
Jedna Dwie
Metoda połówkowa,
Jedno Kudera Richardsona, ——————
α Cronbacha

Dwa, jedno od razu po Powtarzanie testu Wersje alternatywne


drugim (test-retest) (równoległe)

Powtarzanie testu Wersje alternatywne


Dwa w odstępie czasu
(test-retest) (równoległe)

Estymacja wiarygodności
testu

53
Metody badania
rzetelności
Estymacja spójności
wewnętrznej

Wymagana liczba wersji testu


Wymagana liczba badań
Jedna Dwie
Metoda połówkowa,
Jedno Kudera Richardsona, ——————
α Cronbacha

Dwa, jedno od razu po Powtarzanie testu Wersje alternatywne


drugim (test-retest) (równoległe)

Powtarzanie testu Wersje alternatywne


Dwa w odstępie czasu
(test-retest) (równoległe)

Estymacja wiarygodności Estymacja stabilności


testu bezwzględnej

53
Metody badania
rzetelności
Estymacja spójności Estymacja równoważności
wewnętrznej międzytestowej

Wymagana liczba wersji testu


Wymagana liczba badań
Jedna Dwie
Metoda połówkowa,
Jedno Kudera Richardsona, ——————
α Cronbacha

Dwa, jedno od razu po Powtarzanie testu Wersje alternatywne


drugim (test-retest) (równoległe)

Powtarzanie testu Wersje alternatywne


Dwa w odstępie czasu
(test-retest) (równoległe)

Estymacja wiarygodności Estymacja stabilności


testu bezwzględnej

53
Metody badania
rzetelności
Estymacja spójności Estymacja równoważności
wewnętrznej międzytestowej

Wymagana liczba wersji testu


Wymagana liczba badań
Jedna Dwie
Metoda połówkowa,
Jedno Kudera Richardsona, ——————
α Cronbacha

Dwa, jedno od razu po Powtarzanie testu Wersje alternatywne


drugim (test-retest) (równoległe)

Powtarzanie testu Wersje alternatywne


Dwa w odstępie czasu
(test-retest) (równoległe)

Estymacja wiarygodności Estymacja stabilności Estymacja stabilności


testu bezwzględnej względnej

53
Metody badania
rzetelności
Estymacja spójności Estymacja równoważności
wewnętrznej międzytestowej

Wymagana liczba wersji testu


Wymagana liczba badań
Jedna Dwie
Metoda połówkowa,
Jedno Kudera Richardsona, ——————
α Cronbacha

Dwa, jedno od razu po Powtarzanie testu Wersje alternatywne


drugim (test-retest) (równoległe)

Powtarzanie testu Wersje alternatywne


Dwa w odstępie czasu
(test-retest) (równoległe)

Estymacja wiarygodności Estymacja stabilności Estymacja stabilności


testu bezwzględnej względnej

Jedna osoba badana - wielu oceniających


53 - Zgodność ocen sędziów
Metoda połówkowa
• Formy równoległe w obrębie tego samego testu
• Podział
• losowy
• parzyste/nieparzyste
• z uwzględnieniem treści i trudności pozycji
• Obliczenie współczynnika równoważności międzypołówkowej rpp
• Szacowanie rzetelności całego testu (rtt) na odstawie rzetelności
połówki - wzór Spearmana-Browna

2rpp
rtt =
1+ rpp

54
Analiza zgodności
wewnętrznej (1)
• Wzór Kudera-Richardsona - wzór KR20
k

k ∑pq i i
KR20 = (1− i=1
)
k −1 σX2

55
Analiza zgodności
wewnętrznej (1)
• Wzór Kudera-Richardsona - wzór KR20
k

k ∑pq i i
KR20 = (1− i=1
)
k −1 σX2

rzetelność testu

55
Analiza zgodności
wewnętrznej (1)
proporcja
odpowiedzi
• Wzór Kudera-Richardsona - wzór KR20 diagnostycznych
(poprawnych)
k

k ∑pq i i
KR20 = (1− i=1
)
k −1 σX2

rzetelność testu

55
Analiza zgodności
wewnętrznej (1)
proporcja
odpowiedzi
• Wzór Kudera-Richardsona - wzór KR20 diagnostycznych
(poprawnych)
k

k ∑pq i i proporcja
odpowiedzi
KR20 = (1− i=1
) niediagnostycznych

k −1 σX2 (niepoprawnych)

rzetelność testu

55
Analiza zgodności
wewnętrznej (1)
proporcja
odpowiedzi
• Wzór Kudera-Richardsona - wzór KR20 diagnostycznych
(poprawnych)
k

k ∑pq i i proporcja
odpowiedzi
KR20 = (1− i=1
) niediagnostycznych

k −1 σX2 (niepoprawnych)

rzetelność testu

liczba pozycji
testowych

55
Analiza zgodności
wewnętrznej (1)
proporcja
odpowiedzi
• Wzór Kudera-Richardsona - wzór KR20 diagnostycznych
(poprawnych)
k

k ∑pq i i proporcja
odpowiedzi
KR20 = (1− i=1
) niediagnostycznych

k −1 σX2 (niepoprawnych)

rzetelność testu

liczba pozycji wariancja


testowych wyników w teście

55
Analiza zgodności
wewnętrznej (2)
• Alfa Cronbacha - rozszerzenie wzoru KR20
k

k ∑σ 2
i
α= (1− i=1
)
k −1 σX 2

56
Analiza zgodności
wewnętrznej (2)
• Alfa Cronbacha - rozszerzenie wzoru KR20
k

k ∑σ 2
i
α= (1− i=1
)
k −1 σX 2

rzetelność testu

56
Analiza zgodności
wewnętrznej (2)
• Alfa Cronbacha - rozszerzenie wzoru KR20
k

k ∑σ 2
i
α= (1− i=1
)
k −1 σX 2

rzetelność testu

liczba pozycji
testowych

56
Analiza zgodności
wewnętrznej (2)
• Alfa Cronbacha - rozszerzenie wzoru KR20
k

k ∑σ 2
i
wariancja dla
każdej pozycji

α= (1− i=1
) testowej

k −1 σX 2

rzetelność testu

liczba pozycji
testowych

56
Analiza zgodności
wewnętrznej (2)
• Alfa Cronbacha - rozszerzenie wzoru KR20
k

k ∑σ 2
i
wariancja dla
każdej pozycji

α= (1− i=1
) testowej

k −1 σX 2

rzetelność testu

liczba pozycji wariancja


testowych wyników w teście

56
Różne metody mierzą różne
źródła wariancji błędu
Metoda szacowania współczynnika
Wariancja błędu
rzetelności
Metoda połówkowa, Kudera Dobór treści, liczba pozycji testowych
Richardsona, α Cronbacha

Powtarzanie testu (jedno po drugim) Czynniki losowe

Powtarzanie testu (w odstępie czasu) Czynniki losowe, zmienność w czasie

Wersje alternatywne (jedno po drugim) Dobór treści

Wersje alternatywne (w odstępie


Dobór treści i zmienność w czasie
czasu)

Zgodność ocen sędziów Różnice w ocenach między sędziami


57
Jak interpretować wielkość
współczynnika rzetelności?
rtt=0,79 rtt=0,39

150

rtt=0,95 rtt=0,999
140

130

120

110

100
100 110 120 130 140 150
58
Jak interpretować wielkość
współczynnika rzetelności?

Procent wariancji wyniku, który można przypisać


różnym źródłom, np
rtt = 0,64

64% zmienności 36% zmienności


wyników testowych wyników testowych
zależy od rzeczywistego zależy od wariancji błędu
zróżnicowania

59
Przykład - rzetelność Inwentarza
Rzetelno Osobowości
Inwentarza osobowo ci NEO-FFI
NEO-FFI Costy i McCrae
wspó czynnik alfa Cronbacha

Neurotyczno Ekstrawersja Otw. na do w. Ugodowo Sumienno


15-19 0,80 0,80 0,69 0,66 0,81
20-29 0,82 0,77 0,71 0,61 0,79
30-39 0,84 0,74 0,64 0,72 0,81
40-49 0,76 0,71 0,58 0,60 0,80
50-80 0,73 0,77 0,47 0,60 0,76
• U osób starszych homogeniczność zachowań konstytuujących
Dane te cechy
podstawowe prowadz do wniosku,
osobowości e teza o uniwersalno
jest znacznie mniejsza niż ci
u osób
demograficznej Wielkiej Pi tki ma pe ne uzasadnienie jedynie w
młodych
przypadku p ci, a w odniesieniu do wieku – raczej u osób m odych.
•Ograniczona możliwość stosowania polskiej adaptacji NEO-FFI do
Uindywidualnej
osób starszychdiagnozy
bowiem osobowości
homogeniczno zachowa
- raczej konstytuuj
dla osób młodych, cych
w
podstawowe
grupach starszych cechy
należyosobowo
się liczyćcizejest znaczniepogorszeniem
znacznym mniejsza.
rzetelności i związanym z tym bardzo dużym błędem pomiaru

60
Standardowy błąd pomiaru
dla wyniku otrzymanego
Standardowy b d pomiaru dla wyniku otrzymanego

SEM S X 1 rtt
gdzie: SEM to standardowy b d pomiaru
Sx to odchylenie standardowe ogólnych wyników testowych
rtt to rzetelno testu
Rzetelność testu
Standardowy błąd
pomiaru
Odchylenie
standardowe wyników
testowych

61
Przedział ufności dla
wyniku obserwowanego
X − Zα /2 SEM; X + Zα /2 SEM
półprzedział ufności
X
Zα/2*SEM Zα/2*SEM

85% przedział ufności Zα/2 = 1,44

95% przedział ufności Zα/2 = 1,96

99% przedział ufności Zα/2 = 2,56

62
Przykład budowania przedziału
ufności

• Badanie skalą WAIS-R(PL)


• Osoba w grupie wiekowej 20-24 lata, uzyskała 93 pkt w skali
pełnej
• 90% przedział ufności, Zα/2 = 1,64
• rzetelność testu na tym poziomie wieku - 0.902
• SX = 15

SEM = 15 1− 0.902 = 15 × 0, 313 = 4,696


Zα /2 SEM = 1,64 × 4,696 = 7, 701 → 8 pkt

X − Zα /2 SEM; X + Zα /2 SEM → 93 − 8; 93 + 8 → 85; 101


63
Porównywanie dwóch
przedziałów ufności
SEM X−Y = SEM + SEM2
X
2
Y

Standardowy błąd Standardowy błąd


dla wyniku X dla wyniku Y

• Minimalna statystycznie istotna różnica wynosi

Zα /2 SEM X−Y

64
Porównywanie dwóch przedziałów
ufności

Osoba A - 50 pkt Osoba B - 100 pkt

65
Porównywanie dwóch przedziałów
ufności
90% przedział ufności, Z=1,64
SEM=20
Zα /2 SEM = 1,64 × 20 = 32,8 → 33pkt

Osoba A - 50 pkt Osoba B - 100 pkt

65
Porównywanie dwóch przedziałów
ufności
90% przedział ufności, Z=1,64
SEM=20
Zα /2 SEM = 1,64 × 20 = 32,8 → 33pkt

Osoba A - 50 pkt Osoba B - 100 pkt


<17 ; 83> <67 ; 133>

65
Porównywanie dwóch przedziałów
ufności
90% przedział ufności, Z=1,64
SEM=20
Zα /2 SEM = 1,64 × 20 = 32,8 → 33pkt

Osoba A - 50 pkt Osoba B - 100 pkt


<17 ; 83> <67 ; 133>

SEM X−Y = 20 + 20 = 28,285


2 2

65
Porównywanie dwóch przedziałów
ufności
90% przedział ufności, Z=1,64
SEM=20
Zα /2 SEM = 1,64 × 20 = 32,8 → 33pkt

Osoba A - 50 pkt Osoba B - 100 pkt


<17 ; 83> <67 ; 133>

SEM X−Y = 20 + 20 = 28,285


2 2

Zα /2 SEM X−Y = 1,64 × 28,285 = 46, 386 → 47 pkt


65
Porównywanie dwóch przedziałów
ufności
95% przedział ufności, Z=1,96
SEM=20
Zα /2 SEM = 1,96 × 20 = 39,2 → 40 pkt

Osoba A - 50 pkt Osoba B - 100 pkt


<10 ; 90> <60 ; 140>

SEM X−Y = 20 + 20 = 28,285


2 2

Zα /2 SEM X−Y = 1,96 × 28,285 = 55, 437 → 56 pkt


66
Dlaczego rzetelność testu
jest ważna w diagnozie?
• Niska rzetelność wyników zawsze ogranicza
możliwość zastosowania testu, i to do wszystkich
celów - ale zwłaszcza do diagnozy indywidualnej

67
Dlaczego rzetelność testu
jest ważna w diagnozie?

niskie przeciętne wysokie


68
Dlaczego rzetelność testu
jest ważna w diagnozie?

1 2 3 4 5 6 7 8 9 10

niskie przeciętne wysokie


68
Dlaczego rzetelność testu
jest ważna w diagnozie?

1 2 3 4 5 6 7 8 9 10

niskie przeciętne wysokie


68
Dlaczego rzetelność testu
jest ważna w diagnozie?

Półprzedział ufności
3 steny

1 2 3 4 5 6 7 8 9 10

niskie przeciętne wysokie


68
Dlaczego rzetelność testu
jest ważna w diagnozie?
Półprzedział ufności
1 sten

Półprzedział ufności
3 steny

1 2 3 4 5 6 7 8 9 10

niskie przeciętne wysokie


68
Trafność
Czy mierzymy to, co chcieliśmy mierzyć?

69
Trafność testu (1)
• Trafność to dokładność z jaką test mierzy to co ma mierzyć

• Trafność jest to stopień, w jakim test jest w stanie osiągnąć


stawiane mu cele

• Trafność testu wskazuje na wielkość błędu


spowodowanego rozbieżnością między zamierzeniami
autora testu a tym co test faktycznie mierzy

• Trafność odzwierciedla relację jaka zachodzi między


koncepcją właściwości psychologicznej a użytymi
wskaźnikami tej właściwości, czyli adekwatność
operacjonalizacji wielkości psychologicznej

70
Trafność testu (2)
• Trafność testu a trafność interpretacji wyników
danego testu

• Trafność to zintegrowany proces oceny stopnia, w


jakim dowody empiryczne i rozważania natury
teoretycznej potwierdzają adekwatność i
poprawność wniosków wyprowadzanych na
podstawie wyników testowych czy innych narzędzi
pomiaru (Messick, 1989)

71
Walidacja

• Określanie trafności danego testu

• Zbieranie i ocena danych świadczących o trafności


określonej interpretacji wyników testu

• Im więcej przeprowadzonych danych, tym szerszy


potencjał zastosowania testu

72
Test

pomiar

Wynik otrzymany

rzetelność

Wynik prawdziwy

trafność

Cecha
psychologiczna

73
Rodzaje/aspekty trafności
• TREŚCIOWA (inaczej wewnętrzna, logiczna; content validity)
• Ocena (na podstawie pomiaru testowego) całokształtu zachowań,
których próbkę pobiera test
• np. ocena wiadomości z matematyki na przykładzie konkretnego
zadania
• KRYTERIALNA (criterion-related validity)
• Ocena czy osoba posiada lub będzie posiadać pewną określoną
właściwość psychologiczną (inną niż bezpośrednio ta, którą mierzy test)
• TEORETYCZNA (construct validity)
• Pomiar nasilenia hipotetycznej właściwości (czyli psychologicznego
konstruktu, o którym mają świadczyć odpowiedzi na bodźce testowe)

• Relacje między aspektami trafności

74
Uwaga!
Trafność fasadowa
• Trafność treściowa to nie trafność fasadowa (face validity).

• Trafność fasadowa dotyczy tego, co wydaje się mierzyć


test, a nie tego co test rzeczywiście mierzy

• Trafność fasadowa opisuje, jak spostrzegają test osoby


badane i czy – z ich punktu widzenia – wydaje się on
trafnie mierzyć to, co ma mierzyć

• Trafność fasadowa zapewnia, że dany test wydaje się – w


opinii osób badanych – adekwatny do określonego celu

• Czy warto jest dbać o trafność fasadową?

75
Trafność treściowa
• Zakres w jakim pozycje testowe właściwie reprezentują
uniwersum pozycji testowych lub interesujący nas konstrukt

• Zakres, w jakim treść testu stanowi reprezentatywną próbę


dziedziny, która ma być przedmiotem pomiaru

• Aby potwierdzić trafność treściową zbioru wyników


otrzymanych w teście należy wykazać, że zachowania
demonstrowane w badaniu testowym są reprezentatywną
próbką zachowań ujawniających się w interesującej
badacza sferze

• Najczęściej - metoda sędziów kompetentnych

76
Trafność kryterialna
• Kryterium jest to zachowanie czy właściwość, o której chcemy
wnioskować z wyniku ocenianego testu.

• Kryterium jest to zmienna pozatestowa, zewnętrzna w stosunku


do testu, inna niż ta która mierzy interesujący nas test

• Kontaminacja (zanieczyszczenie) kryterium: wyniki testowe nie


mogą wpływać na pozycję jednostki w zakresie branego pod
uwagę kryterium

• Trafność kryterialna jest to stopień zgodności pomiarów


otrzymanych za pomocą testu, którego trafność oceniamy oraz
pomiarów otrzymanych w wyniku oceny kryterium

77
Rodzaje
trafności kryterialnej
• Trafność diagnostyczna (concurrent validity) - kryterium dla testu jest pomiar
zachowania czy cechy aktualnie występującej u osoby badanej

• Trafność prognostyczna (predictive validity) - kryterium dla testu jest pomiar


zachowania czy cechy mającej wystąpić w przyszłości u osoby badanej

• Różnica pomiędzy trafnością diagnostyczną a trafnością prognostyczną nie


polega na różnicy w czasie zbierania danych kryterialnych, lecz na tym, że
różne są przedmioty badania

• Przy diagnozie obchodzi nas stwierdzenie stanu istniejącego

• Przy prognozie - prawdopodobieństwo wystąpienia pewnych skutków stanu


aktualnego
• Wysoka trafność diagnostyczna nie gwarantuje wysokiej trafności
prognostycznej

78
Trafność kryterialna
• wyniki testu rozwoju poznawczego → postępy
szkolne dziecka

• wynik w teście rysowania figur geometrycznych →


stopień uszkodzenia ośrodkowego układu
nerwowego

• test koordynacji wzrokowej → przydatność do


zawodu pilota

• test sumienności → wyniki w pracy


79
Trafność teoretyczna

• Ocena stopnia w jakim wnioski wyprowadzane na


podstawie wyników testowych odzwierciedlają
pozycję osoby na danym kontinuum (konstrukcie)

• Konieczność określenia trafności teoretycznej


występuje wtedy, kiedy test ma być interpretowany
jako miara pewnego atrybutu lub pewnej
właściwości

80
Sposoby badania trafności
teoretycznej
• Analiza struktury czynnikowej testu

• Analiza struktury wewnętrznej testu

• Analiza różnic międzygrupowych

• Analiza macierzy korelacji (macierz WCWM)

• Analiza zmian nieprzypadkowych

• Analiza procesu rozwiązywania testu


81
Analiza czynnikowa (1)
• Celem analizy czynnikowej jest zredukowanie dużej liczby zmiennych
losowych do mniejszego zbioru,

• Założenie - grupy zmiennych losowych reprezentują zmienność tych


samych czynników, czyli zmienne losowe w danej grupie są od siebie w
pewnym stopniu zależne.

• W analizie czynnikowej istnieją dwa podejścia:

• eksploracyjna analiza czynnikowa (EFA - ang. Exploratory Factor


Analysis)

• konfirmacyjna analiza czynnikowa (CFA - ang. Confirmatory Factor


Analysis)

• Teoria → weryfikacja empiryczna struktury kwestionariuszy

82
Analiza czynnikowa (2)

• Wielka Piątka → NEO-PI-R, NEO-FFI, TIPI itd.


• Neurotyczność, Ekstrawersja, Sumienność,
Ugodowość, Otwartość

• Teoria inteligencji → WAIS-R


• Rozumowanie werbalne, Organizacja
percepcyjna, Odporność na dystraktory i pamięć

83
Analiza struktury
wewnętrznej testu (1)
• Zgodność wewnętrzna (homogeniczność) -
stopień, w jakim dany test można uznać za miarę
jednego konstruktu (cechy psychologicznej)

• Jeśli w świetle teorii mierzona cecha jest


homogeniczna, to wysoki współczynnik zgodności
wewnętrznej może być traktowany jako dowód
trafności teoretycznej testu

84
jakim dany test mo na uzna za miar jednego konstruktu
(cechy psychologicznej). Je eli mo na przyj w wietle
teorii, e mierzona cecha jest cech homogeniczn , to
Analiza struktury
wysoki wspó czynnik zgodno ci wewn trznej mo e by
traktowany jako dowód trafno ci teoretycznej testu.

wewnętrznej testu (2)


• Wyniki Wspó
korelacji
czynniki między
korelacji mi poszczególnymi
dzy poszczególnymi testamitestami
a a
ogólnym wynikiem w Skali Pe nej, Skali S ownej
ogólnym wynikiem w ownej
i Skali Bezs Skali w tePełnej, Skali Słownej i
cie WAIS-R
Skali Bezsłownej w WAIS-R
Grupa wiekowa 20-24 lata
Skala Skala Skala
Test
Pe na S owna Bezs owna
Wiadomo ci 0,789 0,864 0,551
Powtarzanie Cyfr 0,675 0,733 0,481
S ownik 0,836 0,882 0,631
Arytmetyka 0,781 0,793 0,633
Rozumienie 0,806 0,816 0,656
Podobie stwa 0776 0,805 0,606
Braki w Obrazkach 0,681 0,575 0,717
Porz dkowanie Obrazków 0,675 0,571 0,710
Klocki 0,645 0,506 0,734
Uk adanki 0,534 0,368 0,680
Symbole Cyfr 0,629 0,527 0,668

85
Analiza różnic
międzygrupowych
• Analiza hipotez dotyczących zachowania się grup różniących
się ze względu na mierzony konstrukt
• Hipotezy wyprowadzone z teorii mierzonej cechy
• Badane grupy powinny różnić się ze względu na ogólny wynik
w teście
• Istnienie różnic w odpowiednim kierunku potwierdza trafność
testu
• Kwestionariusz Potrzeby Poznania (Traczyk, Matusz,
Gąsiorowska, 2011)
• Studenci (M = 134,7; SD = 17,6) i pracownicy naukowi (M =
144,1; SD = 16,5), t(114) = -2,929; p < 0,001

86
Analiza macierzy korelacji
Macierz Wielu Cech – Wielu Metod (1)
• Pomiar kilku cech przy użyciu kilku kwestionariuszy

• Aspekt zbieżny i różnicowy trafności

• ZBIEŻNY (konwergencyjny) - gdy można


wykazać wysoką korelację z innymi testami,
mierzącymi podobne cechy

• RÓŻNICOWY (dywergencyjny) - gdy można


wykazać niską korelację z innymi testami,
mierzącymi inne cechy
87
Analiza macierzy korelacji
Macierz Wielu Cech – Wielu Metod (2)

(Zawadzki i in., 1998)


88
Analiza macierzy korelacji
Macierz Wielu Cech – Wielu Metod (2)

(Zawadzki i in., 1998)


88
Analiza macierzy korelacji
Macierz Wielu Cech – Wielu Metod (3)

(Zawadzki i in., 1998)


89
Analiza macierzy korelacji
Macierz Wielu Cech – Wielu Metod (3)

(Zawadzki i in., 1998)


89
Analiza nieprzypadkowych
zmian wyników testu (1)
• Porównanie wyników dwóch badań, między którymi
wprowadza się oddziaływanie eksperymentalne
związane z cechą

• Wynik porównania powinien być zgodny z założonymi


efektami manipulacji - Istnienie różnic w odpowiednim
kierunku potwierdza trafność testu

• Co może być taką manipulacją?

• np. formalne kształcenie, terapia, farmakoterapia,


zwiększanie doświadczeń
90
Analiza nieprzypadkowych
zmian wyników testu (2)
• poziom lęku w T1 → stresory → ↑ poziom lęku w T2
• poziom lęku w T1 → Xanax → ↓ poziom lęku w T2
• introwersja w T1 (silniejsze procesy pobudzenia
korowego od procesów hamowania) → leki
uspokajające (wzmocnienie procesów hamowania) →
↓ introwersja w T2
• introwersja w T1 (silniejsze procesy pobudzenia
korowego od procesów hamowania) → leki
pobudzające (osłabienie procesów hamowania) → ↑
introwersja w T2
91
Analiza procesu
rozwiązywania testu
• Polega na analizowaniu zadań z punktu widzenia
przetwarzania informacji

• Obserwuje się kolejność wykonania, elementy sprawiające


trudności, pomijane elementy, czas poświęcony na
rozwiązanie poszczególnych zadań, popełniane błędy

• Stosuje się także technikę dekompozycji zadania


polegającą na manipulowaniu cechami zadania

• Podejście inne od koncentracji na analizie samych


odpowiedzi

92
Dlaczego trafność jest ważna
w diagnozie psychologicznej?
• Trafność wyznacza ramy interpretacji wyników
badania

93
Normy i normalizacja
Jak to zinterpretować?

94
Normalizacja (1)
• Nadawanie znaczenia wynikom testowym

• Zgodnie z kryterium teoretycznym norma wyznaczona jest przez


jakąś teorię (koncepcję) psychologiczną. Zasadniczym
znaczeniem terminu norma jest pewien wzór (model) wynikający
z przyjętej teorii, pozostałe zaś znaczenia mieszczą się w tych
ramach.

• Według kryterium kulturowego normę określają przepisy i wzory


kulturowe. Bez względu na treść tych wzorów istotą normy jest
zgodność z takim przepisem.

• Według kryterium statystycznego normą jest to, co jest


opisywane jako „zachowanie większości” czy jako „zachowanie
średnie lub przeciętne”

95
Normalizacja (2)
• W psychometrii przyjmuje się statystyczne rozumienie normy.

• UWAGA! Norma nie oznacza standardu „dobrego” wykonania testu;


norma opisuje poziom typowego wykonania testu przez osoby
należące do określonej grupy.

• Normą – w sensie psychometrycznym – jest standard ilościowy,


wyznaczony przez średnią, medianę lub inną miarę tendencji
centralnej obliczoną dla grupy przedstawicieli danego typu (gatunku).

• Normą jest typowe zachowanie (typowy wynik w teście) otrzymany dla


określonej grupy osób.

• Odniesienie do norm - ocena jak konkretny badany wypada na tle


innych osób (grupy odniesienia)

96
Znaczenie grupy
odniesienia
• Znajomość grupy odniesienia jest kluczem do
prawidłowego interpretowania wyników testowych
• Prawidłowa grupa odniesienia (normalizacyjna)
• dobrze dobrana
• dobrze opisana
• odpowiednio duża
• przebadana w sposób aktualny

97
Rodzaje norm w testach
psychologicznych
• Ze względu na sposób definiowania grupy odniesienia

• normy ogólnokrajowe

• normy lokalne

• Ze względu na sposób ich konstrukcji

• typu standardowego - oparte o rozkład normalny

• typu rangowego - oparte o częstość i rozkład jednostajny

• typu równoważnikowego

• normy wymagań

98
Normy standardowe (1)
• Powstają przez przekształcenie wyników surowych
w teście na wyniki standardowe Z
Wynik surowy Średnia w grupie
osoby badanej odniesienia
w teście
Xi − X
Z=
SD
Wynik
standardowy osoby
badanej Odchylenie
w teście
Z ∼ N(0,1) standardowe w grupie
odniesienia

99
Normy standardowe

• Ale - interpretowanie wyników na skali Z może być


uciążliwe

100
Skale oparte na rozkładzie
normalnym
• Transformacja liniowa - przekształcenie wyników Z na inne skale

jednostka nowej skali = SD × Z + M


• Skala T

• Skala stenowa

• Skala staninowa

• Skala IQ

• Skala tetronowa

• ….

101
Skala T (McCall, 1939)
• Nazwana na cześć E.L. Thordike’a

• M = 50, SD = 10

• obejmuje zasięgiem przedział od -5 do +5 odchyleń


standardowych w rozkładzie normalnym

• 101 jednostek, od 0 do 100

• T = 10 × Z + 50
• Wykorzystywana np. w MMPI
102
Skala stenowa
• Standard ten

• M = 5,5, SD = 2

• obejmuje zasięgiem przedział od -2,25 do +2,25


odchyleń standardowych w rozkładzie normalnym

• 10 jednostek, od 1 do 10

• sten = 2 × Z + 5,5
• Wykorzystywana np. w NEO-FFI
103
Skala staninowa
• Standard nine

• M = 5, SD = 2

• obejmuje zasięgiem przedział od -2 do +2 odchyleń


standardowych w rozkładzie normalnym

• 9 jednostek, od 1 do 9

• sten = 2 × Z + 5
• Wykorzystywana np. w FCZ-KT
104
Skala IQ
• zaproponowana przez Wechslera

• M = 100, SD = 15

• obejmuje zasięgiem przedział teoretycznie


nieograniczony, dowolne jednostki

• IQ = 15 × Z + 100
• Wykorzystywana w WAIS

105
Skala tetronowa
• Opracowana przez Maruszewskiego (1984)

• M = 10, SD = 4

• obejmuje zasięgiem przedział od -2,5 do +2,5


odchyleń standardowych w rozkładzie normalnym

• 21 jednostek, od 0 do 20

• tetron = 4 × Z + 10
• Wykorzystywana np. w wielu testach pedagogicznych
106
Porównanie skal standardowych

107
Etapy procedury wyznaczania norm

108
Normy rangowe
• Odzwierciedlają
uporządkowanie
osób badanych

• Nie
odzwierciedlają
wielkości różnic
między wynikami
osób badanych

109
Skala centylowa

CENTYL 50

110
Normy centylowe
Liczebność
Liczebność prosta dla danego
skumulowana wyniku surowego
obserwacji poniżej
danego wyniku
surowego

cfi−1 + 0,5 × fi
centyl(C) = × 100%
N
Łączna liczba
badanych

• Np. N = 40, jedna osoba 34 + 0,5 × 1


która ma 120 punktów, jest C= × 100% = 86,25%
35 w kolejności 40
111
Skala centylowa a rozkład normalny

1 10 20 30 40 50 60 70 80 99 99

112
Siatka centylowa

113
Normy równoważnikowe
• Obecnie stosowane dość rzadko

• Inaczej normy rozwojowe - określające, jak daleko


na drodze rozwoju (normalnego) znalazła się dana
osoba

• Równoważniki wieku

• Równoważniki klasy

114
Normy równoważnikowe
Zalety Wady

• osiągnięcia badanych są traktowane • przyjmuje się w nich założenie o


rozwojowo równomiernym rozwoju

• równoważniki klasy bądź wieku pokazują • normy takie nadają się tylko do niektórych
opóźnienia/przyspieszenie w uczeniu się treści nauczania
np. w stosunku do średnich osiągnięć
uczniów tej samej klasy, albo w stosunku • bywają mylnie uważane za rejestry
do rówieśników wymagań programowych

• rok szkolny i rok życia stanowią naturalne, • bywają podstawą daleko idących
dobrze znane wszystkim użytkownikom uogólnień
testów, jednostki miary
• ustalanie ich jest pracochłonne i kosztowne
• normy te można dostosować do każdego
miesiąca nauki • wartość norm typu równoważnikowego
zależy od przedmiotu nauczania i polityki
władz szkolnych

115
Analiza zadań
Zasady włączania pozycji testowych
do ostatecznej wersji testu

116
Rodzaje testów
• Testy właściwości poznawczych

• Wiedza, umiejętności, zdolności (także czasy reakcji)

• Istnieje odpowiedź obiektywnie prawidłowa/lepsza/gorsza

• Zagrożenie: zgadywanie

• Testy właściwości afektywnych

• Uczucia, postawy, osobowość, emocje, wierzenia itd.

• Autoekspresja, brak odpowiedzi obiektywnie prawidłowej

• Zagrożenie: trafność samoopisu

117
Analiza zadań
• Analiza treściowa - ustalenie, czy pozycja testowa
jest poprawna rzeczowo, tzn. czy da się ją
wyprowadzić z teorii mierzonej cechy
• Analiza językowa - sprawdzenie, czy pozycja
testowa jest poprawnie sformułowana
• Analiza statystyczna - na podstawie wyników
badań pilotażowych
• współczynnik trudności pozycji testowych
• współczynnik mocy dyskryminacyjnej

118
Współczynnik trudności
(wskaźnik łatwości)
Liczba osób które
odpowiedziały poprawnie
na i-tą pozycję

Współczynnik
ni
trudności
T = = pi
n
Proporcja osób które
odpowiedziały poprawnie
na i-tą pozycję
Ogólna liczba
osób badanych

119
Wariancja pozycji testowej
Proporcja osób które
odpowiedziały poprawnie
na i-tą pozycję

Wariancja i-tej
pozycji
δ = pi (1− pi ) = pi qi
i
2

Proporcja osób które


odpowiedziały niepoprawnie
na i-tą pozycję

120
Jak powinny być dobierane pozycje
testowe na podstawie wsp. trudności?
• Jeśli test ma dobrze różnicować osoby na całym
kontinuum

• Optymalne są takie pozycje, dla których wskaźnik


trudności oscyluje o 50% - pod warunkiem że pozycje
testowe nie są ze sobą powiązane

• W praktyce - średnia trudność testu powinna oscylować


wokół 50%

• Jeśli test ma służyć do celów selekcyjnych - trudność


powinna być dostosowana do pożądanego współczynnika
selekcji

121
Trudność testów a zgadywanie (1)

• Model losowego zgadywania

1
T0 = p0 + q0 × Liczba kategorii
odpowiedzi
Poprawiony
współczynnik
m
trudności

Proporcja osób które Proporcja osób które


odpowiedziały poprawnie odpowiedziały niepoprawnie
na i-tą pozycję na i-tą pozycję

122
Trudność testów a zgadywanie (2)
1
T0 = p0 + q0 ×
m
Proporcja osób Proporcja osób Wartości
Liczba kategorii
odpowiedzi
odpowiadających zgadujących T0 podane przez
prawidłowo odpowiedź Lorda (1952)

2 0,5 0,5/2=0,25 0,75 0,85

3 0,5 0,5/3=0,17 0,67 0,77

4 0,5 0,5/4=0,125 0,623 0,74

5 0,5 0,5/5=0,1 0,60 0,70

123
Poprawka na zgadywanie
przy interpretacji wyniku indywidualnego (1)
Zarejestrowana
częstość niepoprawnych
odpowiedzi
na i-tą pozycję

Wi
Ci = Ri −
Liczba osób,
które rzeczywiście m −1
znały odpowiedź

Liczba kategorii
odpowiedzi
Zarejestrowana
częstość poprawnych
odpowiedzi
na i-tą pozycję

124
Poprawka na zgadywanie
przy interpretacji wyniku indywidualnego (2)
Liczba niepoprawnych
odpowiedzi
dla tej osoby

W
C = R−
Skorygowany wynik
danej osoby
m −1
Liczba kategorii
odpowiedzi

Liczba poprawnych
odpowiedzi
dla tej osoby

125
Np. dla testów
egzaminacyjnych……
• 4 kategorie

• 20 pytań

• osoba odpowiedziała prawidłowo na 11 pytań

9
C = 11− =8
4 −1

126
Współczynnik mocy dyskryminacyjnej

• Stopień, w jaki pozycja testowa różnicuje daną


populację
• pozycja testowa o dodatniej mocy dyskryminacyjnej
• jest częściej rozwiązywana przez badanych o
wysokich wynikach
• różnicuje badanych w zgodzie z innymi pozycjami
testu
• zwiększa wariancję wyników testowania
• pozycja testowa o ujemnej mocy dyskryminacyjnej
jest częściej rozwiązywana przez badanych o niskich
wynikach
127
Rodzaje współczynników
mocy dyskryminacyjnej
• Proste wskaźniki dyskryminacji

• Współczynniki oparte na analizie korelacji między


wynikiem danej pozycji i ogólnym wynikiem w
teście

• Współczynniki oparte na analizie różnic między


skrajnymi grupami

128
Wskaźnik dyskryminacji (1)
Badany
D = pu − pl
A B C D E F G H I J

P1 0 1 1 1 0 1 1 0 1 0 D = 2/3-1/3 = 1/3

P2 1 1 1 1 0 0 0 1 0 1 D = 3/3-3/3 = 0

P3 1 0 1 1 0 1 1 1 1 1 D = 2/3-1 = -1/3

…..

Wynik 25 27 15 24 20 18 16 14 22 10

129
Wskaźnik dyskryminacji (2)

• D≥ 0.40 - pozycję testową można włączyć do testu

• 0.30 ≤ D < 0.40 - pozycja testowa wymaga


niewielkich zmian

• 0.20 ≤ D < 0.30 - pozycja testowa ma niewielkie


znaczenie i wymaga poważnych zmian

• D < 0.20 - pozycja testowa powinna zostać


wyeliminowana z testu lub całkowicie zmieniona

130
Korelacyjne współczynniki
dyskryminacji
• Oparte o korelację pomiędzy wynikiem danej pozycji
testowe i łącznym wynikiem w teście

• Im wyższy dodatni współczynnik korelacji, tym lepsze


właściwości różnicujące (w pożądanym kierunku) ma dana
pozycja

• Wsp. korelacji dwuseryjnej (biserial correlation)

• Wsp. korelacji punktowo-dwuseryjnej (point-biserial


correlation)

• Wsp. korelacji punktowo-czteropolowej (phi coefficient)

131
Założenia
Rozkład cechy która jest
Rozkład ogólnego
Współczynnik mierzona przez daną
wyniku w teście
pozycję testową

korelacji dwuseryjnej normalny normalny

korelacji punktowo- dyskretny (zmienna


normalny
dwuseryjnej dwukategorialna)

korelacji punktowo- dyskretny (zmienna dyskretny (zmienna


czteropolowej dwukategorialna) dwukategorialna)

132
Od czego zależą wysokości
współczynników?

• Od rodzaju współczynnika

• Od proporcji między odpowiedziami prawidłowymi


i nieprawidłowymi (p/q)

• Od rodzaju populacji z której pobrano próbę

133
Współczynniki oparte na analizie
różnic między skrajnymi grupami

• Grupy o niskim i wysokim wyniku w danym teście


(po 27% badanych osób)

• Porównanie pod względem średniego wyniku dla


danej pozycji testem t dla prób niezależnych

134
Jak obliczać wynik ogólny przy
wyliczaniu współczynników mocy
dyskryminacji?

1 2

Wynik ogólny = 1+2+3


135
Jak obliczać wynik ogólny przy
wyliczaniu współczynników mocy
dyskryminacji?

1 2

Wynik ogólny = 1+2+3


135
Jak obliczać wynik ogólny przy
wyliczaniu współczynników mocy
dyskryminacji?

1
X 1 2

Wynik ogólny = 2+3


135
Czynniki wpływające
na wyniki testu

136
Czynniki zniekształcające
wyniki testowe

• Na wyniki testowe wpływają nie tylko zmienne


treściowe - np. określone rodzaje zdolności czy
cech osobowości

• Wyniki testowe mogą też być zniekształcane przez


określone czynniki pozatreściowe

137
Strategie (style) odpowiadania
na pozycje kwestionariusza

• Obserwowana skłonność osób badanych do


udzielania odpowiedzi niezależnie od treści pozycji
testowych

• Trwała dyspozycja do reagowania w określony


sposób w różnych obszarach treściowych

138
Strategie (style) odpowiadania
na pozycje kwestionariusza
• Strategie są stałe i trwałe

• Strategie odpowiadania powodują, że wyniki


testowe są bardziej wieloznaczne

• Strategie odpowiadania są silniejsze w sytuacjach


niejednoznacznych i nieustrukturowanych

• Testy trudne wyzwalają strategie odpowiadania

139
Strategie (style) odpowiadania
na pozycje kwestionariusza

• Tendencja do potakiwania

• Strategia semantyczna

• Tendencja do unikania konkretnej odpowiedzi

• Tendencja do odpowiedzi dewiacyjnych

140
Tendencja do potakiwania

• Skłonność osób badanych do uznawania, że


charakteryzują je różne twierdzenia danego
kwestionariusza, niezależnie od tego jaka jest ich
treść

• Stała dyspozycja do odpowiadania ”prawda",


"zgadzam się", "tak"

141
Strategia semantyczna

• Każda osoba badana może inaczej interpretować


kategorie odpowiedzi typu "czasami", "nie lubię"
czy "trochę się zgadzam".

• Tworzące się w ten sposób stałe błędy mogą się


kumulować i obciążać wyniki

142
Tendencja do unikania
konkretnej odpowiedzi
• Niektóre osoby badane, częściej niż inne
kategorie, wybierają kategorię neutralną ("nie
wiem", "?")

• Tendencja ta może okazać się stałym sposobem


odpowiadania

• Prawdopodobnie zjawisko to oznacza


nieumiejętność podjęcia decyzji w sytuacji
testowania lub niski wgląd - ale także niską
motywację do badania
143
Tendencja do odpowiedzi
dewiacyjnych (Berg, 1967)

• Tendencja do udzielania odpowiedzi wyjątkowych


lub niezwykłych

144
Jak kontrolować style
odpowiadania?
• Odpowiednia budowa kwestionariusza

• wyrównanie liczby pozycji diagnostycznych na "tak" i "nie",


(tendencja do zgadzania się i zaprzeczania)

• eliminowanie odpowiedzi pośrednich (centralny styl odpowiadania)

• stosowanie skal kontrolnych:

• zliczanie odpowiedzi centralnych, niezdecydowanych;

• skali konsekwencji (nieuważności);

• porównanie proporcji odpowiedzi, np. potakujących czy


negujących w skalach treściowych

145
Zmienna aprobaty społecznej
(Edwards, 1957; Crowne i Marlow, 1964)

• Skłonność osób badanych do przypisywania sobie


w samoopisach takich stwierdzeń, które są
społecznie pożądane, a odrzucanie tych, które są
społecznie niepożądane

• Nie jest to świadome oszukiwanie, ale skłonność


do pokazywania się od jak najlepszej strony

146
Kontrolowanie zmiennej
aprobaty społecznej
• Na etapie konstrukcji kwestionariusza:
• Pozycje neutralne
• Pozycje subtelne pod względem trafności fasadowej
• Specjalne formułowanie językowe pozycji
• Wprowadzanie odpowiedniej instrukcji
• Analiza korelacji pozycji ze skalami mierzącymi aprobatę społeczną
• Na etapie stosowania kwestionariusza:
• Wprowadzanie odpowiedniej instrukcji, tzw. instrukcja "szczerości"
• Skala kontrolna aprobaty społecznej (odrzucanie respondentów o
wysokich wynikach lub korygowanie wyników skal treściowych
przez doliczanie tzw. poprawek korekcyjnych

147
Kontrolowanie zmiennej
aprobaty społecznej
aprobata (+) aprobata (-)

Myślę czasem o rzeczach, o Myślę czasem o rzeczach, o


których nie wypada mówić których nie wypada mówić
(NIE) (TAK)
cecha (+)
Histeria + Paranoja +
SD + SD -

Czasem mam ochotę kląć Zdarza mi się śmiać z


(NIE) nieprzyzwoitych dowcipów
(TAK)
cecha (-)
Depresja - Depresja -
SD + SD -
148
Tendencja do dysymulowania i
symulowania a aprobata społeczna
• Tendencja do dysymulowania
• Jest to świadoma lub nieświadoma tendencja osoby badanej do
przedstawiania się w nieprawdziwie korzystnym świetle
• Dysymulacja najczęściej wiązana jest ze zmienną aprobaty
społecznej
• Tendencja do symulowania
• Jest to świadome lub nieświadome udzielanie odpowiedzi,
bezpodstawnie przedstawiających osobę badaną w
niekorzystnym świetle, np. wskazujących na istnienie określonych
zaburzeń zachowania czy niepożądanych cech osobowości
• Kontrolowanie tendencji do symulacji umożliwiają specjalne skale
kontrolne

149
Strategie konstrukcji
testów
• Strategia teoretyczna

• Analiza definicji badanego konstruktu oraz


definicji cech, bowiem określają one zakresy
oraz specyfikę zachowań będących ich opisem

• Strategia empiryczna (instrumentalna)

• Analiza definicji danego kryterium oraz


wyodrębnienie i klasyfikacja podstawowych
wskaźników związanych z kryterium
150
Konstruowanie testu według strategii
empirycznej (instrumentalnej)

Dobranie dwóch grup


Sformułowanie puli pozycji osób
testowych (grupy kryterialnej – osób
(nie muszą wywodzić się z jednej posiadających cechę
spójnej teorii) i grupy kontrolnej – osób nie
posiadających cechy)

Określenie, jakie
pozycje testowe
różnicują te dwie grupy
151
Eksperyment Gougha (1954)
nad klinicznym pojęciem neurotyzmu
• Grupa zaawansowanych studentów i klinicystów miała
na pozycje testu odpowiadać tak, jak ich zdaniem,
odpowiadałby pacjent „doświadczający reakcji
psychoneurotycznej”

• Życie źle obchodzi się ze mną

• Symulanci – 79%; Neurotycy – 14%

• Zazwyczaj uważam, że warto żyć

• Symulanci – 25%; Neurotycy – 68%


152
Częstość odpowiedzi na
wybrane pozycje MMPI
• Czasem drażnię zwierzęta
Odpowiedź FAŁSZ – częściej pacjenci depresyjni niż
niedepresyjni

• Chętnie czytam powieści kryminalne i sensacyjne


Odpowiedź FAŁSZ – częściej hospitalizowani histerycy

• Zdarza mi się czasem poplotkować


Odpowiedź PRAWDA – częściej inteligentni niż nieinteligentni

• Nie lubię widoku palącej kobiety


Odpowiedź FAŁSZ – częściej pacjenci z bólami krzyża
pochodzenia funkcjonalnego

153
Adaptacja testów
Kiedy test “zagraniczny” nadaje się do używania
w naszych warunkach?

154
Adaptacja testu

• Adaptacja testu to opracowanie go w taki sposób,


aby mógł być stosowany w kraju adaptacji czyli był
nadal trafnym i rzetelnym narzędziem diagnozy
psychologicznej.

• Kulturowa adaptacja testu oznacza przystosowanie


czy dopasowanie wersji oryginalnej testu do innej
specyfiki kulturowej.

155
Test “wolny kulturowo”
• Pierwszy raz terminu culture free test użył Cattell
(1940)

• A comprehensive dictionary of psychological and


psychoanalitical terms (1958):

• Culture free jest to test ogólnej inteligencji, z


którego wyeliminowano – na tyle, na ile to było
możliwe – wszystkie zadania zależne od
doświadczeń występujących częściej w jednej
kulturze, niż innej.
156
Przedmiot pomiaru psychologicznego
- uniwersalny czy specyficzny?
• Podejście nomotetyczne do kultur (uniwersalistyczne –
etic approach)
• Podejście idiograficzne do kultur (specyficzne – emic
approach)

157
Podejście nomotetyczne
• Do porównywania wpływu kultury potrzebne są pojęcia ogólne,
będące aproksymacją pojęć specyficznych, lecz oparte na
wspólnym układzie odniesienia
• Uzasadnione są takie działania, jak:
• adaptacja narzędzi diagnostycznych, przenoszonych z innej
kultury wraz z zapleczem teoretycznym i literaturowym,
• przyswajanie teorii psychologicznych (o których się
apriorycznie zakłada, iż są na tyle ogólne, że trafne są w
każdych warunkach społeczno-kulturowych),
• stosowanie „ponadkulturowych” technik terapeutycznych, itd.

158
Podejście idiograficzne
• Analizy wpływów kultury należy dokonywać bazując na pojęciach
wypracowanych przez daną społeczność, gdyż kultura jest
integralną częścią ludzkich zachowań
• Uznaje się istnienie specyficznych kulturowo czynników
etiologicznych, czynników (kultur) immunizujących członków
danej społeczności przeciwko zaburzeniom psychicznym lub im
sprzyjających
• Wiąże się to także z przekonaniem o kulturowo specyficznych
rodzajach osobowości, uzdolnień, rodzajach zaburzeń i/lub
specyficznych ich manifestacji, ich terapii;
• Wiąże się z niezgodą na implantację obcych (kulturowo) narzędzi
diagnostycznych, teorii, systemów klasyfikacji zaburzeń itp.

159
Założenia adaptacji kulturowej.
Zasada równoważności
• Problemy przy adaptacji kulturowej narzędzia
diagnostycznego:
• czy przedmiot pomiaru ma charakter emikalny czy
etikalny
• jeśli przedmiot pomiaru ma charakter etikalny - czy
przejawia się on w drugiej kulturze tak samo lub
podobnie
• Równoważność konstruktu
• Równoważność funkcjonalna zachowań
• Równoważność wskaźników konstruktu teoretycznego
160
Równoważność
konstruktu
• Czy to, co ma być przedmiotem pomiaru (konstrukt
teoretyczny) istnieje nie tylko w kulturze oryginalnej,
ale także w kulturze docelowej?

• Czy pochodzący z kultury oryginalnej konstrukt daje


sensowne i porównywalne informacje w kulturze
docelowej?

• Jeśli TAK—> adaptacja jest możliwa

• Jeśli NIE —> lepiej jest skonstruować nowe narzędzie

161
Równoważność
funkcjonalna zachowań

• Zachowania są funkcjonalnie równoważne wtedy,


gdy członkowie różnych kultur zachowują się
podobnie w podobnych sytuacjach, by zrealizować
równoważne cele.

• Badane zachowania powinny być odpowiedzią na


podobne problemy w analizowanych kulturach

162
Równoważność wskaźników
konstruktu teoretycznego

• Równoważność wskaźników to inaczej


równoważność definicji operacyjnych

• W jaki sposób interesujące nas konstrukty


przejawiają się na poziomie manifestacji?

• Jaki jest wpływ kontekstu kultury rodzimej na treść


pozycji testowych?

163
Strategia adaptacji
• Transkrypcja Etikalny
charakter konstruktu
• Translacja

• Trawestacja

• Parafraza

• Rekonstrukcja Emikalny
charakter konstruktu
164
Transkrypcja
• Maksymalnie wierne tłumaczenie oryginalnych
pozycji. Wprowadza się tylko takie poprawki
językowe, które są niezbędne

• Zakłada się, że zarówno konstrukty, jak i


zachowania są uniwersalne kulturowo

• Transkrypcja jest najbardziej zachowawczą


strategią adaptacji testów - “chroni” nie tylko
oryginalne konstrukty, ale i wskaźniki służące do
ich pomiaru
165
Translacja
• Wierne tłumaczenie finalnej puli oryginalnych pozycji,
ale z możliwością wprowadzenia niezbędnych
modyfikacji, gdy specyfika kulturowa oryginału może
powodować nierównoważność testu

• Zakłada się, że konstrukty, jak i zachowania są


uniwersalne kulturowo, ale nie są uniwersalne pojęcia
używane w danej kulturze do opisu zachowania

• Przed adaptatorem stoi zadanie zaproponowania takiej


modyfikacji językowej lub logicznej pozycji, by była ona
funkcjonalnie zbliżonym do oryginału bodźcem

166
Trawestacja
• Swobodne tłumaczenie oryginału z wprowadzaniem wielu
modyfikacji i zmian, sugerowanych względami językowymi
i psychologicznymi

• Istnieje możliwość wymiany części pozycji ze względów


językowych, treściowych (wymiana opisywanej formy
zachowania na inną, bardziej specyficzną kulturowo) lub
psychometrycznych (lepsza miara danej cechy).

• Zakłada się, że konstrukty psychologiczne są uniwersalne,


ale nie są uniwersalne pojęcia używane w danej kulturze
do opisu zachowania i nie zawsze uniwersalne są same
zachowania (część zachowań ma charakter emikalny).

167
Parafraza
• Konieczność opracowania nowego narzędzia od fazy
analizy teorii i generowania pozycji, aż po analizę
psychometryczną danych - test oryginalny jest jedynie
inspiracją adaptacji

• Celem adaptacji jest maksymalne wierne oddanie intencji


autora odnośnie treści konstruktu psychologicznego (rola
teorii psychologicznej)

• Zakłada się, że konstrukty psychologiczne są uniwersalne


kulturowo, ale z reguły nie są uniwersalne zachowania
(tylko część z nich ma charakter etikalny, tj. równoważny
kulturowo i tylko te mogą wejść do finalnej wersji adaptacji).

168
Rekonstrukcja
• Konieczność opracowania całkowicie nowego narzędzia,
dla którego inspiracją jest oryginalny model teoretyczny i
strategia konstrukcji.

• Przy rekonstrukcji pozycje testu są generowane w danym


języku, zgodnie z regułami przyjętymi w wersji oryginalnej.

• Celem adaptacji jest maksymalne wierne oddanie intencji


autora odnośnie treści konstruktu psychologicznego i
procedury tworzenia testu.

• Zakłada się, że zarówno zachowania jak i konstrukty


psychologiczne mogą nie być uniwersalne kulturowo.

169
Wybór odpowiedniej strategii zależy
przede wszystkim od celu adaptacji

• Bezpośrednie ilościowe porównania


międzykulturowe - transkrypcja, translacja,
trawestacja

• Bezpośrednie ilościowe porównania


wewnątrzkulturowe - parafraza i rekonstrukcja

170
Stronniczość
testów
psychologicznych

171
„Testy psychologiczne mierzą cechy, które nie są
bezpośrednio obserwowalne, które różnie są
definiowane i które mierzone są jedynie w sposób
pośredni. Z tej perspektywy, problem stronniczości
testów inteligencji jest częścią szerszego – w sposób
oczywisty ważniejszego – problemu
niejednoznaczności. Problem stronniczości dotyczy
generalnie wszelkich testów psychologicznych.
Stronniczość bowiem, może się ujawnić nie tylko w
przypadku testów inteligencji, ale również testów
osobowości, testów psychopatologicznych czy testów
zawodowych”.

Reynolds i Brown (1984, s. 15)


172
Co oznacza stronniczość
testu psychologicznego?
• Błąd systematyczny

• W sensie statystycznym, stronniczość wpływa na


wyniki testowania zawsze w stały sposób

• W sensie psychometrycznym, stronniczość wyraża


się w tym, że poszczególne pozycje testowe są mniej
lub bardziej trudne dla osób należących do różnych
podgrup wyodrębnianych (na przykład ze względu
na wiek, czy płeć) w ramach tej samej populacji
173
Kiedy występuje
stronniczość testu?

• Wtedy (i tylko wtedy) gdy dana grupa osiąga


niższe wyniki w teście, a nie osiąga niższych
wyników w kryterium

• Stronniczość to nietrafna różnica grupowa - test


diagnozuje różnice nieobiektywne, nieistniejące lub
nie mające znaczenia dla danego kryterium

174
Stronniczość ≠ Uczciwość
• Stronniczość to cecha formalna testu
• Uczciwość to termin odnoszący się do strony etycznej
testowania
• Uczciwość odwołuje się zawsze do jakiegoś systemu
wartości
• Pojęcie uczciwości, społecznej sprawiedliwości i jednakowej
ochrony przez prawo to pojęcia moralne i prawne i w tym
sensie należy je odróżniać od pojęcia stronniczości testu,
traktowanej jako cecha testu
• Uczciwość stosowania testu to kwestia kompetencji
psychologa, polityki społecznej, rozwiązań prawnych,
konsekwencji praktycznych

175
Czynniki, ze względu na które
test może być stronniczy
• Wiek

• Płeć

• Rasa

• Status socjoekonomiczny (klasa społeczna)

• …Ale nie tylko

176
Wiek
• Test jest zwykle przeznaczony do badania
odpowiedniej populacji (dzieci, młodzież, dorośli)

• Próba zmiany przeznaczenia testu pod tym


względem wymaga dostosowania samego testu,
nieraz nawet ingerencji na poziomie pozycji

• Zazwyczaj adaptacja testu do różnych grup wieku


polega na tworzeniu odrębnych wersji wiekowych
testu oraz w najprostszej postaci - na tworzeniu
norm wiekowych
177
Płeć
• Testy często faworyzują jedną z płci (zwykle mężczyzn)

• Testy powinny być opracowywane tak by czynnik ten


neutralizować

• Procedura decentracji - podtesty neutralne, równe


proporcje skal faworyzujących i dyskryminujących
daną płeć

• Jeśli test wykazuje różnice płciowe, to stronniczości


można uniknąć wprowadzając odrębne normy

178

You might also like