Professional Documents
Culture Documents
Psychometria Pytania 2022
Psychometria Pytania 2022
Psychometria Pytania 2022
2. trafność fasadowa powinna być brana pod uwagę w przypadku testu, gdyż:
a) stanowi podstawę statystycznego doboru pozycji
b) jest częścią składową każdego rodzaju trafności
c) jest dowodem, że test mierzy to, co zmierzył jego autor
d) zapewnia zgodność wyglądu testu czym.... sądzi osoba badana
3. wyniki standardowe to
a) wyniki uzyskane w standardowych warunkach
b) wyniki wyrażone w terminach odchylenia standardowego
c) wyniki wyrażone w terminach obiektywnego standardu
d) wyniki uzyskane za pomocą wystandardyzowanego narzędzia
6. wysoki współczynnik korelacji pomiędzy dwoma testami równoległymi stosowanymi jeden po drugim,
bez przerwy czasowej, świadczy o:
a) funkcjonalnej mierzonej zmiennej w czasie
b) niskiej homogeniczności wysokiej specyficzności pozycji testowych
c) niskiej specyficzności i wysokiej specyficzności pozycji testowych
d) o dużym stopniu obiektywności
8. otrzymanie różnych współczynników trafności kryterialnej dla danego testu jest najczęściej
spowodowany:
a) faktem wybrania różnych zmiennych kryterialnych
b) błędami w obliczeniach
c) niską rzetelnością testu
d) trudnościami w diagnozowaniu zachowania mierzonego przez test
9. test składa się z 10 pytań. Powinien dobrze różnicować w obrębie patologii. Która z poniższych skal
standardowych najlepiej pozwalałaby zrealizować ten cel:
a) M=10, SD=5
b) M=10 SD=1
c) M=50 SD=10
d) M=50 SD=25
11. aby spełnić warunek obiektywności, każdy test musi być przynajmniej:
a) stosowany i obliczany w z góry ustalonych warunkach
b) wysoko rzetelny
c) losową próbką wskaźników zmiennej teoretycznej
d) oparty na wybranej teorii mierzonej zmiennej
12. Stanina to
a) wynik surowy
b) wynik wskazujący na wiek umysłowy
c) inna nazwa centyli
d) znormalizowany wynik standardowy
13. centyle to wyniki, które wskazują jaki procent osób z badanej grupy uzyska wyniki:
a) takie same lub wyższe od danego wyniki
b) takie same lub niższe od danego wyniku
c) wyższe od średniej
d) niższe od średniej
17. aby znormalizowane wyniki testowe były użyteczne odnosi się je do:
a) treści pozycji tworzących test psychologiczny
b) innych metod testowych
c) zachowania wybranej, dobrze określonej grupy
d) rzetelności i trafności metody
18. kontaminacja kryterium najczęściej pojawia się, gdy:
a) test ma niską rzetelność
b) psychiatra ma dostęp do wyników testowych
c) łączy się wyniki dwóch różnych grup osób badanych
d) łączy się wyniki pomiaru dwóch różnych kryteriów
19. stosując współczynnik korelacji dwuseryjnej, jako współczynnik mocy dyskryminacyjnej, musi zostać
spełnione założenie, że zmienna zdychotomizowana jest:
a) rzeczywiście ciągła i posiada rozkład normalny,
b) ciągła lecz nie o rozkładzie normalnym
c) z natury swej dychotomiczna
d) dzieli się w punkcie mediany
22. jeżeli test jest zbyt trudny dla badanej grupy osób to rozkład wyników w tym teście będzie:
a) normalny
b) prostokątny
c) skośny
d) wielo modalny
24. jeżeli rozkład wyników surowych jest rozkładem lewo skośnym, to w celu jego normalizacji należy
zastosować następującą transformację:
a) pierwiastkową,
b) logarytmiczną
c) potęgową
d) żadną z nich
30. testu przeznaczone do selekcji ze względu na specyficzne kryterium, powinny składać się z pozycji
testowych, których współczynnik trudności wynosi:
a) 0,5
b) mieści się w przedziale od 0-100%
c) wyznaczony jest przez rozkład normalny
d) jest równy wyznaczonemu punktowi selekcji
31. formuła speramana - browna jako metoda szacowania rzetelności stosowana jest w technice:
a) test-retest
b) testów równoległych
c) połówkowania (split-half)
d) krudera-richardsona
32. dla którego z poniższych rodzajów testów, okre4ślenie trafności treściowej będzie najbardziej
odpowiednie
a) testów zdolności werbalnych
b) testów wiadomości z matematyki
c) testów projekcyjnych
d) testów inteligencji
38. rzetelność testu to również jedno z kryteriów dobroci testów psychologicznych. Rzetelność testu oznacza
przede wszystkim następującą właściwość wyników teoretycznych
a) powtarzalność
b) obiektywność
c) istotność
d) trafność
40. jedyny, z kryteriów normalnych, branych pod uwagę przy tworzeniu testu jest współczynnik trudności
poszczególnych pozycji testowych. Jeżeli tworzymy test dla celów selekcji i mamy dużo kandydatów, a
możemy przyjąć najwyżej 10% to większość pozycji testowych z tego testu powinna być:
a) raczej trudnych
b) raczej łatwych
c) raczej o przeciętnej trudności
d) raczej o wysokim współczynniku rzetelności niż trafności
41. wiedząc, że w klasycznej teorii testów przyjmuje się wynik obserwowany = wynik prawdziwy + błąd
pomiaru, określ co powinno być podstawowym obowiązkiem autora testu:
a) dążenie do zwiększenia wyniku prawdziwego danej osoby,
b) dążenie do zmniejszenia błędu pomiaru
c) dążenia do zwiększenia wyniku obserwowanego
d)
3. obiektywność jest jedyny z tzw. kryteriów dobroci testów psychologicznych. Aby spełnić warunek
obiektywności każdy test musi przynajmniej
a) zostać oparty na teorii mierzonej zmiennej
b) dawać porównywalne wyniki niezależnie od tego gdzie i kiedy jest stosowany
c) być obliczany w ściśle określonych warunkach
d) posiadać wysokie wskaźniki rzetelności i trafności
4. warunek standaryzacji, czyli koleje kryterium dobroci testów psychologicznych zostanie spełniony wtedy
gdy:
a) test będzie stosowany w jednolity sposób w stosunku do wszystkich osób badanych
b) test zostanie wyposażony w podręcznik zawierający opis zasad jego stosowania
c) test będzie stosowany odpowiednio do możliwości osoby badanej
d) test zostanie zastosowany tylko w takich sytuacjach w których jego wyniki będą miały praktyczną
użyteczność
5. jednym z kryteriów formalnych branym przy tworzeniu testu jest współczynnik trudności poszczególnych
pozycji testowych. Jeżeli chcemy zastosować test do selekcji kandydatów uwzględniając określony punkt
odcięcia to powinniśmy wybrać taki test, który składa się z pozycji testowych, których współczynniki
trudności wynosi:
a) 0,6
b) mieści się w zakresie 0-100%
c) jego średnia wartość wynosi 50%
d) jest równy wyznaczonemu punktowi selekcji
……………………………………………………………………………………………………….
10. rzetelność jako miara dokładności pomiaru testowego testu jest technicznie wyrażana w postaci:
a) współczynnika zmienność
b) współczynnika korelacji
c) współczynnika zgodności
d) współczynnika regresji
11. metoda testów równoległych stosowana do oszacowania rzetelności testu pozwla na wyeliminowanie
wpływu:
a) zbyt wysokiej trudności pozycji testowych
b) pamięci i efektów uczenia się
c) szybkości rozwiązywania zadań
d) błędów o charakterze losowym, ujawniających się w sytuacji testowania
12. wysoki współczynnik korelacji pomiędzy dwoma testami równoległymi stosowanymi jeden po drugim
bez przerwy czasowej, świadczy o:
a) wysokiej fluktuacji mierzonej zmiennej w czasie
b) niskiej homogeniczności i wysokiej specyficzności
c) niskiej specyficzności i wysokiej homogeniczności
d) wysokim stopniu obiektywności testu
13. formuła spermana-browna jako metoda szacowania rzetelności testu jest rutynowo stosowana w technice:
a) podwójnego testowania
b) testów równoległych
c) KR
d)
16. dokonując diagnozy na podstawie wyniku testowego, należy wziąć pod uwagę standardowy błąd pomiaru
ponieważ,
a) tylko w ten sposób można określić istotność otrzymanych wyników
b) pozwala on na dokładne określenie poziomu istotności wyniku prawdziwego,
c) dzięki niemu można określić wielkość błędu jakim jest obciążony wynik testu
d) pozwala on określić wielkość błędu jaki popełniany jest przy interpretowaniu wyniku
poszczególnych pozycji testowych
17. trafność testu to również jedno z kryteriów dobroci testów psychologicznych. Klasyczny podział
obejmuje następujące rodzaje trafności:
a) trafność treściową kryterialną i teoretyczną
b) trafność treściową fasadową i kryterialną
c) trafność treściową logiczną i wewnętrzną
d) trafność treściową diagnostyczną i prognostyczną
18. często zdarza się, że autorzy przeprowadzający badania danego testu uzyskują różne współczynniki
trafności kryterialnej. Jest to najczęściej spowodowane:
a) niskimi współczynnikami pozostałych rodzajów trafności
b) niskimi współczynnikami rzetelności testu
c) trudnościami w diagnozowaniu zachowania mierzonego przez test
d) faktem wybrania różnych zmiennych kryterialnych
19. w której z przedstawionych niżej sytuacji może dojść do zjawiska kontaminacji kryteriów:
a) psychiatra dokonując oszacowania wyników badanych osób ze względu na zmienną
kryterialną miał dostęp do wyników testowych
b) psychiatra dokonując oszacowania wyników badanych osób ze względu na zmienną kryterialną
znał podręcznik testowy
c) autor testu znał procedurę szacowania badanych osób ze względu na zmienną kryterialną
d) autor testu połączy ł wyniki otrzymane dla dwóch różnych zmiennych kryterialnych
20. trafność teoretyczna uważana jest za najważniejszy rodzaj trafności. Znajduje ona swoje odzwierciedlenie
w:
a) hipotezach dotyczących zachowania badanych osób tworzonych na podstawie istotnych dla
psychologa teorii psychologicznych
b) hipotezach dotyczących zachowania badanych osób tworzonych na podstawie teorii
mierzonej zmiennej
c) rezultatach badań nad rzetelnością teorii psychologicznej, która leży u podstaw testu
d) rezultatach badań nad trafnością teorii psychologicznej, która leży u podstaw testu
21. istnieje wiele rodzajów trafności. W zależności od celu testowania niektórych z nich mają większe
znaczenie. Dla którego z poniższych rodzajów testów określenie trafności będzie najbardziej pożądane:
a) testów projekcyjnych
b) testów inteligencji
c) testów zdolności werbalnych
d) testów wiadomości z matematyki
23. wyniki standardowe za pomocą których można przedstawić wyniki uzyskane w teście otrzymane przez
osoby badane to:
a) wyniki uzyskane w standardowych warunkach
b) wyniki wyrażone w terminach odchylenia standardowego
c) wyniki wyrażone w terminach obiektywnych standardów
d) wyniki uzyskane za pomocą wystandaryzowanego narzędzia
24. aby znormalizowane wyniki testowe były użyteczne, tzn. można je był zinterpretować należy je odnieść
do:
a) rzetelności i trafności metody
b) treści pozycji tworzących test psychologiczny
c) zachowania wybranej, dobrze określonej grupy
d) innych metod testowych
22. Jeżeli test jest zbyt trudny dla badanej grupy osób, to rozkład wyników w tym teście
będzie:
a) normalny
b) skośny
e) prostokątny
f) wielomodalny
24. Jeżeli rozkład wyników surowych jest rozkładem lewoskośnym, to w celu jego
normalizacji należy zastosować następującą transformację:
a) pierwiastkową
b) logarytmiczną
g) potęgową
h) żadną z nich
a)
Współczynnik rzetelności dla tego testu wynosi 0,81
b)
Współczynnik rzetelności dla tego testu wynosi 0,9
2.
W jakim przypadku wykonuje się transformację liniową?
b) Gdy cecha nie ma rozkładu normalnego, ale do normalizacji wykorzystuje się skale,
które mają taki rozkład
c) Gdy ani wynik w teście, ani cecha nie mają rozkładu normalnego
d)
Gdy wynik w teście i cecha mają rozkład normalny
3.
Co oznacza „norma” w sensie psychometrycznym?
c)
Norma wyznaczana jest przez standard ilościowy wyznaczony przez miarę
tendencji centralnej dla danej grupy
4.
Który z poniższych rodzajów trafności testu weryfikuje się za pomocą metody
sędziów kompetentnych?
a) Trafność fasadowa
b)
Trafność treściowa
c) Trafność kryterialna
d) Trafność teoretyczna
5
.W którym przypadku istnieje największe ryzyko, że normy dla testu
psychologicznego mierzącego cechy osobowości staną się nieaktualne?
a) Gdy diagnosta będzie wykorzystywał test ponad 10 lat od momentu jego utworzenia
b)
Gdy diagnosta będzie chciał prowadzić badania elektronicznie, a oryginalna wersja
testu jest papierowa
d) Gdy diagnosta będzie miał coraz większe doświadczenie w posługiwaniu się testem
6.
Jeśli Autorzy piszą, że oszacowali stabilność bezwzględną jako miarę
rzetelności badania, to co zrobili?
c)
Policzyli korelacje między dwoma badaniami tym samym testem z odstępem czasu
d) Policzyli korelacje między dwoma badaniami tym samym testem bez odstępu czasu
7.
Które z poniższych założeń NIE jest prawdziwe w odniesieniu do klasycznej
teorii testów?
c)
Wielkość błędu pomiaru zależy od wyniku w teście
8.
Testy, w których czas rozwiązywania jest ograniczony, a trudność zadań jest
przeciętna to inaczej:
a) Test szybkości
b) Test mocy
c) Testy wystandaryzowane
9.
Jak należy zinterpretować współczynnik rzetelności testu równy 1,8?
c)
Nie jest możliwe by współczynnik rzetelności przyjmował taką wartość
d)
Za mało informacji by móc je jednoznacznie zinterpretować
10. Jeśli dwóch diagnostów opracowujących wyniki tego samego badania (testu
tej samej…) dochodzą do tego samego rezultatu, to znaczy, że wykorzystany
test jest:
a)
Obiektywny
b) Nie obiektywny
c) Wystandaryzowany
d)
Nie wystandaryzowany
b)
Wynik w teście jest nisko lub wcale skorelowany z innymi cechami,
mierzącymi
inne cechy
c)
Jest największa dla pozycji o przeciętnym poziomie trudności
d)
Nie zależy od poziomu trudności pozycji testowych
a) Trafność fasadowa
b) Trafność treściowa
c) Trafność kryterialna
d)
Trafność teoretyczna
14. Przedział ufności dla wyniku obserwowanego jest tym mniejszy, im:
a)
Niższa jest rzetelność testu
d)
Niższa jest trafność testu
a) 60%
b) 65%
c) 70%
d) 75%
16. Metoda adaptacji testu psychologicznego, która opiera się na stworzeniu nowego
na…o ten sam model teoretyczny co narzędzie oryginalne to:
a) Transkrypcja
b) Trawestacja
c)
Rekonstrukcja
d)Translacja
a)
Badań trafności testu
c) Badań normalizacyjnych
d)
Wszystkie odpowiedzi są prawidłowe
18. Która z cech testu wyznacza ramy interpretacji wyników badania jako natężenie
określonej ..
a) Rzetelność
c)
Normalizacja
d)
Adaptacja
a)
Skala T
b) Skala rangowa
c) Skala centylowa
d)
Skala centymetrowa
a) Gdy zarówno rozkład cechy mierzonej przez daną pozycję testową, jak i rozkład
ogólnego…teście jest normalny
b) Gdy rozkład cechy mierzonej przez daną pozycję testową nie jest normalny, ale
rozkład ….wyniku w teście jest normalny
c)
Gdy zarówno rozkład cechy mierzonej przez daną pozycje testową, jak i rozkład
ogólnego wyniku w teście (nie jest normalny) tylko jest dyskretny - zmienna
dwukategorialna
d)
Gdy rozkład cechy mierzonej przez daną pozycję testową jest normalny, ale rozkład
ogólny…teście nie jest normalny
d
)Jednakowe pozycje testowe
22. Która cecha testu psychologicznego jest kluczowa dla tego, czy wynik
obserwowany odzwierciedla cechę psychologiczną którą miał mierzyć test?
a)
Rzetelność
b)
Trafność
c) Obiektywność
d)
Standaryzacja
b)
Test właściwości afektywnych
c) Test niewerbalny
d)
Test nieobiektywny
niejest związane ze stronniczością testu
24. Które z poniższych pojęć
psychologicznego?
a)
Występowanie błędu systematycznego pomiaru strona 102 na samej górze
“stronniczość testu to błąd systematyczny”
Pytania psychometria:
10. Moc dyskryminacyjna pozycji informuje o tym, w jakim stopniu pozycja testowa:( nie
rozumiem pytania “ Moc dyskryminacyjnapozycji w teście jest miarą, dzięki której możemy
określić
jak dana zmienna, zadanie, pytanie wpływa na ogólny wynik mierzonej przez narzędzie
cechy czy umiejętności. Miara ta pozwala odpowiedzieć, czy i na ile wyższa wartość dla danej
pozycji jest związana z wyższym poziomem ogólnego wskaźnika danej skali (w skład której
wchodzi dana pozycja).”
a) ……. test ze względu na trafność
b) ……. test ze względu na mierzoną cechę
c) ……. populacje ze względu na mierzoną cechę??
d) ……. populację ze względu na trafność testu
11. ….. tzw. ,, instrukcji i szczerości” stosowana przy kontrolowaniu zmiennej aprobaty
społec…..:
a) ….. być stosowana na etapie konstrukcji kwestionariusza
b) Powinna być stosowana na etapie stosowania kwestionariusza
c) Zakłada stosowanie wyłącznie pozycji neutralnych pod kątem aprobaty społecznej
d) Jest metodą nieskuteczną i nie powinna być stosowana
14. Jeżeli wynik danej osoby w teście inteligencji jest równy 12, a pół przedział ufności dla
alfa=0,15 w tym teście wynosi 2, dla alfa = 0,10 wynosi 3, a dla alfa= 0.05 wynosi 4, to wynik
prawdziwy osoby A z 95% pewnością, znajduje się w przedziale:
a) (10-14)
b) (9-15)
c) (8-16) nie wiem
d) (12-12)
17. Przyjęcie perspektywy emikalnej jako podstawy adaptacji testu oznacza akceptację
następującego poglądu:
a) Cechy będące przedmiotem pomiaru psychologicznego mają charakter uniwersalny i
dlatego można swobodnie …. Testy z jednego obszaru kulturowego co drugiego
b) Cechy będące przedmiotem pomiaru psychologicznego są kulturowo specyficzne i
dlatego procedura adaptacji ……. …….. uwzględniając specyfikę kulturową kraju do którego
testy jest przenoszony
c) Cechy będące przedmiotem pomiaru psychologicznego można traktować jako
uniwersalne lub specyficzne ….. od przyjętej teorii cechy
d) Cechy będące przedmiotem pomiaru psychologicznego można traktować jako
uniwersalne lub specyficzne ….. od przyjętych metod ich pomiaru
21. Obiektywność testu jest pierwszym kryterium dobrości testu. Dany test spełnia warunek
obiektywności, jeżeli:
a) Daje obiektywne wyniki
b) Posiada wysokie korelacje z innymi wynikami testowymi
c) Oceniany przez różnych psychologów daje porównywalne wyniki
d) Pozwala na zastosowanie obiektywnego klucza oceny odpowiedzi
22. W poniższym zdaniu brakuje jednego wyrazu. Które z poniższych określeń należałoby
wstawić w to miejsce? „ Stopień w jakim test pozwala na pomiar nasilenia u osoby badanej
hipotetycznej właściwości to…………… testu.”
a) Trafność wewnętrzna
b) Trafność teoretyczna
c) Trafność logiczna
d) Trafność diagnostyczna
23. Jeżeli interesuje nas odpowiedź na pytanie, czy wszystkie pozycje testu mierzą się tą
samą cechą psychologiczną to możemy zastosować współczynnik rzetelności typu:
a) Test- retest
b) Dla norm równoległych
c) Homogeniczności
d) Połówkowania
24. Jeżeli diagnosta chce różnicować w obrębie wyników bardzo niskich lub bardzo
wysokich, to powinien posługiwać się testem, w którym normy zostały wyróżnione w skali :
a) Tetronowej
b) Staninowej
c) Stenowej
d) T
25. Aby można było stosować test dla celów diagnozy indywidulanej, to jego rzetelność
powinna oscylować wokół:
a) 0,9
b) 0,8
c) 0,7
d) 0,6
Tak, a dla celów niediagnostycznych np. badania naukowe min. 0,6
a) Rzetelność testu
b) Trafność testu
c) Zarówno rzetelnośc testu jak i trafność testu
d) Ani rzetelność ani trafnośc testu ???
29. Trafność teoretyczna uważana jest za najwyższy rodzaj trafności. Znajduje się ona
swoje Odzwierciedlenie m.in. w :
a) Rezultatach badań nad rzetelnością teorii psychologicznej, która leży u podstawy
testu
b) Rezultatach badań nad trafnością teorii psychologicznej która leżu u podstawy testu
c) Hipotezach dotyczących zachowań badań osób tworzonych na podstawie istotnych
dla psychologa teorii psychologicznych
d) Hipotezach dotyczących wyniku badanych osób w teście tworzonych na podstawie
teorii mierzonej
31. Który z wymienionych niżej etapów niejest etapem analizy pozycji testowych?
a) Ustalenie czy pozycje testową da się wprowadzić z teorii mierzonej właściwości
psychologicznej
b) Sprawdzenie czy pozycja testowa jest poprawnie zredagowana
c) Określenie czy pozycja testowa jest homogeniczna
d) Obliczenie statystycznych wskaźników dla pozycji testowej
37. Interpretując wynik otrzymamy w teście należy wziąć pod uwagę standardowy błąd
pomiaru ponieważ można w ten sposób określić wielkość błędu dla:
a) Pozycję testu
b) Wynik ogólny w teście
c) Współczynnika trafności w teście
d) Współczynnika rzetelności testu
38. Jeżeli nie ma żadnych innych wskazań, to średni współczynnik trudności pozycji
testowych sytuacji, gdy konstruowany test ma w maksymalnym stopniu różnicować badaną
populację powinien:
a) Mieścić się w zakresie od 0% do 100%
b) Wynosić około 50%
c) Zostać wyznaczony na podstawie rozkładu normalnego
d) Odpowiadać medialnie rozkładu wyników surowych w tym teście
1Trafnosc kryterialna to :
Prognostyczna i diagnostyczna
2. Kiedy test jest coraz trudniejszy to znaczy ze wpływ na to ma:
Moc testu
3.Jeżeli wskaźnik wynosi 0,8
Rzetelność wysoka
4.Jaka trafność ma analize czynnikowa:
Teoretyczna
5.Test konweregencyjny
Wysoka korelacja z innymi testami
6.Wierne tłumaczenie tekstu to :
Translacja
7.Stronniczosc testu
Wpływa na pozycje testowe i na blad systematyczny
8.Co musi być w diagnozie indywidualnej a nie musi w diagnozie badawczej
Standaryzacja? normalizacja?
9.Punktowo dwuseryjny ( Wskaźnik korelacji punktowo dwuseryjnej przyjmuje wartości od -1
do 1 i powinien mieć wartość dodatnią dla odpowiedzi poprawnej oraz wartości ujemne dla
odpowiedzi niepoprawnych (dystraktorów). Najogólniej ujmując wskaznik ten pokazuje
relację pomiędzy wynikiem całego testu a wyborem konkretnej odpowiedzi w danym
zadaniu) a jakie było pytanie i odpowiedzi nie wiadomo
10 Wynik 50 na skali staninowej w tescie co oznacza tego nie rozumiem i nie mam pewności
czy pyanie było takie ???
Dałam 9 ale nie wiem co ma byc
11.Gdzie są rangi
W centylach
12.Jezeli dwie osoby sprawdzaja test i wychodza te same wyniki to znaczy ze test jest :
Obiektywny
13.Bląd pomiaru zaznaczyć złą odpowiedz (Charakterystyka błędu pomiaru to jedno z
najważniejszych zadań teorii Gulliksena i wogóle teorii pomiaru. Z rownania Z=T+E wynika
że błąd pomiaru to różnica pomiędzy wynikiem otrzymanym a wynikiem prawdziwym czyli
E=X-T)
14. rAZ = rBZ od czego jest :
Testy rownoległe
15.Jak robisz test połówkowy to co robisz pozniej
Alfe Cronbacha ,
16.
im mniejszy procent tym większy przedział ufności
17. Gdzie jest walidacja:
W trafności
18.Normą jest zachowanie
Standardowe
19.Normy lokalne
Miejsce zamieszkania jakies miasto (nie duża próba)
20. Ludzie dostali pytanie gdzie było 5 odpowiedzi, jedna prawidłowa, 80% zrobiła dobrze
(losowo wybierali odpowiedz) jaka jest trudność
Dałam najniższy wynik
21.Moc dyskryminacyjny (
Moc dyskryminacyjnapozycji w teście jest miarą, dzięki której
możemy określić jak dana zmienna, zadanie, pytanie wpływa na ogólny wynik mierzonej przez
narzędzie cechy czy umiejętności. Miara ta pozwala odpowiedzieć, czy i na ile wyższa wartość
dla danej pozycji jest związana z wyższym poziomem ogólnego wskaźnika danej skali (w skład
której wchodzi dana pozycja).
Roznicuje badanych -??
PYTANIA YOLO
5. Rzetelność testu
Wskaźnik korelacji miedzy wynikiem dwoch badan tym samym testem tym samych ludzi.
6. X=T+E??
Zmniejszyć E
7. Które w standaryzacji stwierdzenie jest mniej istotne?
Dwie odp. Prawa autorskie, Wpadnie w rece niepsychologow
8. Standaryzacja
Jednolitość
9. Niski współczynnik korelacji miedzy testami A I B ( rownolegle)
( badanie po odstępie czasu)
Wysoka specyficzność pozycji testowych
10. Normy lokalne
Ścisle określone grupy ludzi -małe niereprezentatywna grupa ludzi
11. Normy
Zachowania typowe
12.Budowanie przedziału dla wyniku otrzymanego (wynik osoby - Z*SEM ; Z*SEM + wynik
osoby). jakie odp nie wiadomo
Rzetelność ? czemu? ktoś wyjaśni?
a nie powinien tu byc przedzial ufnosci dla bledu standardowego?
13.Porównanie dwoch ludzi, aby wybrac lepszego to:
Standardowy bład roznicy (minimalny)
14. Odniesienie pozycji testu do uniwersum?
Trafność tresciowa
15. Gdzie najwieksza jest trafność?
Odp. Test z historii??? co to jest
16. Analiza korelacji macierzy to:
Zbieżna i rozbieżna
17. Test – retest (wada)
Zapamiętywanie
18. Błąd we wzorze X=T+E
Losowy
19. Co nie jest w definicji testu ?
Odp. Wystandaryzowana skala ze średnią 100
.Definicja testu psychologicznego: jest to narzędzie obiektywne, wystandaryzowane, trafne,
rzetelne i znormalizowane, wyposażone w reguły obliczania wartości mierzonej cechy
psychologicznej oraz jasno określającej zakres i rodzaj dopuszczalnych zachowań ze strony
diagnosty. (podręcznik Hornowska)
23. trafność fasadowa powinna być brana pod uwagę w przypadku testu, gdyż:
a) stanowi podstawę statystycznego doboru pozycji
b) jest częścią składową każdego rodzaju trafności
c) jest dowodem, że test mierzy to, co zmierzył jego autor
d) zapewnia zgodność wyglądu testu czym.... sądzi osoba badana
Trafność fasadowa opisuje, jak spostrzegają test osoby badane i czy - z ich punktu widzenia
- wydaje się on trafnie mierzyć to, co ma mierzyć.
1. jeżeli test jest zbyt trudny dla badanej grupy osób to rozkład wyników w tym teście będzie:
a) normalny
b) prostokątny
c) skośny
d) wielomodalny
1. jedyny, z kryteriów normalnych, branych pod uwagę przy tworzeniu testu jest
współczynnik trudności poszczególnych pozycji testowych. Jeżeli tworzymy test dla celów
selekcji i mamy dużo kandydatów, a możemy przyjąć najwyżej 10% to większość pozycji
testowych z tego testu powinna być:
a) raczej trudnych
b) raczej łatwych
c) raczej o przeciętenj trudności ?? sama nie wiem...
d) raczej o wysokim współczynniku rzetelności niż trafności
wiedząc, że w klasycznej teorii testów przyjmuje się wynik obserwowany = wynik prawdziwy
+ błąd pomiaru, określ co powinno być podstawowym obowiązekim autora testu:
a) dążenie do zwiększenia wyniku prawdziwego danej osoby,
b) dążenie do zmniejszenia błędu pomiaru
c) dążenia do zwiększenia wyniku obserwowanego
d) J
2. . obiektywność jest jedyny z tzw. kryteriów dobroci testów psychologicznych. Aby
spełnić warunek obiektywności każdy test musi przynajmniej
a) zostać oparty na teorii mierzonej zmiennej
b) dawać porównywalne wyniki niezależnie od tego gdzie i kiedy jest stosowany
c) być obliczany w ściśle określonych warunkach
d) posiadać wysokie wskaźniki rzetelności i trafności
1. jednym z kryteriów formalnych branym przy tworzeniu testu jest współczynnik trudności
poszczególnych pozycji testowych. Jeżeli chcemy zastosować test do selekcji kandydatów
uwzględniając określony punkt odcięcia to powinniśmy wybrać taki test, który składa się z
pozycji testowych, których współczynniki trudności wynosi:
a) 0,6
b) mieści się w zakresie 0-100%
c) jego średnia wartość wynosi 50%
d) jest równy wyznaczonemu punktowi selekcji
1. s0
a) wynik pozycji testowej powinien być z natury swej dychotomiczny
b) rozkład wyników pozycji testowej powinien być rozkładem dwumodalnym
c) wynik pozycji testowej powinien być zmienną ciągłą
d) rozkład wyników pozycji testowej powinien być rozkładem normalnym
1. często zdarza się, że autorzy przeprowadzający badania danego testu uzyskują różne
współczynniki trafności kryterialnej. Jest to najczęściej spowodowane:
a) niskimi współczynnikami pozostałych rodzajów trafności
b) niskimi współcz ynnikami rzetelności testu
c) trudnościami w diagnozowaniu zachowania mierzonego przez test
d) faktem wybrania różnych zmiennych kryterialnych
1. istnieje wiele rodzajów trafności. W zależności od celu testowania niektórych z nich mają
większe znaczenie. Dla którego z poniższych rodzajów testów określenie trafności będzie
najbardziej pożądane?
a) testów projekcyjnych
b) testów inteligencji
c) testów zdolności werbalnych
d) testów wiadomości z matematyki
1. aby znormalizowane wyniki testowe były użyteczne, tzn. można je był zinterpretować
należy je odnieść do:
a) rzetelności i trafności metody
b) treści pozycji tworzących test psychologiczny
c) zachowania wybranej, dobrze określonej grupy
d) innych metod testowych
1. steny to:
a) wynik surowy
b) wynik wskazujący na wiek umysłowy
c) inna nazwa centyli
d) znormalizowany wynik standardowy
Prawa badającego:
- ściśle określony zakres dopuszczalnych zachowań
Dobra rzetelność:
- gdy współczynnik rzetelności wynosi conajmniej 0,8.
Czym się kierować ustalając długość przerwy czasowej między testem a retestem?
- żeby zminimalizować skutki zapamiętywania swoich odpowiedzi i zminimalizować efekty
uczenia się nowych rzeczy (optymalny czas - od 2 tyg. do 6 miesięcy)
Rodzaje trafności
Poza tym trzeba znać dokładnie tą tabelkę o skalach T, stenach, Staninach, itp. - może być
pytanie np. ile % wariancji wyjaśniają wyniki znajdujące się pomiędzy 40 a 60 na skali T,
albo pomiędzy 3 a 7 na skali staninowej (68,26%).
Jaki sposób szacowania trafności teoretycznej dotyczy liczby wymiarow opisujących dane
zjawisko psychologiczne?
- analiza struktury czynnikowej testu
Wyobraz sobie, ze w tescie wiadomości który wlasnie rozwiązujesz znajduja się jedynie
pytania dotyczące trafności. Taki test ma NIEwystarczajaca trafność:
- tresciową
Które z poniższych pojec odnosi się dop korelacji pomiedzy dana pozycja testowa a
ogolnym wynikiem testu?
- moc dyskryminacyjna
Błąd systematyczny:
- nie ma nic wspolnego z mierzona cecha psych. I wynika ze stalych cech narzędzia.
Pozycje testowe w narzędziu o wysokiej rzetelności szacowanej na podstawie zgodności
wewnętrznej sa:
- skorelowane ze soba
Im wieksza rzetelności testu tym szerokość przedzialu ufności obliczonego dla dowodlnego
wyniku otrzymanego:
- jest mniejsza
W której z poniższych sytuacji info o trafności prognostycznej testu jest szczególnie istotna?
- przewidywanie powodzenia kandydatow w przyszłej pracy.
Jaki sposób szacowania trafności teoretycznej dotyczy liczby wymiarow opisujących dane
zjawisko psychologiczne?
- analiza struktury czynnikowej testu
Wyobraz sobie, ze w tescie wiadomości który wlasnie rozwiązujesz znajduja się jedynie
pytania dotyczące trafności. Taki test ma NIEwystarczajaca trafność:
-tresciową
Jeżeli wyniki uzyskane na podst. Jednego testu pozostaja w silnym związku z wynikami
uzyskanymi w innym tescie przeznaczonym do pomiaru podobnej cechy, wówczas można
przypuszczac ze test ma wysoka:
- trafność zbiezna
Wykonales pewien test inteligencji, a Twój wynik wyniosl 43 punkty. Liczba ta nie ma
zadnego znaczenia bez znajomości:
- standardu statystycznego, czyli normy.
Normy empiryczne:
- ukazuja pozycje jednostki w probie normalizacyjnek i pozwalaja na ocene jej
wynikow z innymi osobami
Które z poniższych pojec odnosi się dop korelacji pomiedzy dana pozycja testowa a
ogolnym wynikiem testu?
- moc dyskryminacyjna
Czy w Polsce osoba nie bedaca psychologiem może stosowac testy psych.?
- nie
Błąd losowy:
- wpływa na rzetelność narzędzia
Jedno z założeń klasycznej teorii testow mowi o nieskorelowaniu Bledu pomiaru i wyniku
prawdziwego. Oznacza to ze:
- mierzac rozne wartości danej cechy nie można określić wielkości Bledu
Im wieksza rzetelności testu tym szerokość przedzialu ufności obliczonego dla dowodlnego
wyniku otrzymanego:
- jest mniejsza
Bład systematyczny:
- ma stala wartość dla roznych osob badanych
9) Wskaźnik „alfa Cronbacha” nadaje się do badania testów, w których odpowiedzi dokonuje
się:
a) tylko na skali dychotomicznej Tak - Nie
b) tylko na skali porządkowej z najmniej pięcioma kategoriami
c) zarówno na skali dychotomicznej, jak i porządkowej z co najmniej pięcioma kategoriami
d) zarówno na skali dychotomicznej, jak i porządkowej z dowolną liczbą kategorii
10) Metodą adaptacji testu, którą cechuje największa możliwa wierność oryginałowi, jest
a) transkrypcja
b) translacja
c) trawestacja
d) rekonstrukcja
Podejście nomotetyczne
• Do porównywania wpływu kultury potrzebne są pojęcia ogólne, będące aproksymacją pojęć
specyficznych, lecz oparte na wspólnym układzie odniesienia
• Uzasadnione są takie działania, jak:
- adaptacja narzędzi diagnostycznych, przenoszonych z innej kultury wraz z zapleczem teoretycznym i
literaturowym,
- przyswajanie teorii psychologicznych (o których się apriorycznie zakłada, iż są na tyle ogólne, że trafne są w
każdych warunkach społeczno-kulturowych),
- stosowanie „podkulturowych” technik terapeutycznych, itd.
Podejście idiograficzne
• Analizy wpływów kultury należy dokonywać bazując na pojęciach wypracowanych przez daną społeczność,
gdyż kultura jest integralną częścią ludzkich zachowań
• Uznaje się istnienie specyficznych kulturowo czynników etiologicznych, czynników (kultur)
immunizujących członków danej społeczności przeciwko zaburzeniom psychicznym lub im
sprzyjających
• Wiąże się to także z przekonaniem o kulturowo specyficznych rodzajach osobowości, uzdolnień,
rodzajach zaburzeń i/lub specyficznych ich manifestacji, ich terapii;
• Wiąże się z niezgodą na implantację obcych (kulturowo) narzędzi diagnostycznych, teorii, systemów
klasyfikacji zaburzeń itp.
3. Student uczył się tylko 3 wykładu z psychometrii a tego nie było na egzaminie. Odczuwa
teraz: trafność treściowa...stronniczość pytań. raczej nie stronniczość pytań
4. Do korelacji czego używamy: w Kendalla.. też pearsona i spearmana ale nie wiem gdzie
przykleić to pytanie
14. Aprobatę społeczną można traktować jako styl LUB cechę osobowościową
w klasycznej teorii testów badacz powinien zakładać, że błąd pomiaru ma średnią zero i
rozkład normalny i zależy jedynie od błędu losowego s.44
19. Były podane dwie rzetelność jedna 0,5 druga 0,8 ile razy więcej trzeba dać pytań aby
wzrosła rzetelność : dwukrotnie, pięciokrotnie
s.61
1. Który test ma coraz trudniejsze zadania ? mocy: nieograniczony czas i zadania coraz
trudniejsze. W teście mocy czas jest ograniczony a zadania średnie, zadań jest dużo i nikt
nie kończy rozwiązywać go przed upływem czasu.
4. Jeśli zbadali metoda połowkową a chca dowiedziec się więcej to czym badać: odp. alfa
Cronbacha i richardsona
6.Jeśli korelacja między wynikiem prawdziwym a testowym dla danego testu określono jako
rttt=0,81 - współczynnik rzetelności tego testu wynosi 0,81
7. przedział ufności : musi być szerszy im chcemy mieć większą pewność
Prezentacja: W praktyce - średnia trudność testu powinna oscylować wokół 50%. Jeśli test ma służyć do celów selekcyjnych
- trudność powinna być dostosowana do pożądanego współczynnika selekcji
3. jedyny, z kryteriów normalnych, branych pod uwagę przy tworzeniu testu jest współczynnik trudności poszczególnych pozycji
testowych. Jeżeli tworzymy test dla celów selekcji i mamy dużo kandydatów, a możemy przyjąć najwyżej 10% to większość
pozycji testowych z tego testu powinna być:
a) raczej trudnych
b) raczej łatwych
c) raczej o przeciętnej trudności
d) raczej o wysokim współczynniku rzetelności niż trafności
4. Tworzymy test, na potrzebę organizacji, by zbadać jakie osoby są najlepsze. Tylko wewnątrz organizacji.
Jakiego typu normy będą
- norma organizacyjna
- norma lokalna
-norma globalna
- norma instytucjonalna
każdy z nich jest prawidłowy chociaż w testach psychologicznych wynik oscyluje w granicach 0,8
6. Ktoś otrzymał w teście wynik 12. Przedział ufności 90 miał wynik 6, przedział inny miał wynik 8; a przedział 95
miał wynik 4 (czy cos takiego) i w jakim przedziale mieści się osoba, gdy p=0,05
a) (6; 8)
b)
(8,16)
c) 10, 14
d) 12; 12
8. Chcemy zbadać dzieci wybitnie inteligentne, by przydzielić je do różnych zajęć dodatkowych, Jakie powinny
być pytania?
a) Bardzo trudnych zadań
b) bardzo łatwe
c) Trochę łatwych trochę trudnych
d) Trudność pytań nie ma znaczenia
błąd pomiaru nie ma nic wspólnego z mierzoną cechą psychologiczną ale wpływa na wynik testowania
(prezentacja)
18. Miara czego jest (czy o czym mówi) dewiacyjny iloraz inteligencji:
a) odchylenia standardowego
b) wyniku surowego.
c) niedorozwój umysłowy
18. Jeśli chcemy zmierzyć wyniki skrajne (największy rozstrzał wyników to używamy )
a) T
b) staniny
c) steny
d) Tetrony
wynik w teście zawsze jest obarczony pewnym błędem. W różnych sytuacjach testowania w taki sam sposób wpływa na
wyniki testowania. Czyli wpływa na rzetelność ale nie jest istotne bo nie nie ma nic wspólnego z mierzoną cechą
psychologiczną.
Parafraza - Konieczność opracowania nowego narzędzia od fazy analizy teorii i generowania pozycji, aż po
analizę psychometryczną danych - test oryginalny jest jedynie inspiracją adaptacji. Celem adaptacji jest
maksymalne wierne oddanie intencji autora odnośnie treści konstruktu psychologicznego (rola teorii
psychologicznej). Zakłada się, że konstrukty psychologiczne są uniwersalne kulturowo, ale z reguły nie są
uniwersalne zachowania (tylko część z nich ma charakter etikalny, tj. równoważny kulturowo i tylko te mogą
wejść do finalnej wersji adaptacji).
Testy właściwości afektywnych: bada czucia, postawy, osobowość, emocje, wierzenia itd.
Brak odpowiedzi obiektywnie prawidłowej
kiedy znajomość wyników jakie osoba badana uzyskała w teście może wpływać na ocenę wyniku tej osoby względem
analizowanej zmiennej kryterialnej s. 91 Hornowska
31) Standaryzacja
a)
posiada podrecznik
b) jednolitość przeprowadzania procedury badania NIE BYŁO TAKIEJ ODP (
było coś o jednolitym
stosowaniu testu wobec wszystkich badanych ale to zle) - dlaczego?
dlaczego jednolite stosowanie wobec kazdej osoby badanej to zlaodp??
bo Standaryzacja procedury badania
testem :Stosując test należy dokładnie
przestrzegać wszystkich zasad
i procedur opisanych w podręczniku
a do czego by było to jednolite stosowanie?
32) Standaryzacja
a
) polegającą na tworzeniu standardowych warunków stosowania testu
33) Standaryzacja
b) jednoliotość
Gdy zalezy nam na motywacji osoby badanej do rozwiązywania testow, to wazna jest?
Trafność fasadowa
40% cen
tyle?
"40% osob ma gorsze wyniki od tej osoby, ktora otrzymała wynik rowny 40 centylowi"
1. Moc dyskryminacyjna?
Korelacja miedzy wynikiem pozycji testowej a wynikiem całego testu.
1. X=T+E
Zmniejszyć E
1. Standaryzacja
Jednolitość
1. Normy lokalne
Ścisle określone grupy ludzi
1. Normy
Zachowania typowe
Dobra rzetelność:
- gdy współczynnik rzetelności wynosi co najmniej 0,8.
Czym się kierować ustalając długość przerwy czasowej między testem a retestem?
- żeby zminimalizować skutki zapamiętywania swoich odpowiedzi i zminimalizować
efekty uczenia się nowych rzeczy (optymalny czas - od 2 tyg. do 6 miesięcy)
Rodzaje trafności
- treściowa - wewnetrzna , logiczna
- kryterialna
- ocena czy osoba posiada lub bedzie włsciwośc psych.
- teoretyczna -pomiar nasilenia hipotetycznej właściwości
Poza tym trzeba znać dokładnie tą tabelkę o skalach T, stenach, Staninach, itp. -
może być pytanie np. ile % wariancji wyjaśniają wyniki znajdujące się pomiędzy 40 a
60 na skali T, albo pomiędzy 3 a 7 na skali staninowej (68,26%).
2. Która z metod nie jest metodą badania rzetelności (wybrać jedną z czterech
podanych).
Rzetelność BADA: metoda połówkowa, test-retest, testy równoległe, analiza
zgodności wewnętrznej czyli alpha Cronbacha
13. Budowanie przedziału ufności - wynik 12, podane wartości odchylenia dla trzech
alfa, z czego trzeba była wybrać jedną dla 90% przedziału i wskazać ten przedział
17. Co to jest standaryzacja? Jednolitosc regul i warunkow badania, tzn aby wyniki
danego testu mozna bylo ze soba porownywac, dany test zawsze powinien byc
przeprowadzony w identycznych warunkach, bo tylko wtedy roznice w wynikach osob
badanych mozna przypisac czynnikom indywidualnym a nie zewnetrznym warunkom
badania
2. Która z metod nie jest metodą badania rzetelności (wybrać jedną z czterech podanych)
Etapy analizy zadań: ustalenie czy pozycja testowa jest poprawna rzeczowo (czy da się ją
wyprowadzić z teorii), sprawdzenie czy pozycja testowa jest poprawnie zredagowana,
obliczenie statystycznych wskaźników dla poszczególnych pozycji testowych
8. skala staninowa:
a. 2z + 5
9. 55 centyl to
a. wynik niższy bądź równy 55%
b. wyniż niższy 55%
c. wyższy bądź równy 45%
d. wyższy 45%
11. O rekonstrukcji też coś było - wskazać zdanie prawdziwe dot. rekonstrukcji
a. trzeba stworzyć nowe narzędzie a oryginał ma być tylko inspiracją
b.
c.
d. maksymalnie wierne tłumaczenie- transkrypcja
e. wierne tłumaczenie z małymi poprawkami-translacja
f. swobodne łumaczenie-trawestacja
13. budowanie przedziału ufnośći - wynik 12, podane wartości odchylenia dla trzech alfa, z
czego trzeba była wybrać jedną dla 90% przedziału i wskazać ten przedział
czy ktos ogarnia jak sie liczy takie rzeczy? ;)
tak to jest 3 wykład na prezentacji, ale jeśli nie ma podanej rzetelnosci, to tego sie nie da
zrobic;/ a do tego bez kalkulatora to powodzenia;) a “nie korzystać z żadnych funkcji telefonu
komórkowego” pewnie obowiązuje, wiec polecam zaopatrzyc sie w kalkulatory:)
16. dobór trudności pytań przy badaniu dzieci upośledzonych nie było pytania o dzieci
upośledzone tylko jaki stopien trudnosci powinno sie dobrac w momencie gdy dzieci maja
kiepskie wyniki i na podstawie testu trzeba je przydzielić do zajęć dodatkowych (a nie szkoły
specjalnej?)
a. większość łatwych pytań
b. większość trudnych
c. trochę trudne ,trochę łatwe ??
d. rodzaj zadań nie ma znaczenia
23. pytanie o zasadę równoważności przy adaptacji Która zasada równoważności nie jest brana
pod uwagę przy adaptacji
25. pytanie o błąd systematyczny (ale nie pamiętam do czego się odnosił - rzetelności? tak)
a. jest istotny
b. nie jest brany pod uwagę (chyba to)
c. to zależy od mierzonej cechy
d. ?
- Błąd systematyczny to błąd, który nie ma nic wspólnego z mierzoną cechą psychologiczną i jest
spowodowany stałymi cechami badanej osoby lub narzędzia pomiarowego.
1. trafność fasadowa powinna być brana pod uwagę w przypadku testu, gdyż:
a) stanowi podstawę statystycznego doboru pozycji
b) jest częścią składową każdego rodzaju trafności
c) jest dowodem, że test mierzy to, co zmierzył jego autor
d) zapewnia zgodność wyglądu testu czym.... sądzi osoba badana
1. wyniki standardowe to
a) wyniki uzyskane w standardowych warunkach
b) wyniki wyrażone w terminach odchylenia standardowego
c) wyniki wyrażone w terminach obiektywnego standardu
d) wyniki uzyskane za pomocą wystandardyzowanego narzędzia
1. otrzymanie różnych współczynników trafności kryterialnej dla danego testu jest najczęściej
spowodowany:
a) faktem wybrania różnych zmiennych kryterialnych
b) błędami w obliczeniach
c) niską rzetelnością testu
d) trudnościami w diagnozowaniu zachowania mierzonego przez test
1. test składa się z 10 pytań. Powinien dobrze różnicować w obrębie patologii. Która z poniższych
skal standardowych najlepiej pozwalałaby zrealizować ten cel:
a) M=10, SD=5
b) M=10 SD=1
c) M=50 SD=10
d) M=50 SD=25
1. Stanina to
a) wynik surowy
b) wynik wskazujący na wiek umysłowy
c) inna nazwa centyli
d) znormalizowany wynik standardowy
1. centyle to wyniki, które wskazują jaki procent osób z badanej grupy uzyska wyniki:
a) takie same lub wyższe od danego wyniki
b) takie same lub niższe od danego wyniku
c) wyższe od średniej
d) niższe od średniej
1. jeżeli test jest zbyt trudny dla badanej grupy osób to rozkład wyników w tym teście będzie:
a) normalny
b) prostokątny
c) skośny
d) wielo modalny
1. jeżeli rozkład wyników surowych jest rozkładem lewo skośnym, to w celu jego normalizacji
należy zastosować następującą transformację:
a) pierwiastkową,
b) logarytmiczną
c) potęgową
d) żadną z nich
1. rzetelność testu to również jedno z kryteriów dobroci testów psychologicznych. Rzetelność testu
oznacza przede wszystkim następującą właściwość wyników teoretycznych
a) powtarzalność
b) obiektywność
c) istotność
d) trafność
1. jedyny, z kryteriów normalnych, branych pod uwagę przy tworzeniu testu jest współczynnik
trudności poszczególnych pozycji testowych. Jeżeli tworzymy test dla celów selekcji i mamy
dużo kandydatów, a możemy przyjąć najwyżej 10% to większość pozycji testowych z tego testu
powinna być:
a) raczej trudnych
b) raczej łatwych
c) raczej o przeciętnej trudności
d) raczej o wysokim współczynniku rzetelności niż trafności
1. wiedząc, że w klasycznej teorii testów przyjmuje się wynik obserwowany = wynik prawdziwy +
błąd pomiaru, określ co powinno być podstawowym obowiązkiem autora testu:
a) dążenie do zwiększenia wyniku prawdziwego danej osoby,
b) dążenie do zmniejszenia błędu pomiaru
c) dążenia do zwiększenia wyniku obserwowanego
d) J
1. obiektywność jest jedyny z tzw. kryteriów dobroci testów psychologicznych. Aby spełnić
warunek obiektywności każdy test musi przynajmniej
a) zostać oparty na teorii mierzonej zmiennej
b) dawać porównywalne wyniki niezależnie od tego gdzie i kiedy jest stosowany
c) być obliczany w ściśle określonych warunkach
d) posiadać wysokie wskaźniki rzetelności i trafności
1. jednym z kryteriów formalnych branym przy tworzeniu testu jest współczynnik trudności
poszczególnych pozycji testowych. Jeżeli chcemy zastosować test do selekcji kandydatów
uwzględniając określony punkt odcięcia to powinniśmy wybrać taki test, który składa się z
pozycji testowych, których współczynniki trudności wynosi:
a) 0,6
b) mieści się w zakresie 0-100%
c) jego średnia wartość wynosi 50%
d) jest równy wyznaczonemu punktowi selekcji
1. znajomość współczynnika mocy dyskryminacyjnej poszczególnych pozycji testowych pozwala
nam na
a) wyeliminowanie pozycji należących do innego testu
b) wyeliminowanie pozycji mierzących inna zmienną niż zmienna testowa,
c) wyeliminowanie pozycji które nie różnicują badanej populacji
d) wyeliminowanie pozycji zbyt mocno różnicujące badane osoby
1. rzetelność jako miara dokładności pomiaru testowego testu jest technicznie wyrażana w postaci:
a) współczynnika zmienność
b) współczynnika korelacji
c) współczynnika zgodności
d) współczynnika regresji
1. dokonując diagnozy na podstawie wyniku testowego, należy wziąć pod uwagę standardowy błąd
pomiaru ponieważ,
a) tylko w ten sposób można określić istotność otrzymanych wyników
b) pozwala on na dokładne określenie poziomu istotności wyniku prawdziwego,
c) dzięki niemu można określić wielkość błędu jakim jest obciążony wynik testu
d) pozwala on określić wielkość błędu jaki popełniany jest przy interpretowaniu wyniku
poszczególnych pozycji testowych
1. trafność testu to również jedno z kryteriów dobroci testów psychologicznych. Klasyczny podział
obejmuje następujące rodzaje trafności:
a) trafność treściową kryterialną i teoretyczną
b) trafność treściową fasadową i kryterialną
c) trafność treściową logiczną i wewnętrzną
d) trafność treściową diagnostyczną i prognostyczną
1. często zdarza się, że autorzy przeprowadzający badania danego testu uzyskują różne
współczynniki trafności kryterialnej. Jest to najczęściej spowodowane:
a) niskimi współczynnikami pozostałych rodzajów trafności
b) niskimi współczynnikami rzetelności testu
c) trudnościami w diagnozowaniu zachowania mierzonego przez test
d) faktem wybrania różnych zmiennych kryterialnych
1. w której z przedstawionych niżej sytuacji może dojść do zjawiska kontaminacji kryteriów:
a) psychiatra dokonując oszacowania wyników badanych osób ze względu na
zmienną kryterialną miał dostęp do wyników testowych
b) psychiatra dokonując oszacowania wyników badanych osób ze względu na zmienną
kryterialną znał podręcznik testowy
c) autor testu znał procedurę szacowania badanych osób ze względu na zmienną
kryterialną
d) autor testu połączy ł wyniki otrzymane dla dwóch różnych zmiennych kryterialnych
1. trafność teoretyczna uważana jest za najważniejszy rodzaj trafności. Znajduje ona swoje
odzwierciedlenie w :
a) hipotezach dotyczących zachowania badanych osób tworzonych na podstawie istotnych
dla psychologa teorii psychologicznych
b) hipotezach dotyczących zachowania badanych osób tworzonych na podstawie
teorii mierzonej zmiennej
c) rezultatach badań nad rzetelnością teorii psychologicznej, która leży u podstaw testu
d) rezultatach badań nad trafnością teorii psychologicznej, która leży u podstaw testu
1. istnieje wiele rodzajów trafności. W zależności od celu testowania niektórych z nich mają
większe znaczenie. Dla którego z poniższych rodzajów testów określenie trafności treściowej
będzie najbardziej pożądane:
a) testów projekcyjnych
b) testów inteligencji
c) testów zdolności werbalnych
d) testów wiadomości z matematyki
1. wyniki standardowe za pomocą których można przedstawić wyniki uzyskane w teście otrzymane
przez osoby badane to:
a) wyniki uzyskane w standardowych warunkach
b) wyniki wyrażone w terminach odchylenia standardowego
c) wyniki wyrażone w terminach obiektywnych standardów
d) wyniki uzyskane za pomocą wystandaryzowanego narzędzia
1. aby znormalizowane wyniki testowe były użyteczne, tzn. można je był zinterpretować należy je
odnieść do:
a) rzetelności i trafności metody
b) treści pozycji tworzących test psychologiczny
c) zachowania wybranej, dobrze określonej grupy
d) innych metod testowych
1. steny to:
a) wynik surowy
b) wynik wskazujący na wiek umysłowy
c) inna nazwa centyli
d) znormalizowany wynik standardowy
22. Jeżeli test jest zbyt trudny dla badanej grupy osób, to rozkład wyników w tym teście będzie:
a) normalny
b) skośny
a) prostokątny
b) wielomodalny
24. Jeżeli rozkład wyników surowych jest rozkładem lewoskośnym, to w celu jego normalizacji należy
zastosować następującą transformację:
a) pierwiastkową
b) logarytmiczną
c) potęgową
d) żadną z nich
25.Trafność teoretyczna testu znajduje swoje odzwierciedlenie w:
a) hipotezach wyprowadzanych z teorii mierzonej zmiennej
b) rezultatach analizy czynnikowej wyników testowych
c) obu wymienionych możliwości
d) żadnej z wymienionych możliwości
24. Jeżeli rozkład wyników surowych jest rozkładem lewoskośnym, to w celu jego normalizacji należy
zastosować następującą transformację:
a) pierwiastkową
b) logarytmiczną
c) potęgową
d)żadną z nich
2. Tworzymy test, na potrzebę organizacji, by zbadać jakie osoby sa najlepsze. Tylko wewnątrz
organizacji. Jakiego typu normy będą
- norma organizacyjna
- norma lokalna
-norma globalna
-norma instytucjonalna
4. Ktoś otrzymał w teście wynik 12. Przedzial ufności 90 miał wynik 6, przedział inny miał wynik 8;
a przedzial 95 miał wynik 4 (czy cos takiego) i w jakim przedziale mieści sie osoba, gdy p=0,05
a) (6; 8)
b) (8,16)
c) 10, 14
d) (12; 12)
6. Pytanie o etikalne
a) uniwersalne kulturowo
12. Miara czego jest (czy o czym mówi) dewiacyjny iloraz inteligencji:
a) odchylenia standardowego
13. Jeśli chcemy zmierzyć wyniki skrajne (największy rozstrzal wyników to używamy )
a) T (M=50 SD= 10)
b) staniny (M=5 SD=2)
c) steny (M=5.5 SD= 2)
d) Tetrony (M= 10 SD=4)
20) Standaryzacja (ale czego? bo jeśli wyniki standardowe to dobrą odpowiedzią będzie b - zobacz pytanie Izy Fischer na
forum i odpowiedź, co prof. mówiła na wykładzie)
a) polegającą na tworzeniu standardowych warunków stosowania testu
b) wyniki wyrażone w terminach odchylenia standardowego
c) wyniki wyrażone w terminach obiektywnych standardów
d) wyniki uzyskane za pomocą wystandaryzowanego narzęd
21) Standaryzacja
b) jednoliotość warunków
27. rzetelność testu to również jedno z kryteriów dobroci testów psychologicznych. Rzetelność
testu oznacza przede wszystkim następującą właściwość wyników teoretycznych
a) powtarzalność
b) obiektywność
c) istotność
d) trafność
28. w której z przedstawionych niżej sytuacji może dojść do zjawiska kontaminacji kryteriów:
a) psychiatra dokonując oszacowania wyników badanych osób ze względu na zmienną
kryterialną miał dostęp do wyników testowych
b) psychiatra dokonując oszacowania wyników badanych osób ze względu na zmienną kryterialną
znał podręcznik testowy
c) autor testu znał procedurę szacowania badanych osób ze względu na zmienną kryterialną
d) autor testu połączy ł wyniki otrzymane dla dwóch różnych zmiennych kryterialnych
29. trafność teoretyczna uważana jest za najważniejszy rodzaj trafności. Znajduje ona swoje
odzwierciedlenie w
a) hipotezach dotyczących zachowania badanych osób tworzonych na podstawie istotnych dla
psychologa teorii psychologicznych
ykonania maksymalnego
d) wykonania oczekiwanego
.
1. Która z poniższych definicji jest pełną i wyczerpującą definicją testu psychologicznego?
a) jest to obiektywny i standaryzowany pomiar próbki zachowania
b) jest to kontrolowana ilościowa obserwacja zachowania
c) jest to pomiar próbki zachowania wybranej grupy ludzi
d) jest to standaryzowany zbiór bodźców dla mierzalnych reakcji
1. trafność fasadowa powinna być brana pod uwagę w przypadku testu, gdyż:
a) stanowi podstawę statystycznego doboru pozycji
b) jest częścią składową każdego rodzaju trafności
c) jest dowodem, że test mierzy to, co zmierzył jego autor
d) zapewnia zgodność wyglądu testu czym.... sądzi osoba badana
1. wyniki standardowe to
a) wyniki uzyskane w standardowych warunkach
b) wyniki wyrażone w terminach odchylenia standardowego
c) wyniki wyrażone w terminach obiektywnego standardu
d) wyniki uzyskane za pomocą wystandaryzowanego narzędzia
1. test składa się z 10 pytań. Powinien dobrze różnicować w obrębie patologii. Która z
poniższych skal standardowych najlepiej pozwalałaby zrealizować ten cel:
a) M=10, SD=5
b) M=10 SD=1
c) M=50 SD=10 , jak poniżej (Hornowska, str. 138 “Testy Psychologiczne”)
d) M=50 SD=25
skalę T stosuje się głównie w testach przeznaczonych do diagnozowania patologii
Bo jest to skala bardzo długa i sięga od -5 do +5 odchyleń standardowych . T = 10z + 50
1. Stanina to
a) wynik surowy
b) wynik wskazujący na wiek umysłowy
c) inna nazwa centyli
d) znormalizowany wynik standardowy
1. centyle to wyniki, które wskazują jaki procent osób z badanej grupy uzyska wyniki:
a) takie same lub wyższe od danego wyniki
b) takie same lub niższe od danego wyniku
c) wyższe od średniej
d) niższe od średniej
Kontaminacja kryterium:
wyniki testowe nie mogą wpływać
na pozycję jednostki w zakresie
branego pod uwagę kryterium
1.
2. rzetelność testu można wyrazić jako:
a) stosunek wariancji [prawdziwej do wariancji błędu
b) stosunek wariancji otrzymanej do wariancji prawdziwej
c) stosunek wariancji prawdziwej do wariancji otrzymanej
d) stosunek wariancji błędu do wariancji otrzymanej
1. jeżeli test jest zbyt trudny dla badanej grupy osób to rozkład wyników w tym teście
będzie:
a) normalny
b) prostokątny
c) skośny
d) wielomodalny
1. jedyny, z kryteriów normalnych, branych pod uwagę przy tworzeniu testu jest
współczynnik trudności poszczególnych pozycji testowych. Jeżeli tworzymy test dla
celów selekcji i mamy dużo kandydatów, a możemy przyjąć najwyżej 10% to większość
pozycji testowych z tego testu powinna być:
a) raczej trudnych
b) raczej łatwych
c) raczej o przeciętnej trudności
d) raczej o wysokim współczynniku rzetelności niż trafności
1. obiektywność jest jeden z tzw. kryteriów dobroci testów psychologicznych. Aby spełnić
warunek obiektywności każdy test musi przynajmniej
a) zostać oparty na teorii mierzonej zmiennej
b) dawać porównywalne wyniki niezależnie od tego gdzie i kiedy jest
stosowany
c) być obliczany w ściśle określonych warunkach
d) posiadać wysokie wskaźniki rzetelności i trafności
1. jednym z kryteriów formalnych branym przy tworzeniu testu jest współczynnik trudności
poszczególnych pozycji testowych. Jeżeli chcemy zastosować test do selekcji
kandydatów uwzględniając określony punkt odcięcia to powinniśmy wybrać taki test,
który składa się z pozycji testowych, których współczynniki trudności wynosi:
a) 0,6
b) mieści się w zakresie 0-100%
c) jego średnia wartość wynosi 50%
d) jest równy wyznaczonemu punktowi selekcji
1. rzetelność jako miara dokładności pomiaru testowego testu jest technicznie wyrażana w
postaci:
a) współczynnika zmienność
b) współczynnika korelacji
c) współczynnika zgodności
d) współczynnika regresji
1. często zdarza się, że autorzy przeprowadzający badania danego testu uzyskują różne
współczynniki trafności kryterialnej. Jest to najczęściej spowodowane:
a) niskimi współczynnikami pozostałych rodzajów trafności
b) niskimi współczynnikami rzetelności testu
c) trudnościami w diagnozowaniu zachowania mierzonego przez test
d) faktem wybrania różnych zmiennych kryterialnych
1. aby znormalizowane wyniki testowe były użyteczne, tzn. można je był zinterpretować
należy je odnieść do:
a) rzetelności i trafności metody
b) treści pozycji tworzących test psychologiczny
c) zachowania wybranej, dobrze określonej grupy
d) innych metod testowych
1. steny to:
a) wynik surowy
b) wynik wskazujący na wiek umysłowy
c) inna nazwa centyli
d) znormalizowany wynik standardowy
19. Stosując współczynnik korelacji dwuseryjnej jako współczynnik mocy dyskryminacyjnej, musi zostać
spełnione założenie, że zmienna zdychotomizowana jest:
a) rzeczywiście ciągła i posiada rozkład normalny
b) ciągła, lecz nie o rozkładzie normalnym
c) z natury swej dychotomiczna
d) dzieli się w punkcie mediany
22. Jeżeli test jest zbyt trudny dla badanej grupy osób, to rozkład wyników w tym teście
będzie:
a) normalny
b) skośny
e) prostokątny
f) wielomodaln
24. Jeżeli rozkład wyników surowych jest rozkładem lewoskośnym, to w celu jego normalizacji
należy zastosować następującą transformację:
a) pierwiastkową
b) logarytmiczną
g) potęgową
h) żadną z nich
1. Co to sa tetrony?
Jednostki skali standardowej
1. 40% centyle?
"40% osob ma gorsze lub takie same ? wyniki od tej osoby, ktora otrzymała wynik rowny 40
centylowi"
1. Moc dyskryminacyjna?
Korelacja miedzy wynikiem pozycji testowej a wynikiem całego testu.
1. Trafność kryterialna
Prognostyczna i diagnostyczna
1. Rzetelność testu
Wskaźnik korelacji miedzy wynikiem dwoch badan tym samym testem tym samych ludzi.
1. X=T+E
Zmniejszyć E
1. Standaryzacja
Jednolitość
1. Normy lokalne
Ścisle określone grupy ludzi
1. Normy
Zachowania typowe
Rzetelność ? SEM?
16.Porównanie dwoch ludzi, aby wybrac lepszego to:
Standardowy bład roznicy
Który test jest bardziej rzetelny: o współczynniku rzetelności -0,90, +0,90, -0,30, +0,30?
- +0,90
Jeżeli znamy rzetelność połowy testu, to do obliczenia rzetelności całego testu użyjemy:
- wzór Spearmana-Browna
Prawa badającego:
- ściśle określony zakres dopuszczalnych zachowań
Dobra rzetelność:
- gdy współczynnik rzetelności wynosi conajmniej 0,8.
Czym się kierować ustalając długość przerwy czasowej między testem a retestem?
- żeby zminimalizować skutki zapamiętywania swoich odpowiedzi i zminimalizować efekty
uczenia się nowych rzeczy (optymalny czas - od 2 tyg. do 6 miesięcy)
Standaryzacja:
-odtworzenie osobie badanej arunkow jakie byly w gr.normalizacyjnej + pozwala na porownanie
wynikow miedzy soba
rzetelnosc -= powtarzalnosc
najmniejsza rzetelnosc = 0
wspolczynnik korelacji = 0,6 , okresl jaki % wariancji wyjasnia wynik prawdziwy a ile %
blad pomiaru
60 prawdziwy, 40 blad
>>>>>szczegolowo:<<<<<<<<
1)stabilnosc - powtarzalnosc wynikow
( 2 razy badamy te sama gr osob tym samym testem - badanie stabilnosci bezwzglednej)
- z przerwa (od 2 do 6 miesiecy) -> zrodla bledu: wyniki testowe nie sa stabilne w czasie
- bez przerwy (badanie wiarygodnosci testu) - >zrodla bledu - czynniki losowe2)
2)powtarzalnosc tresci
> technika testow rownoleglych
- z przerwa (badanie stabilnosci wzglednej)
- bez przerwy (rownowaznosc miedzytestowa)
2. SEM
- błąd standardowy pomiaru - opisuje wielkosc bledu ktora zwiazana jest z danym narzedziem
pomiarowym
3.BŁAD STANDARDOWY RÓŻNICY (mowi o tym, czy roznicy miedzy dwoma wynikami
mozna przypisac znaczenie diagnostyczne)
BLAD STANDARDOWY ROZNICY -> stosuje sie gdy chcemy porownac ze soba 2 wyniki
w selekcji i rekrutacji
->gdy chcemy porownac 2 wskazniki w tym samym tescie
4.TRAFNOSC:
● dokonując diagnozy na podstawie wyniku testowego, należy wziąć pod uwagę
standardowy błąd pomiaru ponieważ,
a) tylko w ten sposób można określić istotność otrzymanych wyników
b) pozwala on na dokładne określenie poziomu istotności wyniku prawdziwego,
c) dzięki niemu można określić wielkość błędu jakim jest obciążony wynik
testu??? tez mi sie tak wydaje TEŻ TAK MYŚLE
d) pozwala on określić wielkość błędu jaki popełniany jest przy interpretowaniu
wyniku poszczególnych pozycji testowych
tersciowa (czy tresc testu mozemy traktowac jako reprezentacja dla uniwersum
tresci opisujacego dany konstrukt)
● kryterialna ( o jakich innych zmiennych bezposrednio niezwiazanych z testem mozna
wnioskowac na podstawie wynikow testu )
○ TRAFNOSC KDZIELI SIE NA (diagnostyczna i prognostyczna)
TRAFNOSC fasadowa -> opisuje to co o tescie sadzi osoba badana (ta trafnosc jest zawsze
wazna, dot. motywacji)
1.BADANIA TRAFNOSCI KRYTERIALNEJ SLUZA:
-rozszezreniu mozliwosci zastosowania testu
6.NORMA - typowosc
norma statystyczna - sredni poziom wykonania testu przez pewna grupe odniesienia
10.CENTYLE - mówią o tym ile osób ma wyniki rowne lub niższe od osoby badanej.
SKALA CENTYLOWA=skala porządkowa
14. Dla czego obliczamy moc dyskryminacyjna przed wlaczeniem zadan do ostatecznej
wersji testu?
- bo chcemy wlaczyc tylko takie pozycje ktore prowadzic beda do maksymalnego
zroznicowania wynikow testu
15.Jakich specyficznych informacji dostarcza analiza zadan?
-w jakim stopniu kazda pozycja testowa oddzielnie roznicuje badana populacje
J
ak moż
na uznac test za rzetelny?
- współczynnik korelacji pomiedzy dwoma wynikami uzyskanymi w badaniu tym samym testem
tej samej grupy osob
1.najwyzsza rzetelnosc odp.
gdy skala jest 5, 7 stopniowa;
2. Ładunek czynnikowy:
5. Jeśli wartość współczynnika rzetelności dla testu wyniosła 0,19 oznacza to, że:
A. Jest on rzetelny
B. Żadna z odpowiedzi nie jest prawidłowa
C. Nie wiadomo co to znaczy, jeśli nie znamy szczegółów na temat badania rzetelności -
a nie to?
D. Jest on nisko rzetelny
8. Które badanie może być podstawą do analizy trafności zbieżnej i różnicowej za pomocą
macierzy "wielu cech - wielu metod":
10. Jeśli test ma służyć tylko do badań naukowych, ale nie do diagnozy indywidualnej, to:
A. Trafność fasadową
B. Trafność teoretyczną
C. Trafność treściową tak
D. Trafność kryterialną
13. Jeśli test ma służyć do diagnozy indywidualnej (a nie tylko do badań naukowych) to:
a. Kryterium Cattella
b. Kryterium Kaisera
c. Kryterium KMO
d. Kryterium czynnikowe
a. Poziomu B2
b. Stylu odpowiadania badanych
c. Poziomu przeciętnego badanego
d. Poziomu badanych o najniższym poziomie językowym tak
17. Jeśli oczekujemy, że wymiary tworzonego przez nas testu będą tworzyć jedną, nadrzędną
cechę (są różnymi aspektami tej samej cechy), to którą z poniższych rodzajów rotacji
powinniśmy wykorzystać wykonując eksploracyjną analizę czynnikową?
a. Różnic międzygrupowych
b. Zmian nieprzypadkowych
c. Procesu rozwiązywania testu
d. Logicznej treści testu tak
21.Jeśli wartość współczynnika rzetelności dla testu wyniosła 0,9 oznacza to, że:
A. Jest on rzetelny
B. Żadna z odpowiedzi nie jest prawidłowa
C. Nie wiadomo co to znaczy, jeśli nie znamy szczegółów na temat badania rzetelności -
a nie to? też myślę, że to- Alicja
D. Jest on nisko rzetelny
A. Rotacja
B. Dendrogram
C. Wykres osypiska
D. Wartość własna
25. Jeśli wartość współczynnika trafności dla testu wyniosła 0,19 oznacza to, że
A. Jest on trafny
B. Żadna z odpowiedzi nie jest prawidłowa
C. Nie wiadomo co to znaczy jeśli nie znamy szczegółów na temat badania trafności
D. Jest on nisko trafny (Ala)
26.
27. Przy użyciu pakietu statystycznego obliczającego korelacje pozycja-skala korekta polega
na:
29. Przy stosowaniu macierzy "wielu cech - wielu metod", aby dany test uznać za trafny
należy wykazać zarówno:
31. Wybór konkretnej metody rotacji w analizie czynnikowej zależy przede wszystkim od:
32. Jeśli w jednym badaniu autorzy wykorzystali do analizy rzetelności Alfę Cronbacha, to
co powinni zrobić w dalszych badaniach, żeby dowiedzieć się czegoś nowego o rzetelności
testu?
34.Jeśli ładunek czynnikowy w analizie czynnikowej wyniósł -0,005, oznacza to, że:
35. Jeśli budując test mierzący inteligencję obliczymy korelację między wynikiem w naszym
teście i wynikiem w teście matryc Ravena, to znaczy, że najprawdopodobniej chcemy
oszacować:
a. Trafność kryterialną
b. Trafność treściową
c. Trafność fasadową
d. Trafność teoretyczną
36.Jeśli test ma służyć do diagnozy indywidualnej (a nie tylko do badań naukowych) to:
a. Alfą Cronbacha
b. Test-retest
c. Metoda połówkowa
d. Wersje równoległe
39.Jeśli oczekujemy, że wszystkie pozycje tworzonego przez nas testu będą wchodzić w
skład jednej skali, bez podwymiarów, to którą z poniższych rodzajów rotacji powinniśmy
wykorzystać wykonując eksploracyjną analizę czynnikową?
40. Przy stosowaniu macierzy "wielu cech - wielu metod", aby dany test uznać za trafny
należy wykazać zarówno:
42.Jeśli budując test mierzący inteligencję obliczymy korelację między wynikiem w naszym
teście i wynikami w kwestionariuszu NEO-FFI, to znaczy, że chcemy najprawdopodobniej
oszacować:
a. Trafność treściową
b. Trafność teoretyczną
c. Trafność kryterialną
d. Trafność fasadową
43. Aby autor kwestionariusza mógł poprawnie wykonać analizę metodą wielu cech-wielu
metod:
45. Najlepsze parametry rzetelności (przy tych samych pytaniach) mają skale odpowiedzi:
a. 5-7 punktowe
b. Nieparzyste
c. Parzyste
d. Które zawierają odpowiedź NIE WIEM
46. Jeśli wartość alfy Cronbacha w teście wyniosła 0,9 oznacza to, że:
47. Jeśli wartość współczynnika trafności dla testu wyniosła 0,9 oznacza to, że:
a. jest on trafny
b. Jest on nisko trafny
c. Żadna z odpowiedzi nie jest prawidłowa
d. Nie wiadomo co to znaczy jeśli nie znamy szczegółów na temat badania trafności
48. .Po przeprowadzeniu analizy mocy dyskryminacyjnych poszczególnych pozycji autor
zidentyfikował w swojej skali pozycję testową o najwyższym współczynniku mocy
dyskryminacyjnej - równym 0,70. Co się stanie z wysokością parametru Alfą Cronbacha,
jeśli autor usunie tę pozycję ze skali?
agasiorowska@swps.edu.pl
1
Literatura
• American Psychological Association, APA (2007).
Standardy dla testów stosowanych w psychologii i w
pedagogice. Gdańsk: Gdańskie Wydawnictwo
Psychologiczne.
2
Wprowadzenie
3
Co to w ogóle jest psychometria?
(inaczej - teoria testów)
• „… dział psychologii zajmujący się teorią i opracowywaniem testów
psychologicznych” (Szymczak, 1979)
• „dział metodologii psychologicznej zajmujący się pomiarem
zachowań ludzkich w aspekcie psychologicznym” (Szewczyk,
1979)
• „dziedzina obejmująca badania psychometryczne (…) na ogół
odnoszące się do różnych aspektów procesów psychicznych, w
tym badania osobowości, inteligencji, określania zdolności” (Reber,
2000)
• „gałąź psychologii zajmująca się określaniem warunków, jakie
powinny spełniać narzędzia wykorzystywane do pomiaru cech
psychologicznych, oraz budowaniem modeli wiążących wyniki
takich pomiarów z rzeczywistymi wartościami mierzonych
cech” (Hornowska, 2007)
4
Tworzenie i korzystanie
z testów psychologicznych
5
Źródła nadużyć związane z korzystaniem
z testów psychologicznych
• Wadliwie/nieprofesjonalne konstruowanie,
stosowanie (obliczanie) i interpretowanie wyników
testu
• Wadliwie/nieprofesjonalne/nietrafne decyzje,
mające wpływ na losy osoby poddanej badaniu
testowemu (np. oddziaływania terapeutyczne czy
selekcyjne)
• Wadliwe (nietrafne i nierzetelne) rezultaty badań
naukowych przeprowadzonych z wykorzystaniem
wadliwych testów psychologicznych i „niby-testów”
6
Test psychologiczny (1)
• Amerykańskie Towarzystwo Psychologiczne (APA):
7
Test psychologiczny (2)
• Badanie testowe to taka sytuacja, w której osoba
badana uczestniczy dobrowolnie, świadoma celu jakim
jest jej ocena
8
Test psychologiczny (3)
9
Każda próba sformułowania precyzyjnej definicji
„testu” lub „testowania” jako procesu jest
prawdopodobnie skazana na niepowodzenie,
ponieważ będzie przypuszczalnie wyłączać pewne
procedury, które powinny być włączone, i włączać
inne, które powinny być wyłączone.
10
Wytyczne Międzynarodowej Komisji ds.
Testów (International Test Commission
– ITC) z 2000
• Testowanie obejmuje szeroki zakres procedur stosowanych w diagnozie
psychologicznej, zawodowej i szkolnej.
• Testowanie może obejmować procedury pomiaru zarówno zachowań
normalnych, jak i odbiegających od normy czy zaburzonych.
• Zazwyczaj procedury testowania przewidują badanie w starannie kontrolowanych
lub ujednoliconych warunkach, ujętych w formalnych protokołach oceny.
• Procedury te dostarczają miar wykonania i wymagają wnioskowania na podstawie
próbek zachowań
• Obejmują one także procedury, których wynikiem może by jakościowa
klasyfikacja lub uporządkowanie osób badanych (np. w kategoriach typów).
• Każda procedura stosowana do „testowania” w powyższym rozumieniu tego
słowa, powinna by traktowana jako „test”, niezależnie od sposobu prowadzenia
badania; niezależnie od tego, czy została opracowana przez profesjonalnego
autora testów; i niezależnie od tego, czy zawiera zestaw pytań, czy te wymaga
wykonania zada lub czynności (np. próbki pracy, testy psychomotoryczne).
11
Rodzaje testów (1)
• Testy standaryzowane
• Testy niestandaryzowane
12
Rodzaje testów (2)
• Testy indywidualne
• Testy grupowe
13
Rodzaje testów (3)
• Testy szybkości
• Testy mocy
14
Rodzaje testów (4)
• Testy obiektywne
• Testy nieobiektywne
15
Rodzaje testów (5)
16
Rodzaje testów (6)
• Testy właściwości poznawczych
• Zagrożenie: zgadywanie
17
Rodzaje testów (7)
• Testy zorientowane na normy
18
Rodzaje testów wg APA (2000)
• Kryterium - złożoność i wymagana wiedza
psychologiczna i umiejętności posługiwania się
danym testem
20
Zawartość Standardów
Wprowadzenie Cz. II Bezstronność testowania
Strony uczestniczące w procesie testowania 7. Bezstronne badanie testem i stosowanie
Cel Standardów testu
• Obiektywność
• Standaryzacja i bezstronne stosowanie
• Rzetelność
• Trafność
• Normalizacja, korzystanie z norm
• Adaptacja kulturowa
22
Obiektywność
• Niezależność wyników testowania (od tego kto,
gdzie i kiedy dokonuje ich oceny)
24
Rzetelność
• Dokładność pomiaru
26
Normalizacja (1)
• Nadawanie znaczenia wynikom testowym
27
Normalizacja (2)
• W psychometrii przyjmuje się statystyczne rozumienie normy.
28
Adaptacja
29
Jak odróżnić
dobry test od testu złego?
• Autor testu: Test ma autora. Test zagraniczny ma również autora polskiej adaptacji
• Podręcznik zawiera:
• Opis teorii lub sposobu doboru grup empirycznych
• Opis grupy, na której przeprowadzono badania standaryzacyjne
• Opis procedury badania i interpretowania wyniku
• Opis badań dotyczących rzetelności i błędu standardowego pomiaru
• Opis badań dotyczących trafności zalecanej interpretacji
• Opis procedury normalizacji i normy
• Pomoce: Dostępny jest opis materiałów testowych, pomocy, arkusza pytań,
arkusza odpowiedzi
• Zabezpieczanie testu: Zostały podjęte wszelkie możliwe kroki, aby materiał
testowy został właściwie zabezpieczony.
• Ochrona prawna: Legalna dystrybucja.
30
Standaryzacja
31
Na czym polega
standaryzacja?
• Dokładne i szczegółowe określenie procedury
prowadzenia badań testowych, czyli
• procedury badania testem
• procedury obliczania wyników
• procedury interpretowania wyników
• Dla każdego testu opracowuje się podręcznik, w
którym dokładnie opisana jest procedura
przeprowadzenia badań
32
Elementy podręcznika
• Kolejność czynności, które wykonuje osoba prowadząca
badania
• Dokładny tekst instrukcji podawanej osobie badanej
• Arkusz odpowiedzi (jeśli jest taki przewidziany ), przygotowany
i stosowany w każdym badaniu w identycznym kształcie
• Klucz, przy pomocy którego dokonuje się punktacji
uzyskanych rezultatów badań
• Normy oceny uzyskanych wyników surowych
• Podanie zasad, przy pomocy których interpretuje się uzyskane
rezultaty badań testowych zgodnie z duchem teorii, w oparciu
o którą test został opracowany
33
Procedura badania testem
• Zasady ogólne
• Wskazówki dotyczące badania testem powinny być przedstawione na tyle jasno i
wyraźnie, aby testujący mógł i chciał powtórzyć sposób badania zastosowany przy
ustalaniu norm
• Stosując metody testowe należy dokładnie przestrzegać procedury badania testem
opisanej w podręczniku
• Instrukcja
• W instrukcji należy omówić takie zagadnienia jak fakt badania indywidualnego czy
grupowego, liczebność badanej grupy, limity czasowe, sposoby zaznaczania
odpowiedzi na arkuszach, możliwość powrotu do poprzednich zadań lub pytań,
problem zgadywania, kolejność stosowania testów lub zadań, zakres pomocy
udzielanej badanemu
• Jeżeli dopuszcza się możliwość rozszerzania lub uszczegóławiania instrukcji
przedstawionej w podręczniku testowym, to należy przedstawić warunki w jakich
postępowanie to jest dopuszczalne
• Pomoce
• Aby utrzymać standaryzację metody testowej należy okresowo sprawdzać materiał
testu, wyposażenie oraz stosowaną procedurę
34
Procedura obliczania
wyników
• Klucz do oceny odpowiedzi
• Osoby stosujące testy są odpowiedzialne za dokładne
obliczanie, sprawdzanie, kodowanie i rejestrowanie
wyników testowych
• Należy okresowo kontrolować stosowany system
obliczania wyników
• Obliczanie wyników
• Procedura obliczania wyników testowych powinna
zostać przedstawiona w podręczniku testowym na tyle
szczegółowo i dokładnie, aby prawdopodobieństwo
popełnienia błędu było jak najmniejsze
35
Procedura interpretowania
norm
• Normy przedstawione w podręczniku testowym
powinny zostać opracowane dla wyraźnie
zdefiniowanych i opisanych populacji
36
Potencjalne zagrożenia
(czyli czego nie wolno robić)
• Stosowanie testu przeznaczonego do badań
indywidualnych w sposób grupowy
38
Cecha psychologiczna
i jej pomiar
• Każdej cesze odpowiada kontinuum na którym
można rozmieścić wszystkie osoby badane
zgodnie z jej natężeniem
39
Wynik obserwowany
a wynik prawdziwy (1)
• Wynik obserwowany to wynik otrzymany w teście
psychologicznym
40
Wynik obserwowany
a wynik prawdziwy (2)
41
Test
pomiar
Wynik otrzymany
rzetelność
Wynik prawdziwy
trafność
Cecha
psychologiczna
42
Rzetelność
Jak dobrze mierzymy? Jaki popełniamy błąd pomiaru?
43
• W pewnym sensie, wszystkie pomiary
psychologiczne są nierzetelne
44
Rodzaje błędów pomiaru
• Błąd systematyczny
• Wynika ze stałych cech osoby badanej lub narzędzia
• Nie ma nic wspólnego z mierzoną cechą
psychologiczną
• W różnych sytuacjach testowania w taki sam sposób
wpływa na wyniki testowania
• Błąd losowy
• Powstaje w wyniku działania przyczyn przypadkowych
• W różnych sytuacjach testowania może w różny
sposób wpływać na wyniki testowania
45
Źródła błędu losowego
46
Klasyczna teoria testów
Wynik w teście Błąd pomiaru
X=T+E
Wynik
prawdziwy
• Podstawowe założenia:
• Błąd pomiaru ma rozkład normalny
• ME = 0 (założenie o nieobciążoności narzędzia)
• rTE=0 (założenie o niezależności)
• rE1E2=0
47
• Wskaźnikiem rzetelności jest wielkość
współczynnika korelacji między wynikiem
obserwowanym a wynikiem prawdziwym (𝜌XT)
• ALE - jak ją obliczyć, skoro nie znamy wyniku
prawdziwego?
48
σ XT σ (T +E )T σ + σ TE
2
σ2
σT
ρ XT = = = T
= T
=
σ Xσ T σ Xσ T σ Xσ T σ Xσ T σ X
49
σ XT σ (T +E )T σ + σ TE
2
σ2
σT
ρ XT = = = T
= T
=
σ Xσ T σ Xσ T σ Xσ T σ Xσ T σ X
49
X=T+E
σ XT σ (T +E )T σ + σ TE
2
σ2
σT
ρ XT = = = T
= T
=
σ Xσ T σ Xσ T σ Xσ T σ Xσ T σ X
49
X=T+E
σ XT σ (T +E )T σ + σ TE
2
σ2
σT
ρ XT = = = T
= T
=
σ Xσ T σ Xσ T σ Xσ T σ Xσ T σ X
49
X=T+E
σ XT σ (T +E )T σ + σ TE
2
σ2
σT
ρ XT = = = T
= T
=
σ Xσ T σ Xσ T σ Xσ T σ Xσ T σ X
49
X=T+E rTE=0
σ XT σ (T +E )T σ + σ TE
2
σ 2
σT
ρ XT = = = T
= T
=
σ Xσ T σ Xσ T σ Xσ T σ Xσ T σ X
49
X=T+E rTE=0
σ XT σ (T +E )T σ + σ TE
2
σ 2
σT
ρ XT = = = T
= T
=
σ Xσ T σ Xσ T σ Xσ T σ Xσ T σ X
49
X=T+E rTE=0
σ XT σ (T +E )T σ + σ TE
2
σ 2
σT
ρ XT = = = T
= T
=
σ Xσ T σ Xσ T σ Xσ T σ Xσ T σ X
49
Definicja rzetelności testu
σ 2
ρ 2
= T
XT
σ 2
X
50
Definicja rzetelności testu
σ 2
ρ 2
= T
XT
σ 2
X
Rzetelność
testu
50
Definicja rzetelności testu
σ 2
ρ 2
= T
XT
σ 2
X
Rzetelność
testu Wariancja
wyników
testowych
50
Definicja rzetelności testu
Wariancja
wyników
prawdziwych
σ 2
ρ 2
= T
XT
σ 2
X
Rzetelność
testu Wariancja
wyników
testowych
50
Testy równoległe
• Testy A i B są równoległe jeśli mierzą to samo i tak
samo, ale składają się z różnych pozycji testowych
• XA=XB
• 𝝈A = 𝝈B
• riAjA = riBjB
• rAZ = rBZ
51
σ XA XB σ (T +EA )(T +EB ) σ + σ TEA + σ TEB + σ EAEB
2
rAB = = =
T
σ X Aσ X B σ X Aσ X B σ X Aσ X B
σ2
σ 2
rAB = T
= = ρ XT
T 2
σ Xσ X σ 2
X
52
X=T+E
rAB = = =
T
σ X Aσ X B σ X Aσ X B σ X Aσ X B
σ2
σ 2
rAB = T
= = ρ XT
T 2
σ Xσ X σ 2
X
52
X=T+E
rAB = = =
T
σ X Aσ X B σ X Aσ X B σ X Aσ X B
𝝈A = 𝝈B
σ2
σ 2
rAB = T
= = ρ XT
T 2
σ Xσ X σ 2
X
52
X=T+E
rAB = = =
T
σ X Aσ X B σ X Aσ X B σ X Aσ X B
𝝈A = 𝝈B
σ2
σ 2
rAB = T
= = ρ XT
T 2
σ Xσ X σ 2
X
Rzetelność
testu
52
Metody badania
rzetelności
53
Metody badania
rzetelności
Estymacja spójności
wewnętrznej
53
Metody badania
rzetelności
Estymacja spójności
wewnętrznej
Estymacja wiarygodności
testu
53
Metody badania
rzetelności
Estymacja spójności
wewnętrznej
53
Metody badania
rzetelności
Estymacja spójności Estymacja równoważności
wewnętrznej międzytestowej
53
Metody badania
rzetelności
Estymacja spójności Estymacja równoważności
wewnętrznej międzytestowej
53
Metody badania
rzetelności
Estymacja spójności Estymacja równoważności
wewnętrznej międzytestowej
2rpp
rtt =
1+ rpp
54
Analiza zgodności
wewnętrznej (1)
• Wzór Kudera-Richardsona - wzór KR20
k
k ∑pq i i
KR20 = (1− i=1
)
k −1 σX2
55
Analiza zgodności
wewnętrznej (1)
• Wzór Kudera-Richardsona - wzór KR20
k
k ∑pq i i
KR20 = (1− i=1
)
k −1 σX2
rzetelność testu
55
Analiza zgodności
wewnętrznej (1)
proporcja
odpowiedzi
• Wzór Kudera-Richardsona - wzór KR20 diagnostycznych
(poprawnych)
k
k ∑pq i i
KR20 = (1− i=1
)
k −1 σX2
rzetelność testu
55
Analiza zgodności
wewnętrznej (1)
proporcja
odpowiedzi
• Wzór Kudera-Richardsona - wzór KR20 diagnostycznych
(poprawnych)
k
k ∑pq i i proporcja
odpowiedzi
KR20 = (1− i=1
) niediagnostycznych
k −1 σX2 (niepoprawnych)
rzetelność testu
55
Analiza zgodności
wewnętrznej (1)
proporcja
odpowiedzi
• Wzór Kudera-Richardsona - wzór KR20 diagnostycznych
(poprawnych)
k
k ∑pq i i proporcja
odpowiedzi
KR20 = (1− i=1
) niediagnostycznych
k −1 σX2 (niepoprawnych)
rzetelność testu
liczba pozycji
testowych
55
Analiza zgodności
wewnętrznej (1)
proporcja
odpowiedzi
• Wzór Kudera-Richardsona - wzór KR20 diagnostycznych
(poprawnych)
k
k ∑pq i i proporcja
odpowiedzi
KR20 = (1− i=1
) niediagnostycznych
k −1 σX2 (niepoprawnych)
rzetelność testu
55
Analiza zgodności
wewnętrznej (2)
• Alfa Cronbacha - rozszerzenie wzoru KR20
k
k ∑σ 2
i
α= (1− i=1
)
k −1 σX 2
56
Analiza zgodności
wewnętrznej (2)
• Alfa Cronbacha - rozszerzenie wzoru KR20
k
k ∑σ 2
i
α= (1− i=1
)
k −1 σX 2
rzetelność testu
56
Analiza zgodności
wewnętrznej (2)
• Alfa Cronbacha - rozszerzenie wzoru KR20
k
k ∑σ 2
i
α= (1− i=1
)
k −1 σX 2
rzetelność testu
liczba pozycji
testowych
56
Analiza zgodności
wewnętrznej (2)
• Alfa Cronbacha - rozszerzenie wzoru KR20
k
k ∑σ 2
i
wariancja dla
każdej pozycji
α= (1− i=1
) testowej
k −1 σX 2
rzetelność testu
liczba pozycji
testowych
56
Analiza zgodności
wewnętrznej (2)
• Alfa Cronbacha - rozszerzenie wzoru KR20
k
k ∑σ 2
i
wariancja dla
każdej pozycji
α= (1− i=1
) testowej
k −1 σX 2
rzetelność testu
56
Różne metody mierzą różne
źródła wariancji błędu
Metoda szacowania współczynnika
Wariancja błędu
rzetelności
Metoda połówkowa, Kudera Dobór treści, liczba pozycji testowych
Richardsona, α Cronbacha
150
rtt=0,95 rtt=0,999
140
130
120
110
100
100 110 120 130 140 150
58
Jak interpretować wielkość
współczynnika rzetelności?
59
Przykład - rzetelność Inwentarza
Rzetelno Osobowości
Inwentarza osobowo ci NEO-FFI
NEO-FFI Costy i McCrae
wspó czynnik alfa Cronbacha
60
Standardowy błąd pomiaru
dla wyniku otrzymanego
Standardowy b d pomiaru dla wyniku otrzymanego
SEM S X 1 rtt
gdzie: SEM to standardowy b d pomiaru
Sx to odchylenie standardowe ogólnych wyników testowych
rtt to rzetelno testu
Rzetelność testu
Standardowy błąd
pomiaru
Odchylenie
standardowe wyników
testowych
61
Przedział ufności dla
wyniku obserwowanego
X − Zα /2 SEM; X + Zα /2 SEM
półprzedział ufności
X
Zα/2*SEM Zα/2*SEM
62
Przykład budowania przedziału
ufności
Zα /2 SEM X−Y
64
Porównywanie dwóch przedziałów
ufności
65
Porównywanie dwóch przedziałów
ufności
90% przedział ufności, Z=1,64
SEM=20
Zα /2 SEM = 1,64 × 20 = 32,8 → 33pkt
65
Porównywanie dwóch przedziałów
ufności
90% przedział ufności, Z=1,64
SEM=20
Zα /2 SEM = 1,64 × 20 = 32,8 → 33pkt
65
Porównywanie dwóch przedziałów
ufności
90% przedział ufności, Z=1,64
SEM=20
Zα /2 SEM = 1,64 × 20 = 32,8 → 33pkt
65
Porównywanie dwóch przedziałów
ufności
90% przedział ufności, Z=1,64
SEM=20
Zα /2 SEM = 1,64 × 20 = 32,8 → 33pkt
67
Dlaczego rzetelność testu
jest ważna w diagnozie?
1 2 3 4 5 6 7 8 9 10
1 2 3 4 5 6 7 8 9 10
Półprzedział ufności
3 steny
1 2 3 4 5 6 7 8 9 10
Półprzedział ufności
3 steny
1 2 3 4 5 6 7 8 9 10
69
Trafność testu (1)
• Trafność to dokładność z jaką test mierzy to co ma mierzyć
70
Trafność testu (2)
• Trafność testu a trafność interpretacji wyników
danego testu
71
Walidacja
72
Test
pomiar
Wynik otrzymany
rzetelność
Wynik prawdziwy
trafność
Cecha
psychologiczna
73
Rodzaje/aspekty trafności
• TREŚCIOWA (inaczej wewnętrzna, logiczna; content validity)
• Ocena (na podstawie pomiaru testowego) całokształtu zachowań,
których próbkę pobiera test
• np. ocena wiadomości z matematyki na przykładzie konkretnego
zadania
• KRYTERIALNA (criterion-related validity)
• Ocena czy osoba posiada lub będzie posiadać pewną określoną
właściwość psychologiczną (inną niż bezpośrednio ta, którą mierzy test)
• TEORETYCZNA (construct validity)
• Pomiar nasilenia hipotetycznej właściwości (czyli psychologicznego
konstruktu, o którym mają świadczyć odpowiedzi na bodźce testowe)
74
Uwaga!
Trafność fasadowa
• Trafność treściowa to nie trafność fasadowa (face validity).
75
Trafność treściowa
• Zakres w jakim pozycje testowe właściwie reprezentują
uniwersum pozycji testowych lub interesujący nas konstrukt
76
Trafność kryterialna
• Kryterium jest to zachowanie czy właściwość, o której chcemy
wnioskować z wyniku ocenianego testu.
77
Rodzaje
trafności kryterialnej
• Trafność diagnostyczna (concurrent validity) - kryterium dla testu jest pomiar
zachowania czy cechy aktualnie występującej u osoby badanej
78
Trafność kryterialna
• wyniki testu rozwoju poznawczego → postępy
szkolne dziecka
80
Sposoby badania trafności
teoretycznej
• Analiza struktury czynnikowej testu
82
Analiza czynnikowa (2)
83
Analiza struktury
wewnętrznej testu (1)
• Zgodność wewnętrzna (homogeniczność) -
stopień, w jakim dany test można uznać za miarę
jednego konstruktu (cechy psychologicznej)
84
jakim dany test mo na uzna za miar jednego konstruktu
(cechy psychologicznej). Je eli mo na przyj w wietle
teorii, e mierzona cecha jest cech homogeniczn , to
Analiza struktury
wysoki wspó czynnik zgodno ci wewn trznej mo e by
traktowany jako dowód trafno ci teoretycznej testu.
85
Analiza różnic
międzygrupowych
• Analiza hipotez dotyczących zachowania się grup różniących
się ze względu na mierzony konstrukt
• Hipotezy wyprowadzone z teorii mierzonej cechy
• Badane grupy powinny różnić się ze względu na ogólny wynik
w teście
• Istnienie różnic w odpowiednim kierunku potwierdza trafność
testu
• Kwestionariusz Potrzeby Poznania (Traczyk, Matusz,
Gąsiorowska, 2011)
• Studenci (M = 134,7; SD = 17,6) i pracownicy naukowi (M =
144,1; SD = 16,5), t(114) = -2,929; p < 0,001
86
Analiza macierzy korelacji
Macierz Wielu Cech – Wielu Metod (1)
• Pomiar kilku cech przy użyciu kilku kwestionariuszy
92
Dlaczego trafność jest ważna
w diagnozie psychologicznej?
• Trafność wyznacza ramy interpretacji wyników
badania
93
Normy i normalizacja
Jak to zinterpretować?
94
Normalizacja (1)
• Nadawanie znaczenia wynikom testowym
95
Normalizacja (2)
• W psychometrii przyjmuje się statystyczne rozumienie normy.
96
Znaczenie grupy
odniesienia
• Znajomość grupy odniesienia jest kluczem do
prawidłowego interpretowania wyników testowych
• Prawidłowa grupa odniesienia (normalizacyjna)
• dobrze dobrana
• dobrze opisana
• odpowiednio duża
• przebadana w sposób aktualny
97
Rodzaje norm w testach
psychologicznych
• Ze względu na sposób definiowania grupy odniesienia
• normy ogólnokrajowe
• normy lokalne
• typu równoważnikowego
• normy wymagań
98
Normy standardowe (1)
• Powstają przez przekształcenie wyników surowych
w teście na wyniki standardowe Z
Wynik surowy Średnia w grupie
osoby badanej odniesienia
w teście
Xi − X
Z=
SD
Wynik
standardowy osoby
badanej Odchylenie
w teście
Z ∼ N(0,1) standardowe w grupie
odniesienia
99
Normy standardowe
100
Skale oparte na rozkładzie
normalnym
• Transformacja liniowa - przekształcenie wyników Z na inne skale
• Skala stenowa
• Skala staninowa
• Skala IQ
• Skala tetronowa
• ….
101
Skala T (McCall, 1939)
• Nazwana na cześć E.L. Thordike’a
• M = 50, SD = 10
• T = 10 × Z + 50
• Wykorzystywana np. w MMPI
102
Skala stenowa
• Standard ten
• M = 5,5, SD = 2
• 10 jednostek, od 1 do 10
• sten = 2 × Z + 5,5
• Wykorzystywana np. w NEO-FFI
103
Skala staninowa
• Standard nine
• M = 5, SD = 2
• 9 jednostek, od 1 do 9
• sten = 2 × Z + 5
• Wykorzystywana np. w FCZ-KT
104
Skala IQ
• zaproponowana przez Wechslera
• M = 100, SD = 15
• IQ = 15 × Z + 100
• Wykorzystywana w WAIS
105
Skala tetronowa
• Opracowana przez Maruszewskiego (1984)
• M = 10, SD = 4
• 21 jednostek, od 0 do 20
• tetron = 4 × Z + 10
• Wykorzystywana np. w wielu testach pedagogicznych
106
Porównanie skal standardowych
107
Etapy procedury wyznaczania norm
108
Normy rangowe
• Odzwierciedlają
uporządkowanie
osób badanych
• Nie
odzwierciedlają
wielkości różnic
między wynikami
osób badanych
109
Skala centylowa
CENTYL 50
110
Normy centylowe
Liczebność
Liczebność prosta dla danego
skumulowana wyniku surowego
obserwacji poniżej
danego wyniku
surowego
cfi−1 + 0,5 × fi
centyl(C) = × 100%
N
Łączna liczba
badanych
1 10 20 30 40 50 60 70 80 99 99
112
Siatka centylowa
113
Normy równoważnikowe
• Obecnie stosowane dość rzadko
• Równoważniki wieku
• Równoważniki klasy
114
Normy równoważnikowe
Zalety Wady
• równoważniki klasy bądź wieku pokazują • normy takie nadają się tylko do niektórych
opóźnienia/przyspieszenie w uczeniu się treści nauczania
np. w stosunku do średnich osiągnięć
uczniów tej samej klasy, albo w stosunku • bywają mylnie uważane za rejestry
do rówieśników wymagań programowych
• rok szkolny i rok życia stanowią naturalne, • bywają podstawą daleko idących
dobrze znane wszystkim użytkownikom uogólnień
testów, jednostki miary
• ustalanie ich jest pracochłonne i kosztowne
• normy te można dostosować do każdego
miesiąca nauki • wartość norm typu równoważnikowego
zależy od przedmiotu nauczania i polityki
władz szkolnych
115
Analiza zadań
Zasady włączania pozycji testowych
do ostatecznej wersji testu
116
Rodzaje testów
• Testy właściwości poznawczych
• Zagrożenie: zgadywanie
117
Analiza zadań
• Analiza treściowa - ustalenie, czy pozycja testowa
jest poprawna rzeczowo, tzn. czy da się ją
wyprowadzić z teorii mierzonej cechy
• Analiza językowa - sprawdzenie, czy pozycja
testowa jest poprawnie sformułowana
• Analiza statystyczna - na podstawie wyników
badań pilotażowych
• współczynnik trudności pozycji testowych
• współczynnik mocy dyskryminacyjnej
118
Współczynnik trudności
(wskaźnik łatwości)
Liczba osób które
odpowiedziały poprawnie
na i-tą pozycję
Współczynnik
ni
trudności
T = = pi
n
Proporcja osób które
odpowiedziały poprawnie
na i-tą pozycję
Ogólna liczba
osób badanych
119
Wariancja pozycji testowej
Proporcja osób które
odpowiedziały poprawnie
na i-tą pozycję
Wariancja i-tej
pozycji
δ = pi (1− pi ) = pi qi
i
2
120
Jak powinny być dobierane pozycje
testowe na podstawie wsp. trudności?
• Jeśli test ma dobrze różnicować osoby na całym
kontinuum
121
Trudność testów a zgadywanie (1)
1
T0 = p0 + q0 × Liczba kategorii
odpowiedzi
Poprawiony
współczynnik
m
trudności
122
Trudność testów a zgadywanie (2)
1
T0 = p0 + q0 ×
m
Proporcja osób Proporcja osób Wartości
Liczba kategorii
odpowiedzi
odpowiadających zgadujących T0 podane przez
prawidłowo odpowiedź Lorda (1952)
123
Poprawka na zgadywanie
przy interpretacji wyniku indywidualnego (1)
Zarejestrowana
częstość niepoprawnych
odpowiedzi
na i-tą pozycję
Wi
Ci = Ri −
Liczba osób,
które rzeczywiście m −1
znały odpowiedź
Liczba kategorii
odpowiedzi
Zarejestrowana
częstość poprawnych
odpowiedzi
na i-tą pozycję
124
Poprawka na zgadywanie
przy interpretacji wyniku indywidualnego (2)
Liczba niepoprawnych
odpowiedzi
dla tej osoby
W
C = R−
Skorygowany wynik
danej osoby
m −1
Liczba kategorii
odpowiedzi
Liczba poprawnych
odpowiedzi
dla tej osoby
125
Np. dla testów
egzaminacyjnych……
• 4 kategorie
• 20 pytań
9
C = 11− =8
4 −1
126
Współczynnik mocy dyskryminacyjnej
128
Wskaźnik dyskryminacji (1)
Badany
D = pu − pl
A B C D E F G H I J
P1 0 1 1 1 0 1 1 0 1 0 D = 2/3-1/3 = 1/3
P2 1 1 1 1 0 0 0 1 0 1 D = 3/3-3/3 = 0
P3 1 0 1 1 0 1 1 1 1 1 D = 2/3-1 = -1/3
…..
Wynik 25 27 15 24 20 18 16 14 22 10
129
Wskaźnik dyskryminacji (2)
130
Korelacyjne współczynniki
dyskryminacji
• Oparte o korelację pomiędzy wynikiem danej pozycji
testowe i łącznym wynikiem w teście
131
Założenia
Rozkład cechy która jest
Rozkład ogólnego
Współczynnik mierzona przez daną
wyniku w teście
pozycję testową
132
Od czego zależą wysokości
współczynników?
• Od rodzaju współczynnika
133
Współczynniki oparte na analizie
różnic między skrajnymi grupami
134
Jak obliczać wynik ogólny przy
wyliczaniu współczynników mocy
dyskryminacji?
1 2
1 2
1
X 1 2
136
Czynniki zniekształcające
wyniki testowe
137
Strategie (style) odpowiadania
na pozycje kwestionariusza
138
Strategie (style) odpowiadania
na pozycje kwestionariusza
• Strategie są stałe i trwałe
139
Strategie (style) odpowiadania
na pozycje kwestionariusza
• Tendencja do potakiwania
• Strategia semantyczna
140
Tendencja do potakiwania
141
Strategia semantyczna
142
Tendencja do unikania
konkretnej odpowiedzi
• Niektóre osoby badane, częściej niż inne
kategorie, wybierają kategorię neutralną ("nie
wiem", "?")
144
Jak kontrolować style
odpowiadania?
• Odpowiednia budowa kwestionariusza
145
Zmienna aprobaty społecznej
(Edwards, 1957; Crowne i Marlow, 1964)
146
Kontrolowanie zmiennej
aprobaty społecznej
• Na etapie konstrukcji kwestionariusza:
• Pozycje neutralne
• Pozycje subtelne pod względem trafności fasadowej
• Specjalne formułowanie językowe pozycji
• Wprowadzanie odpowiedniej instrukcji
• Analiza korelacji pozycji ze skalami mierzącymi aprobatę społeczną
• Na etapie stosowania kwestionariusza:
• Wprowadzanie odpowiedniej instrukcji, tzw. instrukcja "szczerości"
• Skala kontrolna aprobaty społecznej (odrzucanie respondentów o
wysokich wynikach lub korygowanie wyników skal treściowych
przez doliczanie tzw. poprawek korekcyjnych
147
Kontrolowanie zmiennej
aprobaty społecznej
aprobata (+) aprobata (-)
149
Strategie konstrukcji
testów
• Strategia teoretyczna
Określenie, jakie
pozycje testowe
różnicują te dwie grupy
151
Eksperyment Gougha (1954)
nad klinicznym pojęciem neurotyzmu
• Grupa zaawansowanych studentów i klinicystów miała
na pozycje testu odpowiadać tak, jak ich zdaniem,
odpowiadałby pacjent „doświadczający reakcji
psychoneurotycznej”
153
Adaptacja testów
Kiedy test “zagraniczny” nadaje się do używania
w naszych warunkach?
154
Adaptacja testu
155
Test “wolny kulturowo”
• Pierwszy raz terminu culture free test użył Cattell
(1940)
157
Podejście nomotetyczne
• Do porównywania wpływu kultury potrzebne są pojęcia ogólne,
będące aproksymacją pojęć specyficznych, lecz oparte na
wspólnym układzie odniesienia
• Uzasadnione są takie działania, jak:
• adaptacja narzędzi diagnostycznych, przenoszonych z innej
kultury wraz z zapleczem teoretycznym i literaturowym,
• przyswajanie teorii psychologicznych (o których się
apriorycznie zakłada, iż są na tyle ogólne, że trafne są w
każdych warunkach społeczno-kulturowych),
• stosowanie „ponadkulturowych” technik terapeutycznych, itd.
158
Podejście idiograficzne
• Analizy wpływów kultury należy dokonywać bazując na pojęciach
wypracowanych przez daną społeczność, gdyż kultura jest
integralną częścią ludzkich zachowań
• Uznaje się istnienie specyficznych kulturowo czynników
etiologicznych, czynników (kultur) immunizujących członków
danej społeczności przeciwko zaburzeniom psychicznym lub im
sprzyjających
• Wiąże się to także z przekonaniem o kulturowo specyficznych
rodzajach osobowości, uzdolnień, rodzajach zaburzeń i/lub
specyficznych ich manifestacji, ich terapii;
• Wiąże się z niezgodą na implantację obcych (kulturowo) narzędzi
diagnostycznych, teorii, systemów klasyfikacji zaburzeń itp.
159
Założenia adaptacji kulturowej.
Zasada równoważności
• Problemy przy adaptacji kulturowej narzędzia
diagnostycznego:
• czy przedmiot pomiaru ma charakter emikalny czy
etikalny
• jeśli przedmiot pomiaru ma charakter etikalny - czy
przejawia się on w drugiej kulturze tak samo lub
podobnie
• Równoważność konstruktu
• Równoważność funkcjonalna zachowań
• Równoważność wskaźników konstruktu teoretycznego
160
Równoważność
konstruktu
• Czy to, co ma być przedmiotem pomiaru (konstrukt
teoretyczny) istnieje nie tylko w kulturze oryginalnej,
ale także w kulturze docelowej?
161
Równoważność
funkcjonalna zachowań
162
Równoważność wskaźników
konstruktu teoretycznego
163
Strategia adaptacji
• Transkrypcja Etikalny
charakter konstruktu
• Translacja
• Trawestacja
• Parafraza
• Rekonstrukcja Emikalny
charakter konstruktu
164
Transkrypcja
• Maksymalnie wierne tłumaczenie oryginalnych
pozycji. Wprowadza się tylko takie poprawki
językowe, które są niezbędne
166
Trawestacja
• Swobodne tłumaczenie oryginału z wprowadzaniem wielu
modyfikacji i zmian, sugerowanych względami językowymi
i psychologicznymi
167
Parafraza
• Konieczność opracowania nowego narzędzia od fazy
analizy teorii i generowania pozycji, aż po analizę
psychometryczną danych - test oryginalny jest jedynie
inspiracją adaptacji
168
Rekonstrukcja
• Konieczność opracowania całkowicie nowego narzędzia,
dla którego inspiracją jest oryginalny model teoretyczny i
strategia konstrukcji.
169
Wybór odpowiedniej strategii zależy
przede wszystkim od celu adaptacji
170
Stronniczość
testów
psychologicznych
171
„Testy psychologiczne mierzą cechy, które nie są
bezpośrednio obserwowalne, które różnie są
definiowane i które mierzone są jedynie w sposób
pośredni. Z tej perspektywy, problem stronniczości
testów inteligencji jest częścią szerszego – w sposób
oczywisty ważniejszego – problemu
niejednoznaczności. Problem stronniczości dotyczy
generalnie wszelkich testów psychologicznych.
Stronniczość bowiem, może się ujawnić nie tylko w
przypadku testów inteligencji, ale również testów
osobowości, testów psychopatologicznych czy testów
zawodowych”.
174
Stronniczość ≠ Uczciwość
• Stronniczość to cecha formalna testu
• Uczciwość to termin odnoszący się do strony etycznej
testowania
• Uczciwość odwołuje się zawsze do jakiegoś systemu
wartości
• Pojęcie uczciwości, społecznej sprawiedliwości i jednakowej
ochrony przez prawo to pojęcia moralne i prawne i w tym
sensie należy je odróżniać od pojęcia stronniczości testu,
traktowanej jako cecha testu
• Uczciwość stosowania testu to kwestia kompetencji
psychologa, polityki społecznej, rozwiązań prawnych,
konsekwencji praktycznych
175
Czynniki, ze względu na które
test może być stronniczy
• Wiek
• Płeć
• Rasa
176
Wiek
• Test jest zwykle przeznaczony do badania
odpowiedniej populacji (dzieci, młodzież, dorośli)
178