Wykłady Psychometria

You might also like

Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 22

Wykład 1

Podstawy metrologii — nauki o pomiarach

Czym jest metrologia


Nauka dotycząca sposobów dokonywania pomiarów oraz zasad interpretacji
uzyskanych wyników
Psychologia posługuje się narzędziami pomiarowym, testami to zrozumienie
mechanizmów niedoskonałości narzędzi jest bardzo istotne, aby eliminować
błędy

Złoty podział — to piękno i harmonia, obserwowana w przyrodzie, ma wpływ


na artystów, naukowców z wielu dziedzin: estetyka, architektura, malarstwo,
muzyka, matematyka, geometria, finanse

Definicja pomiaru
Pomiar jest to proces poznawczy polegający na porównaniu dwóch wielkości, z
których jedna uważana jest za wzorcową; wynik porównania wyraża się w
liczbach zgodnie z przyjętym układem jednostek
Pomiar jest to znajdowanie wartości wielkości fizycznej na drodze
doświadczalnej przy wykorzystaniu do tego środków technicznych

Rola i cel pomiarów


Rola
W każdej dziedzinie nauki konieczna jest ocena ilościowa i jakościowa oceny
zjawisk i procesów oraz możliwość określenia właściwości narzędzi pracy
Postęp w nauce i techniki jest ścisłe związany z postępem i osiągnięciami w
zakresie miernictwa
Jest to dziedzina o interdyscyplinarnym charakterze

Cel
Każdy pomiar czy badanie musi mieć cel
Osiągniecie celu jest podsumowaniem świadomego działania np.pomiaru

Przykłady:
 Ocena wpływu temperatury na zmianę klimatu
 Sterowanie procesami operacji technologicznych
 Diagnostyka medyczna
 Diagnostyka psychologiczna
 Radarowy pomiar prędkości i mandat
 Badania wytrzymałościowe

Środki pomiarowe
Urządzenie pomiarowe
 Proste: linijka, sznurek, stoper, waga
 Złożone: przyrządy pomiarowe nacisku, prądu, napięcia, liczniki cząstek
elementarnych, pomiar szybkości internetu, pomiar światła w aparacie
fotograficznym, pH wody, itd.) testy psychologiczne, aparatura
pomiarowa np.oscyloskop

Urządzenia sterujące
 Sygnał pomiarowy jako źródło sterowania

Rodzaje pomiarów
Pomiary ciagle — wyniki otrzymywane z urządzenia pomiarowego w sposób
ciągły (wskazanie termometru, przedkosciomierz w samochodzie, poziom wody
w rzece)
Pomiary dyskretne — pomiar dokonywany w sposób punktowy przez
urządzenia dyskretne (zegary cyfrowe)
Technologiczne, międzyoperacyjne, końcowe – cykliczne

Metody pomiarowe
Sposób przeprowadzania pomiaru
 Metody bezpośrednie — wyniki otrzymuje się bezpośredni ze wskazania
urządzenia pomiarowego
 Metody pośrednie — wyniki otrzymuje się mierząc inne wielkości
metodą bezpośrednią a następnie znając zależność pomiędzy nimi oblicza
się zadaną wielkość

Błędy pomiarów
Błąd = wartość poprawna — wartość wskazywana
 Błędy statystyczne — odnoszą się do pomiarów niezmiennych w czasie
wielkości przy działaniu ustalonych wielkości wpływowych
 Błędy dynamiczne — odnoszą się do pomiaru szybko zmiennych w
czasie wielkości mierzonych i/lub wpływowych
 Zastosowanie niepoprawnych metod pomiarowych
 Błędy przyrządów pomiarowych
 Wpływ czynników zewnętrznych
 Niedoskonałość obserwatora
 Systematyczne
 Przypadkowe

Wykład 2
Czym się zajmuje psychometria

Psychometria to
Gałąź psychologii zajmująca się określaniem warunków, jakie powinny spełniać
narzędzia wykorzystywane do pomiaru cech psychologicznych oraz
budowaniem modeli wiążących wyniki takich pomiarów z rzeczywistymi
wartościami mierzonych cech

Wartość cechy
Jest parametrem rozkładu charakteryzującego częstości występowania
określonych zachowań się człowieka w danych sytuacjach

Przykład: zadowolenie z pracy mierzone liczbą dni absencji

Natura mierzonych właściwości (cech) w psychometrii


Cechy to konstrukty teoretyczne, które nie są bezpośrednio obserwowalne
(mieszane) — określa się jako zmienne ukryte (latentne) np.poziom inteligencji,
poziom zaufania dziecka do dorosłych

Właściwości psychiczne rozkładają się na kontinuum pod względem natężenia


— różnice pomiędzy ludźmi pod względem danej cechy mają charakter
ilościowy (np.nasilenie neurotyzmu)

Wiele cech psychicznych (nie wszystkie) ma rozkład normalny — krzywa


Gaussa
Centralne twierdzenie graniczne
 W pewnych warunkach suma dużej liczby zmiennych losowych będzie
mieć w przybliżeniu rozkład normalny
 Ponieważ liczba dyskretnych zdarzeń wzrasta, funkcja zaczyna
przypominać rozkład normalny

Wszystkich ludzi można scharakteryzować pod względem wspólnych cech


(podejście nomotetyczne) np.ekspresja emocji, inteligencja

Każdy człowiek ma odmienne cechy psychiczne — różnice indywidualne


(podejście idiograficzne)

Cechy psychologiczne są definiowane w terminach operacyjnych (definicje


semantyczne np.”prokrastynacja to oddawanie wykonanych prac w ostatniej
chwili”) i w kategoriach związków z innymi konstruktami teoretycznymi i
obserwowanymi zjawiskami (definicje syntaktyczne) np.”prokrastynacja a
sukces szkolny”
Pomiar psychologiczny
Pomiar psychologiczny to przyporządkowanie liczb poszczególnym osobom w
taki sposób, aby miedzy przyporządkowanymi liczbami odzwierciedlały relacje
równości i różności
Przykład: hipotetyczne wyniki badania pewnym testem inteligencji —
nieobserwowane bezpośrednio właściwości psychiczne i zbiór liczb je
odzwierciedlający

Czym innym jest zmienna psychologiczna a czym innym jest jej pomiar

Pomiar jest oparty na ograniczonej próbce zachowań uważanych za najbardzej


adekwatne

Obserwowalne zachowania świadczące o stanach i cechach psychicznych


podlegające pomiarowi to wskaźniki — dzięki nim wnioskujemy o zmiennych
ukrytych np.płacz = smutek

Niejednoznaczność wskaźników

Ten sam wskaźnik może oznaczać różne właściwości


Przykład: szybkie rozwiazanie zadania matematycznego może wynikać z
inteligencji, spostrzegawczości, dobrego wzroku
I odwrotnie
Żadna realizacja pomiaru nie ma charakteru uniwersalnego — ten sam
konstrukt psychologiczny może być powiązany z różnym zbiorem zachowań
(wskaźników)

Im więcej wskaźników bierze się pod uwagę, tym lepiej można wnioskować o
właściwościach psychicznych

Zliczanie wskaźników danej właściwości psychicznej jest jej mierzeniem

Testy psychologiczne zbudowane są z wielu wskaźników, tworzących odrębne


pozycje testowe

Wynik testu jest uogólnieniem pozycji testowych — operacyjnie jest to suma


punktów uzyskanych w poszczególnych pozycjach testowych

Wyniki testu mają odzwierciedlać złożoną rzeczywistość

Pomiar różnicowy
Problem — poszukiwanie punktu odniesienia — brak zera absolutnego i brak
maksymalnego nasilenia danej cechy
Rozwiązanie — wartością, z jaką porównuje się wyniki poszczególnych
badanych jest średnia rozkładu wyników danego testu — jest to pomiar
różnicowy

Wniosek — pomiar psychologiczny nie ma charakteru bezwzględnego a jedynie


względny (porównywanie ze średnią populacji)

Kwestie problemowe pomiaru psychologicznego


Ryzyko założenia o normalności rozkładu (niemożliwe przebadanie całej
populacji)

Nie ma pewności, że zbiór jednostek na skali testowej odpowiada


równomiernym jednostkom na skali testowej

Brak niezależnych miar zmiennych psychologicznych.

Wykład 3
Definicja testu i rodzaje testów
Definicja testu
Test psychologiczny jest specyficzną procedurą diagnozowania

Test psychologiczny jest narzędziem które pozwala na uzyskanie takiej próbki


zachowań, które mogą być wskaźnikami określonej cechy psychologicznej

Dostarcza reguł obliczania wartości mierzonej cechy


Spełnia określone kryteria takie jak obiektywność, standaryzacja, rzetelność,
trafność i normalizacja

Jasno określa zakres i rodzaj dopuszczalnych zachowań diagnosty

Zakłada kooperacyjną postawę osoby badanej

Badanie testowe (Paluchowski, 1991, s.41)


Sytuacja, w której osoba badana uczestniczy dobrowolnie, świadoma celu,
jakim jest jej ocena

Sytuacja tworzona specjalnie do celów diagnostycznych, w której wywołuje się


zachowania typowe pod względem charakterystyki, która ma być przedmiotem
obserwacji
Sytuacja, która nie wymaga osobistego zaangażowania diagnosty i w której jest
jasno określony zakres dopuszczalnych zachowań
Rodzaje testów

Kryteria dobroci testów psychologicznych


 Obiektywność
 Standaryzacja
 Rzetelność
 Trafność
 Normy
 Właściwa adaptacja

Obiektywność czyli niezależność wyników testowania


Test jest obiektywny, jeśli dwie osoby opracowujące wyniki dochodzą do tego
samego rezultatu

Techniką badania stopnia obiektywności jest technika tzw.ślepej diagnozy.


Polega ona na rozesłaniu tego samego, wypełnionego arkusza testowego do
różnych osób oceniających. Jeżeli otrzymane wyniki i ich interpretacja będą do
siebie podobne, można uznać test za obiektywny
Standaryzacja czyli jednolitość warunków badania

Rzetelność
Dokładność pomiaru, czyli wielkość błędu jaki popełnia psycholog

Odpowiada na pytanie, w jakim stopniu wynik odzwierciedla poziom mierzonej


cechy

Wskaźnik rzetelności jest to współczynnik korelacji pomiędzy wynikami


otrzymanymi w teście a wynikami prawdziwymi osób badanych

Konieczność określania standardowego błędu pomiaru

Trafność
Obszar zastosowania testu — czy test mierzy zakładaną zmienną

Pytanie o to, jakie wnioski można wyciągnąć na temat zmiennych mierzonych


przez test

Informacja o tym, jak test pełni swoją funkcję — adekwatność pomiaru w


porównaniu z funkcjonowaniem w życiu

Trafność dotyczy tylko konkretnego zastosowania


Rodzaje trafności
 Diagnostyczna — określa w jakim stopniu test diagnostykę poziom
określonej cechy występujący u danej jednostki
 Prognostyczna — określa, w jakim stopniu test przewiduje zachowanie
jednostki w sytuacji poza testowej
 Treściowa — zwana tez wewnętrzną lub logiczną polega na wykazaniu,
w jakim stopniu treść testu stanowi próbkę klasy sytuacji, które mają być
przedmiotem pomiaru
 Teoretyczna — jednym z aspektów trafności teoretycznej jest
tzw.trafność czynnikowa
 Kryterialna — diagnostyczna + prognostyczna, określona jest poprzez
porównanie wyników testu z kryterium zewnętrznym

Normy, czyli nadawanie znaczenia wynikom testowym


Wynik surowy
 Odnosi się do wyniku otrzymanego w próbie standaryzacyjnej
 Pozwala stwierdzić, w którym miejscu rozkładu mieści się osoba badana
Efektem normalizacji jest zbudowanie zestawu norm, które stanowią podstawę
interpretacji wyników testowych

Norma — typowy poziom wykonania zadania


Normy mają charakter relatywny i zależą od grupy odniesienia

Adaptacja kulturowa testów psychologicznych


Adaptacja to proces przystosowania wersji pierwotnej do specyfiki kultury
lokalnej
 Strategia psychometryczna — tworzenie równoległej wersji narzędzia
 Strategia pragmatyczna — odwołuje się do kulturowego II społecznego
kontekstu badania diagnostycznego

Adaptacja testu musi uwzględniać różnice kulturowe miedzy krajem


pochodzenia i stosowania testu (emic oznacza to, co specyficzne dla
porównywanych kultur, etic to, co wspólne)
Typy tłumaczeń
 Metoda tłumaczenia grupowego — tekst tłumaczy kilka osób a potem
konfrontują rezultaty i wspólnie ustalają ostateczna wersję
 Metoda tłumaczenia odwrotnego — tekst przetłumaczony z języka
obcego na rodzimy inny tłumacz przekłada ponownie na język obcy
 Metoda odpowiedzi dwujęzycznych — obie wersje testu rozwiązują
osoby dwujęzyczne, tzn.posługujące się wprawnie dwoma językami.
Następnie kolęduje się wyniki uzyskane w odpowiedziach na obie wersje
testu
Proces wnioskowania psychometrycznego
Jest to proces wyprowadzania wniosków o wartościach cech psychologicznych
osób na podstawie wyników, jakie otrzymały one w testach psychologicznych

Jego podstawą jest wynik otrzymany w teście czyli wynik obserwowany


 Jest uzyskiwany przez przypisywanie wartości liczbowych
odpowiedziom lub reakcjom na pozycje testu
 Pozycje testu są oceniane w kategoriach odpowiedzi prawdziwych
(diagnostycznych) lub nieprawdziwych (niediagnostycznych)
Wynik prawdziwy jest to wynik odzwierciadlający rzeczywistą wartość
mierzonej cechy (istnieje niezależne oś aktu dokonywania pomiaru)

Elementy procedury wnioskowania psychometrycznego


Kryteria odróżniające dobry test od złego

Wykład 4
Przegląd wybranych testów psychologicznych
Podział testów
 Ze względu na przedmiot pomiaru
Narzędzia do pomiaru cech osobowości (właściwości afektywnych) —
kwestionariusze i inwentarze.
Nie ma prawidłowych ani błędnych odpowiedzi, lecz odpowiedzi wskazujące
na intensywność cechy. Wykorzystują samowiedzę badanego.
 Narzędzia do pomiaru cech intelektu i zdolności matematycznych,
werbalnych, przestrzennych, abstrakcyjność-logicznych, sprawności
psychomotorycznej, inteligencji ogólnej (właściwości poznawczych) —
testy we właściwym znaczeniu
Istnieje prawidłowa odpowiedź. Wykorzystują próbki zachowań.
 Ze względu na liczbę jednorazowo badanych osób
Indywidualne — złożona procedura badania (mierzenie czasu, prezentacja,
zapis); czasochłonność; konieczność nawiązania kontaktu z badanym;
obserwacja badanego; pozwalają na dokładniejsze zdiagnozowanie badanego.
Grupowe — brak pełnej kontroli nad stosowaniem się badanych do instrukcji;
podanie instrukcji i wręczenie testów badanym; pozycje testowe zamknięte;
prosty sposób wyliczania wyników; wielkość ograniczona wielkością sali oraz
możliwością kontroli badanych; stosowane często dla celów selekcyjnych;
krotki czas badania.

Testy cech intelektu


 Szybkości
Umożliwiają ocenę sprawności intelektualnej rozumianej jako szybkość
efektywnej pracy intelektualnej;
Składają się z wielu zadań o tej samej lub podobnej trudności;
Czas wykonania jest ograniczony;
Są dość łatwe;
Liczna zadań przewyższa możliwości badanych;
Miarą osiągnięć jest liczba podanych odpowiedzi (Ew.błędów)
 Mocy
O wyniku decyduje poprawność rozwiązania
Zadania są trudniejsze i bardziej zróżnicowane
Trudność kolejnych zadań wzrasta
Czas wykonania nie jest ograniczony
Badani kończą badanie na zadaniu zbyt dla nich trudnym
 Niewerbalne (wykonaniowe, bezsłowne)
Badany wykonuje określone działania na konkretnym materiale — rysowanie,
prowadzenie ołówka przez ścieżki labiryntu, układanie klocków, rozwiązywania
łamigłówek i zadań matematycznych, układanie elementów układanek,
odnajdywanie brakujących części obrazka
 Werbalne
Odpowiedź udzielana jest słownie w formie pisemnej lub ustnej — konieczna
znajomość języka
 Skale rozwojowe
Do diagnozy poziomu rozwoju intelektualnego dzieci;
Zestawy dla różnych poziomów wieku;
Badanie indywidualne;
Rozpoczyna się od zestawu odpowiadającego wiekowi dziecka;
Często w formie baterii testów.

Pierwsze baterie testów


 Alfred Binet i Theophile Simon (1905)
Opracowanie zestawu zadań o wzrastającym poziomie trudności, opartych o
treści nauczania dla dzieci w wielu 3-13 lat;
Pomiar różnych funkcji intelektualnych — np., oceniania i rozumowania;
Zadania sensoryczne i percepcyjne;
Zadania werbalne i wykonaniowe;
Poziomowi wieku przypisywano zadania rozwiązane przez większość (70%)
rówieśników;
Wiek umysłowy odpowiadał wiekowi przypisanemu określonym zadaniom.
 Adaptacje metody Bienka
Stanfordzka Skala Bineta
Adaptacja Lewisa Termana i wprowadzenie pojęcia ilorazu inteligencji
(proporcja wieku umysłowego do wieku życia pomnożona przez 100)

Wybrane skale rozwojowe


 Skala Dojrzałości Umysłowej Columbia
Test niewerbalny;
Służy do oceny dojrzałości umysłowej dziecka w wieku od 3,5 do 10 lat
Składa się z 70 tablic z rysunkami (3 tablice przykładowe i 67 tablic
właściwych);
Tablice zwierają rysunki figur geometrycznych lub przedmiotów;
Zadaniem dziecka jest wskazanie rysunku niewiążącego się z pozostałymi —
poprawność tworzenia klas logicznych.
 Międzynarodowa Wykonaniowa Skala Lestera
Niewerbalny test inteligencji dla dzieci w wieku od 3 do 15 lat — nie wymaga
używania mowy ani jej rozumienia;
Materiał percepcyjny — składa się z 52 zadań uporządkowanych według
stopnia trudności ustalonego w badaniach standaryzacyjnych;
Zadania pogrupowane są po cztery, tworząc serie od A do M — badany ma
odtworzyć, przy pomocy klocków, układ określony przez informacje zawarte
we wzorze narysowanym na pasku kartonu;
Bada operacje intelektualnej takie jak wykrywanie relacji i ich
wykorzystywanie przy porządkowaniu obiektów;
Nie odwołuję się do wiadomości — wolny od wpływów uczenia i języka;
Badania indywidualne;
Bez ograniczenia czasu (z wyjątkiem 4 prób)
Liczba zadań, jakie dziecko otrzymuje zależy od odnoszonych sukcesów i
porażek;
Czas badania jest zróżnicowany — u dzieci najmłodszych wynosi przeciętnie
20 minut, u najstarszych — około 60 minut.
 Diagnoza Możliwości Intelektualnych
Oparty na koncepcji Piageta — myślenie operacyjne;
Przeznaczony dla dzieci w wieku szkolnym;
Badanie indywidualne lub grupowe;
W badaniach indywidualnych przewidziane są uzasadnienia odpowiedzi przez
dzieci;
Czas nieograniczony;
Obejmuje 192 zadania oparte na materiale obrazkowym, geometrycznym,
liczbowym i werbalnym;
Zadania wymagają uzupełniania trójelementowych klas lub serii czwartym
elementem, tworzenia ich na zasadzie analogii — dopasowanie do istniejącej
pary elementów drugiej pary na wzór pierwszej oraz mnożenia logicznego —
poszukiwania części wspólnych.

Wybrane testy inteligencji ogólnej i zdolności


 Testy Matryc Ravena — kilka wersji
Diagnozują inteligencję niezależną od doświadczenia, wykształcenia i
pochodzenia osoby badanej;
Sprawdzają zdolności spostrzegania i logicznego myślenia;
Przeznaczone do badan grupowych i indywidualnych;
Zadania mają postać wzorów (matryc) w których należy uzupełnić brakujący
element wzoru z podanych alternatywnych rozwiązań;
Zadania połączone są w serie;
Stopień trudności w serii rośnie.
 Skalę inteligencji D. Wechslera
Pierwsza wersja opracowana przez Davida Wechslera w 1939 roku;
Bateria testów werbalnych i niewerbalnych;
Możliwe obliczenie niewerbalnego i werbalnego ilorazu inteligencji oraz
wyniku łącznego.
 Baterie testów APIS-Z (młodzież szkoły średniej, studenci, dorośli) i
APIS-P (szkoła podstawowa, gimnazjum, początek szkoły
ponadgimnazjalnej), badające 4 typy zdolności:
Abstrakcyjno-logiczne (klasyfikacja, przekształcenia liczb);
Klasyfikacja — zadania, w których podano kilka nazw obiektów należących
do tej samej kategorii. Zadaniem badanego jest wybranie spośród pięciu
obiektów takiego, który należy do tej samej kategorii co obiekty podane np.:
pozycja testowa zawiera słowa: SŁOŃ, JEŻ, KROWA. Badany ma do
wyboru: WRÓBEL, KROKODYL, WEGARZ, MYSZ, ŻABA.
Przekształcenie liczb — zadania składające się z trzech par liczb — trzecia
para jest niepełna. W każdej parze druga liczba jest wynikiem pewnego
działania matematycznego na pierwszej.

Werbalne (synonimy, nowe słowa);


Synonimy — zadanie polega na dopisywaniu synonimów słów. Podana jest
pierwsza litera wyrazu bliskoznacznego oraz pewna liczba kropek
odpowiadająca liczbie jego liter.
(Przykład: kartofel — z)
Nowe słowa — zadaniem osoby badanej jest znalezienie początku wyrazu.

Wzrokowo – przestrzenne (kwadraty, klocki);


Kwadraty — każdą z figur należy przeciąć tak, aby po obróceniu powstałych
elementów ułożyć kwadrat.

Klocki — zadanie polega na zliczaniu prostopadłościennych klocków, z


jakich zbudowano przestrzenne konstrukcje.

Społeczne (zachowania, historyjki)


Zachowania — uzasadnienia norm społecznych.

Historyjki — układanie obrazków, by nadać sens całości.

Zastosowanie w selekcji kandydatów do pracy, w doradztwie zawodowym i


poradnictwie szkolnym.

Testy do pomiaru pojedynczych zdolności


Leksykon — ocena zasobu słownictwa; badania grupowe młodzieży w wieku
12-17lat; czas badania ograniczony; ocena mowy biernej i czynnej; zadania
zamknięte (odnajdywanie synonimów, uzupełnianie zdań podanymi wyrazami,
ustalanie nazw dla rzeczy zdefiniowanych znajdowanie typowych określeń
przymiotnikowych dla rzeczowników); zadania otwarte.

Kwestionariusze osobowości i temperamentu


Podlega na samoopisie;
Są rodzajem ustrukturowanego wywiadu;
Czasem opierają się na relacji na temat osób trzecich np., kwestionariusz
temperamentu EAS.

Inwentarze przeznaczone do diagnozy osobowości jako całości


 MMPI (Minnesota Muliphasic Personality Inventory)
Nową wersję MMPI-2 stosuje się przede wszystkim w diagnozie klinicznej do
oceny osobowości i zaburzeń psychicznych oraz obszarach nieklinicznych
(przesiewowe badania kandydatów do pracy, pobór wojskowy)
 EPQ-R
 NEO-FFI
 NEO-PI-R
 FCZ-KT
 Inwentarz Stanu i Cechy Lęki (STAI)
 Kwestionariusz do Badania Poczucia Kontroli (KBPK)
 Kwestionariusz do Radzenia Sobie w Sytuacjach Stresowych (CISS)
 Skał Agresji Buss Durkiewicz
 Kwestionariusz Nadziei Podstawowej BHI-12
 Wielowymiarowy Kwestionariusz Preferencji WKP

Zasady dostępu do testów psychologicznych


A - Dla psychologów; dla innych profesjonalistów (17 testów)
Wymagane kwalifikacje:
 Ukończone studia wyższe magisterskie lub podyplomowe na
kierunkach,n które przygotowują do pracy z ludźmi (nauki pedagogiczne,
społeczne i medyczne) – wymagane przedłożenie kopii dyplomu
 W przypadku psychoterapeutów – dowolne studia wyższe – wymagane
przedłożenie kopii dyplomu

Przykłady:
IZZA - Inwentarz Zachowań Zdrowotnych - lekarze, socjolodzy, pedagodzy,
promocja zdrowia, psychoterapeuci
JSRA - Jak Sobie Radzisz? - lekarze, socjolodzy, pedagodzy, promocja
zdrowia, psychoterapeuci
KMC - Kwestionariusz Metafory Czasu - badania naukowe
KNS - Kwestionariusz Nadziei na Sukces - pedagodzy, socjolodzy, lekarze,
promocja zdrowia, psychoterapeuci

B - Dla psychologów; dla innych profesjonalistów po ukończonym


szkoleniu/szkoleniach
B1 – Testy wymagające jedynie ukończenia ogólnego szkolenia z psychometrii
zakończonego egzaminem (8 testów)
Wymagane kwalifikacje:
 Ukończone studia wyższe magisterskie lub podyplomowe na kierunkach,
które przygotowują do pracy z ludźmi (nauki pedagogiczne, społeczne i
medyczne) – wymagane przedłożenie kopii dyplomu
 Posiadanie certyfikatu ukończenia szkolenia oraz zaliczenia egzaminu ze
szkolenia ogólnego z psychometrii wg programu zaakceptowanego przez
PTP

Przykłady:
KKSA - Kwestionariusz Kompetencji Społecznych - pedagodzy, specjaliści
HR, doradcy zawodowi
KPŻ - Kwestionariusz Postaw Życiowych - pedagodzy, socjolodzy, filozofowie
PROKOS - Profil Kompetencji Społecznych - pedagodzy, specjaliści HR,
doradcy zawodowi
SD - Skala Dyrektywności - socjolodzy, specjaliści HR, doradcy zawodowi
UMACL - Przymiotnikowa Skala Nastroju - lekarze, promocja zdrowia,
psychoterapeuci

B2 - Testy wymagające ukończenia ogólnego szkolenia z psychometrii


zakończonego egzaminem a następnie szkolenia z zakresu tego konkretnego
testu (lub grupy podobnych testów) (12 testów)
Wymagane kwalifikacje:
 Ukończone studia wyższe magisterskie lub podyplomowe na kierunkach,
które przygotowują do pracy z ludźmi (nauki pedagogiczne, społeczne i
medyczne) – wymagane przedłożenie kopii dyplomu
 Posiadanie certyfikatu ukończenia szkolenia oraz zaliczenia egzaminu ze
szkolenia ogólnego z psychometrii wg programu zaakceptowanego przez
PTP
 Ukończone szkolenie z zakresu konkretnego testu (lub grupy podobnych
testów) – wymagane przedłożenie certyfikatu ukończenia szkolenia

Przykłady:
CwP - Człowiek w Pracy - specjaliści HR, doradcy zawodowi
DINEMO - Dwuwymiarowy Inwentarz Inteligencji Emocjonalnej —
pedagodzy, specjaliści HR, doradcy zawodowi
DMI-2A - Diagnoza Możliwości Intelektualnych –pedagodzy
FROSTIG Test Rozwoju Percepcji Wzrokowej - pedagodzy

C – Tylko dla psychologów (30 testów)


Wymagane kwalifikacje:
 Ukończone studia magisterskie z psychologii – wymagane przedłożenie
kopii dyplomu
 Osoby, które mają tytuł doktora psychologii, a nie ukończyły studiów
psychologicznych, mogą kupować testy wyłącznie do celów naukowych
– wymagany dyplom doktorski wraz z oświadczeniem informującym, że
test będzie stosowany tylko do celów naukowych

Przykłady:
MMPI®-2 - Minnesocki Wielowymiarowy Inwentarz Osobowości®-2
MSEI - Wielowymiarowy Kwestionariusz Samooceny
NEO-FFI - Inwentarz Osobowości NEO-FFI
NEO-PI-R - Inwentarz Osobowości NEO-PI-R
OMNIBUS - Test Inteligencji Omnibus
Wykład 5
Klasyczna teoria rzetelności testów

Jest modelem matematycznym i konsekwencją teorii Spearmana (1904, 1907),


Guilforda (1936), Gulliksena (1950) oraz Lorda i Novicka (1968) – klasyczny
model wyniku prawdziwego

Została sformułowana na fundamencie podstawowych założeń czyli


aksjomatów - zdań, które w obrębie danej teorii uznaje się za prawdziwe i nie
weryfikuje

Właściwości modelowego świata nazywane są zmiennymi, a ich


charakterystyczne wartości to parametry

Rzetelność
 Niezawodność, dokładność (potoczne)
 Powtarzalność otrzymanych wyników – badanie tym samym testem,
badanie zestawami równoważnych zadań, badanie w różnych warunkach
 Parametr każdego narzędzia pomiarowego, określający względną
wielkość popełnianych błędów, czyli dokładność pomiaru
 Rzetelność testu wskazuje na zakres, w jakim różnice indywidualne
można przypisać „prawdziwym” różnicom w zakresie danej właściwości,
a w jakim – błędom losowym

Parametr
 Wielkość (liczba), która opisuje strukturę (tzw. rozkład) zmiennej w
teoretycznej populacji o liczebności nieskończenie wielkiej
 Parametry są wartościami tzw. oczekiwanymi i na podstawie założeń
teorii uznawane są za wielkości prawdziwe

Estymator
 Wielkość (liczba), która opisuje strukturę zmiennej w realnej
(empirycznej) zbiorowości o określonej liczebności
 Jeśli przyjmiemy, że zbiorowość została wylosowana z określonej
populacji oraz, że jej liczebność jest dostatecznie duża, to wtedy
nazywamy ją próbą reprezentatywną
 Estymator z próby reprezentatywnej dla populacji może stanowić
podstawę do przewidywania opisującego ją parametru
Oznaczenia najpopularniejszych parametrów i odpowiadających im
estymatorów

Miary rzetelności testu


 Pozwalają oszacować, jaką część ogólnej wariancji wyników stanowi
wariancja błędów
 Klasyfikowanie wariancji jako prawdziwej lub wariancji błędów zależy
od celu badania
Przykład:
 Badanie lęku jako stanu (fluktuacji nastroju) przez kilka kolejnych dni -
zmiany w wynikach testu są istotne z punktu widzenia celu badania i
stanowią część wariancji prawdziwej wyników
 Badanie lęku jako cechy – fluktuacje będą zakwalifikowane jako
wariancja błędu

Źródła błędu w pomiarze testowym


 Stosowanie testów psychologicznych wiąże się zawsze z błędami
pomiaru
 Błąd pomiaru pozwala przewidywać zakres zmienności wyniku
pojedynczej osoby na skutek czynników nie mających związku z celem
badania
o Błąd systematyczny – jest spowodowany stałymi cechami badanej osoby
lub narzędzia pomiarowego np. błąd tendencji centralnej, zakreślanie „nie
zgadzam się”, gdy ktoś nie rozumie pytania. Jeśli jest błędem narzędzia,
to ma znikome znaczenie, ponieważ powoduje przesunięcie wyników
wszystkich osób; w rozumieniu klasycznej teorii testów, nie wiąże się z
nierzetelnością testu, świadczy raczej o „inwalidacji” narzędzia
o Błędy losowe – sposób konstrukcji testu, sytuacja testowania oraz sposób
oceny wyników; są nieprzewidywalne, przypadkowe, powodują
obniżenie rzetelności pomiaru testem

Źródła błędów w pomiarze testowym


Model wyniku prawdziwego i jego założenia
Wynik prawdziwy — wynik hipotetycznego pomiaru, wskazujący na
rzeczywiste wartości danej cechy (T)

Wynik otrzymany (X) — wynik faktycznego pomiaru, który może być


obciążony błędem pomiaru (E)
X=T+E
Przykład: X=10, gdy T=8 i E=2 oraz, gdy T=120 i E=110

Podstawowe założenia klasycznej teorii rzetelności testów — definiują losowy


charakter błędu pomiaru
Założenie 1. O nieobciążoności narzędzia pomiarowego
Wszystkie błędy nieskończenie wielu badań mają rozkład normalny, a średnia
arytmetyczna nieskończenie wielu błędów losowych wynosi zero

μE = 0

Komentarz:
Z 1 Informuje nas o nieprzewidywalnym charakterze błędów pomiaru. Gdyby
można przeprowadzić nieskończenie wiele badań testem w identycznych
warunkach (co praktycznie nie jest możliwe), to część błędów byłaby dodatnia,
a część ujemna. Ich suma a zarazem średnia wyniosłaby zero – im większe
próby tym mniejszy błąd pomiaru.

Założenie 2. O niezależności
Nie ma związku pomiędzy błędami pomiaru a wynikami prawdziwymi

ρTE = 0

(korelacja między błędem pomiaru i wynikiem prawdziwym = 0)

Komentarz:
Założenie to definiuje błąd losowy jako niezwiązany z osobną badaną. Jeśli
błędy pomiaru nie zależą od wyników prawdziwych, to nie zależą również od
rzeczywistego nasilenia cechy, np. nieprawdą jest, że błąd jest większy dla osób
o wysokich wynikach prawdziwych niż o wynikach średnich.

Czyli:
σ x = σ2 T + σ2E
2

(wariancja wyników otrzymanych jest równa sumie wariancji wyników


prawdziwych i wariacji błędów)
Założenie 3. Nie ma związku pomiędzy błędami pomiaru

ρE1E2 = 0

Komentarz
Jeśli w jakikolwiek sposób moglibyśmy uzyskać dwa nieskończenie wielkie
zbiory błędów pomiaru, to nie wystąpi między nimi żadna zgodność. Mogą to
być błędy z pomiaru jednej osoby lub dwóch osób, przy zastosowaniu jednego
lub dwóch testów – nigdy jednak nie będą skorelowane
Za korelacjami wyników otrzymanych kryją się zatem korelacje nie błędów
pomiaru, ale korelacje wyników prawdziwych - korelują zatem ze sobą tylko
wyniki prawdziwe!!!!!.

Statystyczne podejście do problemu wyników prawdziwych i błędu pomiaru


Lorda i Novicka
Przyjmując opisane powyżej założenia co do natury wyniku prawdziwego i
błędu pomiaru oraz przekształcając aksjomaty Gulliksena, Lord i Novick
umożliwili empiryczne testowanie klasyfikacji testów według ich własności
psychometrycznych. Klasyfikacja ta dzieli testy na:
 równoległe (dla których średnie wyników otrzymanych i ich wariancje są
sobie równe oraz testy mają identyczną treść, co oznacza identyczność
wyników prawdziwych - testy mierzą to samo i z jednakową
dokładnością, z zatem ich korelacje powinny być bardzo wysokie,
ograniczone jedynie błędem pomiaru)
 testy równoważne (dla których wyniki prawdziwe i średnie wyników
otrzymanych są sobie równe, ale różne są wariancje - testy mierzą to
samo, choć nie z taką samą dokładnością)
 testy quasi-równoważne (dla których wyniki prawdziwe różnią się o
pewną stałą - testy mierzą systematycznie nieco różną treść).

Klasyfikacja testów ma znaczenie dla sposobu oszacowania rzetelności pomiaru


konkretnego testu – w większości przypadków korzystamy z założenia o
równoległości testów lub wręcz pozycji testowych.

Idea testu równoległego


1. Ma = Mb Średnia wyników otrzymanych w teście A równa się
średniej wyników otrzymanych w teście B
2. Sa = Sb Odchylenie standardowe wyników otrzymanych w teście
A równa się
3. , riaja = ribjb
4. , raZ = rbZ

You might also like