Professional Documents
Culture Documents
Podstawy Psychometrii
Podstawy Psychometrii
Podstawy Psychometrii
Psychometria:
- psycho+ metro = mierzyć
- dziedzina obejmująca badania psychomertryczne
- psychometryczny – odnoszący się do pomiaru tego co jest psychiczne a więc odnoszący
się do badań różnych aspektów procesów psychicznych, w tym osobowości, inteligencji,
zdolności
- odnoszący się do kwestii zastosowania zasad matematycznych i statystycznych w
psychologii
Zmierzyć osobowość:
- zmierzyć – sprowadzić do liczby
- każdy człowiek jest wyjątkowy, nie da się do sprowadzić do zestawu liczb
Po co?
- diagnozować, porównywać, wybrać terapię
- przewidywać przyszłe wyniki, osiągnięcia i dokonywać selekcji
- rozwijać wiedzę, prowadzić badania naukowe
- Każdy pomiar jest tylko przybliżeniem, próbą uchwycenia rzeczywistości trudno
uchwytnej.
Etapy testu:
1. Tworzenie testu
2. Stosowanie testu w praktyce
3. Obliczanie wyników
4. Diagnoza
Co mierzą testy?
- Służą do rejestracji faktów psychologicznych z życia człowieka, informują o jego
zachowaniu przeszłym lub obecnym, typowym lub chwilowym
- Rejestrując różnice w zachowaniu ludzi oraz stałość czasową i sytuacyjną zachowania
danego człowieka
Rodzaje testów
• Podział wg sposobu badania, np. testy indywidualne – grupowe, słowne,
bezsłowne
• Podział wg rodzaju zadań
• Testy maksymalnego wykonania
• Kwestionariusze samoopisowe
• Skale obserwacyjne
Pomiar w psychologii
Proces przyporządkowania liczb (tzn. wyników testowych) osobom badanym w taki
sposób, aby mierzone testem właściwości psychologiczne tych osób były
odzwierciedlone przez własność liczb.
Dokładność instrumentów pomiarowych decyduje o tym, że pomiar jest dokonywany na
skalach pomiarowych o różnej „subtelności”
Skale pomiarowe:
nominalne
Wartości na tej skali nie mają oczywistego uporządkowania (np. nazwa miejscowości,
odpowiedź na pytanie tak/nie)
porządkowa
Wartości mają jasno określony porządek, ale nie są dane odległości między nimi,
możliwe są relacje porządku
przedziałowa - interwałowa
Różnice pomiędzy wartościami mają sensowną interpretację, ale ich iloraz nie, np. daty.
Ilorazowa - stosunkowa
Nie tylko różnice, ale także ilorazy wielkości mają interpretację. Wielkości na skali
ilorazowej można dodawać, dzielić, odejmować
Skale pomiarowe w testach psychologicznych
Zwykle w testach:
• odpowiedzi na jedną pozycję testową traktuje się jako pomiar na skali nominalnej
• wynik całego testy – na skali porządkowej
• wynik testu po normalizacji – na skali przedziałowej
Chociaż jednocześnie wielu badaczy uważa, że już:
• dla pozycji uzyskujemy pomiar na skali porządkowej
• dla testu – na skali przedziałowej
W psychologii zazwyczaj nie mamy możliwości pomiaru ilorazowego (wyjątkowo
rzadko – w odniesieniu do funkcji psychofizjologicznych).
Pomiar ilościowy
Rozkład wyników testu jest „normalny”, ale większość pozycji dostarcza danych
mierzonych na skali nominalnej.
Poprzez zsumowanie wyników pozycji, wynik ogólny testu odpowiada pomiarowi na
skali przedziałowej.
Błąd pomiaru
Prawidłowa odpowiedź na każdą z pozycji może być odgadnięta lub uzyskana losowo –
pomiar cechy za pomocą jednej pozycji jest obciążony dużym błędem (przypadkowości).
Mało prawdopodobne jest otrzymanie wysokiego wyniku wyłącznie na drodze
zgadywania (prawdopodobieństwo warunkowe wielu losowych sukcesów w przypadku
testu z 10 zadaniami wynosi 0,00098).
Współwystępowanie zachowań
Cecha jest własnością, która uzewnętrznia się w różnych zachowaniach
Współwystępowanie tych zachowań jest specyficzne wyłącznie dla danej cechy
Każda z form zachowania może być charakterystyczna dla wielu cech, ale ich
kombinacja jest specyficzna tylko dla danej cechy
Diagnoza, że dana osoba posiada daną cechę, jest trafna jedynie, gdy wykazuje wszystkie
zachowania, charakterystyczne dla tej cechy.
Każda z form zachowania informuje o specyficznym aspekcie cechy, wszystkie razem –
o cesze jako własności ogólnej.
Każda pozycja testowa bada specyficzną formę zachowania
Wynik ogólny w teście – ogólną tendencję (niespecyficzną, dla określonej sytuacji lub
formy zachowania).
Wariancja testu:
Uzyskanie dużego zróżnicowania wyników testu (wyrażonego w wariancji testu) jest
celem pomiaru różnicowego.
Wariancja testu jest równa sumie wariancji pozycji oraz ich podwojonych kowariancji
Zadanie 1 2 i
1 S2 1 C 1,2 C 1,i
2 C 2,1 s2 2 C 2,i
i C 1,i C 2,i s i2
Moc dyskryminacyjna
Stopień, w jakim dana pozycji testowa różnicuje badaną populację – umożliwia
różnicowanie między osobami z niskimi i wysokimi wynikami ( różnica w poziomie
poprawnych odpowiedzi na daną pozycję testową)
Pozwala ocenić na ile dana pozycja mierzy tę samą cechę, która jest mierzona przez cały
test.
Zwykle obliczana jako korelacja między pozycją testu a jego wynikiem ogólnym, z
wyłączeniem tej pozycji (niższa niż z jej uwzględnieniem)
Błąd pomiaru – nie istnieje pomiar bez błędu (w badaniach naukowych, w ocenach
prywatnych); Im większy błąd, tym mniejsza rzetelność pomiaru danym narzędziem.
Błąd obniża precyzję pomiaru cechy – w miejsce wyniku prawdziwego osoba badana
uzyskuje wynik zniekształcony przez błąd.
Źródła błędu pomiaru
• Konstrukcja testu, dobór specyficznych treści (samo sąsiedztwo może
nakierowywać na odpowiedzi)
• Czynniki związane z osobą badaną, np. obecność/ nieobecność w trakcie badania,
umiejętność nawiązywania kontaktu.
• Krótkotrwałe lub chwilowe czynniki indywidualne, np. stan zdrowia, stan
emocjonalny, zmęczenie, koncentracja uwagi, motywacja, lęk przed testowaniem.
• Czynniki sytuacyjne, np. obecność innych ludzi, hałas, temperatura.
• Sposób oceny wyników, np. niedokładne kryteria oceny wyników, błędy przy
zliczaniu wyników (źle przyłożony klucz)
X = T+E
• Założenie 1: ME = 0
• średnia błędów pomiaru jest równa zero
• wszystkie błędy, jakie otrzymalibyśmy badając tym testem tę samą osobę
nieskończenie wiele razy, mają rozkład normalny.
• Błąd w pomiarze testowym ma charakter losowy – mało przewidywalny
• Założenie o braku obciążenia narzędzia pomiarowego
• Założenie 2: rTE = 0
• wynik prawdziwy i błąd pomiaru nie są skorelowane
• Założenie o niezależności
• Założenie 3: r E1E2 = 0
• Błędy różnych pomiarów nie są skorelowane
• Skoro błąd pomiaru ma charakter losowy, to nie ma związku między błędami
otrzymanymi w dwóch kolejnych badaniach
• Twierdzenie 2: MX = MT+ME = Mr
• średnia wyników otrzymanych jest równa średniej wyników prawdziwych
testu.
• Średnia wyników otrzymanych nie jest zniekształcona przez błąd, bo ME=0
• Twierdzenie 3: Sx2 = Sr2+SE2
• wariancja (zmienność) wyników otrzymanych jest równa sumie wariancji
wyników prawdziwych oraz wariancji błędu (Sx2 = Sr2+SE2 = 2covTE).
• Nie ma kowariancji pomiędzy wynikami prawdziwymi oraz błędem
(założenie 2)
• Wariancja wyników otrzymanych jest zniekształcona przez błąd
• Twierdzenie 4:
• rtt= ST2/ Sx2 lub rtt = 1 – SE2/ Sx2
• Rzetelność pomiaru testem to stosunek wariancji wyniku prawdziwego do
wariancji wyniku otrzymanego
• lub stosunek wariancji błędu do wariancji wyników otrzymanych
odejmowany od jedności
• Współczynnik rzetelności wskazuje na zakres w jakim różnice indywidualne
w wynikach testowych można przypisać prawdziwym różnicom w zakresie
badanej cechy, a w jakim – błędem losowym. Współczynnik rzetelności waha
się od 0 do 1.
Rzetelność testu:
rtt = rx1x2
• korzystając z założeń klasycznej teorii testów można przekształcić wzór na
rzetelność pomiaru
• Estymacja rzetelności – korelacja wyników otrzymanych przez tę samą grupę
osób w dwukrotnym badaniu tym samym testem.
• Twierdzenie 5:
SEM = Sx
• Standardowy błąd pomiaru wyniku otrzymanego (SEM)
• Jest to odchylenie standardowe rozkładu wyników badania danej osoby
nieskończenie wiele razy lub badania danej osoby nieskończoną liczbą testów
równoległych (granice w jakich może lokować się faktyczny wynik osoby
badanej)
• Średnia tego rozkłady stanowi wynik prawdziwy, a odchylenie standardowe –
standardowy błąd pomiaru
SEM a SEE
• Lord i Novick zaproponowali inne niż Guliksen rozumienie SEM - SEE
• Standardowy błąd estymacji (SEE) wyniku otrzymanego, który jest zależny od
wyniku prawdziwego.
• Ma rozkład symetryczny wokół estymowanego wyniku prawdziwego i
niesymetryczny wokół wyniku otrzymanego ( jest symetryczny dla wyników
średnich i skośny dla wyników skrajnych)
• W praktyce bardziej zachowawcze jest stosowanie SEM a różnica jest niewielka:
SEE = SEM
2. Metoda wersji równoległych testów – badanie tej samej grupy osób dwoma różnymi
wersjami tego samego testu
• wersje równoległe – narzędzia badające dokładnie to samo i w ten sam sposób ale
treści pozycji są inne
→ równoważność i trudność pozycji
→ służą do porównywania wyników osiągniętych przez te same osoby w dwóch
pomiarach
• Idea testu równoległego – spełnienie 4 kryteriów:
• równe średnie wyników otrzymanych dla obu wersji
• równe odchylenia standardowe
• te same interkorelacje pozycji
• takie same korelacje wyników otrzymanych z zewnętrznym kryterium
• miara rzetelności: współczynnik korelacji oby testów równoległych –
równoważność międzytestowa
• szacowanie stabilności względnej – możliwość badania z przerwą czasową; dwa
testy równoległe
5. Zgodność ocen sędziów – stopień zgodności pomiędzy dwoma lub więcej ocenami
przypisanymi przez sędziów kompetentnych
• stosowana rzadko, zazwyczaj w przypadku narzędzi gdzie odpowiedzi osoby
badanej podlegają swobodnej ocenie diagnosty
• źródło wariancji błędu: niedostatki pracy diagnosty lub klucza
• w celu oceny zgodności kilku zestawów ocen tego samego materiału oblicza się
różne współczynniki zgodności sędziów:
• procent zgodności sędziów
• proporcja zgodnych kategoryzacji Holstiego
• Pi Scotta
• Kappa Cohena
• Alfa Kripendorfa
• W Kendalla
Trafność kryterialna
Wyznaczana przez stopień zgodności dwóch pomiarów:
• wyników testowych
• zmiennej kryterialnej (zewnętrznego kryterium)
Miarą trafności kryterialnej – korelacja między kryterium (istniejącym teraz bądź w
przyszłości) a wynikami testu.
Kryterium
Jest to zachowanie czy właściwość, o której chcemy wnioskować z wyniku ocenianego
testu.
Kryterium jest zewnętrzne w stosunku do testu.
Jest pomiarem innej zmiennej niż ta, którą mierzy test.
Przykłady: efektywność pracy zawodowej, stopnie szkolne, diagnoza psychiatryczna lub
psychologiczna, oceny sędziów, miary psychofizjologiczne, wyniki innych testów.
Trafność kryterialna:
Kryterium musi być rzetelne i trafne raz adekwatne z punktu widzenia tego, co mierzy
test.
Problem kontaminacji („skażenia”) kryterium – np. sędzia oceniający wynik osoby
badanej w kryterium zna jej wynik w teście.
Wyniki testowe nie mogą pływać na pozycję jednostki w zakresie badanego kryterium.
Trafność prognostyczna
Kryterium jest pomiar zachowania mającego wystąpić w przyszłości u osoby badanej.
Ważna, gdy chcemy przewidywać jakieś wyniki.
Trafność diagnostyczna
Kryterium jest pomiar zachowania aktualnego u osoby badanej.
Trafność teoretyczna
Stopień, w jakim test mierzy założony konstrukt teoretyczny.
Nazwa narzędzia wcale nie musi być jednoznaczna z tym, co to narzędzie mierzy.
Popularność danego narzędzia również nie gwarantuje trafności.
Powinno się stosować wiele różnych oszacowań tego typu trafności. Nie istnieje jedno
oszacowanie trafności teoretycznej, takie jak np. współczynnik korelacji.
Trafność fasadowa:
Jak test jest postrzegany przez osoby badane – co test wydaje się mierzyć.
Osoba badana wierzy, że test rzeczywiście mierzy to, co jej się wydaje.
Trafność fasadowa powiązana jest z motywacją badanych.
Nie jest to prawdziwy rodzaj trafności, a raczej sposób, w jaki badani reagują na test.
Analiza czynnikowa:
EFA – empiryczna klasyfikacja pozycji
CFA – porównanie modelu teoretycznego danych – analiza dobroci dopasowania modelu
do struktury danych testowych.
Konfirmacyjna analiza czynnikowa
Testowanie hipotez wyprowadzonych z teorii zjawiska wskazujących, że dana zmienna
ukryta jest wyrażona przez określony zestaw zmiennych obserwowalnych. Testujemy
kilka modeli i wybieramy ten, który najlepiej pasuje do danych.
Możliwość porównania różnych modeli (możemy budować modele alternatywne).
Jest rodzajem równań strukturalnych.
Zmienna obserwowalna 1
Zmienna obserwowalna 2
• Modele strukturalne
Inne zmienne latentne mają wpływ na inne zmienne latentne – oznacza to, że nie
mierzymy ich wprost.
Po co potrzebne są normy?
Jak ocenić czy uzyskany wynik testowy jest wysoki czy niski?
Jak porównać dwa wyniki tekstowe? O ile się różnią.
NORMY
Norma empiryczna
Jest to sposób określania podobieństwa osób badanych do grup odniesienia
Standard ilościowy, wyznaczony przez liczbę osób uzyskujących dane wyniki lub przez
średnią, medianę, czy inną miarę tendencji centralnej obliczoną dla przedstawicieli danej
grupy.
Normy:
• Normy równoważnikowe:
• Normy rozwojowe – pozwalają określić jak daleko na drodze normalnego
rozwoju znajduje się dana osoba
Pokazują opóźnienie lub przyśpieszenie w stosunku do rówieśników
Tzw. równoważniki: wieku, klasy
Równoważniki wieku – liczby lat i miesięcy odpowiadające średniemu poziomowi
wykonania testu na danym poziomie rozwoju.
Wiek umysłowy – poziom, z którego zadania udało się dziecku rozwiązać:
• spopularyzowane przez Bineta i Simona
• zadania łączone w grupy odpowiadające poziomowi wieku
• szacowany na podstawie średniego wyniku w grupie wiekowej.
Równoważnik klas szkolnych – liczby wskazujące na rok i miesiąc nauczania w roku
szkolnym odpowiadającym średniej dla dzieci na danym poziomie rozwoju
Można je testować tylko w odniesieniu do przedmiotów, które są nauczane rzez całą
szkołę (a takich jest mało).
Krytyka norm równoważnikowych
Zakładają związek liniowy między mierzoną właściwością a wiekiem, co jest niezgodne
z prawdą.
Normy te mogą być niejasne – uważane za opis zakresu wymagań
Nie można porównywać wyników osób w różnych obszarach, np. wiek umysłowy 8 lat
nie oznacza, że dziecko zachowuje się jak 8-latek pod względem funkcjonowania
społecznego.
• Normy typu rangowego
• Centyle:
Jaki procent ma wyniki niższe od uzyskanego
Określają względne położenie osoby w grupie standaryzacyjnej
Mają rozkład prostokątny (każdy wynik jest jednakowo podobny).
Jest skalą typu rangowego, więc odnosi się do Mediany = 50.
Liczba jednostek skali = 101 <0; 100>
Skok skali = 1 centyl (1% wyników, tylko centyle krańcowe 0 i 100 obejmują po 0,5%
obserwacji)
Krytyka norm centylowych
Skala centylowa nie odzwierciedla kształtu rozkładu – wszystkie wartości zmiennej mają
jednakowe prawdopodobieństwo
Prowadzi do przecenienia wielkości różnic pośrodku, a niedoceniania ich na krańcach
rozkładu.
Oddaje dobrze uporządkowanie osób na skali, ale nie oddaje względnych różnic między
nimi.
• Normy typu standardowego
Sposób tworzenia skal standardowych
Jeśli rozkład wyników testu jest rozkładem normalnym, wyniki surowe przekształca się
na wyniki standardowe „Z”
z = x – odchylenie standardowe / SD
Jeśli rozkład nie jest normalny – wymaga wcześniej przekształcenia.
• Skala jednostek znormalizowanych „z”
Rozkład po transformacji wyników surowych jest normalny (ciągły)
średnia = 0
SD = 1
Skok w skali = praktycznie = 1.0
Różnicowanie = dowolny zakres
Przeznaczenie - skala podstawowa, stanowiąca punkt wyjścia do transformacji wyników
surowych na inne skale znormalizowane.
Interpretacja wyników skali „z” - 2 i poniżej – b. niskie.
Skala „z” jest nieco kłopotliwa, dlatego używa się innych skal, tzw. skal
niestandardowych.
• Skala Tenowa
zakres od -5 do +5 S skali „z”
101 jednostek (0 do 100 punktów).
M = 50
SD =10
• Skala ilorazów inteligencji IQ
Skok skali = 1/15 odchylenia standardowego jednostek znormalizowanych.
Zakres od -6 do +6 S skali „z”; 201 jednostek IQ <0;200>
• Skala staninowa
Zakres od -2 do +2 S skali „z”
9 jednostek (1 do 9 pkt)
M =5, SD = 2
Skok skali = 1 stanin (0,5 odchylenia standardowego jednostek znormalizowanych).
• Skala stenowa
Zakres <-2,25; 2,25> SD skali „z”
10 jednostek (1; 10pkt)
Skok skali = 1 sten (0,5 odchylenia standardowego jednostek znormalizowanych „z”).
Skala stenowa to przekształcenie wyników standaryzowanych „z” w odniesieniu do
grupy normalizacyjnej.
Próba normalizacyjna
• Normy ogólnokrajowe
• stosowane we wszystkich typach testów
• umożliwiają porównywanie z wynikami reprezentującymi populację
• nie zawsze są potrzebne, czasem bardziej interesujące jest to, jak osoba
wypada na tle konkretnej grupy
• Normy lokalne
• odwołują się do wyników w konkretnych grupach
• są wykorzystywane do realizacji jasno określonych i zdefiniowanych celów
• np. średnie wyniki z danego przedmiotu na danym roczniku studiów
Konstruowanie testu
Pozycja testowa
Sformalizowany wskaźnik danej cechy psychologicznej. Zawiera 2 elementy:
• Zadanie opisujące określone zachowanie (lub zadanie wyzwalające określone
zachowanie)
• Skala rejestrująca to zachowanie (opcje odpowiedzi o określonym formacie oraz
reguła przekształcania odpowiedzi w wynik liczbowy)
Tworzenie pozycji:
• Poszukiwanie takich zachowań i sytuacji, które występują w życiu określonej
grupy osób badanych
• Wymaga wyrażenia wskaźników teoretycznych w „języku” naturalnych
zachowań i sytuacji
• Wymaga przełożenia terminów psychologicznych na język, którym posługują się
osoby badane.
Źródła pozycji
• Zapożyczenia z innych narzędzi, testy zdolności – typowe dla strategii
zewnętrznej
• Poszukiwanie „naturalnych” banków pozycji (zasoby słownikowe, listy
przymiotnikowe – typowe dla strategii indukcyjnej)
• Tworzenie nowych pozycji przez profesjonalistów lub nieprofesjonalistów –
typowe dla strategii teoretycznej lub łączonej.
Format odpowiedzi:
• odpowiedzi dwukategorialne Tak/Nie
• Odpowiedzi wieokategoriwalne Zdecydowanie zgadzam się/ Zgadzam się/ Nie
zgadzam się/ Zdecydowanie zgadzam się
• Opcja centralna – czy powinna być
• szerokość formatu odpowiedzi.
• zakotwiczenie
5. Badania pilotażowe
• przeprowadzenie badania wstępnego przy użyciu konstruowanego narzędzia
• Liczebność: zwykle 5-10 osób na jedną pozycję testową
• Maksymalne zróżnicowanie demograficzne: płeć, wiek, wykształcenie, zawód,
miejsce zamieszkania
• Skład próby uzależniony jest od celu stosowania narzędzia.
Testy a kultura:
• Testy (inteligencji) mierzą zdolności decydujące o sukcesie w tej kulturze, w
której zostały stworzone
• Różnice w wynikach testu w różnych kulturach mogą pochodzić nie tyle z
samych cech, ale z właściwości narzędzia pomiaru
• Czy konstrukty takie jak agresja, asertywność, potrzeba osiągnięć, depresja mają
tę samą treść w różnych kulturach.
Aspekty kultury
Rozróżnienie w lingwistyce – podejście:
• fonemiczne – skupione na dźwiękach charakterystycznych dla danego języka
• fonetyczne – skupione na uniwersalnych aspektach języka
Rozróżnienie w odniesieniu do kultury:
• emic – aspekty odnoszące się do jednej kultury, pojęcia, kategorie lokalne
• etic – uniwersalne, wspólne dla różnych kultur
Kulturowa adaptacja testu:
• Przystosowanie wersji oryginalnej testu do innej specyfiki kulturowej
• Konieczność wprowadzenia specjalnych procedur przystosowujących
• decentrujących – uniwersalizujących
• lub centrujących na kulturze adaptacji
• Stosowanie narzędzia bez jego adaptacji kulturowej prowadzi do stronniczości
lub faworyzacji kultury.
Procedura tłumaczenia:
• Przygotowanie kilku niezależnych tłumaczeń,
• Jeśli istnieją inne wersje językowe testu (np. francuska, niemiecka w przypadku
testu pierwotnie opracowanego w języku angielskim) należy dokonać tłumaczeń z
tych języków.
• Uzgodnienie wersji polskiej.
• Dokonanie tłumaczeniu zwrotnego lub inna procedura.
• Dokonanie poprawy wersji polskiej
• Ocena wersji polskiej przez psychologów i przedstawicieli grupy, dla której test
jest przeznaczony.
Porównania międzykulturowe:
• Różnice między średnimi dla osób pochodzących z różnych kultur (grup) mogą
wskazywać na:
• różnice w składzie badanej populacji
• różnica w znaczeniu pytań i psychometrycznych właściwościach skali
• różnice w faktycznym poziome cech
• Konieczność opracowana norm dla adaptowanej wersji testu.
• Bez stwierdzenia równoważności psychometrycznej metod nie może
porównywać średnich dla grup.
• Wtedy możliwe tylko analizy jakościowe, bez możliwości porównań ilościowych.
Rozdział 3, art13.
Psycholog informuje klienta o celu postępowania, jego przebiegu i wynikach, powinien
również uzyskać zgodę osoby badanej.
Art 14.
1. psycholog ma bowiązek zachowania w tajemnicy informacji związanych z klientem,
uzyskanych w związku z wykonywanie zawodu
2. Obowiązek zachowania tajemnicy zawodowej nie może być ograniczony w czasie
3. Przepis ust.1 nie stosuje się, gdy: poważnie jest zagrożone zdrowie, życie klienta lub
innych osób, bądź tak stanowią ustawy.
Rozdz. 3. art.16 Tworzy się Komisja Ekspertów do realizacji zadań zawartych w art. 17
ust. 3. art 18 ust 3 i art 19 ust 1.
Komisja Ekspertów ustala i aktualizuje listę metod i narzędzi psychologicznych
zastrzeżonych wyłącznie do stosowania przez psychologów.
Krajowa Rada Psychologów sprawuje nadzór i takie tam.
Inne regulacje
• APA style
• Deklaracja zasad etyczno - zawodowych.
Cechy prawdziwego testu: musi mieć autora, to nie tylko materiał testwy, ale także
podręcznik, materiał testowy ma ściśle określoną postać, test jest niedostępny dla osób
niekompetentnych, test jest rozpowszechniany w określone sposób.
Dotychczasowe rozwiązania
Serie niezależnych badań w różnych kulturach.
Ilościowe analizy porównawcze bez psychometrycznego testowania równoważności
narzędzi. Założenie, że stosowane metody mierzą ten sam konstrukt w różnych kulturach,
a bład pomiaru jest na tyle niewieli, ze moze byc uwzględniony w analizie.