Download as pdf or txt
Download as pdf or txt
You are on page 1of 29

Metody statystyczne w psychologii

dr Aleksandra Gradowska
od szczegółu do ogółu

Działamy na
Dodatkowo
zasadzie
myślenia • Metodą małych kroków

indukcyjnego… I koniecznie

• Bardzo systematycznie(statystyki
zasady studiowania nie dotyczą!!!)
Zalecana literatura
• „Drogowskaz statystyczny 1”
S. Bedyńska, A. Brzezicka
Czym jest zmienna?
Zmienna Nazwa zmiennej w sposób

Płeć
pliku
sex
kodowania
1-M 2 K
Przykłady kodowania zmiennych,
Wiek age BRAK zakodowane w pliku all99
Stan cywilny marital 1.Małżonk

2.Wdowi

3.Rozwiedz

4.Separacja

5.Kawaler/panna

9. Brak danych

Liczba dzieci childs 1.jedno

2. dwoje

3.troje

4. czworo

5.pięcioro

6.sześcioro

7.siedmioro

8 i < ośmioro i
więcej
Skale pomiarowe
Skale pomiarowe
Skala
Ilorazowa
Skala Ilościowe
Skala
Przedziałowa

Skala
Porządkowa
Skala jakościowe
Skala
Nominalna

Rekodowanie,
Kategoryzacja

Z wyższej skali, tracąc dane, zrobicie niższą, ale z niższej nie zbudujecie wyższej!
Ostatnio- powtórka, bo bardzo ważne
• SKALE POMIAROWE

Skala nominalna / kategorialna Skala porządkowa/ rangowa

Pozwala odróżnić dwa obiekty (lub więcej) od siebie Pozwala uporządkować obiekty - od najmniejszego do
największego natężenia danej cechy
Kolor oczu - zielone, brązowe, niebieskie
Płeć - kobieta, mężczyzna Stopnie naukowe
Samochody w garażu - lamborghini, mercedes, porsche Lista największych hitów Michela Jacksona: “Bad” na I miejscu,
“Thriller” na II, na trzeciej pozycji “Smooth Criminal”

Skala przedziałowa Skala ilorazowa / stosunkowa

Pozwala na odróżnienie i uporządkowanie obiektów, a także Właściwości poprzednich skal + pozwala stwierdzić ile razy dany
informuje o wielkości różnic między osobami (o ile jednostek się pomiar jest większy/mniejszy od drugiego - posiada zero
różnią) bezwzględne

Ulubione filmy Woody’ego Allena uporządkowane w kolejności Wzrost (cm)


od “bardzo nie lubię” do “uwielbiam” Czas reakcji
np. Skala Likerta
Łączenie zbiorów Danych
Dane → Połącz dane → Dodaj obserwacje/Dodaj zmienne

DODAJ OBSERWACJE
DODAJ ZMIENNE
Dodawanie oberwacji
Dodawanie zmiennych

Jeżeli dołączamy odpowiedzi


(zmienne) do tych samych osób
musimy zwrócić uwagę aby zmienna
kluczowa (np. nr osoby badanej) były
ułożone w tej samej kolejności – np.
od najmniejszej do największej
Pierwsze analizy danych
średnia ……..

Miary tendencji
Mediana ……….
centralnej

Modalna wartość dominująca

Odchylenie pierwiastek kwadratowy z


STATYSTYKI Standardowe wariancji
OPISOWE Miary ( różnica pomiędzy najmniejszą i
Czyli liczbowe charakterystyki rozproszenia Rozstęp największą wartością w zbiorze danych
rozkładu wartości zmiennej.
miara rozproszenia
Wariancja
wyników wokół średniej
brak symetii względem rozkładu
Skośność normalnego, prawo albo lewoskośny
Miary symetrii
rozkładu miara zagęszczenia wyników wokół wartości
Kurtoza centralnej, gdy kurtoz >0, to wykres
lepokurtycznt, gdy <0, to platykurtyczny
Mediana [Me]
Mediana (Me)

• Wartość środkowa
• Jeśli uporządkujemy dane od wartości najmniejszej do
największej, to mediana jest tą wartością, która dzieli
rozkład na pół (odporna na wartości skrajne)

1,1,2,2,2,3,3,3] [3,4,4,4,5,5,6,7

Mediana = 3

• Możemy ją obliczać dla wszelkich skal poza nominalną


• W sytuacji, gdy zbiór zawiera nieparzystą liczbę elementów,
medianę oblicza się poprzez wyliczenie średniej arytmetycznej dla
dwóch środkowych wartości.

13
Dominanta / Modalna [Mo]
Modalna, dominanta (Mo)

• Wartość typowa, modna


• Jest to wartość występująca najczęściej, najbardziej typowa dla danego
zbioru

1,1,2,2,2,3,3,3,3,4,4,4,5,5,6,7

Dominanta (moda) = 3

• Możemy ją obliczać na dowolnej skali


• Rozkład może mieć kilka dominant (2: bimodalny, więcej –
wielomodalny).

14
Średnia Arytmetyczna [M]
Średnia (M)

• Obliczamy ją, sumując wartości wszystkich obserwacji i dzieląc tę


sumę przez liczbę obserwacji (bardzo wrażliwa na skrajne wyniki)

2,2,2,2,2 = 10/5 = 2

• Oznacza ona średni poziom cechy przypadający na jednostkę w danej


zbiorowości
• Nadaje się do porównań grup, populacji
• Oblicza się wyłącznie dla skal ilościowych
Mo Me M

nominalna ☺  

porządkowa ☺ ☺ 

Przedziałowa/ ☺ ☺ ☺
ilościowa
Kwantyle

Dzielą próbę na stosowne części:

• MEDIANA – dzieli rozkład na pół


• TERTYLE – dzielą rozkład na trzy części
• KWARTYLE – dzielą rozkład na cztery części
• KWINTYLE - dzielą rozkład na pięć części
• DECYLE - dzielą rozkład na dziesięć części

zajęcia 2 17
Np. kwartyle
Dzielą próbę na 4 części:
Kwartyl 3
Kwartyl 1

25% 25% 25% 25%

Kwartyl pierwszy: 25% badanej zbiorowości Kwartyl trzeci: 75% badanej zbiorowości
ma wartości mniejsze lub równe kwartylowi ma wartości mniejsze lub równe kwartylowi
pierwszy, a 75% ma wartości większe trzeciemu, a 25% ma wartości większe
lub równe kwartylowi pierwszemu. lub równe kwartylowi trzeciemu

zajęcia 2 18
Rozstęp
Rozstęp

• Wyznacza się go przez porównanie najwyższej i najniższej wartości.

1,1,2,2,2,3,3,3,3,4,4,4,5,5,6,7

Rozstęp = 6

20
Wariancja
Wariancja (SD )- utożsamiana ze zróżnicowaniem zbioru
2

• Miara rozproszenia wyników wokół średniej - suma


różnic pomiędzy wartościami obserwacji a średnią dla
całej grupy podniesiona do kwadratu i podzielona
przez liczbę obserwacji minus jeden.

• Im większa jej wartość, tym większe zróżnicowanie


badanej cechy

21
Wariancja i odchylenie standardowe
- trochę wzorów
Pierwsze analizy danych
średnia ……..

Miary tendencji
Mediana ……….
centralnej

Modalna wartość dominująca

Odchylenie pierwiastek kwadratowy z


STATYSTYKI Standardowe wariancji
OPISOWE Miary ( różnica pomiędzy najmniejszą i
Czyli liczbowe charakterystyki rozproszenia Rozstęp największą wartością w zbiorze danych
rozkładu wartości zmiennej.
miara rozproszenia
Wariancja
wyników wokół średniej
brak symetii względem rozkładu
Skośność normalnego, prawo albo lewoskośny
Miary symetrii
rozkładu miara zagęszczenia wyników wokół wartości
Kurtoza centralnej, gdy kurtoz >0, to wykres
lepokurtycznt, gdy <0, to platykurtyczny
Skośność
Skośność > 0 Skośność = 0 Skośność < 0

Rozkład prawoskośny – W Rozkład lewoskośny– W


zbiorze przeważają wartości zbiorze przeważają wartości
bardzo niskie bardzo wysokie
Mo<Me<M Mo>Me>M
Kurtoza
Wartość kurtozy powyżej 0 sugeruje
że rozkład jest Leptokurtyczny.
[większość wyników skupia się wokół
średniej, w zbiorze jest mało wartości
skrajnych]

Rozkład Normalny

Wartość kurtozy poniżej 0 sugeruje że


rozkład jest Platykurtyczny.
[w zbiorze przeważają wyniki skrajne
– bardzo wysokie i bardzo niskie]
Histogramy
• Na wykresie słupkowym wyświetlane są liczebności każdej odrębnej wartości lub kategorii w postaci
osobnego słupka, co umożliwia ich wizualne porównanie zmiennych.
• Histogram też zawiera słupki , ale są one tworzone wzdłuż skali o równych przedziałach.
• Wysokość każdego słupka histogramu odpowiada liczebności występowania wartości zmiennej
ilościowej wewnątrz przedziału.
• Histogram pokazuje: kształt, środek i rozrzut rozkładu
Analiza Częstośći
Analiza → Opis statystyczny → Częstośći

Kwartyle - dzielą cały zbiór


danych na 4 „równe części”.
Ile punktów podziału potrzeba ?

Percentyle – cały zbiór danych


równa się 100 percentyli.
Analiza częstośći c.d.
GSS93dane

• Ile było Kobiet [sex] a ilu mężczyzn?


• Jaki procent osób badanych stanowiły kobiety ?
• Jaki jest średni wiek osób badanych?
• Ile wynosi wartość mediany dla wieku?
• Jaki wiek występuje w zbiorze najczęściej?
• Jaki procent respondentów uważa, że ich życie jest nudne, a jaki
procent, że pasjonujące?
RAPORT Ważne + Braki Danych = Liczba
osób badanych Częstości – liczba odpowiedzi

Wążne - Wszystkie odpowiedzi


które wchodzą do analiz
Procent – procent z wszystkich
Braki danych - Wszystkie
odpowiedzi
odpowiedzi które nie wchodzą
do analiz
Procent Ważnych – procent
odpowiedzi nie uwgzlędniający
braków danych (100% to wszystkie
odpowiedzi bez Braków danych)

Procent Skumulowany – (istotne


dla zmiennych co najmniej
porządkowych !!)

Nudne = ?%

Pasjonujące = ?%
Analiza częstośći c.d.
GSS93dane

• Ile było Kobiet [sex] a ilu mężczyzn?


• Jaki procent osób badanych stanowiły kobiety ?
• Jaki jest średni wiek osób badanych?
• Ile wynosi wartość mediany dla wieku?
• Jaki wiek występuje w zbiorze najczęściej?
• Jaki procent respondentów uważa, że ich życie jest nudne, a jaki
procent, że pasjonujące?

You might also like