Statystyka Opisowa

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 81

Statystyka opisowa

Harmonogram zaj tryb stacjonarny


ROK

SEMESTR KONWERSATORIA LABORATORIA WYKADY

RAZEM:

tryb stacjonarny

15 h

zaliczenie:

zaliczenie:

egzamin:

30 h

60 h

30 h

60 h

dwa testy
praca empiryczna

egzamin:

II

15 h

konwersatoria + laboratoria + wykady

15 h

15 h

dwa testy
test umiejtnoci praktycznych
konwersatoria + laboratoria + wykady

Harmonogram zaj tryb niestacjonarny


ROK

SEMESTR KONWERSATORIA WICZENIA LABORATORIA WYKADY

RAZEM:

tryb niestacjonarny

14 h

6h

zaliczenie:

zaliczenie:

egzamin:

30 h

60 h

30 h

60 h

test teoretyczny
test praktyczny

egzamin:

II

10 h

konwersatoria + laboratoria + wykady

14 h

6h

10 h
test teoretyczny
test praktyczny

konwersatoria + laboratoria + wykady

Program IBM SPSS Statistics 22


W systemie USOS w zakadce Moduy
dodatkowe wybieramy opcj SPSS i
wypeniamy formularz zgoszeniowy.
Po zarejestrowaniu mona pobra wersj
instalacyjn programu (PS-IMAGO) oraz
klucz licencyjny na biecy rok.

Zmienne
Zmienna (variable)
waciwo przyjmujca rne
co najmniej dwie wartoci.

Podzia zmiennych
Ze wzgldu na wielko zbioru, z ktrego
przyjmuje wartoci:

Dwuwartociowe (dychotomiczne)
Trjwartociowe (trychotomiczne)
Wielowartociowe (politomiczne)

Podzia zmiennych
Niekiedy zmienna wielowartociowa
zostaje przez badacza zamieniona w
zmienn dwuwartociow np.
wielowartociowa zmienna wzrost
zostaje przeksztacona w zmienn wzrost
przyjmujc dwie wartoci: NISKI i
WYSOKI.
Tak zmienn okrelamy mianem

ZDYCHOTOMIZOWANEJ

Podzia zmiennych
Wyrniamy rwnie ZMIENNE CIGE i
ZMIENNE DYSKRETNE.
Dla zmiennych cigych w okrelonym
przedziale dozwolona jest kada moliwa
warto.
W zmiennych dyskretnych dozwolone s
tylko cile okrelone wartoci.
(np.Liczba posiadanych dzieci: 1, 2 , 3.)

Podzia zmiennych
Zmienna ZALENA zmienna bdca
przedmiotem naszych bada, ktrej
zwizki z innymi zmiennymi pragniemy
wyjani i opisa.
Zmienne, od ktrych zmienna zalena
zaley, ktre na ni oddziaywaj nosz
nazw zmiennych NIEZALENYCH

Podzia zmiennych
Zmienne manipulacyjne i klasyfikacyjne.
Zmienne klasyfikacyjne nie podlegaj
manipulacji badacza przyjmuj one
okrelone wartoci dla poszczeglnych
osb s niezalene od badacza.
Zmienne manipulacyjne przyjmuj rne
wartoci w zalenoci od decyzji badacza.

Podzia zmiennych
Zmienne jakociowe i ilociowe
Zmienne jakociowe nie przyjmuj
wartoci liczbowych: pe, zawd, typ
temperamentu.
Zmienne ilociowe pozwalaj na
przedstawienie ich wartoci w postaci
liczb: wiek, wzrost, rwnie wyniki
standaryzowanych testw
psychologicznych.

Podzia zmiennych
Zbir wartoci zmiennej moe by
zakwalifikowany do jednej ze skal
pomiarowych zdefiniowanych przez
Stevensa:
Skala nominalna
Skala porzdkowa
Skala interwaowa
Skala ilorazowa

Podzia zmiennych
Wszystkie zmienne wyraone na
skali ilorazowej s jednoczenie
zmiennymi wyraonymi na skali
interwaowej. Pakiet statystyczny
nie rozrnia tych dwch skal i w
ich miejsce wprowadza pojcie
skali ilociowej.

Opis zmiennej
Do podstawowego opisu statystycznego
zmiennych stosujemy:

- Miary tendencji centralnej


- Miary rozproszenia (dyspersji)

Miary tendencji centralnej


DOMINANTA
= WARTO MODALNA
= MODA (Mo)
Okrela warto NAJCZSTSZ w
danym zbiorze
Moe by stosowana dla skal
nominalnych, porzdkowych i ilociowych.

Miary tendencji centralnej

Miary tendencji centralnej


MEDIANA (Me)
Jest to Warto rodkowa w
uporzdkowanym wg wielkoci zbiorze
Moe by stosowana dla skal
porzdkowych i ilociowych.

Miary tendencji centralnej


MEDIANA (Me)
W przypadku gdy liczba elementw w
prbie jest nieparzysta mediana jest
wartoci zmiennej elementu rodkowego.
Gdy liczba elementw w prbie jest
parzysta, median wyznaczamy obliczajc
redni z wartoci zmiennej dwch
rodkowych elementw.

Miary tendencji centralnej

Miary tendencji centralnej


REDNIA ARYTMETYCZNA

warto przecitna
Ma zastosowanie TYLKO do skal
ilociowych (interwaowych i
ilorazowych)

rednia arytmetyczna

X
i
i 1

rednia arytmetyczna

rednia waona
Niekiedy stosujemy redni waon:
W oznacza wagi dla poszczeglnych
pomiarw
N

w X
i 1
N

w
i 1

rednia waona
Co oznacza:

w1 x1 w2 x2 ... wn xn
X
w1 w2 ... wn
W ten sposb dane ktrym przypisano
wiksze wagi maj wikszy udzia w
okreleniu redniej waonej ni dane, ktrym
przypisano mniejsze wagi.

Kwartyle i mediana

Kwartyle i mediana

Kwartyle, decyle, percentyle


KWARTYLE dziel uporzdkowan grup
na cztery rwne czci.
Niekiedy stosowane s rwnie DECYLE
dokonujce podziau na 10 czci, oraz
PERCENTYLE dzielce na 100 rwnych
czci po 1 %.

Miary tendencji centralnej a


rozproszenie
Badano poziom dochodw w dwch
grupach zawodowych grupie A i grupie B
otrzymano nastpujce wyniki:

Miary tendencji centralnej a


rozproszenie
Pomimo identycznych rednich
sytuacja pacowa w obu grupach jest
diametralnie rna. Demonstruj to
wykresy rozkadw rednich pac w
obu grupach:

Wykres dla grupy A

Wykres dla grupy B

Oba wykresy na jednej skali

Miary dyspersji
Identyczne rednie nie pokazuj nam
rnic w sytuacji materialnej badanych
osb. Dopiero MIARY DYSPERSJI
czyli rozproszenia pozwalaj na
waciw ocen poziomu dochodu w obu
grupach zawodowych.

Miary dyspersji
Najprostsz miar dyspersji jest
ROZSTP, czyli rnica midzy
maksymaln i minimaln wartoci w
grupie.
W naszym przykadzie minimalna warto
poziomu stresu wynosi 1, a warto
maksymalna 7. Rozstp jest rwny 7-1=6

Odchylenie wiartkowe
Inn miar opart na kwartylach jest

ODCHYLENIE WIARTKOWE (Q).


Q1 pierwszy kwartyl, Q3 - trzeci kwartyl

Q3 Q1 5,5 2,5
Q

1,5
2
2

Otrzymana warto pozwala stwierdzi,


e poowa pomiarw w prbie odchyla
si od mediany o 1,5 kategorii.

Miary dyspersji
Zalet odchylenia wiartkowego jest
jego niewraliwo na skrajne wysokie i
niskie wyniki. Naley jednak pamita,
e ta miara zmiennoci wykorzystuje
jedynie 50 % wynikw.

Miary dyspersji
Kolejn miar jest ODCHYLENIE
REDNIE zwane rwnie

PRZECITNYM.
Jest to rednia arytmetyczna
bezwzgldnych odchyle pomiarw od
redniej arytmetycznej w prbie.

Odchylenie rednie

Odchylenie rednie

AD

21,08

1,62
13

Odchylenie rednie
Wprowadzenie wartoci bezwzgldne jest
konieczne, gdy w przeciwnym razie
licznik wyraenia wynosiby zawsze 0.
Jest to jedna z waciwoci redniej
arytmetycznej suma rnic
poszczeglnych pomiarw i redniej jest
zawsze rwna 0.

Odchylenie standardowe
Zamiast wprowadza wartoci
bezwzgldne mona podnie
poszczeglne rnice do kwadratu.
Procedura taka pozwala obliczy
najszerzej stosowan miar dyspersji

odchylenie standardowe.

Odchylenie standardowe

Odchylenie standardowe
Odchylenie standardowe w prbie
oblicza si ze wzoru:

(X X )
N 1

48,92

2,02
13 1

WARIANCJA
Kwadrat odchylenia standardowego to
WARIANCJA bdca najszerzej
stosowan miar zmiennoci zmiennej.
Wariancja w prbie okrelana jest
symbolem s2, natomiast wariancja w
populacji okrelana jest symbolem s2.

Symbole
W prbie
rednia
arytmetyczna
Odchylenie
standardowe
Wariancja

W populacji

s2

s2

Zmienno
Miar zrnicowania rozkadu cechy jest

wspczynnik zmiennoci okrelony wzorem:

s 2,02
v
0,52
x 3,92
Gdzie s to odchylenie standardowe w prbie, a
rednia w prbie.

x to

Zmienno
Dla danych porzdkowych stosowany jest

pozycyjny wspczynnik zmiennoci


oparty na medianie i odchyleniu wiartkowym:

VQ

Me

1,5

0,38
4

Zmienno
Warto wspczynnika zmiennoci poniej
0,5 wiadczy o niewielkim zrnicowaniu,
wartoci z przedziau 0,5 1 wskazuj na
umiarkowane zrnicowanie, a wartoci
powyej 1 naley interpretowa jako due
zrnicowanie.
Warto pamita, i wspczynniki
zmiennoci podawane s czsto w postaci
procentw.

Skono

Rozkad symetryczny
Skono bliska 0

Skono
Rozkad
prawoskony
skono
dodatnia

Skono
Rozkad lewoskony
Skono ujemna

Skono
W rozkadzie PRAWOSKONYM rednia ley na PRAWO
od mediany, a wspczynnik skonoci ma warto
DODATNI

Skono
Wzr na wspczynnik skonoci:

x Me
Am 3
s

Momenty redniej
Inny sposb obliczania skonoci opiera
si na tzw. MOMENTACH REDNIEJ:
Pierwszy moment:
(X X )

m1
0
N
Drugi moment:

m2

(X X )

Momenty redniej
Trzeci moment:

m3
Czwarty moment:

m4

(X X )

(X X )

Momenty redniej

Skono
Skono w oparciu o momenty redniej
obliczamy wedug wzoru:
m

g1

m2 m2

Natomiast bd standardowy skonoci


(SES) szacujemy nastpujco:

6n(n 1)
SES
(n 2)(n 1)(n 3)

Skono
Bezwzgldna
warto
skonoci
dwukrotnie wiksza od swego bdu
standardowego jest wskanikiem
odejcia od symetrii rozkadu.
Naley pamita, e niesymetryczno
rozkadu
moe
by
wynikiem
niewaciwego doboru prby.

Skono
0,79
m3
g1

0,11
m2 m2 3,76 3,76
6n(n 1)
6 *13 *12
SES

0,62
(n 2)(n 1)(n 3)
11*14 *16
W naszym przykadzie bezwzgldna warto
skonoci NIE JEST dwukrotnie wiksza od swego
bdu standardowego. Rozkad nie jest skony.

Skono

Kurtoza
Kurtoza to miara stopnia koncentracji
obserwacji wok pozycji centralnej .
Dla rozkadu normalnego warto ta jest
zbliona do 0. (rozkad mezokurtyczny)
W sytuacji, gdy wyniki s bardziej
skupione wok redniej mwimy o

rozkadzie leptokurtycznym
(kurtoza>0), w przeciwnym razie rozkad
okrelamy mianem platykurtycznego

Kurtoza
Kurtoz obliczamy nastpujco:

m4
g2 2 3
m2
Bd standardowy kurtozy (SEK):
n2 1
SEK 2 * SES
(n 3)(n 5)

Kurtoza
Podobnie jak przy skonoci bezwzgldna
warto kurtozy dwukrotnie wiksza

od swego bdu standardowego


jest wskanikiem istnienia
kurtycznoci rozkadu. Oznacza to,
e rozkad jest kurtyczny wwczas,
gdy bezwzgldna warto kurtozy
jest wiksza od podwojonego
bdu standardowego.

Kurtoza
m4
27,88
g2 2 3
3 1,03
2
m2
(3,76)
n2 1
169 1
SEK 2 * SES
2 * 0,62
1,19
(n 3)(n 5)
10 *18
W naszym przykadzie bezwzgldna kurtozy NIE
JEST dwukrotnie wiksza od swego bdu
standardowego. Rozkad nie jest kurtyczny.

Kurtoza
Rozkad leptokurtyczny
Kurtoza > 0

Kurtoza < 0
Rozkad platykurtyczny wyniki s mniej
skoncentrowane wok punktu centralnego
warto kurtozy jest ujemna

Kurtoza
Naley zwrci uwag, i kurtoza nie jest
tosama z wariancj rozkady o takim
samym odchyleniu standardowym mog
si istotnie rni kurtycznoci.
Rozkad leptokurtyczny jest bardziej
smuky od normalnego, ma rwnie wyej
pooone ogony na kracach rozkadu.

Grupowanie, prezentacja
graficzna danych
Dokonano pomiaru wieku u 45 osb,
wyniki posortowano od najmniejszego do
najwikszego.
Wynik minimalny wynis 11 lat, a
maksymalny 58 lat.

Grupowanie, prezentacja
graficzna danych
Wiek

Czsto

Procent

Wiek

Czsto

Procent

Procent
skum
ulowa
ny

11

2,2

2,2

34

2,2

46,7

12

2,2

4,4

35

6,7

53,3

14

2,2

6,7

36

11,1

64,4

15

4,4

11,1

37

4,4

68,9

16

2,2

13,3

38

4,4

73,3

17

4,4

17,8

41

4,4

77,8

19

2,2

20

42

4,4

82,2

20

2,2

22,2

45

4,4

86,7

21

6,7

28,9

46

2,2

88,9

24

2,2

31,1

48

4,4

93,3

25

6,7

37,8

50

2,2

95,6

28

4,4

42,2

52

2,2

97,8

29

2,2

44,4

58

2,2

100

Ogem:

45

100

Procent
skum
ulowa
ny

Grupowanie, prezentacja
graficzna danych

1. Wyznaczamy rozstp (R)

R = Xmax Xmin = 58-11 = 47

2. Wyznaczamy liczb przedziaw (k)

k = 1 + 3,322 log n

n = 45 (liczba badanych)
log = logarytm przy podstawie 10 (liczy ten logarytm m.in. kalkulator w
akcesoriach w Windows)

k = 1 + 3,322 log 45 = 1 + (3,322 x 1,653) =


1 + 5,491 = 6,491

Zaokrglamy wynik do najbliszej liczby cakowitej:

k=6

Grupowanie, prezentacja
graficzna danych
3. Wyznaczamy szeroko przedziau (d)
d = R / k = 47/6 = 7,83
Wynik zaokrglamy w gr: d = 8
4. Granice przedziaw umieszcza si zwykle
w poowie jednostki pomiarowej, w naszym
przypadku dolna granica pierwszego
przedziau wyniesie 10,5 (pomiar wieku
zosta wykonany z dokadnoci do 1 roku)

Grupowanie, prezentacja
graficzna danych
skumulowane

granice przedziaw

n cum

% cum

17,78

10,5

18,5

17,78

18,5

26,5

20

17

37,78

26,5

34,5

8,89

21

46,67

34,5

42,5

16

35,56

37

82,22

42,5

50,5

13,33

43

95,56

50,5

58,5

4,44

45

100

suma

45

100

Histogram

Histogram i wielobok liczebnoci


czc ze sob rodki grnych bokw
histogramu otrzymujemy wielobok
liczebnoci. Pole powierzchni tej figury
jest rwne polu powierzchni kolumn
histogramu.

Wykres supkowy

Wykres koowy

Opis przy pomocy programu SPSS przykad.

Schemat opisu zmiennych

You might also like