Professional Documents
Culture Documents
Statystyka Opisowa
Statystyka Opisowa
Statystyka Opisowa
RAZEM:
tryb stacjonarny
15 h
zaliczenie:
zaliczenie:
egzamin:
30 h
60 h
30 h
60 h
dwa testy
praca empiryczna
egzamin:
II
15 h
15 h
15 h
dwa testy
test umiejtnoci praktycznych
konwersatoria + laboratoria + wykady
RAZEM:
tryb niestacjonarny
14 h
6h
zaliczenie:
zaliczenie:
egzamin:
30 h
60 h
30 h
60 h
test teoretyczny
test praktyczny
egzamin:
II
10 h
14 h
6h
10 h
test teoretyczny
test praktyczny
Zmienne
Zmienna (variable)
waciwo przyjmujca rne
co najmniej dwie wartoci.
Podzia zmiennych
Ze wzgldu na wielko zbioru, z ktrego
przyjmuje wartoci:
Dwuwartociowe (dychotomiczne)
Trjwartociowe (trychotomiczne)
Wielowartociowe (politomiczne)
Podzia zmiennych
Niekiedy zmienna wielowartociowa
zostaje przez badacza zamieniona w
zmienn dwuwartociow np.
wielowartociowa zmienna wzrost
zostaje przeksztacona w zmienn wzrost
przyjmujc dwie wartoci: NISKI i
WYSOKI.
Tak zmienn okrelamy mianem
ZDYCHOTOMIZOWANEJ
Podzia zmiennych
Wyrniamy rwnie ZMIENNE CIGE i
ZMIENNE DYSKRETNE.
Dla zmiennych cigych w okrelonym
przedziale dozwolona jest kada moliwa
warto.
W zmiennych dyskretnych dozwolone s
tylko cile okrelone wartoci.
(np.Liczba posiadanych dzieci: 1, 2 , 3.)
Podzia zmiennych
Zmienna ZALENA zmienna bdca
przedmiotem naszych bada, ktrej
zwizki z innymi zmiennymi pragniemy
wyjani i opisa.
Zmienne, od ktrych zmienna zalena
zaley, ktre na ni oddziaywaj nosz
nazw zmiennych NIEZALENYCH
Podzia zmiennych
Zmienne manipulacyjne i klasyfikacyjne.
Zmienne klasyfikacyjne nie podlegaj
manipulacji badacza przyjmuj one
okrelone wartoci dla poszczeglnych
osb s niezalene od badacza.
Zmienne manipulacyjne przyjmuj rne
wartoci w zalenoci od decyzji badacza.
Podzia zmiennych
Zmienne jakociowe i ilociowe
Zmienne jakociowe nie przyjmuj
wartoci liczbowych: pe, zawd, typ
temperamentu.
Zmienne ilociowe pozwalaj na
przedstawienie ich wartoci w postaci
liczb: wiek, wzrost, rwnie wyniki
standaryzowanych testw
psychologicznych.
Podzia zmiennych
Zbir wartoci zmiennej moe by
zakwalifikowany do jednej ze skal
pomiarowych zdefiniowanych przez
Stevensa:
Skala nominalna
Skala porzdkowa
Skala interwaowa
Skala ilorazowa
Podzia zmiennych
Wszystkie zmienne wyraone na
skali ilorazowej s jednoczenie
zmiennymi wyraonymi na skali
interwaowej. Pakiet statystyczny
nie rozrnia tych dwch skal i w
ich miejsce wprowadza pojcie
skali ilociowej.
Opis zmiennej
Do podstawowego opisu statystycznego
zmiennych stosujemy:
warto przecitna
Ma zastosowanie TYLKO do skal
ilociowych (interwaowych i
ilorazowych)
rednia arytmetyczna
X
i
i 1
rednia arytmetyczna
rednia waona
Niekiedy stosujemy redni waon:
W oznacza wagi dla poszczeglnych
pomiarw
N
w X
i 1
N
w
i 1
rednia waona
Co oznacza:
w1 x1 w2 x2 ... wn xn
X
w1 w2 ... wn
W ten sposb dane ktrym przypisano
wiksze wagi maj wikszy udzia w
okreleniu redniej waonej ni dane, ktrym
przypisano mniejsze wagi.
Kwartyle i mediana
Kwartyle i mediana
Miary dyspersji
Identyczne rednie nie pokazuj nam
rnic w sytuacji materialnej badanych
osb. Dopiero MIARY DYSPERSJI
czyli rozproszenia pozwalaj na
waciw ocen poziomu dochodu w obu
grupach zawodowych.
Miary dyspersji
Najprostsz miar dyspersji jest
ROZSTP, czyli rnica midzy
maksymaln i minimaln wartoci w
grupie.
W naszym przykadzie minimalna warto
poziomu stresu wynosi 1, a warto
maksymalna 7. Rozstp jest rwny 7-1=6
Odchylenie wiartkowe
Inn miar opart na kwartylach jest
Q3 Q1 5,5 2,5
Q
1,5
2
2
Miary dyspersji
Zalet odchylenia wiartkowego jest
jego niewraliwo na skrajne wysokie i
niskie wyniki. Naley jednak pamita,
e ta miara zmiennoci wykorzystuje
jedynie 50 % wynikw.
Miary dyspersji
Kolejn miar jest ODCHYLENIE
REDNIE zwane rwnie
PRZECITNYM.
Jest to rednia arytmetyczna
bezwzgldnych odchyle pomiarw od
redniej arytmetycznej w prbie.
Odchylenie rednie
Odchylenie rednie
AD
21,08
1,62
13
Odchylenie rednie
Wprowadzenie wartoci bezwzgldne jest
konieczne, gdy w przeciwnym razie
licznik wyraenia wynosiby zawsze 0.
Jest to jedna z waciwoci redniej
arytmetycznej suma rnic
poszczeglnych pomiarw i redniej jest
zawsze rwna 0.
Odchylenie standardowe
Zamiast wprowadza wartoci
bezwzgldne mona podnie
poszczeglne rnice do kwadratu.
Procedura taka pozwala obliczy
najszerzej stosowan miar dyspersji
odchylenie standardowe.
Odchylenie standardowe
Odchylenie standardowe
Odchylenie standardowe w prbie
oblicza si ze wzoru:
(X X )
N 1
48,92
2,02
13 1
WARIANCJA
Kwadrat odchylenia standardowego to
WARIANCJA bdca najszerzej
stosowan miar zmiennoci zmiennej.
Wariancja w prbie okrelana jest
symbolem s2, natomiast wariancja w
populacji okrelana jest symbolem s2.
Symbole
W prbie
rednia
arytmetyczna
Odchylenie
standardowe
Wariancja
W populacji
s2
s2
Zmienno
Miar zrnicowania rozkadu cechy jest
s 2,02
v
0,52
x 3,92
Gdzie s to odchylenie standardowe w prbie, a
rednia w prbie.
x to
Zmienno
Dla danych porzdkowych stosowany jest
VQ
Me
1,5
0,38
4
Zmienno
Warto wspczynnika zmiennoci poniej
0,5 wiadczy o niewielkim zrnicowaniu,
wartoci z przedziau 0,5 1 wskazuj na
umiarkowane zrnicowanie, a wartoci
powyej 1 naley interpretowa jako due
zrnicowanie.
Warto pamita, i wspczynniki
zmiennoci podawane s czsto w postaci
procentw.
Skono
Rozkad symetryczny
Skono bliska 0
Skono
Rozkad
prawoskony
skono
dodatnia
Skono
Rozkad lewoskony
Skono ujemna
Skono
W rozkadzie PRAWOSKONYM rednia ley na PRAWO
od mediany, a wspczynnik skonoci ma warto
DODATNI
Skono
Wzr na wspczynnik skonoci:
x Me
Am 3
s
Momenty redniej
Inny sposb obliczania skonoci opiera
si na tzw. MOMENTACH REDNIEJ:
Pierwszy moment:
(X X )
m1
0
N
Drugi moment:
m2
(X X )
Momenty redniej
Trzeci moment:
m3
Czwarty moment:
m4
(X X )
(X X )
Momenty redniej
Skono
Skono w oparciu o momenty redniej
obliczamy wedug wzoru:
m
g1
m2 m2
6n(n 1)
SES
(n 2)(n 1)(n 3)
Skono
Bezwzgldna
warto
skonoci
dwukrotnie wiksza od swego bdu
standardowego jest wskanikiem
odejcia od symetrii rozkadu.
Naley pamita, e niesymetryczno
rozkadu
moe
by
wynikiem
niewaciwego doboru prby.
Skono
0,79
m3
g1
0,11
m2 m2 3,76 3,76
6n(n 1)
6 *13 *12
SES
0,62
(n 2)(n 1)(n 3)
11*14 *16
W naszym przykadzie bezwzgldna warto
skonoci NIE JEST dwukrotnie wiksza od swego
bdu standardowego. Rozkad nie jest skony.
Skono
Kurtoza
Kurtoza to miara stopnia koncentracji
obserwacji wok pozycji centralnej .
Dla rozkadu normalnego warto ta jest
zbliona do 0. (rozkad mezokurtyczny)
W sytuacji, gdy wyniki s bardziej
skupione wok redniej mwimy o
rozkadzie leptokurtycznym
(kurtoza>0), w przeciwnym razie rozkad
okrelamy mianem platykurtycznego
Kurtoza
Kurtoz obliczamy nastpujco:
m4
g2 2 3
m2
Bd standardowy kurtozy (SEK):
n2 1
SEK 2 * SES
(n 3)(n 5)
Kurtoza
Podobnie jak przy skonoci bezwzgldna
warto kurtozy dwukrotnie wiksza
Kurtoza
m4
27,88
g2 2 3
3 1,03
2
m2
(3,76)
n2 1
169 1
SEK 2 * SES
2 * 0,62
1,19
(n 3)(n 5)
10 *18
W naszym przykadzie bezwzgldna kurtozy NIE
JEST dwukrotnie wiksza od swego bdu
standardowego. Rozkad nie jest kurtyczny.
Kurtoza
Rozkad leptokurtyczny
Kurtoza > 0
Kurtoza < 0
Rozkad platykurtyczny wyniki s mniej
skoncentrowane wok punktu centralnego
warto kurtozy jest ujemna
Kurtoza
Naley zwrci uwag, i kurtoza nie jest
tosama z wariancj rozkady o takim
samym odchyleniu standardowym mog
si istotnie rni kurtycznoci.
Rozkad leptokurtyczny jest bardziej
smuky od normalnego, ma rwnie wyej
pooone ogony na kracach rozkadu.
Grupowanie, prezentacja
graficzna danych
Dokonano pomiaru wieku u 45 osb,
wyniki posortowano od najmniejszego do
najwikszego.
Wynik minimalny wynis 11 lat, a
maksymalny 58 lat.
Grupowanie, prezentacja
graficzna danych
Wiek
Czsto
Procent
Wiek
Czsto
Procent
Procent
skum
ulowa
ny
11
2,2
2,2
34
2,2
46,7
12
2,2
4,4
35
6,7
53,3
14
2,2
6,7
36
11,1
64,4
15
4,4
11,1
37
4,4
68,9
16
2,2
13,3
38
4,4
73,3
17
4,4
17,8
41
4,4
77,8
19
2,2
20
42
4,4
82,2
20
2,2
22,2
45
4,4
86,7
21
6,7
28,9
46
2,2
88,9
24
2,2
31,1
48
4,4
93,3
25
6,7
37,8
50
2,2
95,6
28
4,4
42,2
52
2,2
97,8
29
2,2
44,4
58
2,2
100
Ogem:
45
100
Procent
skum
ulowa
ny
Grupowanie, prezentacja
graficzna danych
k = 1 + 3,322 log n
n = 45 (liczba badanych)
log = logarytm przy podstawie 10 (liczy ten logarytm m.in. kalkulator w
akcesoriach w Windows)
k=6
Grupowanie, prezentacja
graficzna danych
3. Wyznaczamy szeroko przedziau (d)
d = R / k = 47/6 = 7,83
Wynik zaokrglamy w gr: d = 8
4. Granice przedziaw umieszcza si zwykle
w poowie jednostki pomiarowej, w naszym
przypadku dolna granica pierwszego
przedziau wyniesie 10,5 (pomiar wieku
zosta wykonany z dokadnoci do 1 roku)
Grupowanie, prezentacja
graficzna danych
skumulowane
granice przedziaw
n cum
% cum
17,78
10,5
18,5
17,78
18,5
26,5
20
17
37,78
26,5
34,5
8,89
21
46,67
34,5
42,5
16
35,56
37
82,22
42,5
50,5
13,33
43
95,56
50,5
58,5
4,44
45
100
suma
45
100
Histogram
Wykres supkowy
Wykres koowy