Professional Documents
Culture Documents
Wykład 1 .Analiza Struktury
Wykład 1 .Analiza Struktury
I. PLANOWANIE BADANIA
Zbiorowość:
Jednostka statystyczna:
• Przykład 2.
Badamy czas rozwiązywania testu ze statystyki przez
studentów UE celem zdiagnozowania czasu
niezbędnego do rozwiązania całego testu.
Zbiorowość:
Jednostka statystyczna:
Zakres badania
A Gospodarka K 45 profesor
przestrzenna
B Architektura M 32 adiunkt
C Wzornictwo M 41 adiunkt
D Budownictwo M 52 profesor
E Grafika K 28 asystent
III. OPRACOWANIE I PREZENTACJA
MATERIAŁU STATYSTYCZNEGO
Wykresy statystyczne:
- wykres słupkowy
- histogram
- diagram
- wielobok liczebności
- krzywa liczebności.
SZEREGI STATYSTYCZNE
1. Szeregi szczegółowe xi ; 13, 20, 4, 5, 5, 7, 10, 9, 14, 5
(wyliczające)
2.Szeregi rozdzielcze Szereg rozdz. punktowy
(strukturalne) xi – cecha, ni – liczebność cechy
- dla cechy mierzalnej xi ni
(ilościowej) 2 3
* punktowe 3 3
* przedziałowe 8 2
-dla cechy niemierzalnej Szereg rozdzielczy przedziałowy
(jakościowej) xi ni
0-2 3
2-6 3
6-12 2
3. Szeregi czasowe ti - czas
(dynamiczne) yi - wartość badanej cechy
* momentów obrazują ti yi
poziom zjawiska dla 2006 50
wybranego punktu czasowego
( w dniu, o godzinie 2007 56
np.codzienny kurs walut) 2008 53
* okresów, poziom zjawiska 2009 60
za pewien okres (za rok, za
dany kwartał, za pierwsze
półrocze)
IV. OPIS I WNIOSKOWANIE STATYSTYCZNE
• Dane:
18 50 37 21 48 35 19 27 59 31
29 44 50 21 48 31 20 29 57 57
• Dane uporządkowane:
18 19 20 21 21 27 29 29 31 31 35
37 44 48 48 50 50 57 57 59
Rozkład wieku pracowników
wiek Liczba
zatrudnionych
18 1 2,5
19 1 2
20 1 1,5
21 2 1
27 1 0,5
29 2 0
31 2
35 1
Liczba zatrudnionych
37 1 18 19 20 21 27 29 31 35 37 44 48
44 1 50 57 59
48 2
50 2
57 2
59 1
Tabela 1.
Częstości absolutne, względne i procentowe
10
wiek ni wi w Sku 8
% mul 6
4
. wi
2
0-20 3 0,15 15 15 0
ni
45%
0-20 20-40 40-60
Liczebność względna (udział procentowy)
xi ni wi
1-3 10 10% lub 0,1
3-6 30 30%
6-9 40 40%
9-12 20 20%
suma 100
Miary
Przeciętne Koncentracji
Zróżnicowania Asymetrii
(średnie) Kurtoza
(rozproszenia)
współczynnik współczynnik
klasyczny γ3 pozycyjny AQ
(gamma 3)
-dominanta D -wariancja S2 -odchylenie <-1;1>
<-2;2>
ćwiartkowe Q
-kwartyle: -odchylenie
kwartyl pierwszy standardowe S -współczynnik
Q1 zmienności VQ
-współczynnik współczynnik skośności Pearsona
kwartyl drugi Q2 zmienności Vs
=Me As
kwartyl trzeci Q3 <-1;1>
ANALIZA STRUKTURY ZBIOROWOŚCI
Do opisu zbiorowości statystycznej służą parametry statystyczne.
Parametry dzielimy na:
- miary przeciętne
- miary zmienności
- miary asymetrii
- miary koncentracji.
MIARY POZIOMU PRZECIĘTNEGO
KLASYCZNE POZYCYJNE
x =
x
i 1
i
n
Średnia arytmet. dla szeregu rozdzielczego punktowego:
n
x =
xi ni
i 1
n
gdzie: n – suma liczebności ni
ni – liczebność i-tej wartości cechy.
Średnia arytmet. dla szeregu rozdzielczego przedziałowego:
n
= xˆ n
i 1
i i
x n
gdzie: n – suma liczebności ni ; ni – liczebność i-tej wartości
cechy;
xi^ środek i-tego przedziału.
Własności średniej arytmetycznej:
- jest wypadkową wartości wszystkich obserwacji z próby;
(x x ) =
i
i 0
n n
Dx D D 1
* xD
(n n ) (n n
D
D D 1 D
)
D 1
gdzie: xD – początek przedziału dominanty;
nD – liczebność przedziału dominanty;
nD-1 – liczebność przedziału poprzedzającego
przedział dominanty;
nD+1 – liczebność przedziału następnego po
przedziale dominanty;
Δ xD – rozpiętość przedziału dominanty.
Dominanta dla szeregu rozdzielczego przedziałowego
(przedziały klasowe nie są jednakowej rozpiętości):
wyliczamy gęstość : n
g i
i x i
0,25N cumni 1
Q1 = xQ1 + ΔxQ1
nQ1
0,75N cumni 1
Q3 = xQ3 + ΔxQ3
n Q3
MIARY ZMIENNOŚCI (zróżnicowania)
KLASYCZNE POZYCYJNE
- współczynnik zmienności VS
Wariancja dla szeregu wyliczającego:
N
(x) = xi x
2
S2 ( )
i 1
S2 (x) = xi x ni
(
i 1
) 2
N
Wariancja nie ma interpretacji merytorycznej.
Należy obliczyć pierwiastek z wariancji – czyli odchylenie
standardowe, które mówi o odchyleniu wartości badanej
cechy od wartości przeciętnej (średniej).
Vs (x) = S ( x) 100%
x
Współczynnik zmienności używany jest do porównań cech
statystycznych, zbiorowości.
2
Mierzy poziom zróżnicowania tylko części jednostek,
pozostałej po odrzuceniu 25% jednostek o wartościach
najmniejszych i 25% jednostek o wartościach największych.
Q
VQ (x) = 100%
Me
Typowy obszar zmienności:
To obszar w którym
miary klasyczne: mieści się około 67%
wszystkich jednostek
badanej zbiorowości
x S ( x) Xtyp x S ( x)
miary pozycyjne:
Me Q Xtyp Me Q
Jeżeli całą zbiorowość podzielimy według
określonych kryteriów na r grup , to wariancja
dla całej zbiorowości, tzw. wariancja ogólna,
będzie suma dwóch składników:
Wariancja
wewnątrzgrupowa
s s
S n xj x nj
2 2
j j
( )
j 1 j 1
( x) ( x j)
2 2
S j s S s
n
j 1
j n
j 1
j
Średnia
ogólna
MIARY ASYMETRII
KLASYCZNE POZYCYJNE
- Współczynnik 3
- Współczynnik Yuelle’a-
Kendall’a AQ
A 3 2 2 1
(Q Q ) (Q Q )
Q
3 2 2 1
M ( x)
<-2,2>
( x) 3
3
3
S ( x)
• Dla szeregu wyliczającego:
N
( xi
i 1
x )3
M3(x) = N
( xi
i 1
x ) 3 ni
M3 (x) = N
(x
ˆi
i 1
x ) 3 ni
M3 (x) =
N
• Jeżeli rozkład jest symetryczny to As = 0
• Jeżeli rozkład ma asymetrię lewostronną to AS<0
• Jeżeli rozkład ma asymetrię prawostronną to AS>0
( xi x )4
M4 = i 1
N
M4 =
xi x ni
(
i 1
) 4
N
• Dla szeregu rozdzielczego przedziałowego:
N
(x
ˆi x ) 4 ni
M4 = i 1
N
• Im wyższa wartość współczynnika skupienia, tym
krzywa liczebności jest bardziej wysmukła.
Oznacza to większe skupienie wartości cechy
wokół średniej. Małe wartości wsp. skupienia
wskazują na spłaszczenie rozkładu, a więc
mniejsze skupienie wartości cechy wokół średniej.
Kurtoza (eksces)
Koncentracja, rozumiana jako stopień skupienia poszczególnych jednostek zbiorowości ze
względu na badaną cechę zmienną wokół średniej arytmetycznej tej zmiennej, oznacza
deformację rozkładu w związku ze spłaszczeniem lub smukłością krzywej liczebności. Im
bardziej krzywa liczebności jest wysmukła, tym koncentracja (stopień skupienia) jest
silniejsza, a im bardziej krzywa liczebności jest spłaszczona, tym koncentracja (stopień
skupienia) jest słabsza.