Professional Documents
Culture Documents
Wykład 1
Wykład 1
Wykład 1
Pojęcia podstawowe
TYP ZMIENNEJ
…… …… …… ……
…… …… …… ……
Szereg rozdzielczy
R xmax xmin
Ilość klas k jest uzależniona od n i najczęściej ustala się ją za
pomocą wzorów:
k n.
Szereg rozdzielczy
R
b
k
Szereg rozdzielczy
ac
xi
2
Wskaźnik struktury
ni
wi
n
Wskaźnik struktury
nisk
wisk , i 1,2,3,..., k
n
Wskaźnik struktury
gdzie:
nisk –liczba jednostek, których cechy
odpowiadają wartościom nie większym niż xi.
Szereg rozdzielczy przykład
R=478-360=118
K=7 (można ustalić inną liczbę klas, np. 6 lub 8)
b= R 118 16,8... 17
k 7
x1 360 0,5 359,5
Przykład wyglądu szeregu
Dystrybuanta empiryczna –
przyporządkowanie kolejnym wartościom
cechy statystycznej odpowiadającym im
częstości skumulowanych (liczebności
skumulowanych).
Graficzna prezentacja szeregu (histogram)
Histogram
14
12
10
8
6
4
2
0
Graficzna prezentacja szeregu (krzywa częstości)
0 ,3 5
0 ,3
0 ,2 5
0 ,2
0 ,1 5
0 ,1
0 ,0 5
0
368 385 402 419 436 453 470
Graficzna prezentacja wyników
360-377
9,5 2,4
7,1 377-394
4,8
394-411
23,8
23,8 411-428
428-445
28,6 445-462
462-479
MIARY PRZECIĘTNE (ŚREDNIE)
Średnia arytmetyczna:
Niech pomiary x1,...,xn będą wynikami badanej cechy w n-
elementowej próbie.
Średnią arytmetyczną liczb x1,...,xn nazywamy liczbę określoną
wzorem:
1 1 n
x xi ( x1 ... xn )
n i 1 n
MIARY PRZECIĘTNE (ŚREDNIE)
1 k
x
n
i
x i
i 1
n
Uwagi o średniej
400 600
500
2
Uwagi o średniej
60000
xA 150
400
60000
xB 100
600
Uwagi o średniej
120000
śr 480
150 100
MIARY PRZECIĘTNE (ŚREDNIE)
Średnia harmoniczna:
Średnią harmoniczną dla różnych od 0 liczb x1,...,xn nazywamy
odwrotność średniej arytmetycznej odwrotności tych liczb:
1
1 n
1 n
1
h
n xi
;
xi
0
i 1 i 1
MIARY PRZECIĘTNE (ŚREDNIE)
1
1 ni k
h
n i 1 x i
MIARY PRZECIĘTNE (ŚREDNIE)
Średnia geometryczna:
Średnią geometryczną dodatnich liczb x1,...xn nazywamy
następujące wyrażenie:
n
g n
x
i 1
i ( x1 ... xn )
n
Miary przeciętne (średnie)
n n1 nk
g x 1 ... x k
nl nl 1
D mo xl b
(nl nl 1 ) (nl nl 1 )
Miary pozycyjne (moda)
gdzie:
xl - dolna granica klasy, w której jest moda,
l - numer tej klasy,
nl-1,nl+1 - liczebności klas sąsiednich,
nl - liczebność klasy z modą,
b - długość klasy.
Miary pozycyjne (moda wyznaczanie graficzne)
m0-moda
x( n 1) / 2 n nieparzyste
me 1
2 ( x n / 2 x ( n / 2 ) 1 ) n parzyste
Miary pozycyjne (mediana)
b n m 1
me xl ( ni )
nm 2 i 1
Miary pozycyjne (mediana)
gdzie:
xl - dolna granica klasy wyznaczonej w etapie
pierwszym,
b - długość klasy,
nm - liczebność klasy zawierającej medianę,
m - numer klasy zawierającej medianę.
Miary pozycyjne (kwartyle)
Q1
Miary pozycyjne (kwartyle)
Q3
Miary pozycyjne (kwartyle)
q 1
b n
Q1 xl ( ni )
nQ1 4 i 1
Miary pozycyjne (kwartyl I (dolny))
gdzie:
xl - dolna granica klasy zawierającej kwartyl dolny
( klasa w którą wpada wynik ćwiartkowy),
b - długość klasy,
- liczebność klasy zawierającej kwartyl dolny,
nq-Q1 numer klasy zawierającej kwartyl dolny;
Miary pozycyjne (kwartyl III (górny))
q 1
b 3n
Q3 xl ( ni )
nQ3 4 i 1
Miary pozycyjne (kwartyl III (górny))
gdzie:
xl - dolna granica klasy zawierającej kwartyl górny
( klasa w którą wpada wynik ¾ n),
b - długość klasy,
n-Qliczebność
3 klasy zawierającej kwartyl górny,
q- numer klasy zawierającej kwartyl górny.
MIARY ROZPROSZENIA
1 2
n
s xi x
2 2
n i 1
MIARY ROZPROSZENIA
1 k
s ( x i x) ni
2 2
n i 1
MIARY ROZPROSZENIA
1 n
d xi a
n i 1
MIARY ROZPROSZENIA
1 k
d x i a ni
n i 1
MIARY ROZPROSZENIA
Q3 Q1
Q
2
MIARY ROZPROSZENIA (uwagi)
x s xtyp x s
MIARY ROZPROSZENIA (uwagi)
-
2
s -
s +
s +
2
s
x
T
y
p
ow
e
wy
n
ik
i
MIARY ROZPROSZENIA (uwagi)
Ogólnie Q<d<s.
Oczywiście posługiwanie się tymi miarami ma sens tylko
w przypadku analizy jednej cechy i jej wewnętrznego
zróżnicowania. Niestety jeżeli chcemy porównać
dyspersję w dwóch różnych strukturach, dla dwóch
różnych cech musimy posłużyć się względnymi miarami
zmienności. Szczególnie jeżeli chcemy dowiedzieć się
względem jakiej cechy jest bardziej zróżnicowana dana
zbiorowość.
WZGLĘDNE MIARY ROZPROSZENIA
Współczynnik zmienności:
s
100%
x
WZGLĘDNE MIARY ROZPROSZENIA
d1
H 100%
x
WZGLĘDNE MIARY ROZPROSZENIA
Q
Q 100%
me
Miary asymetrii
M3
As 3
s
Miary asymetrii
1
k
3
M 3 x i x ni
n i 1
Miary asymetrii
x mo
As lub
s
Q3 Q1 2me
As lub
2Q
3(me mo )
As
2s
Miary asymetrii
M4
K 4
s
Współczynnik koncentracji kurtoza
Gdzie
1 k
M 4 ( x i x) ni
4
n i 1
Współczynnik spłaszczenia
M4
g2 K 3 4 3
s
Analiza podobieństwa struktur
k
w p min w1i , w2i ,
i 1
Analiza podobieństwa struktur
Przykład
Płace pracowników sieci hoteli „GRAND HOTEL” w
Rzeszowie i Przemyślu przedstawia tabela poniżej:
Analiza podobieństwa struktur
Rozwiązanie:
Numer Place Liczba zatrudnionych (ni) w1i w2i min
klasy
I xi Rzeszów Przemyśl Rzeszów Przemyśl
1 [800; 1000) 20 18 0,4 0,45 0,4
2 [1000; 1200) 8 8 0,16 0,2 0,16
3 [1200; 1400) 12 8 0,24 0,2 0,2
4 [1400; 1600) 10 6 0,2 0,15 0,15
Razem: 50 40 Razem: 0,91
Analiza podobieństwa struktur
1 1
[ x u (1 ) , x u (1 ) ]
2 n 2 n
Przedziały ufności dla średniej
Algorytm wyznaczania:
n-liczebność próbki,
-odchylenie standartowe wyznaczamy przedział
ufności.
Przedziały ufności dla średniej
s s
[ x t (1 , n 1) , x t (1 , n 1) ]
2 n 1 2 n 1
Przedziały ufności dla średniej
Algorytm:
z próby wyliczamy x, s
odczytujemy z tablicy kwantyli rozkładu t-studenta
o n-1 stopniach swobody wartość kwantyla rzędu 1- 2 ;
t (1 , n 1) .
2
wyznaczamy przedział
Przedziały ufności dla średniej
s *
s *
[ X u (1 ) , X u (1 ) ]
2 n 2 n
Przedziały ufności dla średniej
Algorytm:
obliczamy X,s
* 2 1 2
obliczamy (s ) = s (n-liczba wyników).
n 1
odczytujemy z tablicy kwantyli rozkładu normalnego
kwantyl rzędu 1 2
wyznaczamy przedział.
Normalność rozkładu
9 43 26 33 33 33 27 37 50 32
10 22 27 27 30 30 42 43 44 33
34 39 27 28 11 11 54 57 31 32
30 33 9 31 18 24 60 40 42 48
34 36 29 14 34 29 36 36 49 62
Jak to się robi w STATISTICA
wpisywanie danych
nazywamy zmienne
dostajemy okno
Jak to się robi w STATISTICA
Jak to się robi w STATISTICA
Miary
12
10
8
6
4
2
0
0 10 20 30 40 50 60 70
X <= Granica klasy
Jak to się robi w STATISTICA
14
12
10
8
6
4
2
0
0 10 20 30 40 50 60 70
Kategoria (górna granica)