Statystyka

You might also like

Download as ppt, pdf, or txt
Download as ppt, pdf, or txt
You are on page 1of 55

Podstawowe pojęcia i definicje

Badanie statystyczne – ogół prac mających na


celu poznanie struktury zbiorowości
statystycznej
Rodzaje badań statystycznych:
• całkowite (wyczerpujące) – obserwacji
podlegają wszystkie elementy zbiorowości
generalnej
• częściowe – obserwacji podlega tylko część
zbiorowości generalnej (tzw. próba)
• Zbiorowość statystyczna – zbiór elementów
podobnych pod względem określonych cech (lecz nie
identycznych), poddanych badaniom statystycznym
• Jednostka statystyczna – poszczególny element
wchodzący w skład badanej zbiorowości
statystycznej
• Cechy statystyczna – własności, którymi odznaczają
się jednostki wchodzące w skład badanej zbiorowości
Rodzaje cech statystycznych
• mierzalne (ilościowe) – można wyrazić za
pomocą jednostek miary np. wzrost, wiek,
zarobek (wśród cech mierzalnych wyróżniamy
cechy skokowe i ciągłe)
• niemierzalne (jakościowe) – nie można
wyrazić liczbowo np. kolor włosów, stopień
wykształcenia, płeć
Szeregi Statystyczne
• Szereg statystyczny – ciąg wielkości
statystycznych uporządkowanych według
określonego kryterium
Rodzaje szeregów statystycznych
Szeregi
Statystyczne

szczegółowe rozdzielcze czasowe

Z cecha Z cechą momentów okresów


mierzalną niemierzalną

punktowe przedziałowe geograficzne inne

proste skumulowane proste skumulowane


• szereg szczegółowy – uporządkowany rosnąco
lub malejąco ciąg wartości badanej cechy
statystycznej
• szereg rozdzielczy – zbiorowość statystyczna
podzielona na części (klasy) według określonej
cechy jakościowej lub ilościowej z podaniem
liczebności lub częstości każdej z
wyodrębnionych klas
• szereg czasowy – ciąg zaobserwowanych
stanów badanej zmiennej, uporządkowanych
według wartości zmiennej czasowej t, t = 1,2,
…,n
Konstrukcja szeregu rozdzielczego z
przedziałami klasowymi

k – liczba klas (liczba przedziałów klasowych)


k n
h – rozpiętość przedziałów klasowych, różnica pomiędzy górną i dolną granicą i-tego
przedziału klasowego hi  x1i  x01

xmax  xmin R
h 
k k
• Rozkład empiryczny – zestawienie wyników w
postaci szeregu rozdzielczego z cechą mierzalną
• Typy rozkładów:
• jednomodalne: symetryczne, asymetryczne, skrajnie
asymetryczne
• wielomodalne
• Dystrybuanta empiryczna – przyporządkowanie
kolejnym wartościom cechy statystycznej (zmiennej)
odpowiadających im częstości skumulowanych (lub
liczebności skumulowanych)
Przykład 1:
Zapytano sto losowo wybranych osób o liczbę papierosów wypalanych w ciągu
dnia. Uzyskane wyniki przedstawione są w tabeli: wyznaczyć i narysować rozkład
empiryczny i dystrybuantę empiryczną
xi ni nisk wi wisk
1 5 5 0,05 0,05
2 20 25 0,2 0,25
3 23 48 0,23 0,48
4 22 70 0,22 0,7
5 20 90 0,2 0,9
6 10 100 0,1 1
Suma: 100 – 1 –
Wykład 2

Parametry statystyczne opisujące


rozkłady jednomodalne
Parametry klasyczne Parametry pozycyjne
 Modalna
 Kwantyle:
 Średnia arytmetyczna  Kwartyl pierwszy
 Średnia harmoniczna  Kwartyl drugi
Miary położenia
 Średnia (mediana)
geometryczna  Kwartyl trzeci
 decyle

 wariancja
 rozstęp
 odchylenie
 odchylenie
standardowe
Miary zmienności ćwiartkowe
 odchylenie przeciętne
 współczynnik
 współczynnik
zmienności
zmienności
 współczynnik
asymetrii  współczynnik
Miary asymetrii
 współczynnik skośności
skośności
 Współczynnik
Miary koncentracji
skupienia
Klasyczne parametry statystyczne

Średnia arytmetyczna
n

x
i 1
i
x dla szeregu szczegółowego
n
1
x   x i ni dla szeregu rozdzielczego punktowego
n

1 
x   x i ni dla szeregu rozdzielczego z przedziałami klasowymi
n
Własności średniej arytmetycznej

 Suma wartości cechy równa jest iloczynowi średniej arytmetycznej


i liczebności zbiorowości
n k
n x   xi lub n x   xi  ni
i 1 i 1
 Średnia arytmetyczna spełnia warunek:
xmin  x  xmax
 Suma odchyleń poszczególnych wartości cechy od średniej równa się
zero
n k
   
  xi  x  0
i 1  
lub   x i  x ni  0
i 1  
 Suma kwadratów odchyleń poszczególnych wartości od średniej jest
minimalna
n 2 n 2
   
  x i  x   min
i 1  
lub   i
i 1 
x  x  ni  min

 Średnią arytmetyczną można obliczać dla szeregów o zamkniętych
przedziałach klasowych, jednak jeśli liczebność w otwartym przedziale
klasowym stanowi nie więcej niż 5% badanej zbiorowości, to możliwe
jest jego domknięcie
UWAGI!!!
 Średniej arytmetycznej nie można obliczać, gdy w szeregu rozdzielczym
występują otwarte przedziały klasowe (z wyjątkiem sytuacji, gdy istnieje
możliwość ich domknięcia). Należy wtedy zastosować parametry
pozycyjne
 Średnia arytmetyczna wyznaczona z tzw. próby reprezentatywnej staje
się dobrym przybliżeniem wartości przeciętnej w zbiorowości
 Średnia arytmetyczna jest „wrażliwa” na skrajne wartości cechy, tzw.
obserwacje przypadkowe
Miary zmienności (rozproszenia, dyspersji)

charakteryzują stopień zróżnicowania jednostek


zbiorowości pod względem badanej cechy
Wariancja
średnia arytmetyczna kwadratów odchyleń poszczególnych
wartości cechy od średniej arytmetycznej zbiorowości
2
1  n

s    xi  x 
2

n i 1   dla szeregu szczegółowego

2
1  k

s    x i  x  ni dla szeregu rozdzielczego
2

n i 1  
punktowego
2
1  k 

s    x i  x  ni
2

n i 1   dla szeregu rozdzielczego z

przedziałami klasowymi
Odchylenie standardowe

2
s s
Współczynnik zmienności

s
Vs  100
x
Typowy przedział zmienności

x  s  xtyp  x  s
Empiryczny przedział zmienności

x  3s  x emp  x  3s
Wykład 3
Średnia ze średnich

1 r
x
N
xn
i 1
i
Wariancja ogólna
Wariancja ogólna składa się z dwóch składników:
• Średniej arytmetycznej wewnątrzgrupowych wariancji
wartości cechy, tzw. wariancji wewnątrzgrupowej
1 r

s
2 2
si  i  ni
N i 1

• Wariancji średnich grupowych wartości tej zmiennej, tzw.


wariancji międzygrupowej
1 r
2
s (xi ) 
N
 (x
i 1
i
2
 x )  ni

• Wariancja ogólna nosi nazwę równości wariancyjnej:


2 2 2
s  s i  s ( xi )
Pozycyjne parametry statystyczne
• Modalna (dominanta) – wartość cechy statystycznej, która w
danym rozkładzie występuje najczęściej.
• W szeregach szczegółowych i rozdzielczych punktowych jest
to ta wartość, której odpowiada największa liczebność lub
częstość.
• W szeregach rozdzielczych z przedziałami klasowymi można
bezpośrednio tylko wskazać przedział, w którym występuje
modalna. Jej przybliżoną wartość można wyznaczyć
analitycznie lub graficznie z histogramu liczebności lub
częstości

nm  nm 1
Mo  xom   hm
nm  nm1   nm  nm1 
Kwantyle

• wartości cechy badanej zbiorowości,


przedstawionej w postaci szeregu
statystycznego, dzielące daną zborowość na
określone części pod względem liczby
jednostek. Części te pozostają do siebie w
określonych proporcjach.
• Do najczęściej stosowanych kwartyli należą
kwartyle i decyle
Mediana
dzieli zbiorowość na dwie części tak, że połowa jednostek
zbiorowości przyjmuje wartości mniejsze lub równe
medianie, a druga połowa wartości większe lub równe
medianie. Z tego powodu mediana nazywana jest wartością
środkową.
Wyznaczanie mediany w szeregu szczegółowym:

 xn 1
 2

Me   x  x
n n
 2 2
1
 2

W szeregu rozdzielczym z przedziałami klasowymi:

m 1
N Me   ni
i 1
Me  x om   hm
nm
n
N Me 
2
Kwartyl pierwszy
– dzieli zbiorowość na dwie części, tak, że 25% jednostek
zbiorowości charakteryzuje się wartościami cechy mniejszymi
lub równymi kwartylowi pierwszemu, a 75% jednostek
zbiorowości przyjmuje wartości większe lub równe od kwartyla
pierwszego.
Wyznaczanie kwartyli w szeregu rozdzielczym z przedziałami
klasowymi:
m1
N Q1   ni
Q1  xom  i 1
 hm
nm
n
N Q1 
4
Kwartyl trzeci
– dzieli zbiorowość na dwie części, tak, że 75% jednostek
zbiorowości charakteryzuje się wartościami cechy mniejszymi
lub równymi kwartylowi trzeciemu , a 25% jednostek
zbiorowości przyjmuje wartości większe lub równe od kwartyla
trzeciego.
m1
N Q 3   ni
Q3  xom  i 1
 hm
nm
3
N Q3  n
4
Uwagi:
 Mediana jest, razem ze średnią arytmetyczną, jednym z najczęściej stosowanych
parametrów statystycznych
 Może być obliczana w przypadkach, gdy nie jest możliwe stosowanie średniej
arytmetycznej (np. w przypadku otwartych przedziałów klasowych) lub modalnej
(różne rozpiętości przedziałów klasowych)
 Modalna i mediana nie są wrażliwe na zmiany wartości obserwacji skrajnych
 Jeżeli rozkład jest symetryczny, to x  Me  Mo
n
 Mediana ma własność:  x  Me  min
i 1
i
Miary zmienności oparte na parametrach pozycyjnych
Odchylenie ćwiartkowe – połowa różnicy między trzecim a pierwszym
kwartyle, mierzy poziom zróżnicowania jednostek pozostałych po
odrzuceniu 25% jednostek o wartościach najmniejszych i 25%
jednostek o wartościach największych
(Q3  Me)  ( Me  Q1 ) Q3  Q1
Q 
2 2
Typowy przedział zmienności:

Me  Q  xtyp  Me  Q
Współczynnik zmienności:
Q
VQ 
Me
Współczynnik zmienności jest wielkością
niemianowaną, jednak najczęściej, po przemnożeniu
przez 100, jego wielkości podaje się w procentach.
Przyjmuje się, że jeśli wartość współczynnika
zmienności jest mniejsza od 10%, to zróżnicowanie
cechy jest statystyczne nieistotne.
Miary asymetrii:
x  Mo
As 
S
Q1  Q3  2  Me
AQ 
2Q
Współczynniki asymetrii, to liczby niemianowane,
najczęściej przyjmują wartości z przedziału od -1 do 1.
Im wartość współczynnika asymetrii bardziej odbiega
od zera, tym asymetria jest silniejsza
Metody analizy dynamiki zjawisk

Wykład 4
• Szereg czasowy – ciąg zaobserwowanych
stanów zmiennej Y uporządkowanych według
zmiennej czasowej t (t=1,2,,..n)

y  y1 , y 2 ,... y n 
Składowe szeregów
czasowych

Systematyczna Przypadkowa

Tendencja Stały (przeciętny) Składowa


rozwojowa poziom zjawiska okresowa

Wahania Wahania
sezonowe cykliczne
Metody identyfikacji składowych szeregu czasowego

• ocena wzrokowa wykresu


• testy statystyczne (np. test współczynnika
korelacji liniowej Pearsona, test
współczynnika korelacji rang Spearmana)
• analiza autokorelacji
Metody indeksowe
łańcuchowe

absolutne
jednopodstawowe

Przyrosty
łańcuchowe
względne

jednopodstawowe

Miary dynamiki

łańcuchowe

indywidualne
jednopodstawowe

Indeksy dynamiki
łańcuchowe

agregatowe
jednopodstawowe
• Miary dynamiki jednopodstawowe – służą do
określenia zmian, jakie nastąpiły w poziomie zjawiska
w kolejnych okresach (momentach) w porównaniu z
okresem (momentem) przyjętym jako podstawowy
(bazowy)

• Miary dynamiki łańcuchowe – służą do oceny zmian,


jakie nastąpiły w poziomie zjawiska z okresu
(momentu) na okres (moment), jako podstawę
odniesienia przyjmuje się poziom zjawiska w okresie
(momencie) poprzednim
Przyrosty absolutne

– Obliczane w stosunku do jednego okresu, gdy okres bazowy jest okresem pierwszym (t *=1):

y 2  y1 ,..., y n1  y1 , y n  y1
– Obliczane w stosunku do okresu, gdy okres bazowy jest okresem k–tym (t *=k):

y 2  y k , y 2  y k ,..., y n1  y k , y n  y k
Czyli:
 t / k  yt  y k
– łańcuchowe (stale zmieniający się okres bazowy):

y 2  y1 ,..., y n 1  y n  2 , y n  y n 1
Czyli:

 t / t 1  y t  y t 1
Przyrosty względne

– jednopodstawowe

t / k yt  y k
dt / k  
yk yk

– łańcuchowe

 t / t 1 yt  yt 1
d t / t 1  
yt 1 yt 1
UWAGA: Po przemnożeniu wartości przyrostu
względnego przez 100 otrzymujemy
procentowy przyrost względny, zwany
tempem zmian, który informuje, o ile procent
poziom zjawiska zmienił się (wzrósł lub spadł)
w porównaniu z okresem bazowym.
Indywidualne indeksy dynamiki
– jednopodstawowe:

yn
in / 1   1  d n /1
y1
– łańcuchowe:

yn
in / n 1   1  d n / n 1
y n 1
Średnie tempo zmian zjawiska w czasie wyznacza się
za pomocą średniej geometrycznej indeksów łańcuchowych:

iG  n 1 in / n1  in1 / n 2  ...  i2 / 1  n1 in / 1

Średniookresowe tempo zmian:

Tn  iG  1
lub

Tn [%]  iG 100  100


Uwagi:
• Jeśli dane są indeksy jednopodstawowe (t*=1), to można je zamienić na indeksy
łańcuchowe zgodnie ze wzorem:
bo y n  y n : y n 1
in / n 1  in / 1 : in 1 / 1 y n 1 y1 y1
• Jeśli dane są indeksy łańcuchowe, to indeksy jednopodstawowe wyznaczamy:
– Gdy za podstawę badania przyjmujemy pierwszy okres badania t*=1:

in / 1  in / n 1  in 1 / n  2  i2 / 1 y nbo y n y n 1 y2
   

y1 niżypierwszy
Gdy za podstawę przyjmuje się okres inny n 1 y n w2 szereguyczasowym
1
(t*=k), wtedy dla n>k:

bo
in / k  in / n 1  in 1 / n  2  ik 1 / k
yn y n y n 1 y k 1
   
yk y n 1 y n  2 yk
Przykład

cena Przyrosty absolutne przyrosty względne indeksy


numer
data akcji
okresu Jednopodst. Łańcuc. Jednopodst. Łańcu. Jednopodst. Łańcuc.
notowania w zł
t yt  t /1  t / t 1 d t / 1  100 d t / t 1  100 in /1 in / t 1
3.11 1 29,50 0,00 : 0,0% : 1,000 :
4.11 2 31,15 1,65 1,65 5,6% 5,6% 1,056 1,056
5.11 3 29,88 0,38 -1,27 1,3% -4,1% 1,013 0,959
6.11 4 28,00 -1,50 -1,88 -5,1% -6,3% 0,949 0,937
7.11 5 28,22 -1,28 0,22 -4,3% 0,8% 0,957 1,008
Agregatowe indeksy dynamiki

Wykład 5
Indywidualne indeksy cen, ilości i wartości

• p – cena (price)
• q – ilość (quantity)
• w – wartość

pn qn wn
ip  iq  iw 
p0 q0 w0
Agregatowy indeks cen Laspeyresa

p
j 1
nj q0 j
L I P k

p
j 1
0j q0 j
Agregatowy indeks cen Paaschego

p
j 1
nj q nj
P I P k

p
j 1
0j q nj
Agregatowy indeks ilości Laspeyresa

p
j 1
oj q nj
L I q k

p
j 1
0j q0 j
Agregatowy indeks ilości Paaschego

p
j 1
nj q nj
P I q k

p
j 1
nj q0 j
Agregatowy indeks wartości

k k

w
j 1
nj p
j 1
nj q nj
I w k
 k

w
j 1
0j p
j 1
0j q0 j
Równość indeksowa

I w P I p L I q  P I q L I p
Uwagi

• Jeśli pozwalają na to dane statystyczne powinno


obliczać się indeksy obydwu formuł, ponieważ
wyznaczają one przedział zmian w dynamice
badanego zjawiska
• Jednakże do oceny zmian w strukturze ilości zaleca
się wykorzystanie indeksu formuły Laspeyresa,
natomiast do oceny zmian w strukturze ce indeksu
formuły Paaschego
Przykład
Tabela przestawia strukturę wielkości produkcji i cen
pewnego przedsiębiorstwa

Grudzień listopad
Artykuł
Ilość (tys. Cena Ilość (tys. Cena
szt.) (zł/szt.) szt.) (zł/szt.)

A 30 40 24 45
B 50 4 45 5

Obliczyć agregatowe indeksy cen, ilości i wartości


Przykład II

Grudzień Indywidualne indeksy

Artykuł wartość Ilości Cen

wn=pnqn iq=qn/q0 ip=pn/p0

A 1200 0,8 1,125


B 200 0,9 1,25

You might also like