Professional Documents
Culture Documents
Powtórka
Powtórka
Małgorzata Ćwil
mcwil@kozminski.edu.pl
Treści kształcenia
• Statystyka opisowa i matematyczna. Empiryczny rozkład cechy statystycznej i
podstawowe miary opisowe – repetytorium.
• Zmienna losowa i jej rozkład. Wybrane teoretyczne rozkłady zmiennych losowych
skokowych i ciągłych.
• Metody doboru jednostek do próby. Pojęcie rozkładu statystyki z próby losowej.
Centralne twierdzenie graniczne i jego zastosowanie. Rozkłady wybranych
statystyk z próby losowej.
• Estymacja: pojęcie estymatora, estymacja punktowa i przedziałowa. Przedziały
ufności dla wybranych parametrów struktury, ocena dokładności oszacowania i
ustalanie minimalnej liczebności próby.
• Weryfikacja hipotez statystycznych: rodzaje hipotez, błędy popełniane przy
weryfikacji hipotez, procedura testu istotności. Weryfikacja hipotez dotyczących
wybranych parametrów struktury, jednoczynnikowa analiza wariancji- testy
istotności, wybrane testy zgodności.
• Wnioskowanie w analizie korelacji i regresji: test niezależności stochastycznej,
przedziały ufności i testy istotności dla współczynnika korelacji i współczynnika
regresji liniowej.
Lektury
• Bielecka A., Statystyka dla menedżerów. Teoria i
praktyka, Oficyna a Wolters Kluwer business,
Warszawa 2011.
• Maksimowicz-Ajchel A., Zarys statystyki, WSiP,
Warszawa 2013.
• Bedyńska, S., & Cypryańska, M. (Eds.).
(2013). Statystyczny drogowskaz: Praktyczne
wprowadzenie do wnioskowania statystycznego.
Wydawnictwo Akademickie Sedno.
Zaliczenie - wnioskowanie
- o poznawaniu państwa
status (łac.) = państwo
Np.:
statystyka urodzeń/zgonów
statystyka sportowa
statystyka wypadków drogowych
statystyka dochodu narodowego
Co to jest statystyka?
Np.:
przeciętne miesięczne wynagrodzenie absolwentów ALK,
dominujący wiek pracowników danej firmy,
odsetek osób popierających politykę państwa
Statystyka
300
250
200
150
100
50
0
2008 2009 2010 2011 2012 2013
330
310
290
270
250
230
210
190
2008 2009 2010 2011 2012 2013
Statystyka
Olga Tokarczuk,
Prowadź swój pług przez kości umarłych
• Metody wnioskowania o
Statystyka właściwościach zbiorowości
statystycznej na podstawie
matematyczna danych z próby
• Wykorzystuje rachunek prawd.
Opis statystyczny
Zbiorowość statystyczna
Cecha X
Cecha Y
Cecha Z
Wnioskowanie statystyczne
Zbiorowość statystyczna Próba
Cecha X próbkowanie
Cecha Y X, Y, Z
wnioskowanie
Cecha Z
Zbiorowość próbna = próba
• Podzbiór populacji generalnej,
• Obejmuje część elementów populacji,
wybranych w określony sposób
• Podlega badaniu statystycznemu
• Wynik jest uogólniany na zbiorowość
generalną (gdy próba reprezentatywna,
dobrana w sposób losowy)
Badanie częściowe
• Nielosowy dobór jednostek do próby
- dobór jednostek typowych
np. typowa Polka = wiek 30-35 lat, średnie wykształcenie,
mieszka w mieście 100-200 tys. mieszkańców
- dobór kwotowy
struktura próbki = struktura zbiorowości
- dobór metodą kuli śnieżnej
badane jednostki wskazują kolejne do badania
- dobór przypadkowy (≠ losowy!)
Nie zawsze istnieje możliwość zbadania całej
populacji statystycznej
Cechy
statystyczne
Stałe Zmienne
Ciągłe Skokowe
Rodzaje cech statystycznych
Cechy
Stałe/zmienne statystyczne
Stałe Zmienne
Ilościowe Jakościowe
Nominalna
Porządkowa
Przedziałowa (interwałowa)
Stosunkowa (ilorazowa)
Skala nominalna
• identyfikacja badanej jednostki ze względu
na posiadanie lub nie określonych
wariantów (typów) cechy
• słaba
Np.:
- kierunek studiów,
- zajmowane stanowisko,
- źródło informacji
Skala porządkowa
• Jak nominalna + porządkowanie według
intensywności posiadania danej cechy,
intensywność nie jest dokładnie zmierzona
• Relacje mniejszości, równości, większości,
• Skala słaba
Np.:
- zdolność kredytowa firmy: mała/średnia/duża,
- cena: bardzo wysoka/wysoka/dość
wysoka/średnia/dość niska/niska
Skala przedziałowa (interwałowa)
• Jak porządkowa + jednostka miary do ustalania
różnic między poszczególnymi wariantami cechy,
odstępy na skali takie same
• Początek skali stanowi tzw. zero względne
• Można wykonywać operacje dodawania i
odejmowania
• Skala silna
Np.:
- zdolność kredytowa firmy: skala 1-10,
- stopień zadowolenia klienta z obsługi: skala 0 –100
Skala ilorazowa (stosunkowa)
• Jak przedziałowa + naturalna jednostka miary z
zerem absolutnym
• Możliwość obliczenia stosunku pomiaru dwóch
jednostek
• Skala silna
Np.:
• koszty funkcjonowania biura
• czas dostawy
• wysokość funduszu socjalnego
• staż pracy w firmie
• wiek pracownika
Wybór skali pomiarowej decyduje o
możliwościach wyboru odpowiednich form
prezentacji i analizy.
• Skala porządkowa
bardzo niezadowolony/średnio niezadowolony/
średnio zadowolony/bardzo zadowolony
• Skala przedziałowa
0 10
Badanie statystyczne
• proces, którego celem jest zebranie danych,
przetworzenie ich oraz interpretacja wyników
Zakres badania
• Desk research
• Dane były zebrane wcześniej na inne potrzeby
Źródło •
•
Źródła wewnętrzne firmy/zewnętrzne
Niskie koszty, szybki dostęp
wtórne • Niedostosowane do potrzeb danego badania
• Field research
• Informacje zbierane specjalnie na
Źródło potrzeby określonego badania
• Konieczność dotarcia do jednostek
pierwotne badanych
• Wysokie koszty, bardziej czasochłonne
Etapy badań statystycznych
Przedmiot
Źródło danych Zakres badania
badania
Przygotowanie
Czas trwania
organizacyjno-
badania
techniczne
Miary statystyczne
Miary
statystyczne
Miary Miary
klasyczne pozycyjne
•odchylenie • odchylenie
standardowe ćwiartkowe
Miary asymetrii Absolutne Stosunkowe Absolutne Stosunkowe
(skośności) (jaki jest (jaki jest (jaki jest kierunek?) (jaki jest
kierunek?) kierunek i siła) kierunek i siła)
•miernik asymetrii • współczynnik •miernik asymetrii •współczynniki
klasyczny asymetrii klasyczny pozycyjny asymetrii pozycyjne
Miary Absolutne Stosunkowe
spłaszczenia • miernik kurtozy • współczynnik
(kurtozy) kurtozy
Średnia arytmetyczna
• wypadkowa wartości cechy spotykanych u wszystkich jednostek
badanej zbiorowości; wartość cechy przypadająca na jedną jednostkę
przy równomiernym rozłożeniu ogólnej sumy wartości cechy na
wszystkie badane jednostki; wartość abstrakcyjna.
n
x i
Szereg prosty X = i =1
N
k
x i ni k
X = i =1
= xi ni
,
Szereg punktowy k
n i =1
i
i =1
xi ni
o
r
Szereg przedziałowy X i =1
= xi ni
o ,
r
nii =1
i =1
=ŚREDNIA(…)
Przykład
Niech xi będzie wielkością sprzedaży (w tys. zł.) w 2010 r. 10 pracowników
zatrudnionych w firmie sprzedającej farmaceutyki.
i 1 2 3 4 5 6 7 8 9 10 Razem
xi 251 150 102 61 52 71 82 183 202 159 1313
57
Przykład
Wyjazdy zagraniczne pracowników firmy
Liczba Liczba
wyjazdów pracowników
n i` x i ni xi ni`
0 25 0,25 0 25= 0 0 0,25= 0,00
1 35 0,35 1 35= 35 1 0,35= 0,35
2 23 0,23 2 23= 46 2 0,23= 0,46
3 10 0,1 3 10= 30 3 0,10= 0,30
4 7 0,07 4 7= 28 4 0,07= 0,28
100 1 139 1,39
k =5
x i ni k =5
139
X = xi ni = 1,39
,
X = i =1
k =5
= = 1,39
ni
100 i =1
i =1
58
-
Przykład
Zużycie paliwa samochodów na 100 km
-
Przykład
Zużycie paliwa samochodów na 100 km
xio − xi1 ni n i` xio xio ni xio ni`
r =6
x i ni
o
r =6
X xi ni = 9,472
682 o ,
X i =1
r =6
= 9,472
ni
72 i =1
i =1
Mediana
• wartość cechy, która dzieli zbiorowość na dwie
liczebnie równe części
• wartość cechy, jaką posiada jednostka zajmująca
pozycję środkową w uporządkowanym ciągu wartości
• 50% jednostek ma wartości cechy mniejsze lub równe
od mediany, 50% jednostek ma cechy większe lub
równe medianie
=MEDIANA(…)
Mediana w szeregu prostym
x N / 2 + x( N +2)/ 2
M = x( N +1) / 2 M=
2
Mediana
Mediana 1 = 80 000
Mediana 2 = 80 000
Średnia 1 = 80 000
Średnia 2 = 1 080 000
Dominanta
- wartość modalna, moda, ang. Mode
- wartość (lub wariant) cechy, która występuje
najczęściej wśród wartości (wariantów)
jednostek badanej zbiorowości,
- wartość cechy, wokół której skupia się
najwięcej jednostek badanej zbiorowości
=WYST.NAJCZĘSCIEJ.WART(…)
Miary dyspersji
Pięciu pracowników pewnej firmy ma staż pracy odpowiednio (w latach):
6, 3, 0, 2, 4
6 + 3 + 0 + 2 + 4 15
Średni staż pracy w tej grupie osób X = = =3
5 5
Każdy z pracowników odchyla się od średniego stażu o : +3, 0, -3, -1, +1.
Jakie jest średnie odchylenie od wartości średniej ?
i 1 2 3 4 5 Razem
N
xi 6 3 0 2 4 15 (x i − X)
i =1
=0
N
xi − X +3 0 -3 -1 +1 0
Miary dyspersji
Rozwiązanie problemu
Wariant I
( xi − X ) 2 9 0 9 1 1 20
(x )
5
2
i −X
i =1 20
= =4
Wariant II 5 5
xi − X 3 0 3 1 1 8
5
x
i =1
i −X
8
= = 1,6
5 5
Wariancja
Średnia arytmetyczna kwadratów odchyleń poszczególnych
wartości cechy od jej średniej arytmetycznej.
(x ) (x ) (x )
N k r
2
− X ni
2 2
−X
o
i − X ni i
S 2 (x )
i
S (x ) = S 2 (x ) = i =1 i =1
2 i =1
k r
N n
i =1
i n i =1
i
N k
x 2
i x 2
i ni r
xi0 ni
2
S 2 (x ) = S 2 (x ) =
2 2
i =1
−X
i =1
k
−X S 2 (x ) i =1
−X
2
N
ni
r
i =1
n i =1
i
Wzór uproszczony:
=WARIANCJA(…)
S ( x) = X − ( X )
2 2 2
Odchylenie standardowe
- przeciętnie odchylenie wartości cechy od jej średniej arytmetycznej;
- pierwiastek kwadratowy ze średniej arytmetycznej kwadratów
odchyleń poszczególnych wartości cechy jednostek badanej
zbiorowości od jej średniej arytmetycznej.
S ( x) = + S ( x) 2
Vskl (−2;+2) S (x ) 3
(x − X )
N
1 4
i
N
Vkurt = i =1
4
−3
S ( x)
Jednostki nietypowe:
22
16
STAŻ
10
Min-Maks.
25%-75%
-2
kierownicze niekierownicze Mediana
Stanowisko
Histogram