Podstawy Statystyki

You might also like

Download as pps, pdf, or txt
Download as pps, pdf, or txt
You are on page 1of 18

Podstawy statystyki

Kurs specjalistyczny dla pielęgniarek, mgr Adam Dudek,


PWSZ Nysa 2007
Co to jest statystyka ?

Obecnie pojęcia statystyka używamy aby mówić o:


 zbiorze danych liczbowych ukazujących
kształtowanie się określonego zjawiska
 pewnych charakterystykach liczbowych
powstałych z badań nad zbiorowością próbną (np.
odchylenie od próby, średnia)
 dyscyplinie naukowej
Wyróżniamy
 Statystykę opisową - zajmuje się metodami obserwacji
statystycznej, konstruowaniem badań statystycznych,
opracowywaniem i prezentacją danego materiału
statystycznego oraz sumarycznym opisem danych
statystycznych.
 Statystykę matematyczną - to nauka, która zajmuje się
metodami wnioskowania o całej zbiorowości generalnej na
podstawie zbadania wybranej w sposób losowy pewnej
części zwanej próbą.
 Statystykę ekonomiczną - bada zjawiska i procesy
zachodzące w gospodarce na różnych szczeblach jej
agregacji. Do opisu i analizy badanych zjawisk statystyka
ekonomiczna wykorzystuje metody wypracowane przez
statystykę opisową i matematyczną.
Zbiorowość statystyczna

Zbiorowością statystyczną (populacją, masą


statystyczną) , nazywamy zespół jednostek
objętych badaniem statystycznym. Cel badania
określa zbiorowość. Zbiorowość należy ściśle
określić:

 pod względem rzeczowym (czyli kogo lub co


badamy)
 pod względem terytorialnym
 pod względem czasowym
Jednostka statystyczna
 Jednostkami statystycznymi nazywamy elementy
składowe badanej zbiorowości statystycznej. Ilość
jednostek składających się na badaną zbiorowość
nazywamy liczebnością. (liczebnością ogólną - N).
 Cechy statystyczne. Jednostki statystyczne nie są
identyczne, posiadają cechy wspólne i wiele cech
różniących je między sobą. Właściwości jakie posiadają
jednostki statystyczne nazywamy cechami
statystycznymi.
Rodzaje cech statystycznych:
 mierzalne
 niemierzalne
 stałe
 zmienne
Metody badań statystycznych

 badanie pełne - obserwacji poddana jest każda


jednostka zbiorowości statystycznej , której badanie
dotyczy.

 badanie częściowe – obserwację ogranicza się tylko


pewnej części (wybranych jednostek
statystycznych) badanej zbiorowości statystycznej.

Szacunek statystyczny – stosowany jest przypadku, gdy


nie możemy uzyskać interesującej nas zbiorowości lub
jej części w sposób bezpośredni.
Badanie statystyczne - przygotowanie

Etap ten obejmuje czynności związane z przygotowaniem i


zaprojektowaniem badania statystycznego.
 sprecyzowanie celu i tematu
 zdefiniowanie zbiorowości stat. i jednostki stat.
 wybór cech statystycznych
 określenie metody badania statystycznego
 źródło uzyskania danych, które dzielimy na:
 pierwotne (obserwacja, wywiad, ankieta),
 wtórne (sprawozdawczość przedsiębiorstw itp.)
 opracowanie formularzy stat. (np.ankiety) oraz makiet
tablic wynikowych, opracowanie sposobów weryfikacji i
kontroli materiału
Badanie statystyczne – gromadzenie danych
Etap ten polega na ustaleniu wartości cech ilościowych lub
odmian cech jakościowych wszystkich jednostek
tworzących populacje statystyczną lub u prawidłowo
dobranej ich reprezentacji. Może to się odbywać za
pomocą bezpośredniego pomiaru (obserwacji) lub
zbieranie inf. od jednostek sprawozdawczych.

obejmuje dwa zasadnicze kroki:

 zaliczanie (kwalifikowanie)
 grupowanie-polega na wyodrębnianiu jednorodnych lub
względnie jednorodnych części grup w ramach większej i
zróżnicowanej zbiorowości statystycznych.
Metody prezentacji danych statystycznych

 tabelaryczna prezentacja danych statystycznych –


tablice wykorzystywane są do prezentacji danych
statystycznych uporządkowanych według określonego
kryterium. Aby tablica statystyczna była użyteczna
powinna spełniać określone warunki dotyczące jej
formalnej budowy oraz merytorycznej zawartości. Z
formalnego punktu widzenia każda tablica statystyczna
powinna zawierać
 tytuł, w którym podaje się w sposób jasny i zwięzły treść tablicy
określającej zbiorowość statystyczną pod względem rzeczowym
czasowym i przestrzennym
 numer kolejny w przypadku, gdy w opracowaniu jest więcej tablic
 główne oznaczenia kolumn i wierszy
 źródło danych statystycznych
Metody prezentacji danych statystycznych

 graficzna prezentacja danych statystycznych -


najczęściej Wykresy sporządza się na podstawie tablic
statycznych, ale nie mogą być one prostym
powtórzeniem zawartych w nich danych. Wykres ujmuje
zjawiska w sposób bardziej syntetyczny niż tablica.
Każdy wykres podobnie jak tablica powinien mieć tytuł i
źródło danych na podstawie, których należy podać
legendę, czyli wyjaśnienie zastosowanych symboli.
W grafice statystycznej wyróżnia się następujące rodzaje
wykresów:
 liniowe
 powierzchniowe
 pasmowe;
 bryłowe (np. kołowe słupkowe)
 punktów;
 wagowe;
 kombinowane i specjalne;
Metody prezentacji danych statystycznych

 opisowa prezentacja danych statystycznych – polega


na włączeniu danych statystycznych do tekstu
opisującego dane zjawisko. Jest to możliwe tylko
wówczas, gdy liczba danych jest niewielka, gdyż w
przeciwnym razie prezentacja staje się nieczytelna.

 mieszane metody prezentacji danych statystycznych.


Rodzaje analizy statystycznej – natężenia

 Wskaźniki natężenia obliczamy wtedy, gdy chcemy


przedstawić badaną zbiorowość na tle innej zbiorowości
logicznie związana z badaną.
N1
Wn = –––––––––––
N2
N1 – wielkość jednej zbiorowości
N2 – wielkość drugiej zbiorowość
Wn – współczynnik natężenia

 Najczęściej spotykanym współczynnikiem natężenia są np. gęstość


zaludnienia, liczba urodzeń, małżeństw, rozwodów na 10 tys.
mieszkańców, produkcja energii elektrycznej w KW. Na 1
mieszkańca.
Rodzaje analizy statystycznej – struktury
 Struktura zbiorowości określona jest przez podział badanej zbiorowości
statystycznej na grupy jednostek różniących się od siebie wartościami
poszczególnych cech. Liczbową formą opisu struktury są liczby względne
powszechnie stosowane jako wskaźnik struktury. Wskaźnik struktury
możemy obliczyć jako:
 Ułamkowe wskaźniki struktury
ni
Wsi = ––––––––
N
Wsi – wskaźnik struktury
ni – liczebność poszczególnych części danej zbiorowości
N – liczebność całej zbiorowości statystycznej
 wskaźnik procentowy
ni
Wsi = –––––––– * 100%
N
 wskaźnik struktury wyrażany Liczebność promilach
ni
Wsi = –––––––– * 1000 ‰
N
Analiza tendencji centralnych - średnie

 Miary tendencji centralnej to wskazanie w zbiorowości statystycznej


takiej wartości badanej cechy, wokół której skupiają się cechy
wszystkich jednostek wchodzącej w skład tej zbiorowości.
Tendencja centralna określona jest również jako miara przeciętna
lub średnia.

 Średnia arytmetyczna jest to suma wartości cechy wszystkich


jednostek objętych badaniem podzielona przez liczbę jednostek
tworzących badanie zbiorowości statystycznej.

 Średnią geometryczną obliczamy mnożąc wszystkie wartości cech


przez siebie, a następnie wyznaczając z tego iloczynu pierwiastek
n-tego stopnia z tego wyniku, gdzie n jest liczbę jednostek
tworzących daną zbiorowość.
Analiza tendencji centralnych - mediana

 Mediana (zwana też wartością środkową) to w


statystyce wartość cechy w szeregu uporządkowanym,
powyżej i poniżej której znajduje się jednakowa liczba
obserwacji.

 Aby obliczyć medianę ze zbioru n obserwacji, sortujemy


je w kolejności od najmniejszej do największej i
numerujemy od 1 do n. Następnie, jeśli n jest
nieparzyste, medianą jest wartość obserwacji w środku
(czyli obserwacji numer (n+1)/2). Jeśli natomiast n jest
parzyste, wynikiem jest średnia arytmetyczna między
dwiema środkowymi obserwacjami, czyli obserwacją
numer n/2 i obserwacją numer (n/2)+1.
Analiza tendencji centralnych - dominanta

 Dominanta (wartość Wartość Prawdopodobieństwo wyst.


modalna, moda, wartość 1 0.2
najczęstsza) – wskazuje na 2 0.3
wartość o największym
3 0.1
prawdopodobieństwie
wystąpienia, lub wartość 4 0.11
najczęściej występującą w 5 0.29
próbie.
Moda dla tego przykładu wynosi 2

 Wartość modalna bywa bardzo użyteczna gdy wartości


zmiennej losowej nie są liczbowe (nie można policzyć średniej
czy też mediany). Np. dla ciągu {jabłko, gruszka, jabłko,
pomarańcza, gruszka, banan, jabłko} dominantą jest {jabłko}
Miary zmienności

 Rozstęp – różnica pomiędzy wartością maksymalną, a


minimalną cechy - jest miarą charakteryzującą
empiryczny obszar zmienności badanej cechy, nie daje
on jednak informacji o zróżnicowaniu poszczególnych
wartości cechy w zbiorowości. Np. dla ciągu
{1,2,3,4,5,6} rozstęp wynosi 5

 Wariancja - jest to średnia arytmetyczna kwadratów


odchyleń poszczególnych wartości cechy od średniej
arytmetycznej zbiorowości.
Przykład: ciąg {1,2,3,4,5,6}
suma 1+2+3+4+5+6 = 21
średnia zbiorowości = 21/6 = 3.5
odchylenia - 2.5, 1.5, 0.5, 0.5, 1.5, 2.5
kwadraty odchyleń - 6.25, 2.25, 0.25, 0.25, 2.25, 6.25
średnia kwadratów odchyleń - 17.5/6 = 2.91
Wariancja – 2.91
Miary zmienności

 Odchylenie standardowe – jest to pierwiastek kwadratowy z


wariancji i określa przeciętne zróżnicowanie poszczególnych
wartości cechy od średniej arytmetycznej – dla ciągu
{1,2,3,4,5,6} odchylenie standardowe wynosi 1.705

 Odchylenie przeciętne - jest to średnia arytmetyczna


bezwzględnych odchyleń wartości cechy od średniej
arytmetycznej. Określa o ile jednostki danej zbiorowości
różnią się średnio, ze względu na wartość cechy, od średniej
arytmetycznej.

Przykład: ciąg {1,2,3,4,5,6}


suma 1+2+3+4+5+6 = 21
średnia zbiorowości = 21/6 = 3.5
odchylenia - 2.5, 1.5, 0.5, 0.5, 1.5, 2.5
Odchylenie przeciętne - 9/6 = 1,5

You might also like