Download as pdf or txt
Download as pdf or txt
You are on page 1of 8

Pojam i razvoj statistike Statistika – trostruki sadržaj

1. Deskriptivna statistika (u užem smislu) –


• Skup numeričkih podataka (status – stanje) prikupljanje, obrada i prezentiranje podataka
• Prvi začeci statistike datiraju nekoliko vjekova prije nove
2. Statistička analiza – skup statističkih metoda
ere (Kina 4000 g.p.n.e) kvantitativne analize pojava i njihovih odnosa
3. Statistička teorija – iznalazi stat. metode,
• Razvoj statistike – razvoj informatičkog društva objašnjava ih, dokazuje i usavršava.

• Statističke tehnike se veoma često koriste u institucijama


sistema,zatim, u marketingu, računovodstvu, kontroli
kvaliteta, ponašanju potrošača, sportu, politici, medicini,
itd...

1 2

Predmet i način statističkog


Formiranje statističkog skupa zavisi od:
istraživanja
• Prirode pojave
• Masovne pojave (varijabilne po prirodi)
• Prirodne pojave i društvene pojave • Cilja istraživanja
• Statistika je naučni metod kvantitativnog istraživanja masovnih • Raspoloživih mogućnosti posmatranja
pojava.

• Statistički skup – skup svih elemenata na kojima se izvjesna pojava


statistički posmatra (populacija, osnovni skup) Statistički skup treba da ispunjava tri
• Elementi ili jedinice skupa – pojedinačni elementi iz kojih se skup
uslova:
sastoji
 Homogenost
 Diferenciranost
 Cjelovitost
3 4

Skup se određuje:
Vrste obilježja
• Prostorno
• Vremenski
Obilježja
• Pojmovno (sadržinski, stvarno)

• Statistička obilježja – osobine po kojima se Atributivna Numerička


jedinice određenog statističkog skupa (pol, boja očiju) (brojčana)
međusobno razlikuju
• Modaliteti obilježja - različiti vidovi u kojima se Prekidna Neprekidna
obilježja mogu javiti. (broj djece) (visina)

5 6
Statističko posmatranje po obimu:
Tri etape procesa statističkog
istraživanja:
• Potpuno
• Djelimično
• Statističko posmatranje
Statistički metodi istraživanja • Sređivanje, grupisanje i obrada podataka
 Metode sređivanja, prikupljanja i • Statistička analiza
prikazivanja podataka –deskriptivna
statistika
 Metodi statističke analize – analitička
statistika
7 8

Statističko zaključivanje Zašto uzorak?


• Postupak donošenja zaključaka o karakteristikama  Rad sa skupom može da bude:
statističkog skupa na osnovu posmatranja samo
jednog dijela tog skupa – uzorka.  Nemoguć
• Dvije osnovne oblasti:
 Nepraktičan
1. Ocjenjivanje nepoznatih parametara skupa
2. Testiranje stat. hipoteza  Previše skup

9 10

Uzorak i Populacija Mjerne skale

1. Nominalna skala: Podaci mogu biti


klasifikovani samo u modalitete i ne
mogu se rangirati. Između modaliteta ne
postoji obavezan redoslijed, ali se oni
međusobno isključuju.
PRIMJER: bračno stanje, pol, nacionalnost.

Populacija (N) Uzorak (n)


11 12
2. Ordinalna skala: Modaliteti se mogu rangirati, 3. Intervalna skala: uz redosljed modaliteta, daje
ali ne pokazuju veličinu njihovog razlikovanja. i apsolutne razlike između njih. Karakteriše je
PRIMJER: Prilikom testiranja četiri vrste sira, sir C određena jedinica mjere.
je rangiran brojem 1, sir B brojem 2, sir A PRIMJER: Temperatura.
brojem 3, i sir D brojem 4.

13 14

Grupisanje stat. podataka


4. Skala odnosa: Najveći nivo mjerenja. Slična • Prema obilježjima i vremenskim intervalima
prethodnoj s tim što uključuje nulu kao nivo • Ručno i mašinsko
mjerenja • Rezultat stat. obrade – stat. serije – nizovi
PRIMJER: Novac, visina, težina itd. sređenih podataka po nekom obilježju ili
hronologiji

15 16

Neprekidno obilježje
Serije strukture
• Raspored skupa po • Intervalne grupe
vrijednostima obilježja:
atributivnom i numeričkom
• Veličina grupnog intervala se određuje preko
Br. Soba u stanovima Broj stanova

obilježju 1 90 Sturges-ovog pravila za broj klasa, gdje je N


• Atributivno obilježje: pr.
2
3
125
26
ukupan broj podataka, Xmax i Xmin najveća i
Geografske serije 4 7 najmanja vrijednost obilježja:
5 2
• Numerička: prekidno i Ukupno 250
neprekidno X max  X min
k  1  3,3 log N l
k

17 18
Primjer 1
Primjer 1
• Izvršiti grupisanje studenata prema visini (u
cm) – uzorak sadrži 33 studenta: 167, 150, • N=33, k= 1+3,3log33=6,01=6, l=(210-150)/6=10
180, 195, 200, 205, 153, 167, 194, 195, 210,
193, 168, 183, 162, 157, 154, 190, 163, 170, Visina u cm frekvencije, f
172, 184, 185, 152, 187, 167, 175, 194, 180, 150-160 7
160,1-170 7
156, 183, 152, 194. 170,1-180 4
180,1-190 6
190,1-200 7
200,1-210 2

19 20

2-8

Sugestije za konstrukciju distribucije


Dobro i loše grupisanje frekvencija
Broj radnika Broj preduzeća Broj radnika Broj preduzeća
2-6
7-11
6
8
2-7
7-12
6
8
• Da li koristiti računski određenu širinu intervala
12-16
17-21
12
8
12-17
17-21
12
8
za konstruisanje distribucije frekvencija?
Ukupno 34 Ukupno 34 VAŽNO: Preporuka je da se koristi računski ali
ponekada je bolje i lakše koristiti vama
 Podjela podataka u grupe (klase, intervale) prirodniju. Npr. Ako ste izračunali širinu
 Klase treba da budu:
– Međusobno isključive intervala 97, možda je bolje koristiti 100.
• Da se ne preklapaju - svaka opservacija se pridružuje samo jednoj grupi
– Potpune - iscrpne
• Svaka opservacija je pridružena nekoj klasi
• Izračunati broj podataka u svakoj od klasa.
– Jednake-širine (ako je moguće)
• Prva ili zadnja grupa mogu da budu otvoreni intervali

21

Rasporedi frekvencija Rasporedi frekvencija


 Tabela sa 2 kolone koje sadrže: • Apsolutne frekvencije – broj jedinica koji
– Svaki modalitet ili interval vrijednosti
odgovara jednom atributu ili jednoj vrijednosti
– Pridruženu frekvenciju svake klase
• Broj opservacija pridružen svakoj klasi obilježja
• Zbir frekvenija je jednak broju opservacija
– N za populaciju
• Relativne frekvencije – ako frekvenciju
– n za uzorak izvjesnog atributa stavimo u odnos prema
 Sredina klase je njena središnja vrijednost ukupnom broju jedinica tog skupa.
 Relativna frekvencija je udio (procenat) svake klase u
ukupnim opservacijama fi
– Zbir relativnih frekvencija = 1 pi 
f i

23 24
Primjer 1 Raspored kumulativnih frekvencija

x F(x) F(x)/n
Nivo zarada($) Kumulativna frekvencija Relativna kumulativna frekvencija
x f(x) f(x)/n
Nivo zarada ($) Frekvencija (broj potrošača) Relativna frekvencija
0 do manje od 100 30 0.163
100 do manje od 200 68 0.370
0 do manje od 100 30 0.163
200 do manje od 300 118 0.641
100 do manje od 200 38 0.207
300 do manje od 400 149 0.810
200 do manje od 300 50 0.272
400 do manje od 500 171 0.929
300 do manje od 400 31 0.168
500 do manje od 600 184 1.000
400 do manje od 500 22 0.120
500 do manje od 600 13 0.070

184 1.000

Kumulativna frekvencija svake klase je zbir frekvencija te i


• Primjer relativne frekvencije: 30/184 = 0.163 svih prethodnih klasa.
• Zbir relativnih frekvencija = 1

25 26

Grafičko prikazivanje
Vremenske serije (hronološke)
x F(x)
• Kartogrami – geografske serije
• Nizovi stat. podataka Godina Prosječna posjećenost

koji pokazuju varijacije


utakmica Premijer lige • Dijagrami – tačkasti, linijski, površinski
1999 30
pojava tokom vremena 2000 68
(histogrami), prostorni (stereogrami)
• Momentne – nivo 2001 118
• Slike
• Intervalne - tok 2002 149

2003 171

2004 184

27 28

Grafički prikaz rasporeda frekvencija Štapićasti dijagram


• Prekidno obilježje: pomoću tačaka, štapićastih • Štapićasti dijagram može se koristiti za
dijagrama, linijskog dijagrama prikazivanje bilo kog nivoa mjerenja
• Neprekidno obilježje: histogram, poligon, krive (nominalni, ordinalni, intervalni, ili racio).
frekvencije i kumulante • Visine štapića (pravougaonika) predstavljaju
frekvencije klasa
• PRIMJER 2.: Konstruiši štapićasti dijagram za
broj nezaposlenih na 100,000 za odabrane
gradove.

29 30
Primjer 2.

10000
Grad Broj nezaposlenih na 9000
8000 7300
8900
8200
8900

6700

Nezaposleni
7000
100000 stanovnika 6000
5000
5400
Atlanta
Boston
Chicago
4000
Atlanta 7300 3000
2000
Los Angeles
New York
1000 Washington

Boston 5400 0
1 2 3 4 5 6
gradovi

Chicago 6700
Los Angeles 8900
New York 8200
Washington 8900

31 32

Primjer 3. Histogram
Troškovi i prihodi aviokompanija

12
Prosječni prihodi
Prosječni troškovi
 Histogram je karta napravljena od
10
pravougaonika različitih visina.
8 – Širine i lokacije pravougaonika odgovaraju
6
širinama i lokacijama klasa podataka
– Visine pravougaonika odgovaraju
4
frekvencijama ili relativnim frekvencijama klasa
2 podataka
0

American Continental Delta Northwest Southwest United USAir

33 34

Primjer 4.: anketirano je 30 studenata koliko vremena mjesečno


Primjer histograma utroše na učenje. Podaci su dati u tabeli.

Sati Frekvenci Relativne


Histogram frekvencija učenja je f frekvencij
e
9-13 1 1/30
50
50 14-18 12 12/30

40 38 19-23 10 10/30
Frekvuencija

30 31 24-28 5 5/30
30

22 29-33 1 1/30
20

13 33-38 1 1/30
10
100 200 300 400 500 600 TOTA 30 30/30=1
Dolari L
T

35 36
Histogram za primjer 4.
Poligon frekvencija

14
• Poligon frekvencija Sastoji se od linija koje povezuju
12
10
sredine intervala 14
Frekvencije

12
8
10

Frekvencije
6
4 8
2 6
0
10 15 20 25 30 35
4
Sati učenja 2
0
10 15 20 25 30 35
Sati učenja

37 38

Grafičko prikazivanje vremenskih serija


Raspored kumulativnih frekvencija
• Aritmetički dijagram
• Koristi se da prikaže koliko je podataka raspoređeno
ispod ili iznad određene tačke u nekom od intervala. • Polulogaritamski dijagram
35
30
• Polarni (sezonski karakter)
25
20
Frekvencije
15
10
5
0
10 15 20 25 30 35
Sati učenja

39 40

Dijagram vremenske serije “Pita” dijagram


• Pita dijagram je posebno pogodan za prikazivanje
t l
Mjesečna l
potrošnja ti
čelika
l
relativnih frekvencija. Krug je podijeljen srazmjerno
8 .5 relativnom učešću frekvencija u ukupnoj masi.
• PRIMJER 5.: Uzorak od 200 trkača je odabran za
anketiranje njihovih preferencija sportske opreme.
f Tona

7 .5
Millioni

6 .5

5 .5

Mjesetc J F M A M J J A S ON D J F M A M J J A S ON D J F M A M J J A S O

41 42
Primjer 5.

Tip patika # trkača


Asics
Reebok
Ostale
Nike 92 Nike
Adidas
Reebok
Adidas Asics

Adidas 49 Nike
Ostale

Reebok 37
Asics 13
ostale 9

43 44

You might also like