Professional Documents
Culture Documents
Stat Is Tika
Stat Is Tika
OSNOVNI POJMI
Definicija 1:
Statistika je veda, ki se ukvarja s proučevanjem množičnih pojavov v
določenem prostoru in času.
STATISTIKA
Množičen pojav:
ocenjevanje dijakov
Simona PUSTAVRH,
merjenje višin dijakov
ŠC Novo mesto
branje knjig dijakov
smučanje v Sloveniji
merjenje krvnega tlaka
promet skozi določeno križišče
mesečne plače zaposlenih
serijska proizvodnja določenega izdelka
1 2
Definicija 2:
Osnovne naloge statistike: Populacija je množica, ki jo želimo statistično proučiti. Statistična
enota je en element populacije.
zbiranje podatkov (anketiranje, opazovanje, merjenje, štetje)
čiščenje, kodiranje in razvrščanje podatkov, Populacijo lahko sestavljajo živa bitja, predmeti, dogodki.
urejanje in grafično prikazovanje podatkov,
Opredelitev populacije:
povzemanje in sprejemanje zaključkev (odkrivanje lastnosti in
zakonitosti populacije in napovedovanje vrednosti). stvarno (kdo ali kaj spada v populacijo in kdo ne)
geografsko (kje je populacija opazovana)
časovno (kdaj je zajeta)
3 4
Definicija 4:
Preučevano lastnost (značilnost) enote imenujemo statistična
Definicija 3: spremenljivka. Vrednost statistične spremenljivke je lastnost ene
Vzorec je podmnožica (del) populacije. Vzorec je slučajen, če imajo vse opazovane enote in jo imenujemo podatek.
enote populacije enako možnost (enako verjetnost) biti izbrane v vzorec.
5 6
7 8
Odgovorite na naslednja vprašanja:
1 Kaj je v tem primeru populacija? S katerimi pogoji je opredeljena PRIMER 4
(stvarno, časovno, krajevno)? Izvedeti želimo, kakšno je mnenje dijakov na ŠC Novo mesto o malici v
2 Kaj je statistična enota? Kako velik je vzorec? šol. letu 2008/2009. Ker je število dijakov okoli 3000, ne moremo vprašati
vsakega, zato se odločimo, da bomo oblikovali vzorec velikosti 200 dijakov,
3 Katere statistične spremenljivke so predstavljene v tabeli? ki bo dobro predstavljal celo populacijo. Ali bi bil v ta namen ustrezen
4 Kakšna je posamezna spremenljivka glede na način izražanja? vzorec, ki bi zajemal prvih 200 dijakov, ki pridejo v torek zjutraj v šolo?
5 Katere parametre populacije bi lahko določili?
9 10
2. UREJANJE PODATKOV
Kdo zbira podatke?
šole
bolnišnice
podjetja
..
. Spoznali bomo:
SURS (uradna (državna) statistika) ranžirno vrsto
EUROSTAT (evropska statistika) grupiranje podatkov
EPICENTER, NINAMEDIA (javnomnenjske raziskave)
..
.
11 12
RANŽIRNA VRSTA PRIMER 5
Pot do šole. 12 dijakov smo vprašali, koliko časa porabijo za pot do šole.
Ranžirno vrsto predstavljajo po velikosti urejeni številski podatki. Rezultati v minutah so
Uporabljamo jo za urejanje majhnega števila številskih podatkov.
20, 38, 28, 35, 30, 40, 22, 32, 35, 32, 45, 35.
Vsakemu podatku določimo zaporedno mesto v ranžirni vrsti, ki ga
imenujemo rang. Zapiši podatke v ranžirno vrsto in jim določi rang.
Enaki podatki stojijo v ranžirni vrsti skupaj in imajo enak rang.
Rešitev:
Izračunamo ga kot povprečje rangov, ki bi jih podatki imeli, če bi bili
različni med seboj. Čas (min) 20 22 28 30 32 32 35 35 35 38 40 45
Rang
13 14
GRUPIRANJE PODATKOV
Grupiranje: združevanje podatkov v skupine (razrede):
PRIMER 6 najprej določimo skupne lastnosti enot v posameznih razredih (od 5
Poraba mleka. 50 slovenskih družin v neki vasi smo vprašali, koliko mleka do 20 razredov),
so porabili v prejšnjem tednu. Zbrani podatki v litrih so: vsaka enota mora biti v natanko enem razredu (ne sme se zgoditi, da
bi ista enota ustrezala lastnostim dveh razredov ali pa da za kakšno
1,1 1,7 1 0,5 0,9 2,1 2,3 2,3 2,6 3,1 3,7 3,9 3,1 2,5 3,3 3,3 3,9 3,8 4,1 4
enoto ne bi obstajal razred, v katerega bi jo uvrstili),
4,3 4,4 4,4 5,1 5,9 5,3 5,2 5,7 4,7 4,3 4,2 4,3 4,7 4,2 7,1 7,2 7,5 7,5 7,6
6,3 6,2 6,1 6,9 8,1 8,2 8,5 9,3 9,2 9,1 9,8 enote porazdelimo po razredih.
15 16
I. Grupiranje številskih spremenljivk v r razredov:
17 18
19 20
Kumulativna frekvenca Fi : število enot, ki imajo manjše vrednosti od Spodnja meja xi,s in zgornja meja xi,z razreda: zgornja meja razreda
spodnje meje i-tega razreda: i-tega razreda enaka spodnji meji (i + 1)-vega razreda:
21 22
PRIMER 8
Širina razreda di : razlika med zgornjo in spodnjo mejo razreda Poraba mleka - nadaljevanje. Za grupirane podatke iz primera o porabi
mleka izračunaj fi ◦ , fi %, Fi , Fi◦ , xi,s , xi,z , di , xi .
di = xi,z − xi,s
Rešitev:
Sredina razreda xi : aritmetična sredina spodnje in zgornje meje razreda:
Raz. Poraba mleka (l) fi fi ◦ fi % Fi Fi◦ xi,s xi,z di xi
xi,s + xi,z
xi = 1. 0−pod 2 5
2 2. 2−pod 4 13
3. 4−pod 6 16
Z grupiranjem enot v frekvenčne razrede dodelimo vsem enotam v i-tem
4. 6−pod 8 9
razredu isto vrednost xi , s čimer izgubimo nekaj natančnosti pri obdelavi 5. 8−pod 10 7
podatkov. Skupaj / 50
23 24
PRIMER 9 Rešitev:
Starost oseb. V okulistični ambulanti so včeraj pregledali 45 oseb. Raz. Starost fi fi ◦ fi % Fi Fi◦ xi,s xi,z di xi
Njihove starosti v letih so: 1. 1−10
2. 11−20
33 32 34 37 18 12 36 38 22 24 27 27 28 29 21 24 25 27 23 15 3 4 16 13 3. 21−30
15 41 17 19 8 44 45 6 2 7 38 26 25 47 42 25 48 31 35 35 33 4. 31−40
5. 41−50
Podatke grupiraj v razrede, kot so oblikovani v tabeli, nato pa za vsak Skupaj /
razred izračunaj fi ◦ , fi %, Fi , Fi◦ , xi,s , xi,z , di , xi .
25 26
PRIMER 10
Potniki na vlaku. Na vlaku so želeli ugotoviti strukturo potnikov.
II. Grupiranje opisnih podatkov Razdelili so jih na dijake, študente, delavce, brezposelne in upokojence.
Zbrani podatki so:
Za vsak razred lahko določimo le relativno frekvenco in strukturni odstotek
vsakega razreda. dijak dijak dijak delavec brezposelen brezposelen brezposelen upokojenec
upokojenec dijak dijak dijak dijak dijak dijak dijak študent študent študent
Razred Lastnost spr. fi fi ◦ fi % študent delavec delavec delavec delavec dijak dijak dijak dijak dijak dijak
1. lastnost 1 f1 f1◦ f1 % študent študent študent študent študent študent dijak dijak dijak dijak
2. lastnost 2 f2 f2◦ f2 %
.. .. .. .. dijak študent študent študent delavec delavec dijak dijak dijak dijak
. . . . delavec delavec delavec delavec delavec delavec brezposelen brezposelen
r. lastnost r fr fr◦ fr % brezposelen študent študent študent delavec delavec delavec upokojenec
Skupaj / N 1 100 upokojenec brezposelen brezposelen študent študent študent upokojenec
upokojenec delavec upokojenec upokojenec študent študent študent
Frekvenčna porazdelitev opisne spremenljivke
študent dijak dijak dijak dijak dijak upokojenec upokojenec upokojenec
upokojenec
Št. družin
10 9
8 7
5
Excel: COUNTIF (pogoj je posamezna kategorija) 6
4
2
0
0-2 2-4 4-6 6-8 8 - 10
Poraba mleka v l
Frekvenčni poligon je linijski poligon v pravokotnem koordinatnem Strukturni stolpec uporabljamo za prikaz strukturnih odstotkov.
sistemu, ki povezuje točke, katerih abscise so enake sredinam frekvenčnih Narišemo stolpec poljubne širine in poljubne višine. Višino stolpca
razredov, ordinate pa frekvencam: (xi , fi ). Da grafikon povežemo z proglasimo za 100 %, nato pa jo razdelimo v razmerju strukturnih
abscisno osjo, dodamo še točki (x0 , 0) in (xr +1 , 0). odstotkov. Posamezne dele stolpca ponavadi šrafiramo ali pobarvamo z
različnimi barvami, zato za pojasnitev dodamo legendo.
18
16
16 100%
14
13
12 80%
Št. družin
10 9
8
7 Odstotek
60% upokojenci
6 brezposelni
5 delavci
4 študenti
40%
2 dijaki
0 0 0
-1 1 3 5 7 9 11 20%
Poraba mleka v l
0%
31 32
Tudi strukturni krog uporabljamo za prikaz strukturnih odstotkov. Delež Prikaz s stolpci je podoben histogramu, uporabljamo pa ga lahko za
enot v posameznem razredu je prikazan s krožnim izsekom. Velikost prikaz grupiranih opisnih ali številskih podatkov. Širina stolpca je
središčnega kota za vsak razred izračunamo kot odstotek polnega kota: poljubna, višina stolpca pa je premosorazmerna s frekvenco razreda.
fi % · 360◦ . Tudi strukturni krog opremimo z legendo.
35
13,3%
30
25
33,3%
8,9% dijaki
Število oseb
študenti 20
delavci
brezposelni 15
upokojenci
10
18,9%
5
0
dijaki študenti delavci brezposelni upokojenci
25,6%
33 34
PRIMER 11 PRIMER 12
Spodnji grafikon prikazuje zaslužke dijaka preko študentskega servisa v Spodnji grafikon prikazuje iste zaslužke dijaka preko študentskega servisa v
enem letu. Primerjaj zaslužke dijaka po mesecih. enem letu kot prejšnji grafikon. V čem je razlika? Kaj lahko zdaj povemo
o višinah zaslužkov dijaka po mesecih?
35 36
4. SREDNJE VREDNOSTI
MEDIANA
Definicija 6:
Mediana (ali središčnica) je srednja vrednost, od katere ima polovica
Srednja vrednost je mera za osredinjenost podatkov. Pove, kje se enot manjše ali enake vrednosti, polovica pa večje ali enake. Označili jo
nahajajo podatki. Obravanali bomo tri srednje vrednosti: bomo z Me.
mediana
Mediano za majhno število podatkov najhitreje določimo tako, da podatke
modus
najprej uredimo po velikosti v ranžirno vrsto, nato izračunamo mesto, na
aritmetična sredina (povprečje) katerem se nahaja mediana: N+1 2 . Če ta vrednost ni celo število, je
mediana povprečje sosednjih dveh vrednosti.
37 38
MODUS
PRIMER 13 Definicija 7:
Določi mediano zamud avtobusa v petih dneh: 2, 2, 6, 7, 10 min. Rezultat Modus (ali gostiščnica) je srednja vrednost, ki je enaka tisti vrednosti
komentiraj. spremenljivke, ki se najpogosteje pojavlja. Označili ga bomo z Mo.
PRIMER 14
Določi mediano zamud avtobusa v šestih dneh: 2, 2, 6, 7, 10, 15 min. PRIMER 15
Rezultat komentiraj. Določi modus zamud avtobusa v petih dneh: 2, 2, 6, 7, 10 min. Rezultat
komentiraj.
Mediana je določena z mestom v ranžirni vrsti, zato ekstremno veliki (ali
majhni) podatki ne vplivajo na njeno vrednost. Med podatki je lahko tudi več modusov (tiste vrednosti, ki se
enakomnogokrat pojavljajo največkrat).
Excel: MEDIAN
Excel: MODE
39 40
ARITMETIČNA SREDINA PRIMER 16
Izračunaj aritmetično sredino zamud avtobusa v petih dneh: 2, 2, 6, 7, 10
Definicija 8: min.
Aritmetična sredina (povprečje) je srednja vrednost, ki jo dobimo tako, 1 Rezultat komentiraj.
da vsoto vseh vrednosti spremenljivke delimo s številom enot v populaciji
N. Označili jo bomo z µ ali x :
2 Kako bi se spremenila aritmetična sredina, če bi vsakemu podatku
prišteli 5 min?
3 Kako bi se spremenila aritmetična sredina, če bi podatek pomnožili s
x1 + x2 + · · · + xN Σ N xi
µ= ali µ = i=1 5?
N N
4 Kolišna bi bila vsota podatkov, če bi vsakega nadomestili z
aritmetično sredino?
5 Od vsakega podatka odštej aritmetično sredino. Kolikšna je vsota teh
Excel: AVERAGE
vrednosti?
41 42
PRIMER 19
PRIMER 17
Povprečna ocena pisne naloge iz matematike petih dijakov je 3,2. Kaj
Ali je smiselno izračunati aritmetično sredino spremenljivke spol ali pa
lahko poveš o ocenah pisne naloge posameznih dijakov?
spremenljivke kraj bivanja? Odgovor obrazloži.
43 44
5. RAZPRŠENOST PODATKOV
VARIACIJSKI RAZMIK
VR = xmax − xmin
PRIMER 20
Obravnavali bomo naslednje mere za razpršenost:
Izračunaj variacijski razmik zamud avtobusa v petih dneh: 2, 2, 6, 7, 10
variacijski razmik min. Rezultat komentiraj.
standardni odklon (standardna deviacija)
Excel: VR = MAX - MIN (izračunamo, ker ni posebnega ukaza)
medčetrtinski razmik
45 46
Dokaz. Excel:
standardni odklon: STDEVP
47 48
Uporaba žepnega računala
Kaj pove standardni odklon?
Vnos podatkov: Spoznajmo najprej normalno porazdelitev podatkov:
vključimo statistiko (na ekranu se izpiše STAT ali S ali SD)
vsak podatek posebej vnesemo tako, da ga vtipkamo, nato pa
pritisnemo tipko DATA (ali D ali x )
Branje rezultatov:
število podatkov: tipka n
aritmetična sredina: tipka x
standardni odklon: tipka σn
PRIMER 22
S pomočjo žepnega računala izračunaj aritmetično sredino in standardni
odklon zamud avtobusa v petih vožnjah: 2,2,6,7,10 min. Rezultata
primerjaj s prejšnjima rezultatoma.
49 50
51 52
Aritmetična sredina (povprečje) grupiranih podatkov
(tudi tehtana aritmetična sredina): Pri izračunu si pomagamo z razširjeno frekvenčno porazdelitvijo:
f1 x1 + f2 x2 + · · · + fr xr Σr fi xi razred vrednost fi xi fi xi fi xi2
µ= ali µ = i=1 1. x1,min − x1,max f1 x1 f1 x1 f1 x12
N N
2. x2,min − x2,max f2 x2 f2 x2 f2 x22
.. .. .. .. ..
Standardni odklon grupiranih podatkov: . . . . .
r. xr ,min − xr ,max fr xr fr xr fr xr2
Skupaj / N / Σri=1 fi xi Σi=1 fi xi2
r
Σri=1 fi xi2
σ= − µ2
N
53 54
Aritmetična sredina:
55 56
Aritmetična sredina:
57 58
59 60
Rešitev:
PRIMER 26
V T1A so dijaki zbrali podatke o številu ur, ki so jih prejšnji teden preživeli
za računalnikom. Zbrani podatki so:
2, 2, 3, 4, 5, 6, 6, 7, 7, 8, 9, 10, 11, 11, 12, 12, 15, 15, 16, 17, 18, 21, 21,
21, 22, 24, 25, 28, 30, 30, 34
61 62
Rešitev:
PRIMER 27
Na zdravniškem pregledu so stehtali 17 dijakov manjšega razreda. Njihove
teže v kg so:
50, 52, 53, 55, 56, 56, 60, 61, 64, 64, 65, 67, 71, 72, 73, 73, 80
63 64
PRIMER 28 PRIMER 29
Primerjaj osebne dohodke moških in žensk v nekem podjetju na spodnjem Primerjaj osebne dohodke moških in žensk v nekem podjetju na spodnjem
grafikonu. Kaj lahko sklepaš iz slike? grafikonu. Kaj lahko sklepaš iz slike?
65 66
1. l. % 2. l. % 3. l. % 4. l. % Sk. %
PRIMER 30 Zadov. 35 45 35 20 135
Z anketo smo želeli raziskati zadovoljstvo srednješolcev s šolsko malico, Nezadov. 15 15 10 50 90
zato smo anketirali 225 dijakov. Rezultati so zbrani v tabeli: Skupaj 50 60 45 70 225
67 68
8. POVEZANOST ŠTEVILSKIH SPREMENLJIVK
Grafični prikaz strukture
PRIMER 31
Voznik beleži število kilometrov, ki jih prevozi s svojim avtomobilom, in
porabo goriva pri vsaki vožnji. Ugotoviti želi, kako je poraba goriva
povezana s številom prevoženih kilometrov.
Kateri statistični spremenljivki nastopata v primeru?
Ali bo pri različnih vožnjah, ko bo prevozil enako število kilometrov,
vedno porabil enako količino goriva?
Koliko goriva bo porabil za vožnje, pri katerih bo prevozil manj km, v
primerjavi z vožnjami, pri katerih bo prevozil več km?
Razmisli, kaj vpliva na porabo goriva.
69 70
Razsevni diagram:
Razsevni diagram
71 72
Linearna povezanost
73 74
premica je padajoča)
75 76
Rešitev:
PRIMER 32
Voznik je za 12 voženj zabeležil število prevoženih kilometrov in porabo
goriva v litrih. Rezultati so prikazani v tabeli:
Pot (km) 20 35 60 35 65 50 40 25 25 45 10 15
Gorivo (l) 2,5 3,8 6 4 5,5 4 3,5 2,5 3 4 1,8 2
77 78
PRIMER 33
Poraba električne energije. Dijak je doma 7 tednov beležil tedensko
porabo električne energije. Podatki v kWh so zbrani v tabeli:
79 80
Nelinearna povezanost
Rešitev: a)
PRIMER 34
Ali spodnji grafikon prikazuje linearno povezanost spremenljivk?
81 82
PRIMER 35 PRIMER 36
Ali spodnji grafikon prikazuje linearno povezanost spremenljivk? Ali spodnji grafikon prikazuje linearno povezanost spremenljivk?
80 700
70 600
60
50
400
40
300
30
200
20
10 100
0 0
0 1 2 3 4 5 6 7 8 9 10 0 2 4 6 8 10 12 14
Leto Mesec
83 84