Download as pdf or txt
Download as pdf or txt
You are on page 1of 21

1.

OSNOVNI POJMI

Definicija 1:
Statistika je veda, ki se ukvarja s proučevanjem množičnih pojavov v
določenem prostoru in času.
STATISTIKA
Množičen pojav:
ocenjevanje dijakov
Simona PUSTAVRH,
merjenje višin dijakov
ŠC Novo mesto
branje knjig dijakov
smučanje v Sloveniji
merjenje krvnega tlaka
promet skozi določeno križišče
mesečne plače zaposlenih
serijska proizvodnja določenega izdelka

1 2

Definicija 2:
Osnovne naloge statistike: Populacija je množica, ki jo želimo statistično proučiti. Statistična
enota je en element populacije.
zbiranje podatkov (anketiranje, opazovanje, merjenje, štetje)
čiščenje, kodiranje in razvrščanje podatkov, Populacijo lahko sestavljajo živa bitja, predmeti, dogodki.
urejanje in grafično prikazovanje podatkov,
Opredelitev populacije:
povzemanje in sprejemanje zaključkev (odkrivanje lastnosti in
zakonitosti populacije in napovedovanje vrednosti). stvarno (kdo ali kaj spada v populacijo in kdo ne)
geografsko (kje je populacija opazovana)
časovno (kdaj je zajeta)

3 4
Definicija 4:
Preučevano lastnost (značilnost) enote imenujemo statistična
Definicija 3: spremenljivka. Vrednost statistične spremenljivke je lastnost ene
Vzorec je podmnožica (del) populacije. Vzorec je slučajen, če imajo vse opazovane enote in jo imenujemo podatek.
enote populacije enako možnost (enako verjetnost) biti izbrane v vzorec.

Slučajni vzorec predstavlja (reprezentira) celotno populacijo. PRIMER 1


Statistične spremenljivke: višina dijaka, ocena dijaka.
Enostavno slučajno vzorčenje: žrebanje (loterijski način)
vzorci s ponavljanjem (enota, ki je bila že izbrana v vzorec, je Definicija 5:
ponovno izbrana), Parameter je statistična karakteristika populacije.
vzorci brez ponavljanja (enota, ki je bila že izbrana v vzorec, ne more
biti ponovno izbrana). PRIMER 2
Parametri: povprečna višina dijakov, povprečna ocena dijakov.

Število enot populacije označimo z N.

5 6

Glede na način izražanja podatke ločimo na:


PRIMER 3
opisne (ali kvalitativne): vrednosti le opišemo z besedami in jih ne
V tabeli so zbrani nekateri podatki slučajnega vzorca dijakov Šolskega
moremo ovrednotiti numerično (npr. spol, kraj bivanja, barva
centra Novo mesto v šolskem letu 2009/2010:
avtomobila),
vrstne (ali ordinalne): vrednosti lahko uredimo le po velikosti,
Zap.št. Spol Letnik Št. bratov/sester Višina (cm)
njihova razmerja pa nimajo pomena (npr. šolska ocena, doseženo 1. moški 1 1 174,3
mesto na tekmi, zadovoljstvo z malico), 2. ženski 3 2 169,7
številske (ali kvantitativne): vrednosti izrazimo numerično oz. 3. ženski 1 0 164,2
številsko. Ločimo diskretne in zvezne številske podatke. 4. moški 2 2 182,9
Nezvezne (ali diskretne): zaloga vrednosti končna ali neskončna 5. moški 3 3 186,2
množica realnih števil (npr. število prometnih nesreč, št. prebranih 6. moški 4 1 180,1
knjig, št. dijakov v razredu). 7. ženski 4 0 172,8
Zvezne: zavzamejo lahko vsako vrednost iz nekega intervala (npr. 8. moški 2 1 177,7
višina ali teža dijaka, višina žepnine, cena knjig).

7 8
Odgovorite na naslednja vprašanja:
1 Kaj je v tem primeru populacija? S katerimi pogoji je opredeljena PRIMER 4
(stvarno, časovno, krajevno)? Izvedeti želimo, kakšno je mnenje dijakov na ŠC Novo mesto o malici v
2 Kaj je statistična enota? Kako velik je vzorec? šol. letu 2008/2009. Ker je število dijakov okoli 3000, ne moremo vprašati
vsakega, zato se odločimo, da bomo oblikovali vzorec velikosti 200 dijakov,
3 Katere statistične spremenljivke so predstavljene v tabeli? ki bo dobro predstavljal celo populacijo. Ali bi bil v ta namen ustrezen
4 Kakšna je posamezna spremenljivka glede na način izražanja? vzorec, ki bi zajemal prvih 200 dijakov, ki pridejo v torek zjutraj v šolo?
5 Katere parametre populacije bi lahko določili?

9 10

2. UREJANJE PODATKOV
Kdo zbira podatke?
šole
bolnišnice
podjetja
..
. Spoznali bomo:
SURS (uradna (državna) statistika) ranžirno vrsto
EUROSTAT (evropska statistika) grupiranje podatkov
EPICENTER, NINAMEDIA (javnomnenjske raziskave)
..
.

Programski paketi za obdelavo podatkov:


Excel, SPSS, SAS, Minitab, Mathlab, S-Plus, . . .

11 12
RANŽIRNA VRSTA PRIMER 5
Pot do šole. 12 dijakov smo vprašali, koliko časa porabijo za pot do šole.
Ranžirno vrsto predstavljajo po velikosti urejeni številski podatki. Rezultati v minutah so
Uporabljamo jo za urejanje majhnega števila številskih podatkov.
20, 38, 28, 35, 30, 40, 22, 32, 35, 32, 45, 35.
Vsakemu podatku določimo zaporedno mesto v ranžirni vrsti, ki ga
imenujemo rang. Zapiši podatke v ranžirno vrsto in jim določi rang.
Enaki podatki stojijo v ranžirni vrsti skupaj in imajo enak rang.
Rešitev:
Izračunamo ga kot povprečje rangov, ki bi jih podatki imeli, če bi bili
različni med seboj. Čas (min) 20 22 28 30 32 32 35 35 35 38 40 45
Rang

13 14

GRUPIRANJE PODATKOV
Grupiranje: združevanje podatkov v skupine (razrede):
PRIMER 6 najprej določimo skupne lastnosti enot v posameznih razredih (od 5
Poraba mleka. 50 slovenskih družin v neki vasi smo vprašali, koliko mleka do 20 razredov),
so porabili v prejšnjem tednu. Zbrani podatki v litrih so: vsaka enota mora biti v natanko enem razredu (ne sme se zgoditi, da
bi ista enota ustrezala lastnostim dveh razredov ali pa da za kakšno
1,1 1,7 1 0,5 0,9 2,1 2,3 2,3 2,6 3,1 3,7 3,9 3,1 2,5 3,3 3,3 3,9 3,8 4,1 4
enoto ne bi obstajal razred, v katerega bi jo uvrstili),
4,3 4,4 4,4 5,1 5,9 5,3 5,2 5,7 4,7 4,3 4,2 4,3 4,7 4,2 7,1 7,2 7,5 7,5 7,6
6,3 6,2 6,1 6,9 8,1 8,2 8,5 9,3 9,2 9,1 9,8 enote porazdelimo po razredih.

Ali so podatki dovolj pregledni, da lahko povemo kaj o porabi mleka?

15 16
I. Grupiranje številskih spremenljivk v r razredov:

Najmanjša vrednost, ki še sodi v i-ti razred: xi,min


Največja vrednost, ki še sodi v i-ti razred: xi,max
PRIMER 7
(Absolutna) frekvenca razreda fi : število enot v i-tem razredu Poraba mleka. 50 slovenskih družin v neki vasi smo vprašali, koliko mleka
so porabili v prejšnjem tednu. Zbrani podatki v litrih so:
Frekvenčna tabela ali frekvenčna porazdelitev: predstavitev razredov in
pripadajočih frekvenc: 1,1 1,7 1 0,5 0,9 2,1 2,3 2,3 2,6 3,1 3,7 3,9 3,1 2,5 3,3 3,3 3,9 3,8 4,1 4
4,3 4,4 4,4 5,1 5,9 5,3 5,2 5,7 4,7 4,3 4,2 4,3 4,7 4,2 7,1 7,2 7,5 7,5 7,6
Razred Vrednost spr. fi
6,3 6,2 6,1 6,9 8,1 8,2 8,5 9,3 9,2 9,1 9,8
1. x1,min − x1,max f1
2. x2,min − x2,max f2 Zbrane podatke grupiraj v pet razredov in vsakemu razredu določi
.. ..
. . frekvenco.
r. xr ,min − xr ,max fr
Skupaj / N

Frekvenčna porazdelitev številske spremenljivke

17 18

Kaj lahko izračunamo za grupirane podatke?


Rešitev:
Razred Poraba mleka v l fi Relativna frekvenca fi ◦ : delež enot v i-tem razredu glede na število vseh
1. 0−pod 2 enot N, ki smo jih opazovali:
2. 2−pod 4
fi
3. 4−pod 6 fi ◦ =
4. 6−pod 8 N
5. 8−pod 10
Strukturni odstotek fi %: relativna frekvenca fi ◦ pomnožena s 100 %:
Skupaj /
fi % = fi ◦ · 100 %

19 20
Kumulativna frekvenca Fi : število enot, ki imajo manjše vrednosti od Spodnja meja xi,s in zgornja meja xi,z razreda: zgornja meja razreda
spodnje meje i-tega razreda: i-tega razreda enaka spodnji meji (i + 1)-vega razreda:

F1 = 0 in Fi = Fi−1 + fi−1 (za i > 1) xi,z = xi+1,s

Zvezna spremenljivka: xi,s = xi,min in xi,z = xi,max


Relativna kumulativna frekvenca Fi◦ : delež vseh opazovanih enot, ki
Celoštevilska spremenljivka(dve zaporedni celi števili se razlikujeta za
imajo manjše vrednosti od spodnje meje i-tega razreda:
1 - enotski razmik):
Fi xi,s = xi,min − 0, 5
Fi◦ =
N xi,z = xi,max + 0.5

21 22

PRIMER 8
Širina razreda di : razlika med zgornjo in spodnjo mejo razreda Poraba mleka - nadaljevanje. Za grupirane podatke iz primera o porabi
mleka izračunaj fi ◦ , fi %, Fi , Fi◦ , xi,s , xi,z , di , xi .
di = xi,z − xi,s
Rešitev:
Sredina razreda xi : aritmetična sredina spodnje in zgornje meje razreda:
Raz. Poraba mleka (l) fi fi ◦ fi % Fi Fi◦ xi,s xi,z di xi
xi,s + xi,z
xi = 1. 0−pod 2 5
2 2. 2−pod 4 13
3. 4−pod 6 16
Z grupiranjem enot v frekvenčne razrede dodelimo vsem enotam v i-tem
4. 6−pod 8 9
razredu isto vrednost xi , s čimer izgubimo nekaj natančnosti pri obdelavi 5. 8−pod 10 7
podatkov. Skupaj / 50

Excel: grupiranje: FREQUENCY, nato CTRL-SHIFT-ENTER

23 24
PRIMER 9 Rešitev:
Starost oseb. V okulistični ambulanti so včeraj pregledali 45 oseb. Raz. Starost fi fi ◦ fi % Fi Fi◦ xi,s xi,z di xi
Njihove starosti v letih so: 1. 1−10
2. 11−20
33 32 34 37 18 12 36 38 22 24 27 27 28 29 21 24 25 27 23 15 3 4 16 13 3. 21−30
15 41 17 19 8 44 45 6 2 7 38 26 25 47 42 25 48 31 35 35 33 4. 31−40
5. 41−50
Podatke grupiraj v razrede, kot so oblikovani v tabeli, nato pa za vsak Skupaj /
razred izračunaj fi ◦ , fi %, Fi , Fi◦ , xi,s , xi,z , di , xi .

25 26

PRIMER 10
Potniki na vlaku. Na vlaku so želeli ugotoviti strukturo potnikov.
II. Grupiranje opisnih podatkov Razdelili so jih na dijake, študente, delavce, brezposelne in upokojence.
Zbrani podatki so:
Za vsak razred lahko določimo le relativno frekvenco in strukturni odstotek
vsakega razreda. dijak dijak dijak delavec brezposelen brezposelen brezposelen upokojenec
upokojenec dijak dijak dijak dijak dijak dijak dijak študent študent študent
Razred Lastnost spr. fi fi ◦ fi % študent delavec delavec delavec delavec dijak dijak dijak dijak dijak dijak
1. lastnost 1 f1 f1◦ f1 % študent študent študent študent študent študent dijak dijak dijak dijak
2. lastnost 2 f2 f2◦ f2 %
.. .. .. .. dijak študent študent študent delavec delavec dijak dijak dijak dijak
. . . . delavec delavec delavec delavec delavec delavec brezposelen brezposelen
r. lastnost r fr fr◦ fr % brezposelen študent študent študent delavec delavec delavec upokojenec
Skupaj / N 1 100 upokojenec brezposelen brezposelen študent študent študent upokojenec
upokojenec delavec upokojenec upokojenec študent študent študent
Frekvenčna porazdelitev opisne spremenljivke
študent dijak dijak dijak dijak dijak upokojenec upokojenec upokojenec
upokojenec

Oblikuj frekvenčno porazdelitev podatkov, nato pa za vsak razred


izračunaj fi ◦ in fi %.
27 28
3. GRAFIČNO PRIKAZOVANJE PODATKOV
Histogram je prikaz grupiranih številskih podatkov v pravokotnem
koordinatnem sistemu s stolpci, kjer vsak stolpec ustreza enemu razredu.
Rešitev: Če so razredi enako široki, so višine stolpcev premosorazmerne s
Razred Potniki fi fi ◦ fi % frekvencami razredov, sicer so s frekvencami premosorazmerne ploščine
1. dijak pravokotnikov.
2. študent
3. delavec
18
4. brezposelen 16
16
13
5. upokojenec 14
12
Skupaj /

Št. družin
10 9
8 7
5
Excel: COUNTIF (pogoj je posamezna kategorija) 6
4
2
0
0-2 2-4 4-6 6-8 8 - 10
Poraba mleka v l

Excel: Stolpični diagram (zmanjšamo presledke med stolpci, primeren za


prikaz zveznih številskih podatkov)
29 30

Frekvenčni poligon je linijski poligon v pravokotnem koordinatnem Strukturni stolpec uporabljamo za prikaz strukturnih odstotkov.
sistemu, ki povezuje točke, katerih abscise so enake sredinam frekvenčnih Narišemo stolpec poljubne širine in poljubne višine. Višino stolpca
razredov, ordinate pa frekvencam: (xi , fi ). Da grafikon povežemo z proglasimo za 100 %, nato pa jo razdelimo v razmerju strukturnih
abscisno osjo, dodamo še točki (x0 , 0) in (xr +1 , 0). odstotkov. Posamezne dele stolpca ponavadi šrafiramo ali pobarvamo z
različnimi barvami, zato za pojasnitev dodamo legendo.
18
16
16 100%

14
13
12 80%
Št. družin

10 9
8
7 Odstotek
60% upokojenci
6 brezposelni
5 delavci
4 študenti
40%
2 dijaki

0 0 0
-1 1 3 5 7 9 11 20%

Poraba mleka v l
0%

Excel: Črtni diagram (primeren za prikaz vrstnih in številskih podatkov)


Excel: Stolpični diagram (primeren za prikaz vrstnih in opisnih podatkov)

31 32
Tudi strukturni krog uporabljamo za prikaz strukturnih odstotkov. Delež Prikaz s stolpci je podoben histogramu, uporabljamo pa ga lahko za
enot v posameznem razredu je prikazan s krožnim izsekom. Velikost prikaz grupiranih opisnih ali številskih podatkov. Širina stolpca je
središčnega kota za vsak razred izračunamo kot odstotek polnega kota: poljubna, višina stolpca pa je premosorazmerna s frekvenco razreda.
fi % · 360◦ . Tudi strukturni krog opremimo z legendo.

35

13,3%
30

25
33,3%
8,9% dijaki

Število oseb
študenti 20
delavci
brezposelni 15
upokojenci

10
18,9%
5

0
dijaki študenti delavci brezposelni upokojenci
25,6%

Excel: Tortni diagram (primeren za prikaz vrstnih in opisnih podatkov)


Excel: Stolpični diagram (primeren za prikaz vrstnih in opisnih podatkov)

33 34

PRIMER 11 PRIMER 12
Spodnji grafikon prikazuje zaslužke dijaka preko študentskega servisa v Spodnji grafikon prikazuje iste zaslužke dijaka preko študentskega servisa v
enem letu. Primerjaj zaslužke dijaka po mesecih. enem letu kot prejšnji grafikon. V čem je razlika? Kaj lahko zdaj povemo
o višinah zaslužkov dijaka po mesecih?

35 36
4. SREDNJE VREDNOSTI

MEDIANA

Definicija 6:
Mediana (ali središčnica) je srednja vrednost, od katere ima polovica
Srednja vrednost je mera za osredinjenost podatkov. Pove, kje se enot manjše ali enake vrednosti, polovica pa večje ali enake. Označili jo
nahajajo podatki. Obravanali bomo tri srednje vrednosti: bomo z Me.
mediana
Mediano za majhno število podatkov najhitreje določimo tako, da podatke
modus
najprej uredimo po velikosti v ranžirno vrsto, nato izračunamo mesto, na
aritmetična sredina (povprečje) katerem se nahaja mediana: N+1 2 . Če ta vrednost ni celo število, je
mediana povprečje sosednjih dveh vrednosti.

37 38

MODUS
PRIMER 13 Definicija 7:
Določi mediano zamud avtobusa v petih dneh: 2, 2, 6, 7, 10 min. Rezultat Modus (ali gostiščnica) je srednja vrednost, ki je enaka tisti vrednosti
komentiraj. spremenljivke, ki se najpogosteje pojavlja. Označili ga bomo z Mo.

PRIMER 14
Določi mediano zamud avtobusa v šestih dneh: 2, 2, 6, 7, 10, 15 min. PRIMER 15
Rezultat komentiraj. Določi modus zamud avtobusa v petih dneh: 2, 2, 6, 7, 10 min. Rezultat
komentiraj.
Mediana je določena z mestom v ranžirni vrsti, zato ekstremno veliki (ali
majhni) podatki ne vplivajo na njeno vrednost. Med podatki je lahko tudi več modusov (tiste vrednosti, ki se
enakomnogokrat pojavljajo največkrat).
Excel: MEDIAN
Excel: MODE

39 40
ARITMETIČNA SREDINA PRIMER 16
Izračunaj aritmetično sredino zamud avtobusa v petih dneh: 2, 2, 6, 7, 10
Definicija 8: min.
Aritmetična sredina (povprečje) je srednja vrednost, ki jo dobimo tako, 1 Rezultat komentiraj.
da vsoto vseh vrednosti spremenljivke delimo s številom enot v populaciji
N. Označili jo bomo z µ ali x :
2 Kako bi se spremenila aritmetična sredina, če bi vsakemu podatku
prišteli 5 min?
3 Kako bi se spremenila aritmetična sredina, če bi podatek pomnožili s
x1 + x2 + · · · + xN Σ N xi
µ= ali µ = i=1 5?
N N
4 Kolišna bi bila vsota podatkov, če bi vsakega nadomestili z
aritmetično sredino?
5 Od vsakega podatka odštej aritmetično sredino. Kolikšna je vsota teh
Excel: AVERAGE
vrednosti?

41 42

Lastnosti aritmetične sredine:


Če vsakemu podatku prištejemo isto vrednost a, a > 0, se tudi PRIMER 18
aritmetična sredina poveča za a. Če vsakemu podatku odštejemo a, V skupini je 5 dijakov. Njihova povprečna starost je 15 let. Kaj lahko
se aritmetična sredina zmanjša za a. sklepamo?
Če vsak podatek pomnožimo z a, se tudi aritmetična sredina pomnoži
1 Da je največ dijakov starih 15 let.
z a. 2 Da so vsi dijaki stari približno 15 let.
Če vsak podatek nadmestimo z aritmetično sredino, ostane vsota 3 Da so vsi dijaki stari 15 let.
podatkov nespremenjena. 4 Da je polovica dijakov starih manj kot 15 let, polovica pa več kot 15
Če od vsakega podatka odštejemo aritmetično sredino (izračunamo let.
odklon od aritmetične sredine), je vsota vseh odklonov enaka 0. 5 Da je vsota starosti vseh otrok v skupini 75 let.

PRIMER 19
PRIMER 17
Povprečna ocena pisne naloge iz matematike petih dijakov je 3,2. Kaj
Ali je smiselno izračunati aritmetično sredino spremenljivke spol ali pa
lahko poveš o ocenah pisne naloge posameznih dijakov?
spremenljivke kraj bivanja? Odgovor obrazloži.

43 44
5. RAZPRŠENOST PODATKOV
VARIACIJSKI RAZMIK

Razpršenost (ali variabilnost) je lastnost podatkov, da lahko zavzamejo Definicija 9:


različne vrednosti. Podatki so lahko bolj ali manj razpršeni, kar je videti na Variacijski razmik je razlika med največjo in najmanjšo vrednostjo v
sliki: populaciji. Označimo ga z VR.

VR = xmax − xmin

PRIMER 20
Obravnavali bomo naslednje mere za razpršenost:
Izračunaj variacijski razmik zamud avtobusa v petih dneh: 2, 2, 6, 7, 10
variacijski razmik min. Rezultat komentiraj.
standardni odklon (standardna deviacija)
Excel: VR = MAX - MIN (izračunamo, ker ni posebnega ukaza)
medčetrtinski razmik

45 46

STANDARDNI ODKLON PRIMER 21


Izračunaj standardni odklon zamud avtobusa v petih dneh: 2, 2, 6, 7, 10
Definicija 10: min.
Standardni odklon (ali standardna deviacija) je enaka korenu povprečja 1 Rezultat komentiraj.
kvadratov odklonov vrednosti od aritmetične sredine. Označimo ga s σ:
2 Kaj bi se zgodilo s standardnim odklonom, če bi vsem vrednostim
 prišteli 5 min?
ΣN
i=1 (xi − µ)
2 3 Kako bi se spremenil standardni odklon, če bi vsak podatek pomnožili
σ=
N s 5?
Za uporabo je bolj preprosta formula:
 Če vsakemu podatku prištejemo a, se standardni odklon ne spremeni.
ΣN
i=1 xi
2 Če vsak podatek pomnožimo z a, a > 0, se tudi standardni odlklon
σ= − µ2
N pomnoži z a.

Dokaz. Excel:
standardni odklon: STDEVP

47 48
Uporaba žepnega računala
Kaj pove standardni odklon?
Vnos podatkov: Spoznajmo najprej normalno porazdelitev podatkov:
vključimo statistiko (na ekranu se izpiše STAT ali S ali SD)
vsak podatek posebej vnesemo tako, da ga vtipkamo, nato pa
pritisnemo tipko DATA (ali D ali x )

Branje rezultatov:
število podatkov: tipka n
aritmetična sredina: tipka x
standardni odklon: tipka σn

PRIMER 22
S pomočjo žepnega računala izračunaj aritmetično sredino in standardni
odklon zamud avtobusa v petih vožnjah: 2,2,6,7,10 min. Rezultata
primerjaj s prejšnjima rezultatoma.

49 50

Primeri normalno porazdeljenih podatkov:


ARITMETIČNA SREDINA IN STANDARDNI ODKLON
IQ ljudi GRUPIRANIH PODATKOV
teža odraslih ljudi
čas, ki ga potrebuje avtobus od Novega mesta do Ljubljane
dolžina žebljev pri serijski proizvodnji
PRIMER 23
Splošno: Dijaki v T1A, T1B in T1C so pisali pisno nalogo iz matematike.
Če je porazdelitev podatkov približno normalna (simetričen histogram), se Povprečna ocena dijakov iz T1A je 3,4, povprečna ocena v T1B je 3,2, v
približno 23 podatkov nahaja na intervalu [µ − σ, µ + σ]. T1C pa 2,9. Kolikšna je povprečna ocena dijakov vseh treh razredov?

51 52
Aritmetična sredina (povprečje) grupiranih podatkov
(tudi tehtana aritmetična sredina): Pri izračunu si pomagamo z razširjeno frekvenčno porazdelitvijo:
f1 x1 + f2 x2 + · · · + fr xr Σr fi xi razred vrednost fi xi fi xi fi xi2
µ= ali µ = i=1 1. x1,min − x1,max f1 x1 f1 x1 f1 x12
N N
2. x2,min − x2,max f2 x2 f2 x2 f2 x22
.. .. .. .. ..
Standardni odklon grupiranih podatkov: . . . . .
r. xr ,min − xr ,max fr xr fr xr fr xr2

Skupaj / N / Σri=1 fi xi Σi=1 fi xi2
r
Σri=1 fi xi2
σ= − µ2
N

53 54

Aritmetična sredina:

PRIMER 24 Standardni odklon:


Poraba mleka - nadaljevanje primera. Izračunaj aritmetično sredino in
standardni odklon porabe mleka 50 slovenskih družin prejšnji teden v neki
vasi. Rezultat obrazloži. Obrazložitev rezultata:

Rešitev: Frekvenčno tabelo dopolnimo s stolpcema fi xi in fi xi2 :

razred poraba mleka v l fi xi fi xi fi xi2


1. 0−pod 2 5 1
2. 2−pod 4 13 3
3. 4−pod 6 16 5
4. 6−pod 8 9 7
5. 8−pod 10 7 9
Skupaj / 50 /

55 56
Aritmetična sredina:

PRIMER 25 Standardni odklon:


Starost oseb - nadaljevanje primera Izračunaj aritmetično sredino in
standardni odklon starosti oseb, ki so bile včeraj pregledane v okulistični
ambulanti. Rezultat obrazloži.
Rešitev:
razred starost fi xi fi xi fi xi2
1. 1−10 6 5,5
2. 11−20 8 15,5
3. 21−30 14 25,5
4. 31−40 11 35,5
5. 41−50 6 45,5
Skupaj / 45 /

57 58

6. KVARTILI IN ŠKATLA Z BRKI


S pomočjo kvartilov lahko nazorno pokažemo razpršenost podatkov tako,
da narišemo škatlo z brki, za katero potrebujemo poleg kvartilov še
Definicija 11: najmanjšo in največjo vrednost med podatki.
Trije kvartili razdelijo številske podatke v ranžirni vrsti v štiri skupine:
prvi kvartil Q1 je tista vrednost, od katere je 25 % podatov manjših
(ali enakih) in 75 % podatkov večjih (ali enakih) - nahaja se na
N+1
4 -tem mestu
drugi kvartil Q2 je tista vrednost, od katere je 50 % podatov manjših
(ali enakih) in 50 % podatkov večjih (ali enakih) (tudi mediana) -
nahaja se na 2(N+1)
4 -tem mestu
tretji kvartil Q3 je tista vrednost, od katere je 75 % podatov manjših Škatlo z brki imenujemo tudi okvir z ročaji ali grafikon kvartilov (ang.
(ali enakih) in 25 % podatkov večjih (ali enakih) - nahaja se na box-and-whiskers plot ali box-plot).
3(N+1)
4 - tem mestu Definicija 12:
2(N+1) Medčertinski razmik Q je razlika med tretjim in prvim kvartilom. (Med
Če vrednosti N+1
4 , 4 in 3(N+1)
4 niso celoštevilske, vzamemo za kvartil
Q1 in Q3 se nahaja 50 % podatkov.)
povprečje sosednjih vrednosti.

59 60
Rešitev:

PRIMER 26
V T1A so dijaki zbrali podatke o številu ur, ki so jih prejšnji teden preživeli
za računalnikom. Zbrani podatki so:

2, 2, 3, 4, 5, 6, 6, 7, 7, 8, 9, 10, 11, 11, 12, 12, 15, 15, 16, 17, 18, 21, 21,
21, 22, 24, 25, 28, 30, 30, 34

1 Izračunaj vse tri kvartile in jih obrazloži.


2 Izračunaj medčetrtinski razmik.
3 Nariši škatlo z brki.

61 62

Rešitev:

PRIMER 27
Na zdravniškem pregledu so stehtali 17 dijakov manjšega razreda. Njihove
teže v kg so:

50, 52, 53, 55, 56, 56, 60, 61, 64, 64, 65, 67, 71, 72, 73, 73, 80

1 Izračunaj vse tri kvartile in jih obrazloži.


2 Izračunaj medčetrtinski razmik.
3 Nariši škatlo z brki.

63 64
PRIMER 28 PRIMER 29
Primerjaj osebne dohodke moških in žensk v nekem podjetju na spodnjem Primerjaj osebne dohodke moških in žensk v nekem podjetju na spodnjem
grafikonu. Kaj lahko sklepaš iz slike? grafikonu. Kaj lahko sklepaš iz slike?

65 66

7. POVEZANOST OPISNIH SPREMENLJIVK IN


KONTINGENČNA TABELA

Definicija 13: Struktura anketiranih dijakov po zadovoljstvu s šolsko malico za vsak


Kontingenčna ali dvorazsežna tabela prikazuje podatke po vrednostih dveh letnik:
opisnih spremenljivk hkrati.

1. l. % 2. l. % 3. l. % 4. l. % Sk. %
PRIMER 30 Zadov. 35 45 35 20 135
Z anketo smo želeli raziskati zadovoljstvo srednješolcev s šolsko malico, Nezadov. 15 15 10 50 90
zato smo anketirali 225 dijakov. Rezultati so zbrani v tabeli: Skupaj 50 60 45 70 225

Zadovoljstvo/Letnik 1. letnik 2. letnik 3. letnik 4. letnik


Zadovoljen 35 45 35 20
Nezadovoljen 15 15 10 50

Kaj lahko povemo o zadovoljstvu anketiranih dijakov z malico? Ali se


mnenja razlikujejo po letnikih?

67 68
8. POVEZANOST ŠTEVILSKIH SPREMENLJIVK
Grafični prikaz strukture

PRIMER 31
Voznik beleži število kilometrov, ki jih prevozi s svojim avtomobilom, in
porabo goriva pri vsaki vožnji. Ugotoviti želi, kako je poraba goriva
povezana s številom prevoženih kilometrov.
Kateri statistični spremenljivki nastopata v primeru?
Ali bo pri različnih vožnjah, ko bo prevozil enako število kilometrov,
vedno porabil enako količino goriva?
Koliko goriva bo porabil za vožnje, pri katerih bo prevozil manj km, v
primerjavi z vožnjami, pri katerih bo prevozil več km?
Razmisli, kaj vpliva na porabo goriva.

69 70

Razsevni diagram:

Spremenljivka X : število prevoženih kilometrov


Spremenljivka Y : količina porabljenega goriva

Povezanost med številskima spremenljivkama X in Y imenujemo


korelacija.

Povezanost spremenljivk lahko prikažemo v pravokotnem koordinatnem


sistemu, če eno od spremenljivk proglasimo za neodvisno in drugo za
odvisno. Tako dobljeni diagram imenujemo razsevni diagram.

Razsevni diagram

Excel: Raztreseni (XY)

71 72
Linearna povezanost

Spremenljivki X in Y sta povezani linearno, če točke v razsevnem


diagramu ležijo na isti premici ali pa se od nje bolj ali manj odklanjajo
(ovalna oblika množice točk v razsevnem diagramu).

Premico, ki se najbolj prilega točkam, imenujemo regresijska premica.

Ločimo pozitivno in negativno linearno povezanost.


Pozitivna linearna povezanost: večje vrednosti spremenljivke X so
povezane z v povprečju večjimi vrednostmi spremenljivke Y . (regresijska
premica je naraščajoča)

73 74

Negativna linearna povezanost: večje vrednosti spremenljivke X so


povezane z v povprečju manjšimi vrednostmi spremenljivke Y . (regresijska Ni povezanosti

premica je padajoča)

75 76
Rešitev:

PRIMER 32
Voznik je za 12 voženj zabeležil število prevoženih kilometrov in porabo
goriva v litrih. Rezultati so prikazani v tabeli:
Pot (km) 20 35 60 35 65 50 40 25 25 45 10 15
Gorivo (l) 2,5 3,8 6 4 5,5 4 3,5 2,5 3 4 1,8 2

a) Nariši razsevni diagram (v zvezek in z Excel ali z Graph). Ali je med


spremenljivkama opaziti linearno povezanost?
b) Določi enačbo regresijske premice (z Excel ali Graph). Premico vriši v
razsevni diagram.
c) Koliko goriva bo v povprečju porabil voznik za 42 km?

77 78

PRIMER 33
Poraba električne energije. Dijak je doma 7 tednov beležil tedensko
porabo električne energije. Podatki v kWh so zbrani v tabeli:

Zap. št. (k) teden kWh


1 1. teden 109
2 2. teden 98
3 3. teden 102
4 4. teden 103
5 5. teden 95
6 6. teden 90
7 7. teden 92

a) Nariši linijski diagram (v zvezek in z Excel ali Graph). Katera krivulja


bi se prilegala porabi električne energije?
b) Določi enačbo te krivulje (z Excel ali Graph). Vriši jo v diagram.
c) Kolikšno porabo električne energije lahko pričakujemo 8. teden?

79 80
Nelinearna povezanost
Rešitev: a)

PRIMER 34
Ali spodnji grafikon prikazuje linearno povezanost spremenljivk?

Excel: Črtni grafikon

b) Enačba linearnega trenda je y = −2, 6429x + 109.

c) Napoved za 8. teden: y = −2, 6429 · 8 + 109 = 87, 9 kWh.

81 82

PRIMER 35 PRIMER 36
Ali spodnji grafikon prikazuje linearno povezanost spremenljivk? Ali spodnji grafikon prikazuje linearno povezanost spremenljivk?

80 700

70 600

60

Vrednost delnice (EUR)


500
Višina kaktusa (mm)

50
400
40
300
30
200
20

10 100

0 0
0 1 2 3 4 5 6 7 8 9 10 0 2 4 6 8 10 12 14
Leto Mesec

83 84

You might also like