I 3. Vježba (R) D

Zadatak 1.
Prodava u butiku biljei koliinu prodanih majica pojedine

veliine i dobiveni su podaci dani sljedeom tablicom
XS
2
S
9
M 30
L
16
XL 7
XXL 3
Graki prikaite podatke pomou
(a) stupastog dijagrama
(b) stukturalnog kruga
(c) Pareto dijagrama
Rjeenje:
(a)
>
>
>
>
>
>
>
imena<-c('XS','S','M','L','XL','XXL')
f<-c(2,9,30,16,7,3)
fr<-f/sum(f)
kf<-cumsum(f)
kfr<-cumsum(fr)
majice<-data.frame(imena,f,kf,fr,kfr)
majice
imena f kf
fr
kfr
1
XS 2 2 0.02985075 0.02985075
2
S 9 11 0.13432836 0.16417910
3
M 30 41 0.44776119 0.61194030
4
L 16 57 0.23880597 0.85074627
5
XL 7 64 0.10447761 0.95522388
6 XXL 3 67 0.04477612 1.00000000
## Nacrtajmo histogram
> barplot(f,col=rainbow(length(f)),legend.text=imena, main='Histogram broja
prodanih majica po veliini')
(b)
> postotci<-round(f/sum(f)*100)
> imena1<-paste(imena,postotci, sep=", ")
> imena1<-paste(imena1,"%")
30
Histogram broja prodanih majica po velicini
10
15
20
25
XS
S
M
L
XL
XXL
XS
XL
XXL
> pie(f,labels=imena1,col=rainbow(6),main='Strukturalni krug

broja prodanih majica po veliini')
Strukturalni krug broja prodanih majica po velicini
M, 45 %
S, 13 %
XS, 3 %
XXL, 4 %
XL, 10 %
L, 24 %
## ili ako zelimo 3D prikaz

>library(plotrix)
>pie3D(f,labels=imena1,col=heat.colors(6),border=F,explode=0.05,
main='Strukturalni krug broja prodanih majica po veliini')
Strukturalni krug broja prodanih majica po velicini
M 45%,%
S 13%,%
XS 3%,%
XXL 4%,%
XL 10%,%
L 24%,%
(c)
>names(f)<-imena
>f<-data.frame(f)
>library(qcc)
>pareto.chart(f,main='Pareto dijagram broja prodanih majica po veliini')
Pareto chart analysis for f
Frequency Cum.Freq. Percentage Cum.Percent.
M
30.000000 30.000000 44.776119
44.776119
L
16.000000 46.000000 23.880597
68.656716
S
9.000000 55.000000 13.432836
82.089552
XL
7.000000 62.000000 10.447761
92.537313
XXL 3.000000 65.000000
4.477612
97.014925
XS
2.000000 67.000000 2.985075
100.000000
## ili ako zelimo u nekoj drugoj boji
>pareto.chart(f,col=terrain.colors(6),main='Pareto dijagram
broja prodanih majica po veliini')
## ostale mogue boje su: rainbow(), heat.colors(), topo.colors()
100%
70
Pareto dijagram broja prodanih majica po velicini
60
75%
50
50%
40
30
XS
XXL
XL
0%
10
25%
20
Frequency
Cumulative Percentage
## ako zelimo dodati vertikalnu liniju koja nam oznacava mjesto gdje kumulativna
suma dostize 75% od najvece vrijednosti koristimo sljedecu naredbu
> abline(h=(sum(f)*.75),col="red",lwd=3)
100%
70
Pareto dijagram broja prodanih majica po velicini
60
75%
50
50%
40
30
Zadatak 2.
XS
XXL
XL
0%
10
25%
20
Frequency
Cumulative Percentage
Promatrajui boju oiju uenika jednog razreda dobiveni su
sljedei podaci:
Boja oiju Frekvencija
Plava
10
Smea
11
Crna
2
Zelena
7
Odredite tablicu relativnih i kumulativnih frekvencija. Skicirajte histogram,
strukturalni krug, te Pareto diagram za dane podatke.
Zadatak 3. Kontrolor uzima serije od 30 proizvoda i svaki put zapie

broj defektnih proizvoda u seriji. Nakon 20 pregledanih serija dobiveni su
sljedei podaci:
0 0 1 1 0 0 3 1 0 2
0 1 0 0 4 0 0 3 2 0
(a) Odredite tablicu frekvencija i relativnih frekvencija i kumulanti

(b) Nacrtajte histogram, poligon frekvencija i kumulantu distribucije
Rjeenje:
(a)
> def<-c(0,0,1,1,0,0,3,1,0,2,0,1,0,0,4,0,0,3,2,0)
> def.f<-table(def)
> def.f
def
0 1 2 3 4
11 4 2 2 1
> def.fr<-def.f/sum(def.f)
> def.fr
def
0
1
2
3
4
0.55 0.20 0.10 0.10 0.05
> def.kf<-cumsum(def.f)
> def.kf
0 1 2 3 4
11 15 17 19 20
> def.kfr<-cumsum(def.fr)
> def.kfr
0
1
2
3
4
0.55 0.75 0.85 0.95 1.00
> defektni<-cbind(def.f,def.kf,def.fr,def.kfr)
> defektni
def.f def.kf def.fr def.kfr
0
11
11
0.55
0.55
1
4
15 0.20
0.75
2
2
17 0.10
0.85
3
2
19 0.10
0.95
4
1
20 0.05
1.00
(b)
> plot(def.f,type="b",lty=5,pch=10, col="dark blue", xlab="Broj
defektnih proizvoda u seriji od 20", ylab="Frekvencija")
> plot(def.fr,type="b")
> plot(def.kfr,type="b")
##ili
> plot(def.f,type="b")
> plot(def.fr,type="b")
> plot(def.kfr,type="s")
Zadatak 4. U 16 drava izmjerena je prosjena konzumacija maslinovog
ulja (u litrama) po glavi stanovnika u toku jedne godine i dobiveni su podaci
9.9 5.6 10.8 6.3 3.9 11.2 5.7 8.4

7.2 4.2 5.8 15.2 10.9 3.1 7.4 9.1
Nacrtajte histogram , poligon relativnih frekvencija i kumulantu distribucije

za dane podatke.
Rjeenje:
>podaci<-c(9.9,5.6,10.8,6.3,3.9,11.2,5.7,8.4,7.2,4.2,5.8,15.2,10.9,3.1,7.4,9.1)
> range(podaci)
[1] 3.1 15.2
> k<-round(1+3.3*log(length(podaci))/log(10))
> k
[1] 5
> r<-(max(podaci)-min(podaci))/k
> r
[1] 2.42
> razredi<-seq(3.0,15.5,by=2.5)
> razredi
[1] 3.0 5.5 8.0 10.5 13.0 15.5
## svakom od podataka pridruzimo razred u kojem se nalazi koristeci
funkciju 'cut'
> podaci.cut<-cut(podaci,razredi,right=F)
> podaci.cut
[1] [8,10.5) [5.5,8)
[10.5,13) [5.5,8)
[3,5.5) [10.5,13) [5.5,8)
[8] [8,10.5) [5.5,8)
[3,5.5) [5.5,8)
[13,15.5) [10.5,13) [3,5.5)
[15] [5.5,8) [8,10.5)
Levels: [3,5.5) [5.5,8) [8,10.5) [10.5,13) [13,15.5)
> podaci.f<-table(podaci.cut)
> podaci.f
podaci.cut
[3,5.5) [5.5,8) [8,10.5) [10.5,13) [13,15.5)
3
6
3
3
1
> cbind(podaci.f)
podaci.f
[3,5.5)
3
[5.5,8)
6
[8,10.5)
3
[10.5,13)
3
[13,15.5)
1
> podaci.fr<-podaci.f/sum(podaci.f)
> podaci.fr
podaci.cut
[3,5.5) [5.5,8) [8,10.5) [10.5,13) [13,15.5)
0.1875
0.3750
0.1875
0.1875
0.0625
> podaci.kf<-cumsum(podaci.f)
> podaci.kfr<-cumsum(podaci.fr)
## postavljamo da se podaci ispisuju zaokruzeni na 1 znamenku
(kada je broj u normaliziranom obliku)
> old=options(digits=1)
> cbind(podaci.f,podaci.fr,podaci.kf,podaci.kfr)
podaci.f podaci.fr podaci.kf podaci.kfr
[3,5.5)
3
0.19
3
0.2
[5.5,8)
6
0.38
9
0.6
[8,10.5)
3
0.19
12
0.8
[10.5,13)
3
0.19
15
0.9
[13,15.5)
1
0.06
16
1.0
>options(old)
> hist(podaci,breaks=razredi,col='light green',border='green',
xlab="prosjena konzumacija maslinovog ulja(l)",ylab="Frekvencija",
main="Histogram prosjene konzumacije maslinovog ulja")
## Nacrtajmo histogram povrsine 1
hist(podaci,breaks=razredi, freq=FALSE, col='light green',border='green',
## Nacrtajmo histogram relatoivnih frekvencija
h = hist(podaci,breaks=razredi,col='light green',border='green',
h$density = h$counts/sum(h$counts)
plot(h,freq=F)
## Nacrtajmo graf relativnih frekvencija
>sredine<-(razredi[2:length(razredi)]+razredi[1:length(razredi)-1])/2
> sredine
[1] 4.25 6.75 9.25 11.75 14.25
> plot(sredine,podaci.fr,xlab="Prosjena konzumacija maslinovog
ulja u l ", ylab="Relativne frekvencije","b")
>
## Nacrtajmo graf kumulante relativnih frekvencija
> kfr<-c(0,podaci.kfr)
> plot(razredi,kfr,"b",xlab="Prosjena konzumacija maslinovog
ulja u l",ylab="kumulanta relativnih frakvencija")
3
2
1
0
Frekvencija
Histogram prosjecne konzumacije maslinovog ulja
10
12
14
16
prosjecna konzumacija maslinovog ulja(l)
Relativne frekvencije
10
12
14
1.0
Prosjecna konzumacija maslinovog ulja u l
0.8
0.6
0.4
0.2
0.0
kumulanta relativnih frakvencija
10
12
14
16
Prosjecna konzumacija maslinovog ulja u l
Zadatak 5.
Zadani su sljedei podaci

44 63 68 84 46 72 76 106
81 88 72 49 64 66 75 47
Za dane podatke nacrtaje:

(a) stem and leaf diagram
10
(b) dijagram toaka

Rjeenje:
(a)
> podaci<-c(44,63,68,84,46,72,76,106,81,88,72,49,64,75,47)
> stem(podaci)
The decimal point is 1 digit(s) to the right of the |
4 | 4679
6 | 3482256
8 | 148
10 | 6
> library(epicalc)
> dotplot(floor(podaci/10),pch=20,main="Dijagram toaka")
10
5
Frequency
15
20
Dijagram tocaka
10
11
Zadatak 6.
Zadani su podaci
23.67 10.2 3.40 4.43 15.51 5.67 16.87 12.55 56.8 0.23
1.11 12.45 3.57 24.71 5.91 33.5 52.42 30.99 2.55 11.98
Nacrtajte stem and leaf diagram i diagram toaka za dane podatke.
12
Zadatak 7. Mjereno je vrijeme izvoenja neke radne operacije i dobiveni

su sljedei podaci (u sekundama)
24 28 22 26 24
27 26 25 26 23
30 26 29 25 27
24 26 25 24 27
Odredite sredinu, medijan, mod, raspon, interkvartil i standardnu devijaciju

za dane podatke.
Rjeenje:
## Ucitajmo podatke
>podaci<-c(24,28,22,26,24,27,26,25,26,23,30,26,29,25,27,24,26,25,24,27)
> podaci
[1] 24 28 22 26 24 27 26 25 26 23 30 26 29 25 27 24 26 25 24 27
## Odredimo srednju vrjednost (aritmeticku sredinu) podataka
> mean(podaci)
[1] 25.7
## Odredimo harmonijsku sredinu podataka
library(psych)
> harmonic.mean(podaci)
[1] 25.55752
## Odredimo geometrijsku sredinu podataka
> geometric.mean(podaci)
[1] 25.62846
## Odredimo medijan podataka
> median(podaci)
[1] 26
## Odredimo mod podataka
## Prvo moramo definirati funkciju statmod
> statmod<-function(x){
+ z<-table(as.vector(x))
+ names(z)[z==max(z)]
+ }
> statmod(podaci)
[1] "26"
## Odredimo standardnu devijaciju
> sd(podaci)
13
[1] 1.976174
## Odredimo varijancu
> var(podaci)
[1] 3.905263
## Odredimo raspon podataka
> max(podaci)-min(podaci)
[1] 8
## Odredimo maksimalni podatak
> max(podaci)
[1] 30
## Odredimo minimalni podatak
> min(podaci)
[1] 22
## Odredimo donji kvartil
> quantile(podaci,0.25,type=6)
25%
24
## Drugi nacin odredivanja medijana
50%
26
## Odredimo gornji kvartil
75%
27
## Odredimo interkvartil
> IQR(podaci)
[1] 3
## Nacrtajmo dijagram pravokutnika
> boxplot(podaci)
14
30
28
26
24
22
Mjerenjem koncentracije krvne plazme endorna trkaa

nakon utrke dobiveni su podaci (u pmol/l)
Zadatak 8.
66 72 79 84 102 110 123 144 162 169 414
Konstruirajte diagram pravokutnika za ove podatke.
15
Zadatak 9. Sukcesivnim mjerenjima gustoe novootkrivenog materijala

dobivene su sljedee vrijednosti (u g/cm3 )
xi
[19.59, 19.60i
[19.60, 19.61i
[19.61, 19.62i
[19.62, 19.63i
[19.63, 19.64i
[19.64, 19.65i
[19.65, 19.66i
[19.66, 19.67i
[19.67, 19.68i
[19.68, 19.69i
fi
3
9
10
11
15
10
5
6
2
1
Odredite sredinu, medijan i standardnu devijaciju uzorka.

Rjeenje:
> sredine<-seq(19.595,19.685,0.01)
> f<-c(3,9,10,11,15,10,5,6,2,1)
> library(Hmisc)
> wtd.mean(sredine,f)
[1] 19.63236
> wtd.var(sredine,f)
[1] 0.0004450509
> sqrt(wtd.var(sredine,f))
[1] 0.02109623
> wtd.quantile(sredine,f,probs=c(0,0.25,0.5,0.75,1))
0%
25%
50%
75% 100%
19.595 19.615 19.635 19.645 19.685
> wtd.Ecdf(sredine,f)
$x
[1] 19.595 19.595 19.605 19.615 19.625 19.635 19.645 19.655 19.665 19.675
[11] 19.685
$ecdf
[1] 0.00000000 0.04166667 0.16666667 0.30555556 0.45833333 0.66666667
[7] 0.80555556 0.87500000 0.95833333 0.98611111 1.00000000
> F<-wtd.Ecdf(sredine,f)
>plot(F$x,F$ecdf,'l',xlab='gustoa materijala',
ylab='kumulanta relativnih frekvencija')
> abline(h=0.75,col='dark red')
16
0.8
0.6
0.4
0.2
0.0
kumulanta relativnih frekvencija
1.0
> abline(h=0.25,col='orange')
> abline(h=0.5,col='red')
19.60
19.62
19.64
19.66
19.68
gustoca materijala
17
Zadatak 10. Promatramo ocjene iz Matematike uenika 1. razreda

jedne srednje kole, te su dobiveni sljedei podaci:
5 3 4 4 2 5 3 3 2 2 2 5 4
4 1 2 3 3 3 3 4 4 2 1 2 2
Nacrtajte histogram relativnih frekvencija, te odredite aritmetiku sredinu,

mod ,medijan, standardnu devijaciju, te gornji i donji kvantil uzorka. Nacrtajte dijagram pravokutnika za dane podatke.
Rjeenje:
>
>
>
>
ocjene<-c(5,3,4,4,2,5,3,3,2,2,2,5,4,1,2,2,3,3,3,3,4,4,2,1,2,2)
n<-lenght(ocjene)
f<-data.frame(table(ocjene))
f
ocjene Freq
1
1
2
2
2
9
3
3
7
4
4
5
5
5
3
>f<-data.frame(f,f[2]/sum(f[2]))
> f
ocjene Freq Freq.1
1
1
2 0.08
2
2
9 0.35
3
3
7 0.27
4
4
5 0.19
5
5
3 0.12
> hist(ocjene,probability=TRUE,breaks=c(0.5,1.5,2.5,3.5,4.5,5.5,6.5),
xlab="ocjene",ylab="relativne frekvencije",main="Histogram",col="red")
> mean(ocjene)
[1] 3
> sd(ocjene)
[1] 1
> var(ocjene)
[1] 1
> summary(ocjene)
Min. 1st Qu. Median
Mean 3rd Qu.
Max.
18
1
2
3
> quantile(ocjene,0.25)
25%
2
50%
3
> median(ocjene)
[1] 3
75%
4
>boxplot(ocjene)
Na nekom fakultetu je odabran uzorak od 40 studenata i

izmjerene su im visine:
Zadatak 11.
140 188 175 176 177 168 162 181

183 187 187 162 184 161 180 169
195 171 170 199 181 169 189 191
172 182 183 178 180 165 185 205
183 187 188 182 163 179 178 188
Odredite karakteristinu petorku uzorka, te nacrtajte dijagram pravokutnika.
19
Zadatak 12. Podaci o cijenama litre mlijeka sakupljene na 100 prodajnih mjesta dane su u datoteci 'mlijeko' . Nacrtajte histogram, poligon
relativnih frekvencija i kumulantu za dane podatke.
Rjeenje:
> x<-scan('mlijeko')
Read 100 items
> x
[1] 5.05 6.37 4.50
[16] 4.85 3.91 5.04
[31] 7.35 7.00 5.69
[46] 4.01 5.42 3.87
[61] 4.91 5.76 4.76
[76] 5.69 5.26 4.81
[91] 6.51 5.33 7.42
3.70
6.39
6.62
4.47
5.19
5.71
5.14
4.72
5.22
5.36
4.32
5.66
4.57
6.24
6.58
4.74
5.94
4.97
6.80
5.79
5.66
5.46
6.07
4.09
6.09
5.48
6.28
6.74
4.82
5.65
5.60
4.84
5.27
5.01
5.61
5.46
4.87
6.15
4.38
6.16
6.28
6.35
5.61
6.45
6.25
5.57
5.35
5.61
4.32
4.75
6.46
5.40
5.96
3.97
6.17
4.42
6.78
7.19
6.60
5.20
4.07
Izmjeren je kapacitet 494 istovrsnih kondenzatora. Podaci o

frekvenciji fi pojavljivanja odreenih vrijednosti unutar intervala [ai , bi i dane
su u datoteci 'kondenzatori'. Odredite aritmetiku sredinu, medijan, mod,
gornji i donji kvantil, te skicirajte histogram(povrine 1), poligon relativnih
frekvencija i kumulante za dane podatke.
Zadatak 13.
Rjeenje:
## Ucitajmo podatke iz datoteke 'kondenzatori' u varijablu y

> y<-read.table('kondenzatori')
> y
a
b f
1 20.0 20.5
8
2 20.5 21.0 15
3 21.0 21.5 50
4 21.5 22.0 93
5 22.0 22.5 85
6 22.5 23.0 100
7 23.0 23.5 67
8 23.5 24.0 46
9 24.0 24.5 20
10 24.5 25.0 9
11 25.0 25.5 1
## Odredimo velicinu uzorka
20
5.59
5.60
6.27
4.92
5.27
4.06
5.05
5.19
7.48
6.01
5.58
4.80
5.88
5.16
4.88
5.89
4.96
7.15
> N<-sum(y$f)
> N
[1] 494
## Odredimo sredine razreda
> s<-(y$a+y$b)/2
> s
[1] 20.25 20.75 21.25 21.75 22.25 22.75 23.25 23.75 24.25 24.75 25.25
## Odredimo aritmeticku sredinu uzorka (uocimo da smo mogli koristiti
funkcije wtd.mean, wtd.quantile, wtd.Ecdf iz biblioteke Hmisc)
> as<-crossprod(s,y$f)/N
> as
[,1]
[1,] 22.48583
## Odredimo karakteristicnu petorku
## Buduci da nemamo "`pravi" uzorak, prvo formiramo uzorak u kojem ce se
svako od opazanja iz pojedinog razreda biti positovjeceno sa sredinom razreda
> y.uzorak<-rep(s,y$f)
> summary(y.uzorak)
Min. 1st Qu. Median
Mean 3rd Qu.
Max.
20.25 21.75
22.25 22.49
23.25 25.25
## Odredimo relativne frekvencije razreda
> fr<-y$f/N
> fr
[1] 0.016194332 0.030364372 0.101214575 0.188259109 0.172064777 0.202429150
[7] 0.135627530 0.093117409 0.040485830 0.018218623 0.002024291
## Odredimo kumulantu relativnih frekvencija razreda
> Fr<-cumsum(fr)
## Dodajmo u tablicu y stupac s relativnim frekvencijama i
kumulantom relativnih frekvencija
> y<-data.frame(y,fr,Fr)
> y
a
b f
fr
Fr
1 20.0 20.5
8 0.016194332 0.01619433
2 20.5 21.0 15 0.030364372 0.04655870
3 21.0 21.5 50 0.101214575 0.14777328
4 21.5 22.0 93 0.188259109 0.33603239
5 22.0 22.5 85 0.172064777 0.50809717
6 22.5 23.0 100 0.202429150 0.71052632
7 23.0 23.5 67 0.135627530 0.84615385
8 23.5 24.0 46 0.093117409 0.93927126
9 24.0 24.5 20 0.040485830 0.97975709
21
10 24.5 25.0 9 0.018218623 0.99797571

11 25.0 25.5 1 0.002024291 1.00000000
## Skicirajmo histogram povrsine 1
> hist(y.uzorak,breaks=seq(20,25.5,by=0.5),freq=FALSE,col='dark violet',
border='white', main='Histogram kapaciteta istvorsnih kondenzatora')
## Skicirajmo poligon relativnih frekvencija
> plot(s,fr,'l',xlab='Kapacitet kondenzatora',ylab='relativna
frekvencija',main='Poligon relativnih frekvencija',col='blue')
## Skicirajmo kumulantu relativnih frekvencija
> plot(c(20,y$b),c(0,Fr),'l',xlab='Kapacitet kondenzatora',
ylab='kumulanta relativna frekvencija',main='Kumulanta relativnih frekvencija',
col='blue')
> abline(h=0.75,col='dark red')
> abline(h=0.25,col='orange')
> abline(h=0.5,col='red')
0.2
0.1
0.0
Density
0.3
0.4
Histogram kapaciteta istvorsnih kondenzatora
20
21
22
23
24
25
y.uzorak
22
0.15
0.10
0.05
0.00
relativna frekvencija
0.20
Poligon relativnih frekvencija
21
22
23
24
25
Kapacitet kondenzatora
0.8
0.6
0.4
0.2
0.0
kumulanta relativna frekvencija
1.0
Kumulanta relativnih frekvencija
20
21
22
23
24
25
Kapacitet kondenzatora
Zadatak 14. Praenjem broja stanovnika jednog gradia u periodu od

50 godina dobiveni su podaci spremljeni u datoteku 'stanovnici'. Odredite
prosjenu brzinu rasta broja stanovnika u datom periodu.
Rjeenje:
## Ucitajmo podatke iz datoteke

> x<-read.table('stanovnici')
23
## Izracunajmo brzinu rasta stanovnistva po periodima od godinu dana

> v<-x$brstanovnika[2:50]/x$brstanovnika[1:49]
> v
[1] 0.8569815 1.2246781 0.9882441 0.3617324 1.1435850 0.9791414 0.9633919
[8] 1.0622585 1.0531528 1.3565534 1.0198048 0.9422944 1.1433829 1.2119222
[15] 0.7309041 0.5177326 1.0429534 0.6069987 1.2106430 1.6076923 1.0401003
[22] 1.0138007 1.1285653 1.2042887 0.8337043 1.1557971 1.2445141 1.6412568
[29] 1.2935380 1.1415636 1.1732947 1.2179589 0.6554126 1.2931316 0.8150942
[36] 1.0948634 0.7583886 1.4266934 0.8521446 0.7400922 0.7863235 0.9145444
[43] 0.8411716 0.5676802 0.7846652 0.5579411 1.1258017 0.9877301 0.9099379
## Izracunajmo geometrijsku i aritmeticku sredinu
> vg=geometric.mean(v)
> va=mean(v)
> vg
[1] 0.9654123
> va
[1] 1.004572
## Uocimo
> x$brstanovnika[50]
[1] 2051
> x$brstanovnika[1]*vg^49
[1] 2051
> x$brstanovnika[1]*va^49
[1] 14391.89
24
Zadatak 15. Na pet strojeva razliite starosti izrauje se isti proizvod,

odnosno strojevi su razliito produktivni. U osamsatnom radnom vremenu
utvren je prosjean utroak vremena po jedinici proizvoda u minutama dan
u tabeli. Kolika je prosjena produktivnost strojeva izraena utrokom vremena po proizvodu?
Stroj Utroeno vrijeme po jedinici proizvoda (u min)

A
B
C
D
E
0, 8
1, 0
1, 2
1, 2
1, 5
Rjeenje:
## Za prosjecan utrosak vremena po proizvodu koristimo

harmonijsku sredinu
> u<-c(0.8,1.0,1.2,1.2,1.5)
> h<-harmonic.mean(u)
> h
[1] 1.090909
## Buduci da je ukupan broj proizvedenih proizvoda po stroju
> b<-8*60/u
> b
[1] 600 480 400 400 320
## pa je prosjecan utrosak vremena po proizvodu
> 8*60/mean(b)
[1] 1.090909
25
Zadatak 16. Za podatke dane u datotekama 'dat1', 'dat2' ,'dat3' i

'dat4' odredite aritmetiku sredinu, medijan, skicirajte poligon relativnih
frekvencija i histogram, te odredite koecijent asimetrinosti i zaobljenosti.
Rjeenje:
## Ucitajmo podatke iz datoteke 'dat1'

> x1<-read.table('dat1')
> x1<-x1[,1]
## Odredimo opseg podataka
> N<-length(x1)
> N
[1] 1000
## Ispisimo prvih 10 vrijednosti da odredimo tip podataka
> x1[1:10]
[1] 3.7001099 0.8816091 -6.4772521 4.5499841 2.9771401 7.1217207
[7] 5.2422784 -6.1089050 6.9055011 2.6734968
## Odredimo aritmeticku sredinu i medijan
> as<-mean(x1)
> med<-median(x1)
> as
[1] 4.802439
> med
[1] 4.911762
## Podjelimo podatke u razrede
> m=min(x1)
> M=max(x1)
> k=ceiling(1+3.3*log(1000)/log(10))
> k
[1] 11
> m
[1] -7.04834
> M
[1] 19.27563
> d=ceiling((M-m)/k*10)/10
> d
[1] 2.4
> r<-seq(-7.1,19.7,by=2.4)
> r
[1] -7.1 -4.7 -2.3 0.1 2.5 4.9 7.3 9.7 12.1 14.5 16.9 19.3
> x1.cut<-cut(x1,r,right=F)
> x1.f<-table(x1.cut)
26
> x1.fr<-x1.f/sum(x1.f)
> cbind(x1.f,x1.fr)
x1.f x1.fr
[-7.1,-4.7)
9 0.009
[-4.7,-2.3) 33 0.033
[-2.3,0.1)
69 0.069
[0.1,2.5)
169 0.169
[2.5,4.9)
219 0.219
[4.9,7.3)
239 0.239
[7.3,9.7)
156 0.156
[9.7,12.1)
67 0.067
[12.1,14.5) 30 0.030
[14.5,16.9)
8 0.008
[16.9,19.3)
1 0.001
## Nacrtajmo poligon relativnih frekvencija
> length(r)
[1] 12
> s<-(r[2:12]+r[1:11])/2
> s
[1] -5.9 -3.5 -1.1 1.3 3.7 6.1 8.5 10.9 13.3 15.7 18.1
> plot(s,x1.fr,'l',col='dark red',lwd=2,
main='Poligon relativnih frekvencija podataka iz dat1' )
##Nactrajmo histogram
> hist(x1,breaks=r,col='orange',border='white',
main='Histogram podataka iz dat1')
## Odredimo koeficijent asimetrije i zaobljenosti
> library(e1071)
> a3=skewness(x1)
> a3
[1] -0.0118604
> a4=kurtosis(x1)+3
> a4
[1] 3.05184538
## Buduci da je koeficijent asimetrije a3 blizu 0 zakljucujemo
da je distribucija simetricna, a buduci da je koeficijent
zaobljenosti a4 blizu 3 zakljuujemo da je distribucija
normalno zaobljena.
## Ucitajmo podatke iz dat2
27
x1.fr
Poligon relativnih frekvencija podataka iz dat1
10
15
150
100
0
50
Frequency
200
Histogram podataka iz dat1
10
15
20
x1
> x2<-read.table('dat2')
> x2<-x2[,1]
## Odredimo opseg uzoreka
>length(x2)
[1] 1000
## Ispisimo prvih 10 podataka da utvrdimo o kojem se tipu vrijednosti radi
> x2[1:10]
28
[1] 1 4 5 3 9 4 4 4 6 4
## Odredimo frekvencije pojavljivanja odredenih vrijednosti
> f<-data.frame(table(x2))
## Odredimo relativne frekvencije
> f<-data.frame(f,fr=f$Freq/sum(f$Freq))
> f
x2 Freq
fr
1 0
10 0.010
2 1
29 0.029
3 2
92 0.092
4 3 129 0.129
5 4 179 0.179
6 5 171 0.171
7 6 143 0.143
8 7
98 0.098
9 8
74 0.074
10 9 40 0.040
11 10
22 0.022
12 11
5 0.005
13 12
4 0.004
14 13
2 0.002
15 14
2 0.002
## Odredimo aritmeticku sredinu, medijan i mod
> mean(x2)
[1] 5.044
> median(x2)
[1] 5
## Uocimo da je mod=4, te da je mod< medijan < aritmeticka sredina
## Nacrtajmo poligon relativnih frekvencija
> plot(0:14,f$fr,'b',xlab='podaci iz dat2',ylab='relativne frekvencije',
col='dark green',main='Poligon relativnih frekvencija za podatke iz dat2',lwd=2,l
> hist(x2,breaks=seq(-0.5,14.5,by=0.5),col='light green', border='white',
main='Histogram podataka iz dat2')
## Odredimo koeficijent asimetrije i zaobljenosti
> skewness(x2)
[1] 0.4649913
> kurtosis(x2)+3
[1] 3.257166
## Buduci da je koeficijent asimetrije a3 > 0 zakljucujemo da je
distribucija pozitivno asimetrina, a buduci da je koeficijent
29
zaobljenosti a4 > 3 zakljucujemo da je distribucija zaobljena.

## Ako zelimo odrediti moment ili centralni moment nekog reda
uzorka, to radimo na sljedeci nacin
## npr. 5-ti moment
>library(e1071)
> moment(x2,order=3, center=F)
[1] 214.078
## ili 4-ti centralni moment
> moment(x2,order=4,center=T)
[1] 91.40272
Poligon relativnih frekvencija za podatke iz dat2
0.15
0.10
0.05
0.00
relativne frekvencije
10
12
14
podaci iz dat2
30
100
50
0
Frequency
150
Histogram podataka iz dat2
10
15
x2
31

I 3. Vježba (R) D

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

I 3. Vježba (R) D

Uploaded by

Copyright:

Available Formats

Zadatak 1.

Prodava u butiku biljei koliinu prodanih majica pojedine

Histogram broja prodanih majica po velicini

> pie(f,labels=imena1,col=rainbow(6),main='Strukturalni krug

Strukturalni krug broja prodanih majica po velicini

## ili ako zelimo 3D prikaz

main='Strukturalni krug broja prodanih majica po veliini')

Strukturalni krug broja prodanih majica po velicini

Pareto dijagram broja prodanih majica po velicini

Pareto dijagram broja prodanih majica po velicini

Promatrajui boju oiju uenika jednog razreda dobiveni su

Zadatak 3. Kontrolor uzima serije od 30 proizvoda i svaki put zapie

(a) Odredite tablicu frekvencija i relativnih frekvencija i kumulanti

9.9 5.6 10.8 6.3 3.9 11.2 5.7 8.4

Nacrtajte histogram , poligon relativnih frekvencija i kumulantu distribucije

Histogram prosjecne konzumacije maslinovog ulja

prosjecna konzumacija maslinovog ulja(l)

Prosjecna konzumacija maslinovog ulja u l

kumulanta relativnih frakvencija

Prosjecna konzumacija maslinovog ulja u l

Zadani su sljedei podaci

Za dane podatke nacrtaje:

(b) dijagram toaka

Nacrtajte stem and leaf diagram i diagram toaka za dane podatke.

Zadatak 7. Mjereno je vrijeme izvoenja neke radne operacije i dobiveni

Odredite sredinu, medijan, mod, raspon, interkvartil i standardnu devijaciju

Mjerenjem koncentracije krvne plazme endorna trkaa

66 72 79 84 102 110 123 144 162 169 414

Konstruirajte diagram pravokutnika za ove podatke.

Zadatak 9. Sukcesivnim mjerenjima gustoe novootkrivenog materijala

Odredite sredinu, medijan i standardnu devijaciju uzorka.

kumulanta relativnih frekvencija

Zadatak 10. Promatramo ocjene iz Matematike uenika 1. razreda

Nacrtajte histogram relativnih frekvencija, te odredite aritmetiku sredinu,

Na nekom fakultetu je odabran uzorak od 40 studenata i

140 188 175 176 177 168 162 181

Odredite karakteristinu petorku uzorka, te nacrtajte dijagram pravokutnika.

Izmjeren je kapacitet 494 istovrsnih kondenzatora. Podaci o

## Ucitajmo podatke iz datoteke 'kondenzatori' u varijablu y

10 24.5 25.0 9 0.018218623 0.99797571

Histogram kapaciteta istvorsnih kondenzatora

Poligon relativnih frekvencija

kumulanta relativna frekvencija

Kumulanta relativnih frekvencija

Zadatak 14. Praenjem broja stanovnika jednog gradia u periodu od

## Ucitajmo podatke iz datoteke

## Izracunajmo brzinu rasta stanovnistva po periodima od godinu dana

Zadatak 15. Na pet strojeva razliite starosti izrauje se isti proizvod,

Stroj Utroeno vrijeme po jedinici proizvoda (u min)

## Za prosjecan utrosak vremena po proizvodu koristimo

Zadatak 16. Za podatke dane u datotekama 'dat1', 'dat2' ,'dat3' i

## Ucitajmo podatke iz datoteke 'dat1'

Poligon relativnih frekvencija podataka iz dat1

Histogram podataka iz dat1

zaobljenosti a4 > 3 zakljucujemo da je distribucija zaobljena.

Poligon relativnih frekvencija za podatke iz dat2

Histogram podataka iz dat2

You might also like

Mjerenjem koncentracije krvne plazme endorna trkaa