Raspodjele 2018 v3

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 57

Raspodjele podataka

• Raspodjele podataka za diskretna obilježja


• Raspodjele podataka za kontinuirana obilježja
• Teorijske raspodjele podataka

Raspodjele podataka Dr. sc. Hrvoje Cajner


Raspodjele podataka Dr. sc. Hrvoje Cajner
Raspodjele (diskretna obilježja)

• Hipergeometrijska (složene kombinacije)

• Binomna (Bernoulli-jev događaj)

• Poisson-ova (zakon rijetkih događaja, potok događaja)

Raspodjele podataka Dr. sc. Hrvoje Cajner


Hipergeometrijska raspodjela
• proizlazi iz dvoslojnog skupa - složene kombinacije – skup od N
elemenata sadrži podskup elemenata sa svojstvom A i podskup
elemenata sa svojstvom Ā

SKUP
N

M (A) N-M (Ā)


UZORAK
n

x el A (n-x) el Ā

Raspodjele podataka Dr. sc. Hrvoje Cajner


• funkcija vjerojatnosti hipergeometrijske raspodjele:

M  N − M 
     parametri: M, N i n
P(x) =  x   n-x 
- n – veličina uzorka
N
 
n
xM
n−x N −M N = 1, 2...
1 M  N n, M, N  N

nM
• očekivana vrijednost:  = E ( x);  =
N

M  M   N −n
• varijanca:  2 = E[( x −  ) 2 ];  2 = n   1 −    
N  N   n −1 

Raspodjele podataka Dr. sc. Hrvoje Cajner


• utjecaj parametara na oblik hipergeometrijske raspodjele:
Hypergeometric; n=5
0 1 2 3 4 5
N=10; M=5 N=10; M=3
0,8

0,6

0,4

0,2
Probability

0,0
N=50; M=5 N=50; M=3
0,8

0,6

0,4

0,2

0,0
0 1 2 3 4 5
X
Raspodjele podataka Dr. sc. Hrvoje Cajner
Binomna raspodjela
• broj N (elementi skupa) teži u beskonačnost – podvrsta hipergeometrijske
• Bernoulli-jev događaj – samo dva ishoda
- vjerojatnost događaja se ne mijenja i iznosi p
- vjerojatnost q=1-p
- nezavisni pokušaji (slučajno uzorkovanje)
- broj pokušaja (veličina uzorka), n

A Ā
UZORAK n - elemenata

p (1-p)=q

Raspodjele podataka Dr. sc. Hrvoje Cajner


• funkcija vjerojatnosti binomne raspodjele B (n, p):
 n  x ( n− x )
P(x) =    p  q , za x = 0,1,...n parametri: n, p
 x
• očekivana vrijednost (aritmetička sredina):  = E ( x) = n  p

• varijanca:  2 = n pq

• koeficijent asimetrije: 3 =
M3
=
(q-p)
 3
n pq

- distribucija će biti uvijek asimetrična ako nije


p=q=0,5

M4 1− 6  p  q
• koeficijent zaobljenosti: 4 = 4 = 3 +
 n pq
Raspodjele podataka Dr. sc. Hrvoje Cajner
• utjecaj parametara n i p na oblik binomne raspodjele:
Binomial; n=10; p=0,2 Binomial; n=10; p=0,5 Binomial; n=10; p=0,8

0,30 0,25 0,30

0,25 0,20 0,25

0,20 0,20

Probability
Probability

Probability
0,15

0,15 0,15
0,10
0,10 0,10

0,05
0,05 0,05

0,00 0,00 0,00


0 1 2 3 4 5 6 7 0 2 4 6 8 10 3 4 5 6 7 8 9 10 11
X X X
Distribution Plot
Binomial; n=5; p=0,2 Binomial; n=10; p=0,2 Binomial; n=20; p=0,2
0,25
0,4 0,30

0,25 0,20
0,3
0,20
Probability

Probability

Probability
0,15
0,2 0,15

0,10
0,10
0,1

0,05 0,05

0,0
0 1 2 3 4 5 0,00 0,00
0 1 2 3 4 5 6 7
X 0 2 4 6 8 10 12
X
X

Raspodjele podataka Dr. sc. Hrvoje Cajner


• ‘Galtonova’ daska – binomni eksperiment
– kuglicu spuštamo na čavliće koji su složeni u pravilnu trokutastu rešetku
– padom na čavlić kuglica može skrenuti na lijevo ili desno (berouli-jev događaj)
– daska je pravilna te su ishodi jednako vjerojatni p=0.5
– n – broj redova čavlića

Link

Raspodjele podataka Dr. sc. Hrvoje Cajner


– primjer ‘Galtonove’ daske sa n=4 reda čavlića:

- slučajna varijabla poprima vrijednost:


0 - za jedan ishod
1 - za 4 ishoda
2 – za 6 ishoda
3 – za 4 ishoda
4 – za 1 ishod
- općenito:

Raspodjele podataka Dr. sc. Hrvoje Cajner


• primjer 1. binomne raspodjele:
Primjer: Svaki izuzeti uzorak vode ima vjerojatnost da je kontaminiran otpadnom
tvari u iznosu od 10% . Pretpostavimo da se uzroci uzimaju nezavisno s
obzirom na prisustvo otpadnih tvari. Potrebno je pronaći:
a) Vjerojatnost da će u 18 izuzetih uzoraka biti točno 2 uzorka
kontaminirana?
p = 0,1
n = 18
18  vjerojatnost da će biti točno 2
P ( x = 2) =    0,12  0,916 kontaminirana uzorka
2
P ( x = 2) = 0,284

b) Vjerojatnost da će od 18 uzoraka biti barem 4 kontaminirana?

p = 0,1 ; n = 18
P( x  4) = P( x = 0) + P ( x = 1) + P ( x = 2) + P ( x = 3)
P( x  4) = 1 − [ P( x  4)] = 0,098

Raspodjele podataka Dr. sc. Hrvoje Cajner


- grafički prikaz (binomna raspodjela):

Binomial; n=18; p=0,1 Binomial; n=18; p=0,1


0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7
0,30 0,284 0,30

0,25 0,25

0,20 0,20
Probability

Probability
0,15 0,15

0,10 0,10

0,05 0,05
0,0982

0,00
0 1 2 3 4 5 6 7 0,00
0 1 2 3 4 5 6 7
X
X

a) b)

Raspodjele podataka Dr. sc. Hrvoje Cajner


• primjer 2. primjene binomne raspodjele:
Primjer: Rad jednog automata kontrolira se uzorcima od 15 proizvoda. U svakom
uzorku se ustanovljuje broj defektnih proizvoda. Budući da je uzeto 200 uzoraka,
dobiveni rezultati su dani kroz tablicu. Potrebno je pronaći adekvatnu raspodjelu
po kojoj se ponašaju podaci te vjerojatnost pojave ne više od 2 defektna u
uzorku. x 0 1 2 3 4 5 6
Histogram of xi fi 77 81 31 7 2 1 1
90

80

70
- radi se o Binomnoj raspodjeli (n konačan):
x
60
x = 0,915; n = 15; p = = 0,061
Frequency

50

40
n
30
Binomial; n=15; p=0,061
15 
20 0,4
0 1
0,941
2 3 4 5 6 7 8 9
P( x) =    0,061x  0.939(15− x )
10 x
P( x  2) = P( x = 0) + P( x = 1)
0,3
0
0 1 2 3 4 5 6
Probability

xi
0,2
+ P( x = 2);
0,1
P( x  2) = 0,941
0,0
0 1 2 3 4 5 6 7 8 9
X

Raspodjele podataka Dr. sc. Hrvoje Cajner


- tablica vjerojatnosti n  P(x)
za primjer 2.
x   px q(n-x) P(x)
 x
0 1 1 0,389031 0,389031 0,389031
1 15 0,061 0,414303 0,379087 0,768118
2 105 0,003721 0,441217 0,172386 0,940504
3 455 0,000227 0,46988 0,048528 0,989032
4 1365 1,38E-05 0,500405 0,009457 0,998489
5 3003 8,45E-07 0,532913 0,001352 0,999841
6 5005 5,15E-08 0,567532 0,000146 0,999987
7 6435 3,14E-09 0,6044 1,22E-05 0,999999
8 6435 1,92E-10 0,643664 7,94E-07 1
9 5005 1,17E-11 0,685478 4,01E-08 1
10 3003 7,13E-13 0,730009 1,56E-09 1
11 1365 4,35E-14 0,777432 4,62E-11 1
12 455 2,65E-15 0,827936 1E-12 1
13 105 1,62E-16 0,881721 1,5E-14 1
14 15 9,88E-18 0,939 1,39E-16 1
15 1 6,02E-19 1 6,02E-19 1
Raspodjele podataka Dr. sc. Hrvoje Cajner
Poisson-ova raspodjela
• proizlazi iz binomne r. uz određene uvjete:
p→0
n→
n  p → konst. (tijekom vremena)
• opisuje rijetke događaje (oni koji se javljaju s malom vjerojatnošću)
• potok događaja – vjerojatnost promatranog događaja u vremenskom
periodu (valovi, naleti...) – odabir vremenskog perioda je bitan

• funkcija vjerojatnosti Poisson-ove raspodjele P(x):


m x −m
P(x) =  e , za x = 0 ,1,...n parametar: m=E(x)
x!
(u literaturi se spominje i λ = parametar m)

Raspodjele podataka Dr. sc. Hrvoje Cajner


• očekivana vrijednost:  = E ( x) = n  p =  = m  x
• varijanca:  2 ( x) = m;  ( x) = m
M3 1
• koeficijent asimetrije: 3 = 3 =
 m
M4 1
• koeficijent zaobljenosti:  4 = 4 = 3 +
 m

• rekurzivna formula za Poisson-ovu raspodjelu:


m x −m m x−1
P(x) = e P(x − 1 ) =  e −m
x! ( x − 1)!

m
P(x) = P( x − 1) 
x
Raspodjele podataka Dr. sc. Hrvoje Cajner
• utjecaj parametra m na Poisson-ovu raspodjelu :
Poisson; Mean=0,5 Poisson; Mean=2 Poisson; Mean=4
0,30 0,20
0,6

0,25
0,5
0,15

0,4
0,20
Probability

Probability
Probability
0,3 0,15 0,10

0,2 0,10
0,05
0,1 0,05

0,0
0 1 2 3 4 0,00 0,00
0 1 2 3 4 5 6 7 8 0 2 4 6 8 10 12
X
X X

- nakon m  1 pokazuje se mod – da su dvije susjedne vrijednosti istih


vjerojatnosti
- kada m →  gubi se asimetričnost i Poisson-ova raspodjela teži
simetričnoj

Raspodjele podataka Dr. sc. Hrvoje Cajner


• primjer 1. primjene Poisson-ove raspodjele:
Primjer: U slučaju tanke bakrene žice, pretpostavlja se da broj pukotina slijedi
zakon Poisson-ove raspodjele sa očekivanjem od 2.3 mikropukotine po
milimetru. Potrebno je odrediti:

a) vjerojatnost da se dogodi baš 2 mikropukotine po jednom milimetru žice.


- varijabla x – broj mikropukotina po mm žice
E ( x) = m  x = 2,3 Distribution Plot
Poisson; Mean=2,3

2,3x −2 , 3 0,30

P(x) = e 0,25
0,265

x!
0,20

Probability
0,15

2,32 −2 , 3 0,10

P(x = 2 ) =  e = 0,265 0,05


2!
0,00
0 2 8
X

Raspodjele podataka Dr. sc. Hrvoje Cajner


b) Vjerojatnost da se pojavi barem jedna mikropukotina u 2 mm žice.
- varijabla x – broj mikropukotina na 2mm žice

E ( x) = 2  2,3 = 4,6 Distribution Plot


Poisson; Mean=4,6
x
4,6 −4 , 6 0,20
P(x) = e
x!
0,15

Probability
0,10
0 0,9899
4,6 −4 , 6
P(x = 0 ) =  e = 0,0101
0! 0,05

P(x  1 ) = 1 − P( x = 0) = 0,9899
0,00
0 1
X

Raspodjele podataka Dr. sc. Hrvoje Cajner


• primjer 2. primjene Poisson-ove raspodjele:
Primjer: Tijekom drugog svjetskog rata London je gađan projektilima V1.
Britance je zanimalo kako iz podataka o padanju projektila zaključiti da li je
riječ o gađanju nasumce ili se cilja neka točka u Londonu.
- London je podijeljen na 576 sektora
- U vremenskom periodu promatranja palo je 537 projektila

Chart of Observed and Expected Values


Poisson mean for x = 0,928819
250 Expected
Observed Poisson Contribution
x Observed Probability Expected Chi-Sq
200 0 229 0,395020 226,74 0,009479
1 211 0,366902 211,39 0,000533
150
2 93 0,170393 98,54 0,269846
3 35 0,052755 30,62 0,700380
Value

4 7 0,014931 7,14 0,041860


100 5 (6,7..) 1 1,57

50
TEST:
N N* DF Chi-Sq P-Value
576 0 3 1,02210 0,796
0
x 0 1 2 3 >=4
- podaci se ponašaju po Poisson-ovoj razdiobi!
- zaključak - V1 nije imao navođenje
Raspodjele podataka Dr. sc. Hrvoje Cajner
Negativna binomna raspodjela
• broj N (elementi skupa) teži u beskonačnost
• Bernoulli-jev događaj – samo dva ishoda
- vjerojatnost događaja se ne mijenja i iznosi p
- vjerojatnost q=1-p
- nezavisni pokušaji (slučajno uzorkovanje)
• Binomna – distribucija broja postizanja ishoda A (varijabla x) u
konstantnom broju nezavisnih pokušaja (n)
• Negativna binomna – distribucija broj pokušaja (x) koji su potrebni da se
dobije konstantni broj uspjeha (r)

Raspodjele podataka Dr. sc. Hrvoje Cajner


• za r-ti uspjeh koji se treba dogoditi na x-tom pokušaju:
• x-1 pokušaja mora sadržavati r-1 uspjeha (modelira se binomnom)
 x − 1 r-1
( )
( x −1)−( r −1)
P=    p  1-p
 r −1
• x-ti pokušaj mora biti uspjeh te ima vjerojatnost b. događaja p
• konačno vjerojatnost da se zadovolji r-ti uspjeh na x-tom pokušaju je
umnožak dviju vjerojatnosti
 x − 1 r-1  x − 1 r
( )   p  (1-p )
( x −1)−( r −1) x −r
P(x)=p     p  1-p = 
 r −1  r −1
za x = r, r+1, … (beskonačno)
• Parametri negativne binomne:
r q
• očekivana vrijednost: =
p
rq
• varijanca: 2 = 2
p
2− p
• koeficijent asimetrije: 3 =
qr
p2 − 6 p + 6
• Koeficijent spljoštenosti: 4 =
rq
Raspodjele podataka Dr. sc. Hrvoje Cajner
Primjer 1: Zaposlenik agencije za provedbu telefonskih anketa mora ispuniti dnevnu kvotu od 3
potpune ankete. Vjerojatnost ispunjavanja potpune ankete u jednom telefonskom razgovoru je
konstantna i iznosi 9%. Kolika je vjerojatnost da će se 3 kompletne ankete dogoditi pri 10-tom
pozivu?

p=0,09
r=3
10 − 1
P( x = 10) =    ( )
7
 0,09 3
1-0,09 = 0,01356
 3 − 1 
0,91 3
= = 30,33
0,09

Raspodjele podataka Dr. sc. Hrvoje Cajner


Raspodjele (kontinuirana obilježja)

• Pravokutna
• Trokutasta
• Normalna
• Jedinična normalna
• Lognormalna
• Weibullova

Raspodjele podataka Dr. sc. Hrvoje Cajner


Pravokutna raspodjela
• najjednostavnija raspodjela kontinuirane varijable (jednolika raspodjela)
• Poznate su minimalna i maksimalna vrijednost no nije moguće utvrditi veću učestalost
određenih vrijednosti
• funkcija gustoće vjerojatnosti je pozitivna konstanta C na nekom segmentu [a, b] dok je u
svakom drugom slučaju jednaka 0
C za a  x  b
f ( x) = 
0 inače

• parametri: a+b
=
2
b−a
=
12
b b 1
 f ( x)dx = 1   Cdx = 1  C =
a a b−a
x2 x2
1
P( x1  x  x2 ) =  f ( x)dx =  Cdx = ( x2 − x1 )
x1 x1 b−a
Raspodjele podataka Dr. sc. Hrvoje Cajner
Primjer 1: U nekom proizvodnom procesu se konstantno događa zatajenje pumpe u periodu od
8. do 12. radnog sata. Pretpostavka je da je vjerojatnost zatajenja pumpe uniformno
distribuirana varijabla unutar danog intervala. Potrebno je izračunati vjerojatnost da se dogodi
zatajenje pumpe u periodu od 8. do 9. radnog sata.

1 1
f ( x) = =
12 − 8 4
11 1 1 3
P(8  x  11) =  dx = (11 − 8 ) = = 0,75 (75%)
8 4 4 4

Raspodjele podataka Dr. sc. Hrvoje Cajner


Trokutasta raspodjela
• Raspodjela koja se vrlo često koristi kada nema dovoljno informacija o stohastičkom
procesu, već samo minimum, maksimum i vrijednost moda
• Vrlo česta u simulacijskim modelima
• funkcija gustoće vjerojatnosti i funkcija distribucije
 0 za x<a
 2( x − a)  0 za x  a
 za a  x  c 
 (b − a)(c − a)  ( x − a) 2
za a<x  c
 2  (b − a )(c − a )
f ( x) =  za x=c F ( x) = 
1 − (b − x)
2
 b−a za c<x<b
 2(b − x)  (b − a )(b − c)
 (b − a)(c − a) za c  x  b 
 1 za b  x

 0 za x>b
• Parametri:
a+b+c
=
3
a 2 + b 2 + c 2 − ab − ac − bc
 =2

18

Raspodjele podataka Dr. sc. Hrvoje Cajner


Normalna raspodjela
• prvi definirao Abraham de Moivre
• upotrijebio Gauss (Gauss-ova raspodjela)
• najčešće korištena raspodjela – čak 33% procesa u prirodi slijedi zakon
normalne raspodjele
• funkcija gustoće vjerojatnosti f(x) – zbog kontinuiranog obilježja
• nastanak normalne r. - binomni poučak (razvijanje binoma u red , A. de
Moivre)
(a + b) = (a + b)  (a + b)  ...  (a + b) =
n

 n  n− x x  n  x n− x
( a + b) =     a  b → P ( x ) =   p  q
n
n
binomna r.
x =0
 x  x
uz uvjet p = q = 0 ,5 i n → 
1 1 x−
− 


2
funkcija gustoće
P(x)  f ( x) = e 2  
vjerojatnosti normalne r.
  2
Raspodjele podataka Dr. sc. Hrvoje Cajner
• funkcija gustoće vjerojatnosti normalne raspodjele f(x):
1  x− 2

1 −  
f ( x) = e 2  
za -  x 
  2
parametri: μ i σ2(x)
• očekivana vrijednost: E(x)= μ
• varijanca: σ2(x)
• koeficijent asimetrije: α3= 0 - simetrična razdioba
• koeficijent zaobljenosti: α4= 3 (α’4= 0) – normalno zaobljena
• svojstva funkcije gustoće vjerojatnosti f(x):
1. f ( x)  0 za svaki x

2.  f ( x) dx = 1
−
x2
3.  f ( x)dx = P( x1  x  x2 )
x1

Raspodjele podataka Dr. sc. Hrvoje Cajner


• veza funkcije gustoće vjerojatnosti f(x) i funkcija distribucije F(x)
normalne raspodjele:

x2

F ( x) =  f ( x)dx
x1
Raspodjele podataka Dr. sc. Hrvoje Cajner
• vjerojatnosti ispod normalne raspodjele N{μ, σ2}:

• utjecaj parametara μ i σ2 na oblik normalne raspodjele:

Raspodjele podataka Dr. sc. Hrvoje Cajner


Jedinična normalna raspodjela N{0,1}
• standardizirana normalna raspodjela sa parametrima μ=0 i σ2=1
• sve druge normalne raspodjele svodimo (z-transformacija) na jediničnu
normalnu raspodjelu
• bilo koja vrijednost u x domeni se može prikazati kao μ ± k·σ
x−
• transformacija: z=

Raspodjele podataka Dr. sc. Hrvoje Cajner


• funkcija gustoće vjerojatnosti jedinične normalne raspodjele f(z):
1 1
− z2
f ( z) = e 2 ;  = 0;  2 = 1
2
• upotrebom jedinične normalne razdiobe standardiziramo odstupanja
preko parametra z:
1. |z|=1 → P(z)=0,6827
2. |z|=1,96 → P(z)=0,9500
3. |z|=2,0 → P(z)=0,9545
4. |z|=3 → P(z)=0,9973

• područje ±3σ koje se koristi u konstrukcijama naziva se tolerancija


• danas procesi u području ±3σ više nisu dovoljno dobri pa se prelazi
na sustav od ±6σ
• područje od ±6σ ima vjerojatnost pojave od 99,9999998 %

Raspodjele podataka Dr. sc. Hrvoje Cajner


• ostale vjerojatnosti kod normalne razdiobe:

Raspodjele podataka Dr. sc. Hrvoje Cajner


• primjer 1. primjene normalne raspodjele:
Primjer: Pretpostavimo da se izmjerena jakost struje u vodiču pokorava zakonu
normalne raspodjele sa očekivanjem μ=10 mA i varijancom σ2=4 mA2. Kolika je
vjerojatnost da će jakost struje premašiti 13 mA?

(x − )
Normal; Mean=10; StDev=2

(13 − 10)
z= =  z = 1,5
5,0 7,5 10,0 12,5 15,0 17,5
0,20

 2
0,15
P( x  13) = P( z  1,5) = 1 − P( z  1,5) = 0,06681
Density

0,10

0,05 Normal; Mean=0; StDev=1

-3 -2 -1 0 1 2 3
0,4
0,00
5,0 7,5 10
10,0 13
12,5 15,0 17,5
X
0,3

Density
0,2

0,1

0,0668

0,0
-3 -2 -1 0 1 1,5 2 3
z

Raspodjele podataka Dr. sc. Hrvoje Cajner


Lognormalna raspodjela
• raspodjela koja dobro opisuje slučajeve: duljina trajanja proizvodnje,
plaće zaposlenika...
• slučaj kada je logaritam varijable x ( ln(x) ) normalno distribuiran
ln( x) = y - normalno distribuirana
• vjerojatnosti pojave varijable x se dobivaju transformacijom varijable y
sa naznakom da je x  (0, )

• ako y ima normalnu distribuciju sa očekivanjem α i varijancom β2 tada


možemo napisati x=ey što je lognormalna varijabla sa funkcijom
gustoće vjerojatnosti:
 1 −
(ln x − ) 2

 e 2 2
za x  0, β  0
f ( x) =  2    x
parametri: α i β2
 0 za ostalo
Raspodjele podataka Dr. sc. Hrvoje Cajner
• utjecaj parametara na oblik lognormalne raspodjele:

Raspodjele podataka Dr. sc. Hrvoje Cajner


• primjer primjene lognormalne raspodjele:
Primjer: Životni vijek poluvodičkog lasera je lognormalno distribuiran sa
parametrima =10 h i =1,5 h (parametri pripadajuće normalne distribucije,
očekivanje i standardna devijacija). Kolika je vjerojatnost da životni vijek premaši
10 000 sati?
P ( x  10000) = 1 − P ( x  10000);
y = 10000; y = e x ; x = ln( y );
9,2103 − 10
x = 9,2103; z = = −0,52
1,5
P ( x  10000) = 1 − F ( z = −0,52) = 0,701
Lognormal; Loc=10; Scale=1,5; Thresh=0
0,000008

0,000007

0,000006

0,000005
Density

0,000004

0,000003

0,000002

0,000001
0,701
0,000000
10000
0
X

Raspodjele podataka Dr. sc. Hrvoje Cajner


Weibull-ova raspodjela
• definira vjekove trajanja tehničkih sustava – krivulja kade
• parametri ove raspodjele daju veliku fleksibilnost prilikom opisivanja
različitih slučajeva kada broj otkaza raste sa vremenom (trošenje
ležaja), ostaje konstantan ili pada s vremenom (neki poluvodiči)

• funkcija gustoće vjerojatnosti Weibull-ove raspodjele:

(   )  x  e
 −1 −(   x ) 
za x  0,   0, β  0
f ( x) = 
 0 za ostalo parametri: α, β

Raspodjele podataka Dr. sc. Hrvoje Cajner


• utjecaj parametara na oblik Weibull-ove raspodjele:

Raspodjele podataka Dr. sc. Hrvoje Cajner


• krivulja kade (krivulja mortaliteta):

I. period – ‘dječje bolesti’ – 1. raspodjela e-t


II. period – ‘normalne eksploatacije’, slučajni kvarovi – 2. raspodjela uniformna
III. period – zbog ‘trošenja dijelova’, vremenski kvarovi – 3. raspodjela normalna

Raspodjele podataka Dr. sc. Hrvoje Cajner


Teorijske raspodjele

• Studentova ‘t’ raspodjela


• c2 − raspodjela
• F - raspodjela

Raspodjele podataka Dr. sc. Hrvoje Cajner


Studentova t-raspodjela
• definirao ju W. S. Gosset kao razdiobu varijable t
• proizašla iz raspodjele aritmetičkih sredina
• kada n raste približava se
normalnoj razdiobi k=30

 n +1 
 
1  2  t 2 n2+1
f (t ) =   (1 + ) ;  ( n ) = (n − 1)!
n    n  n
 
2
Raspodjele podataka Dr. sc. Hrvoje Cajner
• tablica Studentove ras.-
za određenu vrijednost
površine (vjerojatnosti) i
stupnja slobode daje
vrijednosti parametra t

Primjer: Za =0,01 u uzorku


veličine 10 elemenata
(k=10-1=9 stupnjeva
slobode) t=2,821

• treba s oprezom
primjenjivati tablice zbog
različitog korištenja
termina  – površina
samo jednog ‘repa’ ili
oba?!

Raspodjele podataka Dr. sc. Hrvoje Cajner


c2 (hi-kvadrat) raspodjela
• varijance se ne pokoravaju normalnoj raspodjeli
• poseban slučaj  razdiobe definira raspodjelu varijable c2
• varijabla c2 sa samo jednim parametrom k=n-1 → stupanj slobode

x −x
2

c =  
2

n
i E(c ) = k
2
- očekivana vrijednost

  
i =1
0

Raspodjele podataka Dr. sc. Hrvoje Cajner


• tablica c2 ras.- za
određenu vrijednost
površine (vjerojatnosti) i
stupnja slobode daje
vrijednosti parametra c2

• kod čitanja vrijednosti c2P


treba imati na umu da se
to odnosi na ‘unutrašnju’
površinu.
Primjer: Pronaći vrijednosti
c2/2 i c21−/2 za vjerojatnost
pogreške 5% i k=9.
c2/2= c20,025=2,70
c21−/2= c20,975=19,02

Raspodjele podataka Dr. sc. Hrvoje Cajner


F - raspodjela
• definirao G. Snedecor , R. Fisher
• to je raspodjela varijable F koja je definirana kao omjer
procijenjenih varijanci
• raspodjela ima samo dva parametra:
– stupanj slobode brojnika kbrojnika
– stupanj slobode nazivnika knazivnika
s 2

F= 1

s 2

-parametri: kbrojnika=n1-1;
knazivnika=n2-1
- preduvjet: (s1>s2)

Raspodjele podataka Dr. sc. Hrvoje Cajner


• Tablica F-raspodjele daje vrijednosti parametra F
vrijednosti varijable F za
vjerojatnost (površinu
desnog repa), stupanj
slobode brojnika i
nazivnika.

Primjer: Pronaći
vrijednost varijable F za
=0.25, kb=9 i kn=11.

F=1,53

Raspodjele podataka Dr. sc. Hrvoje Cajner


Papir vjerojatnosti
• još jedna od grafičkih metoda analize podataka (iz uzorka)
kontinuiranog obilježja
• utvrđuje se da li se podaci ponašaju po jednoj od promatranih
raspodjela i koliko koji elementi odstupaju
• za svaku raspodjelu posebno konstruira se papir vjerojatnosti:
– papir vjerojatnosti normalne raspodjele (najčešće)
– papir vjerojatnosti Weibull-ove raspodjele
– papir vjerojatnosti lognormalne raspodjele
– ...
• uzima se funkcija distribucije određene raspodjele i promjenom mjerila
dobiva se funkcija distribucije u obliku pravca (Henry-jev pravac)

Raspodjele podataka Dr. sc. Hrvoje Cajner


• konstruiranje papira vjerojatnosti normalne raspodjele
Papir vjerojatnosti
Funkcija distribucije Normal
Normal
99
100
95

80 ~84% 90
80
70
60 60

%
50
%

40
40 30
20

20 10
5

0
1
0 5 10 15 20 0 5 10 15 20
x  x  +
• Henry-jev pravac se ucrtava tako da se odrede dvije čvrste točke:
– 1. točka : (x=, y=50%)
– 2. točka : (x=+, y=84%)

Raspodjele podataka Dr. sc. Hrvoje Cajner


• primjena papira vjerojatnosti
Primjer: Provjeriti da li se podaci iz uzorka rasipaju po normalnoj raspodjeli.

- promatranjem podataka može se utvrditi da li se podaci rasipaju


po normalnoj raspodjeli.
- uzeta je raspodjela sa parametrima  = x i  02 =  2 ( x)
Raspodjele podataka Dr. sc. Hrvoje Cajner
1. Određeni proizvodni proces kontrolira se prebrojavanjem defektnih proizvoda u nekom vremenskom periodu. Po završetku
kontrole kvalitete proizvodnog sustava formirana je sljedeća tablica s rezultatima:
Broj defektnih (x) Broj uzoraka
0 52
1 40
2 26
3 11
4 5
5 1
a) Izračunati osnovne parametre prikazanih podataka: aritmetičku sredinu, standardnu devijaciju i varijancu, te
odrediti mod i medijan.
b) Nacrtajte histogram frekvencija i kumulantu
c) Navedite koja bi teorijska razdioba mogla opisati konkretne podatke (odrediti parametre) i napisati funkciju
vjerojatnosti.
d) Ako se prihvati da se proces ponaša po teorijskoj razdiobi, potrebno je izračunati vjerojatnost da se u promatranom
vremenskom periodu pronađe 2 ili više defektna proizvoda.

Raspodjele podataka Dr. sc. Hrvoje Cajner


x  E ( x) = m; m = 1,11
mx −m 1,11x −1,11
P( x) = e  P( x) = e
x! x!

Raspodjele podataka Dr. sc. Hrvoje Cajner


1. Određeni proizvodni proces kontrolira se prebrojavanjem defektnih proizvoda na uzorcima veličine 10 komada.
Nakon svakog uzorka ustanovljuje se broj defektnih proizvoda (x) u uzorku. Nakon 80 uzoraka formirana je
tablica s rezultatima.
Broj defektnih (x) Broj uzoraka
0 12
1 21
2 22
3 20
4 3
5 2

a) Izračunati osnovne parametre prikazanih podataka: aritmetičku sredinu, standardnu devijaciju i varijancu,
te odrediti mod i medijan.
b) Nacrtajte histogram frekvencija i kumulantu
c) Navedite koja bi teorijska razdioba mogla opisati konkretne podatke (odrediti parametre) i napisati
funkciju vjerojatnosti.
d) Ako se prihvati da se proces ponaša po teorijskoj razdiobi, potrebno je izračunati vjerojatnost da se u
uzorku pronađe 4 ili više defektnih proizvoda.

Raspodjele podataka Dr. sc. Hrvoje Cajner


Primjer - Prilagodba normalne raspodjele
Osnovni statistički parametri promatranog uzorka izuzetog iz jednog procesa su: 𝑥 =50,026;
𝜎 2 = 0,145. Podaci su nakon analize strukturirani u tablicu frekvencija. Potrebno je prilagoditi
normalnu raspodjelu.
indeks raz., di xi Razred frekvencija, fi
-2 49,3 49,2 - 49,4 2
-1 49,6 49,5 - 49,7 7
0 49,9 49,8 - 50,0 14
1 50,2 50,1 - 50,3 10
2 50,5 50,4 - 50,6 6
3 50,8 50,7 - 50,9 3
16 45

14 40

35
12

30
10
Frekvencija

Frekvencija

25
8
20
6
15

4
10

2
5

0 0
49,3 49,6 49,9 50,2 50,5 50,8 49,3 49,6 49,9 50,2 50,5 50,8
x x

2
1  x− 
1 − 
  1 − 12 t 2
f ( x) = e 2  f (t ) = e
 2 2
N i
ft ( x) =  f (t )

N - ukupni broj podataka, i -širina razreda (razlika sredina dvaju razreda)

Raspodjele podataka Dr. sc. Hrvoje Cajner


xi Razred frekvencija, relativna x− f(t) fti
t=
fi frekvencija, fri 
49,3 49,2 - 49,4 2 0,0476 -1,905 0,06529 2,159
49,6 49,5 - 49,7 7 0,1666 -1,118 0,213928 7,074
49,9 49,8 - 50,0 14 0,333 -0,331 0,3777 12,49
50,2 50,1 - 50,3 10 0,2381 0,456 0,359 11,89
50,5 50,4 - 50,6 6 0,1428 1,2 0,184 6,099
50,8 50,7 - 50,9 3 0,0715 2,03 0,051 1,686
Histogram teorijskih frekvencija Histogram teorijskih kumulativnih frekvencija
14 45

40
12

35
10
30
Teorijska frekvencija, fti
Teorijska frekvencija, f ti

8 25

20
6

15
4
10

2
5

0 0
49,3 49,6 49,9 50,2 50,5 50,8 49,3 49,6 49,9 50,2 50,5 50,8
x x

Raspodjele podataka Dr. sc. Hrvoje Cajner

You might also like