Professional Documents
Culture Documents
Konspekt 2013
Konspekt 2013
i
. Elementaarsndmustest saame konstrueerida sndmusi. tleme, et suvaline elementaar-
sndmuste ruumi alamhulk mrab sndmuse . Praktikas huvitavad meid vaid sellised
elementaarsndmuste hulgad, millele oskame anda tlgenduse. Sndmusi thistame suurte la-
dina thtedega: A, B, C, ... jne, millele tarbe korral lisame indeksi. Mnikord kasutame snd-
muste thistamiseks snalisi vljendeid, niteks: "paarisarvuline tulemus", "positiivne eksami
hinne" jms.
tleme, et sndmus A={
i1
,
i2
,...
,
ik
} toimub, kui katse tulemuseks on ks sndmust
A mravatest elementaarsndmustest. Niteks kui vaadeldavaks sndmuseks A on "paaris-
arvu silmade saamine hel tringu viskel", siis sndmus tleme, et sndmus A toimub, kui
tringu pealmisel tahul on kas 2, 4 vi 6 silma. Teisiti, kui ={
1
,
2,
3,
4,
5
,
6
} on trin-
guviskele vastav elementaarsndmuste ruum, siis paarisarvu silmade saamisele vastab
elementaarsndmuste hulk A={
2
,
4
,
6
}.
Kogu jrgnevas ksitluses eeldame, et meil on mratud elementaarsndmuste ruum
ning vaatleme selle alamhulki kui sndmusi. Iga konkreetse elementaarsndmuste ruumi kor-
ral saab mrata kindla arvu erinevaid sndmusi. Niteks, olgu lihtsuse mttes antud meie
elementaarsndmuste ruumis ainult 3 elementi: = {
1
,
2
,
3
}. Selle ruumi phjal saame
konstrueerida kokku 7 erinevat sndmust: A
1
= {
1
}, A
2
= {
2
}, A
3
= {
3
}, A
4
= {
1
,
2
},
A
5
= {
1
,
3
}, A
6
= {
2
,
3
}, A
7
= {
1
,
2
,
3
}. Tavaliselt lisatakse sellele hulkade hulgale ka
thihulk A
8
= = {}, mille korral ei toimunud htegi eelpool mainitud elementaarsndmus-
tes. Saab nidata, et n elemendilisest elementaarsndmuste ruumist tulenevate erinevate snd-
muste koguarv koos thihulgale vastava sndmusega on 2
n
.
tleme, et sndmus A = {
1
,
2
, ...,
k
} toimub, kui katse tulemuseks on ks elemen-
taarsndmustest, kas
1
vi
2
vi ... vi
k.
Sndmust A nimetatakse kindlaks sndmuseks, kui ta on mratud kogu elementaar-
sndmuste ruumil, st A = . Seega katse lbiviimisel sndmus A toimub kindlasti, kuna vas-
tavalt elementaarsndmuste ruumi definitsioonile vhemalt ks elementaarsndmus toimub.
Sndmust A = nimetatakse vimatuks sndmuseks. Kuna vimatule sndmusele vas-
tav hulk ei sisalda htegi elementaarsndmust, siis (igati oodatult!) vimatu sndmus ei saa
toimuda.
6
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Nide 1.1. Vaatleme eksamit kui juhuslikku katset, millel saadavad hinded kui katse vi-
malikud vljundid (elementaarsndmused!) moodustavad elementaarsndmuste ruumi =
{A, B, C, D, E, F}. tleme, et toimus sndmus lipilane sooritas eksami, kui katse vl-
jundiks oli ks hulka {A, B, C, D, E} kuuluvatest elementaarsndmustest ja ei sooritanud
eksamit, kui vljundiks on {F}.
Toodud nites on sndmused lipilane sooritas eksami ja ei sooritanud eksamit
teinesteist vlistavad. Selle nite korral saaksime tinglikult sisse tuua ka thihulga miste
lipilane ei tulnud eksamile ja seega ta eksamihinnet ei saanud. Paneme thele, et sellise tl-
genduse juures on ks probleem tudengi eksamile mitteilmumine ei ole tegelikult vimatu
sndmus.
Sndmusi A
1
, A
2
,... ja A
n
nimetame ksteist vlistavaiks, kui he toimumine vlistab
lejnute toimumise ehk he toimumisel teised toimuda ei saa.
Sndmuse A vastandsndmuseks (thistame
A
), nimetatakse sndmust, mis toimub siis
ja ainult siis kui A ei toimu. Lhtudes elementaarsndmuste ruumist, mravad sndmuse
A
need elementaarsndmused, mille korral A ei toimu, st mis vlistavad A toimumise. Kasuta-
des tehteid hulkadega vime kirjutada
A
= \ A, kus \ thistab hulkade lahutamistehet.
Siit tulenevalt vime lihtsalt tuletada, et vastandsndmuse vastandsndmus
A
on see snd-
mus A ise.
Sndmusi A
1
, A
2
, ..., A
n
nimetatakse ainuvimalikeks, kui katse sooritamisel vhemalt
ks neist toimub. Ainuvimalikud sndmused ei pruugi olla ksteist vlistavad.
Sndmused A
1
, A
2
, ..., A
n
moodustavad sndmuste tieliku ssteemi (tisssteemi) kui
nad on ksteist vlistavad ainuvimalikud sndmused.
Niteks moodustavad sndmuste tieliku ssteemi tringuviske tulemused, aga ka suvaline
hulk, mis koosneb vaid sndmusest ja tema vastandsndmusest.
Kokkuvtteks vime elda, et formaalselt on sndmus mingi katse vimalike tulemuste
hulk, sndmusega seotakse teda iseloomustav parameeter - toimumine/mittetoimumine. Edas-
pidises hakkab meid huvitama kvantitatiivne hinnang sndmuse toimumise vimalikkusele,
mida nimetame sndmuse tenosuseks.
1.2 Tehted sndmustega
Sndmust vaatlesime elementaarsndmuste hulgana elementaarsndmuste ruumis. Hul-
kade korral on defineeritud tehted hulkadega: liitmine, korrutamine ja lahutamine. Iga sellise
tehte tulemus on hulk samas elementaarsndmuste ruumis, mis seega mratleb mingi snd-
muse.
Olgu jrgnevas A
1
, A
2
, ..., A
n
suvalised sama elementaarsndmuste ruumi phjal mratud
sndmused.
Sndmuste A
1
, A
2
, ..., A
n
summaks A nimetame sndmust A = A
1
U A
2
U ... U A
n
.
Lhtudes hulkade summa mratlusest, sisaldab hulk A kiki neid elementaarsndmusi,
mis kuuluvad vhemalt hte sndmustest A
i
. Seega vime elda, et sndmus A toimub para-
jasti siis, kui toimub vhemalt ks sndmustest A
i
(i = 1, 2, ..., n).
Sndmuste A
1
, A
2
, ..., A
n
korrutiseks A nimetame sndmust A = A
1
A
2
... A
n
.
7
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Lhtudes hulkade hisosa mratlusest, sisaldab hulk A neid ja ainult neid elementaar-
sndmusi, mis kuuluvad kikidesse sndmustesse A
i
. Seega vime elda, et sndmus A toi-
mub parajasti siis, kui toimuvad kik sndmused A
i
(i = 1, 2, ..., n).
Sndmuste A
i
ja A
j
vaheks nimetame sndmust A
i
\ A
j
ehk antud sndmus sisaldab ainult
neid elementaarsndmusi, mis kuuluvad sndmusesse A
i,
ent ei kuulu sndmusesse A
j
.
2 TENOSUSE MISTE JA OMADUSED
Sndmusega tenosusteoorias me ei seo mingeid arvulisi nitajaid, ei laiust, ei pikkust, ei
aega, ei kestvust. Nagu eespool vaatlesime, oli sndmusega seotud vaid ks nitaja snd-
muse toimumine (sndmus kas toimub vi ei toimu). Samas on ilmne, et mningate snd-
muste toimumise vimalikkus on suurem kui teistel. Niteks, tringu viskamisel on paaris-
arvu silmade saamine oodatavam kui tpselt kahe silma saamine. Jrgnevas huvitab meid si-
duda sndmuse toimumisega mingi arvuline nitaja, et oleks vimalik vrrelda sndmuse toi-
mumise vimalikkust arvude vrdlemise teel.
Arvulist karakteristikut, mis lubab vrrelda eri sndmusi nende toimumise vimalikkuse
seisukohalt, nimetame tenosuseks.
Kui katsel on n vrdvimalikk u vljundit = {
1
,
2
...,
n
}, ning neist k (k n) vljundit
mravad elementaarsndmuste hulga, mille korral tleme, et toimub sndmus A, siis nime-
tame sndmuse A toimumise tenosuseks p(A) arvu
n
k
= p(A)
(2.1)
Vahetult sellest definitsioonist lhtudes vime testada jrgmised omadused:
- kindla sndmuse tenosus p() = 1,
- vimatu sndmuse tenosus p() = 0
- suvalise sndmuse A tenosus asub vahemikus 0 p(A) 1
lal defineeritud suurust p(A) nimetatakse sndmuse klassikaliseks tenosuseks. Peale
klassikalise tenosuse kasutatakse veel mitmeid tenosuse mratlusi, niteks geomeetrili-
ne tenosus, statistiline tenosus, subjektiivne tenosus ja veel mned. Kesolevas kur-
suses neid eraldi ei ksitleta, teen siinjuures vaid kaks lisamrkust:
1) klassikaline tenosus on kahe arvu suhe ja sageli vljendatakse seda suhet igapevae-
lus protsentides, st korrutatakse arvuga 100;
2) saab nidata, et piisavalt suure katsete arvu korral lheneb jlgitava sndmuse sagedus
tema toimumise tenosusele.
Nide 2.1. Thistagu A sndmust, mis seisneb selles, et kaardipakist (52 kaarti) tmmatud
3 kaardi hulgas on tpselt kaks kuningat. Milline on selliselt mratud sndmuse A esinemise
tenosus?
Elementaarsndmuste ruumiks on kikvimalikud erinevad kaardikolmikud, mida saame
moodustada 52 kaardi hulgast. Kokku on selliseid kolmikuid kombinatsioonide arv 52 kaardi
hulgast kolme kaupa seega
3
52
C n . lesande tingimustele vastavalt peab kolmest kaar-
dist kaks olema valitud nelja kuninga hulgast, seega on
2
4
C vimalust ja igale vimalikule
8
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
kuningapaarile vastab vimalus valida kaaslaseks ks kaart 48 mittekuninga hulgast, ehk
teisiti
1
48
C vimalust. Jrelikult on meie poolt vaadeldava sndmuse korral soodsate vi-
maluste koguarv
1
48
2
4
*C C k ning sndmuse A tenosus
3
52
1
48
2
4
*
) (
C
C C
A p
.
3 TEHTED TENOSUSTEGA
Eespool defineerisime sndmuste summa ja korrutise misted. Vaatame, kuidas leida
selliste liitsndmuste tenosusi.
3.1 ksteist vlistavate sndmuste summa tenosus
Teineteist vlistavate sndmuste A ja B summa tenosus vrdub nende tenosuste sum-
maga:
P(A U B) = P(A) + P(B)
.
Nide 3Error: Reference source not found.1. Seisnegu sndmus A selles, et tringu
viskamisel saadakse 1 punkt ja B selles, et saadakse 2 punkti. Sndmust C = A U B saab
vaadelda sndmusena, et tringu viskamisel saadakse kas ks vi kaks punkti. Lhtudes
laltoodust vime kirjutada
P(A U B) = P(A) + P(B) = 1/6 + 1/6 = 1/3.
On lihtne ldistada see seaduspra suvalise arvu sltumatute sndmuste A
1
, A
2
, ..., A
n
koh-
ta.
3.2 Tinglik tenosus ja sndmuste korrutise tenosus
Sndmuste korrutamise tenosuse mratlemisel vaatleme ksteisele jrgnevaid snd-
musi, kus sndmuse iga jrgneva sndmuse tenosus vib sltuda sellest, mis enne teda juh-
tus.
Olgu meil tegemist kahe teineteisele ajas jrgneva sndmusega. tleme, et kaks sndmust
on sltumatud, kui he toimumine ei mjuta teise toimumist. Niteks, tringu jrjekordse
viske tulemus ei sltu sellest, milline tulemus saadi eelmisel viskel. Kui aga niteks on tege-
mist loteriiga, millel loositakse vlja ainukene vit auto, siis ilmselt peale juhusliku pileti
valimist muutub jrgmisena juhuslikult valitud pileti vidu tenosus.
Sndmuse A (toimumise) tenosust tingimusel, et toimus sndmus B, nimetatakse snd-
muse A tinglikuks tenosuseks sndmuse B suhtes ja thistatakse P(A | B) ja leitakse
valemiga
P(B)
B) P(A
= B) P(A
|
.
Sellest tingliku tenosuse definitsioonist saame eeskirja sndmuste korrutise te-
nosuse leidmiseks.
Korrutamislause. Kahe sndmuse A ja B korrutise tenosuseks P(AB) nimetatakse arvu,
mis saadakse he sndmuse tenosuse korrutamisel teise sndmuse tingliku tenosusega
esimese suhtes: P(A B) = P(B) P(A | B).
9
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Juhul, kui sndmuse A toimumine ei sltu B toimumisest (sndmused on sltumatud),
siis loomulikult P(A | B) = P(A) ning korrutamislause vime vlja kirjutada kujul:
Seda vrdust kasutatakse sageli ka selleks, et mrata kahe sndmuse sltuvus vi sltuma-
tus, tpsemalt sndmuste sltumatus defineeritakse seda tpi seose abil.
Korrutamislauset on lihtne laiendada ka enam kui kahe sndmuse korrutisele, seda kasutame
ka jrgnevas nites.
Nide 3.2. Firma korraldas loterii, milles oli 100 pileti hulgas 20 viduga piletit. Milline
on tenosus, et esimesena kolm piletit vtnud isik saab kolm vidupiletit?
Lahendus: Olgu A
1
- "esimesena valitud pilet on viduga",
A
2
- "teisena valitud pilet on viduga",
A
3
- "kolmandana valitud pilet on viduga".
Siis P(A
1
A
2
A
3
) = P(A
1
) P(A
2
| A
1
) P(A
3
| A
1
A
2
)= 20/100 x 19/99 x 18/98, mis ongi otsitav
tenosus.
3.3 Sndmuste summa tenosus
Eespool vaadeldi ksteist vlistavate sndmuste summa tenosust. Kasutades snd-
muste korrutise tenosust saame leida sndmuste summa tenosuse ka ldjuhul, kui ei eel-
data, et sndmused on ksteist vlistavad.
Sndmuste A ja B summa tenosus on vrdne nende sndmuste tenosuste summa ja
korrutise tenosuse vahega:
P(A U B) = P(A) + P(B) P(A B).
P(A B) = P(B) P(A).
10
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Lhtudes korrutamislausest saab selle valemi ka testada
1
, kuid vtame selle kui testatud
fakti. Illustreerime seda lihtsalt mistetava nitega.
Nide 3.3. Oletame, et kaks jahimeest nevad hunti ja tulistavad korraga. Olgu jahi-
meeste "tpsusklass" selline, et esimene jahimees tabab tenosusega 0.8 ja teine te-
nosusega 0.6. Lihtsuse mttes eeldame, et kskik kumma jahimehe hunti tabav kuul on sur-
mav. Milline on tenosus, et hunt sai surma?
Lahendus. Siin on tegemist kahe sltumatu sndmuse summaga: A - "esimene jahimees
laskis hundile pihta" ja B - "teine jahimees laskis hundile pihta". Vastavalt toodud valemile
saame leida hundi surmasaamise tenosuse:
P(A U B) = P(A) +P(B) P(A B) = 0,8 + 0,6 0,8*0,6 = 1,4 0,48 = 0,92
Seda lesannet on vimalik lahendada ka teisiti. Nimelt on sndmus "Hunt sai surma"
vastandsndmuseks sellele, et Hunt ji elama, s.t. mlemad jahimehed lasksid mda:
P("surnud") = 1 - P("elus") = 1P AB1P A P B = 1-0,2*0,4=0,92
*1Testus. Kui vaatleme kahte sndmust A ja B, siis sndmus A toimub kas koos snd-
musega B (seega AB) vi koos sndmuse B mittetoimimisega (seega A B). Analoogiliselt
toimub sndmus B kas koos sndmusega A (seega AB) vi koos sndmuse A mittetoimumi-
sega (seega AB).
Seega A = AB + A
B
ja B = AB + AB
Kuna mlemas vrduses on liidetavad teineteist vlistavad, siis vime kirjutada:
P(A) = P(AB) + P(A
B
)
P(B) = P(AB) + P( AB)
Liites vrduse mlemad pooled, kehtib vrdus
P(A
B
) + P( AB)= P(A) + P(B) - 2P(AB)
Analoogilise mttekiguga saame, et sndmus A U B toimub parajasti siis, kui toimub ks
teineteist vlistavatest sndmustest AB, BA vi A
B
. Seega
A U B = AB U AB U A
B
ja kasutades ra seda, et nad on ksteist vlistavad, saame
P(AUB) =P(AB) +P( AB) +P(A
B
)
Vttes nd kaks testatud seost kokku, ongi meil kes tulemus
P(AUB) = P(A) +P(B) - P(AB).
11
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
3.4 Sndmuse tistenosus
Vaatleme situatsiooni, kus mingi sndmus saab toimuda ainult koos mingi teise snd-
musega. Tavaliselt on tegu sellise juhtumiga siis, kui enne katse tegemist tuleb teha valik mit-
me erineva katsekeskkonna vahel. Niteks - kui enne eksamit on vimalik valida mitme
ppeju vahel vi kui Hiina sitmiseks on vimalik valida mitme erineva turismifirma vahel
jne.
Sellise situatsiooni vime formaalselt snastada jrgmiselt. Olgu sndmus A selline, et A
vib toimuda koos hega ja ainult hega sndmuste tielikku ssteemi moodustavatest snd-
mustest H
1
, H
2
, ... , H
n
. Leida tenosus, et sndmus A toimub.
Lhtudes sndmuse A toodud mratlusest vime ta vlja kirjutada liitsndmusena
A= AH
1
U AH
2
U ...U AH
n
.
Kuna probleemi pstituse jrgi on sndmused H
i
ksteist vlistavad, siis on seda ka AH
i
ning lhtudes liitmislausest saame
P(A) = P(AH
1
) + P(AH
2
) + ...+ P(AH
n
).
ehk lhemalt kujul
) H P(A P(A)
n
1 i
i
Kasutades nd iga liidetava korral korrutamisteoreemi, saame valemi
)) H | P(A ) (P(H P(A)
i
n
1 i
i
,
mida nimetatakse tistenosuse valemiks.
Nide 3.4. Oletame, et lipilane ppis eksamiks selgeks kogu vajaliku materjali ja vib
eksami sooritada positiivsele hindele. Tavaliselt lisandub aga veel teine faktor - ppeju sub-
jektiivne arusaamine lipilase teadmistest. Oletame, et eksami andmiseks on lipilasel vi-
malik valida kolme erineva ppeju (thistame neid H
1
, H
2
ja H
3
) vahel. On teada, et ks neist
on raske arusaamisega lipilase headusest ning sellest tulenevalt sooritatakse eksam
lipilase heade teadmiste korral tema juures tenosusega 0,4; teine ppejud on vhe tai-
bukam ja tema saab aru, kas lipilane oskab vi ei tenosusega 0,7; kolmas ppejudude
saab aru sellest, et lipilane teab tenosusega 0,9. Leida eksami sooritamise tenosus.
Lahendus. On selge, et kui lipilasel oleks teada, kes on kes, ei tekiks ksimust kelle
juures eksam anda. Praeguses eeldame, et ta seda ei tea ja on sunnitud valima ppeju juhus-
likult. Eksami sooritamise tistenosuse vime kirjutada kujul
P(A) = P(H
1
)P(A|H
1
) +P(H
2
)P(A|H
2
) +P(H
3
)P(A|H
3
)
Kuna ppeju valimise tenosused on vrdsed, siis P(H
i
)=1/3 siis
P(A) = 1/3*0,4 + 1/3*0,7 + 1/3*0,9 =0,67
Seega lipilase eksami sooritamise tenosus on tistenosuse valemi phjal 0,67.
Hindamaks tistenosust vljendava summa iga liikme P(H
k
)P(A|H
k
) panust tiste-
nosuses, vaatleme suhet:
)) H | P(A ) (P(H
) H | P(A * ) P(H
A) | P(H
i
n
1 i
i
k k
k
,
12
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
See suhe annab tingliku tenosuse P(H
k
|A) selleks, et sndmus A toimus just nimelt koos
sndmusega H
k
. Seda valemit nimetatakse Bayes'i valemiks.
Nide 3.5. Eeldame, et lipilane sai eksamil lbi (vt nide 3.4). Leida tenosus, et ta
sooritas eksami kolmanda ppeju juures.
Lahendus. Leiame suhte P(H
3
|A)= (1/3*0.9)/0,67= 0,447. Seega - jrgmine lipilane teab
et tenosusega 0,447, sooritas eelmine lipilane eksami kige parema ppeju juures.
Kuna me lhtume sellest, et lipilane sai eksamil lbi, siis tenosuste summa, et ta
sooritas eksami esimese, teise vi kolmanda ppeju juures peab vrduma hega.
13
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
JUHUSLIK SUURUS
4 DISKREETNE JUHUSLIK SUURUS
Juhuslik suurus on suurus, mis sltuvalt juhusest vib omandada erinevaid vrtusi. Juhus-
likuks suuruseks on niteks: lipilaste arv tenosusteooria loengul, hu temperatuur, tele-
foniarve suurus kuus, inimese pikkus, firma kive jne. Iga juhusliku suuruse korral on esmane
mrata, milliseid vrtusi ta vib omandada, st mrata tema vimalike vrtuste hulk.
Niteks juhuslik suurus "lipilaste arv loengul" vib omandada vrtusi {0, 1, 2, ..., n}, kus
n on ainele registreerinud lipilaste arv; juhuslik suurus "hu temperatuur" vrtusi vahemi-
kus (-80, +60) jne. Juhuslike suuruste liigitamise seisukohalt ei ole oluline mitte see, milliseid
konkreetseid vrtusi ks vi teine juhuslik suurus vib omandada, vaid see, kas vimalike
vrtuste hulk on lplik vi lpmatu. Nii on lal toodud nidetes esimesel juhul lplik arv
vimalikke vrtusi, teisel juhul on tegemist reaalarvude vahemikuga, milles on lpmatu arv
erinevaid vimalikke vrtusi.
Juhuslikku suurust nimetatakse diskreetseks juhuslikuks suuruseks, kui ta vib
omandada lpliku vi loenduva
2
hulga vrtusi: niteks tringuviskel saadav silmade arv,
mdalaskude arv esimese tabamiseni, eksamihinne, loengul olevate lipilaste arv jne. Disk-
reetse juhusliku suuruse vimalikud vrtused ei pea olema tisarvud, oluline on, et erinevaid
vimalikke vrtusi oleks lplik vi loenduv arv.
Juhuslikku suurust nimetatakse pidevaks juhuslikuks suuruseks, kui ta vib omandada
lpmatu hulga vrtusi. Kesolevas kursuses eeldame, et pideva juhusliku suuruse vrtused
on reaalarvud mingist reaalarvude vahemikust. Niteks on pidevaks juhuslikuks suuruseks
arbuusi kaal, he liitri bensiiniga lbitud vahemaa, jne.
Eespool kasutasime juhuslike suuruste thistamiseks tema sisust tulenevat nime: pikkus,
arbuusi kaal jne. Ksitluse formaliseerimiseks thistame alljrgnevas juhuslikke suurusi
suurte ladina thtedega X, Y, Z, ... ja nende konkreetseid vrtusi vastavate vikeste thtede-
ga koos indeksitega X = {x
1
, x
2
, ..., x
n
}; Y = {y
1
, y
2
, ...}; Z = {z
1
, z
2
, ...}.
Juhuslike suuruste kirjeldamisel on oluline leida nende kitumise tenosuslik aspekt,
mida vime vljendada kahe ksimusega:
1) milline on tenosus juhusliku suuruse iga vimaliku vrtuse omandamiseks,
2) milline on tenosus, et juhuslik suuruse vrtus asub mingis vahemikus.
Neist esimene ksimus puudutab ainult diskreetseid juhuslikke suurusi, teine aga m-
lemaid tpe.
Juhusliku suuruse igale vrtuse vastava tenosuse leidmiseks seotakse vrtus (vrtuste
vahemik) teatud sndmusega (juhuslik suurus X omandab vrtuse x
i
) ja vrtuste koguhul-
gale vastab sndmuste tielik ssteem (vt 1.1). Vrtusele vastava sndmuse tenosus loe-
takse juhuslikul suurusel selle vrtuse omandamise tenosuseks. Diskreetse juhusliku
suuruse korral on selline samastamine sna loomulik, niteks sndmus "tringu viskamisel
*2eldakse, et hulgas on loenduv arv elemente kui selle hulga elementide arv on vrdne mne naturaal -
arvude hulga alamhulga elementide arvuga. Nii niteks mdalaskude arv esimese tabamuseni vib olla kuitahes
suur ja seega ei ole vimaluste arv lplik, ent kindlasti on mdalaskude arv mingi naturaalarv ja jrelikult on
vimaluste arv loenduv.
14
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
tuleb vlja tahk kuue tpiga" vastab juhusliku suuruse "tringuviskel saadavate silmade arv"
vrtusele 6. Pideva juhusliku suuruse korral vaadeldakse sndmust kui juhusliku suuruse
vrtuse langemist teatud vahemikku ja sellega saadakse sisuliselt vastavus, kus lplikule
arvule sndmustele vastab lpmatu hulk vrtusi.
4.1 Diskreetse juhusliku suuruse jaotus
Eeskirja P(X), mis diskreetse juhusliku suuruse igale vrtusele seab vastavusse selle
vrtuse omandamise tenosuse, nimetatakse juhusliku suuruse (tenosuste) jaotuseks
(ka jaotusseaduseks). Juhusliku suuruse jaotuse vime anda kas tabelina, funktsioonina,
diagrammina vi muul sarnasel viisil, mis mrab ra vastavuse: juhusliku suuruse
vrtus tenosus, et juhuslik suurus omandab selle vrtuse. Thistame juhusliku
suuruse vrtusele x
i
vastavat tenosust p(x
i
) vi lhidalt p
i
. Seega P(X) = {p(x
1
),
p(x
2
), ..., p(x
n
)}.
Nide 4.1. Olgu teada, et laskur tulistab 2 korda ja iga lasu korral tabab mrklauda te-
nosusega 0,8. Leida mrklauda tabanud kuulide arvu kui juhusliku suuruse tenosuste
jaotus.
Lahendus. Olgu X juhuslik suurus "mrklauda tabanud kuulide arv", mis vastavalt nitele
vib omandada arvulisi vrtusi 0, 1 vi 2. Thistame vrtuste hulga X = {0, 1, 2}. Juhusli -
ku suuruse iga vrtuse omandamise tenosuse leidmisel lhtume temale vastava sndmuse
tenosusest. Seega korraldame vastavuse sndmuse ja juhusliku suuruse vimalike vrtuste
vahel. Olgu sndmus A - mrklauda tabas 0 kuuli, B - tabas 1 kuul ja C - tabas 2 kuuli.
Kasutades sndmuste summa ja korrutise tenosuse leidmise eeskirja saame leida:
P(A) = 0,2 x 0,2 = 0,04
P(B) = 0,2 x 0,8 + 0,8 x 0,2 = 0,32
P(C) = 0,8 x 0,8 = 0,64
Juhusliku suuruse tenosuste jaotustabeli vime nd vlja kirjutada kujul:
A B C
x
i
0 1 2
p(x
i
) 0,04 0,32 0,64
Tavaliselt jaotustabelis sndmusi thistavat rida vlja ei kirjutata, praegusel juhul tegime
seda selleks, et rhutada juhusliku suuruse vrtuste tenosuste arvutamist vastavate snd-
muste tenosuste kaudu. Kuna sndmused A, B ja C moodustavad sndmuste tieliku ss-
teemi (on ksteist vlistavad ja ks neist kindlasti toimub), siis peab tenosuste summa
vrduma hega.
Nide 4.2. Olgu diskreetne juhuslik suuruse X ={0, 1, 2, 3, 4, 5, 6, 7, 8} jaotus antud tabe-
liga:
x
i
0 1 2 3 4 5 6 7 8
p(x
i
) 0,004 0,031 0,109 0,219 0,274 0,219 0,109 0,031 0,004
Jaotuse olemusest parema visuaalse ettekujutuse saamiseks koostatakse sageli tabeli alusel
tulpdiagramm. Praegusel juhul saaksime:
15
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Siit on visuaalselt nha tenosuse muutumine tema vimalike vrtuste korral ning see
annab hea levaate jaotuse olemusest. pris sageli on aga tarvis leida tenosus, et juhuslik
suurus on viksem (vi suurem) kui mingi ette antud vrtus. Tenosuse viksem kui leid-
miseks liidame kikide eelnevate vrtuste tenosused. Selle saame kirjutada valemina
) p(x ) x P(X ) F(x
j i i
i j
x x
,
kus funktsiooni F(x) nimetatakse jaotusfunktsiooniks.
Leiame nite 4.2 phjal juhusliku suuruse jaotusfunktsiooni vrtused kikide vimalike
vrtuste korral ja korrastame tulemused tabelisse:
F(0)=
=P(X0)
F(1)=
=P(X1)
F(2)=
=P(X2)
F(3)=
=P(X3)
F(4)=
=P(X4)
F(5)=
=P(X5)
F(6)=
=P(X6)
F(7)=
=P(X7)
F(8)=
=P(X8)
F(x) 0,004 0,035 0,144 0,363 0,637 0,856 0,965 0,996 1,000
Selle tabeli vime esitada jllegi tulpdiagrammina, kus x-teljel on juhusliku suuruse vr-
tused ja y-teljel vrtusele vastav tenosus.
Tegelikult ei pea jaotusfunktsiooni argumendiks olema vaadeldava juhusliku suuruse vi-
malik vrtus, selleks vib olla suvaline arv. On ilmne, et jaotusfunktsioon ei saa kahaneda
(positiivsete arvude summa). Samuti, et F(x
1
-) = P(X x
1
-) = 0 ja F(x
n
) = P(X x
n
) = 1, kus
on kuitahes vike positiivne arv. Praegusel, diskreetse juhusliku suuruse korral tuleneb
jaotusfunktsioon vga loogiliselt teadaolevast jaotusest. Oluliseks muutub aga jaotusfunkt-
siooni miste just pideva juhusliku suuruse korral, kus ta on tegelikult pideva juhusliku
suuruse mratlemise phialus.
Tenosuse, et juhuslik suurus on suurem kui mingi arv vime defineerida analoogili-
selt, kuid tavaliselt leitakse selline tenosus kasutades vastandsndmuse tenosust ja seega
P(X > x) = 1 - P(X x).
0
0,2
0,4
0,6
0,8
1
1,2
Jaotusf unktsioon F(x)
Jaotuse tul pdi agramm
16
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
4.2 Tehted diskreetsete juhuslike suurustega
Diskreetne juhuslik suurus on mratud, kui on teada tema vimalikud vrtused ja ja nen-
de vrtuste esinemise tenosused (jaotus), s.t, kui on antud paar (X, P(X)) = {(x
i
, p(x
i
)):
i=1,2,...}.
tleme, et diskreetsed juhuslikud suurused X ja Y on sltumatud, kui he juhusliku
suuruse kindla vrtuse omandamise tenosus ei sltu sellest, millise vrtuse omandab
teine juhuslik suurus. Sltumatute juhuslike suuruste korral vime tenosuse, et X omandab
vrtuse x
i
ja Y omandab vrtuse y
j
leida kui
P(X = x
i
,Y = y
j
) = P(X = x
i
) P(Y = y
j
).
Edaspidises kasutame thistustes lhendatud varianti: p(x
i
, y
j
) = p(x
i
)p(y
j
)
Juhuslike suurustega saab teha teha aritmeetilisi tehteid. Niteks perekonna kuu sissetule-
ku leidmiseks peame liitma pere liikmete kuu sissetulekud ja saame uue juhusliku suuruse
(kui iga liikme sissetulek on juhuslik suurus). Uue juhusliku suuruse korral on nagu ikka
tarvis kigepealt leida tema vimalikud vrtused ja iga vrtuse tenosus, st mrata jaotus.
Vaatlemegi jrgnevalt tehteid diskreetsete juhuslike suurustega. Olgu meil antud juhusli-
kud suurused X = {x
1
, x
2
, ..., x
n
}; Y = {y
1
, y
2
, ..., y
m
} ning olgu teada ka nende jaotused.
Summa. Kahe juhusliku suuruse (X, P(X)) ja (Y, P(Y)) summaks X+Y loeme juhuslikku
suurust (Z, P(Z)) = {(z
k
, p(z
k
)}, mille korral
z
k
= x
i
+ y
j
(i=1,2,...,n; j=1,2,...,m) ja p(z
k
) = p(x
i,
,
y
j
).
Kui X ja Y on sltumatud diskreetsed juhuslikud suurused, siis tulenevalt ksikvrtustele
vastavusse seatavate sndmuste sltumatusest saame vita, et tenosus p(z
k
) = p(x
i
)p(y
j
).
Sltuvate juhuslike suuruste korral tuleb arvestada tinglikke tenosusi.
Korrutis. Kahe juhusliku suuruse (X, P(X)) ja (Y, P(Y)) korrutiseks XY loeme juhuslik-
ku suurust (Z, P(Z)) = {(z
k
, p(z
k
)}, mille korral vrtus on z
k
= x
i
y
j
(i=1,2,...,n; j=1,2,...,m) ja
vastava vrtuse tenosus on p(z
k
) = p(x
i,
y
j
).
Samuti nagu summa korral kehtib siingi: kui X ja Y on sltumatud diskreetsed juhuslikud
suurused, siis p(z
k
) = p(x
i
)p(y
j
); sltuvate juhuslike suuruste korral tuleb arvestada tinglikke
tenosusi.
Vahe. Kahe juhusliku suuruse (X, P(X)) ja (Y, P(Y)) vaheks X-Y loeme juhuslikku
suurust (Z, P(Z))={(z
k
, p(z
k
)}, kus z
k
= x
i
- y
j
(i=1,2,...,n; j=1,2,...,m) ja p(z
k
) = p(x
i
x
j
).
Juhul, kui X ja Y on sltumatud diskreetsed juhuslikud suurused, siis p(z
k
) = p(x
i
)p(y
j
);
sltuvate juhuslike suuruste korral tuleb arvestada tinglikke tenosusi.
Toodud tehete korral on oluline jtta meelde ldine tsiasi - sltumatute juhuslike suuruste
vrtuste vahel teeme vajaliku tehte (liidame, korrutame, lahutame), tulemuse tenosuse
saamiseks tuleb aga igal juhul lhtevrtuste tenosused korrutada. Seda on lihtne selgitada
tuginedes sndmustele. Tepoolest, kui vaadelda vrtustele vastavaid sndmusi, siis iga
tehte korral kehtib tulemuses vide toimub sndmus A (juhuslik suurus X=x
i
) ja toimub
17
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
sndmus B (juhuslik suurus Y=y
j
) ja seega peame leidma sndmuste A ja B korrutise te-
nosuse. Teine oluline aspekt on, et erinevate X ja Y vrtuste korral vivad tehte tulemusena
saadavad vrtused kokku langeda.
Nide 4.3. Mees ja naine kivad juhutdel. Saadav pevapalk on mlemal juhuslik suu-
rus, kusjuures mees teenib pevas kas 100, 150 vi 200 krooni; naine kas 150 vi 250 krooni.
Oletame, et nende juhuslike suuruste (mehe ja naise pevateenistus) korral on teada ka iga
vrtuse saamise tenosus:
Mees: X 100 150 200 Naine: Y 150 250
p(xi) 0,3 0,5 0,2 p(yi) 0,4 0,6
Perekonna peva sissetuleku, kui juhusliku suuruse, leidmiseks saame lhtudes lalpool
toodud reeglitest koostada jaotustabeli:
Perekond:
Z 250 300 350 400 450
p(z
i
) 0,12
0,2 0,26 0,3 0,12
4.3 Juhusliku suuruse arvkarakteristikud
Juhusliku suuruse arvkarakteristikud on analoogilised nendele, mida arvutatakse ld-
statistikas sagedustabeli phjal. Eriti suur on analoogia diskreetse juhusliku suuruse korral.
Allpool defineerime misted mood, keskvrtus ja dispersioon, lhtudes jaotustabelist.
4.3.1 Mood
Di skreetse juhusliku suuruse moodiks x
mo
nimetame juhusliku suuruse kige suurema te-
nosusega esinevat vrtust. Kuna sama tenosusega vib olla mitu vrtust, siis ei ole
mood mratud heselt. Seega vrtus x
mo
on mood, kui
) p(x max ) p(x
i
x
mo
i
.
Kui juhuslikul suurusel on ks mood, siis nimetatakse seda unimodaalseks, kui mitu
multimodaalseks
4.3.2 Keskvrtus
Diskreetse juhusliku suuruse X={x
1
, x
2
, ...} keskvrtuseks EX nimetatakse arvu
X x
i i
i
) p(x x EX
Keskvrtust nimetatakse ka matemaatiliseks ootuseks ehk ootevrtuseks. Selgitame
keskvrtuse mistet nite abil.
Nide 4.4. Kasiino kinkis lasteaiale juludeks mnguautomaadi. Seda oli igati lasteprane
ja lihtne ksitleda. Lapsel ei pruukinud teha muud, kui lasta automaati ks eurone mnt ja
kohe pistsid lagendikul sihitult ringi jooksma 7 hunti, 5 ilvest, 4 karu, 3 tiigrit ja 1 lvi. Suva-
18
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
lisel hetkel pstikule vajutades langes ks mnguautomaadi poolt juhuslikult valitud loom
jahisaagiks. Kui selleks oli tiiger, maksis automaat mngijale preemiaks 2 eurot, loomade
kuninga lvi pdmise korral aga 5 eurot. Phjamaiste ulukite korral sai mngijale osaks sb-
ralik soovitus Proovi veel.
Leida lapse mngu vidu keskvrtus (vidu matemaatiline ootus). Lapsed on mngust
vaimustuses, sest igaks neist unistab vahetada oma eurone mnt viielise vastu. Aga kuidas
neb vlja tegelikkus? Kogu lesande andmestiku vime koondada jrgmisse tabelisse:
Hunt Ilves Karu Tiiger Lvi
Ulukite arv 7 5 4 3 1
Uluki tabamise tenosus p=k/n 0,35 0,25 0,2 0,15 0,05
Tabamise preemia 0 0 0 2 5
Vit mngu lpul x
i
-1 -1 -1 1 4
Korrutis x
i
*p(x
i
)
-0,35 -0,25 -0,2 0,15 0,2
Vastavalt keskvrtuse arvutamise valemile
5
1 i
i i
) p(x x EX
, saame leida vidu keskvr-
tuse EX = -1* 0,35 + (-1)*0,25 + (-1)*0,2 + 1*0,15 + 2*0,2 = -0,45
Kokkuvttes vime elda, et igati kasulik kingitus kinkijale! Tiendusena toodud nitele
soovitan analsida juhtumit, kui kasiino hel peval otsustab maksta ka tiigri eest pree-
miaks 7 eurot.
Nagu nha, on diskreetse juhusliku suuruse keskvrtus teatud kaalutud summa, kus
kaaludeks on tenosused.
Keskvrtuse omadused. Leiame juhusliku suuruse keskvrtuse philised omadused,
mis on vajalikud kursuse edasistes osades. Nende testamisel on oluline arvestada, et disk-
reetse juhusliku suuruse tenosuste summa le kikide vimalike vrtuste vrdub hega.
1) Ec=c - konstandi keskvrtus on vrdne sama konstandiga: Ec = c (testada!)
2) E(cX) = cEX (testada!)
3) E(X+Y) = EX + EY - juhuslike suuruste summa keskvrtus vrdub keskvrtuste
summaga (testamata)
4) E(X-Y) = EX - EY (testuses kasutada ra omadusi 2 ja 3)
5) Sltumatute juhuslike suuruste korrutise keskvrtus vrdub keskvrtuste korruti-
sega E(XY) = EXEY:
i j
j j
i
i i
j
j i j i
i j
j i j i
EY EX ) p(y y ) p(x x ) )p(y p(x y x ) y , p(x y x E(XY)
4.3.3 Dispersioon
Krvuti juhusliku suuruse keskvrtusega on juhusliku suuruse iseloomustamisel oluline
hinnata ka tema vrtuste hajuvust keskvrtuse suhtes. Hajuvuse mratlemiseks vib kasu-
tada mitmesuguseid hinnanguid, kuid levinuimaks on dispersioon ja standardhlve.
Juhusliku suuruse dispersiooniks nimetatakse arvu: DX = E(X-EX)
2
.
19
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Kasutades keskvrtuse definitsiooni saame diskreetse juhusliku suuruse korral disper-
siooni kirjutada kujul:
i
i
2
i
) p(x EX) - (x DX
.
Dispersiooni korral kasutatakse summaarse hajuvuse hindamiseks hlvete ruutude sum-
mat, et keskvrtuse suhtes erimrgilised hlbed summas ei kustutaks ksteist. Ruuthlbe
kasutamisel on aga puuduseks see, et hlbe mtmiseks kasutatav hik on samuti ruudus.
Nimelt, kui niteks meie juhuslik suurus on mdetav meetrites, siis dispersioon (ruuthlve)
avaldub ruutmeetrites. Selle vltimiseks vetakse praktikas kasutusele ruutjuur dispersioonist.
Arvu
DX =
nimetatakse juhusliku suuruse standardhlbeks.
Vaatleme dispersiooni mningaid edaspidises olulisi omadusi. Seejuures eeldame, et ju-
huslikud suurused X ja Y on sltumatud.
1) Dc = 0 (testada)
2) D(cX) = E(E(cX) - cX)
2
= E(c
2
(EX-X)
2
) = c
2
E(EX-X)
2
= c
2
DX
3) DX = E(X-EX)
2
= E(X
2
-2XEX +(EX)
2
) = EX
2
- 2EXEX + E(EX)
2
= EX
2
- (EX)
2
4) D(X + Y) = E(X + Y)
2
- (E(X+Y))
2
= EX
2
+ 2 EX EY + EY
2
- (EX)
2
2 EX EY - (EY)
2
=
=EX
2
- (EX)
2
+ EY
2
- (EY)
2
= DX +DY (teise vrduse juures kasutasime sltumatust)
5) D(X - Y) = E(X - Y)
2
- (E(X-Y))
2
= EX
2
2 EX EY + EY
2
- (EX)
2
+ 2 EX EY - (EY)
2
=
=EX
2
- (EX)
2
+ EY
2
-(EY)
2
= DX +DY
20
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
5 DISKREETSE JUHUSLIKU SUURUSE TEOREETILISI JAOTUSI
Diskreetne juhuslik suurus on antud oma vimalike vrtuste loeteluga ja eeskirjaga, mis
igale vrtusele seab vastavusse selle vrtuse omandamise tenosuse. Kui vimalikud vr-
tused ja/vi vastavust korraldav eeskiri on teatud kindla kujuga, siis on meil tegemist vastavat
liiki (teoreetilise) jaotusega. Iga sellise liigi korral saame enamasti leida lihtsad valemid
jaotuse arvkarakteristikute (siin ksitleme vaid keskvrtust ja dispersiooni) leidmiseks.
Kesolevas paragrahvis vaatleme diskreetse juhusliku suuruse enamlevinud jaotusi, mil-
leks on htlane jaotus, binoomjaotus ja Poissoni jaotus.
5.1 Diskreetse juhusliku suuruse jaotusi
5.1.1 htlane jaotus
tleme, et diskreetne juhuslik suurus X = {x
1
, x
2
, ..., x
n
} on htlase jaotusega, kui kikide
vrtuste esinemistenosused on vrdsed, st p(x
i
) = p(x
j
) iga i, j = 1, 2, ..., n korral. Kuna
kikide vrtuste tenosuste summa peab vrduma hega:
1 = )
x
p(
i
n
1 = i
, on ruutkeskmise ja aritmeetilise
keskmise ruudu vahe.
Nide 5.1. Leida tringuviskel saadavate silmade arvu keskvrtus.
Lahendus. EX=1/6(1+2+3+4+5+6)=3,5.
21
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
5.1.2 Binoomjaotus
Olgu juhusliku suuruse X vimalikeks vrtusteks naturaalarvud X = {0, 1, 2, ..., n}. R-
hutamaks fakti, et tegu on tisarvudega, vtame kasutusele smboli k = 0, 1, ..., n.
tleme, et juhuslik suurus X on binoomjaotusega, kui tema iga vrtuse X = k tenosus on
antud valemiga
k n k k
n
p) (1 p C k) P(n,
, kus p on reaalarv vahemikus nullist heni: 0 p 1.
Sobivus. Selleks, et see tenosuse arvutamise eeskiri viks ldse olla juhusliku suuruse te-
nosuse jaotuseks, peab kikidele vrtustele vastavate tenosuste summa vrduma hega.
Nitame, et lal toodud valemi korral see kehtib.
Lhtume Newtoni binoomvalemist, mille ldkuju on:
+
n
0 k
k n k k
n
n
y x C y) (x .
See vrdus kehtib suvaliste reaalarvuliste vrtuste x ja y korral. Praegusel juhul, vttes x
= p ja y = 1-p, vime kikide vrtuste tenosuste summa kirjutada kujul
1 p)) (1 (p p) (1 p C k) P(n,
n
0 k
n k n k k
n
n
0 k
+
,
mis testabki vite.
Keskvrtus. Vastavalt diskreetse juhusliku suuruse keskvrtuse definitsioonile vime bi-
noomjaotusega juhusliku suuruse keskvrtuse kirjutada kujul:
n
0 k
k n k k
n
n
0 k
p) (1 p kC p(k) k EX (5.1)
Osutub, et seda valemit saab tunduvalt lihtsustada. Selleks lhtume jllegi Newtoni bi-
noomvalemist vttes x = p ja y = 1-p = q ning sellise thistuse tulemusena vime Newtoni bi-
noomvalemi kirjutada:
k - n k k
n
n
0 = k
n
q p = q) + (p C
.
Edasi teeme jrgmised tehted:
1) vtame vrduse mlemalt poolelt tuletise muutuja p jrgi ning saame:
q p
C
k = q) + (p n
k - n 1 - k
k
n
n
0 = k
1 - n
Arvestades nd, et p+q =1, saame vrduse vasakul pool tulemuseks np ja paremal pool
keskvrtuse EX arvutamise valemi binoomjaotuse korral (5.1). Kokkuvtte saime binoom-
jaotusega juhusliku suuruse keskvrtuse leidmiseks lihtsa avaldise:
EX = np.
Dispersioon. Saab nidata, et binoomjaotuse dispersioon avaldub samuti lihtsa avaldisena
DX=npq.
22
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Selle testus on suhteliselt lihtne, asjasthuvitatute jaoks toon selle joonealuse mrkusena
*1
Rakendatavus. Binoomjaotus on kahe parameetriga jaotus (nendeks on n ja p), mida thista-
takse B(n,p). Videt, et juhuslik suurus X on binoomjaotusega kirjutame kujul X ~ B(n, p).
Binoomjaotuse tuletamisel me ei sidunud teda mitte mingi konkreetse juhtumiga - binoom-
jaotus on teoreetiline jaotus. Kerkib loomulik ksimus, millised juhuslikud suurused on jaotu-
nud binoomjaotuse jrgi?
ldjuhul on binoomjaotusega tegemist, kui juhuslik suurus X={0, 1, , n} rahuldab
jrgmisi tingimusi:
- juhuslikuks suuruseks X=k on sndmuse esinemise kordade arv: 0, 1, ..., n katse-
seerias pikkusega n;
- igal katsel vaadeldav sndmus toimub tenosusega p, mis on muutumatu kikide
n katse korral ja katsete tulemused on sltumatud.
Nide 5.2. Oletame, et lipilaste teadmiste kontrollimiseks koostati test, mis sisaldab neli
ksimust, millele saab vastata kas jah vi ei. Testi sooritanuiks loetakse kik need
lipilased, kes vastasid igesti ra 3 vi 4 ksimust. ks lipilane ei teadnud ainet ja vastas
kikidele ksimustele juhuslikult. Leida igete vastuste arvu jaotus ja tenosus, et lipilane
sooritas testi edukalt.
Lahendus. Tegemist on neljast katsest koosneva katseseeriaga, milles iga katse korral
arvab lipilane ige vastuse ra tenosusega p=0,5, seega tegu on binoomjaotusega
B(n,p)=B(4, 0.5). Kasutades lal toodud valemit saame leida jaotustabeli
igete vastuste arv x
i
0 1 2 3 4
) p - (1 p
C
= i) (P(n, = )
x
P(
i - n i
i
n
i
0.0625 0.25 0.375 0.25 0.0625
Siit on kerge leida, et testi sooritamise tenosus antud tingimustel on kllaltki suur:
P(X3) = 0,25 + 0,0625 = 0,3125
ja seega ligikaudu iga kolmas ainet mittetundev lipilane sooritab testi.
Leida iseseisvalt, mis juhtub, kui lipilane kirjutab kikidele ksimustele vastuseks
"jah"?
*1 Asjasthuvitatud vivad saadud tulemust kontrollida. Testamiseks vtame lal saadud vrdusest
q p
C
k = q) + (p pn
k - n k
k
n
n
=0 k
1 - n
.
Korrutades nd mlemaid pooli suurusega p on tulemuseks :
q p
C k
= q) + (p p 1) - n(n + q) + (p np
k - n k
n
k
2
n
=0 k
2 - n 2 1 - n
.
Arvestades seoseid q p
C k
=
EX
k - n k
k
n
2
n
=0 k
2
ja p+q = 1, saame EX
2
= np + n(n-1)p
2
Teiselt poolt vastavalt dispersiooni omadustele vime kirjutada
DX = EX
2
- (EX)
2
= np +n(n-1)p
2
- n
2
p
2
= np + n
2
p
2
- np
2
- n
2
p
2
= np(1-p) = npq,
mis annabki testatava tulemuse.
23
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
5.1.3 Poissoni jaotus
Definitsioon ja omadused
tleme, et tisarvulisi vrtusi omav juhuslik suurus k = 0, 1, 2, ... on Poissoni jaotusega,
kui iga vrtuse tenosus on leitav valemiga
e
k!
= p(k)
-
k
, kus jaotuse parameeter > 0 on
konstant. Jaotuse parameetril on oma kindel thendus, mis selgub allpool.
Sobivus. Nitame kigepealt, et toodud valem
e
k!
= p(k)
-
k
sobib ldse juhusliku suuruse
tenosuse jaotuse andmiseks, st kikide vrtuste tenosuste summa vrdub hega:
0 k
1 p(k) .
Tepoolest, on teada e
mratlus summana
0 k
k
k!
e
. Seega saame vga lihtsalt
1 e e
k!
e e
k!
0 k
0 k
k
k
.
Keskvrtus. Leiame Poissoni jaotusega juhusliku suuruse X keskvrtuse:
Seega - jaotuse parameeter ei ole midagi muud kui Poissoni jaotusega juhusliku suuruse
keskvrtus.
Kasutades valemit DX = EX
2
- (EX)
2
saame leida, et Poissoni jaotusega juhusliku suuruse
dispersioon on samuti DX = .
Kokkuvttes saime, et Poissoni jaotuse kasutamiseks on vaja teada vaid hte parameetrit
, mis on nii jaotuse keskvrtuseks kui ka dispersiooniks. Poissoni jaotus on he parameet-
riga jaotus ja teda thistatakse P()
3
.
Rakendatavus. Millised juhuslikud suurused alluvad Poissoni jaotusele?
*3Mtleme korraks ka jaotuse parameetrite thendusele. Kui me teame nt binoomjaotuse pa-
rameetreid n ja k siis on jaotus tielikult kirjeldatud. Jaotuse parameetrite arv ongi mistetav
kui minimaalne komplekt infot, mis jaotuse ra kirjeldab. Poissoni jaotusel oli ainult ks pa-
rameeter, samuti htlasel jaotusel (vrtuste hulga suurus), binoomjaotusel aga kaks. Suva-
lisel diskreetsel jaotusel on parameetreid he vrra vhem kui vrtusi (sest kui vrtuste te-
nosused summeeruvad heks siis saame he vrtuse tenosuse lejnud vrtuste te-
nosuste abil alati leida).
e e =
1)! - (k
e
=
e
1)! - (k
=
e
k!
k
= EX
1 - k
1 = k
- -
k
1 = k
-
k
0 = k
24
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Vaatleme juhuslike sndmuste voogu ajas ning seame eesmrgiks leida kindlas ajava-
hemikus toimuvate sndmuste arvu tenosus. Selliseid protsesse, kus lesande pstitus
vastab toodud snastusele, on tegelikkuses kllaltki palju. Niteks kosmoselaeva tabavate
meteoriitide arv, jrjekorras seisvate inimeste arv, serverile saabuvate prdumiste arv, jne.
Mitte iga sndmuste vooga seotud sndmuse toimumiste arv kui juhuslik suurus ei allu Pois-
soni jaotusele. Poissoni jaotusega on tegemist juhul, kui vaadeldav protsess rahuldab jrgmisi
tingimusi:
- juhuslikuks suuruseks on vaadeldavas ajavahemikus toimuvate sndmuste arv,
- sndmuse toimumine teatud ajavahemikus ei sltu selle ajavahemiku algus- ja
lppmomendist (protsess on statsionaarne),
- kaks sndmust ei toimu samaaegselt (protsess on harilik),
- sndmuste toimumise arv vahemikus ei sltu nende arvust eelmises vahemikus
(protsess on jrelmjuta).
Praktilises elus selliseid kiki nudeid tielikult rahuldavaid ideaalseid protsesse ei
esine, kuid teatud lhendusega saame paljusid juhuslikke suurusi lugeda jaotunuks Poissoni
jaotuse jrgi.
Nide 5.3. Oletame, et meil on tegemist teenindusasutusega, kus iga kliendi teenin-
damiseks kulub 15 minutit. Kaheksa tunnise tpeva jooksul klastab seda asutust keskmi-
selt 20 inimest. Leida tenosus, et korraga on asutuses le kahe kliendi.
le kahe kliendi on asutuses parajasti siis, kui 15 minuti jooksul tuleb rohkem kui
kaks inimest. Keskmiselt tuleb 15 minuti jooksul (vaadeldav ajavahemik) 20 / 4*8 = 0,625
klienti, st = 0,625 ja tegemist on Poissoni jaotusega P() = P(0,625).
Seega leiame tenosuse, et tuleb le kahe kliendi:
P(k>2)= 1 - P(k=0) - P(k=1) - P(k=2) ==1- (0.625
0
e
-0.625
)/1- (0.625
1
e
-0.625
)/1-(0.625
2
e
-0.625
)/2=
=1 0.535 0,335 - 0.105 = 0.026
Seega le poolte klastajatest tulevad kontorisse kui seal pole htegi klastajat ja vaid
2,6% klastajaist neb enda ees vhemalt kahte inimest.
Oletame nd, et pevas klastab seda asutust mitte 20 vaid 40 inimest. Kuidas muutuvad
vastavad tenosused? Leiame = 40 / 32 = 1,25.
132 , 0 224 , 0 358 , 0 286 , 0 1
2!
625 , 0
-
1!
625 , 0
-
0!
625 , 0
- 1
2) p(k - 1) p(k - 0) p(k - 1 = 2) p(k
652 , 0 2 652 , 0 1 652 , 0 0
>
e e e
Seega, antud tingimustel teenindatakse alla kolmandiku klastajaist kohe, kuid 13% neb
enda ees vhemalt kahte klastajat ja peab ootama.
Poissoni piirteoreem
Binoomjaotuse rakendamisel vivad tekkida arvutuslikud raskused. Oletame niteks, et
meil on antud katsete kordamiste arv n=160 ja vaadeldav sndmus vib esineda tenosusega
25
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
0,005. Selleks, et leida tenosust, kus vaadeldav sndmus esineb tpselt 2 korda, peame
leidma
995
0.
005
0.
158! 2!
160!
= P(160,2)
158 2
Kuigi siin saab teha mningaid lihtsustusi, on selle avaldise vrtuse leidmine ikkagi
piisavalt suur t.
Teoreem. Kui juhuslik suurus X on binoomjaotusega B(n,p), siis katsete arvu piiramatul
suurendamisel on binoomjaotus lhendatav Poissoni jaotusega P(), kus =np.
Poissoni jaotus lhendab binoomjaotust kllalt hsti just sndmuse toimumise vikeste
tenosuste korral (p0,1) korral, kusjuures eeldatakse ikka piisavalt suurt katsete arvu. See
tuleneb Poissoni jaotuse olemusest: ksikute sndmuste voog, mille korraga esinemise te-
nosus on vike. Poissoni piirteoreemi vime kirjutada kujul:
e
k!
) (np
= P(np) p) B(n,
np -
k
.
Nide 5.4. Lennufirma andmeil on keskmiselt 200 reisija hulgas ks reisija imikuga. Len-
nukis on 160 reisijakohta ja kaks istet imikutele. Lihtsuse mttes eeldame, et kik reisija-
kohad on alati tidetud. Leida tenosus, et imiku kohtadest tuleb puudus.
See on tpiline binoomjaotuse juhtum (p=1/200=0,005; n=160; k>2), kuid lesande
lahendamine binoomjaotust kasutades on arvutuslikult ebamugav. Minnes le Poissoni
jaotusele saame leida
P(x=0) = e
-
= e
-0.8
= 0,449;
P(x=1) = e
-
= 0.8e
-0.8
= 0,359
P(x=2) =0.5
2
e
-
= 0.8e
-0.8
= 0,143
Otsitav tenosus avaldub vahena:
P(imikuistmetest tuleb puudus) = 1-(0,449+0,359+0,143) = 0,049. Seega kllaltki harva,
vaid 5% juhtudest tuleb imikuistmetest puudus.
26
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
6 PIDEV JUHUSLIK SUURUS
Juhuslikku suurust nimetatakse pidevaks juhuslikuks suuruseks, kui ta vib omandada
vrtusi mingist reaalarvude vahemikust: b)} (a, x : {x X , kus a ja b on reaalarvud ning
eeldame a < b. Kuna suvalises reaalarvude vahemikus on lpmata palju erinevaid vrtusi,
siis ei ole pideva juhusliku suuruse vimalike vrtuste hulk piiratud ja ldjuhul on mingi
konkreetse vrtuse omandamise tenosus vrdne nulliga
4
. Just vrtuste hulga lpmatusest
tulenevalt on pideva juhusliku suuruse ksitlemisel vaja teistsugust lhenemist.
6.1 Juhusliku suuruse jaotusfunktsioon ja tihedusfunktsioon
Juhusliku suuruse X jaotusfunktsiooniks F(x) nimetatakse funktsiooni, mis annab te-
nosuse, et juhuslik suurus X on viksem funktsiooni argumendi vrtusest x. Seega tulene-
valt definitsioonist:
F(x) = P(Xx).
ldjuhul vib juhuslik suurus X omandada kiki reaalarvulisi vrtusi:
)} , ( x : {x X . Sellest tulenevalt saab testada jaotusfunktsiooni jrgmised omadused:
1.
0 F(x) lim
x
Omaduse testamiseks lheme le sndmuse tenosusele ja saame
0 P() ) P(X x) P(X lim F(x) lim
x x
,
kuna tegu on vimatu sndmusega kski arv ei saa olla viksem kui -.
2.
1 F(x) lim
x
Analoogiliselt esimese omaduse testamisele kirjutame
( ) 1 P ) P(X x) P(X lim F(x) lim
x x
,
sest vide, et X on alati tene.
3. Jaotusfunktsioon on mittekahanev, st suvalise kahe arvu a ja b korral, kui a < b,
F(b) F(a).
Testamiseks seome vaadeldavad arvuvahemikud sndmustega:
olgu A sndmus, et X a,
B sndmus,et a
< X b ja
C sndmus, et X b.
Kerge on nha, et kolme sndmuse vahel kehtib seos C = AUB. Kuna sndmused A ja B
on teineteist vlistavad, saame liitmislause phjal P(C) = P(AUB )=P(A) + P(B). Arvestades
nd sndmuste A, B ja C thendusi, vime kirjutada: P(Xb)=P(Xa)+P(a < X b) ja lh-
tudes jaotusfunktsiooni definitsioonist on meil tulemus F(b) = F(a) + P(a
< X b). Kuna te-
nosus on alati mittenegatiivne, siis saamegi siit F(b) F(a).
1. Kui a
< b, siis P(a
< X b) = F(b) - F(a).
See tuleneb vahetult eelmise omaduse testusest.
*4Seetttu pideva juhusliku suuruse X korral P(a
< X b) = P(a X < b) = P(a < X < b) = P(a X b)
27
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Tegelikult vime jaotusfunktsiooni defineerida ka esitatu suhtes vastupidiselt, lhtudes
testatud omadustest.
Definitsioon. Iga funktsioon, mis rahuldab omadusi 1-3 sobib mingi juhusliku suuruse
jaotusfunktsiooniks.
Seda definitsiooni kasutame hiljem selleks, et kontrollida, kas antud funktsioon sobib ld-
se jaotusfunktsiooniks, kas ta aga viks sobida vaadeldavale juhuslikule suurusele tuleb
kontrollida kasutades vastavaid meetodeid (vt. osa 12).
Diskreetse juhusliku suuruse korral oli jaotusfunktsioon mratud kui argumendist vikse-
mate vrtuste tenosuste summa:
) p(x ) x P(X ) F(x
j i i
i j
x x
. Olemuselt midagi sarnast
saame mratleda ka pideva jaotuse korral, kuid siin on tegu lpmatult vikeste osade sum-
maga.
Eeldades jaotusfunktsiooni pidevust kirjutame vlja suhte:
x
F(x) x) F(x +
. Minnes le
piirvrtusele saame leida funktsiooni f(x) kui jaotusfunktsiooni tuletise:
f(x) (x) F
x
F(x) x) F(x
lim
0 x
+
Integreerides vrrandi
f(x) (x) F
mlemaid pooli, vib saadud vrduse kirjutada kujul:
x
f(x)dx F(x) (6.1)
ldjuhul vime elda: kui leidub selline funktsioon f(x), et kehtib vrdus (6.1), siis seda
funktsiooni nimetatakse juhusliku suuruse X tihedusfunktsiooniks ehk lhidalt tiheduseks.
Tihedusfunktsioonil f(x) on jrgmised omadused:
1) f (x) 0 . Tuleneb sellest, et jaotusfunktsioon F(x) on mittekahanev (murru lugeja
ei ole negatiivne) ja
x
F(x) x) F(x
lim (x) F f(x)
0 x
+
1 f(x)dx . Testus:
x
x x
1 F(x) lim f(x)dx lim f(x)dx
4)
dx f(x) = b) X P(a
b
a
<
. Testus: Tulenevalt jaotusfunktsiooni ja integraali omadustest
<
b
a
a b
f(x)dx f(x)dx f(x)dx F(a) F(b) b) X P(a
Kuna jaotusfunktsioon ja tihedusfunktsioon on omavahel analtiliselt seotud, siis piisab
juhusliku suuruse kirjeldamiseks kskik kumma teadmisest. Jrgnevas kasutame nende va-
helist seost kujul:
x
f(x)dx F(x) vi f(x) (x) F
.
28
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Nagu jaotusfunktsiooni korralgi, vime tihedusfunktsiooni kohta vita: iga funktsioon,
f(x) mis rahuldab omadusi 1-3 sobib mingi juhusliku suuruse jaotusfunktsiooniks.
Jaotusfunktsiooni ja tihedusfunktsiooni omadused nitavad, et ainult teatud kindla kujuga
funktsioonid saavad vljendada juhusliku suuruse tenosuse jaotust. Visuaalse pildi
saamiseks jaotusfunktsiooni ja tihedusfunktsiooni kujust soovitan lugejal, lhtudes nende
omadustest, visandada nende funktsioonide graafikud.
Jaotusfunktsioon (tihedusfunktsioon) kirjeldab tielikult juhusliku suuruse kitumist te-
nosuslikust aspektist. Teades jaotust saame leida vastused paljudele ksimustele, niteks:
milline on juhusliku suuruse vahemikku langemise tenosus, kui tihedalt on vrtused
koondunud oma keskvrtuse mber, milline on juhusliku suuruse oodatav vrtus jne. Seega
me oskaksime kike seda leida, kui vaid teaksime juhuslikule suurusele X vastavat tihedus-
funktsiooni f(x) vi jaotusfunktsiooni F(x). Niteks on juhuslikuks suuruseks lipilase ku-
lutused raamatutele, inimese jala suurus, inimese sissetulek, tealiste inimeste arv jne, jne.
Teades nende juhuslike suuruste jaotusfunktsiooni on vimalik leida niteks tenosuse, et
inimese sissetulek on mingis vahemikus, kui paljude inimeste sissetulek on teatud vahemikus,
kui palju lipilasi kulutab raamatutele rohkem kui x krooni jne. Kuidas aga leida vajalik
jaotusfunktsioon? Osutub, et on vimalik leida terved sarnaselt kituvate juhuslike suuruste
pered, milles juhuslikud suurused kituvad analoogiliselt ja nende jaotusfunktsioonid erine-
vad ksteisest vaid parameetrite vrtuste poolest. Sellest tulenevalt mratletakse teatud
tpjaotused ja ptakse iga uuritava juhusliku suuruse korral mrata, millise tpilise situa-
tsiooni (teoreetilise jaotuse) alla saab teda viia.
Teoreetiliste jaotuste kirjeldamisel ja kasutamisel on vaja teada mningaid juhuslikke
suurusi iseloomustavaid karakteristikuid, mis tulenevad jaotusfunktsioonist (tihedusfunkt-
sioonist). Enne kui vaadelda konkreetseid teoreetilisi jaotusi, ksitleme pidevat juhuslikku
suurust iseloomustavaid parameetreid.
6.2 Pideva juhusliku suuruse arvkarakteristikud
6.2.1 Kvantiilid
Juhusliku suuruse vrtust x
me
, mille korral jaotusfunktsioon omandab vrtuse nimeta-
takse mediaaniks. Seega mediaani korral kehtib F(x
me
)=P(Xx
me
) = . Seega mrab me-
diaan teatud keskmise, nn mediaankeskmise. Niteks, kui vaadeldav juhuslik suurus X on
ttaja palk, siis vrtus x
me
nitab seda arvu, millest vhem saavad pooled ttajad (keskmi-
ne palk kui aritmeetiline keskmine on hoopis midagi muud).
Mediaani korral otsime juhusliku suuruse sellist vrtust, mille korral jaotusfunktsioon
omandab vrtuse . Praktikas, juhusliku suuruse kitumise kirjeldamisel pakuvad sageli
huvi ka teised fikseeritud vrtused, mille korral on vastavale punktile antud oma nimi:
F(x)=P(Xx) = 1/4 - punkt x on alumine kvartiil
F(x)=P(Xx) = 3/4 - punkt x on lemine kvartiil
F(x
k
)=P(Xx
k
) = k/10 - punkt x
k
on k-s detsiil (k=1, 2 , ..., 9)
Misted mediaan, kvartiil ja detsiil on hsti tuntud ldstatistikas ja siinjuures me nendel
eraldi ei peatu. Tegelikult kasutame neid vaid illustreerivate mistetena, et tuua sisse nende
ldistus kvantiili miste. Nimelt on kiki need misted mratletud lhtudes kindlalt ette
29
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
antud tenosusest ning otsitakse juhusliku suuruse vrtust, mille korral jaotusfunktsioon
omandab selle tenosuse.
Seega vime teha ldistuse: arvu x
)=P(Xx
) = .
Seega kvantiil x
) = lahendit x
nimetatakse -kvantiiliks. Vastavatel vrtustel saame siit
kik lalvaadeldud erijuhud. Lhtudes sellest matemaatilisest definitsioonist, vime kvantiili
leidmiseks kasutada prdfunktsiooni mistet:
x
= F
-1
().
Kuna jaotusfunktsioon on tihedusfunktsiooniga ksheselt seotud, siis vime kvantiili de-
fineerida ka lhtudes tihedusfunktsioonist. Lhtudes valemist (6.1), kasutades tihedusfunkt-
siooni, vime -kvantiili vlja kirjutada kui vrrandi f(x)dx ) F(x
lahendi x
. Sellist
tlgendust on mugav kasutada kvantiili x
x
nimetatakse arvu, mille korral kehtib vrdus
> ) ( 1 ) ( x F x X P
.
Seega - tiendkvantiil on juhusliku suuruse vrtus, millest suuremaid vrtusi omandab
juhuslik suurus tenosusega (0 1).
Kujutades hel ja samal joonisel (vt allpool) -kvantiili x
ja 1- tiendkvantiili
1
x on
kerge veenduda, et kvantiil ja tiendkvantiil on teineteise kaudu avaldatavad:
x
x
1
(6.2)
Vaata esitatud seost jrgneval joonisel
*5Pidevate juhuslike suuruste korral on iga ksikvrtuse tenosus ldjuhul null
x
f(x
)
Viirutatud pindala suurus =
Kvantiil x
30
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
6.2.2 Keskvrtus
Pideva juhusliku suuruse keskvrtus on analoogiline diskreetse juhusliku suuruse kesk-
vrtusega, ainult et definitsioonis peame summeerimise asemel kasutama integreerimist ja
ksikvrtuse tenosuse asemel kasutame tihedusfunktsiooni.
Definitsioon. Kui f(x) on pideva juhusliku suuruse X tihedusfunktsioon, siis arvu EX, mis
avaldub kujul
xf(x)dx EX nimetatakse pideva juhusliku suuruse keskvrtuseks.
Nide 6.3. Olgu
'
>
<
b x kui 0,
b x a kui ,
a b
1
a x kui 0,
f(x)
juhusliku suuruse X tihedusfunktsioon.
Leida juhusliku suuruse X keskvrtus.
Lahendus. Arvutame:
2 2
1
a - b
1
) ( f
2
b a x
a b
dx x dx x x EX
b
a
b
a
+
Pideva juhusliku suuruse keskvrtuse omadused on samad, mis diskreetse juhusliku
suuruse keskvrtuse korralgi. Nende testamisel tuleb lhtuda pideva juhusliku suuruse
keskvrtuse definitsioonist, eelnevalt on tarvis aga sisse tuua tehted pidevate juhuslike
suurustega. Kesolevas kursuses me neid aga ei ksitle.
6.2.3 Dispersioon
Juhusliku suuruse dispersiooniks nimetatakse arvu:
DX = E(X-EX)
2
.
Kasutades pideva juhusliku suuruse keskvrtuse definitsiooni, saame valemi kujul:
dx f(x) EX) (x DX
2
Saab nidata, et pideva juhusliku suuruse dispersiooni omadused on samad, mis diskreetse
juhusliku suuruse korralgi.
1-
x
x
= x
1
-
(x)
P(X<x
)=
P(X>x
1-
)=
1-
31
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
7 PIDEVA JUHUSLIKU SUURUSE JAOTUSI
7.1 Pidev htlane jaotus
Kige lihtsamaks pideva juhusliku suuruse jaotuseks on pidev htlane jaotus, mis on sar-
nane diskreetse htlase jaotusega. Juhuslik suurus X on ligul [a, b] htlase jaotusega, kui
ligu jaotamisel suvaliseks arvuks vrdse pikkusega osadeks on igasse osaliku sattumise
tenosused vrdsed.
Juhusliku suuruse X pidevaks htlaseks jaotuseks ligul [a, b] nimetatakse jaotust, mille
tihedusfunktsioon avaldub kujul:
'
>
<
b x kui 0,
b x a kui ,
a b
1
a x kui 0,
f(x)
kus a ja b on suvalised reaalarvud.
On kerge veenduda, et selle funktsiooni korral on tidetud tihedusfunktsiooni omadused 1-
3 (vt punkt 6.1) ja seega saab toodud funktsioon olla tihedusfunktsiooniks (soovitan lugejal
vlja joonistada selle funktsiooni graafik). Kui juhuslik suurus X on pideva htlase jaotusega,
siis kirjutame X ~ U(a,b).
Leiame pideva htlase jaotuse jaotusfunktsiooni, keskvrtuse ja dispersiooni.
Jaotusfunktsioon:
a b
a x
t
a b
1
dt
a b
1
f(t)dt F(x)
x
a
x x
a
Keskvrtus:
2
b a
2
) a (b
a b
1
2
x
a b
1
dx
a b
1
x f(x)dx x EX
2 2
b
a
2
+
Dispersioon. Lhtume valemist DX = EX
2
(EX)
2
ning leiame kigepealt:
3
b ab a
3
) a (b
a b
1
3
x
a b
1
dx
a b
1
x f(x)dx x EX
2 2 3 3
b
a
3
2 2 2
+ +
Edasi, kasutades juba arvutatud EX vrtust saame:
12
) b - (a
=
12
b
- 2ab -
a
=
12
a
3 - 6ab -
b
3 -
b
4 + 4ab +
a
4
=
4
) a + (b
-
3
b
+ ab +
a
= DX
2
2 2 2 2 2 2
2
2 2
Nide 7.1. Tramm sidab iga 15 minuti tagant. Ma ei pea meeles trammi peatusest vl-
jumisaegu ja lhen alati trammi ootama juhuslikult. Kui kaua ma pean keskmiselt trammi oo-
tama?
Lahendus. Selle lahendamiseks ei pea ppima tenosusteooriat ja igaks vib tulemuse
peast elda. Antud juhul saame aga kontrollida, kas meie teoorias saadud tulemus peab paika.
Ilmselt on tegu pideva htlase jaotusega X ~ U(0; 15). Tihedusfunktsioonil on kuju
'
>
<
15 , 0
15 0 ,
15
1
0 , 0
) (
x kui
x kui
x kui
x f
ja ooteaja keskvrtus EX= 7,5 minutit.
32
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
7.2 Normaaljaotus
7.2.1 Normaaljaotuse definitsioon
Normaaljaotuseks nimetatakse reaalarvulise juhusliku suuruse jaotust, mille tihedus-
funktsioon avaldub kujul
2
2
2
) (x
e
2
1
(x)
, kus jaotuse parameeter > 0 ja on reaal-
arv.
Normaaljaotuse uurimisel lhtume samast skeemist nagu eelpool toodud jaotuste korralgi:
nitame, et toodud funktsioon sobib tihedusfunktsiooniks ning leiame jaotuse keskvrtuse ja
dispersiooni. Nende omaduste testused ei ole rasked, kuid nuavad mningaid lisateadmisi
ning selle kursuse raames toome vastavad testused vaid joonealuse mrkusena
*2
.
Tihedusfunktsioon (x) on positiivne ja integraal temast vrdub hega
1 dx e
2
1
(x)dx
2
2
2
) (x
Normaaljaotuse dispersioon
2
2
) (x
2
... dx e x) (
2
1
DX
2
2
dt e
t
2
.
1.
1
2
2
2
1
) (
2
2
2
2
) (
dt e dx e dx x
t
x
2
) - (x
= t
ning sellest tulenevalt saime ka
dt 2 = dx
.
2.Keskvrtus
+ +
dt e t dt e dt e dx e x EX
t t t
x
2 2 2
2
2
) 2 (
1
2
1
2
) (
kuna smmeetriline integraal paaritust funktsioonist
e
t
t -
2
vrdub nulliga.
3. Dispersioon
dt e t dx e x DX
t
x
2
2
2
2
2
) (
2
2
2 2
) (
2
1
+
2
2 2
2 2 2
) 2 ( 2
dt e te t dt te t
t t t
, kuna
esimene liidetav vrdub nulliga (nimetajas on e astmes lpmatus).
33
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
1) tihedusfunktsiooni graafik on smmeetriline sirge x = suhtes (nidata!),
2) moodiks on punkt x = (nidata!),
3) asmptoodiks on x-telg
Tuginedes nendele omadustele vime joonistada vlja normaaljaotuse tihedusfunktsiooni
graafiku kuju:
Sellel graafikul on iseloomulik kuju ja sellist graafikut nimetatakse Gaussi kveraks.
7.2.2. Standardiseeritud normaaljaotus
Suure osa matemaatilise statistika lesannete korral on vaja leida vaadeldava juhusliku
suuruse mingisse vahemikku langemise tenosust, seega leida tenosus P(a < X b), kus
a ja b on lesande pstitusest tulenevad arvud. Tulenevalt jaotusfunktsiooni F(x) omadusest
4 (vt 6.1) saame leida P(a < X b) = P(X b) - P(X a) = F(b) F(a). Seega peame osaka-
ma leida tenosust P(- < X x), kus x thistab meile vajalikku juhusliku suuruse X vr-
tust.
Olgu meil nd tegemist normaaljaotusega. Lhtudes normaaljaotuse definitsioonist
saame selle tenosuse vlja kirjutada kujul:
dx e
2
1
dx (x) F(x) P(X
x
2
) (x x
2
2
< ) x (7.1)
Siin funktsiooni F(x) argument x on integraali lemine raja, kuid jtame selle samuti ka
integraali aluse funktsiooni argumendiks. See ei tekita segadust, kuna mratud integraali
vrtuse leidmine toimub kahes etapis kigepealt leitakse integraali alusele funktsioonile
vastav algfunktsioon ja seejrel leitakse tema vrtus kasutades mratud integraali rajasid.
Kahjuks ei ole lihtsa, elementaarfunktsioonides avalduva algfunktsiooni leidmine aga antud
eksponentfunktsiooni korral vimalik ning seetttu otsitakse mitmesuguseid lihtsustusi. Tsi,
praktilistes arvutustes ei ole tnapeval selle integraali vrtuse leidmise lihtsustamine oluli-
ne, kuna ksitsi arvutamise aeg on mdas. Protseduur normaaljaotusega juhusliku suuruse
X~N(,) jaoks vajalike tenosuste leidmiseks on olemas loomulikult kikides statistilise
andmettluse pakettides, aga samuti ka tabelarvutusssteemides. Niteks tabelarvutussstee-
mis Excel on vastav protseduur
P(Xx)= NORMDIST(x; ; ; true)
tabelarvutusssteemis OpenOffice on see analoogiline
P(Xx)= NORMDIST(x; ; ; 1)
(x)
x
EX
34
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
erinedes vaid tevrtuse andmise poolest.
sna sageli on tarvis lahendada ka prdlesannet leida juhusliku suuruse X vrtus x
,
mille korral tenosus, et ta omandab sellest arvust viksemaid vrtusi on . Seega leida an-
tud tenosusele vastav kvantiil: P(X<x
x
z
. Sellel muutujavahetusel on teatud
sisuline thendus: teisendusega x - nihutatakse koordinaattelgede alguspunkt vaadeldava ju-
husliku suuruse keskvrtusele vastavasse punkti (seega uute telgede nullpunkt htib punk-
tiga vanades koordinaattelgedes). Jagamine arvuga muudab skaalat, vttes seal kasuta-
tavaks mduhikuks standardhlbe.
Otsitava tenosuse P(X<x) saame nd vlja kirjutada kujul:
(z) dz e
2
1
dx e
2
1
dx (x) F(x) P(X
z
2
x
2
) (x x
2
2
2
<
z
) x
Sellist teisendust nimetatakse normaaljaotuse standardiseerimiseks ning ning funktsiooni
(z) standardiseeritud normaaljaotuse jaotusfunktsiooniks (ka Laplace'i funktsiooniks).
Standardiseeritud normaaljaotuse tihedusfunktsiooni
2
z
2
e
2
1
(z)
graafik on normaal-
jaotuse graafik, mis on smmeetriline funktsioonitelje suhtes, keskvrtusega punktis z = 0
ning argumenttelje hikuks on standardhlve : Seega vime kirjutada Z ~ N(0,1).
Meie jaoks on edaspidises oluline teada leminekut:
,
_
x
F(x) x) P(X
Normaaljaotuse standardiseerimine ei teinud jaotusfunktsiooni (Laplace'i funktsiooni)
vrtuste arvutamist oluliselt lihtsamaks, ikkagi on tarvis leida integraal astmefunktsioonist ja
ta ei ole avaldatav elementaarfunktsioonide kaudu. Praktikas saadakse kasu aga sellest, et
normaaljaotuse parameetrid (keskvrtus ja standardhlve ) seotakse kokku uues muutu-
jas z ning kasutades Laplace'i funktsiooni kui integraali vrtuste leidmise ligikaudseid mee-
todeid vime iga z korral leida (z) vrtuse. Osutub aga, et argumendi z vrtusi tasub
vaadata vaid vahemikus (-5, +5), kuna vahemikust vlja jvate vrtuste korral vime vtta
nad konstantseteks: (z>5) 1 ja (z<-5) 0. Argumendi ja sellele vastava funktsiooni
vrtused on esitatavad lehekljele mahtuva tabeliga (selline tabel on toodud ka kesoleva
konspekti lpus), leitavad aga ka protseduuriga P(Z z) = NORMSDIST(z,) tabelarvutusss-
teemides.
Edaspidises kasutame palju standardiseeritud normaaljaotuse kvantiile ja tiendkvantiile.
Tuletan meelde, et kvantiile vaadeldakse alati seoses mingi kindla tenosusega, thistame
35
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
selle thega . Sel juhul on -kvantiil juhusliku suuruse kui tihedusfunktsiooni argumendi
vrtus z
,
_
x
F(x) x) P(X
Sellest tulenevalt saame normaaljaotusega juhusliku suuruse X vahemikku [a,b) lange-
mise tenosuse leida valemiga:
,
_
,
_
<
b
F(a) F(b) b) X P(a
Nide 7.2. Olgu mingil maal, mingis likoolis tudengi lunasgi keskmine maksumus
kuus on normaaljaotusega juhuslik suurus, keskvrtusega 50 krooni ja standardhlbega 15, st
X~N(50, 15). Leida tenosus, et juhuslikult valitud tudengi lunasgi keskmine maksumus
kuus ei leta 20 krooni.
Lahendus. Tulenevalt jaotusfunktsiooni thendusest F(x)=P(X<x), vime vahetult
vlja kirjutada: P(X20) = F(20) = ((20-50)/15) = (-2). Kasutades vastavat tabelit
vi mingit tabelarvutusfunktsiooni
6
saame leida (-2) = 0,0228.
Seega tenosus, et juhuslikult valitud lipilase lunask ei maksa le 20 krooni on
0,0228, ehk teisiti eldes - 2,28 % lipilastest ei kuluta lunasgile le 20 krooni.
*6 Niteks Excelis tuleks kirjutada valem =NORMDIST(20;50;15;TRUE)
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
0,45
-5 -4 -3 -2 -1 0 1 2 3 4 5 -z
P(Z<-z
)=
z
P(Z>z
)=
36
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
7.2.3. 3- reegel
Vastavalt jaotusfunktsiooni omadustele on juhusliku suuruse X vahemikku (a, b) lange-
mise tenosus P(a < X b) = F(b) - F(a). Eeldades, et juhuslik suurus X on jaotunud nor-
maaljaotuse jrgi, saame
)
- a
( - )
- b
( = b) X P(a <
.
Normaaljaotuse standardiseerimisel lksime le uuele skaalale, kus mthikuks standard-
hlbe. Kasutades eespool toodud valemit anname sellele skaalale iseloomustuse, leides milli-
ne osa tenosusest langeb keskvrtusest tisarv kordse hiku kaugusele.
Matemaatiliselt kirja panduna lahendame lesande: leida tenosuse, et normaaljaotusega
juhuslik suurus X ~ N(, ) hlbib oma keskvrtusest vhem kui he-, kahe vi kolme
standardhlbe (hiku) vrra. Seega leiame tenosused:
1 korral, kui a = - , b = + saame
P( < X < + ) = (( + )/) (( )/)=
=(1) - (-1) = 0,8413 0,1587 = 0,6826
2 korral, kui a = - 2 , b = + 2 saame
P( 2 < X < + 2) =(( + 2 ) /) (( 2 - ) /)=
=(2) - (-2) = 0,9772 0,0228 = 0,9544
3 korral, kui a = - 3 , b = + 3 saame
P( 3 < X < + 3) =(( + 2 )/ ) (( 2 )/ )=
=(3) - (-3) = 0,9987 0,0013 = 0,9974
Nendest vrdustest kige huvipakkuvam on viimane, mida snastatakse 3-reeglina: nor-
maaljaotusega juhuslik suurus praktiliselt ei hlbi oma keskvrtusest rohkem kui kolmekord-
se standardhlbe vrra.
7.2.4. Normaaljaotust iseloomustavad tunnused
Millised juhuslikud suurused on normaaljaotusega? Normaaljaotusega juhusliku suuruse
tunnused saame snastada, kui vaatleme tihedusfunktsiooni omadusi ja 3 reeglit.
Olulisteks tunnusteks on:
- normaaljaotusega juhusliku suuruse vrtused on smmeetrilised keskvrtuse
suhtes,
- normaaljaotusega juhusliku suuruse vrtused on koondunud keskvrtuse mber
ja ei erine keskvrtusest praktiliselt rohkem kui kolmekordse standardhlbe vr-
ra,
- juhusliku suuruse tihedusfunktsioonil on Gaussi kverale sarnanev kuju.
Neid kolme tingimust vime praktikas kontrollida konkreetsete andmete phjal, leides
kigepealt keskvrtuse kui aritmeetilise keskmise, hinnates seejrel sagedustabeli smmeet-
riat ja vrtuste hajuvust. Allpool, jrgmises punktis lhtume aga vastupidisest eeldame
normaaljaotust ja tulenevalt oma intuitiivsest ettekujutusest juhusliku suuruse kohta mrame
parameetrid.
37
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
7.2.5 Tplesanded
Nagu eespool tlesime, vimaldab juhusliku suuruse jaotusfunktsiooni (tihedusfunkt-
siooni) teadmine lahendada mitmesuguseid tenosuse arvutamisega seotud lesandeid selle
juhusliku suuruse kohta. Siinkohal lhtume normaaljaotusest, st vaatleme juhtu X ~ N(, ),
kuid kikide lesannete korral vime teha eelduse, et tegemist on mingi teise jaotusega.
Kikide lesannete lahendused phinevad sisuliselt valemil
F(a) F(b) b) X P(a <
. Eri
lesannete korral varieeritakse aga sellega, mis on antud ja mis on otsitav. lesannete vi-
suaalseks ilmestamiseks kasutame toodud valemi tihedusfunktsioonil phinevat esitust
<
b
a
a b
(x)dx (x)dx (x)dx F(a) F(b) b) X P(a
kus otsitavat tenosust thistav pindala on toodud joonisel viirutatud:
Vimalike probleemipstituste nitamiseks lhtume samast lesandest ning snastame eri-
nevaid lesandeid.
Nide 7.2. On kindlaks tehtud, et inimese inteligentsi indeks IQ on normaaljaotusega ju-
huslik suurus X ~ N(125, 10).
A. Leida tenosus, et juhuslikult valitud inimese IQ on
a) viksem kui 110,
b) suurem vi vrdne 130.
Lahendus: a) 067 , 0 ) 5 , 1 ( )
10
125 110
( F(110) 110) P(X
<
Vastus. Tenosus, et juhuslikult valitud inimese IQ on alla 110 on 0,067
b) 0,69 (0,5) )
10
125 130
( 130) P(X 1 130) P(X
<
Vastus. Tenosus, et juhuslikult valitud inimese IQ on le 130 on 0,69
B. Mitme protsendi inimeste IQ asub vahemikus 115-135? Teisiti milline
on tenosus, et juhuslikult valitud inimese IQ asub selles vahemikus?
(x)
a
b
P(X<110)
(x)
110 125
X
P(X130)
(x)
130 125
X
P(115<X<135)
(x)
135 125
X
115
38
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Lahendus:
0,682 0,159 0,841 1) ( (1) )
10
125 115
( )
10
125 135
( F(115) - F(135) 135) X P(115
< <
Vastus. Antud jaotuse korral ~68% inimeste IQ on vahemikus 115-135.
C. Leida millisest arvust on 90% inimeste IQ viksem?
Lahendus: See on eelnevatega vrreldes prdlesanne: teame tenosust ja soovime leida
millisel juhusliku suuruse vrtusel on tidetud etteantud tingimus P(X<x
0,9
)=0,9. See viib
meid kvantiili miste juurde tarvis on leida normaaljaotuse N(125, 10) 0,9-kvantiil.
0,9 )
10
125
( ) F( ) P(X
9 , 0
9 , 0 9 , 0
<
x
x x edasi saame 28 , 1 (0,9)
10
125
1 - 9 , 0
x
ning siit x
0,9
= 125+101,28=137,8
Vastus. 90% inimeste IQ on alla 137,8 punkti.
D. Leida millisest indeksi vrtusest on 5% inimeste IQ suurem?
Lahendus: Kui eelmises lesandes oli tarvis leida kvantiil, siis praegusel juhul tuleb leida
tiendkvantiil. Kasutades kvantiili ja tiendkvantiili vahelist seost:
x
x
1
, vime selle
lesande taandada eelmisele juhule. Nimelt 0,05-tiendkvantiili asemel leiame 0,95-
kvantiili.
E. Leida, millisesse IQ vahemikku kuulub 50% inimestest.
Lahendus: Sellisel kujul ei ole see lesanne heselt lahenduv, kuna selliseid vahemikke
vib olla mitu. Seetttu antakse seda tpi lesannetes mingi lisatingimus. Olgu praegusel ju-
hul selleks niteks leida keskvrtuse suhtes smmeetriline vahemik, kuhu kuulub 50%
inimestest. Juhusliku suuruse vahemikku (x
1
, x
2
) langemise tenosus on mratud valemi-
ga )
- x
( - )
- x
( = ) x < X < P(x
2 1
2 1
. Praegusel juhul on otsitavateks vahemiku ots-
punktid x
1
ja x
2
. Arvestades lisatingimust (smmeetrilised keskvrtuse suhtes) vime kirju-
tada x
1
= ja x
2
= + ning toodud valemis jb ainukese tundmatuna sisse otsitavate
vrtuste erinevus keskvrtusest .
1 - )
( 2 ))
( - (1 - )
( )
( - )
(
)
- ) (
( - )
- ) (
( = ) < X < - P(
+
+
Lahendatavas lesandes oli antud = 10 ja vahemikku langemise tenosus on 0,25.
Asendame need vrtused saadud valemisse: 0,5 1 - )
10
( 2
1
+
.
Vastus. Poolte inimeste IQ on keskvrtuse suhtes smmeetrilises vahemi-
kus 125 6,7.
P(X<x
0,9
)=0,9
(x)
x
0,9
=137,8 125
X
115
P(118,3<X<131,7)=0,5
(x)
x=131,7
X
118,7
39
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
7.2.6 Binoomjaotuse lhendamine normaaljaotusega
Eespool diskreetsete juhuslike suuruste ksitlemisel leidsime, et kui vaadeldava sndmuse
esinemise tenosus on vike, siis vastavalt Poissoni piirteoreemile (5.1.3) saab binoom-
jaotust lhendada Poissoni jaotusega. Osutub aga, kui sndmuse esinemise ja mitteesinemise
kordade arvu tenosused on ligikaudu vrdsed, vib binoomjaotuse ligikaudseks arvu-
tamiseks kasutada normaaljaotust. Nimelt kehtivad Laplacei lokaalne ja integraalne piirteo-
reem.
Nende teoreemide jrgi on binoomjaotus B(n,p) lhendatav normaaljaotusega, kus nor-
maaljaotuse keskvrtus ja standardhlve on mratud binoomjaotusega: ) npq N(np, .
Praktikas arvestatakse, et lhendamisel saadakse piisav tpsus juhul kui on tidetud tingi-
mused: np 5 ja n(1-p) 5. Seega, kui sndmuse esinemise tenosus p on ligikaudu 0,5, siis
annab normaaljaotuse kasutamine binoomjaotuse asemel juba vikeste katsete arvu korral
hid tulemusi. Sageli soovitatakse tulemuse tpsuse suurendamiseks kasutada veel parandus-
koefitsienti 0,5, mille kasutamisel tenosuse P(x
1
Xx
2
) asendatakse modifitseeritud te-
nosusega P(x
1
-0,5Xx
2
+0,5).
Laplace'i lokaalne piirteoreem . Tenosus, et n sltumatu katse tulemusena, milles iga-
hes sndmus toimub tenosusega p, toimub sndmus tpselt k korda on piisavalt suure
katsete arvu korral ligikaudu vrdne:
2
x
2
e
npq 2
1
k) P(n,
, kus
npq
np k
x
.
Laplace'i integraalne piirteoreem. Tenosus, et n sltumatu katse tulemusena, milles
iga hes sndmus toimub tenosusega p, toimub sndmus vhemalt k
1
korda ja limalt k
2
korda on piisavalt suure katsete arvu korral ligikaudu vrdne:
)
npq
np k
( )
npq
np k
( ) k : k P(n,
1 2
2 1
Nii Laplace'i lokaalse kui ka integraalse teoreemi sisuline tlgendus on vga lihtne. Kui
vaadelda binoomjaotuse jaotusdiagrammi, siis hendades diagrammi tulpade keskpunktid pi-
deva joonega, saame normaaljaotuse tihedusfunktsiooni graafikuga sna sarnase joone.
Laplace'i teoreemides vaadeldakse seda ainult teisipidi: lhtudes vastavate parameetrite jrgi
joonistatud normaaljaotuse tihedusfunktsiooni graafikust seatakse igale vrtusele vastavusse
tihedusfunktsiooni vrtus kohtadel k = 0, 1, 2, ..., n.
Nide 7.3. Oletame, et tegemist on katseseeriaga, mis koosneb 50 katsest. Meid huvitav
sndmus vib igal katsel toimuda tenosusega p=0.2. Leida tenosus, et vaadeldav snd-
mus
a) toimub tpselt 10 korda,
b) toimub 10-15 korda.
Lahendus. See on tpiline binoomjaotuse lesanne, mida on kasulik lahendada tuginedes
Laplace'i lokaal- ja integraalteoreemile.
40
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Leiame kigepealt abisuurused:
83 , 2 8 8 , 0 2 , 0 50 npq ja
0
83 , 2
2 , 0 50 10
npq
np k
Tenosuse, et vaadeldav sndmus toimub katse 50 kordsel kordamisel tpselt 10 korda
leiame Laplace'i lokaalteoreemi phjal:
0,141 e
2 2,83
1
P(50,10)
0
Tenosuse, et otsitav sndmus toimub 10-15 korda leiame Laplace'i integraalteoreemi
jrgi
0,46 (0) (1,77) )
2,83
10 10
( )
2,83
10 15
(
)
npq
np k
( )
npq
np k
( ) k : k P(n,
1 2
2 1
sellistel tingi-
mustel alati normaaljaotusega.
7.3.2 Juhusliku suuruse ruutude summa jaotus
1 Standardse normaaljaotusega sltumatute juhuslike suuruste X
1
, X
2
, ... , X
v
ruutude sum-
ma Y = (X
1
)
2
+(X
2
)
2
+ ... + (X
v
)
2
on
2
-jaotusega ( hii-ruut jaotusega)
*3
juhuslik suurus : Y ~
2
(v). Liidetavate arv v on
2
- jaotuse parameeter, mida nimetatakse vabadusastmete
arvuks.
Paneme thele, et liidetavad juhuslikud suurused peavad olema standardse normaal-
jaotusega X
i
~ N(0,1).
2
- jaotust kasutatakse matemaatilises statistikas dispersiooni kohta
tehtavate hinnangute leidmisel, sltuvuse kindlaks tegemisel ja mujal.
*3 Lhtudes eespool kasutatud jaotuse defineerimise viisist vime mratleda: pidev juhuslik suurus Y on hii
ruut jaotusega Y ~
2
(v), kui tema tihedusfunktsioon on antud valemiga
2
2
1
2
)
2
( 2
) (
y
v
v
e
v
y
y
, kus
0
1
) ( dt t e x
x t
ja v on tisarvuline parameeter. Saab nidata, et
2
- jaotuse keskvrtus EX = v ja dis-
persioon DX = 2v. Alljrgnevas vime aga hii-ruut jaotuse definitsiooni ra unustada. Meid huvitavad vaid
2
-
jaotuse tiendkvantiilid, mille leidmiseks kasutame vastavat tabelit.
42
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
8 TENOSUSTEOORIA PIIRTEOREEMID
Tenosusteooria piirteoreemid loovad seose tegelikkuses esinevate juhuslike protsesside-
ga mratud juhuslike suuruste karakteristikute ja teoreetiliste jaotuste parameetrite vahel.
Piirteoreemid on rakendatavad juhuslike suuruste jada korral ning nad nitavad jada koondu-
mist teatud nitaja (jaotusfunktsiooni, tenosuse, keskvrtuse) jrgi. Tegelikult me eespool,
punktis 7.3.1 juba vaatlesime hte piirteoreemi, nn tsentraalset piirteoreemi, mis vljendas
koondumist jaotusfunktsiooni jrgi. Allpool ksitleme veel kahte piirteoreemi, millel on prak-
tikas suur thtsus. Lhtudes esituse lihtsustamise pdest on teoreemid toodud mitte eriti ran-
ges snastuses.
8.1 Tsebsevi suurte arvude seadus
Kui X
1
, X
2
, ...,X
n
on
hise keskvrtusega ja dispersiooniga
2
sltumatud juhuslikud
suurused, siis kehtib 1
n
S
P lim
n
n
,
_
<
, kus S
n
on juhuslike arvude summa X
=
S i
n
1 = i
n
ja
on kuitahes vike arv.
Teisiti eldes - samatbiliste juhuslike suuruste aritmeetiline keskmine lheneb nende ju-
huslike suuruste hisele keskvrtusele. Juhusliku suuruse keskvrtus on kindlal viisil defi-
neeritud arvuline vrtus. Keskvrtuse leidmiseks peab diskreetse juhusliku suuruse korral
teadma tema vimalike vrtuste loetelu ja nende omandamise tenosusi; pideva juhusliku
suuruse korral on aga tarvis teada tihedusfunktsiooni. Praktikas ei ole alati vimalik kasutada
neid keskvrtuse definitsioone ning siin tulebki appi Tsebevi suurte arvude seadus, mis
vimaldab keskvrtuse ligikaudset hindamist.
Kokkuvttes: juhusliku suuruse keskvrtuseks vib vtta juhuslike suuruste summa arit-
meetilise keskmise, kui aritmeetiline keskmine on leitud piisavalt suure liidetavate arvu kor-
ral. Niteks, kui juhusliku suurusena vaatleme kutsealuste pea mbermtu, siis selle juhusli-
ku suuruse keskvrtuse saame leida mtes ra piisavalt suure hulga kutsealuste pea mber-
mte ja leides saadud arvude aritmeetilise keskmise. See keskvrtus ei aita meid veel
mrata kui palju ja millistes suurustes mtse peame varuma.
8.2 Bernoulli suurte arvude seadus
Kui n hesuguse katse tulemusena vaadeldav sndmus A toimub k korda, siis
1 p
n
k
P lim
n
,
_
<
, kus on kuitahes vike arv ja p on sndmuse A toimumise tenosus
hel katsel.
Teisiti eldes katse kordamisel lpmatult palju arv kordi lheneb sndmuse toimimise
sagedus sndmuse esinemise tenosusele.
Bernoulli suurte arvude seadus tuleneb Tsebevi suurte arvude seadusest ja on tema eri-
juht. Selle nitamiseks oletame, et juhuslikud suurused X
1
, X
2
, ...,X
n
vivad omandada vaid
vrtusi 0 ja 1 (seega erijuht ldisest). Olgu iga juhusliku suuruse korral vrtuse 1 oman-
damise tenosus hesugune ja thistame P(X
i
= 1) = p. Sel juhul on juhusliku suuruse kesk-
vrtus EX
i
= p ja dispersioon DX
i
= p(1-p). Tlgendame vaadeldavat juhuslikku suurust X
i
43
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
selliselt, et ta omandab vrtuse 1, kui toimub meid huvitav sndmus, ja 0 - kui sndmust ei
toimu. Sellisel juhul thendab summa S
n
= X
1
+ X
2
+ ... + X
n
sndmuse toimumise kordade
arvu k ja jagatis
n
Sn
on sndmuse toimumise suhteline sagedus katse kordamisel n korda.
Pannes saadud tulemused Tsebsevi suurte arvude seadusse, saamegi Bernoulli suurte arvude
seaduse.
Bernoulli suurte arvude seadus annab vimaluse koguda andmeid vaadeldavate sndmuste
esinemise sageduste kohta ning koostada vastavad jaotustabelid. Niteks, elektroonikakauplus
peab arvestust tootjatehaste kaupa, mitu hikut tuuakse remonti mdud asjade kohta.
Piisavalt suurte mgikoguste korral vib selle mgistatistika phjal, tuginedes Bernoulli
suurte arvude seadusele vita, et tenosusega p(A) tuuakse tehase A toodang remonti, te-
nosusega p(B) tehase B toodang jne.
Selline sageduse ja tenosuse sidumine on niivrd loomulik, et vib isegi tekitada sega-
dust. Nii niteks pris ks lipilane: Kui mul on plaanis visata mnti 20 korda. Oletame, et
peale 15. viset on kull tulnud vlja 9 korda ja kiri 6 korda. Kuna kulli ja kirja vljatulemise
tenosused on vrdsed, siis peab jrgmise 5 viske korral kull tulema vlja 1 kord ja kiri 4
korda.
Kuidas see on seotud Bernoulli suurte arvude seadusega?
44
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
M A T E M A A T I L I N E S T A T I S T I K A
Matemaatiline statistika on matemaatika haru, mis ksitleb statistiliste andmete kogumist,
ttlemist ja nende phjal jrelduste tegemist. Statistilised andmed on katse-, vaatlus-, mt-
mis- ja ksitlusandmed vi muud eksperimendi lbiviimisel saadud andmed. Matemaatiline
statistika sisaldab endas mitmeid teooriaid, mis vaatlevad statistiliste andmestike ksitlemise
eri aspekte: katsete ja vaatluste lbiviimine (katseplaneerimise teooria), statistiliste hpoteesi-
de kontrollimine (hpoteeside teooria), mudelite parameetrite mramine (hinnangute
teooria), tunnustevaheliste seoste avastamine ja kirjeldamine (korrelatsioonanals, kom-
ponentanals, faktoranals ja kanooniline anals), tunnuse vrtuste prognoosimine (reg-
ressioonanals, dispersioonanals, kovariatsioonanals), objektide eristamine ja rhmi-
tamine (diskriminantanals, klasteranals), ajas muutuvate juhuslike nhtuste uurimine
(aegridade teooria) jpt.
Matemaatilise statistika philesandeks on valimi phjal jrelduste tegemine ldkogumi
kohta. Seda kikide lalmainitud teooriate korral. Kesolevas kursuses lhtume samuti va-
limist ning valimi statistikute phjal anname hinnangu ldkogumi teatud karakteristikutele.
Toome sisse kahte liiki hinnangud punktihinnang ja vahemikhinnang. Vahemikhinnang on
aluseks ka hpoteeside testamisel ldkogumi karakteristikute vi ldkogumi tunnuste vahe-
liste seoste kohta. Nagu eessnas eldud, tahame juda asja olemuseni, st vaadelda meetodi
saamist ja olemust, jttes rakendusliku klje philiselt edasiste kursuste lesandeks.
9 Error: Reference source not foundLDKOGUM JA VALIM
9.1 ldkogumi ja valimi mratlus
ldkogum. ldkogum on mingil printsiibil mratletud, vaatluse alla vetav objektide
koguhulk, niteks kikide Eesti lipilaste hulk, kikide Scania tpi busside hulk, raamatu-
kogu kikide raamatute hulk jne.
Tunnus. Iga objekti iseloomustavad temal mdetud tunnused, niteks lipilaste korral:
sissetulek kuus, telefoniarve suurus, televiisori olemasolu, pikkus, kaal jne. ldkogumi iga
objekti tunnuste vrtused on tpselt mratud (lipilase A sissetulek kuus 300 eurot,
telefoniarve 16 eurot, televiisor - ei ole jne).
Tunnuse jaotus. Iga arvulist tunnust vib vaadelda kui juhuslikku suurust, mis omandab
vrtusi kindlast vahemikust (niteks pikkus 100 250 cm). Iga tunnuse, kui juhusliku
suuruse, korral saame leida tema jaotuse. Jaotusfunktsiooni (tihedusfunktsiooni) kuju mrab
juhuslikule suurusele vastava teoreetilise jaotuse tbi (normaaljaotus, eksponentjaotus, jne).
ldjuhul ei ole jaotuse tp teada ja tuleb mrata vastavate meetodite abil. Erijuhul vib
tunnuse jaotus olla teada, niteks leitud eelnevate uuringutega.
Karakteristik. ldkogumi iga tunnuse korral vib leida seda tunnust iseloomustavad
karakteristikud, niteks keskmine vrtus, hajuvus keskmise vrtuse suhtes, smmeetria
kordaja, mediaan jne. Kik karakteristikud arvutatakse kindlate eeskirjade jrgi ja nende vr-
tused on konkreetse ldkogumi korral heselt mratud arvulised suurused.
Valim on ldkogumist valitud objektide hulk. Valimi tegemise eesmrk on hinnata meid
huvitavaid ldkogumi karakteristikuid valimi abil. ldkogumi hindamiseks kasutatav valim
45
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
peab olema piisavalt suur ja koostatud juhuslikult, st ldkogumi iga objekt vib sattuda ld-
kogumisse vrdse tenosusega. Viimane tingimus on praktiliselt tidetud piisavalt suurte
ldkogumite korral, kus he objekti vtmine valimisse praktiliselt ei muuda teiste objektide
valimisse sattumise tenosust ja kasutatakse objekti juhuslikkusel phinevat valikut. Vikes-
te ldkogumite korral tuleb arvestada mitmeid erisusi. Niteks kas juba valimisse valitud
objekt saab teistkordselt sattuda valimisse, jne. Siin tulevad mningad tpsustused kasuta-
tavatesse valemitesse, kuid kesolevas loengus me lhtume philiinist ja neid ei ksitle.
Hinnang. Hinnang on valimi phjal arvutatud arvuline vrtus (punktihinnang) vi vr-
tuste vahemik (vahemikhinnang), mis seatakse vastavusse ldkogumi karakteristikuga. Reeg-
lina ei ole saadud hinnang tpne, mistttu kasutamisel tuleb arvestada tema vimaliku vea
suurust ja tenosuslikku hinnangut tpsusele.
Milliseid ldkogumi karakteristikuid soovitakse hinnata, sltub uurimise eesmrgist. See-
juures vib pstitatud lesandeks olla he tunnuse karakteristikute (keskvrtus, dispersioon,
smmeetria, jne) leidmine, kahe tunnuse vahelise sltuvuse kindlaks tegemine, he tunnuse
vrtuste prognoosimine teiste phjal jne. Eri probleeme ksitlevad matemaatilise statistika
eri harud. Kesolevas kursuses ksitleme mningaid neist ja vaatleme erinevaid metoodikaid
tulemuse saavutamiseks.
9.2 ldkeskmine ja dispersioon
Olgu N objekti, mis moodustavad ldkogumi ja vtame vaatluse alla he, objekte iseloo-
mustava arvulisi vrtusi omava tunnuse. Tavaelus on tunnusel nimi, olgu selleks siis sisse-
tulek, pikkus, laius vi muud sarnast. Meie thistame tunnuse thega X. Kui me m-
dame selle tunnuse vrtuse kikidel ldkogumi objektidel, saaksime tema vrtuste jada: X
= {x
1
, x
2
, ..., x
N
}, kus x
i
thistab i-nda objekti vaadeldava tunnuse vrtust. Selle tunnuse
osas iseloomustavad ldkogumit tunnuse teatud karakteristikud, niteks tunnuse keskmine
vrtus (niteks, keskmine palk), tunnuse maksimaalne vrtus (kige suurem palk), tunnuse
mediaan (millisest summast vhem saavad palka pooled inimesed) jne. Kuna alljrgnevas k-
sitluses lhtume alati hest nn. vaadeldavast tunnusest, siis enamasti jtame selle tekstis rhu-
tamata ja rgime ldkogumist kui kikidel objektidel mdetud tunnuse vrtuste hulgast.
Niteks, olgu ldkogumiks Tartu likooli lipilaste koguhulk. Igal lipilasel vime
mta terve rea tunnuseid: kulutused raamatutele aastas, aasta sissetulek, lipilase pikkus,
hinne tenosusteoorias, laste arv jne. Alljrgnevas vaatleme juhtu, kus uurimise alla ve-
takse vaid ks tunnus, niteks kulutused raamatutele. Seega vime vaadelda ldkogumit
(selle tunnuse osas) kui statistilist rida, kus iga arv vastab he lipilase kulutustele. ldistus-
te tegemiseks on vaja seda rida kui tervikut iseloomustavaid nitajaid: milline on keskmine
kulutus, milline on maksimaalne kulu raamatutele, milline on hajuvus keskmisest kulust jne.
Kesoleva kursuse raames ei jua me vaadelda kikvimalikke nitajaid, vaid piirdume
ldkogumi (vaadeldava tunnuse!) uurimisel kahe karakteristikuga: ldkeskmine ja disper-
sioon ehk ruuthlve ldkeskmise suhtes. Need karakteristikud defineeritakse jrgmiste vale-
mitega:
ldkeskmine: x
N
1
=
i
N
1 = i
ja dispersioon:
) -
x
(
N
1
=
i
2
N
1 = i
2
.
46
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Suurust nimetatakse standardhlbeks (ehk vaadeldava tunnuse standardhlbeks ldkeskmise
suhtes ldkogumis).
9.3 Valimikeskmine ja dispersioon
Nagu nha, ei ole meie poolt defineeritud ldkeskmine mitte midagi muud kui tunnuse
vrtuste aritmeetiline keskmine (niteks keskmine kulu raamatutele), standardhlve iseloo-
mustab aga tunnuse vrtuste hajuvust ldkeskmise suhtes (kas eri lipilaste kulutused on
vga erinevad). Nii ldkeskmine kui ka tema standardhlve on kindla ldkogumi korral he-
selt mratavad arvulised vrtused (arvkarakteristikud). Praktikas huvitab meid just nende
kui teste vrtuste leidmine. Kui ldkogum on vike, siis ei valmista nende leidmine
raskusi ja kik arvutatud vrtused on absoluutselt tpsed. Sageli on ldkogum aga kas liiga
suur vi ajas pidevalt muutuv ning vajalike nitajate leidmine vahetult ldkogumi phjal
raske vi vimatu. Seetttu tehakse ldkogumist vljavte (valim) ja arvutatakse valimi tea-
tud statistilised nitajad (statistikud) ning saadud tulemused vetakse ldkogumi arvkarak-
teristikute vrtuste hinnangute aluseks. Enamasti kasutatakse ldkogumi karakteristikute hi-
ndamiseks valimi phjal analoogilisi arvutusvalemeid nagu ldkogumiski, kus vajalikud
arvutused tehakse vaid valimisse sattunud objekte arvestades. Alati see aga nii ei pruugi olla
ja seetttu vaatleme allpool hindamisvimalusi tpsemalt.
Olgu ldkogumi phjal tehtud n objektist koosnev valim X = {x
1
, x
2
, ..., x
n
}, kus x
i
(i
= 1,..., n) on valimisse valitud i-ndal objektil mdetud tunnuse vrtus. Defineerime va-
limikeskmise ja dispersiooni alljrgnevalt:
valimikeskmine: x
n
1
= X
i
n
1 = i
ja valimidispersioon: ) X -
x
(
1 - n
1
=
s
i
2
n
1 = i
2
,
kus s on valimi(keskmise) standardhlve.
ldkogumist saab teha mitmeid erinevaid valimeid. Kui ldkeskmine ja tema standard-
hlve on antud ldkogumi korral heselt mratud arvulised suurused, siis valimikeskmine
X
ja valimi standardhlve s on heselt mratud vaid iga konkreetse valimi korral, ldjuhul
sltub nende vrtus saadud valimist. Selleks, et valimi phjal saaks ldse anda hinnanguid
ldkogumile, on nutav, et valim oleks juhuslik. See thendab, et valimisse kuuluvad objek-
tid valitakse juhusliku protsessi tulemusena, kus igal ldkogumi objektil on vrdne vimalus
sattuda valimisse. Kuna valim on juhuslik, siis on nii valimikeskmine, valimi standardhlve
kui ka teised valimi phjal arvutatud vrtused juhuslikud suurused (nende vrtused sltu-
vad sellest, millised ldkogumi elemendid sattusid valimisse).
Selleks, et valimi phjal leitud juhuslike suuruste alusel vtta vastu mingitki otsustust,
peame kindlaks tegema vastava juhusliku suuruse iseloomu: tema jaotuse ja arvkarakteristi-
kud.
9.4 Valimikeskmine kui juhuslik suurus
Valimikeskmist kasutatakse ldkeskmise hindamisel. Kuna valimikeskmine
X
on juhus-
lik suurus, siis saab loomulikult ka tema phjal tehtud hinnang olla vaid teatud tpsusega hi-
nnanguks. Hinnangu tpsuse mratlemiseks on tarvis teada valimikeskmise kui juhusliku
suuruse phiparameetreid: keskvrtust, dispersiooni ja jaotust (jaotus- vi tihedusfunkt-
47
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
siooni). Paneme thele, et meil on tegu valemina antud juhusliku suurusega x
n
1
= X
i
n
1 = i
ning
tema arvkarakteristikute leidmiseks peame rakendama keskvrtuse ja dispersiooni leidmise
eeskirja sellele valemile tervikuna.
Valimikeskmise keskvrtus. Vastavalt diskreetse juhusliku suuruse keskvrtuse defi-
nitsioonile saame tema (valimikeskmise) keskvrtuse ) X E( leida jrgmiselt
n
1 i
i
n
1 i
i
Ex
n
1
) x
n
1
E( X E
Kuna x
i
on ldkogumi suvaline element elementide hulgast {x
1
, x
2
, ..., x
N
}, siis eeldusel, et
iga ldkogumi elemendi valimisse sattumise tenosus on hesugune p(x
i
)=1/N. Tulenevalt
keskvrtuse definitsioonist ning kasutades ldkeskmise definitsiooni, vime iga valimisse
sattunud elemendi keskvrtuse Ex
i
arvutada:
N
1 k
k k
N
1 k
k i
N
1
x ) p(x x Ex
(9.1)
Paneme selle tulemuse lemisse valemisse ja saame valimikeskmise keskvrtuse:
n
1
Ex
n
1
X E
n
1 i
n
1 i
i
(9.2)
Kokkuvttes - valimikeskmise keskvrtus on vrdne ldkeskmisega.
Valimikeskmise dispersioon. Vaatame nd teist, valimikeskmist kui juhuslikku suurust
iseloomustavat arvkarakteristikut dispersiooni. Valimikeskmise
X
dispersiooni ) X D(
saame leida valemiga:
n
n
n
Dx
n
1
) x
n
1
D( ) X D(
2
2
2 n
1 i
i 2
n
1 i
i
, (9.3)
kus x
i
thistab suvalist valimisse sattunud ldkogumi elementi. Toodud valemis kasutasime
nagu lalpoolgi ra seda, et kuna iga ldkogumi element vib sattuda valimisse vrdse te-
nosusega 1/N, siis
= ) -
x
(
N
1
= )
x
p( ) -
x
( = )
x
p( )
Ex
-
x
( = )
Ex
-
x
E( =
Dx
2
2
k
N
1 = k
k
2
k
N
1 = k
k
2
k k
N
1 = k
2
i i i
(9.4)
Tavaliselt thistatakse valimikeskmise dispersiooni
2
X
) X D( . Saadud tulemuse (9.3) vime
snastada jrgmiselt: valimikeskmise dispersioon sltub ldkogumi dispersioonist ja vheneb
valimi mahu kasvades. Tegelikkuses on see igati ootusprane ja loogiline tulemus.
Kokkuvttes saime tulemused
X E ja
n
2
2
X
.
Suurust
n
X
nimetatakse valimikeskmise standardveaks.
Valimikeskmise jaotus. Leidmata on veel kolmas valimikeskmist kui juhuslikku suurust
iseloomustav nitaja tema jaotus.
Paneme thele, et nende definitsioonist, on ldkeskmine ja ldkogumi standardhlve
mratud kogu vastava tunnuse jaoks tervikuna. Valimikeskmise
X
keskvrtuse ja disper-
48
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
siooni leidmisel saime vahetulemused (9.1) ja (9.4), mis nitavad, et suvalise valimisse vali-
tud elemendi x
i
keskvrtus on vrdne ldkeskmisega Ex
i
ning dispersioon ldkogumi
dispersiooniga
=
Dx
2
i
.
Seega on valimikeskmine
X
sama keskvrtuse ja dispersiooniga mratud juhuslike
arvude aritmeetiline keskmine. Vastavalt tsentraalsele piirteoreemile (vt. 7.3.1) on va-
limikeskmine kui aritmeetiline keskmine piisavalt suure liidetavate arvu korral (piisavalt suu-
re valimi korral) jaotunud normaaljaotuse jrgi:
)
n
, N( ) , X N(E ~ X
X
. Erijuhul, kui
vaadeldav tunnus X on normaaljaotusega, on valimikeskmine
X
, kui normaaljaotusega ju-
huslike suuruste summa, jaotunud normaaljaotuse jrgi ka vikeste valimite korral.
9.5 Valimi standardhlve kui juhuslik suurus
Nagu valimikeskmine
X
, nii on ka valimi standardhlve
) X -
x
(
1 - n
1
=
s
i
2
n
1 = i
juhuslik
suurus ning me vime leida tema, kui juhusliku suuruse, karakteristikud. Kesolevas kursuses
huvitab meid vaid tema keskvrus.
Saab nidata (vt joonealune mrkus), et kui ldkogumil on lplik dispersioon
2
, siis
statistiku s
2
keskvrtuseks on samuti
2
, st
2 2
Es
.
*6
Toodud testusest on nha, et see tulemus kehtib ainult juhul, kui murru nimetaja on n-1,
mitte n.
*6 Testamiseks teisendame kigepealt valimi standardhlbe valemit:
] ) - X n( - ) -
x
( [
1) - (n
1
= ] ) - X n( + ) - X 2n( - ) -
x
( [
1) - (n
1
=
= ) ) - X ( + ) - X )( -
x
2( - ) -
x
((
1) - (n
1
= ) ) - X ( - ) -
x
((
1) - (n
1
=
s
2 2
i
n
=1 i
2 2 2
i
n
=1 i
2
i
2
i
n
=1 i
2
i
n
=1 i
2
Edasi vime kirjutada
2 2 2
] [
n ] ) - X nE( - ) -
x
E( [
1) - (n
1
=
Es
2 2
i
n
=1 i
2
mida oligi tarvis testada.
Toodud testusest selgub htlasi, miks on valimi standardhlve definitsioonis jagatud suurusega n-1.
49
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
10 LDKOGUMI KARAKTERISTIKUTE PUNKTIHINNANG
ldkogumi tunnuse karakteristiku punktihinnanguks nimetatakse valimi phjal teatud
eeskirjade jrgi arvutatud vrtust. Kuna valim on juhuslik, siis arvutatud vrtus on samuti
juhuslik. Sellist vrtust nimetatakse ldkogumi karakteristiku hinnanguks. ldiselt vib
punktihinnangu leida erinevate arvutuseeskirjade jrgi, kusjuures eri eeskirjade jrgi saadavad
tulemused on enamasti erinevad. Vaatleme lihtsat nidet: oletame, et bensiini 95 keskmise
maksumuse leidmiseks tehti ksitlus 12-nes tanklas ja saadi jrgmised hinnad:
1,24; 1,20; 1,22; 1,26; 1,19; 1,22; 1,24; 1,24; 1,25; 1,26; 1,20; 1,22
Hinnangu bensiiniliitri keskmise maksumuse kohta vime saada mitmel viisil.
1) Kasutades ldkeskmise ( liitri keskmise hinna) leidmiseks valimikeskmist, saame
x
n
1
= X
i
n
=1 i
=(1,24+1,2+1,22+1,26+1,19+1,22+1,24+1,24+1,25+1,26+1,2+1,22)/12=1,228
2) Kasutades hinnanguks poolt maksimaalse ja minimaalse hinna summast, saame
=(1,19+1,26)/2=1,22
3) Kasutades saadud variatsioonrea kahe keskmise vrtuse poolsummat, saame
=(1,22+1,24)/2=1,23
Antud juhul on tulemused peaaegu vrdsed, kuid nad ei pruugi seda alati olla. Tekib ksi-
mus, kas on olemas reeglid sobiva hinnangu valimiseks? Millist hinnangut lugeda sobivaks?
Efektiivse punktihinnangu miste. ldkogumi karakteristiku hinnangut nimetatakse efek-
tiivseks hinnanguks, kui hinnang on nihketa ja hinnangu standardhlve vheneb valimi mahu
kasvades.
Valimi phjal arvutatud juhusliku suuruse vrtust nimetatakse ldkogumi karakteristiku
nihketa hinnanguks, kui selle juhusliku suuruse keskvrtus on vrdne hinnatava karak-
teristikuga.
Kui vaatleme nd laltoodud kolme erinevat hinnangut, kus hinnatavaks suuruseks on
ldkeskmine , siis esimesel juhu jaoks testasime, et
= X E
. Teise ja kolmanda juhu jaoks
sellist vrdust ldjuhul testada ei saa ning E ja E . Seega vime vita, et va-
limikeskmine on ldkeskmise nihketa hinnanguks.
Hinnangu sobivuse teiseks nitajaks on hinnangu hajuvus, mida iseloomustatakse hinnan-
gu standardhlbega. Mida viksem on hajuvus hinnatava karakteristiku suhtes, seda parem on
kasutatav hinnang. ldiselt nutakse, et hinnangu hajuvuse saab teatud tingimustel teha
kuitahes vikeseks.
Kasutades ldkeskmise hinnanguna valimikeskmist, on hajuvus mratud valimikesk-
mise standardveaga
n
X
. Sellest valemist on nha, et valimi mahu suurendamisega
(n), saab muuta hajuvuse kuitahes vikeseks.
Nihketa hinnangut, mille standardviga lheneb nullile, nimetatakse efektiivseks punktihi-
nnanguks. Tuginedes laleldule vime elda, et valimikeskmine on ldkeskmise efektiiv-
seks hinnanguks.
50
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
11 LDKOGUMI KARAKTERISTIKUTE VAHEMIKHINNANGUD
Punktihinnang annab uuritava suuruse kohta heselt mratud vrtuse, mida on lihtne
kasutada. Punktihinnanguid kasutatakse niteks mitmesuguste ksitluse korral: mitu protsenti
inimesi toetab hte vi teist erakonda, milline on toidukorvi keskmine maksumus, kui palju
raha kulutab lipilane keskmiselt raamatute ostmiseks jne. On tiesti selge, et saadud hi-
nnang on ligikaudne ja on oluline teada, milline on hinnangu tpsus. Tpsuse arvesse vtmata
jtmine annab vimaluse tulemustega mngimiseks. Niteks, kui he erakonna pooldajate
protsent muutus he protsendipunkti vrra, siis saab sellest kirjutada pikki artikleid ja otsida
phjendusi poolt ja vastu. Tegelikkuses vis phjus olla vaid selles, et mlemad tulemused
jid hinnanguvea piiridesse ja mingit sisulist muutust ei toimunudki.
Punktihinnangut on kll mugav kasutada, kuid ta ei pruugi olla eriti usaldusvrne. Roh-
kem informatsiooni sisaldab vahemikhinnang. Vahemikhinnangu korral leitakse vahemik,
millesse hinnatav karakteristik kuulub ning antakse hinnang usaldatavusele.
Nide 11.1 Toidule hes ndalas tehtavate kulutuste suuruse uurimiseks ksitleti juhusli-
kult 64 toidukaupade ostjat ja saadi euro tpsusega jrgmised vastused:
104; 141; 106; 25; 98; 93; 36; 145; 129; 77; 96; 6; 16; 84; 83; 32; 116; 47; 112; 79; 111; 132; 61;
100; 103; 104; 74; 109; 166; 39; 157; 84; 116; 122; 111;118; 50; 154; 98; 120; 79; 42; 77; 71; 131;
115; 52; 150; 76; 81; 75; 119; 115; 138; 87; 1; 103; 106; 74; 45; 50; 90; 80; 104
Selle valimi jrgi tahetakse hinnata, kui palju inimene he ndala jooksul toidupoes kesk-
miselt kulutab. Kulutuste tegeliku suuruse saamiseks peaksime me ksitlema kiki inimesi
sltuvalt meie uuringule pandud piiridest, kas siis Eestis, Euroopas vi kogu maakeral. Punk-
tihinnangu korral on vastuse saamine lihtne. Leiame valimikeskmise x
n
1
= X
i
n
1 = i
= = 90,86
ja he euro tpsusega vidame, et inimene kulutab toidule ndalas 91 eurot. Ilmselt on tde
(ldkeskmise tegelik vrtus) kusagil 91 euro mbruses. Arvesse vttes vimalikku viga vi-
me selle punktihinnangu kujundada vahemikhinnanguks joonisel nidatud viisil:
Vahemikhinnangu korral seataksegi eesmrgiks mrata vahemik, mis teatud te-
nosusega sisaldaks hinnatavat karakteristikut.
Olgu w ldkogumi karakteristik, millele tahame anda hinnangut. Juhuslikku v ahemikku
( a, b ), mis ldkogumi hinnatavat karakteristikut w sisaldab tenosusega , nimetatakse usal -
91
Tenosusega asub kulu keskmine
selles vahemikus
a b
51
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
dusvahemikuks . Tenosust nimetatakse usaldusnivooks ja arve a ja b usalduspii -
rideks.
Usalduspiirid mravad usaldusvahemiku laiuse b a. Hinnangu veaks nimetatakse
poolt usaldusvahemiku laiusest: = (b-a)/2.
Enamasti pstitatakse usaldusvahemiku leidmise lesanne selliselt: leida usaldusvahemik,
millesse ldkogumi uuritav karakteristik w kuulub usaldusnivool . Usaldusnivoo vrtus
antakse uuringus ette ja sltub uuringu olulisusest, enamasti vetakse >0,9. Kehtib ilmne
seos mida suurema usaldatavusega tahame anda hinnangut, seda laiem on usaldusvahemik,
st seda suurem on hinnangu viga.
Kui tenosus, et vahemik (a,b) sisaldab uuritav karakteristikut on , siis jrelikult te-
nosusega 1- = vahemik seda ei sisalda, st tenosusega me teeme vea. Suurust nime-
tatakse olulisusnivooks ning sageli antaksegi ette just olulisusnivoo vrtus. Mida viksema
olulisusnivoo anname ette, seda kindlamalt soovime, et meie poolt leitud usaldusvahemik
sisaldaks tegelikku vrtust.
11.1 ldkeskmise vahemikhinnang
Eelnev vahemikhinnangu kohta kiv jutt kehtib suvalise hinnatava karakteristiku korral.
Konkreetsed vahemikhinnangu leidmise eeskirjad on aga tarvis tuletada iga karakteristiku
(ldkeskmine, dispersioon, mediaan, jne) korral eraldi.
Olgu hinnatavaks karakteristikuks ldkeskmine ning pstitame lesande selliselt: leida
(usaldus)vahemik ldkeskmise hinnangule olulisusnivool .
ldkeskmise usaldusvahemiku leidmisel lhtume tema punktihinnangust (valimikeskmi-
sest) ja kasutame ra valimikeskmise kui juhusliku suuruse keskvrtuse, dispersiooni ja
jaotuse. Kuna valimikeskmise jaotus on ldjuhul mratud vaid suurte valimite korral (vt. osa
9.4), siis vaatame ka hinnangu leidmist kahes osas.
11.1.1 Suur valim
Olgu antud mingi valim X = {x
1
, x
2
, ..., x
n
}, mille korral eeldame, et valimimaht on
piisavalt suur (n>60). Valimikeskmise
X
kohta teame kolme tsiasja (vt. 9.4):
1. teame, et valimikeskmise
X
keskvrtus on vrdne ldkeskmisega: = X E ;
2. teame, et valimikeskmise
X
standardhlve
X
on seotud ldkogumi standardhl-
bega ja avaldub kujul
n
X
3. teame, et valimikeskmise
X
on (ligikaudu) normaaljaotusega juhuslik suurus:
)
n
, N( ) , N( ~ X
X
.
Neid kolme tdemust kasutame allpool ldkeskmise vahemikhinnangu leidmisel.
Pstitame lesande: leida keskvrtuse suhtes smmeetriline vahemik, kus va-
limikeskmine
X
, kui juhuslik suurus, asub tenosusega 1- .
52
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
See on tavaline juhusliku suuruse vahemikku langemise tenosuse leidmise lesanne,
mille saame kirjutada tingimusega:
1 ) X E X P( < ,
kus otsitavaks suuruseks on hinnangu viga .
Kuna juhusliku suuruse
X
keskvrtus on = X E , siis vime saadud tingimuse vlja
kirjutada kujul:
1 ) X P( < .
Arvestades absoluutvrtuse mrkide thendust vime elda, et juhuslik suurus
X
ei erine
konstandist rohkem kui suuruse vrra, ehk
1 )) X ) P(( ) X P( + < < < (11.1)
See on lihtne vahemikku langemise tenosuse leidmise lesanne, kus otsitavaks on va-
hemiku laius. Sellist probleemi ksitlesime punktis 7.2.5 nidislesandes E. Praegusel juhul
me aga ei asenda valemisse konkreetseid arve, vaid jme ldise smboolika juurde kuni
lesande lahendamise lpuni.
Tulenevalt sellest, et meie poolt vaadeldav juhuslik suurus
X
on normaaljaotusega,
saame analoogiliselt viidatuga kirjutada:
,
_
,
_
,
_
,
_
+
+ < <
X X X X
)) ( X ) P(( ,
kus kasutasime vahemiku otspunktide vrtusi: a = + ja b = . Kasutades standardi-
seeritud normaaljaotuse korral kehtivat valemit (-z) = 1-(z) (valem 7.3) vime saadud tu-
lemust edasi lihtsustada:
Probleemi pstituse tingimuste jrgi vrdub juhusliku suuruse
X
vaadeldavasse vahemikku
langemise tenosus vrtusega 1- ja seega saame:
Selles vrduses on ainukeseks otsitavaks suuruseks hinnangu viga . Avaldame hinnangu vea
ja kasutades kvantiili mistet (vt. 6.2.1) avaldame:
2
1
X
2
1
1
X
z z )
2
(1
.
Saadud valemit vime juba kasutada hinnangu vea leidmiseks olulisusnivool . Olulisusni-
voo seostamiseks hinnangu veaga thistatakse asemel
... )) ( X ) P((
X X X
,
_
,
_
,
_
+ < <
,
_
. Te-
gelikkuses me seda aga ei tea ega saagi teada. Eespool punktis 9.4 leidsime, et valimikesk-
mise standardhlve on avaldatav kujul
n
X
, kus on ldkogumi standardhlve ning
seega omandab valem(11.3) kuju:
n
z X
n
z X
/2 /2
+ < <
(11.3)
Kahjuks on ldkogumi standardhlve enamasti teada teada vaid erandjuhtudel, kui tema
leidmiseks (hindamiseks) on lbi viidud eraldi uuringud. Osutub aga, et kui tegu on suure va-
limiga, siis vime, tulemust oluliselt kahjustamata ldkogumi standardhlve asemel kasuta-
da valimi standardhlvet
) X -
x
(
1 - n
1
=
s
i
2
n
1 = i
= = 90,86
2) valimi standardhlve
) X -
x
(
1 - n
1
=
s
i
2
n
=1 i
==37,33
3) valimi standardviga
67 , 4
8
33 , 37
n
s
X
4) leiame normaaljaotuse usaldusnivoole vastava normaaljaotuse tiendkvantiili: 1- =
0,95; = 0,05; /2 = 0,025 ja standardiseeritud normaaljaotuse tabelitest leiame
96 , 1
975 , 0 025 , 0
z z
.
Paneme nd saadud arvud valemisse (10.2)'' ning saame vahemikhinnangu
67 , 4 96 , 1 86 , 90 67 , 4 96 , 1 86 , 90 + < <
ehk mardatult: 81,7 < < 100,1
Nagu neme, asub antud katseandmetest tulenevalt ndalase toidukorvi tegelik maksumus
kllaltki laias vahemikus ning vahemiku keskpunkti kasutamine (punktihinnang) vib viia
ekslikele tulemustele.
Kuidas muutub vahemikhinnang usaldusnivoo kasvades? On loogiline eeldada, et mida
suurema usaldatavusega (suuremal usaldusnivool) soovime saada tulemust, seda laiemaks
venib usaldusvahemik. Selle kinnitamiseks vaatleme usaldusvahemikku erinevatel usaldus-
nivoodel. Olgu nendeks 0,5; 0,9; 0,95 ja 0,99 ja korrastame saadud tulemused alljrgnevasse
tabelisse:
Usaldusnivoo (1-) 0,5 0,9 0,95 0,99
Valimikeskmine
X
90,86 90,86 90,86 90,86
Valimi standardhlve s 37,33 37,33 37,33 37,33
Tiendkvantiil
2
z
0,68 1,65 1,96 2,58
Standardviga
X
= = 85,3
2) valimi standardhlve
) X -
x
(
1 - n
1
=
s
i
2
n
=1 i
==39,2
3) valimi standardviga
84 , 7
5
2 , 39
25
s
X
Korrastame nd tulemused erinevate usaldusnivoode korral tabelisse:
Usaldusnivoo (1-) 0,5 0,9 0,95 0,99
Valimikeskmine
X
85,3 85,3 85,3 85,3
Standardhlve s
39,2 39,2 39,2 39,2
t-jaotuse tiendkvantiil
2
t
0,68 1,71 2,06 2,8
Standardviga
X
ei ole teada
n
s
z
+ X < <
n
s
z
- X
/2 /2
Vike
valim
n<60
teada
n
z
+ X < <
n
z
- X
/2 /2
ei ole teada
n
s
t + X < <
n
s
t - X
n n
1 , 2 / 1 , 2 /
Ei ksitle antud kursuses
Tabel 11.1
11.2 Valimi suuruse mramine
Punktis 11.1 ngime, et hinnangu viga sltub kahest tegurist: lesande pstitamisel ette
antud usaldusnivoost 1- ja valimi suurusest n. Seejuures valimi mahu kasvades viga
vheneb. Usaldusnivoo ja valimi suurus on uurija valida, teised parameetrid (jaotus ja
standardhlve) tulenevad uuritava tunnuse olemusest.
Sageli pstitatakse lesanne selliselt: leida uuritava karakteristiku hinnang usaldusnivool
1- , mille korral viga ei leta hikut .
Nutava tpsuse saame tagada vaid piisavalt suure mahuga valimi kasutamisel. Seega on
meil tegemist lesandega: leida valimimaht, mille korral olulisusnivool hinnatav karak -
teristik ei erine tegelikust vrtusest rohkem kui lubatava vea
vrra.
Oletame, et tegemist on ldkeskmise hinnanguga. Kik selle vimalikud erijuhud, mille
korral oskame anda hinnangu, on toodud tabelis 11.1. Sltuvalt lhtetingimustest vime
eristada kahte alamjuhtu:
1) tunnuse standardhlve on teada
2) kasutame valimi standardhlvet s.
Esimesel juhul avaldub hinnangu viga
, kujul:
n
z /2
ning siit on kerge leida va-
limi maht:
2
2 /
,
_
z
n , mis annab minimaalse nutavat tpsust tagava vajaliku valimi-
mahu.
Teisel juhul, kui kasutame valimi standardhlvet
) X -
x
(
n
=
s
n
i
i
2
1
1
1
, avaldub hinnan-
gu viga valemiga )
s *
z
( = n
2 /2
)
n
s(
*
z
= n
0
/2
vi
2
1
,
_
)
n
s(
*
t
= n
0
/2
Kui osutub, et leitud vrtus n
1
on viksem kui proovivalimi maht n
0
, siis arusaadavalt
on proovivalimi suurus piisav. Kui aga n
1
>n
0
, see thendab, et proovivalim oli vike, tuleb
valimit suurendada. Seega tuleb ldkogumist valida tiendavalt n
1
-n
0
elementi. Kogu
protsessi korratakse seni, kuni mingil sammul nutav valimi maht on viksem vajalikust, st
n
i+1
<n
i
.
Valimi mahu leidmisel eeldasime, et ldkogum on piisavalt suur vi lpmatu. Seega
kunagi ei teki olukord, kus valimisse tuleb vtta rohkem objekte kui neid on ldkogumis neid
ldse on. Lplike, vikese objektide arvuga ldkogumite korral (niteks majandusteaduskon-
na II kursuse lipilased, le miljonieurolise kibega ettevtted Eestis jne) on mttekas mitte
teha valimit, vaid uurida tervet ldkogumit ja saada hinnangute asemel tpsed tulemused. Kui
mingil phjusel ei ole ldkogumi anals siiski vimalik, tuleb ikkagi piirduda valimi phjal
tehtavate hinnangutega. Valimi vajaliku mahu mramisel klbavad laltoodud hinnangud,
kui neid korrutada koefitsiendiga
n + N
N
, kus N on ldkogumi maht ja n leitud valimi
maht.
ldiselt kehtib valimi mahu mramisel phireegel - mida suurem on valim, seda
phjalikumat analsi saab teha, kuid majanduslikest kaalutlustest lhtudes - mida viksem
on valim, seda odavam on uuringut lbi viia.
Nide 11.4. Vtame uuesti ksile nite 11.3 ja leiame, mitut inimest on tarvis ksitleda, et
saada hinnangut 10 euro tpsusega usaldusnivool 0,95.
Lahendus: 65
10
2 , 39 * 06 , 2
2
2
2 /
2
2 /
,
_
,
_
,
_
s t
t
n
1
N
1 i
i
,
kus N
1
on tunnuste arv, mille vrtus on 1 (summas liidame kokku N
1
hte) ja N on objektide
arv ldkogumis. Suhe N
1
/N on vaadeldava tunnuse vrtuse 1 omandamise suhteline
sagedus ldkogumis. Eristamaks suhtelise sageduse hindamisvalemeid ldkeskmise vale-
mitest thistame suhtelise sageduse thega p.
Vastavalt ldkogumi standardhlbe definitsioonile avaldub praegusel juhul ldkogumi
standardhlve (vt 9.2): p) p(1 . Tavaliselt thistatakse 1-p=q, ning saame valemi
pq
*7
Seega saime, et vrtusi 0 ja 1 omava tunnuse korral vastab ldkogumis ldkesk-
misele ldkogumi suhteline sagedus p ja standardhlve avaldub suhtelise sageduse kaudu
kujul pq .
*7 Tepoolest,
pq = p) - p(1 = p + p 2 - p = )
N
+
N
2p - p (N
N
1
=
= ) x + px p (
N
1
= ) x
- (p
N
1
=
2 2
1 1
i
N
=1 i
i
N
=1 i
2
N
=1 i
2
i
N
=1 i
2
2
2
*
2
n
1 i
1
i
p
n
n
x
n
1
X
, kus n
1
on valimis vrtust 1
omavate elementide arv.
Suhteline sagedus
p
kui valimikeskmine on juhuslik suurus, mille
1) keskvrtus (arvestades lalpool kasutusele vetud thistust):
p
x
n
1
E = p E X E
i
n
1 = i
,
_
2) dispersioon
n
pq
n
X D
2
2
p
2
X
Kuna sageduse korral on tegemist ldkeskmise hindamise erijuhuga, siis asendades leitud
vrtused ldkeskmise hindamise valemisse ja saame:
p /2 p /2
z + p < p < z - p .
Ilmselt ei ole siin mtet vaadelda juhtu kui ldkogumi standardhlve on teada:
n
pq
p X
, kuna siis me vime hinnatava vrtuse p leida sellest samast valemist. Kui
ldkogumi standardhlve ei ole teada, kasutame arvutustes valimi phjal arvutatud lhend-
vrtusi:
n
q p
p X
ning saame sageduse hindamiseks valemi
n
q p
z + p < p <
n
q p
z - p
/2 /2
Vikeste valimite korral me saime anda hinnangu vaid siis, kui uuritav tunnus on normaal-
jaotusega. Kahendvrtusi omav tunnus seda ei ole ja seega ei klba siinjuures ka Studenti
jaotus. Vikeste valimite korral kasutatakse hinnangu leidmisel eritabeleid, mida me siin-
kohal ei vaatle.
Nide 11.5. Poliitik palus hinnata oma toetajaskonna suurust usaldusnivool 0,95. Selleks
ksitleti 400 inimest, kellest 225 tles, et toetan ja 175 tlesid ei toeta. Leida hinnang
poliitikut toetavate inimeste protsendile.
Lahendus.
1) 0.56 = 225/400 = p 0.44 = q
2) 0.025 =
400
0.44 * 0.56
=
n
q p
=
p
3) Thistagu I
p
usaldusvahemikku: I
p
=(0.56 1.96*0.025) = (0.56 0.05)
Seega - usaldusnivool 0.95 toetab poliitikut 51-61% inimestest.
60
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
11.3.1 Valimi suuruse mramine suhtelise sageduse hinnangutes
Nagu ldkeskmise hinnangu korralgi, saab ka sageduse hinnangus leida valimi suuruse,
mis usaldusnivool 1- tagab, et usalduspiirid jvad etteantud lubatavast veast viksemaks.
Selleks lhtume veahinnangust
n
q p
*
z /2
ja siit leiame
2
2
/2
q p *
z
= n . Sageli vetakse
korrutise q * p tegeliku vrtuse asemel tema vimalik maksimaalne vrtus, mis saavuta-
takse juhul 5 , 0 = p . See annab kll vajalikust veidi suurema valimi, kuid vimaldab kohe
uurimise algul mrata valimi suuruse. Seega, sageduse vahemikhinnangute korral vime lei-
da valimimahu arvutades:
4
z
= n
2
2
2
.
Nide 11.6. Mitut inimest on nite 11.5 korral tarvis ksitleda, et saada vastus usaldusni-
vool 95% veaga 5%.
Leiame 384 =
0.05 * 0.05
0.5 * 0.5 *
96
1.
= n
2
. Seega ksitlesime praeguse lesandepstituse 16
inimest korral rohkem kui seda hdaprast tarvis oleks olnud.
Lubatava vea vhendamine suurendab ksitletavate hulka mrgatavalt, niteks soovides tu-
lemust, mis samal usaldusnivool ei letaks 3% viga, peaksime ksitlema 1100 inimest.
61
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
12 HPOTEESID
12.1 Hpoteeside pstitamise phimtted ja liigid
Kik siiani tehtud jreldused ldkogumi karakteristikute kohta olid hinnangud karakteristi-
kute arvulistele vrtustele. Selliseid hinnanguid tegime lhtudes vajalikust usaldusnivoost ja
lubatavast veast. Sageli ei huvita meid aga mitte niivrd parameetrite konkreetsed arvulised
vrtused, kuivrd nendel vrtustel phinev otsustus.
Hpoteese vime pstitada mingi konkreetse karakteristiku kohta, olgu selleks siis ld-
keskmine, standardhlve, keskmiste vahe, sagedus vi mni teine karakteristik, aga samuti ka
vga mitmete teistsuguste videte testamiseks vi mberlkkamiseks, niteks kas tunnuste
vahel on seos, kas tunnus on jaotunud eeldatava jaotuse jrgi jne.
Kesolevas osas vaatleme hpoteeside pstitamist ldkogumi parameetrite kohta. Hpo-
teeside pstitamise olemuse vib snastada selliselt.
1. On olemas ldkogum, millel on meid huvitava karakteristiku vrtus w, mida me aga
ei tea.
2. Teeme oletuse, et selle karakteristiku vrtus on meie poolt eeldatavas suhtes oleta-
tava arvuga w
0,
st on vrdne arvuga w
0
, on arvust w
0
suurem (w > w
0
) vi viksem
(w < w
0
). Oletatav vrtus w
0
on mingil mral meie veendumus.
3. Moodustame valimi (kontrollvalimi) ja arvutame valimi statistiku kui ldkogumi
vaadeldava karakteristiku w hinnangu. Sltuvalt sellest, millises suhtes on valimi ph-
jal arvutatud statistik meie poolt pakutud arvuga w
0
vime anda hinnangu oma vitele,
st kas w = w
0
, w > w
0
vi w < w
0
.
Selgitame seda lihtsa nite varal.
Suitsetamine on paha harjumus, millega sageli alustatakse suhteliselt noorelt. Olgu niteks
eeldatav ohtlik iga keskmiselt kusagil 14. eluaasta juures. Selle vite kohta vime pstitada
jrgmised teesid:
1) regulaarse suitsetamise algus on keskmiselt 14-aastaselt;
2) regulaarse suitsetamise algas keskmiselt prast 14. eluaastat ja
3) regulaarse suitsetamise algas keskmiselt enne 14. eluaastat.
Paneme thele, et meie vited on praegu tehtud ldkeskmise kohta. Pstitatud teeside
testamiseks peame tegema valimi, st ksitlema teatud arvu suitsetajaid. Sama valimi phjal
saame kontrollida kikide videte paikapidavust vi paikapidamatust, kuid seda ikkagi ks-
haaval. Selleks vaadeldakse iga vitega krvuti tema vastandit ning teatud reeglite jrgi
otsustatakse, millist videt lugeda teseks.
Iga konkreetse vite korral vaadeldakse hpoteeside teoorias teineteist vlistavate hpo-
teeside paare, millest ks thistab testatavat videt, nn alternatiivset hpoteesi H
1
ja teine
temale vastupidist situatsiooni, nn nullhpoteesi - H
0
. Seega, lhtudes laltoodust saame vl-
ja kirjutada hpoteeside paarid:
A. H
0
: w = 14 B. H
0
: w 14 C. H
0
: w 14
H
1
: w 14 H
1
: w > 14 H
1
: w < 14
62
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Siin w thistab muutujat regulaarse suitsetamise alguse keskmine iga ja w
0
= 14 on meie
poolt arvatav vrtus. ldjuhul vime hpoteeside liigid koos nimedega kirjutada vlja kujul:
H
0
: w = w
0
A. Kahepoolne hpotees:
H
1
: w w
0
H
0
: w w
0
B. Hpotees suurem:
H
1
: w > w
0
H
0
: w w
0
C. Hpotees viksem:
H
1
: w < w
0
Nagu eespool eldud, tehakse hpoteeside kontrollimiseks valim ja leitakse valimi vastav
karakteristik. Kuna valim on juhuslik, on juhuslik ka valimi vastav karakteristik, millega
vrdleme oma arvamust. On tiesti vimalik, et ks valim kinnitab pstitatud teesi, kuid tehes
uue valimi, vime saada vastupidise tulemuse. Seeprast tuleb jllegi tehtav otsustus siduda
tenosusega, st anda hinnang igeks peetava vite tesusele.
Hpoteeside pstitamisel ja kontrollimisel lhtutakse sellest, et nullhpotees H
0
nitab ala-
ti kehtivat olukorda ja kasutades valimist saadud tulemusi me peame testama alternatiivse
hpoteesi H
1
. Seeprast rgitaksegi, et tehtud valimi phjal saame testada alternatiivse h-
poteesi vi kui seda ei saa, siis tleme me jme nullhpoteesi juurde. Nagu nha, ei ole
vrdus w = w
0
testatav hpotees ning videt suitsetamine algas keskmiselt 14 aastaselt
me otseselt testada ei saa. Kll saame aga testada, et valim ei kinnita, et suitsetamise algus
erineks meie poolt arvatavast 14 aastast.
Nullhpoteesi ja alternatiivse hpoteesi erinevat thendust tuleb meeles pidada hpoteesi-
de pstitamisel esmalt tuleb paika panna see, mida tahame testada (hpotees H
1
) ja seejrel
tema vastuvide - H
0
. Ilus analoogia tekib siin ka nn stuse presumptsiooniga tuleb lh-
tuda phimttest, et inimene on alati stu, alles mberlkkamatute tendite korral (meil on
selleks ldkogumist vetud valim), vime vita vastupidist.
12.2 Hpoteeside kontrollimise phimtted
A. Kahepoolne hpotees. Olgu ldlevinud arvamuse jrgi hinnatava parameetri
vrtus w = w
0
. Meie arvates see nii ei ole ja me tahame selle eksiarvamuse kummutada
testades alternatiivse hpoteesi. Seega on tegemist kahepoolsete hpoteeside paariga:
H
0
: w = w
0
H
1
: w w
0
Hpoteeside kontrollimiseks vtame ldkogumist valimi ja leiame valimi phjal kontrolli-
tavale karakteristikule vastava statistiku X (kui kontrollitavaks suuruseks on ldkeskmine,
siis on kontrollstatistikuks valimikeskmine
X
, kui kontrollitavaks on suhteline sagedus, siis
on selleks suhteline sagedus valimis jne).
On loogiline, et kui hpoteeside kontrollimiseks arvutatud statistik X ei erine meie poolt
oletatavast vrtusest w
0
oluliselt, st
<
0
w X
, kus on mingi vike suurus, siis on usutav
vide w = w
0
ja on loomulik jda nullhpoteesi juurde. Kui aga osutub, et leitud statistik X
63
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
ei ole meie poolt arvatavale vrtusele kllalt lhedal:
0
w X
siis nullhpotees usutav ei
ole ja tuleks lugeda kehtivaks alternatiivne hpotees H
1
.
Arvestades, et statistik X on juhuslik suurus, vime seda situatsiooni kujutada joonisel
selliselt:
Lubatav erinevus on loomulik siduda mingi tenosusega ja vaadelda teda sltuvuses
sellest tenosusest. Seega leitakse vahemik
) (
0
t w
millesse juhuslik suurus X langeb
mingi tenosusega. See on sisuliselt usaldusvahemiku leidmise lesanne (vt 11.1) ning lu-
batav krvalekalle
w
0
-
X
jme H
0
juurde
H
1
H
1
64
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Lubatava krvalekalde suurus mratakse jllegi sltuvalt ette antud usaldusnivoost 1-.
Krvalekalle
leitakse valemist
A
H
0
: w=w
0
H
1
: ww
0
H
0,
kui
<
0
w X
H
1
, kui
0
w X
< 1 ) (
0
w X P
B
H
0
: ww
0
H
1
: w>w
0
H
0,
kui
) (
0
+ < w X
H
1
, kui
) (
0
+ w X
< 1 ) (
0
w X P
C
H
0
: ww
0
H
1
: w<w
0
H
0,
kui
) (
0
> w X
H
1
, kui
) (
0
w X
< 1 ) (
0
X w P
Tabel 12.1
w
0
+ w
0
X
kehtib H
1
jme H
0
juurde
w
0
-
X
kehtib H
1
jme H
0
juurde
w
0
65
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
12.3 Hpoteesid ldkeskmise kohta
Eespool me leidsime ldised tingimused hpoteeside kontrollimiseks. Lhtudes nendest
tingimustest saame leida hpoteeside kontrollimise eeskirjad ldkogumi iga karakteristiku
jaoks, arvestades selle karakteristiku omapra.
Vaatleme jrgnevas ldkeskmise kohta tehtavaid hpoteese. Thistagu alljrgnevas:
ldkeskmist,
0
meie poolt oletatavat vrtust ja kontrollvalimi phjal arvutatud statistik
X
X
- valimikeskmist.
Punktis 9.4 nitasime, et X E ja ilma uuritavale tunnusele lisatingimusi panemata on
piisavalt suure kontrollvalimi korral (valimi maht > 60) vastavalt tsentraalsele piirteoreemile
valimikeskmine
X
jaotunud normaaljaotuse jrgi. Nullhpoteesi jrgi =
0
, jrelikult eel-
dame siis ka, et
0
X E
.
12.3.1 Kahepoolsete hpoteeside kontrollmine
Vaatleme hpoteesipaari
0 1
0 0
:
:
H
H
. Eelmises punktis saime, et lubatav krvale-
kalle
0
vahel jme nullhpoteesi juurde.
Tehtud eeldusel, et kontrollvalim piisavalt suur, on juhuslik suurus
X
normaaljaotusega
ja vahemikku langemise tenosuse leidmisel vime kasutada Laplace'i funktsiooni:
1 1 )
( 2 )
( )
( ) X P(
X
0 0
+ < <
Edasi saame
2
1 ) (
X
ning sarnaselt punktis 11.1 tehtuga avaldame
2 /
1
)
2
1 (
z
X
, kus z /2 on standardiseeritud jaotuse tiendkvantiil. Otsitav suurus
avaldub kujul
X
z
2 /
.
Pannes saadud
X
<
ja
vtame vastu alternatiivse hpoteesi, kui:
/2
X
0
z
.
66
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Enamasti tuuakse sisse veel lisathistus
X
0
X
Z
. Meenutame (vt
11.1), et juhul kui on teada ldkogumi standardhlve , siis leiame
n
X
; enamasti me
seda aga ei tea ja piisavalt hea hinnangu saame, kui kasutame valimi standardhlvet s ning sel
juhul arvestame, et
n
s
X
.
Nide 12.1. Pikaajalise katsetamise kigus on selgunud, et 10-12 aastaste pilaste intel-
ligentsuse testi IQ keskmine nitaja on 110 palli. Seda testi kasutati hes vikeses koolis 80
pilase hindamiseks ja saadi keskmiseks
108,2 = X
. Seejuures arvutati ka valimi standard-
hlve s=9,4. Kas olulisusnivool 0.05 vime vita, et selle kooli pilaste intelligentsustase eri-
neb keskmisest?
Lahendus. Lhtudes hpoteeside pstitamise phimttest, me nullhpoteesiga peame vit-
ma, et ei ole olulist erinevust selle kooli pilaste ja pilaste ldise keskmise IQ vahel. Seega
H
0
: = 110
saame kahepoolsete hpoteeside paari:
H
1
: 110
Olulisusnivoole =0,05 vastab tiendkvantiil
96 1 =
z /2
,
. Leiame teststatistiku Z
1,71 - =
s
n * 110) - (108.2
= Z
.
Kuna teststatistiku absoluutvrtus on viksem kui vastav tiendkvantiil:
96 , 1
025 , 0 2 /
< z z Z
, siis jme nullhpoteesi juurde. Seega, vike erinevus tulemustes ei
luba veel vita kontrollitava kooli pilaste erinevat intelligentsust. Rhutame siinjuures, et
kahepoolse hpoteesiga me kontrollime intelligentsustaseme erinevust, mitte seda kas see on
suurem vi viksem.
Nagu neme, phineb hpoteeside kontrollimine kahe vrtuse vrdlemisel helt
poolt teststatistik Z, mille vrtus sltub valimi keskmisest ja standardhlbest, teiselt poolt
tiendkvantiil, mille vrtus sltub nutavast olulisusnivoost. Vaatame veelkord toodud
nidet ja nuame hinnangut olulisusnivool 0,1. Sel juhul teststatistiku vrtus on sama,
tiendkvantiil
65 , 1
025 , 0 2 / 1 , 0 2 /
z z z
=
1,96s ja juhul = 0,1 on selleks
0
+
0
-
X
jme H
0
juurde
H
1
H
1
68
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
H
1
: >
0
Nagu lalpool analsisime siis juhul, kui valimikeskmine on viksem kui meie oletatav
vrtus
0
X < , ei saa valim kummutada nullhpoteesi. Nii ei ole nite 12.1 andmete phjal
mtet hakata testame et vaadeldava kooli pilaste keskmine IQ on suurem ldisest keskmi-
sest. Tabelis 12.1 leidsime, et nullhpoteesi juurde jme tingimusel
) (
0
+ < w X
, seega
ldkeskmise juhul on tingimus
) ( X
0
+ < (12.1)
ning raja
+
+ < 1 ) ( ) ( ) (
0 0
0
X X
X P
Analoogiliselt kahepoolsete hpoteeside kontrollivalemi tuletamisega
z
X
) 1 (
1
ning siit hinnang rajale
z
X
.
Asendades leitud
z X
X
+ <
0
. Kirjutame selle vrratuse
natukene teisel kujul, saame kriteeriumi, et nullhpoteesi juurde jme, kui
z
X
X
<
0
ehk arvestades thistust
Z
X
X
0
omandab kriteerium vga lihtsa kuju: z
Z
< .
H
0
:
0
Hpotees viksem on antud paarina:
H
1
: <
0
On arusaadav, et kui X
0
> , siis valim ei kummuta nullhpoteesi. Kui aga X
0
,
siis kerkib ksimus sellest, kas valimikeskmine on oletatavast ldkeskmisest piisavalt palju
viksem, et vtta vastu alternatiivne hpotees. Nullhpoteesi juurde jmise tingimuseks
saime punktis 12.2:
- X
0
. Lhtudes tenosusest 1 = )
- X P(
0
> vime kirjuta-
da:
1 )
( )
( 1 )
( 1 ) ( X P( 1 )) ( X P(
X
X
0 0
0 0
<
.
Nagu eespool tegime, saame siit kergesti vlja kirjutada vrduse
z
X
ja nullh-
poteesi juurde jmise tingimusest
z X
X
0
ehk
z
X
X
<
0
. Kasutades lal-
pool toodud thistust Z, vime nullhpoteesi juurde jmise tingimuse kirjutada lejnutega
analoogilisel kujul:
z Z <
69
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Nide 12.2. Detaili valmistamise aeg on normi jrgi 35 sekundit. Meister vidab, et tema
poolt pakutud tiustuse korral aeg lheneb. Selle vite kontrollimiseks tehti 70 katset ning
saadi
X
= 32,5 ja s=10,2. Kas katse tulemused kinnitavad meistri videt?
Lahendus. Meistri vite kontrollimiseks pstitame hpoteesid. Nullhpoteesiks valime si-
tuatsiooni, mis vidab, et midagi muutunud ei ole - aeg ei lhenenud.
35 :
H
35 :
H
1
0
<
paremaks muutu ei
Leiame kontrollstatistiku
05 , 2
2 , 10
70 ) 35 5 , 32 (
0
X
X
Z
. Kui on tegemist
vikeste valimitega ja uuritav tunnus on normaaljaotusega, siis vime teha sellise asenduse,
kuid samas kasutama normaaljaotuse tiendkvantiili asemel Studenti tiendkvantiili (vrdle
ldkeskmise usaldusvahemiku leidmisega osas 11.1)
Kokkuvttes saame tulemused koondada tabelisse:
kus
X
X
Z
- on teststatistik,
z
- on standardse normaaljaotuse tiendkvantiil
ja
1 , n
t
n
t Z
B
H
0
:
0
H
1
: >
0
H
0,
kui
z Z <
H
1
, kui
z Z
H
0,
kui
1 ,
<
n
t Z
H
1
, kui
1 ,
n
t Z
C
H
0
:
0
H
1
: <
0
H
0,
kui
z Z <
H
1
, kui
z Z
H
0,
kui
1 ,
<
n
t Z
H
1
, kui
1 ,
n
t Z
Tabel 12.2
70
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
usaldusvahemiku leidmist ksitlesime eespool punktis 11.3. Seal time sisse jrgmised t-
histused ja leidsime jrgmised seosed:
ldkeskmine (st. suhteline sagedus ldkogumis): = p
ldkeskmise dispersioon:
2
= pq
valimikeskmine (st. suhteline sagedus valimis): p = X
valimikeskmise dispersioon:
n
pq
=
n
=
2
2
X
Selles osas tegeleme sageduse kohta kivate hpoteesidega. Thistame meie poolt
arvatava sageduse vrtust smboliga p
0
. Kuna lhtume sellest, et see vrtus on ige, siis tu-
leneb temast ka valimikeskmise dispersioon
n
q p
=
0 0 2
X
, kus q
0
=1-p
0
.
Nagu lalpool eldud, on sageduse korral tegemist ldkeskmise erijuhuga. Suurte va-
limite korral on valimikeskmine
X
(praegu p ) tsentraalse piirteoreemi kohaselt jaotunud
normaaljaotusega ning peab paika kik, mis eespool oli eldud ldkeskmise hpoteeside kor-
ral. Normaaljaotuse - tiendkvantiiliga (vi /2-tiendkvantiiliga) vrreldav teststatistik Z
asendub laltoodud thistusi arvestades teststatistikuga kujul:
0 0
0 0
) ( ) (
q p
n p p X
Z
X
.
Hpoteeside kontrollimiseks saame tabeli:
Kui hpoteesides ldkeskmise kohta saime vikese kontrollvalimi korral kasutada Studenti
jaotuse tiendkvantiile, siis sageduse hindamisel seda teha ei saa.
Nide 12.3. Muudatuste tegemiseks tkorralduses ksitleti 120 tlist. Nendest 65 tles
"pooldan muudatusi". Kas olulisusnivool = 0.05 vime vita, et le poolte tlistest
pooldab muudatusi?
Lahendus. Kontrollitav sagedus p
0
= 0,5 ning tahame teada, kas tehtud valim testab vite
p > 0,5. Saame hpoteesid:
H
0
: p 0,5 (las olla nii nagu on)
H
0
: p > 0,5 (enamus pooldab muudatusi)
Suur valim
Hpotees Kehtib hpotees
A
H
0
: p = p
0
H
1
: p p
0
H
0,
kui
2 /
z Z <
H
1
, kui
2 /
z Z
B
H
0
: p p
0
H
1
: p > p
0
H
0,
kui
z Z <
H
1
, kui
z Z
C
H
0
: p p
0
H
1
: p < p
0
H
0,
kui
z Z <
H
1
, kui
z Z
71
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Leiame sageduse valimis: 0.54 =
120
65
= p ning teststatistiku vrtuse
876 , 0
5 , 0 5 , 0
120 ) 5 , 0 54 , 0 ( ) (
0 0
0
q p
n p p
Z
Kuna
65 , 1
05 , 0
z
siis teststatistik Z on viksem tiendkvantiilist ja me jme nullhpo-
teesi juurde - ei saa vita, et enamik toetab muudatusi.
Suhteline sagedus toodud nites
0.54 =
120
65
= p
on siiski kindlalt le poole ning tule-
museks saadud vide, et le poole ei toeta muudatusi on tavainimesele arusaamatu. Milles on
asi?
Vaatame, kuidas valimi suurendamine mjutab vastuvetavat otsust. Vtame esialgse nite
ja oletame, et 120 tlise asemel ksitleti 200 inimest, kusjuures "jah/ei" proportsioon ji
samaks 0,54. Sel juhul teststatistik
1.13 = 200
0.5 0.5
0.5 - 0.54
= z
X
Y
= D vi
X
Y
> D vi
X
Y
< D,
kus D on mingi arvatav erinevuse suurus.
ldkeskmiste oletatava erinevuse vi mitteerinevuse testamiseks pstitame hpoteeside
paarid: A: H
0
:
X
-
Y
= D B: H
0
:
X
-
Y
D C: H
0
:
X
-
Y
D
H
1
:
X
Y
D H
1
:
X
-
Y
> D H
1
:
X
-
Y
< D
Kuna ritame alati testada alternatiivset hpoteesi H
1
, siis viksime nullhpoteesis kirju-
tada ka vrduse H
0
:
X
-
Y
= D kikide hpoteesitpide korral, kuid jme antud juhul siis-
ki laltoodud kuju juurde.
Hpoteeside kontrollimiseks teeme kummastki ldkogumist piisavalt suured sltumatud
valimid
7
suurustega n
1
ja n
2
ning leiame valimikeskmised
X
ja
Y
, mis on juhuslikud
suurused. Vastavalt tsentraalsele piirteoreemile (osa 7.3.1) on piisavalt suurte valimite korral
juhuslikud suurused
X
ja
Y
normaaljaotusega. Toome sisse uue juhusliku suuruse
Y - X W
. Saab nidata, juhuslik suurus W on normaaljaotusega, keskvrtusega
Y X
EW ja standardhlbega
2
2
Y
1
2
X
Y X W
n
+
.
Seega oleme taandanud probleemi ldkeskmiste vahe kohta pstitatud hpoteeside prob-
leemi osas 12.3 ksitletud juhule suure valimimahu korral. Tuginedes sellele vime vahetult
vlja kirjutada:
*7 Valimid on sltumatud, kui nad ei sisalda samu objekte ning objekti valik hte valimisse ei mjusta objek-
ti valimist teise
73
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Hpoteesi kuju
Kehtivuse tingimus
A
H
0
:
X
-
Y
= D
H
1
:
X
-
Y
D
H
0,
kui
2 /
z Z <
H
1
, kui
2 /
z Z
B
H
0
:
X
-
Y
D
H
1
:
X
-
Y
> D
H
0,
kui
z Z <
H
1
, kui
z Z
C
H
0
:
X
-
Y
D
H
1
:
X
-
Y
< D
H
0,
kui
z Z <
H
1
, kui
z Z
Siin
Y X
D ) Y X (
Z
ning
Y X
arvutatakse laltoodud valemi phjal, kui on teada ldko-
gumite standardhlbed vi valemi
2
2
Y
1
2
X
Y X
n
s
n
s
+
abil, kus s
X
ja s
Y
on vastavate valimite
standardhlbed.
Tuletan meelde, et me eeldasime suuri valimeid. Kui kasvi ks valimitest ei ole piisavalt
suur, saame vaadelda vaid juhtu, kus tunnused on normaaljaotusega ja enam-vhem sama
standardhlbega. Muutub uue juhusliku suuruse
Y - X W
standardhlbe arvutamise eeskiri
ja hpoteeside kontrollimisel peame normaaljaotuse asemel kasutama Studenti jaotust. Kuna
ldine lhenemine on osaga 12.3 sarnane, siis toome siinjuures ra vaid lpptulemuse, mille
vormistame alljrgneva tabelina.
Seejuures vikeste valimite korral (eeldusel, et ldkogumid on normaaljaotusega ja enam-
vhem vrdsete dispersioonidega) leiame valimikeskmiste vahe standardhlbe
Y X
, siis
2
2
1
2
) (
n
s
n
s
p p
Y X
+
, kus
2 -
n
+
n
1) -
n
(
s
+ 1) -
n
(
s
=
s
2 1
2
2
Y 1
2
X 2
p
Mrgime siinjuures, et sna sageli huvitab vaid ldkeskmiste omavaheline suhe:
X
=
Y
vi
X
<
Y
vi
X
>
Y
. See on erijuht eelnevast, kus eeldatava erinevuse suurus on vetud
vrdseks nulliga: D = 0. Siin viitame veel hele tihti kasutatavale vitele: juhul kui testa-
takse hpotees H
1
:
X
Y
siis eldakse, et vaadeldavad kogumid (millest tehti valimid) ei
ole vastaval olulisusnivool statistiliselt eristatavad ldkeskmise mttes.
Nide 12.4. Kaalujlgijad tegutsesid kahe eri metoodika jrgi. Poole aasta mdudes hi-
nnati, kas kasutatud metoodikate tulemuses on olulist erinevust. Selleks tehti kummagi me-
toodika jrgi tegutsenud inimeste hulgast valimid (kumbki 60 inimest) ja leiti keskmine kaalu
Suur valim Vike valim
Hpotees
Kehtib hpotees Kehtib hpotees
A
H
0
:
X
-
Y
= D
0
H1:
X
-
Y
D
0
H
0,
kui
2 /
z Z <
H
1
, kui
2 /
z Z
H
0,
kui
f
t Z
, 2 /
<
H
1
, kui
f
t Z
, 2 /
B
H
0
:
X
-
Y
D
0
H
1
:
X
-
Y
> D
0
H
0,
kui
z Z <
H
1
, kui
z Z
H
0,
kui
f
t Z
,
<
H
1
, kui
f
t Z
,
C
H
0
:
X
-
Y
D
0
H
1
:
X
-
Y
< D
0
H
0,
kui
z Z <
H
1
, kui
z Z
H
0,
kui
f
t Z
,
<
H
1
, kui
f
t Z
,
kus
f = min(n
1
1, n
2
1)
ja
Y X
D - ) Y X (
Z
74
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
vhenemine:
X
= 10 kg ja
Y
= 11 kg, kusjuures arvutati ka s
1
= 5 ja s
2
= 6. Kas metoodi-
kates on erinevust?
Lahendus. Pstitame hpoteesid: H
0
:
X
=
Y
H
1
:
X
Y
Arvutame teststatistiku
1 =
60
36
+
60
25
1
=
n
s
+
n
s
)
Y
-
X
(
=
)
Y
-
X
(
= Z
2
2
2
1
2
1
)
X
-
X
(
2 1
Nii olulisusnivool 0,05
( , )
/
z
2
196
kui ka olulisusnivool 0.1
( , )
/
z
2
168
nuavad and-
med nullhpoteesi juurde jmist - ei saa vita erinevuse eksisteerimist kahe metoodika tule-
muste vahel.
12.6 Hpoteesid sageduste vahe kohta
Sageli on praktikas tarvis hinnata suhtelise sageduse (protsendi) muutusi, st. anda hinnang
suhteliste sageduste vahele. Niteks on tavaline, et antakse hinnanguid erakondade poolehoid-
jate protsendi muutumisele, reklaamikampaania mjule jne. Nagu eespool vaatlesime (osa
11.3), on sagedus ldkeskmise erijuht (tunnus omandab vaid vrtusi 0 ja 1) ning phimtte-
liselt saame suurte valimite korral kasutada kiki ldkeskmise kohta toodud hinnanguid.
Arvestades aga tunnuse eripra omandavad nii pstitatavad hpoteesid kui ka kasutatavad
valemid veidi teistsuguse kuju. Laskumata tpsetesse selgitustesse toome siinjuures vaid t-
histused ja protsentide vahe kohta pstitatud hpoteeside kontrollimise koondtabeli.
Olgu antud kaks ldkogumit ning nendes arvutatud tunnuse vrtuse 1 suhtelised
sagedused p
1
ja p
2
. Olgu esimesest ldkogumist tehtud valim suurusega n
1
ning selle phjal
arvutatud suhteline sagedus
1
1
1
n
m
p
; teise valimi korral
2
2
2
n
m
p
. Hpoteeside kontrollimiseks
arvutatakse kahe kogumi hine standardhlve:
)
n
1
n
1
)( p - (1 p s
2 1
p
+
kus
2 1
2 1
n n
m m
p
+
+
.
Hpoteeside kontrollimise tabel kahe kogumi suhteliste sageduste vrdlemisel on:
Hpotees Kehtib hpotees
A
H
0
: p
1
= p
2
H
1
: p
1
p
2
H
0,
kui
2 /
z Z
p
<
H
1
, kui
2 /
z Z
p
B
H
0
: p
1
= p
2
H
1
: p
1
> p
2
H
0,
kui
z Z
p
<
H
1
, kui
z Z
p
C
H
0
: p
1
= p
2
H
1
: p
1
< p
2
H
0,
kui
z Z
p
<
H
1
, kui
z Z
p
kus
p
p
s
p p
Z
2 1
Nide 12.5. Oletame, et enne reklaamikampaaniat oli erakonna Liberaalid pooldajaid 100
ksitletu phjal 20%. Prast kampaaniat oli toetajaid 24%. Kas olulisusnivool 5% vime vi-
ta, et pooldajate arv suurenes?
Lahendus. Tahame nidata, et pooldajate arv suurenes. Seega pstitame hpoteesid:
75
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
H
0
: p
1
= p
2
H
1
: p
1
< p
2
Arvutame: 0,2 p
1
, 24 , 0
2
p , 0,22
200
24 20
p
+
,
0,06 0,01) 0,78(0,01 * 0,22 )
n
1
n
1
)( p - (1 p s
2 1
p
+ +
ning teststatistik Z
p
= (0,2-0,24/0,06) = -0,67.
Olulisusnivoole 0,05 vastab normaaljaotuse tiendkvantiil
1,65 z
0,05
ja kuna -Z
p
=
0,67 < 1,65 siis jme nullhpoteesi juurde.
Seega kuigi silmaga nhtavalt tusis toetajate hulk 4% vrra, ei saa sellest siiski teha
jreldust kampaania edukusest. Probleemseisneb selles, et antud juhul oli 100 ksitletut liiga
vhe usaldusvrseks erinevuse testamiseks.
76
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
13 JAOTUSE LEIDMINE
Senises ksitluses eeldasime, et lesannet lahendama asudes me teame, millise jaotusega
on parajasti vaadeldav juhuslik suurus. Niteks eeldasime, et telefoniarve suurus on normaal-
jaotusega, kosmoselaeva tabanud meteoriitide arv on Poissoni jaotusega jne. Kuidas aga tege-
likkuses teha kindlaks, millise jaotusega on juhuslik suurus? Praktikas on juhuslik suurus an-
tud mingi oma vrtuste hulgaga (niteks valimisse vetud lipilaste telefoniarved). Vib
kohe vita, et ei ole sellist meetodit, mille korral, lhtudes uuritava juhusliku suuruse vr-
tustest, saab vahetult tuletada tema jaotuse. Jb le ks tee pstitada oletus jaotuse kohta,
teha valim ja vaadata, kas meie oletus sobib vi ei. See on tpiline hpoteeside pstitamise
ja kontrollimise skeem.
Teeme seda ja pstitame hpoteesid:
H
0
: F = F
0
(Q)
H
1
: F
F
0
(Q)
kus nullhpoteesiga H
0
tleme, et juhusliku suuruse jaotus F on meie arvates F
0
parameetrite
hulgaga Q. Tehes valimi tahame veenduda, kas valim viib meid alternatiivse hpoteesi F
F
0
(Q) juurde vi ei.
ldjuhul antakse juhusliku suuruse jaotus eeskirjaga (funktsiooniga), mis mrab tema va-
hemikku langemise tenosuse. Nii et praegusel juhul me ei saa piirduda lihtsalt arvude vrd-
lemisega, nagu tegime eespool hpoteeside kontrollimisel, vaid peame vrdlema juhusliku
suuruse vahemikku langemise sagedusi eeldatava jaotuse F
0
(Q) korral vahemikku langemise
sagedustega valimis. Seega omavahel on tarvis vrrelda vrtuste tabeleid. Kui erinevus
nende vahel on kllaltki vike, vib arvata, et nullhpoteesis antud jaotus kirjeldab piisavalt
hsti juhuslikku suurust, igal juhul valim seda ei kummuta.
Kust vtta oletatav jaotuse kuju? Ilmselt mngib siin suurt rolli uurija kogemus, aga samu-
ti vib mtteid suunata ka juhusliku suuruse vrtuste saamise protsessi olemus (viiteid vas-
tavat juhuslikku suurust genereerivale protsessile time iga vaadeldava teoreetilise jaotuse
juures). Iga eeldatav teoreetiline jaotus on seotud mingite parameetrite hulgaga Q, niteks
normaaljaotusel keskvrtus ja standardhlve. Oletatavas jaotuses parameetrite leidmisel vi-
me kasutada valimit, kui meil kusagilt ei ole vtta paremat oletust.
Jaotuse kohta kivate hpoteeside kontrollimiseks on mitmeid meetodeid. Meie vaatleme
siinkohal vaid hte,
2
-statistikul phinevat meetodit (hii-ruut-testi), mis sobib jrelduste te-
gemiseks piisavalt suurte (n 30) valimite phjal.
Kuidas vrrelda vrtuste hulki oletatava vrtuse jrgi arvutatuid valimi phjal leitutega
ja millal vime vita, et erinevus on piisavalt suur alternatiivse hpoteesi vastuvtmiseks.
Siin on olemas tielik sarnasus eelmistes osades vaadeldud hpoteeside pstitamise ja
testamisega tabelite phjal leitav vrtuste erinevus on juhuslik suurus ning kui me teame
tema jaotust, saame vajaliku olulisusnivoo korral leida arvu (tiendkvantiili), mille letamisel
peame vastu vtma alternatiivse hpoteesi.
Selgitame seda tpsemalt. Olgu meil oletatav jaotus F
0
(Q) ja tehtud kontrollvalim. Nende
phjal moodustame sagedustabeli, millesse kanname objektide arvu tunnuse vrtusvahe-
mikes eeldatava jaotuse jrgi ja sageduse kontrollvalimis. Seega vaatleme tabelit:
77
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Vahemik 1: Xx
1
2: x
1
<Xx
2
... j: x
j-1
<Xx
j
... K: x
k-1
<Xx
k
Tenosus F
0
(Q) jrgi
p
1
=P(Xx
1
) p
2
=P(x
1
<Xx
2
) ... p
j
=P(x
j-1
<Xx
j
) ... p
k
=P(x
k-1
<Xx
k
)
Sagedus eeldatava jaotuse
korral: e
i
=p
j
n
e
1
=p
1
n e
2
=p
2
n ... e
i
=p
j
n ... e
k
=p
k
n
Suhteline sagedus valimi
phjal
v
1
=S(Xx
1
) v
2
=S(x
1
<Xx
2
) ... v
j
=S(x
j-1
<Xx
j
) ... v
k
=S(x
k-1
<Xx
k
)
Thistused e
j
ja v
j
vtsime kasutusele, kuna selliselt on nad olemas mitmetes pikutes ja neid
viks tlgendada kui e eeldatav vrtus ja v valimist saadud vrtus.
On selge, et eeldatava ja valimist saadud sageduste vahet isaloomustav summa
k
i i
i i
e
e v
h
1
2
) (
on juhuslik suurus. Oma olemuselt vljendab see just seda, mida soovisime
leida hinnangut tabeli vastavate ridade erinevusele. Saab nidata, et see juhuslik suurus on
nn
2
- jaotusega*
8
, ning teda saab kasutada hpoteeside kontrollimisel teststatistikuna. Selle
olemust me siinjuures selgitama ei hakka.
Thistades nd
2
-jaotuse tiendkvantiili olulisusnivool thega
f ,
h
, vime snastada:
hpoteeside kontrolli tingimused jrgmiselt:
- jme nullhpoteesi H
0
juurde, kui h <
f ,
h
ja
- vtame vastu alternatiivse hpoteesi H
1
, kui h
f ,
h
,
kus
2
-jaotuse tiendkvantiil
f ,
h
n
X x
s
i
i
.
Vimaliku jaotuse kohta idee saamiseks esitame andmed graafikul:
Selle joonise phjal on vga raske ennustada, mis jaotusega on tegemist. Vib teha vaid
he jrelduse - vaadeldava isikute hulga kohta on meie vrtuste (vaadeldavate vanuste) arv
liiga suur. Vhendame seda jaotades vanused rhmadesse (klassidesse) ja leiame kraadikaits-
jate arvu vastavas klassis. Vttes niteks intervalliks he aasta asemel kolm aastat, on tabel
oluliselt selgem:
x
i
23 24 25 26 27 28 29 30 31 32 33 34 35 36 37
v
i
1 1 3 5 4 4 1 3 4 2 3 2 1 2 1 37
v
i
5 13 8 7 4 37
Joonistades nd tabeli phjal graafiku, saame juba jaotuse prognoosimiseks kllaltki sel-
ge pildi:
Vaadates seda graafikut vib oletada, et tegu on normaaljaotusega. Kontrollime seda,
arvestades lalpool leitud valimikeskmist ja valimi standardhlvet. Seega saame kontrollitava
hpoteesidepaari:
H
0
: F = N(29,5; 3,7)
H
1
: F N(29,5; 3,7)
Kuna vastavalt tehtud eeldusele on tegemist normaaljaotusega N(29.5, 3.7), siis saame lei-
da ka arvud e
i
, mis nitavad, kui palju kraadikaitsjaid 37-st ksitletust oleks pidanud jaotu-
sest tulenevalt olema vastavas vanusevahemikus.
0.11 = (-1.21) = )
3.7
29.5 - 25
( = 25) < P(X
0
2
4
6
8
10
12
14
23-25 26-28 29-31 32-34 35-37
vi
0
1
2
3
4
5
6
23 24 25 26 27 28 29 30 31 32 33 34 35 36 37
isikute arv vi
79
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Siin esimese vahemiku vtsime mitte 23-24, vaid llitasime vahemiku koosseisu ka kik
23 aastast nooremad. Samuti tegime ka viimase vahemikuga, vaadeldes teda kui 35 aastat ja
rohkem. Sellega saime vikese ebatpsuse, kuid antud juhul ei ole see oluline. Lbiviidud
arvutuste tulemusena saame tabeli:
x
i
23 24 25 26 27 28 29 30 31 32 33 34 35 36 37
v
i
1 1 3 5 4 4 1 3 4 2 3 2 1 2 1 37
v
i
5 13 8 7 4 37
P(x
i
<X<x
i+1
) 0.11 0.23 0.32 0.23 0.11 1
e
i
=n*p
i
4.07 8.51 11.8 8.51 4.07 36.96
Hpoteeside kontrollimiseks arvutame teststatistiku:
096 , 4 ...
) (
1
2
k
i i
i i
e
e v
h
,
kus k=5 on praegusel juhul vrreldavate vrtuste (klasside) arv.
Valides olulisusnivooks = 0,1 ja arvestades vabadusastmete arvu f = 5-2-1 = 2 saame
2
-
jaotuse tabelist leida tiendkvantiili
f ,
h
vrtuse 605 , 4 h
2 ; 1 , 0
.
Kuna
4,605 =
h
< 4,096 = h
f ,
, siis antud valimi korral on erinevus normaaljaotusest liiga
vike selleks, et nullhpoteesi mber lkata ja me ei saa vita, et andmed ei prineks vas-
tavast normaaljaotusest.
0.23 = 0.13 - (-0.41) = 0.11 - )
3.7
29.5 - 28
( = F(25) - F(28) = 28) < X P(25
0.32 = 0.34 - (0.41) = 0.34 - )
3.7
29.5 - 31
( = F(28) - F(31) = 31) < X P(28
0.11 = 0.89 - 1 = F(34) - 1 = X) P(34
80
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
14 TUNNUSTEVAHELISED SEOSED
14.1 Kahe tunnuse hisjaotus
ldkogumi igal objektil on palju erinevaid tunnuseid. Eelmistes paragrahvides me valisi-
me he tunnuse ja tegelesime selle tunnuse uurimisega - leidsime tema keskmise, standard-
hlbe, jaotuse jms. Sageli on aga vaja uurida kahe vi enama tunnust nende koosmju sei-
sukohalt, niteks: seos keskmise hinde ja palga vahel prast likooli lpetamist, seos inimese
iseloomutbi ja laste arvu vahel, seos reklaamikampaania maksumuse ja valituks osutunud
saadikute arvu vahel jne.
Allpool piirdume vaid kahe tunnuse vaheliste seoste uurimisega.
Kigepealt kirjeldame lahendatavat lesannet matemaatiliselt. Olgu vetud vaatluse alla
kaks tunnust X ja Y oma vimalike vrtustega X = {x
1
, x
2
, ..., x
n
} ja Y = {y
1
, y
2
, ..., y
m
}.
Tunnuste X ja Y hissagedustabeliks nimetame tabelit, mis iga vrtuste paari (x
i
, y
j
) korral
nitab selle esinemissagedust p
ij
vaadeldavas kogumis:
Y/ X x
1
x
2
... x
n
y
1
p
11
p
12
... p
1n
y
2
p
21
p
22
... p
2n
... ... ... ... ...
y
m
p
m1
p
m2
... p
mn
Kogumiks on kas ldkogum vi valim. Viimasel juhul tahame kik valimi phjal tehtud
jreldused kanda le ldkogumile.
Kahe tunnuse vahelise seose uurimisel huvitavad meid eelkige jrgmised ksimused:
1) kas kahe tunnuse vahel on olemas seos,
2) kuidas vljendada seose tugevust arvuliselt,
3) kuidas prognoosida he tunnuse vrtusi teise tunnuse phjal.
Otsime nendele ksimustele vastuseid allpool, kasutades enamasti ra eespool saadud tule-
musi.
14.2
2
- test sltuvuse avastamiseks
Olgu vaatluse all kaks tunnust, mille kohta tahame kindlaks teha, kas nende vahel on
olemas mingi statistiline sltuvus. Niteks, kas on olemas sltuvus lipilaste materiaalse
olukorra ja ppeedukuse vahel, kas on olemas sltuvus firma edukuse ja juhtkonna haridus-
taseme vahel, jne. Kuna tunnuste uurimisel lhtume hisest sagedustabelist, siis ei ole oluline,
kas tegemist on arvuliste vi mittearvuliste tunnustega. Pideva tunnuse korral moodustame
vrtusklassid ja vaatleme sagedusi vastavates vrtusklassides.
Eespool kasutasime
2
- testi he tunnuse jaotuse kindlaks tegemisel, kus vrdlesime va-
limi vrtuste esinemissagedusi nendega, mis oleks pidanud olema tulenevalt eeldatavast teo-
reetilisest jaotusest. Kahe tunnuse vahelise sltuvuse kindlaks tegemine on tegelikult sarnane
lesanne: vrreldakse valimi phjal leitud sagedusi teoreetiliste sagedustega. Teoreetilised
sagedused leitakse eeldusel, et tunnuste vahel seost ei ole (seose puudumise korral on tegu
htlase jaotusega, kus iga paari esinemissagedus on proportsionaalne vastavate vrtustega
objektide esinemisega valimis).
81
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Seega pstitame hpoteesid:
H
0
: tunnuste vahel ei ole seost (nad on sltumatud)
H1 : tunnuste vahel on seos (nad on sltuvad)
Hpoteeside kontrollimiseks kasutatakse
2
- jaotusel phinevat h-statistikut, mis vaadel-
daval juhul avaldub kujul:
e
)
e
-
v
(
= h
j i,
2
j i, j i,
j i,
. Valime olulisusni-
voo =0,05, millele vastab tiendkvantiil
12,6 h
6 0,05,
. Seega
6 0,05,
h h >
ja peame vastu vt-
ma alternatiivse hpoteesi: antud andmete phjal on olemas seos sissetuleku ja elukoha vahel.
See oli sltuvuse avastamise test, kui on tarvis leida ka sltuvuse arvulist suurust ja
suunda, kasutatakse korrelatsioonanalsi.
82
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
14.3 Korrelatiivne sltuvus
Eespool vaatlesime,
2
- testi seose (sltuvuse) avastamiseks kahe tunnuse vahel.
Seose leidmiseks vaatlesime tunnuste vrtuste kikvimalikke paare ja nende koosesinemise
sagedusi. lesande sellises ksitluses ei hirinud meid asjaolu, et mlemad tunnused visid
omandada mittearvulisi vrtusi. Lbiviidud analsi tulemusena vtsime vastu alternatiivse
hpoteesi sltuvad vi siis jime nullhpoteesi "sltumatud" juurde. Kuigi varieerides olu-
lisusnivooga vime kaudselt hinnata ka sltuvuse tugevust, on arvuliste tunnuste korral vi-
malik tuletada ka tpsemaid, sealhulgas arvulisi hinnanguid sltuvuse tugevusele.
14.3.1 Lineaarse korrelatsiooni kordaja
Tunnuste vahelise sltuvuse arvulise suuruse mramiseks on mitmeid meetodeid.
heks enimkasutatavaks on Pearsoni lineaarse korrelatsiooni kordaja, millel on ka korrektne
tenosusteoreetiline tagamaa". Selle kordaja arvutamiseeskirja oskame tuletada ka oma se-
niste teadmiste phjal. Asjast huvitatute tarbeks on see peenemas kirjas toodud mittekohus-
tusliku osana.
Olgu antud juhuslikud suurused X ja Y. Kui X ja Y on teineteisest sltumatud, siis nitasime eespool, et nen-
de summa dispersioon vrdub dispersioonide summaga: D(X+Y) = DX + DY.
Kui juhuslikud suurused on teineteisest sltuvad, siis saame:
D(X+Y) = E(X+Y - E(X+Y))
2
=E((X-EX)+ (Y-EY))
2
=
=E(X-EX)
2
+2E((X-EX)(Y-EY))+E(X-EX)
2
=
=DX + DY + 2 E((X-EX)(Y-EY))
Liiget E((X-EX)(Y-EY)) nimetatakse kovariatsiooniks ja kirjutatakse
cov(XY) = E((X-EX)(Y-EY))
Juhuslike suuruste X ja Y kovariatsioonil on jrgmised omadused:
1. Kui juhuslikud suurused X ja Y on sltumatud, siis cov(X,Y) = 0.
Tepoolest: cov (X,Y) = E((X-EX)(Y-EY))= E(XY-YEX - XEY + EX EY =EXY-EYEX -E XEY + EX EY = 0
2. Kui suurused X ja Y on lineaarses sltuvuses, st Y=aX+b, siis
cov( ) XY DX DY
.
Tepoolest, kuna EY = aEX + b, siis Y-EY = aX + b - aEX -b = a(X-EX) ning cov (X,Y) = aE(X-EX)
2
= a
DX, ja teiselt poolt DY = D(aX +b) = a
2
DX kust saame
DX
DY
a , mille asendamine valemisse cov
(X,Y) =a DX annab tulemuseks
DY DX = Y) cov(X,
Kovariatsiooni vrtus vib olla nii positiivne kui ka negatiivne. Lhtudes kovariatsiooni definitsioonist ne-
me, et positiivse kovariatsiooni korral on prevaleerivad muutujate samasuunalised muutused, negatiivse korral
aga erisuunalised (he suuruse kasvamisele vastab teise kahanemine).
Silmas pidades nii kovariatsiooni definitsiooni kui ka omadusi vib kovariatsiooni vaadelda sltuvuse m-
duna juhuslike suuruste X ja Y vahel, mis omandab vrtuse 0 sltumatuse korral kuni
DY * DX t
lineaarse
sltuvuse korral.
Sltuvuse mthikuna ei kasutata aga kovariatsiooni otseselt, vaid ta normeeritakse vrtusega
DY * DX
ning saadud nitajat
DY DX
EY Y EX X E
DY DX
Y X
Y X r
)) )( (( ) , cov(
) , (
(14.1)
83
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
nimetatakse korrelatsioonikordajaks.
Arvestades kovariatsiooni omadusi vime vita: korrelatsioonikordaja nitab juhuslike suuruste X ja Y vahelist
lineaarset sltuvust ning muutub vahemikus [-1, -1].
Vaatleme objektide kogumit, millel on mdetud kahe tunnuse vrtused. Tunnuste vas-
tavate vrtuste koos esinemise vib vlja kirjutada kas lalpool toodud viisil hissagedusta-
belina vi lihtsalt vastavate paaride jadana (koos kordustega):
X x
1
x
2
.... x
n
Y y
1
y
2
.... y
n
Tunnuseid vaadeldakse juhuslike suurustena, kusjuures tunnused vivad olla teineteisest
sltuvad. Sltuvuse tugevuse hindamiseks vib kohaldada lalpool tuletatud lineaarse kor-
relatsioonikordaja valemit (14.1) Thistades
X = EX
ja
Y = EY
ning arvestades, et vaadelda-
vas paaride hulgas on iga paari kogumis esinemise tenosus p(x
i
, y
i
) = 1/n, saab korrela-
tsiooni arvutamiseks valemi kirjutada kujul:
) Y - y ( ) X -
x
(
) Y - y )( X -
x
(
= Y) r(X,
2
i
n
=1 i
2
i
n
=1 i
i
i
n
=1 i
(14.2)
Suurust r(X,Y) nimetatakse lineaarse korrelatsiooni kordajaks ehk Pearsoni korrelatsiooni-
kordajaks. Lineaarse korrelatsiooni kordaja hindab tunnustevahelise lineaarse seose tugevust
ja suunda. Lineaarse seose korral kirjutatakse tunnuste vaheline seos lineaarse vrrandiga
kujul Y=aX+b, kus a ja b on arvulised konstandid, mille leidmist vaatleme punktis 14.4.
Tulenevalt korrelatsioonikordaja leidmisel lhtealuseks olevast valemist (14.1), vib kor-
relatsioonikordaja omandada vaid vrtusi vahemikust [-1 , 1], kus negatiivsed vrtused ni-
tavad prdvrdelise seose olemasolu, positiivsed vrtused aga vrdelise sltuvuse olemas-
olu. Vrtus r(X,Y)= 0 nitab lineaarse sltuvuse puudumist.
Kui me korrelatsioonikordaja leidmisel vtame aluseks ldkogumi, siis nitab valemi
(14.2) jrgi arvutatud korrelatsioonikordaja lineaarse korrelatsiooni suurust kahe selle ldko-
gumi tunnuse vahel. Enamasti on aga ldkogum tema terviklikuks ksitlemiseks liiga suur ja
nagu ikka, kasutame valimit. Valimi phjal arvutatud korrelatsioonikordaja on ldkogumi
korrelatsioonikordaja hinnanguks. Nagu kikide teiste ldkogumi parameetrite hindamise
korral, nii ka vaadeldaval juhul, saab anda hinnangu saadud tulemuse tpsusele, st saab leida
tenosuse P(|r-|<)=1-
kus thistab ldkogumi korrelatsioonikordajat ja r valimi phjal leitud korrelatsiooni-
kordajat.
Sageli ei taheta teada mitte korrelatsioonikordaja suurust, vaid hinnata kas lineaarse kor-
relatsioonisltuvuse on olemas ja mrata tema suund. Sel juhul pstitatakse hpoteesid:
A. H
0
:=0 ei ole korrelatiivset sltuvust
H
1
: 0 on korrelatiivne sltuvus
B. H
0
:0 ei ole positiivset korrelatiivset sltuvust
H
1
: >0 on positiivne korrelatiivne sltuvus
84
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
C. H
0
:0 ei ole negatiivset korrelatiivset sltuvust
H
1
: <0 on negatiivne korrelatiivne sltuvus
Pstitatud hpoteeside kontrollimisel kasutatakse erilist nn. Fischeri jaotust. Kesolevas
kursuses ei ole aga mtet sisse tuua veel hte jaotuse tabelit, kuna praktikas abistab selliste
hpoteeside kontrollimisel ikkagi vastav statistika tarkvarapakett, mis leiab olulisuste-
nosuse, mille korral lugeda testatuks alternatiivne hpotees.
Lineaarne korrelatsioonikordaja ei ole "kikvimas" vahend seose tugevuse mramiseks.
Alati tuleb silmas pidada, et ta on vaid lineaarse seose nitaja ja ta vib anda seose puudu-
mise, kuigi tunnuste vahel on mingi teise funktsiooniga avaldatav seos vi on andmekogumil
mingi raskesti arvestatav eripra (niteks objektid ldkogumis on jaotunud mitmesse rhma).
Toome allpool nite, kus lineaarne korrelatsioonikordaja ei kirjelda tunnustevahelist seost
adekvaatselt.
Nide 14.2.*
9
Olgu katsealustel hiirtel mdetud pikkus ja kaal antud tabelina:
Kaal 11 10 10,6 9,8 10,2 11,5 15,9 10,2 11,6 10,6 12,1 11,1 10,5
Pikkus 22 25 23 20 20 28 36 23 22 25 25 22 21
Arvutades selle phjal korrelatsioonikordaja saame r(X,Y) = 0,87 ning vime vita, et pik-
kus ja kaal on positiivselt kllaltki hsti koreleerunud.
Vaatleme esitatud andmeid graafikul:
0
10
20
30
40
0 5 10 15 20
Kaal
P
i
k
k
u
s
Neme, et vrreldes teistega on ks hiir oma pikkuse ja kaalu poolest erandlik. Ilmselt m-
justab ta ka korrelatsioonikordaja ldhinnangut tugevasti. Jtame selle hiire (15,9; 36) oma
valimist vlja ja arvutame lejnute korral korrelatsioonikordaja. Seega vaatleme tabelit:
Kaal 11 10 10,6 9,8 10,2 11,5 10,2 11,6 10,6 12,1 11,1 10,5
Pikkus 22 25 23 20 20 28 23 22 25 25 22 21
Arvutades nd korrelatsioonikordaja saame r(X,Y)= 0,47. Seega meie seose tugevus
vhenes tunduvalt.
Veelgi ilmekama nite vime tuua, kui eeldama tunnustevahelist mittelineaarset seost
(niteks ruutseost Y=aX
2
+b). Kuigi sel juhul on tunnuste vahel seos olemas, nitab Pearsoni
korrelatsioonikordaja seose puudumist ja seda igusega lineaarset seost ju ei ole.
*9 Nide on vetud raamatust A-M. Parring, M.Vhi, E.Krik. Statistilise andmettluse algpetus. Tartu
likooli Kirjastus, 1997
85
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
14.3.2 Spearmani korrelatsioonikordaja
Krvuti lineaarse korrelatsioonikordajaga kasutatakse veel mitmeid teisi korrelatsiooni-
kordajaid: Spearmani, Kendalli jpt. Allpool vaatlema Spermani korrelatsioonikordajat e.
astakkorrelatsioonikordajat.
Spermani korrelatsioonikordaja korral vetakse otseste mtmistulemuste asemel
kasutusele astakud. Astak on mdetava tunnuse jrjekorranumber vastava mtmistulemuse
jrjestatud reas. See vhendab erindite osakaalu kskik kui suur on ka erindi vastava tun-
nuse vrtus, Spermani korrelatsioonikordaja arvutamises suureneb ta eelmisega vrreldes
vaid he vrra.
Nide 14.3. Vaatleme veelkord hiirte uurimise nidet 14.2 ja leiame tema astakkorrelatsiooni
kordaja.
Arvutuste tulemused koondame tabelisse:
Jrk Kaal Pikkus
Kaalu
astak
Pikkuse
astak
1 11 22 4 3
2 10 25 2 5
3 10,6 23 5 4
4 9,8 20 1 1
5 10,2 20 3 1
6 11,5 28 7 6
7 15,9 36 10 7
8 10,2 23 3 4
9 11,6 22 8 3
10 10,6 25 5 5
11 12,1 25 9 5
12 11,1 22 6 3
13 10,5 21 4 2
Lineaarne korrelatsioonikordaja astakute vahel on r(X,Y) = 0,62.
Kui mtmistulemused on kik erinevad, saab lineaarse korrelatsiooni kordaja arvutamist
lihtsustada ja Spearmani korrelatsioonikordaja leida valemist:
) 1 (
)) ( ) ( 6
1 ) , (
2
2
n n
y astak - x (astak
= Y X r
i i
n
=1 i
S
Vaadeldava nite korral saame tulemuseks r
s
(X,Y) = 0,78.
Nagu nha, on saadud tulemused laltoodud lihtsa nite korral erinevad. Vrreldes
lineaarse korrelatsioonikordaja ja Spearmani korrelatsioonikordaja olemust peame meeles:
kui lineaarne korrelatsioonikordaja mdab tunnuste vahelise lineaarse seose tugevust, siis
Spearmani korrelatsioonikordaja mdab tunnuste vahelise monotoonse seose tugevust.
Nagu mainitud, on tunnustevahelise korrelatsiooni kordajaid palju. Millist neist valida,
sltub uuritavate andmete sisulisest analsist. Sageli aitab sellele kaasa graafiline pilt, mis
nitab andmetekogumi struktuurilist iserasust.
86
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
LISAD
Standardiseeritud normaaljaotuse tabel
x 0 1 2 3 4 5 6 7 8 9
-3,0 0,0013 0,0013 0,0013 0,0012 0,0012 0,0011 0,0011 0,0011 0,0010 0,0010
-2,9 0,0019 0,0018 0,0018 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014
-2,8 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019
-2,7 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026
-2,6 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036
-2,5 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048
-2,4 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064
-2,3 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084
-2,2 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,0110
-2,1 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143
-2,0 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183
-1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233
-1,8 0,0359 0,0351 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294
-1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367
-1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455
-1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559
-1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681
-1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823
-1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985
-1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170
-1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379
-0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611
-0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867
-0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148
-0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451
-0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776
-0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121
-0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483
-0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859
-0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4,0
0,9987 0,9990 0,9993 0,9995 0,9997 0,9998 0,9998 0,9999 0,9999 1,0000 1,0000
Normaaljaotusega juhusliku suuruse
X~N(0, 1) jaotusfunktsiooni vrtused
-
3
,
0
-
2
, 5
-
2
, 0
-
1
,
5
-
1
, 0
-
0
, 5
0
, 0
0
, 5
1
, 0
1
, 5
2
, 0
2
, 5
3
, 0
(x)
x
87
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Studenti jaotuse tiendkvantiilide tabel
0,2 0,15 0,1 0,05 0,025 0,02 0,01 0,005
1 1,963 1,963 3,078 6,314 12,706 15,894 31,821 63,656
2 1,061 1,386 1,886 2,920 4,303 4,849 6,965 9,925
3 0,978 1,250 1,638 2,353 3,182 3,482 4,541 5,841
4 0,941 1,190 1,533 2,132 2,776 2,999 3,747 4,604
5 0,920 1,156 1,476 2,015 2,571 2,757 3,365 4,032
6 0,906 1,134 1,440 1,943 2,447 2,612 3,143 3,707
7 0,896 1,119 1,415 1,895 2,365 2,517 2,998 3,499
8 0,889 1,108 1,397 1,860 2,306 2,449 2,896 3,355
9 0,883 1,100 1,383 1,833 2,262 2,398 2,821 3,250
10 0,879 1,093 1,372 1,812 2,228 2,359 2,764 3,169
11 0,876 1,088 1,363 1,796 2,201 2,328 2,718 3,106
12 0,873 1,083 1,356 1,782 2,179 2,303 2,681 3,055
13 0,870 1,079 1,350 1,771 2,160 2,282 2,650 3,012
14 0,868 1,076 1,345 1,761 2,145 2,264 2,624 2,977
15 0,866 1,074 1,341 1,753 2,131 2,249 2,602 2,947
16 0,865 1,071 1,337 1,746 2,120 2,235 2,583 2,921
17 0,863 1,069 1,333 1,740 2,110 2,224 2,567 2,898
18 0,862 1,067 1,330 1,734 2,101 2,214 2,552 2,878
19 0,861 1,066 1,328 1,729 2,093 2,205 2,539 2,861
20 0,860 1,064 1,325 1,725 2,086 2,197 2,528 2,845
21 0,859 1,063 1,323 1,721 2,080 2,189 2,518 2,831
22 0,858 1,061 1,321 1,717 2,074 2,183 2,508 2,819
23 0,858 1,060 1,319 1,714 2,069 2,177 2,500 2,807
24 0,857 1,059 1,318 1,711 2,064 2,172 2,492 2,797
25 0,856 1,058 1,316 1,708 2,060 2,167 2,485 2,787
26 0,856 1,058 1,315 1,706 2,056 2,162 2,479 2,779
27 0,855 1,057 1,314 1,703 2,052 2,158 2,473 2,771
28 0,855 1,056 1,313 1,701 2,048 2,154 2,467 2,763
29 0,854 1,055 1,311 1,699 2,045 2,150 2,462 2,756
30 0,854 1,055 1,310 1,697 2,042 2,147 2,457 2,750
31 0,853 1,054 1,309 1,696 2,040 2,144 2,453 2,744
32 0,853 1,054 1,309 1,694 2,037 2,141 2,449 2,738
33 0,853 1,053 1,308 1,692 2,035 2,138 2,445 2,733
34 0,852 1,052 1,307 1,691 2,032 2,136 2,441 2,728
35 0,852 1,052 1,306 1,690 2,030 2,133 2,438 2,724
36 0,852 1,052 1,306 1,688 2,028 2,131 2,434 2,719
37 0,851 1,051 1,305 1,687 2,026 2,129 2,431 2,715
38 0,851 1,051 1,304 1,686 2,024 2,127 2,429 2,712
39 0,851 1,050 1,304 1,685 2,023 2,125 2,426 2,708
40 0,851 1,050 1,303 1,684 2,021 2,123 2,423 2,704
41 0,850 1,050 1,303 1,683 2,020 2,121 2,421 2,701
42 0,850 1,049 1,302 1,682 2,018 2,120 2,418 2,698
43 0,850 1,049 1,302 1,681 2,017 2,118 2,416 2,695
44 0,850 1,049 1,301 1,680 2,015 2,116 2,414 2,692
45 0,850 1,049 1,301 1,679 2,014 2,115 2,412 2,690
46 0,850 1,048 1,300 1,679 2,013 2,114 2,410 2,687
47 0,849 1,048 1,300 1,678 2,012 2,112 2,408 2,685
48 0,849 1,048 1,299 1,677 2,011 2,111 2,407 2,682
49 0,849 1,048 1,299 1,677 2,010 2,110 2,405 2,680
50 0,849 1,047 1,299 1,676 2,009 2,109 2,403 2,678
51 0,849 1,047 1,298 1,675 2,008 2,108 2,402 2,676
52 0,849 1,047 1,298 1,675 2,007 2,107 2,400 2,674
53 0,848 1,047 1,298 1,674 2,006 2,106 2,399 2,672
54 0,848 1,046 1,297 1,674 2,005 2,105 2,397 2,670
55 0,848 1,046 1,297 1,673 2,004 2,104 2,396 2,668
56 0,848 1,046 1,297 1,673 2,003 2,103 2,395 2,667
57 0,848 1,046 1,297 1,672 2,002 2,102 2,394 2,665
58 0,848 1,046 1,296 1,672 2,002 2,101 2,392 2,663
59 0,848 1,046 1,296 1,671 2,001 2,100 2,391 2,662
60 0,848 1,045 1,296 1,671 2,000 2,099 2,390 2,660
>60 0,842 1,036 1,282 1,645 1,960 2,054 2,326 2,576
indeks (a vi a/2)
f
t-jaotuse tiendkvantiilid
88
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
2
- jaotuse tiendkvantiilide tabel
f \ tn 0.99 0.975 0.95 0.9 0.1 0.05 0.025 0.01 0.005
1 0.00 0.00 0.00 0.02 2.71 3.84 5.02 6.63 7.88
2 0.02 0.05 0.10 0.21 4.61 5.99 7.38 9.21 10.60
3 0.11 0.22 0.35 0.58 6.25 7.81 9.35 11.34 12.84
4 0.30 0.48 0.71 1.06 7.78 9.49 11.14 13.28 14.86
5 0.55 0.83 1.15 1.61 9.24 11.07 12.83 15.09 16.75
6 0.87 1.24 1.64 2.20 10.64 12.59 14.45 16.81 18.55
7 1.24 1.69 2.17 2.83 12.02 14.07 16.01 18.48 20.28
8 1.65 2.18 2.73 3.49 13.36 15.51 17.53 20.09 21.95
9 2.09 2.70 3.33 4.17 14.68 16.92 19.02 21.67 23.59
10 2.56 3.25 3.94 4.87 15.99 18.31 20.48 23.21 25.19
11 3.05 3.82 4.57 5.58 17.28 19.68 21.92 24.73 26.76
12 3.57 4.40 5.23 6.30 18.55 21.03 23.34 26.22 28.30
13 4.11 5.01 5.89 7.04 19.81 22.36 24.74 27.69 29.82
14 4.66 5.63 6.57 7.79 21.06 23.68 26.12 29.14 31.32
15 5.23 6.26 7.26 8.55 22.31 25.00 27.49 30.58 32.80
16 5.81 6.91 7.96 9.31 23.54 26.30 28.85 32.00 34.27
17 6.41 7.56 8.67 10.09 24.77 27.59 30.19 33.41 35.72
18 7.01 8.23 9.39 10.86 25.99 28.87 31.53 34.81 37.16
19 7.63 8.91 10.12 11.65 27.20 30.14 32.85 36.19 38.58
20 8.26 9.59 10.85 12.44 28.41 31.41 34.17 37.57 40.00
21 8.90 10.28 11.59 13.24 29.62 32.67 35.48 38.93 41.40
22 9.54 10.98 12.34 14.04 30.81 33.92 36.78 40.29 42.80
23 10.20 11.69 13.09 14.85 32.01 35.17 38.08 41.64 44.18
24 10.86 12.40 13.85 15.66 33.20 36.42 39.36 42.98 45.56
25 11.52 13.12 14.61 16.47 34.38 37.65 40.65 44.31 46.93
26 12.20 13.84 15.38 17.29 35.56 38.89 41.92 45.64 48.29
27 12.88 14.57 16.15 18.11 36.74 40.11 43.19 46.96 49.65
28 13.56 15.31 16.93 18.94 37.92 41.34 44.46 48.28 50.99
29 14.26 16.05 17.71 19.77 39.09 42.56 45.72 49.59 52.34
30 14.95 16.79 18.49 20.60 40.26 43.77 46.98 50.89 53.67
40 22.16 24.43 26.51 29.05 51.81 55.76 59.34 63.69 66.77
50 29.71 32.36 34.76 37.69 63.17 67.50 71.42 76.15 79.49
60 37.48 40.48 43.19 46.46 74.40 79.08 83.30 88.38 91.95
70 45.44 48.76 51.74 55.33 85.53 90.53 95.02 100.43 104.21
80 53.54 57.15 60.39 64.28 96.58 101.88 106.63 112.33 116.32
90 61.75 65.65 69.13 73.29 107.57 113.15 118.14 124.12 128.30
100 70.06 74.22 77.93 82.36 118.50 124.34 129.56 135.81 140.17
89
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Valemite koondtabel
A. ldised teadmised
1. Kombinatsioonid:
)! ( !
!
m n m
n
n
m
m
n
C
,
_
2. Ruutvrrandi: ax
2
+bx+c=0 lahend
a
ac b b
x
2
4
2
t
0 0
! !
1
k
k
k
e
k
e
k
;
4. Kahaneva geomeetrilise jada summa
q
a
S
1
0
, kus a
0
esimene liige ja q tegur
B. Sndmus ja tema tenosus
1. p(A)=
n
k
;
k
n
k
n
k
n
C
C C
A p
2
2
1
1
) (
, kus A on sndmus, et n-elemendilisest hulgast, mis sisaldab n
1
ht liiki ja n
2
teist liiki elementi (n
1
+n
2
=n), valitakse k elementi, milles on antud jaotus
elementide liikide jrgi: k
1
esimest ja k
2
teist liiki elementi (k
1
+ k
2
=k).
2. ) ( 1 ) ( A p A p .
3. Sndmuste summa tenosus: p(AUB)=p(A)+p(B)-p(AB) ja korrutise tenosus: p(AB)=
p(A|B)p(B). Kui sndmused A ja B on sltumatud, siis p(A|B)=p(A).
4. Tistenosus: )) H | P(A ) (P(H P(A)
i
n
1 i
i
)) H | P(A ) (P(H
) H | P(A ) P(H
A) | P(H
i
n
1 i
i
k k
k
C. Juhuslik suurus
1.
X x
i i
i
) p(x x EX
; DX = E(X-EX)
2
;
i
i
2
i
) p(x ) x (EX DX
; DX = EX
2
- (EX)
2
).
2.
xf(x)dx EX ; dx f(x) x) (EX DX
2
3. F(x)=P(Xx); P(a<Xb)=F(b)-F(a)
4.
k n k k
n
p) (1 p C k) P(n,
,
5.
e
k!
= P(k)
-
k
, EX = ; DX =
6.
e
k!
) (np
p) B(n,
np -
k
7. :
e
2
2
2
) (x
2
1
(x)
; EX = ja DX =
2
; F(x)=((x-)/)
8.
e
2npq
np) (k
n
2
npq 2
1
(k) P
,
_
,
_
npq
np k
npq
np k
) k ; (k P
1 2
2 1
n
.
90
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
D. Statistilised hinnangud
1. ldkogum: x
N
1
=
i
N
1 = i
; ) -
x
(
N
1
=
i
2
N
1 = i
2
2. Valim: x
n
1
= X
i
n
1 = i
) X -
x
(
1 - n
1
=
s
i
2
n
1 = i
2
= X E
n
s
n
=
X
3. ldkeskmise usalduspiiride leidmine
Tunnuse jaotus
Normaaljaotus Teadmata
Suur
valim
n60
teada
n
z
+ X < <
n
z
- X
/2 /2
ei ole
teada
n
s
z
+ X < <
n
s
z
- X
/2 /2
Vike
valim
n<60
teada
n
z
+ X < <
n
z
- X
/2 /2
ei ole
teada
n
s
t + X < <
n
s
t - X
n n
1 , 2 / 1 , 2 /
Ei ksitle antud
kursuses
- ldkogumi
standardhlve
s valimi standard-
hlve
2 /
z -normaal-
jaotuse tiendkvantiil
f
t
, 2 /
- Studenti
jaotuse tiendkvantiil
1- usaldusnivoo,
olulisusnivoo
Valimi maht:
2
2 /
,
_
z
n vi
2
,
_
s *
z
= n
/2
4. ldkeskmiste vahe usalduspiirid :
Tunnuse jaotus
Normaaljaotus Teadmata
Suur valim
n1,n2 60
1 ja 2
on teada
1 ja 2
ei ole
teada
Vike
valim
n1,n2 <60
1 ja 2
ei ole
teada
Ei saa lei-
da
1
ja
2
- ldkogumite
standardhlbed
s
1
ja s
2
valimite standardhl-
bed
2 /
z -normaaljaotuse tiend-
kvantiil
f
t
, 2 /
- Studenti jaotuse
tiendkvantiil
f=n1+n2-2
3 : 3 / 1
2
1
2
2
s s
2
) 1 ( ) 1 (
2 1
2
2 2
2
1 1
+
+
n n
s n s n
s
p
2
2
2
1
2
1
2
2 1
) (
2 1
n n
z X X I
+ t
2
2
2
1
2
1
2
2 1
) (
2 1
n
s
n
s
z X X I + t
2 1
;
2
2 1
1 1
) (
2 1
n n
s t X X I
p
f
+ t
91
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
6. Sageduse vahemikhinnang:
n
q p
z + p < p <
n
q p
z - p
/2 /2
ja valimi maht
2
2
/2
z
n
q p *
=
E. Hpoteesid
1. ldkeskmise kohta pstitatud hpoteeside kontrollimine:
Suur valim Vike valim
Hpotees Kehtib hpotees Kehtib hpotees
A
H
0
: =
0
H
1
:
0
H
0,
kui
2 /
z Z <
H
1
, kui
2 /
z Z
H
0,
kui
1 , 2 /
<
n
t Z
H
1
, kui
1 , 2 /
n
t Z
B
H
0
:
0
H
1
: >
0
H
0,
kui
z Z <
H
1
, kui
z Z
H
0,
kui
1 ,
<
n
t Z
H
1
, kui
1 ,
n
t Z
C
H
0
:
0
H
1
: <
0
H
0,
kui
z Z <
H
1
, kui
z Z
H
0,
kui
1 ,
<
n
t Z
H
1
, kui
1 ,
n
t Z
kus
X
X
Z
n
X
vi
n
s
X
z - normaaljaotuse tiendkvantiil
t - Studenti jaotuse tiendkvantiil
1- -usaldusnivoo
2. Hpoteesid ldkeskmiste erinevuse kohta
Suur valim Vike valim
Hpotees Kehtib hpotees Kehtib hpotees
A
H
0
:
X
-
Y
= D
0
H
1
:
X
-
Y
D
0
H
0,
kui
2 /
z Z <
H
1
, kui
2 /
z Z
H
0,
kui
f
t Z
, 2 /
H
1
, kui
f
t Z
, 2 /
>
B
H
0
:
X
-
Y
D
0
H
1
:
X
-
Y
>D
0
H
0,
kui
z Z <
H
1
, kui
z Z
H
0,
kui
f
t Z
,
H
1
, kui
f
t Z
,
>
C
H
0
:
X
-
Y
D
0
H
1
:
X
-
Y
<D
0
H
0,
kui
z Z <
H
1
, kui
z Z
H
0,
kui
f
t Z
,
<
H
1
, kui
f
t Z
,
kus f = n
1
+ n
2
2
) Y X (
0
D ) Y X (
Z
z - normaaljaotuse tiendkvantiil
t - Studenti jaotuse tiendkvantiil
1- -usaldusnivoo
Valimikeskmiste vahe standardhlve arvutatakse:
a) kui on teada ldkogumite standardhlbed
X
ja
Y,
siis
2
2
Y
1
2
X
) Y X (
n
92
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
c) kui valimid on vikesed, ldkogumid normaaljaotusega, enam-vhem vrdsed disper-
sioonid, siis
2
2
p
1
2
p
) Y X (
n
s
n
s
+
, kus
2 -
n
+
n
1) -
n
( s + 1) -
n
( s
=
s
2 1
2
2
Y 1
2
X 2
p
3. Hpoteesid sageduse kohta:
Suur valim
Hpotees Kehtib hpotees
A
H
0
: p=p
0
H
1
: pp
0
H
0,
kui
2 /
z Z <
H
1
, kui
2 /
z Z
B
H
0
: pp
0
H
1
: p>p
0
H
0,
kui
z Z <
H
1
, kui
z Z
C
H
0
: pp
0
H
1
: p<p
0
H
0,
kui
z Z <
H
1
, kui
z Z
kus
0 0
0
q p
n ) p p (
Z
z - normaaljaotuse tiendkvantiil
1- -usaldusnivoo
4. Hpoteesid sageduste erinevuse kohta
Hpotees Kehtib hpotees
A
H
0
: p
1
=p
2
H
1
: p
1
p
2
H
0,
kui
2 /
z Z
p
<
H
1
, kui
2 /
z Z
p
B
H
0
: p
1
p
2
H
1
: p
1
>p
2
H
0,
kui
z Z
p
<
H
1
, kui
z Z
p
C
H
0
: p
1
p
2
H
1
: p
1
<p
2
H
0,
kui
z Z
p
<
H
1
, kui
z Z
p
kus
p
2 1
p
s
p p
Z
)
n
1
n
1
)( p (1 p s
2 1
p
+
2 1
2 1
n n
m m
p
+
+
1
1
1
n
m
p
ja
2
2
2
n
m
p
6. Hpoteesid seose olemasolu kohta
93
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Hpoteesid Kehtib hpo-
tees
H
0
: seos puudub
H
1
: on seos
H
0,
kui
f
h h
,
<
H
1
, kui
f
h h
,
v
ij
-vaatlusest tulenev suhteline
sagedus
eij eeldusest tulenev suhteline
sagedus
f = (ridade arv-1)*(veergude arv -1)
7. Hpoteesid jaotuse kontrollimiseks
Hpoteesid Kehtib hpotees
H
0
: F=F
0
H
1
: F
F
0
H
0,
kui
f
h h
,
<
H
1
, kui
f
h h
,
v
ij
-vaatlusest tulenev suhteline
sagedus
eij eeldusest tulenev suhteline
sagedus
f=k-d-1 (d on vaadeldava jaotuse valimilt hinnatud para-
meetrite arv)
F. Seosekordajad
1. Lineaarse korrelatsiooni kordaja:
DY DX
EY)) EX)(Y E((X
DY DX
Y) cov(X,
Y) r(X,
ehk
) Y - y ( ) X -
x
(
) Y - y )( X -
x
(
= Y) r(X,
2
i
n
1 = i
2
i
n
1 = i
i
i
n
1 = i
n
1 i
2
i
n
1 i
i i
) X (x
) Y )(y X (x
b
e
)
e
-
v
(
= h
j i,
2
j i, j i,
j i,
k
1 i i
2
i i
e
) e (v
h
94