Download as pdf or txt
Download as pdf or txt
You are on page 1of 94

K. remaa & A. Kaasik.

Tenosusteooria ja matemaatiline statistika 2013


TENOSUSTEOORIA
JA
MATEMAATILINE STATISTIKA
(loengukonspekt)
Kuldev remaa
alates aastast 2013 toimetanud Ants Kaasik
Tartu 2013
1
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Proloog
Kesolev loengukursus on meldud eesktt majandusteaduskonna lipilastele. Kursus koosneb kahest
osast: tenosusteooriast ja matemaatilisest statistikast. Tenosusteooria on teadus seadusprast juhuslike
sndmuste ja juhuslike protsesside maailmas; matemaatiline statistika on teadus andmete kogumisest, tt-
lemisest ja statistiliselt korrektsete jrelduste tegemise meetoditest. Phiteadmised mlemast valdkonnast
kuuluvad tnapeval iga spetsialisti teadmiste hulka. Mlemad teadusharud on vga ulatuslikud, antud kur-
suse raames teeme vaid esimesed sammud nendes valdkondades. Tenosusteooria on aluseks mitmetele
teadusharudele, kesolevas kursuses - matemaatilisele statistikale.
Kesolev kursus on eeldusaineks erinevatele kursustele. Antud kursuses ongi seatud eesmrgiks anda
teoreetilised alused teistes kursustes ksitletava mistmiseks. Teooria ja baasteadmised on alati raskemini
omandatavad ning nende thtsus ilmneb alles nende kasutamisel praktikas, jrgnevates kursustes. Kursuses
ksitletud mistete ja seoste ilmestamiseks toome hsti lihtsaid niteid, et mitte raisata aega keeruliste
nidete sisu seletamisele.
Paljudele on selle kursuse philised misted teada juba koolikursusest. Kuid kuna erinevates koolides
ksitletakse tenosusteooria ja matemaatilise statistika osa erineva phjalikkusega, siis kordame le ka
kik elementaarsed ted, et muuta kogu kursus tervikuks. See ktkeb endas ka teatud ohtu tekib arusaam,
et kik ongi vga lihtne ning loengul kimine on vaid aja raiskamine. Alles eksamiks ppides selgub, et te-
gelikult on mindud palju kaugemale sellest, mis oli teada varem.
Kesolevas kursuses ei ole toodud keerulisi testusi, esitatud testused on jukohased igale lipilasele
ja aitavad kinnistada arusaamist testatava vite olemusest. Paljude aastate kogemusena on muutnud kur-
suse sisu ja esitusvorm vastavalt sellele, millised osad on eksamitde phjal olnud raskemini mistetavad,
vi milledest on valesti aru saadud. Meelega on toodud sisse mningaid kordusi, et eri osade juures mee-
nutada lbitut.
Kirjandust on sellise loengukursuse kohta palju. Rikkaliku loetelu vib leida internetist. Kuid just ma-
terjali paljusus teeb kohati raskeks vajaliku osa ktteleidmise ning eri autorite poolt esitatu liitmine tervik-
likuks pildiks vib osutuda liialt raskeks. Seeprast on kesolev konspekt koostatud selliselt, et ta sisaldab
kike kursuse edukaks lbimiseks vajalikku. Tiendava kirjandusena viks kigepealt veelkord lbi tta-
da keskkoolis pitu, kasutades niteks raamatut
Mart Miinus: Matemaatika XII klassile. Tallinn, Koolibri 1994.
Vga head on ka Tartu likooli kirjastuse vljaandeid:
Ene Tiit, Mrt Mls: Rakendusstatistika algkursus. Tartu likooli Kirjastus, 1997.
A.Parring, M.Vhi, E. Krik: Statistilise andmettluse algpetus. Tartu likooli Kirjastus, 1997.
Neile lisaks ka
Ene Tiit: Tenosusteooria lhikursus, AVITA, Tallinn, 1995
Helmo Kerdi: Statistika ja tenosusteooria alused. Sisekaitseakadeemia, Tallinn 1999
J.Gurski: Tenosusteooria ja matemaatiline statistika. Valgus, Tallinn, 1986
Suhteliselt rikkalik on ingliskeelsete raamatute valik, kuid oma ksitluse phjalikkuselt letavad nad
enamasti selles kursuses nutu. Toome siin vaid he viite:
John A. Ingram, Joseph G.Monks Statistics for Business and Economics. Academic Press, 1989
2
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
T E N O S U S T E O O R I A..................................................................................................5
SNDMUSE TENOSUS ........................................................................................................6
1 SNDMUSE MISTE ........................................................................................................6
1.1 Elementaarsndmuste ruum, sndmuste liigitus...................................................6
1.2 Tehted sndmustega.............................................................................................7
2 TENOSUSE MISTE JA OMADUSED........................................................................8
3 TEHTED TENOSUSTEGA............................................................................................9
3.1 ksteist vlistavate sndmuste summa tenosus.................................................9
3.2 Tinglik tenosus ja sndmuste korrutise tenosus.............................................9
3.3 Sndmuste summa tenosus.............................................................................10
3.4 Sndmuse tistenosus.....................................................................................10
JUHUSLIK SUURUS..................................................................................................................12
4 DISKREETNE JUHUSLIK SUURUS...............................................................................12
4.1 Diskreetse juhusliku suuruse jaotus ...................................................................13
4.2 Tehted juhuslike suurustega ...............................................................................14
4.3 Juhusliku suuruse arvkarakteristikud..................................................................16
4.3.1 Mood..................................................................................................16
4.3.2 Keskvrtus.........................................................................................16
4.3.3 Dispersioon.........................................................................................17
5 DISKREETSE JUHUSLIKU SUURUSE TEOREETILISI JAOTUSI...............................19
5.1 Diskreetse juhusliku suuruse jaotusi..................................................................19
5.1.1 htlane jaotus.....................................................................................19
5.1.2 Binoomjaotus......................................................................................20
5.1.3 Poissoni jaotus....................................................................................22
6 PIDEV JUHUSLIK SUURUS............................................................................................25
6.1 Juhusliku suuruse jaotusfunktsioon ja tihedusfunktsioon...................................25
6.2 Pideva juhusliku suuruse arvkarakteristikud......................................................27
6.2.1 Kvantiilid............................................................................................27
6.2.2 Keskvrtus.........................................................................................29
6.2.3 Dispersioon.........................................................................................29
7 PIDEVA JUHUSLIKU SUURUSE JAOTUSI...................................................................30
7.1 Pidev htlane jaotus............................................................................................30
7.2 Normaaljaotus.....................................................................................................31
7.2.1 Normaaljaotuse definitsioon..............................................................31
7.2.2. Standardiseeritud normaaljaotus.........................................................32
7.2.3. 3- reegel..........................................................................................35
7.2.4. Normaaljaotust iseloomustavad tunnused .........................................35
7.2.5 Tplesanded.....................................................................................36
7.2.6 Binoomjaotuse lhendamine normaaljaotusega..................................38
7.3 Juhuslike suuruste summa ja ruutude summa jaotus...........................................39
7.3.1 Juhusliku suuruse summa jaotus .........................................................40
7.3.2 Juhusliku suuruse ruutude summa jaotus ............................................40
8 TENOSUSTEOORIA PIIRTEOREEMID...................................................................41
8.1 Tsebsevi suurte arvude seadus .........................................................................41
8.1 Bernoulli suurte arvude seadus..........................................................................41
M A T E M A A T I L I N E S T A T I S T I K A......................................................................43
9 LDKOGUM JA VALIM..................................................................................................44
9.1 ldkogumi ja valimi mratlus..........................................................................44
9.2 ldkeskmine ja ldkogumi ruuthlve ................................................................44
3
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
9.3 Valimikeskmine ja valimi ruuthlve..................................................................45
9.4 Valimikeskmine kui juhuslik suurus .................................................................46
9.5 Valimi standardhlve kui juhuslik suurus ..........................................................47
10 LDKOGUMI KARAKTERISTIKUTE PUNKTIHINNANG........................................48
11 LDKOGUMI KARAKTERISTIKUTE VAHEMIKHINNANGUD..............................50
11.1 ldkeskmise vahemikhinnang ..........................................................................51
11.1.1 Suur valim.........................................................................................51
11.1.2 Vikese valimi juhtum......................................................................54
11.2 Valimi suuruse mramine................................................................................56
11.3 Suhtelise sageduse (protsendi) vahemikhinnang..............................................58
11.3.1 Valimi suuruse mramine suhtelise sageduse hinnangutes .............59
12 HPOTEESID..................................................................................................................61
12.1 Hpoteeside pstitamise phimtted ja liigid..................................................61
12.2 Hpoteeside kontrollimise phimtted.............................................................62
12.3 Hpoteesid ldkeskmise kohta.........................................................................64
12.3.1 Kahepoolsete hpoteeside kontrollmine ...........................................65
12.3.2 hepoolsete hpoteeside kontrollmine.............................................67
12.3.3 Hpoteeside kontrollimise koondtabel..............................................68
12.4 Hpoteesid sageduste kohta.............................................................................69
12.5 Hpoteesid ldkeskmiste vahe kohta...............................................................71
12.6 Hpoteesid sageduste vahe kohta.....................................................................74
13 JAOTUSE LEIDMINE.....................................................................................................75
14 TUNNUSTEVAHELISED SEOSED ..............................................................................79
14.1 Kahe tunnuse hisjaotus ..................................................................................79
14.2 2 - test sltuvuse avastamiseks........................................................................79
14.3 Korrelatiivne sltuvus.......................................................................................81
14.3.1 Lineaarse korrelatsiooni kordaja......................................................81
14.3.2 Spearmani korrelatsioonikordaja .....................................................84
LISAD............................................................................................................................................ 85
Standardiseeritud normaaljaotuse tabel..........................................................................................85
Studenti jaotuse tiendkvantiilide tabel ..................................................................................86
2 - jaotuse tiendkvantiilide tabel...............................................................................................87
Valemite koondtabel....................................................................................................................... 88
4
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
T E N O S U S T E O O R I A
Tegelikus elus kohtame sageli nhtusi, kus samades tingimustes kulgeva sama protsessi tu-
lemused on erinevad. Selliseid protsesse nimetame juhuslikeks protsessideks. Kige
elementaarsemaks sellise protsessi niteks on tringu viskamine - kuidas me ka ei pa visata
tpselt hte moodi, saame enamasti eri kordadel ikka erinevad tulemused. Tegemist on juhus-
like faktorite mjuga, mida me ei suuda viskamisel arvestada.
Tenosusteooriaks nimetatakse matemaatika haru, mis uurib juhuslike nhtuste ldisi
seadusprasusi lahus nende konkreetsest olemusest ja annab meetodid nende nhtuste iseloo-
mustamiseks. Tenosusteooria tekkimise tukejuks sai hasartmngudes ilmnevate seadus-
prasuste uurimine. Blaise Pascal'i, Cristian Huygens'i ja Pierre de Fermat td 17. sajandi
keskel olid tenosusteooria alguseks. Sama sajandi teisel poolel jtkas teooria arendamist
Jacob Bernoulli.
Tenosusteooria on iseseisev teadusharu, mille suurim panus seisneb selles, et temale tu-
ginevad paljud teised teadusharud: informatsiooniteooria, demograafia, geneetika, mate-
maatiline statistika jne. Meid huvitab peaasjalikult viimane mainituist matemaatiline
statistika.
Tulenevalt nii tenosusteooria kui ma matemaatilise statistika ulatuslikkusest kehtib kes-
oleva kursuse proloogis eldu - kursuse eesmrk on tutvustada phimisteid, elementaarseid
rakendusi ja anda teadmised lihtsamate tulemuste tlgendamiseks ja sedagi vga piiratud ula-
tuses.
5
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
SNDMUSE TENOSUS
1 SNDMUSE MISTE
1.1 Elementaarsndmuste ruum, sndmuste liigitus
Vaadeldava protsessi vi lbiviidava katse tulemust nimetame elementaarsndmuseks.
Niteks on tringu viskamisel vimalikud tulemused: peale jb he tpiga tahk, peale
jb kahe tpiga tahk, jne - kokku kuus erinevat tulemust ehk kuus elementaarsndmust.
Eelmises lauses snadega peale jb tahk ... tpiga rhutasime vaid seda, et sndmuste k-
sitlemisel ei ole oluline kvantitatiivne hinnang tulemusele, vaid ainult see, kas sndmus toi-
mus vi mitte. Lhiduse mttes rgime edaspidi tringu korral ikkagi, et saime he silma,
kaks silma jne.
Thistame katse tulemusena saadavaid elementaarsndmusi kreeka thtedega
1
,
2
...,
n
ja kikide elementaarsndmuste (st katse tulemuste) hulka = {
1
,
2
...,
n
}.
Kui katse vljundiks on elementaarsndmus
i
, siis tleme, et toimus elementaarsndmus

i
. Elementaarsndmustest saame konstrueerida sndmusi. tleme, et suvaline elementaar-
sndmuste ruumi alamhulk mrab sndmuse . Praktikas huvitavad meid vaid sellised
elementaarsndmuste hulgad, millele oskame anda tlgenduse. Sndmusi thistame suurte la-
dina thtedega: A, B, C, ... jne, millele tarbe korral lisame indeksi. Mnikord kasutame snd-
muste thistamiseks snalisi vljendeid, niteks: "paarisarvuline tulemus", "positiivne eksami
hinne" jms.
tleme, et sndmus A={
i1
,
i2
,...
,

ik
} toimub, kui katse tulemuseks on ks sndmust
A mravatest elementaarsndmustest. Niteks kui vaadeldavaks sndmuseks A on "paaris-
arvu silmade saamine hel tringu viskel", siis sndmus tleme, et sndmus A toimub, kui
tringu pealmisel tahul on kas 2, 4 vi 6 silma. Teisiti, kui ={
1
,
2,

3,

4,

5
,
6
} on trin-
guviskele vastav elementaarsndmuste ruum, siis paarisarvu silmade saamisele vastab
elementaarsndmuste hulk A={
2
,
4
,
6
}.
Kogu jrgnevas ksitluses eeldame, et meil on mratud elementaarsndmuste ruum
ning vaatleme selle alamhulki kui sndmusi. Iga konkreetse elementaarsndmuste ruumi kor-
ral saab mrata kindla arvu erinevaid sndmusi. Niteks, olgu lihtsuse mttes antud meie
elementaarsndmuste ruumis ainult 3 elementi: = {
1
,
2
,
3
}. Selle ruumi phjal saame
konstrueerida kokku 7 erinevat sndmust: A
1
= {
1
}, A
2
= {
2
}, A
3
= {
3
}, A
4
= {
1
,
2
},
A
5
= {
1
,
3
}, A
6
= {
2
,
3
}, A
7
= {
1
,
2
,
3
}. Tavaliselt lisatakse sellele hulkade hulgale ka
thihulk A
8
= = {}, mille korral ei toimunud htegi eelpool mainitud elementaarsndmus-
tes. Saab nidata, et n elemendilisest elementaarsndmuste ruumist tulenevate erinevate snd-
muste koguarv koos thihulgale vastava sndmusega on 2
n
.
tleme, et sndmus A = {
1
,
2
, ...,
k
} toimub, kui katse tulemuseks on ks elemen-
taarsndmustest, kas
1
vi
2
vi ... vi
k.
Sndmust A nimetatakse kindlaks sndmuseks, kui ta on mratud kogu elementaar-
sndmuste ruumil, st A = . Seega katse lbiviimisel sndmus A toimub kindlasti, kuna vas-
tavalt elementaarsndmuste ruumi definitsioonile vhemalt ks elementaarsndmus toimub.
Sndmust A = nimetatakse vimatuks sndmuseks. Kuna vimatule sndmusele vas-
tav hulk ei sisalda htegi elementaarsndmust, siis (igati oodatult!) vimatu sndmus ei saa
toimuda.
6
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Nide 1.1. Vaatleme eksamit kui juhuslikku katset, millel saadavad hinded kui katse vi-
malikud vljundid (elementaarsndmused!) moodustavad elementaarsndmuste ruumi =
{A, B, C, D, E, F}. tleme, et toimus sndmus lipilane sooritas eksami, kui katse vl-
jundiks oli ks hulka {A, B, C, D, E} kuuluvatest elementaarsndmustest ja ei sooritanud
eksamit, kui vljundiks on {F}.
Toodud nites on sndmused lipilane sooritas eksami ja ei sooritanud eksamit
teinesteist vlistavad. Selle nite korral saaksime tinglikult sisse tuua ka thihulga miste
lipilane ei tulnud eksamile ja seega ta eksamihinnet ei saanud. Paneme thele, et sellise tl-
genduse juures on ks probleem tudengi eksamile mitteilmumine ei ole tegelikult vimatu
sndmus.
Sndmusi A
1
, A
2
,... ja A
n
nimetame ksteist vlistavaiks, kui he toimumine vlistab
lejnute toimumise ehk he toimumisel teised toimuda ei saa.
Sndmuse A vastandsndmuseks (thistame
A
), nimetatakse sndmust, mis toimub siis
ja ainult siis kui A ei toimu. Lhtudes elementaarsndmuste ruumist, mravad sndmuse
A

need elementaarsndmused, mille korral A ei toimu, st mis vlistavad A toimumise. Kasuta-
des tehteid hulkadega vime kirjutada
A
= \ A, kus \ thistab hulkade lahutamistehet.
Siit tulenevalt vime lihtsalt tuletada, et vastandsndmuse vastandsndmus
A
on see snd-
mus A ise.
Sndmusi A
1
, A
2
, ..., A
n
nimetatakse ainuvimalikeks, kui katse sooritamisel vhemalt
ks neist toimub. Ainuvimalikud sndmused ei pruugi olla ksteist vlistavad.
Sndmused A
1
, A
2
, ..., A
n
moodustavad sndmuste tieliku ssteemi (tisssteemi) kui
nad on ksteist vlistavad ainuvimalikud sndmused.
Niteks moodustavad sndmuste tieliku ssteemi tringuviske tulemused, aga ka suvaline
hulk, mis koosneb vaid sndmusest ja tema vastandsndmusest.
Kokkuvtteks vime elda, et formaalselt on sndmus mingi katse vimalike tulemuste
hulk, sndmusega seotakse teda iseloomustav parameeter - toimumine/mittetoimumine. Edas-
pidises hakkab meid huvitama kvantitatiivne hinnang sndmuse toimumise vimalikkusele,
mida nimetame sndmuse tenosuseks.
1.2 Tehted sndmustega
Sndmust vaatlesime elementaarsndmuste hulgana elementaarsndmuste ruumis. Hul-
kade korral on defineeritud tehted hulkadega: liitmine, korrutamine ja lahutamine. Iga sellise
tehte tulemus on hulk samas elementaarsndmuste ruumis, mis seega mratleb mingi snd-
muse.
Olgu jrgnevas A
1
, A
2
, ..., A
n
suvalised sama elementaarsndmuste ruumi phjal mratud
sndmused.
Sndmuste A
1
, A
2
, ..., A
n
summaks A nimetame sndmust A = A
1
U A
2
U ... U A
n
.
Lhtudes hulkade summa mratlusest, sisaldab hulk A kiki neid elementaarsndmusi,
mis kuuluvad vhemalt hte sndmustest A
i
. Seega vime elda, et sndmus A toimub para-
jasti siis, kui toimub vhemalt ks sndmustest A
i
(i = 1, 2, ..., n).
Sndmuste A
1
, A
2
, ..., A
n
korrutiseks A nimetame sndmust A = A
1
A
2
... A
n
.
7
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Lhtudes hulkade hisosa mratlusest, sisaldab hulk A neid ja ainult neid elementaar-
sndmusi, mis kuuluvad kikidesse sndmustesse A
i
. Seega vime elda, et sndmus A toi-
mub parajasti siis, kui toimuvad kik sndmused A
i
(i = 1, 2, ..., n).
Sndmuste A
i
ja A
j
vaheks nimetame sndmust A
i
\ A
j
ehk antud sndmus sisaldab ainult
neid elementaarsndmusi, mis kuuluvad sndmusesse A
i,
ent ei kuulu sndmusesse A
j
.
2 TENOSUSE MISTE JA OMADUSED
Sndmusega tenosusteoorias me ei seo mingeid arvulisi nitajaid, ei laiust, ei pikkust, ei
aega, ei kestvust. Nagu eespool vaatlesime, oli sndmusega seotud vaid ks nitaja snd-
muse toimumine (sndmus kas toimub vi ei toimu). Samas on ilmne, et mningate snd-
muste toimumise vimalikkus on suurem kui teistel. Niteks, tringu viskamisel on paaris-
arvu silmade saamine oodatavam kui tpselt kahe silma saamine. Jrgnevas huvitab meid si-
duda sndmuse toimumisega mingi arvuline nitaja, et oleks vimalik vrrelda sndmuse toi-
mumise vimalikkust arvude vrdlemise teel.
Arvulist karakteristikut, mis lubab vrrelda eri sndmusi nende toimumise vimalikkuse
seisukohalt, nimetame tenosuseks.
Kui katsel on n vrdvimalikk u vljundit = {
1
,
2
...,
n
}, ning neist k (k n) vljundit
mravad elementaarsndmuste hulga, mille korral tleme, et toimub sndmus A, siis nime-
tame sndmuse A toimumise tenosuseks p(A) arvu

n
k
= p(A)
(2.1)
Vahetult sellest definitsioonist lhtudes vime testada jrgmised omadused:
- kindla sndmuse tenosus p() = 1,
- vimatu sndmuse tenosus p() = 0
- suvalise sndmuse A tenosus asub vahemikus 0 p(A) 1
lal defineeritud suurust p(A) nimetatakse sndmuse klassikaliseks tenosuseks. Peale
klassikalise tenosuse kasutatakse veel mitmeid tenosuse mratlusi, niteks geomeetrili-
ne tenosus, statistiline tenosus, subjektiivne tenosus ja veel mned. Kesolevas kur-
suses neid eraldi ei ksitleta, teen siinjuures vaid kaks lisamrkust:
1) klassikaline tenosus on kahe arvu suhe ja sageli vljendatakse seda suhet igapevae-
lus protsentides, st korrutatakse arvuga 100;
2) saab nidata, et piisavalt suure katsete arvu korral lheneb jlgitava sndmuse sagedus
tema toimumise tenosusele.
Nide 2.1. Thistagu A sndmust, mis seisneb selles, et kaardipakist (52 kaarti) tmmatud
3 kaardi hulgas on tpselt kaks kuningat. Milline on selliselt mratud sndmuse A esinemise
tenosus?
Elementaarsndmuste ruumiks on kikvimalikud erinevad kaardikolmikud, mida saame
moodustada 52 kaardi hulgast. Kokku on selliseid kolmikuid kombinatsioonide arv 52 kaardi
hulgast kolme kaupa seega
3
52
C n . lesande tingimustele vastavalt peab kolmest kaar-
dist kaks olema valitud nelja kuninga hulgast, seega on
2
4
C vimalust ja igale vimalikule
8
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
kuningapaarile vastab vimalus valida kaaslaseks ks kaart 48 mittekuninga hulgast, ehk
teisiti
1
48
C vimalust. Jrelikult on meie poolt vaadeldava sndmuse korral soodsate vi-
maluste koguarv
1
48
2
4
*C C k ning sndmuse A tenosus
3
52
1
48
2
4
*
) (
C
C C
A p
.
3 TEHTED TENOSUSTEGA
Eespool defineerisime sndmuste summa ja korrutise misted. Vaatame, kuidas leida
selliste liitsndmuste tenosusi.
3.1 ksteist vlistavate sndmuste summa tenosus
Teineteist vlistavate sndmuste A ja B summa tenosus vrdub nende tenosuste sum-
maga:
P(A U B) = P(A) + P(B)
.
Nide 3Error: Reference source not found.1. Seisnegu sndmus A selles, et tringu
viskamisel saadakse 1 punkt ja B selles, et saadakse 2 punkti. Sndmust C = A U B saab
vaadelda sndmusena, et tringu viskamisel saadakse kas ks vi kaks punkti. Lhtudes
laltoodust vime kirjutada
P(A U B) = P(A) + P(B) = 1/6 + 1/6 = 1/3.
On lihtne ldistada see seaduspra suvalise arvu sltumatute sndmuste A
1
, A
2
, ..., A
n
koh-
ta.
3.2 Tinglik tenosus ja sndmuste korrutise tenosus
Sndmuste korrutamise tenosuse mratlemisel vaatleme ksteisele jrgnevaid snd-
musi, kus sndmuse iga jrgneva sndmuse tenosus vib sltuda sellest, mis enne teda juh-
tus.
Olgu meil tegemist kahe teineteisele ajas jrgneva sndmusega. tleme, et kaks sndmust
on sltumatud, kui he toimumine ei mjuta teise toimumist. Niteks, tringu jrjekordse
viske tulemus ei sltu sellest, milline tulemus saadi eelmisel viskel. Kui aga niteks on tege-
mist loteriiga, millel loositakse vlja ainukene vit auto, siis ilmselt peale juhusliku pileti
valimist muutub jrgmisena juhuslikult valitud pileti vidu tenosus.
Sndmuse A (toimumise) tenosust tingimusel, et toimus sndmus B, nimetatakse snd-
muse A tinglikuks tenosuseks sndmuse B suhtes ja thistatakse P(A | B) ja leitakse
valemiga
P(B)
B) P(A
= B) P(A

|
.
Sellest tingliku tenosuse definitsioonist saame eeskirja sndmuste korrutise te-
nosuse leidmiseks.
Korrutamislause. Kahe sndmuse A ja B korrutise tenosuseks P(AB) nimetatakse arvu,
mis saadakse he sndmuse tenosuse korrutamisel teise sndmuse tingliku tenosusega
esimese suhtes: P(A B) = P(B) P(A | B).
9
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Juhul, kui sndmuse A toimumine ei sltu B toimumisest (sndmused on sltumatud),
siis loomulikult P(A | B) = P(A) ning korrutamislause vime vlja kirjutada kujul:

Seda vrdust kasutatakse sageli ka selleks, et mrata kahe sndmuse sltuvus vi sltuma-
tus, tpsemalt sndmuste sltumatus defineeritakse seda tpi seose abil.
Korrutamislauset on lihtne laiendada ka enam kui kahe sndmuse korrutisele, seda kasutame
ka jrgnevas nites.
Nide 3.2. Firma korraldas loterii, milles oli 100 pileti hulgas 20 viduga piletit. Milline
on tenosus, et esimesena kolm piletit vtnud isik saab kolm vidupiletit?
Lahendus: Olgu A
1
- "esimesena valitud pilet on viduga",
A
2
- "teisena valitud pilet on viduga",
A
3
- "kolmandana valitud pilet on viduga".
Siis P(A
1
A
2
A
3
) = P(A
1
) P(A
2
| A
1
) P(A
3
| A
1
A
2
)= 20/100 x 19/99 x 18/98, mis ongi otsitav
tenosus.
3.3 Sndmuste summa tenosus
Eespool vaadeldi ksteist vlistavate sndmuste summa tenosust. Kasutades snd-
muste korrutise tenosust saame leida sndmuste summa tenosuse ka ldjuhul, kui ei eel-
data, et sndmused on ksteist vlistavad.
Sndmuste A ja B summa tenosus on vrdne nende sndmuste tenosuste summa ja
korrutise tenosuse vahega:

P(A U B) = P(A) + P(B) P(A B).
P(A B) = P(B) P(A).
10
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Lhtudes korrutamislausest saab selle valemi ka testada
1
, kuid vtame selle kui testatud
fakti. Illustreerime seda lihtsalt mistetava nitega.
Nide 3.3. Oletame, et kaks jahimeest nevad hunti ja tulistavad korraga. Olgu jahi-
meeste "tpsusklass" selline, et esimene jahimees tabab tenosusega 0.8 ja teine te-
nosusega 0.6. Lihtsuse mttes eeldame, et kskik kumma jahimehe hunti tabav kuul on sur-
mav. Milline on tenosus, et hunt sai surma?
Lahendus. Siin on tegemist kahe sltumatu sndmuse summaga: A - "esimene jahimees
laskis hundile pihta" ja B - "teine jahimees laskis hundile pihta". Vastavalt toodud valemile
saame leida hundi surmasaamise tenosuse:
P(A U B) = P(A) +P(B) P(A B) = 0,8 + 0,6 0,8*0,6 = 1,4 0,48 = 0,92
Seda lesannet on vimalik lahendada ka teisiti. Nimelt on sndmus "Hunt sai surma"
vastandsndmuseks sellele, et Hunt ji elama, s.t. mlemad jahimehed lasksid mda:
P("surnud") = 1 - P("elus") = 1P AB1P A P B = 1-0,2*0,4=0,92
*1Testus. Kui vaatleme kahte sndmust A ja B, siis sndmus A toimub kas koos snd-
musega B (seega AB) vi koos sndmuse B mittetoimimisega (seega A B). Analoogiliselt
toimub sndmus B kas koos sndmusega A (seega AB) vi koos sndmuse A mittetoimumi-
sega (seega AB).
Seega A = AB + A
B
ja B = AB + AB
Kuna mlemas vrduses on liidetavad teineteist vlistavad, siis vime kirjutada:
P(A) = P(AB) + P(A
B
)
P(B) = P(AB) + P( AB)
Liites vrduse mlemad pooled, kehtib vrdus
P(A
B
) + P( AB)= P(A) + P(B) - 2P(AB)

Analoogilise mttekiguga saame, et sndmus A U B toimub parajasti siis, kui toimub ks
teineteist vlistavatest sndmustest AB, BA vi A
B
. Seega
A U B = AB U AB U A
B
ja kasutades ra seda, et nad on ksteist vlistavad, saame
P(AUB) =P(AB) +P( AB) +P(A
B
)
Vttes nd kaks testatud seost kokku, ongi meil kes tulemus
P(AUB) = P(A) +P(B) - P(AB).
11
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
3.4 Sndmuse tistenosus
Vaatleme situatsiooni, kus mingi sndmus saab toimuda ainult koos mingi teise snd-
musega. Tavaliselt on tegu sellise juhtumiga siis, kui enne katse tegemist tuleb teha valik mit-
me erineva katsekeskkonna vahel. Niteks - kui enne eksamit on vimalik valida mitme
ppeju vahel vi kui Hiina sitmiseks on vimalik valida mitme erineva turismifirma vahel
jne.
Sellise situatsiooni vime formaalselt snastada jrgmiselt. Olgu sndmus A selline, et A
vib toimuda koos hega ja ainult hega sndmuste tielikku ssteemi moodustavatest snd-
mustest H
1
, H
2
, ... , H
n
. Leida tenosus, et sndmus A toimub.
Lhtudes sndmuse A toodud mratlusest vime ta vlja kirjutada liitsndmusena
A= AH
1
U AH
2
U ...U AH
n
.
Kuna probleemi pstituse jrgi on sndmused H
i
ksteist vlistavad, siis on seda ka AH
i
ning lhtudes liitmislausest saame
P(A) = P(AH
1
) + P(AH
2
) + ...+ P(AH
n
).
ehk lhemalt kujul
) H P(A P(A)
n
1 i
i


Kasutades nd iga liidetava korral korrutamisteoreemi, saame valemi
)) H | P(A ) (P(H P(A)
i
n
1 i
i

,
mida nimetatakse tistenosuse valemiks.
Nide 3.4. Oletame, et lipilane ppis eksamiks selgeks kogu vajaliku materjali ja vib
eksami sooritada positiivsele hindele. Tavaliselt lisandub aga veel teine faktor - ppeju sub-
jektiivne arusaamine lipilase teadmistest. Oletame, et eksami andmiseks on lipilasel vi-
malik valida kolme erineva ppeju (thistame neid H
1
, H
2
ja H
3
) vahel. On teada, et ks neist
on raske arusaamisega lipilase headusest ning sellest tulenevalt sooritatakse eksam
lipilase heade teadmiste korral tema juures tenosusega 0,4; teine ppejud on vhe tai-
bukam ja tema saab aru, kas lipilane oskab vi ei tenosusega 0,7; kolmas ppejudude
saab aru sellest, et lipilane teab tenosusega 0,9. Leida eksami sooritamise tenosus.
Lahendus. On selge, et kui lipilasel oleks teada, kes on kes, ei tekiks ksimust kelle
juures eksam anda. Praeguses eeldame, et ta seda ei tea ja on sunnitud valima ppeju juhus-
likult. Eksami sooritamise tistenosuse vime kirjutada kujul
P(A) = P(H
1
)P(A|H
1
) +P(H
2
)P(A|H
2
) +P(H
3
)P(A|H
3
)
Kuna ppeju valimise tenosused on vrdsed, siis P(H
i
)=1/3 siis
P(A) = 1/3*0,4 + 1/3*0,7 + 1/3*0,9 =0,67
Seega lipilase eksami sooritamise tenosus on tistenosuse valemi phjal 0,67.
Hindamaks tistenosust vljendava summa iga liikme P(H
k
)P(A|H
k
) panust tiste-
nosuses, vaatleme suhet:

)) H | P(A ) (P(H
) H | P(A * ) P(H
A) | P(H
i
n
1 i
i
k k
k

,
12
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
See suhe annab tingliku tenosuse P(H
k
|A) selleks, et sndmus A toimus just nimelt koos
sndmusega H
k
. Seda valemit nimetatakse Bayes'i valemiks.
Nide 3.5. Eeldame, et lipilane sai eksamil lbi (vt nide 3.4). Leida tenosus, et ta
sooritas eksami kolmanda ppeju juures.
Lahendus. Leiame suhte P(H
3
|A)= (1/3*0.9)/0,67= 0,447. Seega - jrgmine lipilane teab
et tenosusega 0,447, sooritas eelmine lipilane eksami kige parema ppeju juures.
Kuna me lhtume sellest, et lipilane sai eksamil lbi, siis tenosuste summa, et ta
sooritas eksami esimese, teise vi kolmanda ppeju juures peab vrduma hega.
13
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
JUHUSLIK SUURUS
4 DISKREETNE JUHUSLIK SUURUS
Juhuslik suurus on suurus, mis sltuvalt juhusest vib omandada erinevaid vrtusi. Juhus-
likuks suuruseks on niteks: lipilaste arv tenosusteooria loengul, hu temperatuur, tele-
foniarve suurus kuus, inimese pikkus, firma kive jne. Iga juhusliku suuruse korral on esmane
mrata, milliseid vrtusi ta vib omandada, st mrata tema vimalike vrtuste hulk.
Niteks juhuslik suurus "lipilaste arv loengul" vib omandada vrtusi {0, 1, 2, ..., n}, kus
n on ainele registreerinud lipilaste arv; juhuslik suurus "hu temperatuur" vrtusi vahemi-
kus (-80, +60) jne. Juhuslike suuruste liigitamise seisukohalt ei ole oluline mitte see, milliseid
konkreetseid vrtusi ks vi teine juhuslik suurus vib omandada, vaid see, kas vimalike
vrtuste hulk on lplik vi lpmatu. Nii on lal toodud nidetes esimesel juhul lplik arv
vimalikke vrtusi, teisel juhul on tegemist reaalarvude vahemikuga, milles on lpmatu arv
erinevaid vimalikke vrtusi.
Juhuslikku suurust nimetatakse diskreetseks juhuslikuks suuruseks, kui ta vib
omandada lpliku vi loenduva
2
hulga vrtusi: niteks tringuviskel saadav silmade arv,
mdalaskude arv esimese tabamiseni, eksamihinne, loengul olevate lipilaste arv jne. Disk-
reetse juhusliku suuruse vimalikud vrtused ei pea olema tisarvud, oluline on, et erinevaid
vimalikke vrtusi oleks lplik vi loenduv arv.
Juhuslikku suurust nimetatakse pidevaks juhuslikuks suuruseks, kui ta vib omandada
lpmatu hulga vrtusi. Kesolevas kursuses eeldame, et pideva juhusliku suuruse vrtused
on reaalarvud mingist reaalarvude vahemikust. Niteks on pidevaks juhuslikuks suuruseks
arbuusi kaal, he liitri bensiiniga lbitud vahemaa, jne.
Eespool kasutasime juhuslike suuruste thistamiseks tema sisust tulenevat nime: pikkus,
arbuusi kaal jne. Ksitluse formaliseerimiseks thistame alljrgnevas juhuslikke suurusi
suurte ladina thtedega X, Y, Z, ... ja nende konkreetseid vrtusi vastavate vikeste thtede-
ga koos indeksitega X = {x
1
, x
2
, ..., x
n
}; Y = {y
1
, y
2
, ...}; Z = {z
1
, z
2
, ...}.
Juhuslike suuruste kirjeldamisel on oluline leida nende kitumise tenosuslik aspekt,
mida vime vljendada kahe ksimusega:
1) milline on tenosus juhusliku suuruse iga vimaliku vrtuse omandamiseks,
2) milline on tenosus, et juhuslik suuruse vrtus asub mingis vahemikus.
Neist esimene ksimus puudutab ainult diskreetseid juhuslikke suurusi, teine aga m-
lemaid tpe.
Juhusliku suuruse igale vrtuse vastava tenosuse leidmiseks seotakse vrtus (vrtuste
vahemik) teatud sndmusega (juhuslik suurus X omandab vrtuse x
i
) ja vrtuste koguhul-
gale vastab sndmuste tielik ssteem (vt 1.1). Vrtusele vastava sndmuse tenosus loe-
takse juhuslikul suurusel selle vrtuse omandamise tenosuseks. Diskreetse juhusliku
suuruse korral on selline samastamine sna loomulik, niteks sndmus "tringu viskamisel
*2eldakse, et hulgas on loenduv arv elemente kui selle hulga elementide arv on vrdne mne naturaal -
arvude hulga alamhulga elementide arvuga. Nii niteks mdalaskude arv esimese tabamuseni vib olla kuitahes
suur ja seega ei ole vimaluste arv lplik, ent kindlasti on mdalaskude arv mingi naturaalarv ja jrelikult on
vimaluste arv loenduv.
14
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
tuleb vlja tahk kuue tpiga" vastab juhusliku suuruse "tringuviskel saadavate silmade arv"
vrtusele 6. Pideva juhusliku suuruse korral vaadeldakse sndmust kui juhusliku suuruse
vrtuse langemist teatud vahemikku ja sellega saadakse sisuliselt vastavus, kus lplikule
arvule sndmustele vastab lpmatu hulk vrtusi.
4.1 Diskreetse juhusliku suuruse jaotus
Eeskirja P(X), mis diskreetse juhusliku suuruse igale vrtusele seab vastavusse selle
vrtuse omandamise tenosuse, nimetatakse juhusliku suuruse (tenosuste) jaotuseks
(ka jaotusseaduseks). Juhusliku suuruse jaotuse vime anda kas tabelina, funktsioonina,
diagrammina vi muul sarnasel viisil, mis mrab ra vastavuse: juhusliku suuruse
vrtus tenosus, et juhuslik suurus omandab selle vrtuse. Thistame juhusliku
suuruse vrtusele x
i
vastavat tenosust p(x
i
) vi lhidalt p
i
. Seega P(X) = {p(x
1
),
p(x
2
), ..., p(x
n
)}.
Nide 4.1. Olgu teada, et laskur tulistab 2 korda ja iga lasu korral tabab mrklauda te-
nosusega 0,8. Leida mrklauda tabanud kuulide arvu kui juhusliku suuruse tenosuste
jaotus.
Lahendus. Olgu X juhuslik suurus "mrklauda tabanud kuulide arv", mis vastavalt nitele
vib omandada arvulisi vrtusi 0, 1 vi 2. Thistame vrtuste hulga X = {0, 1, 2}. Juhusli -
ku suuruse iga vrtuse omandamise tenosuse leidmisel lhtume temale vastava sndmuse
tenosusest. Seega korraldame vastavuse sndmuse ja juhusliku suuruse vimalike vrtuste
vahel. Olgu sndmus A - mrklauda tabas 0 kuuli, B - tabas 1 kuul ja C - tabas 2 kuuli.
Kasutades sndmuste summa ja korrutise tenosuse leidmise eeskirja saame leida:
P(A) = 0,2 x 0,2 = 0,04
P(B) = 0,2 x 0,8 + 0,8 x 0,2 = 0,32
P(C) = 0,8 x 0,8 = 0,64
Juhusliku suuruse tenosuste jaotustabeli vime nd vlja kirjutada kujul:
A B C
x
i
0 1 2
p(x
i
) 0,04 0,32 0,64
Tavaliselt jaotustabelis sndmusi thistavat rida vlja ei kirjutata, praegusel juhul tegime
seda selleks, et rhutada juhusliku suuruse vrtuste tenosuste arvutamist vastavate snd-
muste tenosuste kaudu. Kuna sndmused A, B ja C moodustavad sndmuste tieliku ss-
teemi (on ksteist vlistavad ja ks neist kindlasti toimub), siis peab tenosuste summa
vrduma hega.
Nide 4.2. Olgu diskreetne juhuslik suuruse X ={0, 1, 2, 3, 4, 5, 6, 7, 8} jaotus antud tabe-
liga:
x
i
0 1 2 3 4 5 6 7 8
p(x
i
) 0,004 0,031 0,109 0,219 0,274 0,219 0,109 0,031 0,004
Jaotuse olemusest parema visuaalse ettekujutuse saamiseks koostatakse sageli tabeli alusel
tulpdiagramm. Praegusel juhul saaksime:
15
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Siit on visuaalselt nha tenosuse muutumine tema vimalike vrtuste korral ning see
annab hea levaate jaotuse olemusest. pris sageli on aga tarvis leida tenosus, et juhuslik
suurus on viksem (vi suurem) kui mingi ette antud vrtus. Tenosuse viksem kui leid-
miseks liidame kikide eelnevate vrtuste tenosused. Selle saame kirjutada valemina

) p(x ) x P(X ) F(x
j i i


i j
x x
,
kus funktsiooni F(x) nimetatakse jaotusfunktsiooniks.
Leiame nite 4.2 phjal juhusliku suuruse jaotusfunktsiooni vrtused kikide vimalike
vrtuste korral ja korrastame tulemused tabelisse:
F(0)=
=P(X0)
F(1)=
=P(X1)
F(2)=
=P(X2)
F(3)=
=P(X3)
F(4)=
=P(X4)
F(5)=
=P(X5)
F(6)=
=P(X6)
F(7)=
=P(X7)
F(8)=
=P(X8)
F(x) 0,004 0,035 0,144 0,363 0,637 0,856 0,965 0,996 1,000
Selle tabeli vime esitada jllegi tulpdiagrammina, kus x-teljel on juhusliku suuruse vr-
tused ja y-teljel vrtusele vastav tenosus.
Tegelikult ei pea jaotusfunktsiooni argumendiks olema vaadeldava juhusliku suuruse vi-
malik vrtus, selleks vib olla suvaline arv. On ilmne, et jaotusfunktsioon ei saa kahaneda
(positiivsete arvude summa). Samuti, et F(x
1
-) = P(X x
1
-) = 0 ja F(x
n
) = P(X x
n
) = 1, kus
on kuitahes vike positiivne arv. Praegusel, diskreetse juhusliku suuruse korral tuleneb
jaotusfunktsioon vga loogiliselt teadaolevast jaotusest. Oluliseks muutub aga jaotusfunkt-
siooni miste just pideva juhusliku suuruse korral, kus ta on tegelikult pideva juhusliku
suuruse mratlemise phialus.
Tenosuse, et juhuslik suurus on suurem kui mingi arv vime defineerida analoogili-
selt, kuid tavaliselt leitakse selline tenosus kasutades vastandsndmuse tenosust ja seega
P(X > x) = 1 - P(X x).
0
0,2
0,4
0,6
0,8
1
1,2
Jaotusf unktsioon F(x)
Jaotuse tul pdi agramm
16
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
4.2 Tehted diskreetsete juhuslike suurustega
Diskreetne juhuslik suurus on mratud, kui on teada tema vimalikud vrtused ja ja nen-
de vrtuste esinemise tenosused (jaotus), s.t, kui on antud paar (X, P(X)) = {(x
i
, p(x
i
)):
i=1,2,...}.
tleme, et diskreetsed juhuslikud suurused X ja Y on sltumatud, kui he juhusliku
suuruse kindla vrtuse omandamise tenosus ei sltu sellest, millise vrtuse omandab
teine juhuslik suurus. Sltumatute juhuslike suuruste korral vime tenosuse, et X omandab
vrtuse x
i
ja Y omandab vrtuse y
j
leida kui
P(X = x
i
,Y = y
j
) = P(X = x
i
) P(Y = y
j
).
Edaspidises kasutame thistustes lhendatud varianti: p(x
i
, y
j
) = p(x
i
)p(y
j
)
Juhuslike suurustega saab teha teha aritmeetilisi tehteid. Niteks perekonna kuu sissetule-
ku leidmiseks peame liitma pere liikmete kuu sissetulekud ja saame uue juhusliku suuruse
(kui iga liikme sissetulek on juhuslik suurus). Uue juhusliku suuruse korral on nagu ikka
tarvis kigepealt leida tema vimalikud vrtused ja iga vrtuse tenosus, st mrata jaotus.
Vaatlemegi jrgnevalt tehteid diskreetsete juhuslike suurustega. Olgu meil antud juhusli-
kud suurused X = {x
1
, x
2
, ..., x
n
}; Y = {y
1
, y
2
, ..., y
m
} ning olgu teada ka nende jaotused.
Summa. Kahe juhusliku suuruse (X, P(X)) ja (Y, P(Y)) summaks X+Y loeme juhuslikku
suurust (Z, P(Z)) = {(z
k
, p(z
k
)}, mille korral
z
k
= x
i
+ y
j
(i=1,2,...,n; j=1,2,...,m) ja p(z
k
) = p(x
i,
,

y
j
).
Kui X ja Y on sltumatud diskreetsed juhuslikud suurused, siis tulenevalt ksikvrtustele
vastavusse seatavate sndmuste sltumatusest saame vita, et tenosus p(z
k
) = p(x
i
)p(y
j
).
Sltuvate juhuslike suuruste korral tuleb arvestada tinglikke tenosusi.
Korrutis. Kahe juhusliku suuruse (X, P(X)) ja (Y, P(Y)) korrutiseks XY loeme juhuslik-
ku suurust (Z, P(Z)) = {(z
k
, p(z
k
)}, mille korral vrtus on z
k
= x
i
y
j
(i=1,2,...,n; j=1,2,...,m) ja
vastava vrtuse tenosus on p(z
k
) = p(x
i,
y
j
).
Samuti nagu summa korral kehtib siingi: kui X ja Y on sltumatud diskreetsed juhuslikud
suurused, siis p(z
k
) = p(x
i
)p(y
j
); sltuvate juhuslike suuruste korral tuleb arvestada tinglikke
tenosusi.
Vahe. Kahe juhusliku suuruse (X, P(X)) ja (Y, P(Y)) vaheks X-Y loeme juhuslikku
suurust (Z, P(Z))={(z
k
, p(z
k
)}, kus z
k
= x
i
- y
j
(i=1,2,...,n; j=1,2,...,m) ja p(z
k
) = p(x
i
x
j
).
Juhul, kui X ja Y on sltumatud diskreetsed juhuslikud suurused, siis p(z
k
) = p(x
i
)p(y
j
);
sltuvate juhuslike suuruste korral tuleb arvestada tinglikke tenosusi.
Toodud tehete korral on oluline jtta meelde ldine tsiasi - sltumatute juhuslike suuruste
vrtuste vahel teeme vajaliku tehte (liidame, korrutame, lahutame), tulemuse tenosuse
saamiseks tuleb aga igal juhul lhtevrtuste tenosused korrutada. Seda on lihtne selgitada
tuginedes sndmustele. Tepoolest, kui vaadelda vrtustele vastavaid sndmusi, siis iga
tehte korral kehtib tulemuses vide toimub sndmus A (juhuslik suurus X=x
i
) ja toimub
17
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
sndmus B (juhuslik suurus Y=y
j
) ja seega peame leidma sndmuste A ja B korrutise te-
nosuse. Teine oluline aspekt on, et erinevate X ja Y vrtuste korral vivad tehte tulemusena
saadavad vrtused kokku langeda.
Nide 4.3. Mees ja naine kivad juhutdel. Saadav pevapalk on mlemal juhuslik suu-
rus, kusjuures mees teenib pevas kas 100, 150 vi 200 krooni; naine kas 150 vi 250 krooni.
Oletame, et nende juhuslike suuruste (mehe ja naise pevateenistus) korral on teada ka iga
vrtuse saamise tenosus:
Mees: X 100 150 200 Naine: Y 150 250
p(xi) 0,3 0,5 0,2 p(yi) 0,4 0,6
Perekonna peva sissetuleku, kui juhusliku suuruse, leidmiseks saame lhtudes lalpool
toodud reeglitest koostada jaotustabeli:
Perekond:
Z 250 300 350 400 450
p(z
i
) 0,12
0,2 0,26 0,3 0,12
4.3 Juhusliku suuruse arvkarakteristikud
Juhusliku suuruse arvkarakteristikud on analoogilised nendele, mida arvutatakse ld-
statistikas sagedustabeli phjal. Eriti suur on analoogia diskreetse juhusliku suuruse korral.
Allpool defineerime misted mood, keskvrtus ja dispersioon, lhtudes jaotustabelist.
4.3.1 Mood
Di skreetse juhusliku suuruse moodiks x
mo
nimetame juhusliku suuruse kige suurema te-
nosusega esinevat vrtust. Kuna sama tenosusega vib olla mitu vrtust, siis ei ole
mood mratud heselt. Seega vrtus x
mo
on mood, kui
) p(x max ) p(x
i
x
mo
i

.
Kui juhuslikul suurusel on ks mood, siis nimetatakse seda unimodaalseks, kui mitu
multimodaalseks
4.3.2 Keskvrtus
Diskreetse juhusliku suuruse X={x
1
, x
2
, ...} keskvrtuseks EX nimetatakse arvu

X x
i i
i
) p(x x EX
Keskvrtust nimetatakse ka matemaatiliseks ootuseks ehk ootevrtuseks. Selgitame
keskvrtuse mistet nite abil.
Nide 4.4. Kasiino kinkis lasteaiale juludeks mnguautomaadi. Seda oli igati lasteprane
ja lihtne ksitleda. Lapsel ei pruukinud teha muud, kui lasta automaati ks eurone mnt ja
kohe pistsid lagendikul sihitult ringi jooksma 7 hunti, 5 ilvest, 4 karu, 3 tiigrit ja 1 lvi. Suva-
18
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
lisel hetkel pstikule vajutades langes ks mnguautomaadi poolt juhuslikult valitud loom
jahisaagiks. Kui selleks oli tiiger, maksis automaat mngijale preemiaks 2 eurot, loomade
kuninga lvi pdmise korral aga 5 eurot. Phjamaiste ulukite korral sai mngijale osaks sb-
ralik soovitus Proovi veel.
Leida lapse mngu vidu keskvrtus (vidu matemaatiline ootus). Lapsed on mngust
vaimustuses, sest igaks neist unistab vahetada oma eurone mnt viielise vastu. Aga kuidas
neb vlja tegelikkus? Kogu lesande andmestiku vime koondada jrgmisse tabelisse:
Hunt Ilves Karu Tiiger Lvi
Ulukite arv 7 5 4 3 1
Uluki tabamise tenosus p=k/n 0,35 0,25 0,2 0,15 0,05
Tabamise preemia 0 0 0 2 5
Vit mngu lpul x
i
-1 -1 -1 1 4
Korrutis x
i
*p(x
i
)
-0,35 -0,25 -0,2 0,15 0,2
Vastavalt keskvrtuse arvutamise valemile

5
1 i
i i
) p(x x EX
, saame leida vidu keskvr-
tuse EX = -1* 0,35 + (-1)*0,25 + (-1)*0,2 + 1*0,15 + 2*0,2 = -0,45
Kokkuvttes vime elda, et igati kasulik kingitus kinkijale! Tiendusena toodud nitele
soovitan analsida juhtumit, kui kasiino hel peval otsustab maksta ka tiigri eest pree-
miaks 7 eurot.
Nagu nha, on diskreetse juhusliku suuruse keskvrtus teatud kaalutud summa, kus
kaaludeks on tenosused.
Keskvrtuse omadused. Leiame juhusliku suuruse keskvrtuse philised omadused,
mis on vajalikud kursuse edasistes osades. Nende testamisel on oluline arvestada, et disk-
reetse juhusliku suuruse tenosuste summa le kikide vimalike vrtuste vrdub hega.
1) Ec=c - konstandi keskvrtus on vrdne sama konstandiga: Ec = c (testada!)
2) E(cX) = cEX (testada!)
3) E(X+Y) = EX + EY - juhuslike suuruste summa keskvrtus vrdub keskvrtuste
summaga (testamata)
4) E(X-Y) = EX - EY (testuses kasutada ra omadusi 2 ja 3)
5) Sltumatute juhuslike suuruste korrutise keskvrtus vrdub keskvrtuste korruti-
sega E(XY) = EXEY:


i j
j j
i
i i
j
j i j i
i j
j i j i
EY EX ) p(y y ) p(x x ) )p(y p(x y x ) y , p(x y x E(XY)
4.3.3 Dispersioon
Krvuti juhusliku suuruse keskvrtusega on juhusliku suuruse iseloomustamisel oluline
hinnata ka tema vrtuste hajuvust keskvrtuse suhtes. Hajuvuse mratlemiseks vib kasu-
tada mitmesuguseid hinnanguid, kuid levinuimaks on dispersioon ja standardhlve.
Juhusliku suuruse dispersiooniks nimetatakse arvu: DX = E(X-EX)
2
.
19
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Kasutades keskvrtuse definitsiooni saame diskreetse juhusliku suuruse korral disper-
siooni kirjutada kujul:

i
i
2
i
) p(x EX) - (x DX
.
Dispersiooni korral kasutatakse summaarse hajuvuse hindamiseks hlvete ruutude sum-
mat, et keskvrtuse suhtes erimrgilised hlbed summas ei kustutaks ksteist. Ruuthlbe
kasutamisel on aga puuduseks see, et hlbe mtmiseks kasutatav hik on samuti ruudus.
Nimelt, kui niteks meie juhuslik suurus on mdetav meetrites, siis dispersioon (ruuthlve)
avaldub ruutmeetrites. Selle vltimiseks vetakse praktikas kasutusele ruutjuur dispersioonist.
Arvu
DX =
nimetatakse juhusliku suuruse standardhlbeks.
Vaatleme dispersiooni mningaid edaspidises olulisi omadusi. Seejuures eeldame, et ju-
huslikud suurused X ja Y on sltumatud.
1) Dc = 0 (testada)
2) D(cX) = E(E(cX) - cX)
2
= E(c
2
(EX-X)
2
) = c
2
E(EX-X)
2
= c
2
DX
3) DX = E(X-EX)
2
= E(X
2
-2XEX +(EX)
2
) = EX
2
- 2EXEX + E(EX)
2
= EX
2
- (EX)
2

4) D(X + Y) = E(X + Y)
2
- (E(X+Y))
2
= EX
2
+ 2 EX EY + EY
2
- (EX)
2
2 EX EY - (EY)
2
=
=EX
2
- (EX)
2
+ EY
2
- (EY)
2
= DX +DY (teise vrduse juures kasutasime sltumatust)
5) D(X - Y) = E(X - Y)
2
- (E(X-Y))
2
= EX
2
2 EX EY + EY
2
- (EX)
2
+ 2 EX EY - (EY)
2
=
=EX
2
- (EX)
2
+ EY
2
-(EY)
2
= DX +DY
20
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
5 DISKREETSE JUHUSLIKU SUURUSE TEOREETILISI JAOTUSI
Diskreetne juhuslik suurus on antud oma vimalike vrtuste loeteluga ja eeskirjaga, mis
igale vrtusele seab vastavusse selle vrtuse omandamise tenosuse. Kui vimalikud vr-
tused ja/vi vastavust korraldav eeskiri on teatud kindla kujuga, siis on meil tegemist vastavat
liiki (teoreetilise) jaotusega. Iga sellise liigi korral saame enamasti leida lihtsad valemid
jaotuse arvkarakteristikute (siin ksitleme vaid keskvrtust ja dispersiooni) leidmiseks.
Kesolevas paragrahvis vaatleme diskreetse juhusliku suuruse enamlevinud jaotusi, mil-
leks on htlane jaotus, binoomjaotus ja Poissoni jaotus.
5.1 Diskreetse juhusliku suuruse jaotusi
5.1.1 htlane jaotus
tleme, et diskreetne juhuslik suurus X = {x
1
, x
2
, ..., x
n
} on htlase jaotusega, kui kikide
vrtuste esinemistenosused on vrdsed, st p(x
i
) = p(x
j
) iga i, j = 1, 2, ..., n korral. Kuna
kikide vrtuste tenosuste summa peab vrduma hega:
1 = )
x
p(
i
n
1 = i

, siis lhtudes defi-


nitsioonis antud vrtuste tenosuste vrdsusest on lihtne jreldada, et iga vrtuse teno-
sus p(x
i
) = 1/n.
htlase jaotuse graafik tulpdiagrammina neb vlja selline:


x
1
x
2
x
n
. . . .
p(x
i
)
htlase jaotuse keskvrtus:



n
1 i
i
n
1 i
n
1 i
i i i
x
n
1
n
1
x ) p(x x EX on tegelikult vrtuste
aritmeetiline keskmise.
Dispersioon:
2
n
1 i
i
n
1 i
2
i
2 2
x
n
1
x
n
1
(EX) EX DX
,
_




, on ruutkeskmise ja aritmeetilise
keskmise ruudu vahe.
Nide 5.1. Leida tringuviskel saadavate silmade arvu keskvrtus.
Lahendus. EX=1/6(1+2+3+4+5+6)=3,5.
21
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
5.1.2 Binoomjaotus
Olgu juhusliku suuruse X vimalikeks vrtusteks naturaalarvud X = {0, 1, 2, ..., n}. R-
hutamaks fakti, et tegu on tisarvudega, vtame kasutusele smboli k = 0, 1, ..., n.
tleme, et juhuslik suurus X on binoomjaotusega, kui tema iga vrtuse X = k tenosus on
antud valemiga
k n k k
n
p) (1 p C k) P(n,

, kus p on reaalarv vahemikus nullist heni: 0 p 1.
Sobivus. Selleks, et see tenosuse arvutamise eeskiri viks ldse olla juhusliku suuruse te-
nosuse jaotuseks, peab kikidele vrtustele vastavate tenosuste summa vrduma hega.
Nitame, et lal toodud valemi korral see kehtib.
Lhtume Newtoni binoomvalemist, mille ldkuju on:

+
n
0 k
k n k k
n
n
y x C y) (x .
See vrdus kehtib suvaliste reaalarvuliste vrtuste x ja y korral. Praegusel juhul, vttes x
= p ja y = 1-p, vime kikide vrtuste tenosuste summa kirjutada kujul
1 p)) (1 (p p) (1 p C k) P(n,
n
0 k
n k n k k
n
n
0 k
+

,
mis testabki vite.
Keskvrtus. Vastavalt diskreetse juhusliku suuruse keskvrtuse definitsioonile vime bi-
noomjaotusega juhusliku suuruse keskvrtuse kirjutada kujul:


n
0 k
k n k k
n
n
0 k
p) (1 p kC p(k) k EX (5.1)
Osutub, et seda valemit saab tunduvalt lihtsustada. Selleks lhtume jllegi Newtoni bi-
noomvalemist vttes x = p ja y = 1-p = q ning sellise thistuse tulemusena vime Newtoni bi-
noomvalemi kirjutada:
k - n k k
n
n
0 = k
n
q p = q) + (p C

.
Edasi teeme jrgmised tehted:
1) vtame vrduse mlemalt poolelt tuletise muutuja p jrgi ning saame:
q p
C
k = q) + (p n
k - n 1 - k
k
n
n
0 = k
1 - n

2) korrutame mlemaid pooli suurusega p:


q p
C
k = q) + (p pn
k - n k
k
n
n
0 = k
1 - n

Arvestades nd, et p+q =1, saame vrduse vasakul pool tulemuseks np ja paremal pool
keskvrtuse EX arvutamise valemi binoomjaotuse korral (5.1). Kokkuvtte saime binoom-
jaotusega juhusliku suuruse keskvrtuse leidmiseks lihtsa avaldise:
EX = np.
Dispersioon. Saab nidata, et binoomjaotuse dispersioon avaldub samuti lihtsa avaldisena
DX=npq.
22
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Selle testus on suhteliselt lihtne, asjasthuvitatute jaoks toon selle joonealuse mrkusena
*1

Rakendatavus. Binoomjaotus on kahe parameetriga jaotus (nendeks on n ja p), mida thista-
takse B(n,p). Videt, et juhuslik suurus X on binoomjaotusega kirjutame kujul X ~ B(n, p).
Binoomjaotuse tuletamisel me ei sidunud teda mitte mingi konkreetse juhtumiga - binoom-
jaotus on teoreetiline jaotus. Kerkib loomulik ksimus, millised juhuslikud suurused on jaotu-
nud binoomjaotuse jrgi?
ldjuhul on binoomjaotusega tegemist, kui juhuslik suurus X={0, 1, , n} rahuldab
jrgmisi tingimusi:
- juhuslikuks suuruseks X=k on sndmuse esinemise kordade arv: 0, 1, ..., n katse-
seerias pikkusega n;
- igal katsel vaadeldav sndmus toimub tenosusega p, mis on muutumatu kikide
n katse korral ja katsete tulemused on sltumatud.
Nide 5.2. Oletame, et lipilaste teadmiste kontrollimiseks koostati test, mis sisaldab neli
ksimust, millele saab vastata kas jah vi ei. Testi sooritanuiks loetakse kik need
lipilased, kes vastasid igesti ra 3 vi 4 ksimust. ks lipilane ei teadnud ainet ja vastas
kikidele ksimustele juhuslikult. Leida igete vastuste arvu jaotus ja tenosus, et lipilane
sooritas testi edukalt.
Lahendus. Tegemist on neljast katsest koosneva katseseeriaga, milles iga katse korral
arvab lipilane ige vastuse ra tenosusega p=0,5, seega tegu on binoomjaotusega
B(n,p)=B(4, 0.5). Kasutades lal toodud valemit saame leida jaotustabeli
igete vastuste arv x
i
0 1 2 3 4
) p - (1 p
C
= i) (P(n, = )
x
P(
i - n i
i
n
i
0.0625 0.25 0.375 0.25 0.0625
Siit on kerge leida, et testi sooritamise tenosus antud tingimustel on kllaltki suur:
P(X3) = 0,25 + 0,0625 = 0,3125
ja seega ligikaudu iga kolmas ainet mittetundev lipilane sooritab testi.
Leida iseseisvalt, mis juhtub, kui lipilane kirjutab kikidele ksimustele vastuseks
"jah"?
*1 Asjasthuvitatud vivad saadud tulemust kontrollida. Testamiseks vtame lal saadud vrdusest
q p
C
k = q) + (p pn
k - n k
k
n
n
=0 k
1 - n

veelkord tuletise p jrgi. Saame


q p
C k
= q) + (p 1)p - n(n + q) + (p n
k - n 1 - k
k
n
2
n
=0 k
2 - n 1 - n

.
Korrutades nd mlemaid pooli suurusega p on tulemuseks :
q p
C k
= q) + (p p 1) - n(n + q) + (p np
k - n k
n
k
2
n
=0 k
2 - n 2 1 - n

.
Arvestades seoseid q p
C k
=
EX
k - n k
k
n
2
n
=0 k
2

ja p+q = 1, saame EX
2
= np + n(n-1)p
2

Teiselt poolt vastavalt dispersiooni omadustele vime kirjutada
DX = EX
2
- (EX)
2
= np +n(n-1)p
2
- n
2
p
2
= np + n
2
p
2
- np
2
- n
2
p
2
= np(1-p) = npq,
mis annabki testatava tulemuse.
23
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
5.1.3 Poissoni jaotus
Definitsioon ja omadused
tleme, et tisarvulisi vrtusi omav juhuslik suurus k = 0, 1, 2, ... on Poissoni jaotusega,
kui iga vrtuse tenosus on leitav valemiga
e
k!

= p(k)
-
k
, kus jaotuse parameeter > 0 on
konstant. Jaotuse parameetril on oma kindel thendus, mis selgub allpool.
Sobivus. Nitame kigepealt, et toodud valem
e
k!

= p(k)
-
k
sobib ldse juhusliku suuruse
tenosuse jaotuse andmiseks, st kikide vrtuste tenosuste summa vrdub hega:

0 k
1 p(k) .
Tepoolest, on teada e

mratlus summana

0 k
k

k!

e
. Seega saame vga lihtsalt
1 e e
k!

e e
k!

0 k

0 k
k

k


.
Keskvrtus. Leiame Poissoni jaotusega juhusliku suuruse X keskvrtuse:
Seega - jaotuse parameeter ei ole midagi muud kui Poissoni jaotusega juhusliku suuruse
keskvrtus.
Kasutades valemit DX = EX
2
- (EX)
2
saame leida, et Poissoni jaotusega juhusliku suuruse
dispersioon on samuti DX = .
Kokkuvttes saime, et Poissoni jaotuse kasutamiseks on vaja teada vaid hte parameetrit
, mis on nii jaotuse keskvrtuseks kui ka dispersiooniks. Poissoni jaotus on he parameet-
riga jaotus ja teda thistatakse P()
3
.
Rakendatavus. Millised juhuslikud suurused alluvad Poissoni jaotusele?
*3Mtleme korraks ka jaotuse parameetrite thendusele. Kui me teame nt binoomjaotuse pa-
rameetreid n ja k siis on jaotus tielikult kirjeldatud. Jaotuse parameetrite arv ongi mistetav
kui minimaalne komplekt infot, mis jaotuse ra kirjeldab. Poissoni jaotusel oli ainult ks pa-
rameeter, samuti htlasel jaotusel (vrtuste hulga suurus), binoomjaotusel aga kaks. Suva-
lisel diskreetsel jaotusel on parameetreid he vrra vhem kui vrtusi (sest kui vrtuste te-
nosused summeeruvad heks siis saame he vrtuse tenosuse lejnud vrtuste te-
nosuste abil alati leida).
e e =
1)! - (k

e
=
e
1)! - (k

=
e
k!

k
= EX

1 - k
1 = k
- -
k
1 = k
-
k
0 = k



24
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Vaatleme juhuslike sndmuste voogu ajas ning seame eesmrgiks leida kindlas ajava-
hemikus toimuvate sndmuste arvu tenosus. Selliseid protsesse, kus lesande pstitus
vastab toodud snastusele, on tegelikkuses kllaltki palju. Niteks kosmoselaeva tabavate
meteoriitide arv, jrjekorras seisvate inimeste arv, serverile saabuvate prdumiste arv, jne.
Mitte iga sndmuste vooga seotud sndmuse toimumiste arv kui juhuslik suurus ei allu Pois-
soni jaotusele. Poissoni jaotusega on tegemist juhul, kui vaadeldav protsess rahuldab jrgmisi
tingimusi:
- juhuslikuks suuruseks on vaadeldavas ajavahemikus toimuvate sndmuste arv,
- sndmuse toimumine teatud ajavahemikus ei sltu selle ajavahemiku algus- ja
lppmomendist (protsess on statsionaarne),
- kaks sndmust ei toimu samaaegselt (protsess on harilik),
- sndmuste toimumise arv vahemikus ei sltu nende arvust eelmises vahemikus
(protsess on jrelmjuta).
Praktilises elus selliseid kiki nudeid tielikult rahuldavaid ideaalseid protsesse ei
esine, kuid teatud lhendusega saame paljusid juhuslikke suurusi lugeda jaotunuks Poissoni
jaotuse jrgi.
Nide 5.3. Oletame, et meil on tegemist teenindusasutusega, kus iga kliendi teenin-
damiseks kulub 15 minutit. Kaheksa tunnise tpeva jooksul klastab seda asutust keskmi-
selt 20 inimest. Leida tenosus, et korraga on asutuses le kahe kliendi.
le kahe kliendi on asutuses parajasti siis, kui 15 minuti jooksul tuleb rohkem kui
kaks inimest. Keskmiselt tuleb 15 minuti jooksul (vaadeldav ajavahemik) 20 / 4*8 = 0,625
klienti, st = 0,625 ja tegemist on Poissoni jaotusega P() = P(0,625).
Seega leiame tenosuse, et tuleb le kahe kliendi:
P(k>2)= 1 - P(k=0) - P(k=1) - P(k=2) ==1- (0.625
0
e
-0.625
)/1- (0.625
1
e
-0.625
)/1-(0.625
2
e
-0.625
)/2=
=1 0.535 0,335 - 0.105 = 0.026
Seega le poolte klastajatest tulevad kontorisse kui seal pole htegi klastajat ja vaid
2,6% klastajaist neb enda ees vhemalt kahte inimest.
Oletame nd, et pevas klastab seda asutust mitte 20 vaid 40 inimest. Kuidas muutuvad
vastavad tenosused? Leiame = 40 / 32 = 1,25.
132 , 0 224 , 0 358 , 0 286 , 0 1
2!
625 , 0
-
1!
625 , 0
-
0!
625 , 0
- 1
2) p(k - 1) p(k - 0) p(k - 1 = 2) p(k
652 , 0 2 652 , 0 1 652 , 0 0

>

e e e
Seega, antud tingimustel teenindatakse alla kolmandiku klastajaist kohe, kuid 13% neb
enda ees vhemalt kahte klastajat ja peab ootama.
Poissoni piirteoreem
Binoomjaotuse rakendamisel vivad tekkida arvutuslikud raskused. Oletame niteks, et
meil on antud katsete kordamiste arv n=160 ja vaadeldav sndmus vib esineda tenosusega
25
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
0,005. Selleks, et leida tenosust, kus vaadeldav sndmus esineb tpselt 2 korda, peame
leidma
995
0.
005
0.
158! 2!
160!
= P(160,2)
158 2
Kuigi siin saab teha mningaid lihtsustusi, on selle avaldise vrtuse leidmine ikkagi
piisavalt suur t.
Teoreem. Kui juhuslik suurus X on binoomjaotusega B(n,p), siis katsete arvu piiramatul
suurendamisel on binoomjaotus lhendatav Poissoni jaotusega P(), kus =np.
Poissoni jaotus lhendab binoomjaotust kllalt hsti just sndmuse toimumise vikeste
tenosuste korral (p0,1) korral, kusjuures eeldatakse ikka piisavalt suurt katsete arvu. See
tuleneb Poissoni jaotuse olemusest: ksikute sndmuste voog, mille korraga esinemise te-
nosus on vike. Poissoni piirteoreemi vime kirjutada kujul:

e
k!
) (np
= P(np) p) B(n,
np -
k
.
Nide 5.4. Lennufirma andmeil on keskmiselt 200 reisija hulgas ks reisija imikuga. Len-
nukis on 160 reisijakohta ja kaks istet imikutele. Lihtsuse mttes eeldame, et kik reisija-
kohad on alati tidetud. Leida tenosus, et imiku kohtadest tuleb puudus.
See on tpiline binoomjaotuse juhtum (p=1/200=0,005; n=160; k>2), kuid lesande
lahendamine binoomjaotust kasutades on arvutuslikult ebamugav. Minnes le Poissoni
jaotusele saame leida
P(x=0) = e
-
= e
-0.8
= 0,449;
P(x=1) = e
-
= 0.8e
-0.8
= 0,359
P(x=2) =0.5
2
e
-
= 0.8e
-0.8
= 0,143
Otsitav tenosus avaldub vahena:
P(imikuistmetest tuleb puudus) = 1-(0,449+0,359+0,143) = 0,049. Seega kllaltki harva,
vaid 5% juhtudest tuleb imikuistmetest puudus.
26
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
6 PIDEV JUHUSLIK SUURUS
Juhuslikku suurust nimetatakse pidevaks juhuslikuks suuruseks, kui ta vib omandada
vrtusi mingist reaalarvude vahemikust: b)} (a, x : {x X , kus a ja b on reaalarvud ning
eeldame a < b. Kuna suvalises reaalarvude vahemikus on lpmata palju erinevaid vrtusi,
siis ei ole pideva juhusliku suuruse vimalike vrtuste hulk piiratud ja ldjuhul on mingi
konkreetse vrtuse omandamise tenosus vrdne nulliga
4
. Just vrtuste hulga lpmatusest
tulenevalt on pideva juhusliku suuruse ksitlemisel vaja teistsugust lhenemist.
6.1 Juhusliku suuruse jaotusfunktsioon ja tihedusfunktsioon
Juhusliku suuruse X jaotusfunktsiooniks F(x) nimetatakse funktsiooni, mis annab te-
nosuse, et juhuslik suurus X on viksem funktsiooni argumendi vrtusest x. Seega tulene-
valt definitsioonist:
F(x) = P(Xx).
ldjuhul vib juhuslik suurus X omandada kiki reaalarvulisi vrtusi:
)} , ( x : {x X . Sellest tulenevalt saab testada jaotusfunktsiooni jrgmised omadused:
1.
0 F(x) lim
x


Omaduse testamiseks lheme le sndmuse tenosusele ja saame

0 P() ) P(X x) P(X lim F(x) lim
x x


,
kuna tegu on vimatu sndmusega kski arv ei saa olla viksem kui -.
2.
1 F(x) lim
x


Analoogiliselt esimese omaduse testamisele kirjutame

( ) 1 P ) P(X x) P(X lim F(x) lim
x x


,
sest vide, et X on alati tene.
3. Jaotusfunktsioon on mittekahanev, st suvalise kahe arvu a ja b korral, kui a < b,
F(b) F(a).
Testamiseks seome vaadeldavad arvuvahemikud sndmustega:
olgu A sndmus, et X a,
B sndmus,et a

< X b ja
C sndmus, et X b.
Kerge on nha, et kolme sndmuse vahel kehtib seos C = AUB. Kuna sndmused A ja B
on teineteist vlistavad, saame liitmislause phjal P(C) = P(AUB )=P(A) + P(B). Arvestades
nd sndmuste A, B ja C thendusi, vime kirjutada: P(Xb)=P(Xa)+P(a < X b) ja lh-
tudes jaotusfunktsiooni definitsioonist on meil tulemus F(b) = F(a) + P(a

< X b). Kuna te-
nosus on alati mittenegatiivne, siis saamegi siit F(b) F(a).
1. Kui a

< b, siis P(a

< X b) = F(b) - F(a).
See tuleneb vahetult eelmise omaduse testusest.
*4Seetttu pideva juhusliku suuruse X korral P(a

< X b) = P(a X < b) = P(a < X < b) = P(a X b)
27
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Tegelikult vime jaotusfunktsiooni defineerida ka esitatu suhtes vastupidiselt, lhtudes
testatud omadustest.
Definitsioon. Iga funktsioon, mis rahuldab omadusi 1-3 sobib mingi juhusliku suuruse
jaotusfunktsiooniks.
Seda definitsiooni kasutame hiljem selleks, et kontrollida, kas antud funktsioon sobib ld-
se jaotusfunktsiooniks, kas ta aga viks sobida vaadeldavale juhuslikule suurusele tuleb
kontrollida kasutades vastavaid meetodeid (vt. osa 12).
Diskreetse juhusliku suuruse korral oli jaotusfunktsioon mratud kui argumendist vikse-
mate vrtuste tenosuste summa:
) p(x ) x P(X ) F(x
j i i


i j
x x
. Olemuselt midagi sarnast
saame mratleda ka pideva jaotuse korral, kuid siin on tegu lpmatult vikeste osade sum-
maga.
Eeldades jaotusfunktsiooni pidevust kirjutame vlja suhte:
x
F(x) x) F(x +
. Minnes le
piirvrtusele saame leida funktsiooni f(x) kui jaotusfunktsiooni tuletise:
f(x) (x) F
x
F(x) x) F(x
lim
0 x

+

Integreerides vrrandi
f(x) (x) F
mlemaid pooli, vib saadud vrduse kirjutada kujul:

x
f(x)dx F(x) (6.1)
ldjuhul vime elda: kui leidub selline funktsioon f(x), et kehtib vrdus (6.1), siis seda
funktsiooni nimetatakse juhusliku suuruse X tihedusfunktsiooniks ehk lhidalt tiheduseks.
Tihedusfunktsioonil f(x) on jrgmised omadused:
1) f (x) 0 . Tuleneb sellest, et jaotusfunktsioon F(x) on mittekahanev (murru lugeja
ei ole negatiivne) ja
x
F(x) x) F(x
lim (x) F f(x)
0 x
+

avaldub kahe positiiv-


se arvu suhtena.
2)
0 f(x) lim
x


ja
0 f(x) lim
x


. Kuna piirsituatsioonis on jaotusfunktsioon konstantne
F(-)=0 ja F()=1, siis ka tema kasvukiirust vljendav funktsioon f(x) lheneb nulli-
le.
3)


1 f(x)dx . Testus:





x
x x
1 F(x) lim f(x)dx lim f(x)dx
4)
dx f(x) = b) X P(a
b
a

<
. Testus: Tulenevalt jaotusfunktsiooni ja integraali omadustest


<
b
a
a b
f(x)dx f(x)dx f(x)dx F(a) F(b) b) X P(a
Kuna jaotusfunktsioon ja tihedusfunktsioon on omavahel analtiliselt seotud, siis piisab
juhusliku suuruse kirjeldamiseks kskik kumma teadmisest. Jrgnevas kasutame nende va-
helist seost kujul:

x
f(x)dx F(x) vi f(x) (x) F
.
28
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Nagu jaotusfunktsiooni korralgi, vime tihedusfunktsiooni kohta vita: iga funktsioon,
f(x) mis rahuldab omadusi 1-3 sobib mingi juhusliku suuruse jaotusfunktsiooniks.
Jaotusfunktsiooni ja tihedusfunktsiooni omadused nitavad, et ainult teatud kindla kujuga
funktsioonid saavad vljendada juhusliku suuruse tenosuse jaotust. Visuaalse pildi
saamiseks jaotusfunktsiooni ja tihedusfunktsiooni kujust soovitan lugejal, lhtudes nende
omadustest, visandada nende funktsioonide graafikud.
Jaotusfunktsioon (tihedusfunktsioon) kirjeldab tielikult juhusliku suuruse kitumist te-
nosuslikust aspektist. Teades jaotust saame leida vastused paljudele ksimustele, niteks:
milline on juhusliku suuruse vahemikku langemise tenosus, kui tihedalt on vrtused
koondunud oma keskvrtuse mber, milline on juhusliku suuruse oodatav vrtus jne. Seega
me oskaksime kike seda leida, kui vaid teaksime juhuslikule suurusele X vastavat tihedus-
funktsiooni f(x) vi jaotusfunktsiooni F(x). Niteks on juhuslikuks suuruseks lipilase ku-
lutused raamatutele, inimese jala suurus, inimese sissetulek, tealiste inimeste arv jne, jne.
Teades nende juhuslike suuruste jaotusfunktsiooni on vimalik leida niteks tenosuse, et
inimese sissetulek on mingis vahemikus, kui paljude inimeste sissetulek on teatud vahemikus,
kui palju lipilasi kulutab raamatutele rohkem kui x krooni jne. Kuidas aga leida vajalik
jaotusfunktsioon? Osutub, et on vimalik leida terved sarnaselt kituvate juhuslike suuruste
pered, milles juhuslikud suurused kituvad analoogiliselt ja nende jaotusfunktsioonid erine-
vad ksteisest vaid parameetrite vrtuste poolest. Sellest tulenevalt mratletakse teatud
tpjaotused ja ptakse iga uuritava juhusliku suuruse korral mrata, millise tpilise situa-
tsiooni (teoreetilise jaotuse) alla saab teda viia.
Teoreetiliste jaotuste kirjeldamisel ja kasutamisel on vaja teada mningaid juhuslikke
suurusi iseloomustavaid karakteristikuid, mis tulenevad jaotusfunktsioonist (tihedusfunkt-
sioonist). Enne kui vaadelda konkreetseid teoreetilisi jaotusi, ksitleme pidevat juhuslikku
suurust iseloomustavaid parameetreid.
6.2 Pideva juhusliku suuruse arvkarakteristikud
6.2.1 Kvantiilid
Juhusliku suuruse vrtust x
me
, mille korral jaotusfunktsioon omandab vrtuse nimeta-
takse mediaaniks. Seega mediaani korral kehtib F(x
me
)=P(Xx
me
) = . Seega mrab me-
diaan teatud keskmise, nn mediaankeskmise. Niteks, kui vaadeldav juhuslik suurus X on
ttaja palk, siis vrtus x
me
nitab seda arvu, millest vhem saavad pooled ttajad (keskmi-
ne palk kui aritmeetiline keskmine on hoopis midagi muud).
Mediaani korral otsime juhusliku suuruse sellist vrtust, mille korral jaotusfunktsioon
omandab vrtuse . Praktikas, juhusliku suuruse kitumise kirjeldamisel pakuvad sageli
huvi ka teised fikseeritud vrtused, mille korral on vastavale punktile antud oma nimi:
F(x)=P(Xx) = 1/4 - punkt x on alumine kvartiil
F(x)=P(Xx) = 3/4 - punkt x on lemine kvartiil
F(x
k
)=P(Xx
k
) = k/10 - punkt x
k
on k-s detsiil (k=1, 2 , ..., 9)
Misted mediaan, kvartiil ja detsiil on hsti tuntud ldstatistikas ja siinjuures me nendel
eraldi ei peatu. Tegelikult kasutame neid vaid illustreerivate mistetena, et tuua sisse nende
ldistus kvantiili miste. Nimelt on kiki need misted mratletud lhtudes kindlalt ette
29
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
antud tenosusest ning otsitakse juhusliku suuruse vrtust, mille korral jaotusfunktsioon
omandab selle tenosuse.
Seega vime teha ldistuse: arvu x

, mille korral jaotusfunktsioon omandab vrtuse ,


nimetatakse juhusliku suuruse -kvantiiliks. Lhtudes jaotusfunktsiooni thendusest (teno-
sus, et juhuslik suurus on viksem vaadeldavast arvust) vime kirjutada nagu eespoolgi:
F(x

)=P(Xx

) = .
Seega kvantiil x

on juhusliku suuruse vrtus, millest viksemaid vrtusi omandab ju-


huslik suurus tenosusega
5
.
Matemaatiliselt vime -kvantiili defineerida jrgmiselt: kui F(x) on jaotusfunktsioon, siis
vrrandi F(x

) = lahendit x

nimetatakse -kvantiiliks. Vastavatel vrtustel saame siit
kik lalvaadeldud erijuhud. Lhtudes sellest matemaatilisest definitsioonist, vime kvantiili
leidmiseks kasutada prdfunktsiooni mistet:
x

= F
-1
().
Kuna jaotusfunktsioon on tihedusfunktsiooniga ksheselt seotud, siis vime kvantiili de-
fineerida ka lhtudes tihedusfunktsioonist. Lhtudes valemist (6.1), kasutades tihedusfunkt-
siooni, vime -kvantiili vlja kirjutada kui vrrandi f(x)dx ) F(x


lahendi x

. Sellist
tlgendust on mugav kasutada kvantiili x

thenduse graafiliseks kujutamiseks:



Kvantiili mistega on tihedalt seotud tiendkvantiili miste. Nimelt, juhusliku suuruse X -
tiendkvantiiliks

x
nimetatakse arvu, mille korral kehtib vrdus


> ) ( 1 ) ( x F x X P
.
Seega - tiendkvantiil on juhusliku suuruse vrtus, millest suuremaid vrtusi omandab
juhuslik suurus tenosusega (0 1).
Kujutades hel ja samal joonisel (vt allpool) -kvantiili x

ja 1- tiendkvantiili
1
x on
kerge veenduda, et kvantiil ja tiendkvantiil on teineteise kaudu avaldatavad:
x

x
1

(6.2)
Vaata esitatud seost jrgneval joonisel
*5Pidevate juhuslike suuruste korral on iga ksikvrtuse tenosus ldjuhul null
x
f(x
)
Viirutatud pindala suurus =
Kvantiil x

30
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
6.2.2 Keskvrtus
Pideva juhusliku suuruse keskvrtus on analoogiline diskreetse juhusliku suuruse kesk-
vrtusega, ainult et definitsioonis peame summeerimise asemel kasutama integreerimist ja
ksikvrtuse tenosuse asemel kasutame tihedusfunktsiooni.
Definitsioon. Kui f(x) on pideva juhusliku suuruse X tihedusfunktsioon, siis arvu EX, mis
avaldub kujul


xf(x)dx EX nimetatakse pideva juhusliku suuruse keskvrtuseks.
Nide 6.3. Olgu

'

>

<

b x kui 0,
b x a kui ,
a b
1
a x kui 0,
f(x)
juhusliku suuruse X tihedusfunktsioon.
Leida juhusliku suuruse X keskvrtus.
Lahendus. Arvutame:
2 2
1
a - b
1
) ( f
2
b a x
a b
dx x dx x x EX
b
a
b
a
+



Pideva juhusliku suuruse keskvrtuse omadused on samad, mis diskreetse juhusliku
suuruse keskvrtuse korralgi. Nende testamisel tuleb lhtuda pideva juhusliku suuruse
keskvrtuse definitsioonist, eelnevalt on tarvis aga sisse tuua tehted pidevate juhuslike
suurustega. Kesolevas kursuses me neid aga ei ksitle.
6.2.3 Dispersioon
Juhusliku suuruse dispersiooniks nimetatakse arvu:
DX = E(X-EX)
2
.
Kasutades pideva juhusliku suuruse keskvrtuse definitsiooni, saame valemi kujul:
dx f(x) EX) (x DX
2



Saab nidata, et pideva juhusliku suuruse dispersiooni omadused on samad, mis diskreetse
juhusliku suuruse korralgi.

1-
x
x

= x
1
-


(x)
P(X<x

)=


P(X>x
1-
)=

1-
31
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
7 PIDEVA JUHUSLIKU SUURUSE JAOTUSI
7.1 Pidev htlane jaotus
Kige lihtsamaks pideva juhusliku suuruse jaotuseks on pidev htlane jaotus, mis on sar-
nane diskreetse htlase jaotusega. Juhuslik suurus X on ligul [a, b] htlase jaotusega, kui
ligu jaotamisel suvaliseks arvuks vrdse pikkusega osadeks on igasse osaliku sattumise
tenosused vrdsed.
Juhusliku suuruse X pidevaks htlaseks jaotuseks ligul [a, b] nimetatakse jaotust, mille
tihedusfunktsioon avaldub kujul:

'

>

<

b x kui 0,
b x a kui ,
a b
1
a x kui 0,
f(x)
kus a ja b on suvalised reaalarvud.
On kerge veenduda, et selle funktsiooni korral on tidetud tihedusfunktsiooni omadused 1-
3 (vt punkt 6.1) ja seega saab toodud funktsioon olla tihedusfunktsiooniks (soovitan lugejal
vlja joonistada selle funktsiooni graafik). Kui juhuslik suurus X on pideva htlase jaotusega,
siis kirjutame X ~ U(a,b).
Leiame pideva htlase jaotuse jaotusfunktsiooni, keskvrtuse ja dispersiooni.
Jaotusfunktsioon:
a b
a x
t
a b
1
dt
a b
1
f(t)dt F(x)
x
a
x x
a




Keskvrtus:
2
b a
2
) a (b
a b
1
2
x
a b
1
dx
a b
1
x f(x)dx x EX
2 2
b
a
2
+


Dispersioon. Lhtume valemist DX = EX
2
(EX)
2
ning leiame kigepealt:
3
b ab a
3
) a (b
a b
1
3
x
a b
1
dx
a b
1
x f(x)dx x EX
2 2 3 3
b
a
3
2 2 2
+ +


Edasi, kasutades juba arvutatud EX vrtust saame:
12
) b - (a
=
12
b
- 2ab -
a
=
12
a
3 - 6ab -
b
3 -
b
4 + 4ab +
a
4
=
4
) a + (b
-
3
b
+ ab +
a
= DX
2
2 2 2 2 2 2
2
2 2
Nide 7.1. Tramm sidab iga 15 minuti tagant. Ma ei pea meeles trammi peatusest vl-
jumisaegu ja lhen alati trammi ootama juhuslikult. Kui kaua ma pean keskmiselt trammi oo-
tama?
Lahendus. Selle lahendamiseks ei pea ppima tenosusteooriat ja igaks vib tulemuse
peast elda. Antud juhul saame aga kontrollida, kas meie teoorias saadud tulemus peab paika.
Ilmselt on tegu pideva htlase jaotusega X ~ U(0; 15). Tihedusfunktsioonil on kuju

'

>

<

15 , 0
15 0 ,
15
1
0 , 0
) (
x kui
x kui
x kui
x f
ja ooteaja keskvrtus EX= 7,5 minutit.
32
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
7.2 Normaaljaotus
7.2.1 Normaaljaotuse definitsioon
Normaaljaotuseks nimetatakse reaalarvulise juhusliku suuruse jaotust, mille tihedus-
funktsioon avaldub kujul
2
2
2
) (x
e
2
1
(x)


, kus jaotuse parameeter > 0 ja on reaal-
arv.
Normaaljaotuse uurimisel lhtume samast skeemist nagu eelpool toodud jaotuste korralgi:
nitame, et toodud funktsioon sobib tihedusfunktsiooniks ning leiame jaotuse keskvrtuse ja
dispersiooni. Nende omaduste testused ei ole rasked, kuid nuavad mningaid lisateadmisi
ning selle kursuse raames toome vastavad testused vaid joonealuse mrkusena
*2
.
Tihedusfunktsioon (x) on positiivne ja integraal temast vrdub hega
1 dx e
2
1
(x)dx
2
2
2
) (x

Normaaljaotuse keskvrtus ... dx e x


2
1
EX
2
2
2
) (x

Normaaljaotuse dispersioon
2
2
) (x
2
... dx e x) (
2
1
DX
2
2

Nagu nha, on normaaljaotusel kaks parameetrit ja , milledel on kindel sisuline


thendus. Normaaljaotus on kahe parameetriga jaotus, mida thistatakse N(,). Normaal-
jaotuse tihedusfunktsiooni uurimisel vime teha kindlaks jrgmised omadused:
*2 Toodud kolme omaduse testamisel kasutame Poissoni integraali

dt e
t
2
.
1.
1
2
2
2
1
) (
2
2
2
2
) (


dt e dx e dx x
t
x

, kus tegime muutujavahetuse

2
) - (x
= t

ning sellest tulenevalt saime ka
dt 2 = dx
.
2.Keskvrtus

+ +

dt e t dt e dt e dx e x EX
t t t
x
2 2 2
2
2
) 2 (
1
2
1
2
) (

kuna smmeetriline integraal paaritust funktsioonist
e
t
t -
2
vrdub nulliga.
3. Dispersioon

dt e t dx e x DX
t
x
2
2
2
2
2
) (
2
2
2 2
) (
2
1

Edasi kasutame ositi integreerimise reeglit


udv - uv = vdu
ning valides konkreetsel juhul
2
;
t
e v t u


ning sellest tulenevalt
2
2 ;
t
te dv dt du


.
Tehes vastavad asendused saame edasi

+
2
2 2
2 2 2
) 2 ( 2

dt e te t dt te t
t t t
, kuna
esimene liidetav vrdub nulliga (nimetajas on e astmes lpmatus).
33
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
1) tihedusfunktsiooni graafik on smmeetriline sirge x = suhtes (nidata!),
2) moodiks on punkt x = (nidata!),
3) asmptoodiks on x-telg
Tuginedes nendele omadustele vime joonistada vlja normaaljaotuse tihedusfunktsiooni
graafiku kuju:
Sellel graafikul on iseloomulik kuju ja sellist graafikut nimetatakse Gaussi kveraks.
7.2.2. Standardiseeritud normaaljaotus
Suure osa matemaatilise statistika lesannete korral on vaja leida vaadeldava juhusliku
suuruse mingisse vahemikku langemise tenosust, seega leida tenosus P(a < X b), kus
a ja b on lesande pstitusest tulenevad arvud. Tulenevalt jaotusfunktsiooni F(x) omadusest
4 (vt 6.1) saame leida P(a < X b) = P(X b) - P(X a) = F(b) F(a). Seega peame osaka-
ma leida tenosust P(- < X x), kus x thistab meile vajalikku juhusliku suuruse X vr-
tust.
Olgu meil nd tegemist normaaljaotusega. Lhtudes normaaljaotuse definitsioonist
saame selle tenosuse vlja kirjutada kujul:
dx e
2
1
dx (x) F(x) P(X
x
2
) (x x
2
2


< ) x (7.1)
Siin funktsiooni F(x) argument x on integraali lemine raja, kuid jtame selle samuti ka
integraali aluse funktsiooni argumendiks. See ei tekita segadust, kuna mratud integraali
vrtuse leidmine toimub kahes etapis kigepealt leitakse integraali alusele funktsioonile
vastav algfunktsioon ja seejrel leitakse tema vrtus kasutades mratud integraali rajasid.
Kahjuks ei ole lihtsa, elementaarfunktsioonides avalduva algfunktsiooni leidmine aga antud
eksponentfunktsiooni korral vimalik ning seetttu otsitakse mitmesuguseid lihtsustusi. Tsi,
praktilistes arvutustes ei ole tnapeval selle integraali vrtuse leidmise lihtsustamine oluli-
ne, kuna ksitsi arvutamise aeg on mdas. Protseduur normaaljaotusega juhusliku suuruse
X~N(,) jaoks vajalike tenosuste leidmiseks on olemas loomulikult kikides statistilise
andmettluse pakettides, aga samuti ka tabelarvutusssteemides. Niteks tabelarvutussstee-
mis Excel on vastav protseduur
P(Xx)= NORMDIST(x; ; ; true)
tabelarvutusssteemis OpenOffice on see analoogiline
P(Xx)= NORMDIST(x; ; ; 1)

(x)
x
EX
34
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
erinedes vaid tevrtuse andmise poolest.
sna sageli on tarvis lahendada ka prdlesannet leida juhusliku suuruse X vrtus x

,
mille korral tenosus, et ta omandab sellest arvust viksemaid vrtusi on . Seega leida an-
tud tenosusele vastav kvantiil: P(X<x

) = . laltoodud tabelarvutusssteemides saame


seda kirjutada protseduuriga:
x

= NORMINV(; ; ).
Kuigi me ei oska valemit (7.1) vljendada elementaarfunktsioonides vltides integraali
leidmist, saame teda lihtsustada sellisel mral, et tema vrtus on siiski leitav ka ilma arvuti-
ta. Selline lihtsustus leminek nn Laplace'i funktsioonile on oluline nii jrgnevas mate-
maatilise statistika osa ksitlemisel, kuid vimaldab ka mainitud integraali vrtuste leidmist
lihtsate tabelite abil.
Teeme integraalis (7.1) muutujavahetuse

x
z

. Sellel muutujavahetusel on teatud
sisuline thendus: teisendusega x - nihutatakse koordinaattelgede alguspunkt vaadeldava ju-
husliku suuruse keskvrtusele vastavasse punkti (seega uute telgede nullpunkt htib punk-
tiga vanades koordinaattelgedes). Jagamine arvuga muudab skaalat, vttes seal kasuta-
tavaks mduhikuks standardhlbe.
Otsitava tenosuse P(X<x) saame nd vlja kirjutada kujul:
(z) dz e
2
1
dx e
2
1
dx (x) F(x) P(X
z
2
x
2
) (x x
2
2
2
<


z
) x
Sellist teisendust nimetatakse normaaljaotuse standardiseerimiseks ning ning funktsiooni
(z) standardiseeritud normaaljaotuse jaotusfunktsiooniks (ka Laplace'i funktsiooniks).
Standardiseeritud normaaljaotuse tihedusfunktsiooni
2
z
2
e
2
1
(z)

graafik on normaal-
jaotuse graafik, mis on smmeetriline funktsioonitelje suhtes, keskvrtusega punktis z = 0
ning argumenttelje hikuks on standardhlve : Seega vime kirjutada Z ~ N(0,1).
Meie jaoks on edaspidises oluline teada leminekut:

,
_

x
F(x) x) P(X
Normaaljaotuse standardiseerimine ei teinud jaotusfunktsiooni (Laplace'i funktsiooni)
vrtuste arvutamist oluliselt lihtsamaks, ikkagi on tarvis leida integraal astmefunktsioonist ja
ta ei ole avaldatav elementaarfunktsioonide kaudu. Praktikas saadakse kasu aga sellest, et
normaaljaotuse parameetrid (keskvrtus ja standardhlve ) seotakse kokku uues muutu-
jas z ning kasutades Laplace'i funktsiooni kui integraali vrtuste leidmise ligikaudseid mee-
todeid vime iga z korral leida (z) vrtuse. Osutub aga, et argumendi z vrtusi tasub
vaadata vaid vahemikus (-5, +5), kuna vahemikust vlja jvate vrtuste korral vime vtta
nad konstantseteks: (z>5) 1 ja (z<-5) 0. Argumendi ja sellele vastava funktsiooni
vrtused on esitatavad lehekljele mahtuva tabeliga (selline tabel on toodud ka kesoleva
konspekti lpus), leitavad aga ka protseduuriga P(Z z) = NORMSDIST(z,) tabelarvutusss-
teemides.
Edaspidises kasutame palju standardiseeritud normaaljaotuse kvantiile ja tiendkvantiile.
Tuletan meelde, et kvantiile vaadeldakse alati seoses mingi kindla tenosusega, thistame
35
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
selle thega . Sel juhul on -kvantiil juhusliku suuruse kui tihedusfunktsiooni argumendi
vrtus z

., millest viksemaid vrtusi omandab juhuslik suurus Z tenosusega . Tiend-


kvantiil seevastu on vrtus, millest suuremaid vrtusi omandab juhuslik suurus Z te-
nosusega . Visuaalse ettekujutuse saamiseks vastavatest suurustest sobib jrgnev joonis:
Jooniselt on lihtne nha, et tulenevalt tihedusfunktsiooni smmeetriast funktsioonitelje
suhtes on -kvantiil ning vastav -tiendkvantiil omavahel seotud vrdusega


z z (7.2)
mida edaspidises korduvalt kasutame. Samuti, lhtudes smmeetriast ja sellest, et
P(Xz)=(z) vljendub joonisel tihedusfunktsiooni graafiku aluse pindalaga, on kerge nha,
et suvalise punkti z korral kehtib vrdus:
(z)=1-(-z) (7.3)
Seega saime tulemuseks: tenosus, et normaaljaotusega juhuslik suurus X ~ N(,) on
viksem arvust x, leitakse valemiga:

,
_

x
F(x) x) P(X
Sellest tulenevalt saame normaaljaotusega juhusliku suuruse X vahemikku [a,b) lange-
mise tenosuse leida valemiga:

,
_



,
_


<

b
F(a) F(b) b) X P(a
Nide 7.2. Olgu mingil maal, mingis likoolis tudengi lunasgi keskmine maksumus
kuus on normaaljaotusega juhuslik suurus, keskvrtusega 50 krooni ja standardhlbega 15, st
X~N(50, 15). Leida tenosus, et juhuslikult valitud tudengi lunasgi keskmine maksumus
kuus ei leta 20 krooni.
Lahendus. Tulenevalt jaotusfunktsiooni thendusest F(x)=P(X<x), vime vahetult
vlja kirjutada: P(X20) = F(20) = ((20-50)/15) = (-2). Kasutades vastavat tabelit
vi mingit tabelarvutusfunktsiooni
6
saame leida (-2) = 0,0228.
Seega tenosus, et juhuslikult valitud lipilase lunask ei maksa le 20 krooni on
0,0228, ehk teisiti eldes - 2,28 % lipilastest ei kuluta lunasgile le 20 krooni.

*6 Niteks Excelis tuleks kirjutada valem =NORMDIST(20;50;15;TRUE)
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
0,45
-5 -4 -3 -2 -1 0 1 2 3 4 5 -z

P(Z<-z

)=
z

P(Z>z

)=
36
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
7.2.3. 3- reegel
Vastavalt jaotusfunktsiooni omadustele on juhusliku suuruse X vahemikku (a, b) lange-
mise tenosus P(a < X b) = F(b) - F(a). Eeldades, et juhuslik suurus X on jaotunud nor-
maaljaotuse jrgi, saame
)

- a
( - )

- b
( = b) X P(a <
.
Normaaljaotuse standardiseerimisel lksime le uuele skaalale, kus mthikuks standard-
hlbe. Kasutades eespool toodud valemit anname sellele skaalale iseloomustuse, leides milli-
ne osa tenosusest langeb keskvrtusest tisarv kordse hiku kaugusele.
Matemaatiliselt kirja panduna lahendame lesande: leida tenosuse, et normaaljaotusega
juhuslik suurus X ~ N(, ) hlbib oma keskvrtusest vhem kui he-, kahe vi kolme
standardhlbe (hiku) vrra. Seega leiame tenosused:
1 korral, kui a = - , b = + saame
P( < X < + ) = (( + )/) (( )/)=
=(1) - (-1) = 0,8413 0,1587 = 0,6826
2 korral, kui a = - 2 , b = + 2 saame
P( 2 < X < + 2) =(( + 2 ) /) (( 2 - ) /)=
=(2) - (-2) = 0,9772 0,0228 = 0,9544
3 korral, kui a = - 3 , b = + 3 saame
P( 3 < X < + 3) =(( + 2 )/ ) (( 2 )/ )=
=(3) - (-3) = 0,9987 0,0013 = 0,9974
Nendest vrdustest kige huvipakkuvam on viimane, mida snastatakse 3-reeglina: nor-
maaljaotusega juhuslik suurus praktiliselt ei hlbi oma keskvrtusest rohkem kui kolmekord-
se standardhlbe vrra.
7.2.4. Normaaljaotust iseloomustavad tunnused
Millised juhuslikud suurused on normaaljaotusega? Normaaljaotusega juhusliku suuruse
tunnused saame snastada, kui vaatleme tihedusfunktsiooni omadusi ja 3 reeglit.
Olulisteks tunnusteks on:
- normaaljaotusega juhusliku suuruse vrtused on smmeetrilised keskvrtuse
suhtes,
- normaaljaotusega juhusliku suuruse vrtused on koondunud keskvrtuse mber
ja ei erine keskvrtusest praktiliselt rohkem kui kolmekordse standardhlbe vr-
ra,
- juhusliku suuruse tihedusfunktsioonil on Gaussi kverale sarnanev kuju.
Neid kolme tingimust vime praktikas kontrollida konkreetsete andmete phjal, leides
kigepealt keskvrtuse kui aritmeetilise keskmise, hinnates seejrel sagedustabeli smmeet-
riat ja vrtuste hajuvust. Allpool, jrgmises punktis lhtume aga vastupidisest eeldame
normaaljaotust ja tulenevalt oma intuitiivsest ettekujutusest juhusliku suuruse kohta mrame
parameetrid.
37
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
7.2.5 Tplesanded
Nagu eespool tlesime, vimaldab juhusliku suuruse jaotusfunktsiooni (tihedusfunkt-
siooni) teadmine lahendada mitmesuguseid tenosuse arvutamisega seotud lesandeid selle
juhusliku suuruse kohta. Siinkohal lhtume normaaljaotusest, st vaatleme juhtu X ~ N(, ),
kuid kikide lesannete korral vime teha eelduse, et tegemist on mingi teise jaotusega.
Kikide lesannete lahendused phinevad sisuliselt valemil
F(a) F(b) b) X P(a <
. Eri
lesannete korral varieeritakse aga sellega, mis on antud ja mis on otsitav. lesannete vi-
suaalseks ilmestamiseks kasutame toodud valemi tihedusfunktsioonil phinevat esitust

<

b
a
a b
(x)dx (x)dx (x)dx F(a) F(b) b) X P(a
kus otsitavat tenosust thistav pindala on toodud joonisel viirutatud:
Vimalike probleemipstituste nitamiseks lhtume samast lesandest ning snastame eri-
nevaid lesandeid.
Nide 7.2. On kindlaks tehtud, et inimese inteligentsi indeks IQ on normaaljaotusega ju-
huslik suurus X ~ N(125, 10).
A. Leida tenosus, et juhuslikult valitud inimese IQ on
a) viksem kui 110,
b) suurem vi vrdne 130.
Lahendus: a) 067 , 0 ) 5 , 1 ( )
10
125 110
( F(110) 110) P(X

<
Vastus. Tenosus, et juhuslikult valitud inimese IQ on alla 110 on 0,067
b) 0,69 (0,5) )
10
125 130
( 130) P(X 1 130) P(X

<
Vastus. Tenosus, et juhuslikult valitud inimese IQ on le 130 on 0,69
B. Mitme protsendi inimeste IQ asub vahemikus 115-135? Teisiti milline
on tenosus, et juhuslikult valitud inimese IQ asub selles vahemikus?
(x)
a
b
P(X<110)
(x)
110 125
X
P(X130)
(x)
130 125
X
P(115<X<135)
(x)
135 125
X
115
38
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Lahendus:

0,682 0,159 0,841 1) ( (1) )
10
125 115
( )
10
125 135
( F(115) - F(135) 135) X P(115

< <
Vastus. Antud jaotuse korral ~68% inimeste IQ on vahemikus 115-135.
C. Leida millisest arvust on 90% inimeste IQ viksem?
Lahendus: See on eelnevatega vrreldes prdlesanne: teame tenosust ja soovime leida
millisel juhusliku suuruse vrtusel on tidetud etteantud tingimus P(X<x
0,9
)=0,9. See viib
meid kvantiili miste juurde tarvis on leida normaaljaotuse N(125, 10) 0,9-kvantiil.
0,9 )
10
125
( ) F( ) P(X
9 , 0
9 , 0 9 , 0

<
x
x x edasi saame 28 , 1 (0,9)
10
125
1 - 9 , 0

x

ning siit x
0,9
= 125+101,28=137,8
Vastus. 90% inimeste IQ on alla 137,8 punkti.
D. Leida millisest indeksi vrtusest on 5% inimeste IQ suurem?
Lahendus: Kui eelmises lesandes oli tarvis leida kvantiil, siis praegusel juhul tuleb leida
tiendkvantiil. Kasutades kvantiili ja tiendkvantiili vahelist seost:
x

x
1

, vime selle
lesande taandada eelmisele juhule. Nimelt 0,05-tiendkvantiili asemel leiame 0,95-
kvantiili.
E. Leida, millisesse IQ vahemikku kuulub 50% inimestest.
Lahendus: Sellisel kujul ei ole see lesanne heselt lahenduv, kuna selliseid vahemikke
vib olla mitu. Seetttu antakse seda tpi lesannetes mingi lisatingimus. Olgu praegusel ju-
hul selleks niteks leida keskvrtuse suhtes smmeetriline vahemik, kuhu kuulub 50%
inimestest. Juhusliku suuruse vahemikku (x
1
, x
2
) langemise tenosus on mratud valemi-
ga )

- x
( - )

- x
( = ) x < X < P(x
2 1
2 1
. Praegusel juhul on otsitavateks vahemiku ots-
punktid x
1
ja x
2
. Arvestades lisatingimust (smmeetrilised keskvrtuse suhtes) vime kirju-
tada x
1
= ja x
2
= + ning toodud valemis jb ainukese tundmatuna sisse otsitavate
vrtuste erinevus keskvrtusest .
1 - )

( 2 ))

( - (1 - )

( )

( - )

(
)

- ) (
( - )

- ) (
( = ) < X < - P(


+
+
Lahendatavas lesandes oli antud = 10 ja vahemikku langemise tenosus on 0,25.
Asendame need vrtused saadud valemisse: 0,5 1 - )
10
( 2

ja siit leiame hl-


be keskvrtuse suhtes 7 , 6 0,67 10 );
2
0,5 1
(
10

1

+


.
Vastus. Poolte inimeste IQ on keskvrtuse suhtes smmeetrilises vahemi-
kus 125 6,7.
P(X<x
0,9
)=0,9
(x)
x
0,9
=137,8 125
X
115
P(118,3<X<131,7)=0,5
(x)
x=131,7
X
118,7
39
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
7.2.6 Binoomjaotuse lhendamine normaaljaotusega
Eespool diskreetsete juhuslike suuruste ksitlemisel leidsime, et kui vaadeldava sndmuse
esinemise tenosus on vike, siis vastavalt Poissoni piirteoreemile (5.1.3) saab binoom-
jaotust lhendada Poissoni jaotusega. Osutub aga, kui sndmuse esinemise ja mitteesinemise
kordade arvu tenosused on ligikaudu vrdsed, vib binoomjaotuse ligikaudseks arvu-
tamiseks kasutada normaaljaotust. Nimelt kehtivad Laplacei lokaalne ja integraalne piirteo-
reem.
Nende teoreemide jrgi on binoomjaotus B(n,p) lhendatav normaaljaotusega, kus nor-
maaljaotuse keskvrtus ja standardhlve on mratud binoomjaotusega: ) npq N(np, .
Praktikas arvestatakse, et lhendamisel saadakse piisav tpsus juhul kui on tidetud tingi-
mused: np 5 ja n(1-p) 5. Seega, kui sndmuse esinemise tenosus p on ligikaudu 0,5, siis
annab normaaljaotuse kasutamine binoomjaotuse asemel juba vikeste katsete arvu korral
hid tulemusi. Sageli soovitatakse tulemuse tpsuse suurendamiseks kasutada veel parandus-
koefitsienti 0,5, mille kasutamisel tenosuse P(x
1
Xx
2
) asendatakse modifitseeritud te-
nosusega P(x
1
-0,5Xx
2
+0,5).
Laplace'i lokaalne piirteoreem . Tenosus, et n sltumatu katse tulemusena, milles iga-
hes sndmus toimub tenosusega p, toimub sndmus tpselt k korda on piisavalt suure
katsete arvu korral ligikaudu vrdne:
2
x
2
e
npq 2
1
k) P(n,

, kus
npq
np k
x

.
Laplace'i integraalne piirteoreem. Tenosus, et n sltumatu katse tulemusena, milles
iga hes sndmus toimub tenosusega p, toimub sndmus vhemalt k
1
korda ja limalt k
2
korda on piisavalt suure katsete arvu korral ligikaudu vrdne:
)
npq
np k
( )
npq
np k
( ) k : k P(n,
1 2
2 1

Nii Laplace'i lokaalse kui ka integraalse teoreemi sisuline tlgendus on vga lihtne. Kui
vaadelda binoomjaotuse jaotusdiagrammi, siis hendades diagrammi tulpade keskpunktid pi-
deva joonega, saame normaaljaotuse tihedusfunktsiooni graafikuga sna sarnase joone.
Laplace'i teoreemides vaadeldakse seda ainult teisipidi: lhtudes vastavate parameetrite jrgi
joonistatud normaaljaotuse tihedusfunktsiooni graafikust seatakse igale vrtusele vastavusse
tihedusfunktsiooni vrtus kohtadel k = 0, 1, 2, ..., n.
Nide 7.3. Oletame, et tegemist on katseseeriaga, mis koosneb 50 katsest. Meid huvitav
sndmus vib igal katsel toimuda tenosusega p=0.2. Leida tenosus, et vaadeldav snd-
mus
a) toimub tpselt 10 korda,
b) toimub 10-15 korda.
Lahendus. See on tpiline binoomjaotuse lesanne, mida on kasulik lahendada tuginedes
Laplace'i lokaal- ja integraalteoreemile.
40
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Leiame kigepealt abisuurused:
83 , 2 8 8 , 0 2 , 0 50 npq ja
0
83 , 2
2 , 0 50 10

npq
np k
Tenosuse, et vaadeldav sndmus toimub katse 50 kordsel kordamisel tpselt 10 korda
leiame Laplace'i lokaalteoreemi phjal:
0,141 e
2 2,83
1
P(50,10)
0


Tenosuse, et otsitav sndmus toimub 10-15 korda leiame Laplace'i integraalteoreemi
jrgi
0,46 (0) (1,77) )
2,83
10 10
( )
2,83
10 15
(
)
npq
np k
( )
npq
np k
( ) k : k P(n,
1 2
2 1

Vastus. Tenosus, et vaadeldav katse toimub katseseerias tpselt 10 korda on ligikaudu


0,141 ja tenosus, et ta toimub 10-15 korda on ligikaudu 0,46.
7.3 Juhuslike suuruste summa ja ruutude summa jaotus
Eespool me ksitlesime teoreetilisi jaotusi. Iga teoreetilise jaotuse korral mrasime juhus-
liku suuruse vimalikud vrtused, jaotusfunktsiooni ja arvkarakteristikud. Iga teoreetilise
jaotuse korral pdsime kirjeldada, milliste reaalsete protsesside korral vaadeldakse
protsessiga kaasnevat juhuslikku suurust. Praktikas on lugu enamasti vastupidine, st on
olemas mingi reaalne protsess, mis genereerib juhusliku suuruse vrtusi ning juhusliku
suuruse kohta hinnangute andmiseks peame teadma tema jaotust. Vite juhuslik suurus on
mingi jaotusega F testamist ldjuhul vaatleme kursuse lpuosas (vt 13), kuid teatud juhtu-
del tuleneb jaotuse liik aga juhusliku suuruse saamise viisist. Juhislik suurus ei ole alati
seotud mingi protsessi vi katse lbiviimisega, vaid ta lihtsalt on olemas niteks inimese
pikkust saame vaadelda juhusliku suurusena, leida tema jaotuse ja kik arvkarakteristikud.
Nagu juba eespool vaatlesime, vime juhuslike suuruste vahel teha aritmeetilisi tehteid.
Tulemuseks on jllegi juhuslik suurus, millel saame mrata jaotuse ning arvkarakteristikud.
Jrgnevalt vaatleme kesoleva kursuse matemaatilise statistika osas vaja minevaid juhuslike
suurusi:
a) juhuslike suuruste summat
n
X
...
n
X
n
X
n
X ... X X
X
n 2 1 n 2 1
+ + +
+ + +
ja
b) juhuslike suuruste ruutude summat Y
v
= (X
1
)
2
+ (X
2
)
2
+ ... + (X
v
)
2
.
7.3.1 Juhusliku suuruse summa jaotus
Olgu X
1
, X
2
, ..., X
n
juhuslikud suurused ning leiame nende aritmeetilise keskmise
n
X
...
n
X
n
X
n
X ... X X
X
n 2 1 n 2 1
+ + +
+ + +
, mis on samuti juhuslik suurus. On selge, liide-
tavaid juhuslikke suurusi ei saa me valida pris suvaliselt, liites niteks kokku telefoni nu-
mbri, juuste arvu, vanaema pensioni suuruse jne. Aritmeetilise keskmise leidmisel on mtet,
kui eeldame liidetavate arvude hist pritolu, vljendades seda nuetega keskvrtusele,
standardhlbele ja jaotusele.
41
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Tsentraalne piirteoreem. Kui hesuguse jaotusega sltumatud juhuslikud suurused X
1
,
X
2
, ..., X
n
on hise keskvrtusega ja dispersiooniga
2
, siis nende juhuslike suuruste arit-
meetilise keskmise X
n
1
= X
i
n
1 = i

jaotus liidetavate arvu n kasvamisel lheneb normaal-


jaotusele.
Paneme thele, et liidetavate juhuslike suuruste X
i
korral me ei nua mingit konkreetset
jaotust, vaid ainult seda, et neil peab olema sama jaotus, sama keskvrtus ja sama standard-
hlve. Mida suurem on liidetavate arv, seda tpsemalt kirjeldab aritmeetilise keskmise kitu-
mist normaaljaotus. Piisavalt hea lhend saadakse ldiselt juba siis, kui liidetavate arv letab
60 piiri.
Erijuhul, kui liidetavate juhuslike suuruste eeldatav hine jaotus on normaaljaotus, seega
X
i
~ N(,), siis on aritmeetiline keskmine normaaljaotusega ka vikese liidetavate arvu kor-
ral. See tuleneb sellest, et normaaljaotusega juhuslike suuruste liitmisel saame ikka normaal-
jaotusega juhusliku suuruse, seega on aritmeetiline keskmine X
n
1
= X
i
n
1 = i

sellistel tingi-
mustel alati normaaljaotusega.
7.3.2 Juhusliku suuruse ruutude summa jaotus
1 Standardse normaaljaotusega sltumatute juhuslike suuruste X
1
, X
2
, ... , X
v
ruutude sum-
ma Y = (X
1
)
2
+(X
2
)
2
+ ... + (X
v
)
2
on
2
-jaotusega ( hii-ruut jaotusega)
*3
juhuslik suurus : Y ~

2
(v). Liidetavate arv v on
2
- jaotuse parameeter, mida nimetatakse vabadusastmete
arvuks.
Paneme thele, et liidetavad juhuslikud suurused peavad olema standardse normaal-
jaotusega X
i
~ N(0,1).
2
- jaotust kasutatakse matemaatilises statistikas dispersiooni kohta
tehtavate hinnangute leidmisel, sltuvuse kindlaks tegemisel ja mujal.
*3 Lhtudes eespool kasutatud jaotuse defineerimise viisist vime mratleda: pidev juhuslik suurus Y on hii
ruut jaotusega Y ~
2
(v), kui tema tihedusfunktsioon on antud valemiga
2
2
1
2
)
2
( 2
) (
y
v
v
e
v
y
y


, kus



0
1
) ( dt t e x
x t
ja v on tisarvuline parameeter. Saab nidata, et
2
- jaotuse keskvrtus EX = v ja dis-
persioon DX = 2v. Alljrgnevas vime aga hii-ruut jaotuse definitsiooni ra unustada. Meid huvitavad vaid
2
-
jaotuse tiendkvantiilid, mille leidmiseks kasutame vastavat tabelit.
42
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
8 TENOSUSTEOORIA PIIRTEOREEMID
Tenosusteooria piirteoreemid loovad seose tegelikkuses esinevate juhuslike protsesside-
ga mratud juhuslike suuruste karakteristikute ja teoreetiliste jaotuste parameetrite vahel.
Piirteoreemid on rakendatavad juhuslike suuruste jada korral ning nad nitavad jada koondu-
mist teatud nitaja (jaotusfunktsiooni, tenosuse, keskvrtuse) jrgi. Tegelikult me eespool,
punktis 7.3.1 juba vaatlesime hte piirteoreemi, nn tsentraalset piirteoreemi, mis vljendas
koondumist jaotusfunktsiooni jrgi. Allpool ksitleme veel kahte piirteoreemi, millel on prak-
tikas suur thtsus. Lhtudes esituse lihtsustamise pdest on teoreemid toodud mitte eriti ran-
ges snastuses.
8.1 Tsebsevi suurte arvude seadus
Kui X
1
, X
2
, ...,X
n
on

hise keskvrtusega ja dispersiooniga
2
sltumatud juhuslikud
suurused, siis kehtib 1
n
S
P lim
n
n

,
_

<

, kus S
n
on juhuslike arvude summa X
=
S i
n
1 = i
n
ja
on kuitahes vike arv.
Teisiti eldes - samatbiliste juhuslike suuruste aritmeetiline keskmine lheneb nende ju-
huslike suuruste hisele keskvrtusele. Juhusliku suuruse keskvrtus on kindlal viisil defi-
neeritud arvuline vrtus. Keskvrtuse leidmiseks peab diskreetse juhusliku suuruse korral
teadma tema vimalike vrtuste loetelu ja nende omandamise tenosusi; pideva juhusliku
suuruse korral on aga tarvis teada tihedusfunktsiooni. Praktikas ei ole alati vimalik kasutada
neid keskvrtuse definitsioone ning siin tulebki appi Tsebevi suurte arvude seadus, mis
vimaldab keskvrtuse ligikaudset hindamist.
Kokkuvttes: juhusliku suuruse keskvrtuseks vib vtta juhuslike suuruste summa arit-
meetilise keskmise, kui aritmeetiline keskmine on leitud piisavalt suure liidetavate arvu kor-
ral. Niteks, kui juhusliku suurusena vaatleme kutsealuste pea mbermtu, siis selle juhusli-
ku suuruse keskvrtuse saame leida mtes ra piisavalt suure hulga kutsealuste pea mber-
mte ja leides saadud arvude aritmeetilise keskmise. See keskvrtus ei aita meid veel
mrata kui palju ja millistes suurustes mtse peame varuma.
8.2 Bernoulli suurte arvude seadus
Kui n hesuguse katse tulemusena vaadeldav sndmus A toimub k korda, siis
1 p
n
k
P lim
n

,
_

<

, kus on kuitahes vike arv ja p on sndmuse A toimumise tenosus
hel katsel.
Teisiti eldes katse kordamisel lpmatult palju arv kordi lheneb sndmuse toimimise
sagedus sndmuse esinemise tenosusele.
Bernoulli suurte arvude seadus tuleneb Tsebevi suurte arvude seadusest ja on tema eri-
juht. Selle nitamiseks oletame, et juhuslikud suurused X
1
, X
2
, ...,X
n
vivad omandada vaid
vrtusi 0 ja 1 (seega erijuht ldisest). Olgu iga juhusliku suuruse korral vrtuse 1 oman-
damise tenosus hesugune ja thistame P(X
i
= 1) = p. Sel juhul on juhusliku suuruse kesk-
vrtus EX
i
= p ja dispersioon DX
i
= p(1-p). Tlgendame vaadeldavat juhuslikku suurust X
i
43
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
selliselt, et ta omandab vrtuse 1, kui toimub meid huvitav sndmus, ja 0 - kui sndmust ei
toimu. Sellisel juhul thendab summa S
n
= X
1
+ X
2
+ ... + X
n
sndmuse toimumise kordade
arvu k ja jagatis
n
Sn
on sndmuse toimumise suhteline sagedus katse kordamisel n korda.
Pannes saadud tulemused Tsebsevi suurte arvude seadusse, saamegi Bernoulli suurte arvude
seaduse.
Bernoulli suurte arvude seadus annab vimaluse koguda andmeid vaadeldavate sndmuste
esinemise sageduste kohta ning koostada vastavad jaotustabelid. Niteks, elektroonikakauplus
peab arvestust tootjatehaste kaupa, mitu hikut tuuakse remonti mdud asjade kohta.
Piisavalt suurte mgikoguste korral vib selle mgistatistika phjal, tuginedes Bernoulli
suurte arvude seadusele vita, et tenosusega p(A) tuuakse tehase A toodang remonti, te-
nosusega p(B) tehase B toodang jne.
Selline sageduse ja tenosuse sidumine on niivrd loomulik, et vib isegi tekitada sega-
dust. Nii niteks pris ks lipilane: Kui mul on plaanis visata mnti 20 korda. Oletame, et
peale 15. viset on kull tulnud vlja 9 korda ja kiri 6 korda. Kuna kulli ja kirja vljatulemise
tenosused on vrdsed, siis peab jrgmise 5 viske korral kull tulema vlja 1 kord ja kiri 4
korda.
Kuidas see on seotud Bernoulli suurte arvude seadusega?
44
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
M A T E M A A T I L I N E S T A T I S T I K A
Matemaatiline statistika on matemaatika haru, mis ksitleb statistiliste andmete kogumist,
ttlemist ja nende phjal jrelduste tegemist. Statistilised andmed on katse-, vaatlus-, mt-
mis- ja ksitlusandmed vi muud eksperimendi lbiviimisel saadud andmed. Matemaatiline
statistika sisaldab endas mitmeid teooriaid, mis vaatlevad statistiliste andmestike ksitlemise
eri aspekte: katsete ja vaatluste lbiviimine (katseplaneerimise teooria), statistiliste hpoteesi-
de kontrollimine (hpoteeside teooria), mudelite parameetrite mramine (hinnangute
teooria), tunnustevaheliste seoste avastamine ja kirjeldamine (korrelatsioonanals, kom-
ponentanals, faktoranals ja kanooniline anals), tunnuse vrtuste prognoosimine (reg-
ressioonanals, dispersioonanals, kovariatsioonanals), objektide eristamine ja rhmi-
tamine (diskriminantanals, klasteranals), ajas muutuvate juhuslike nhtuste uurimine
(aegridade teooria) jpt.
Matemaatilise statistika philesandeks on valimi phjal jrelduste tegemine ldkogumi
kohta. Seda kikide lalmainitud teooriate korral. Kesolevas kursuses lhtume samuti va-
limist ning valimi statistikute phjal anname hinnangu ldkogumi teatud karakteristikutele.
Toome sisse kahte liiki hinnangud punktihinnang ja vahemikhinnang. Vahemikhinnang on
aluseks ka hpoteeside testamisel ldkogumi karakteristikute vi ldkogumi tunnuste vahe-
liste seoste kohta. Nagu eessnas eldud, tahame juda asja olemuseni, st vaadelda meetodi
saamist ja olemust, jttes rakendusliku klje philiselt edasiste kursuste lesandeks.
9 Error: Reference source not foundLDKOGUM JA VALIM
9.1 ldkogumi ja valimi mratlus
ldkogum. ldkogum on mingil printsiibil mratletud, vaatluse alla vetav objektide
koguhulk, niteks kikide Eesti lipilaste hulk, kikide Scania tpi busside hulk, raamatu-
kogu kikide raamatute hulk jne.
Tunnus. Iga objekti iseloomustavad temal mdetud tunnused, niteks lipilaste korral:
sissetulek kuus, telefoniarve suurus, televiisori olemasolu, pikkus, kaal jne. ldkogumi iga
objekti tunnuste vrtused on tpselt mratud (lipilase A sissetulek kuus 300 eurot,
telefoniarve 16 eurot, televiisor - ei ole jne).
Tunnuse jaotus. Iga arvulist tunnust vib vaadelda kui juhuslikku suurust, mis omandab
vrtusi kindlast vahemikust (niteks pikkus 100 250 cm). Iga tunnuse, kui juhusliku
suuruse, korral saame leida tema jaotuse. Jaotusfunktsiooni (tihedusfunktsiooni) kuju mrab
juhuslikule suurusele vastava teoreetilise jaotuse tbi (normaaljaotus, eksponentjaotus, jne).
ldjuhul ei ole jaotuse tp teada ja tuleb mrata vastavate meetodite abil. Erijuhul vib
tunnuse jaotus olla teada, niteks leitud eelnevate uuringutega.
Karakteristik. ldkogumi iga tunnuse korral vib leida seda tunnust iseloomustavad
karakteristikud, niteks keskmine vrtus, hajuvus keskmise vrtuse suhtes, smmeetria
kordaja, mediaan jne. Kik karakteristikud arvutatakse kindlate eeskirjade jrgi ja nende vr-
tused on konkreetse ldkogumi korral heselt mratud arvulised suurused.
Valim on ldkogumist valitud objektide hulk. Valimi tegemise eesmrk on hinnata meid
huvitavaid ldkogumi karakteristikuid valimi abil. ldkogumi hindamiseks kasutatav valim
45
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
peab olema piisavalt suur ja koostatud juhuslikult, st ldkogumi iga objekt vib sattuda ld-
kogumisse vrdse tenosusega. Viimane tingimus on praktiliselt tidetud piisavalt suurte
ldkogumite korral, kus he objekti vtmine valimisse praktiliselt ei muuda teiste objektide
valimisse sattumise tenosust ja kasutatakse objekti juhuslikkusel phinevat valikut. Vikes-
te ldkogumite korral tuleb arvestada mitmeid erisusi. Niteks kas juba valimisse valitud
objekt saab teistkordselt sattuda valimisse, jne. Siin tulevad mningad tpsustused kasuta-
tavatesse valemitesse, kuid kesolevas loengus me lhtume philiinist ja neid ei ksitle.
Hinnang. Hinnang on valimi phjal arvutatud arvuline vrtus (punktihinnang) vi vr-
tuste vahemik (vahemikhinnang), mis seatakse vastavusse ldkogumi karakteristikuga. Reeg-
lina ei ole saadud hinnang tpne, mistttu kasutamisel tuleb arvestada tema vimaliku vea
suurust ja tenosuslikku hinnangut tpsusele.
Milliseid ldkogumi karakteristikuid soovitakse hinnata, sltub uurimise eesmrgist. See-
juures vib pstitatud lesandeks olla he tunnuse karakteristikute (keskvrtus, dispersioon,
smmeetria, jne) leidmine, kahe tunnuse vahelise sltuvuse kindlaks tegemine, he tunnuse
vrtuste prognoosimine teiste phjal jne. Eri probleeme ksitlevad matemaatilise statistika
eri harud. Kesolevas kursuses ksitleme mningaid neist ja vaatleme erinevaid metoodikaid
tulemuse saavutamiseks.
9.2 ldkeskmine ja dispersioon
Olgu N objekti, mis moodustavad ldkogumi ja vtame vaatluse alla he, objekte iseloo-
mustava arvulisi vrtusi omava tunnuse. Tavaelus on tunnusel nimi, olgu selleks siis sisse-
tulek, pikkus, laius vi muud sarnast. Meie thistame tunnuse thega X. Kui me m-
dame selle tunnuse vrtuse kikidel ldkogumi objektidel, saaksime tema vrtuste jada: X
= {x
1
, x
2
, ..., x
N
}, kus x
i
thistab i-nda objekti vaadeldava tunnuse vrtust. Selle tunnuse
osas iseloomustavad ldkogumit tunnuse teatud karakteristikud, niteks tunnuse keskmine
vrtus (niteks, keskmine palk), tunnuse maksimaalne vrtus (kige suurem palk), tunnuse
mediaan (millisest summast vhem saavad palka pooled inimesed) jne. Kuna alljrgnevas k-
sitluses lhtume alati hest nn. vaadeldavast tunnusest, siis enamasti jtame selle tekstis rhu-
tamata ja rgime ldkogumist kui kikidel objektidel mdetud tunnuse vrtuste hulgast.
Niteks, olgu ldkogumiks Tartu likooli lipilaste koguhulk. Igal lipilasel vime
mta terve rea tunnuseid: kulutused raamatutele aastas, aasta sissetulek, lipilase pikkus,
hinne tenosusteoorias, laste arv jne. Alljrgnevas vaatleme juhtu, kus uurimise alla ve-
takse vaid ks tunnus, niteks kulutused raamatutele. Seega vime vaadelda ldkogumit
(selle tunnuse osas) kui statistilist rida, kus iga arv vastab he lipilase kulutustele. ldistus-
te tegemiseks on vaja seda rida kui tervikut iseloomustavaid nitajaid: milline on keskmine
kulutus, milline on maksimaalne kulu raamatutele, milline on hajuvus keskmisest kulust jne.
Kesoleva kursuse raames ei jua me vaadelda kikvimalikke nitajaid, vaid piirdume
ldkogumi (vaadeldava tunnuse!) uurimisel kahe karakteristikuga: ldkeskmine ja disper-
sioon ehk ruuthlve ldkeskmise suhtes. Need karakteristikud defineeritakse jrgmiste vale-
mitega:
ldkeskmine: x
N
1
=
i
N
1 = i

ja dispersioon:
) -
x
(
N
1
=
i
2
N
1 = i
2

.
46
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Suurust nimetatakse standardhlbeks (ehk vaadeldava tunnuse standardhlbeks ldkeskmise
suhtes ldkogumis).
9.3 Valimikeskmine ja dispersioon
Nagu nha, ei ole meie poolt defineeritud ldkeskmine mitte midagi muud kui tunnuse
vrtuste aritmeetiline keskmine (niteks keskmine kulu raamatutele), standardhlve iseloo-
mustab aga tunnuse vrtuste hajuvust ldkeskmise suhtes (kas eri lipilaste kulutused on
vga erinevad). Nii ldkeskmine kui ka tema standardhlve on kindla ldkogumi korral he-
selt mratavad arvulised vrtused (arvkarakteristikud). Praktikas huvitab meid just nende
kui teste vrtuste leidmine. Kui ldkogum on vike, siis ei valmista nende leidmine
raskusi ja kik arvutatud vrtused on absoluutselt tpsed. Sageli on ldkogum aga kas liiga
suur vi ajas pidevalt muutuv ning vajalike nitajate leidmine vahetult ldkogumi phjal
raske vi vimatu. Seetttu tehakse ldkogumist vljavte (valim) ja arvutatakse valimi tea-
tud statistilised nitajad (statistikud) ning saadud tulemused vetakse ldkogumi arvkarak-
teristikute vrtuste hinnangute aluseks. Enamasti kasutatakse ldkogumi karakteristikute hi-
ndamiseks valimi phjal analoogilisi arvutusvalemeid nagu ldkogumiski, kus vajalikud
arvutused tehakse vaid valimisse sattunud objekte arvestades. Alati see aga nii ei pruugi olla
ja seetttu vaatleme allpool hindamisvimalusi tpsemalt.
Olgu ldkogumi phjal tehtud n objektist koosnev valim X = {x
1
, x
2
, ..., x
n
}, kus x
i
(i
= 1,..., n) on valimisse valitud i-ndal objektil mdetud tunnuse vrtus. Defineerime va-
limikeskmise ja dispersiooni alljrgnevalt:
valimikeskmine: x
n
1
= X
i
n
1 = i

ja valimidispersioon: ) X -
x
(
1 - n
1
=
s
i
2
n
1 = i
2

,
kus s on valimi(keskmise) standardhlve.
ldkogumist saab teha mitmeid erinevaid valimeid. Kui ldkeskmine ja tema standard-
hlve on antud ldkogumi korral heselt mratud arvulised suurused, siis valimikeskmine
X
ja valimi standardhlve s on heselt mratud vaid iga konkreetse valimi korral, ldjuhul
sltub nende vrtus saadud valimist. Selleks, et valimi phjal saaks ldse anda hinnanguid
ldkogumile, on nutav, et valim oleks juhuslik. See thendab, et valimisse kuuluvad objek-
tid valitakse juhusliku protsessi tulemusena, kus igal ldkogumi objektil on vrdne vimalus
sattuda valimisse. Kuna valim on juhuslik, siis on nii valimikeskmine, valimi standardhlve
kui ka teised valimi phjal arvutatud vrtused juhuslikud suurused (nende vrtused sltu-
vad sellest, millised ldkogumi elemendid sattusid valimisse).
Selleks, et valimi phjal leitud juhuslike suuruste alusel vtta vastu mingitki otsustust,
peame kindlaks tegema vastava juhusliku suuruse iseloomu: tema jaotuse ja arvkarakteristi-
kud.
9.4 Valimikeskmine kui juhuslik suurus
Valimikeskmist kasutatakse ldkeskmise hindamisel. Kuna valimikeskmine
X
on juhus-
lik suurus, siis saab loomulikult ka tema phjal tehtud hinnang olla vaid teatud tpsusega hi-
nnanguks. Hinnangu tpsuse mratlemiseks on tarvis teada valimikeskmise kui juhusliku
suuruse phiparameetreid: keskvrtust, dispersiooni ja jaotust (jaotus- vi tihedusfunkt-
47
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
siooni). Paneme thele, et meil on tegu valemina antud juhusliku suurusega x
n
1
= X
i
n
1 = i

ning
tema arvkarakteristikute leidmiseks peame rakendama keskvrtuse ja dispersiooni leidmise
eeskirja sellele valemile tervikuna.
Valimikeskmise keskvrtus. Vastavalt diskreetse juhusliku suuruse keskvrtuse defi-
nitsioonile saame tema (valimikeskmise) keskvrtuse ) X E( leida jrgmiselt



n
1 i
i
n
1 i
i
Ex
n
1
) x
n
1
E( X E
Kuna x
i
on ldkogumi suvaline element elementide hulgast {x
1
, x
2
, ..., x
N
}, siis eeldusel, et
iga ldkogumi elemendi valimisse sattumise tenosus on hesugune p(x
i
)=1/N. Tulenevalt
keskvrtuse definitsioonist ning kasutades ldkeskmise definitsiooni, vime iga valimisse
sattunud elemendi keskvrtuse Ex
i
arvutada:



N
1 k
k k
N
1 k
k i

N
1
x ) p(x x Ex
(9.1)
Paneme selle tulemuse lemisse valemisse ja saame valimikeskmise keskvrtuse:

n
1
Ex
n
1
X E
n
1 i
n
1 i
i



(9.2)
Kokkuvttes - valimikeskmise keskvrtus on vrdne ldkeskmisega.
Valimikeskmise dispersioon. Vaatame nd teist, valimikeskmist kui juhuslikku suurust
iseloomustavat arvkarakteristikut dispersiooni. Valimikeskmise
X
dispersiooni ) X D(
saame leida valemiga:
n

n
n
Dx
n
1
) x
n
1
D( ) X D(
2
2
2 n
1 i
i 2
n
1 i
i




, (9.3)
kus x
i
thistab suvalist valimisse sattunud ldkogumi elementi. Toodud valemis kasutasime
nagu lalpoolgi ra seda, et kuna iga ldkogumi element vib sattuda valimisse vrdse te-
nosusega 1/N, siis

= ) -
x
(
N
1
= )
x
p( ) -
x
( = )
x
p( )
Ex
-
x
( = )
Ex
-
x
E( =
Dx
2
2
k
N
1 = k
k
2
k
N
1 = k
k
2
k k
N
1 = k
2
i i i
(9.4)
Tavaliselt thistatakse valimikeskmise dispersiooni
2
X
) X D( . Saadud tulemuse (9.3) vime
snastada jrgmiselt: valimikeskmise dispersioon sltub ldkogumi dispersioonist ja vheneb
valimi mahu kasvades. Tegelikkuses on see igati ootusprane ja loogiline tulemus.
Kokkuvttes saime tulemused
X E ja
n

2
2
X
.
Suurust
n

X

nimetatakse valimikeskmise standardveaks.
Valimikeskmise jaotus. Leidmata on veel kolmas valimikeskmist kui juhuslikku suurust
iseloomustav nitaja tema jaotus.
Paneme thele, et nende definitsioonist, on ldkeskmine ja ldkogumi standardhlve
mratud kogu vastava tunnuse jaoks tervikuna. Valimikeskmise
X
keskvrtuse ja disper-
48
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
siooni leidmisel saime vahetulemused (9.1) ja (9.4), mis nitavad, et suvalise valimisse vali-
tud elemendi x
i
keskvrtus on vrdne ldkeskmisega Ex
i
ning dispersioon ldkogumi
dispersiooniga

=
Dx
2
i
.
Seega on valimikeskmine
X
sama keskvrtuse ja dispersiooniga mratud juhuslike
arvude aritmeetiline keskmine. Vastavalt tsentraalsele piirteoreemile (vt. 7.3.1) on va-
limikeskmine kui aritmeetiline keskmine piisavalt suure liidetavate arvu korral (piisavalt suu-
re valimi korral) jaotunud normaaljaotuse jrgi:
)
n

, N( ) , X N(E ~ X
X

. Erijuhul, kui
vaadeldav tunnus X on normaaljaotusega, on valimikeskmine
X
, kui normaaljaotusega ju-
huslike suuruste summa, jaotunud normaaljaotuse jrgi ka vikeste valimite korral.
9.5 Valimi standardhlve kui juhuslik suurus
Nagu valimikeskmine
X
, nii on ka valimi standardhlve
) X -
x
(
1 - n
1
=
s
i
2
n
1 = i

juhuslik
suurus ning me vime leida tema, kui juhusliku suuruse, karakteristikud. Kesolevas kursuses
huvitab meid vaid tema keskvrus.
Saab nidata (vt joonealune mrkus), et kui ldkogumil on lplik dispersioon
2
, siis
statistiku s
2
keskvrtuseks on samuti
2
, st
2 2
Es
.
*6
Toodud testusest on nha, et see tulemus kehtib ainult juhul, kui murru nimetaja on n-1,
mitte n.
*6 Testamiseks teisendame kigepealt valimi standardhlbe valemit:
] ) - X n( - ) -
x
( [
1) - (n
1
= ] ) - X n( + ) - X 2n( - ) -
x
( [
1) - (n
1
=
= ) ) - X ( + ) - X )( -
x
2( - ) -
x
((
1) - (n
1
= ) ) - X ( - ) -
x
((
1) - (n
1
=
s
2 2
i
n
=1 i
2 2 2
i
n
=1 i
2
i
2
i
n
=1 i
2
i
n
=1 i
2




Edasi vime kirjutada
2 2 2
] [

n ] ) - X nE( - ) -
x
E( [
1) - (n
1
=
Es
2 2
i
n
=1 i
2
mida oligi tarvis testada.
Toodud testusest selgub htlasi, miks on valimi standardhlve definitsioonis jagatud suurusega n-1.
49
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
10 LDKOGUMI KARAKTERISTIKUTE PUNKTIHINNANG
ldkogumi tunnuse karakteristiku punktihinnanguks nimetatakse valimi phjal teatud
eeskirjade jrgi arvutatud vrtust. Kuna valim on juhuslik, siis arvutatud vrtus on samuti
juhuslik. Sellist vrtust nimetatakse ldkogumi karakteristiku hinnanguks. ldiselt vib
punktihinnangu leida erinevate arvutuseeskirjade jrgi, kusjuures eri eeskirjade jrgi saadavad
tulemused on enamasti erinevad. Vaatleme lihtsat nidet: oletame, et bensiini 95 keskmise
maksumuse leidmiseks tehti ksitlus 12-nes tanklas ja saadi jrgmised hinnad:
1,24; 1,20; 1,22; 1,26; 1,19; 1,22; 1,24; 1,24; 1,25; 1,26; 1,20; 1,22
Hinnangu bensiiniliitri keskmise maksumuse kohta vime saada mitmel viisil.
1) Kasutades ldkeskmise ( liitri keskmise hinna) leidmiseks valimikeskmist, saame
x
n
1
= X
i
n
=1 i

=(1,24+1,2+1,22+1,26+1,19+1,22+1,24+1,24+1,25+1,26+1,2+1,22)/12=1,228
2) Kasutades hinnanguks poolt maksimaalse ja minimaalse hinna summast, saame
=(1,19+1,26)/2=1,22
3) Kasutades saadud variatsioonrea kahe keskmise vrtuse poolsummat, saame
=(1,22+1,24)/2=1,23
Antud juhul on tulemused peaaegu vrdsed, kuid nad ei pruugi seda alati olla. Tekib ksi-
mus, kas on olemas reeglid sobiva hinnangu valimiseks? Millist hinnangut lugeda sobivaks?
Efektiivse punktihinnangu miste. ldkogumi karakteristiku hinnangut nimetatakse efek-
tiivseks hinnanguks, kui hinnang on nihketa ja hinnangu standardhlve vheneb valimi mahu
kasvades.
Valimi phjal arvutatud juhusliku suuruse vrtust nimetatakse ldkogumi karakteristiku
nihketa hinnanguks, kui selle juhusliku suuruse keskvrtus on vrdne hinnatava karak-
teristikuga.
Kui vaatleme nd laltoodud kolme erinevat hinnangut, kus hinnatavaks suuruseks on
ldkeskmine , siis esimesel juhu jaoks testasime, et
= X E
. Teise ja kolmanda juhu jaoks
sellist vrdust ldjuhul testada ei saa ning E ja E . Seega vime vita, et va-
limikeskmine on ldkeskmise nihketa hinnanguks.
Hinnangu sobivuse teiseks nitajaks on hinnangu hajuvus, mida iseloomustatakse hinnan-
gu standardhlbega. Mida viksem on hajuvus hinnatava karakteristiku suhtes, seda parem on
kasutatav hinnang. ldiselt nutakse, et hinnangu hajuvuse saab teatud tingimustel teha
kuitahes vikeseks.
Kasutades ldkeskmise hinnanguna valimikeskmist, on hajuvus mratud valimikesk-
mise standardveaga
n

X

. Sellest valemist on nha, et valimi mahu suurendamisega
(n), saab muuta hajuvuse kuitahes vikeseks.
Nihketa hinnangut, mille standardviga lheneb nullile, nimetatakse efektiivseks punktihi-
nnanguks. Tuginedes laleldule vime elda, et valimikeskmine on ldkeskmise efektiiv-
seks hinnanguks.
50
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
11 LDKOGUMI KARAKTERISTIKUTE VAHEMIKHINNANGUD
Punktihinnang annab uuritava suuruse kohta heselt mratud vrtuse, mida on lihtne
kasutada. Punktihinnanguid kasutatakse niteks mitmesuguste ksitluse korral: mitu protsenti
inimesi toetab hte vi teist erakonda, milline on toidukorvi keskmine maksumus, kui palju
raha kulutab lipilane keskmiselt raamatute ostmiseks jne. On tiesti selge, et saadud hi-
nnang on ligikaudne ja on oluline teada, milline on hinnangu tpsus. Tpsuse arvesse vtmata
jtmine annab vimaluse tulemustega mngimiseks. Niteks, kui he erakonna pooldajate
protsent muutus he protsendipunkti vrra, siis saab sellest kirjutada pikki artikleid ja otsida
phjendusi poolt ja vastu. Tegelikkuses vis phjus olla vaid selles, et mlemad tulemused
jid hinnanguvea piiridesse ja mingit sisulist muutust ei toimunudki.
Punktihinnangut on kll mugav kasutada, kuid ta ei pruugi olla eriti usaldusvrne. Roh-
kem informatsiooni sisaldab vahemikhinnang. Vahemikhinnangu korral leitakse vahemik,
millesse hinnatav karakteristik kuulub ning antakse hinnang usaldatavusele.
Nide 11.1 Toidule hes ndalas tehtavate kulutuste suuruse uurimiseks ksitleti juhusli-
kult 64 toidukaupade ostjat ja saadi euro tpsusega jrgmised vastused:
104; 141; 106; 25; 98; 93; 36; 145; 129; 77; 96; 6; 16; 84; 83; 32; 116; 47; 112; 79; 111; 132; 61;
100; 103; 104; 74; 109; 166; 39; 157; 84; 116; 122; 111;118; 50; 154; 98; 120; 79; 42; 77; 71; 131;
115; 52; 150; 76; 81; 75; 119; 115; 138; 87; 1; 103; 106; 74; 45; 50; 90; 80; 104
Selle valimi jrgi tahetakse hinnata, kui palju inimene he ndala jooksul toidupoes kesk-
miselt kulutab. Kulutuste tegeliku suuruse saamiseks peaksime me ksitlema kiki inimesi
sltuvalt meie uuringule pandud piiridest, kas siis Eestis, Euroopas vi kogu maakeral. Punk-
tihinnangu korral on vastuse saamine lihtne. Leiame valimikeskmise x
n
1
= X
i
n
1 = i

= = 90,86
ja he euro tpsusega vidame, et inimene kulutab toidule ndalas 91 eurot. Ilmselt on tde
(ldkeskmise tegelik vrtus) kusagil 91 euro mbruses. Arvesse vttes vimalikku viga vi-
me selle punktihinnangu kujundada vahemikhinnanguks joonisel nidatud viisil:
Vahemikhinnangu korral seataksegi eesmrgiks mrata vahemik, mis teatud te-
nosusega sisaldaks hinnatavat karakteristikut.
Olgu w ldkogumi karakteristik, millele tahame anda hinnangut. Juhuslikku v ahemikku
( a, b ), mis ldkogumi hinnatavat karakteristikut w sisaldab tenosusega , nimetatakse usal -

91

Tenosusega asub kulu keskmine
selles vahemikus
a b
51
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
dusvahemikuks . Tenosust nimetatakse usaldusnivooks ja arve a ja b usalduspii -
rideks.
Usalduspiirid mravad usaldusvahemiku laiuse b a. Hinnangu veaks nimetatakse
poolt usaldusvahemiku laiusest: = (b-a)/2.
Enamasti pstitatakse usaldusvahemiku leidmise lesanne selliselt: leida usaldusvahemik,
millesse ldkogumi uuritav karakteristik w kuulub usaldusnivool . Usaldusnivoo vrtus
antakse uuringus ette ja sltub uuringu olulisusest, enamasti vetakse >0,9. Kehtib ilmne
seos mida suurema usaldatavusega tahame anda hinnangut, seda laiem on usaldusvahemik,
st seda suurem on hinnangu viga.
Kui tenosus, et vahemik (a,b) sisaldab uuritav karakteristikut on , siis jrelikult te-
nosusega 1- = vahemik seda ei sisalda, st tenosusega me teeme vea. Suurust nime-
tatakse olulisusnivooks ning sageli antaksegi ette just olulisusnivoo vrtus. Mida viksema
olulisusnivoo anname ette, seda kindlamalt soovime, et meie poolt leitud usaldusvahemik
sisaldaks tegelikku vrtust.
11.1 ldkeskmise vahemikhinnang
Eelnev vahemikhinnangu kohta kiv jutt kehtib suvalise hinnatava karakteristiku korral.
Konkreetsed vahemikhinnangu leidmise eeskirjad on aga tarvis tuletada iga karakteristiku
(ldkeskmine, dispersioon, mediaan, jne) korral eraldi.
Olgu hinnatavaks karakteristikuks ldkeskmine ning pstitame lesande selliselt: leida
(usaldus)vahemik ldkeskmise hinnangule olulisusnivool .
ldkeskmise usaldusvahemiku leidmisel lhtume tema punktihinnangust (valimikeskmi-
sest) ja kasutame ra valimikeskmise kui juhusliku suuruse keskvrtuse, dispersiooni ja
jaotuse. Kuna valimikeskmise jaotus on ldjuhul mratud vaid suurte valimite korral (vt. osa
9.4), siis vaatame ka hinnangu leidmist kahes osas.
11.1.1 Suur valim
Olgu antud mingi valim X = {x
1
, x
2
, ..., x
n
}, mille korral eeldame, et valimimaht on
piisavalt suur (n>60). Valimikeskmise
X
kohta teame kolme tsiasja (vt. 9.4):
1. teame, et valimikeskmise
X
keskvrtus on vrdne ldkeskmisega: = X E ;
2. teame, et valimikeskmise
X
standardhlve
X
on seotud ldkogumi standardhl-
bega ja avaldub kujul
n
X



3. teame, et valimikeskmise
X
on (ligikaudu) normaaljaotusega juhuslik suurus:
)
n

, N( ) , N( ~ X
X

.
Neid kolme tdemust kasutame allpool ldkeskmise vahemikhinnangu leidmisel.
Pstitame lesande: leida keskvrtuse suhtes smmeetriline vahemik, kus va-
limikeskmine
X
, kui juhuslik suurus, asub tenosusega 1- .
52
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
See on tavaline juhusliku suuruse vahemikku langemise tenosuse leidmise lesanne,
mille saame kirjutada tingimusega:
1 ) X E X P( < ,
kus otsitavaks suuruseks on hinnangu viga .
Kuna juhusliku suuruse
X
keskvrtus on = X E , siis vime saadud tingimuse vlja
kirjutada kujul:
1 ) X P( < .
Arvestades absoluutvrtuse mrkide thendust vime elda, et juhuslik suurus
X
ei erine
konstandist rohkem kui suuruse vrra, ehk
1 )) X ) P(( ) X P( + < < < (11.1)
See on lihtne vahemikku langemise tenosuse leidmise lesanne, kus otsitavaks on va-
hemiku laius. Sellist probleemi ksitlesime punktis 7.2.5 nidislesandes E. Praegusel juhul
me aga ei asenda valemisse konkreetseid arve, vaid jme ldise smboolika juurde kuni
lesande lahendamise lpuni.
Tulenevalt sellest, et meie poolt vaadeldav juhuslik suurus
X
on normaaljaotusega,
saame analoogiliselt viidatuga kirjutada:

,
_

,
_

,
_

,
_

+
+ < <
X X X X


)) ( X ) P(( ,
kus kasutasime vahemiku otspunktide vrtusi: a = + ja b = . Kasutades standardi-
seeritud normaaljaotuse korral kehtivat valemit (-z) = 1-(z) (valem 7.3) vime saadud tu-
lemust edasi lihtsustada:
Probleemi pstituse tingimuste jrgi vrdub juhusliku suuruse
X
vaadeldavasse vahemikku
langemise tenosus vrtusega 1- ja seega saame:
Selles vrduses on ainukeseks otsitavaks suuruseks hinnangu viga . Avaldame hinnangu vea
ja kasutades kvantiili mistet (vt. 6.2.1) avaldame:

2

1
X
2

1
1
X
z z )
2

(1


.
Saadud valemit vime juba kasutada hinnangu vea leidmiseks olulisusnivool . Olulisusni-
voo seostamiseks hinnangu veaga thistatakse asemel

. Samuti, kasutades kvantiili ja


tiendkvantiili vahelist seost
z z
1 (vt. 6.2.1), saame hinnangu vea lppkujuks:
X
z


2
Nd ei jgi muud le, kui lhtudes pstitatud lesande matemaatilisest kujust(valem
11.1) kirjutada, et tenosusega 1- asub valimikeskmine
X
vahemikus
1

... )) ( X ) P((
X X X

,
_

,
_

,
_

+ < <

,
_

+ < < 1 1 2 ... )) ( ) ((


X
X P
53
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
X /2 X /2
z X z + < < . (11.2)
Aga tegelikult ei huvita meid mitte see, kus asub valimikeskmine, vaid see, kus asub ld-
keskmine. Lihtne on nha, lahutades vrratuse 11.2 kikidest liikmetest ) X ( + ja korrutades
tulemust (-1)- ga, saame:
X /2 X /2
z X z X + < < . (11.3)
Kokkuvttes saime tulemuse: piisavalt suure valimimahu korral kehtib olulisusni-
vool , et meie poolt konstrueeritud juhusliku vahemiku otspunktid langevad ldkesk-
misest erinevatele pooltele ehk juhuslik vahemik sisaldab ka ldkeskmist.

Valemi tuletamisel me eeldasime, et meil on teada valimikeskmise standardhlve
X

. Te-
gelikkuses me seda aga ei tea ega saagi teada. Eespool punktis 9.4 leidsime, et valimikesk-
mise standardhlve on avaldatav kujul
n

X

, kus on ldkogumi standardhlve ning
seega omandab valem(11.3) kuju:
n

z X
n

z X
/2 /2
+ < <
(11.3)
Kahjuks on ldkogumi standardhlve enamasti teada teada vaid erandjuhtudel, kui tema
leidmiseks (hindamiseks) on lbi viidud eraldi uuringud. Osutub aga, et kui tegu on suure va-
limiga, siis vime, tulemust oluliselt kahjustamata ldkogumi standardhlve asemel kasuta-
da valimi standardhlvet
) X -
x
(
1 - n
1
=
s
i
2
n
1 = i

, kusjuures vrtus s on valimi phjal alati lei-


tav. Seega saame ldkeskmise vahemikhinnangu valemi (11.3) phikujuks:
n
s
z X
n
s
z X
/2 /2
+ < <
(11.3)
Viimasest kahest valemist on nha, et valimi mahu kasvades hinnangu viga vheneb, seega
mida suurem valim, seda tpsema tulemuse saame.
ldkeskmise vahemikhinnangu valemi tuletamisel lhtusime sellest, et valimikeskmine
X

kui juhuslik suurus on normaaljaotusega. Vastavalt tsentraalsele piirteoreemile on see nue
piisavalt suure valimi korral alati tidetud sltumata tunnuse jaotusest. Siiski on olemas ka
ks erijuht; kui vaadeldav tunnus ise on normaaljaotusega, on valimikeskmine
X
normaal-
jaotusega ka vikeste valimite korral (vt osas 9.4).
Nide 11.2 Prdume uuesti nites 11.1 toodud andmete juurde ning leiame toidule teh-
tud keskmise kulu vahemikhinnangu.
Vahemikhinnangu leidmisel antakse ette usaldusnivoo, st tenosus, millega ldkeskmine asub tu-
lemuseks saadud vahemikus. Olgu hetkel nutavaks usaldusnivooks 1- = 0,95, mis on tavaline vr-
tus seda laadi uuringutes.
Lahendus. Tegemist on piisavalt suure valimiga (n > 60) ning ldkogumi standardhlvet me
ei tea. Seega osutub sobivaks valem (11.3). Leiame
54
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
1) valimikeskmine x
n
1
= X
i
n
=1 i

= = 90,86
2) valimi standardhlve
) X -
x
(
1 - n
1
=
s
i
2
n
=1 i

==37,33
3) valimi standardviga
67 , 4
8
33 , 37

n
s

X


4) leiame normaaljaotuse usaldusnivoole vastava normaaljaotuse tiendkvantiili: 1- =
0,95; = 0,05; /2 = 0,025 ja standardiseeritud normaaljaotuse tabelitest leiame
96 , 1
975 , 0 025 , 0
z z
.
Paneme nd saadud arvud valemisse (10.2)'' ning saame vahemikhinnangu
67 , 4 96 , 1 86 , 90 67 , 4 96 , 1 86 , 90 + < <
ehk mardatult: 81,7 < < 100,1
Nagu neme, asub antud katseandmetest tulenevalt ndalase toidukorvi tegelik maksumus
kllaltki laias vahemikus ning vahemiku keskpunkti kasutamine (punktihinnang) vib viia
ekslikele tulemustele.
Kuidas muutub vahemikhinnang usaldusnivoo kasvades? On loogiline eeldada, et mida
suurema usaldatavusega (suuremal usaldusnivool) soovime saada tulemust, seda laiemaks
venib usaldusvahemik. Selle kinnitamiseks vaatleme usaldusvahemikku erinevatel usaldus-
nivoodel. Olgu nendeks 0,5; 0,9; 0,95 ja 0,99 ja korrastame saadud tulemused alljrgnevasse
tabelisse:
Usaldusnivoo (1-) 0,5 0,9 0,95 0,99
Valimikeskmine
X
90,86 90,86 90,86 90,86
Valimi standardhlve s 37,33 37,33 37,33 37,33
Tiendkvantiil
2

z
0,68 1,65 1,96 2,58
Standardviga
X

4,66 4,66 4,66 4,66


Hinnangu viga

3,17 7,69 9,13 12,02


Usaldusvahemik 87 - 94 83 - 98 81 - 100 78 - 103
Toodud nites saime suhteliselt laia usaldusvahemiku tnu sellele, et valimi maht oli kl-
laltki vike. Kuidas mjustada tulemuse tpsust, vaatame allpool punktis 11.3.1.
11.1.2 Vikese valimi juhtum
Eelmises punktis ngime, et kui tegu on vikese valimiga, kuid vaadeldav tunnus on normaal-
jaotusega, ning me teame ldkogumi standardhlvet , siis tiendavaid probleeme ei teki - ldkesk-
mise hinnanguks vime kasutada valemit (11.3)'. Enamasti me aga ldkogumi standardhlvet ei tea
ning tema asendamine valimi standardhlbega vib anda valed usalduspiirid.
Kuna selline lesanne, kus tegu on vikese valimiga ja ldkogumi standardhlvet ei tea, on kllalt -
ki tpiline, siis leiti sellele ligikaudne lahend. Nimelt, hel juhul, kui uuritav tunnus on normaal -
jaotusega, vib normaaljaotuse asemel kasutada nn. Studenti jaotust. Studenti jaotuse ttas vlja
inglise matemaatik William Gosset just sellise juhu tarvis. Meie poolt vaadeldava lesande kontekstis
55
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
(valem (11.3)'') suurendab Studenti jaotus normaaljaotuse tiendkvantiili
/2
z vrtust ning seda
sltuvalt valimi mahust n. Mida viksem on valimi maht, seda suurem on Studenti jaotuse tiend-
kvantiili vrtus ja seda laiemad usalduspiirid saadakse. Seega, vikese valimi korral, kui uuritav tun-
nus on jaotunud normaaljaotuse jrgi ja me ei tea ldkogumi standardhlvet , kasutatakse ldkeskmise
hindamisel valemit:
n
s
t + X < <
n
s
t - X
1 n /2, 1 n /2,


, (11.4)
kus s on valimi phjal arvutatud valimikeskmise standardhlve ja
1 n /2,
t

Studenti jaotuse
tiendkvantiil olulisusnivool valimi mahu n korral. Valimi mahu kasvamisel lheneb
Studenti jaotuse tiendkvantiili vrtus normaaljaotuse tiendkvantiili vrtusele ning alates
mahust ~60, vime lugeda nad vrdseiks. Studenti jaotuse tiendkvantiilide tabel on toodud
kesoleva konspekti lpus, tiendkvantiilide leidmise funktsioon on reeglina lisatud ka kiki-
de tabelarvutusprogrammide statistikafunktsioonide loetellu (niteks Excelis on see
TINV(, n-1)=
1 n /2,
t

).
Nide 11.3. Vtame eelmise nite ja oletame, et ksitleti ainult 25 inimest. Kuna me ei tea
ldkogumi standardhlvet , siis saame leida usalduspiirid vaid juhul kui uuritav tunnus (ostu
rahakulu toidule) on normaaljaotusega. Kuidas kontrollida seda, et tunnus on normaal-
jaotusega, vaatame hiljem, praeguse nite korral oletame, et on tegu normaaljaotusega. Seega
ksitluse tulemusel saime ostu suurused:
104 141 106 25 98 93 36 145 129 77 96 6 16 84
83 32 116 47 112 79 111 132 61 100 103
Nutakse leida ostu keskmise usaldusvahemik usaldusnivoodel 0,5; 0,9; 0,95 ja 0,99.
Lahendus. Usaldusvahemiku arvutamisel lhtume valemist (11.4). Leiame
1) valimikeskmine x
n
1
= X
i
n
=1 i

= = 85,3
2) valimi standardhlve
) X -
x
(
1 - n
1
=
s
i
2
n
=1 i

==39,2
3) valimi standardviga
84 , 7
5
2 , 39
25

s

X


Korrastame nd tulemused erinevate usaldusnivoode korral tabelisse:
Usaldusnivoo (1-) 0,5 0,9 0,95 0,99
Valimikeskmine
X
85,3 85,3 85,3 85,3
Standardhlve s
39,2 39,2 39,2 39,2
t-jaotuse tiendkvantiil
2

t
0,68 1,71 2,06 2,8
Standardviga
X

7,84 7,84 7,84 7,84


Hinnangu viga

5,33 13,40 16,15 21,95


Usaldusvahemik
80 - 91 71 - 99 69 - 102 63 - 108
56
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Vrreldes eelmise nitega, kus ksitlesime 64 inimest, suurenevad valimimahu kasvades
usalduspiirid tulemuse tpsus on viksem.
ldkeskmise vahemikhinnangu valemid vime koondada jrgmisse tabelisse:
Tunnuse jaotus
Normaaljaotus Teadmata
Suur
valim
n60
teada
n
z
+ X < <
n
z
- X
/2 /2



ei ole teada
n
s
z
+ X < <
n
s
z
- X
/2 /2



Vike
valim
n<60
teada
n
z
+ X < <
n
z
- X
/2 /2



ei ole teada
n
s
t + X < <
n
s
t - X
n n

1 , 2 / 1 , 2 /

Ei ksitle antud kursuses
Tabel 11.1
11.2 Valimi suuruse mramine
Punktis 11.1 ngime, et hinnangu viga sltub kahest tegurist: lesande pstitamisel ette
antud usaldusnivoost 1- ja valimi suurusest n. Seejuures valimi mahu kasvades viga
vheneb. Usaldusnivoo ja valimi suurus on uurija valida, teised parameetrid (jaotus ja
standardhlve) tulenevad uuritava tunnuse olemusest.
Sageli pstitatakse lesanne selliselt: leida uuritava karakteristiku hinnang usaldusnivool
1- , mille korral viga ei leta hikut .
Nutava tpsuse saame tagada vaid piisavalt suure mahuga valimi kasutamisel. Seega on
meil tegemist lesandega: leida valimimaht, mille korral olulisusnivool hinnatav karak -
teristik ei erine tegelikust vrtusest rohkem kui lubatava vea

vrra.
Oletame, et tegemist on ldkeskmise hinnanguga. Kik selle vimalikud erijuhud, mille
korral oskame anda hinnangu, on toodud tabelis 11.1. Sltuvalt lhtetingimustest vime
eristada kahte alamjuhtu:
1) tunnuse standardhlve on teada
2) kasutame valimi standardhlvet s.
Esimesel juhul avaldub hinnangu viga

, kujul:
n
z /2



ning siit on kerge leida va-
limi maht:
2
2 /

,
_

z
n , mis annab minimaalse nutavat tpsust tagava vajaliku valimi-
mahu.
Teisel juhul, kui kasutame valimi standardhlvet
) X -
x
(
n
=
s
n
i
i
2

1
1
1
, avaldub hinnan-
gu viga valemiga )
s *
z
( = n
2 /2

. Selle valemi kasutamisel on aga otsitavaks suuruseks


57
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
olev valimi maht n mlemal pool vrdusmrki, kuna ka standardhlbe leidmisel mngib
rolli suurus n.
Ilusat matemaatilist lahendust sellele probleemile ei ole. Praktikas kasutatakse valimi
mahu mramiseks vea ja eksituse meetodit. Kigepealt koostatakse nn. proovivalim, mille
maht mratakse suvaliselt: olgu selleks n
0
. Proovivalimi korral leitakse tema standardhlve
s
0
= s(n
0
) ja arvutatakse sellest tulenev valimimaht n
1
:
2
1

,
_

)
n
s(
*
z
= n
0
/2
vi
2
1

,
_

)
n
s(
*
t
= n
0
/2
Kui osutub, et leitud vrtus n
1
on viksem kui proovivalimi maht n
0
, siis arusaadavalt
on proovivalimi suurus piisav. Kui aga n
1
>n
0
, see thendab, et proovivalim oli vike, tuleb
valimit suurendada. Seega tuleb ldkogumist valida tiendavalt n
1
-n
0
elementi. Kogu
protsessi korratakse seni, kuni mingil sammul nutav valimi maht on viksem vajalikust, st
n
i+1
<n
i
.
Valimi mahu leidmisel eeldasime, et ldkogum on piisavalt suur vi lpmatu. Seega
kunagi ei teki olukord, kus valimisse tuleb vtta rohkem objekte kui neid on ldkogumis neid
ldse on. Lplike, vikese objektide arvuga ldkogumite korral (niteks majandusteaduskon-
na II kursuse lipilased, le miljonieurolise kibega ettevtted Eestis jne) on mttekas mitte
teha valimit, vaid uurida tervet ldkogumit ja saada hinnangute asemel tpsed tulemused. Kui
mingil phjusel ei ole ldkogumi anals siiski vimalik, tuleb ikkagi piirduda valimi phjal
tehtavate hinnangutega. Valimi vajaliku mahu mramisel klbavad laltoodud hinnangud,
kui neid korrutada koefitsiendiga
n + N
N
, kus N on ldkogumi maht ja n leitud valimi
maht.
ldiselt kehtib valimi mahu mramisel phireegel - mida suurem on valim, seda
phjalikumat analsi saab teha, kuid majanduslikest kaalutlustest lhtudes - mida viksem
on valim, seda odavam on uuringut lbi viia.
Nide 11.4. Vtame uuesti ksile nite 11.3 ja leiame, mitut inimest on tarvis ksitleda, et
saada hinnangut 10 euro tpsusega usaldusnivool 0,95.
Lahendus: 65
10
2 , 39 * 06 , 2
2
2
2 /
2
2 /

,
_

,
_

,
_


s t

t
n

Seega tarvis on ksitleda vhemalt 65 inimest. Kuna meil 25 inimese ksitlusandmed on


juba olemas, siis on tiendavalt tarvis ksitleda veel 40 inimest. Prast nende inimeste ksit-
lemist tuleb uuesti mber arvutada valimi maht, et veenduda, kas tpsustunud valimikeskmise
ja standardhlbe korral valimi maht on ikka piisav.
Vrdleme nd nidete 11.2 ja 11.3 tulemusi usaldusnivool 0,95. Nite 11.3 korral ksit-
lesime 25 inimest, mis on vhem kui on vajalik selleks, et viga jks 10 euro piiresse ning
saime tulemuse: keskmine maksumus = 85,5 16,15. Nites 10.2 ksitlesime 64 inimest,
seega peaaegu vajaliku tpsuse saamiseks nutavat inimeste arvu n=65 ning saime tulemuse:
keskmine maksumus = 90,8 9,13.
58
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
11.3 Suhtelise sageduse (protsendi) vahemikhinnang
Eespool vaadeldud ldkeskmise hinnang (keskmine palk, keskmine reisijate arv, kesk-
mine loengult puudutud tundide arv, keskmine televiisori vaatamise tundide arv, jne)on prak-
tikas ks sagedamini kasutamist leidvatest hinnangutest. Kuid peaaegu sama tihti tahetakse
hinnata ka mingi sndmuse toimumise suhtelist sagedust, toetusprotsenti, teatud omadustega
toote osakaalu jms. Seega tahetakse teada sndmuse toimumise suhtelist sagedust, mis vib
olla vljendatud ka protsendina. Suhtelise sageduse hindamise ldphimtted on samad mida
kasutasime ldkeskmise hindamisel: koostatakse valim ja valimi phjal saadud sageduse
phjal antakse hinnang suhtelisele sagedusele ldkogumis. Hindamisvalemi tuletamisel
saame tegelikult ra kasutada enamuse eelnevas saadud tulemustest, kui vaatleme sagedust
ldkeskmise erijuhuna.
ldkeskmise hindamiseks saime valemi (11.3):
X X
z X z X

+ < <
2 / 2 /
,
mida soovime ra kasutada suhtelise sageduse vahemikhinnangu valemi saamisel.
ldkeskmise hinnangu leidmisel me eeldasime, et uuritav tunnus on arvuline ja vib
omandada suvalisi arvulisi vrtusi. Vaatleme nd juhtu, kus uuritav tunnus omandab vaid
vrtusi 0 ja 1:
} 1 , 0 {
i
x
. Sellisel juhul vime ldkeskmisele ning ja ldkogumi standard-
hlbele anda tlgenduse, mis sobib meie eesmrgiga seostada need suhtelise sagedusega.
Tehtud eeldustel on ldkogumi vaadeldav tunnus X = {x
1
, x
2
, ..., x
N
} nullide ja htede jada
ning ldkeskmise definitsiooni jrgi (vt 9.2) abil:
p
N
N
x
N
1

1
N
1 i
i

,
kus N
1
on tunnuste arv, mille vrtus on 1 (summas liidame kokku N
1
hte) ja N on objektide
arv ldkogumis. Suhe N
1
/N on vaadeldava tunnuse vrtuse 1 omandamise suhteline
sagedus ldkogumis. Eristamaks suhtelise sageduse hindamisvalemeid ldkeskmise vale-
mitest thistame suhtelise sageduse thega p.
Vastavalt ldkogumi standardhlbe definitsioonile avaldub praegusel juhul ldkogumi
standardhlve (vt 9.2): p) p(1 . Tavaliselt thistatakse 1-p=q, ning saame valemi
pq
*7
Seega saime, et vrtusi 0 ja 1 omava tunnuse korral vastab ldkogumis ldkesk-
misele ldkogumi suhteline sagedus p ja standardhlve avaldub suhtelise sageduse kaudu
kujul pq .
*7 Tepoolest,

pq = p) - p(1 = p + p 2 - p = )
N
+
N
2p - p (N
N
1
=
= ) x + px p (
N
1
= ) x
- (p
N
1
=
2 2
1 1
i
N
=1 i
i
N
=1 i
2
N
=1 i
2
i
N
=1 i
2
2
2
*
2

kus teisenduses kasutasime sageduse p mratlust p=N


1
/N ja sellest tulenevat vrdust N
1
=p*N.
59
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Vaatleme analoogilisi suurusi valimi korral. Olgu lalkirjeldatud ldkogumist tehtud va-
lim: X = {x
1
, x
2
, ..., x
n
}, mis analoogiliselt ldkogumiga on tunnuse vrtuste 0 ja 1 jada. Va-
limikeskmise vime kirjutada kujul


n
1 i
1
i
p
n
n
x
n
1
X
, kus n
1
on valimis vrtust 1
omavate elementide arv.
Suhteline sagedus
p
kui valimikeskmine on juhuslik suurus, mille
1) keskvrtus (arvestades lalpool kasutusele vetud thistust):

p
x
n
1
E = p E X E
i
n
1 = i

,
_


2) dispersioon
n
pq

n

X D
2
2
p
2
X

Kuna sageduse korral on tegemist ldkeskmise hindamise erijuhuga, siis asendades leitud
vrtused ldkeskmise hindamise valemisse ja saame:
p /2 p /2
z + p < p < z - p .
Ilmselt ei ole siin mtet vaadelda juhtu kui ldkogumi standardhlve on teada:
n
pq

p X

, kuna siis me vime hinnatava vrtuse p leida sellest samast valemist. Kui
ldkogumi standardhlve ei ole teada, kasutame arvutustes valimi phjal arvutatud lhend-
vrtusi:
n
q p

p X
ning saame sageduse hindamiseks valemi
n
q p
z + p < p <
n
q p
z - p
/2 /2
Vikeste valimite korral me saime anda hinnangu vaid siis, kui uuritav tunnus on normaal-
jaotusega. Kahendvrtusi omav tunnus seda ei ole ja seega ei klba siinjuures ka Studenti
jaotus. Vikeste valimite korral kasutatakse hinnangu leidmisel eritabeleid, mida me siin-
kohal ei vaatle.
Nide 11.5. Poliitik palus hinnata oma toetajaskonna suurust usaldusnivool 0,95. Selleks
ksitleti 400 inimest, kellest 225 tles, et toetan ja 175 tlesid ei toeta. Leida hinnang
poliitikut toetavate inimeste protsendile.
Lahendus.
1) 0.56 = 225/400 = p 0.44 = q
2) 0.025 =
400
0.44 * 0.56
=
n
q p
=
p
3) Thistagu I
p
usaldusvahemikku: I
p
=(0.56 1.96*0.025) = (0.56 0.05)
Seega - usaldusnivool 0.95 toetab poliitikut 51-61% inimestest.
60
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
11.3.1 Valimi suuruse mramine suhtelise sageduse hinnangutes
Nagu ldkeskmise hinnangu korralgi, saab ka sageduse hinnangus leida valimi suuruse,
mis usaldusnivool 1- tagab, et usalduspiirid jvad etteantud lubatavast veast viksemaks.
Selleks lhtume veahinnangust
n
q p
*
z /2

ja siit leiame

2
2
/2
q p *
z
= n . Sageli vetakse
korrutise q * p tegeliku vrtuse asemel tema vimalik maksimaalne vrtus, mis saavuta-
takse juhul 5 , 0 = p . See annab kll vajalikust veidi suurema valimi, kuid vimaldab kohe
uurimise algul mrata valimi suuruse. Seega, sageduse vahemikhinnangute korral vime lei-
da valimimahu arvutades:
4
z
= n
2

2
2

.
Nide 11.6. Mitut inimest on nite 11.5 korral tarvis ksitleda, et saada vastus usaldusni-
vool 95% veaga 5%.
Leiame 384 =
0.05 * 0.05
0.5 * 0.5 *
96
1.
= n
2
. Seega ksitlesime praeguse lesandepstituse 16
inimest korral rohkem kui seda hdaprast tarvis oleks olnud.
Lubatava vea vhendamine suurendab ksitletavate hulka mrgatavalt, niteks soovides tu-
lemust, mis samal usaldusnivool ei letaks 3% viga, peaksime ksitlema 1100 inimest.
61
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
12 HPOTEESID
12.1 Hpoteeside pstitamise phimtted ja liigid
Kik siiani tehtud jreldused ldkogumi karakteristikute kohta olid hinnangud karakteristi-
kute arvulistele vrtustele. Selliseid hinnanguid tegime lhtudes vajalikust usaldusnivoost ja
lubatavast veast. Sageli ei huvita meid aga mitte niivrd parameetrite konkreetsed arvulised
vrtused, kuivrd nendel vrtustel phinev otsustus.
Hpoteese vime pstitada mingi konkreetse karakteristiku kohta, olgu selleks siis ld-
keskmine, standardhlve, keskmiste vahe, sagedus vi mni teine karakteristik, aga samuti ka
vga mitmete teistsuguste videte testamiseks vi mberlkkamiseks, niteks kas tunnuste
vahel on seos, kas tunnus on jaotunud eeldatava jaotuse jrgi jne.
Kesolevas osas vaatleme hpoteeside pstitamist ldkogumi parameetrite kohta. Hpo-
teeside pstitamise olemuse vib snastada selliselt.
1. On olemas ldkogum, millel on meid huvitava karakteristiku vrtus w, mida me aga
ei tea.
2. Teeme oletuse, et selle karakteristiku vrtus on meie poolt eeldatavas suhtes oleta-
tava arvuga w
0,
st on vrdne arvuga w
0
, on arvust w
0
suurem (w > w
0
) vi viksem
(w < w
0
). Oletatav vrtus w
0
on mingil mral meie veendumus.
3. Moodustame valimi (kontrollvalimi) ja arvutame valimi statistiku kui ldkogumi
vaadeldava karakteristiku w hinnangu. Sltuvalt sellest, millises suhtes on valimi ph-
jal arvutatud statistik meie poolt pakutud arvuga w
0
vime anda hinnangu oma vitele,
st kas w = w
0
, w > w
0
vi w < w
0
.
Selgitame seda lihtsa nite varal.
Suitsetamine on paha harjumus, millega sageli alustatakse suhteliselt noorelt. Olgu niteks
eeldatav ohtlik iga keskmiselt kusagil 14. eluaasta juures. Selle vite kohta vime pstitada
jrgmised teesid:
1) regulaarse suitsetamise algus on keskmiselt 14-aastaselt;
2) regulaarse suitsetamise algas keskmiselt prast 14. eluaastat ja
3) regulaarse suitsetamise algas keskmiselt enne 14. eluaastat.
Paneme thele, et meie vited on praegu tehtud ldkeskmise kohta. Pstitatud teeside
testamiseks peame tegema valimi, st ksitlema teatud arvu suitsetajaid. Sama valimi phjal
saame kontrollida kikide videte paikapidavust vi paikapidamatust, kuid seda ikkagi ks-
haaval. Selleks vaadeldakse iga vitega krvuti tema vastandit ning teatud reeglite jrgi
otsustatakse, millist videt lugeda teseks.
Iga konkreetse vite korral vaadeldakse hpoteeside teoorias teineteist vlistavate hpo-
teeside paare, millest ks thistab testatavat videt, nn alternatiivset hpoteesi H
1
ja teine
temale vastupidist situatsiooni, nn nullhpoteesi - H
0
. Seega, lhtudes laltoodust saame vl-
ja kirjutada hpoteeside paarid:
A. H
0
: w = 14 B. H
0
: w 14 C. H
0
: w 14
H
1
: w 14 H
1
: w > 14 H
1
: w < 14
62
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Siin w thistab muutujat regulaarse suitsetamise alguse keskmine iga ja w
0
= 14 on meie
poolt arvatav vrtus. ldjuhul vime hpoteeside liigid koos nimedega kirjutada vlja kujul:

H
0
: w = w
0

A. Kahepoolne hpotees:
H
1
: w w
0

H
0
: w w
0
B. Hpotees suurem:
H
1
: w > w
0

H
0
: w w
0

C. Hpotees viksem:
H
1
: w < w
0

Nagu eespool eldud, tehakse hpoteeside kontrollimiseks valim ja leitakse valimi vastav
karakteristik. Kuna valim on juhuslik, on juhuslik ka valimi vastav karakteristik, millega
vrdleme oma arvamust. On tiesti vimalik, et ks valim kinnitab pstitatud teesi, kuid tehes
uue valimi, vime saada vastupidise tulemuse. Seeprast tuleb jllegi tehtav otsustus siduda
tenosusega, st anda hinnang igeks peetava vite tesusele.
Hpoteeside pstitamisel ja kontrollimisel lhtutakse sellest, et nullhpotees H
0
nitab ala-
ti kehtivat olukorda ja kasutades valimist saadud tulemusi me peame testama alternatiivse
hpoteesi H
1
. Seeprast rgitaksegi, et tehtud valimi phjal saame testada alternatiivse h-
poteesi vi kui seda ei saa, siis tleme me jme nullhpoteesi juurde. Nagu nha, ei ole
vrdus w = w
0
testatav hpotees ning videt suitsetamine algas keskmiselt 14 aastaselt
me otseselt testada ei saa. Kll saame aga testada, et valim ei kinnita, et suitsetamise algus
erineks meie poolt arvatavast 14 aastast.
Nullhpoteesi ja alternatiivse hpoteesi erinevat thendust tuleb meeles pidada hpoteesi-
de pstitamisel esmalt tuleb paika panna see, mida tahame testada (hpotees H
1
) ja seejrel
tema vastuvide - H
0
. Ilus analoogia tekib siin ka nn stuse presumptsiooniga tuleb lh-
tuda phimttest, et inimene on alati stu, alles mberlkkamatute tendite korral (meil on
selleks ldkogumist vetud valim), vime vita vastupidist.
12.2 Hpoteeside kontrollimise phimtted
A. Kahepoolne hpotees. Olgu ldlevinud arvamuse jrgi hinnatava parameetri
vrtus w = w
0
. Meie arvates see nii ei ole ja me tahame selle eksiarvamuse kummutada
testades alternatiivse hpoteesi. Seega on tegemist kahepoolsete hpoteeside paariga:
H
0
: w = w
0

H
1
: w w
0

Hpoteeside kontrollimiseks vtame ldkogumist valimi ja leiame valimi phjal kontrolli-
tavale karakteristikule vastava statistiku X (kui kontrollitavaks suuruseks on ldkeskmine,
siis on kontrollstatistikuks valimikeskmine
X
, kui kontrollitavaks on suhteline sagedus, siis
on selleks suhteline sagedus valimis jne).
On loogiline, et kui hpoteeside kontrollimiseks arvutatud statistik X ei erine meie poolt
oletatavast vrtusest w
0
oluliselt, st
<
0
w X
, kus on mingi vike suurus, siis on usutav
vide w = w
0
ja on loomulik jda nullhpoteesi juurde. Kui aga osutub, et leitud statistik X
63
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
ei ole meie poolt arvatavale vrtusele kllalt lhedal:

0
w X
siis nullhpotees usutav ei
ole ja tuleks lugeda kehtivaks alternatiivne hpotees H
1
.
Arvestades, et statistik X on juhuslik suurus, vime seda situatsiooni kujutada joonisel
selliselt:
Lubatav erinevus on loomulik siduda mingi tenosusega ja vaadelda teda sltuvuses
sellest tenosusest. Seega leitakse vahemik
) (
0
t w
millesse juhuslik suurus X langeb
mingi tenosusega. See on sisuliselt usaldusvahemiku leidmise lesanne (vt 11.1) ning lu-
batav krvalekalle

leitakse usaldusnivool 1- tingimusest




< 1 ) (
0
w X P
. Loo-
mulikult tuleb arvestada juhusliku suuruse X jaotust ja vajalikke arvkarakteristikuid.
H
0
: w w
0
B. Hpotees suurem:
H
1
: w > w
0

Selle hpoteesipaari korral on alternatiivne ehk sisukas hpotees vide, et vaadeldav ld-
kogumi karakteristik w on suurem meie poolt arvatavast vrtusest w
0
. On loomulik, et kui
valimi phjal hpoteesi kontrollimiseks arvutatud statistik X on viksem oletatavast vrtu-
sest w
0,
siis pole meil mingeid tendeid vitmaks, et tegelik vrtus on suurem kui w
0
. Ilmselt
ei saa sisuka hpoteesi testuseks lugeda ka veel seda, kui statistik X letab pakutavat vr-
tust w
0
vga vhe mitte rohkem kui mingi vikese suuruse vrra. Kui aga statistik X on
suurem kui lubatav juhuslik krvalekalle , st mingil usaldusnivool 1- kehtib:
) (
0
+ w X
,
siis vime vita, et koostatud valim testas vaadeldaval usaldusnivool alternatiivse hpoteesi
H
1
.
Toodud arutelu vib ilmestada joonisega:
w
0
w
0
+

w
0
-

X
jme H
0
juurde
H
1
H
1
64
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Lubatava krvalekalde suurus mratakse jllegi sltuvalt ette antud usaldusnivoost 1-.
Krvalekalle

, mille korral jme veel nullhpoteesi juurde leitakse tingimusest




< 1 ) (
0
w X P
.
C. Hpotees viksem:
0 1
0 0
:
:
w w H
w w H
<

Selle hpoteesipaari korral on testatavaks vide, et ldkogumi vaadeldav karakteristik w


on viksem meie poolt arvatavast vrtusest: H
1
: w < w
0
. On loomulik, et kui valimi phjal
hpoteesi kontrollimiseks arvutatud statistik X on suurem oletatavast vrtusest w
0,
siis pole
meil tendeid vitmaks, et tegelik vrtus on viksem kui w
0
. Ilmselt ei saa sisuka hpoteesi
testuseks lugeda ka veel seda, kui statistik X ei ole piisavalt palju viksem meie poolt arva-
tavast vrtusest. Seega, hpoteesi H
1
loeme testatuks, kui tenosusega 1- kehtib
) (w X
0

. Joonisel vime seda situatsiooni kirjeldada jrgmiselt:
Lubatav krvalekalde suurus mratakse jllegi sltuvalt ette antud tenosusest 1-.
Krvalekalle

, mille korral jdakse veel nullhpoteesi juurde leitakse tingimusest


1 ) X P(w
0
<
. Sobiva

vrtuse leiame allpool vahetult sellest valemist tulenevalt.


Kokkuvttes vime saadud tulemused koondada tabelisse:
Hpotees Kehtib hpotees

leitakse valemist
A
H
0
: w=w
0
H
1
: ww
0
H
0,
kui
<
0
w X

H
1
, kui

0
w X


< 1 ) (
0
w X P
B
H
0
: ww
0
H
1
: w>w
0
H
0,
kui
) (
0
+ < w X

H
1
, kui
) (
0
+ w X



< 1 ) (
0
w X P
C
H
0
: ww
0
H
1
: w<w
0
H
0,
kui
) (
0
> w X

H
1
, kui
) (
0
w X



< 1 ) (
0
X w P
Tabel 12.1
w
0
+ w
0
X
kehtib H
1
jme H
0
juurde
w
0
-
X
kehtib H
1
jme H
0
juurde
w
0
65
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
12.3 Hpoteesid ldkeskmise kohta
Eespool me leidsime ldised tingimused hpoteeside kontrollimiseks. Lhtudes nendest
tingimustest saame leida hpoteeside kontrollimise eeskirjad ldkogumi iga karakteristiku
jaoks, arvestades selle karakteristiku omapra.
Vaatleme jrgnevas ldkeskmise kohta tehtavaid hpoteese. Thistagu alljrgnevas:
ldkeskmist,
0
meie poolt oletatavat vrtust ja kontrollvalimi phjal arvutatud statistik
X
X
- valimikeskmist.
Punktis 9.4 nitasime, et X E ja ilma uuritavale tunnusele lisatingimusi panemata on
piisavalt suure kontrollvalimi korral (valimi maht > 60) vastavalt tsentraalsele piirteoreemile
valimikeskmine
X
jaotunud normaaljaotuse jrgi. Nullhpoteesi jrgi =
0
, jrelikult eel-
dame siis ka, et
0
X E
.
12.3.1 Kahepoolsete hpoteeside kontrollmine
Vaatleme hpoteesipaari
0 1
0 0
:
:

H
H
. Eelmises punktis saime, et lubatav krvale-
kalle

, mille korral jme usaldusnivool 1- nullhpoteesi juurde, on leitav tingimusest:


1 ) X P(
0
<
. Vrrandi lahendamise kik on samasugune, nagu ta oli ldkeskmise
usaldusvahemiku leidmisel (vt 11.1), kuid kordame seda siinjuures siiski. Leiame krvalekal-
de

, millest viksemate erinevuste korral leitud valimikeskmise


X
ja kontrollitava vrtuse

0
vahel jme nullhpoteesi juurde.
Tehtud eeldusel, et kontrollvalim piisavalt suur, on juhuslik suurus
X
normaaljaotusega
ja vahemikku langemise tenosuse leidmisel vime kasutada Laplace'i funktsiooni:
1 1 )

( 2 )

( )

( ) X P(
X

0 0
+ < <
Edasi saame
2
1 ) (



X
ning sarnaselt punktis 11.1 tehtuga avaldame
2 /
1
)
2
1 (

z
X


, kus z /2 on standardiseeritud jaotuse tiendkvantiil. Otsitav suurus

avaldub kujul
X
z
2 /

.
Pannes saadud

vrtuse laltoodud kahepoolse hpoteesi kontrolltingimusse


0
X <
(vt tabel 12.1), saame vlja kirjutada tulemuse:
nullhpoteesi juurde jme siis, kui kehtib vrratus:
/2
X
0
z

X
<

ja
vtame vastu alternatiivse hpoteesi, kui:
/2
X
0
z

.
66
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Enamasti tuuakse sisse veel lisathistus
X
0

X
Z

, kus valimi andmete phjal arvutatud


suurust Z nimetatakse teststatistikuks vi kontrollstatistikuks. Kasutades teststatistikut Z,
saime kokkuvttes tulemuse et kahepoolsete hpoteeside kontrollimisel:
jme nullhpoteesi juurde, kui z
| Z |
/2
<
ja
vtame vastu alternatiivse, kui z
| Z |
/2
.
Teststatistiku Z leidmisel kasutatakse valimikeskmise standardhlvet
X

. Meenutame (vt
11.1), et juhul kui on teada ldkogumi standardhlve , siis leiame
n
X


; enamasti me
seda aga ei tea ja piisavalt hea hinnangu saame, kui kasutame valimi standardhlvet s ning sel
juhul arvestame, et
n
s
X

.
Nide 12.1. Pikaajalise katsetamise kigus on selgunud, et 10-12 aastaste pilaste intel-
ligentsuse testi IQ keskmine nitaja on 110 palli. Seda testi kasutati hes vikeses koolis 80
pilase hindamiseks ja saadi keskmiseks
108,2 = X
. Seejuures arvutati ka valimi standard-
hlve s=9,4. Kas olulisusnivool 0.05 vime vita, et selle kooli pilaste intelligentsustase eri-
neb keskmisest?
Lahendus. Lhtudes hpoteeside pstitamise phimttest, me nullhpoteesiga peame vit-
ma, et ei ole olulist erinevust selle kooli pilaste ja pilaste ldise keskmise IQ vahel. Seega
H
0
: = 110
saame kahepoolsete hpoteeside paari:
H
1
: 110
Olulisusnivoole =0,05 vastab tiendkvantiil
96 1 =
z /2
,

. Leiame teststatistiku Z
1,71 - =
s
n * 110) - (108.2
= Z
.
Kuna teststatistiku absoluutvrtus on viksem kui vastav tiendkvantiil:
96 , 1
025 , 0 2 /
< z z Z

, siis jme nullhpoteesi juurde. Seega, vike erinevus tulemustes ei
luba veel vita kontrollitava kooli pilaste erinevat intelligentsust. Rhutame siinjuures, et
kahepoolse hpoteesiga me kontrollime intelligentsustaseme erinevust, mitte seda kas see on
suurem vi viksem.
Nagu neme, phineb hpoteeside kontrollimine kahe vrtuse vrdlemisel helt
poolt teststatistik Z, mille vrtus sltub valimi keskmisest ja standardhlbest, teiselt poolt
tiendkvantiil, mille vrtus sltub nutavast olulisusnivoost. Vaatame veelkord toodud
nidet ja nuame hinnangut olulisusnivool 0,1. Sel juhul teststatistiku vrtus on sama,
tiendkvantiil
65 , 1
025 , 0 2 / 1 , 0 2 /
z z z

ning kuna |-1,71| > 1,65, siis vtame vastu al-


ternatiivse hpoteesi tehtud valim nitab, et selle kooli pilaste IQ erineb keskmisest.
Kumba tulemust lugeda igeks? Erinevatele olulisusnivoodele vastavad erineva pik-
kusega vahemikud, mille korral jdakse nullhpoteesi juurde. Juhul = 0,05 on selleks

=
1,96s ja juhul = 0,1 on selleks

= 1,65s . Vaatame seda situatsiooni joonisel:


67
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Arvestame, et valimikeskmine, mille phjal teeme otsustuse on juhuslik suurus ja vib
omandada erinevaid vrtusi. Neme, et suurema olulisusnivoo korral = 0,1 me loobume
nullhpoteesist kiiremini ja vtame vastu alternatiivse hpoteesi. Meenutame, et olulisusni-
vood visime tlgendada teatud tpi vea tenosusena. Kui tegelikkuses on aga ige nullh-
potees, seega oletus =
0
, siis vttes vastu alternatiivse hpoteesi me teeme vea.
Situatsiooni, kus tegelikkuses kehtib nullhpotees, kuid meie vtame vastu alternatiivse
hpoteesi, nimetatakse esimest liiki veaks. laltoodud nite korral thendaks see seda, et
kuigi tegelikult ei ole laste intelligentsitasemetes erinevust, nitab meie testi tulemus, et eri-
nevus on olemas.
ldiselt vib olla ka teisipidi tegelikult kehtib alternatiivne hpotees, on olemas erine-
vus, kuid meie katsetulemused nuavad nullhpoteesi juurde jmist. Sel juhul rgitakse
teist liiki veast.
Jooniselt vib nha, et mida viksem on olulisusnivoo, seda suurem on vahemik mille kor-
ral jme nullhpoteesi juurde. Seega seda viksema tenosusega teeme esimest liiki vea;
seda viksema tenosusega saame toodud nites vita, et vaadeldava kooli laste intel-
ligentsitase ei kni keskmiseni. Siit tuleneb ka hpoteeside juures kasutatav terminoloogia
me peame testama erinevuse (ei vrdu, on suurem, on viksem) vi jma nullhpoteesi
juurde. Sageli tuuakse siinjuures eelnevalt esitatud nide kohtust: me eeldame kaebealuse
stust ja peame testama tema sdioleku.
Nagu neme, juhib nullhpoteesi juurde jmist ja alternatiivse hpoteesi vastuvtmist va-
limi phjal koostatud teststatistik Z. Selleks, et mitte katsetada erinevaid olulisusnivoosid,
lhenetakse hpoteeside kontrollimisele ka teisipidi. Koostatud valimi phjal leitakse
kontrollstatistik Z ning mratakse olulisusnivoo, mis vastab teststatistiku vrtusele. Sellist
olulisusnivoo vrtust nimetatakse olulisustenosuseks.
Kasutades normaaljaotuse tiendkvantiilide tabeleid, saab laltoodud nite korral leida, et
olulisustenosus on 0,088. Seega vime vita, et olulisusnivoo = 0,088 on prdepunkt,
mille letamisel korral loetakse testatuks alternatiivne hpotees. Mingis mttes vib olu-
lisustenosust tlgendada kui valimi phjal leitud hinnangut nullhpoteesi usutavusele, tp-
semalt see vljendab tenosust saada selline vi veelgi rmuslikum valim nullhpoteesi
kehtides.
12.3.2 hepoolsete hpoteeside kontrollmine

H
0
:
0
Hpotees suurem on antud paarina:
vastab =0,1
vastab =0,05

0
+

0
-

X
jme H
0
juurde
H
1
H
1
68
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
H
1
: >
0
Nagu lalpool analsisime siis juhul, kui valimikeskmine on viksem kui meie oletatav
vrtus
0
X < , ei saa valim kummutada nullhpoteesi. Nii ei ole nite 12.1 andmete phjal
mtet hakata testame et vaadeldava kooli pilaste keskmine IQ on suurem ldisest keskmi-
sest. Tabelis 12.1 leidsime, et nullhpoteesi juurde jme tingimusel
) (
0
+ < w X
, seega
ldkeskmise juhul on tingimus
) ( X
0
+ < (12.1)
ning raja

, mis mrab lemineku nullhpoteesilt alternatiivsele hpoteesile olulisusni-


vool saame leida valemist 1 = ) ) - X P((
0
< .
Paragrahvi alguses seadsime eelduseks, et tegemist on suure kontrollvalimiga ja sellest tu-
lenevalt on valimikeskmine jaotunud normaaljaotuse jrgi. Siis vime leida tenosuse
1 = ) < ) - X P((
0
avaldada kujul:


+
+ < 1 ) ( ) ( ) (
0 0
0
X X
X P
Analoogiliselt kahepoolsete hpoteeside kontrollivalemi tuletamisega

z
X


) 1 (
1
ning siit hinnang rajale

z
X
.
Asendades leitud

valemisse (12.1) saame

z X
X
+ <
0
. Kirjutame selle vrratuse
natukene teisel kujul, saame kriteeriumi, et nullhpoteesi juurde jme, kui

z
X
X
<

0
ehk arvestades thistust
Z
X
X

0
omandab kriteerium vga lihtsa kuju: z
Z

< .
H
0
:
0
Hpotees viksem on antud paarina:
H
1
: <
0
On arusaadav, et kui X
0
> , siis valim ei kummuta nullhpoteesi. Kui aga X
0
,
siis kerkib ksimus sellest, kas valimikeskmine on oletatavast ldkeskmisest piisavalt palju
viksem, et vtta vastu alternatiivne hpotees. Nullhpoteesi juurde jmise tingimuseks
saime punktis 12.2:

- X

0
. Lhtudes tenosusest 1 = )

- X P(

0
> vime kirjuta-
da:
1 )

( )

( 1 )


( 1 ) ( X P( 1 )) ( X P(
X

X
0 0
0 0


<
.
Nagu eespool tegime, saame siit kergesti vlja kirjutada vrduse

z
X
ja nullh-
poteesi juurde jmise tingimusest

z X
X

0
ehk

z
X
X
<

0
. Kasutades lal-
pool toodud thistust Z, vime nullhpoteesi juurde jmise tingimuse kirjutada lejnutega
analoogilisel kujul:

z Z <
69
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Nide 12.2. Detaili valmistamise aeg on normi jrgi 35 sekundit. Meister vidab, et tema
poolt pakutud tiustuse korral aeg lheneb. Selle vite kontrollimiseks tehti 70 katset ning
saadi
X
= 32,5 ja s=10,2. Kas katse tulemused kinnitavad meistri videt?
Lahendus. Meistri vite kontrollimiseks pstitame hpoteesid. Nullhpoteesiks valime si-
tuatsiooni, mis vidab, et midagi muutunud ei ole - aeg ei lhenenud.
35 :
H
35 :
H
1
0
<

paremaks muutu ei

Leiame kontrollstatistiku
05 , 2
2 , 10
70 ) 35 5 , 32 (
0

X
X
Z

. Sellele vastav olulisus-


tenosus = 0,02, mis on piisavalt vike selleks, et vtta vastu alternatiivne hpotees.
12.3.3 Hpoteeside kontrollimise koondtabel
Tuletame veelkord meelde, et lalpool ksitletus eeldasime valimikeskmise kui juhus-
liku suuruse normaaljaotust. See on tidetud juhul, kui hpoteeside kontrollimiseks koostatud
kontrollvalim on piisavalt suur. Sel juhul visime ilma suurema eksimuseta vtta ldkogumi
standardhlbe asemel kasutusse valimi standardhlbe:
n
s
n
X

. Kui on tegemist
vikeste valimitega ja uuritav tunnus on normaaljaotusega, siis vime teha sellise asenduse,
kuid samas kasutama normaaljaotuse tiendkvantiili asemel Studenti tiendkvantiili (vrdle
ldkeskmise usaldusvahemiku leidmisega osas 11.1)
Kokkuvttes saame tulemused koondada tabelisse:
kus
X
X
Z

- on teststatistik,

z
- on standardse normaaljaotuse tiendkvantiil
ja
1 , n
t

- on Studenti jaotuse tiendkvantiil olulisusnivool ja vabadusastmete arvuga n-1.


12.4 Hpoteesid sageduste kohta
Kui uurimise objektiks on ldkogumi tunnus, mis omandab vaid vrtusi "0" ja "1", siis
ldkeskmine thendab sisuliselt vrtuse "1" esinemise suhtelist sagedust. Suhtelise sageduse
Suur valim Vike valim
Hpotees Kehtib hpotees Kehtib hpotees
A
H
0
: =
0
H
1
:
0
H
0,
kui
2 /
z Z <
H
1
, kui
2 /
z Z
H
0,
kui
1 , 2 /
<
n
t Z


H
1
, kui
1 , 2 /

n
t Z

B
H
0
:
0
H
1
: >
0
H
0,
kui

z Z <

H
1
, kui

z Z
H
0,
kui
1 ,
<
n
t Z


H
1
, kui
1 ,

n
t Z


C
H
0
:
0
H
1
: <
0
H
0,
kui

z Z <
H
1
, kui

z Z

H
0,
kui
1 ,
<
n
t Z


H
1
, kui
1 ,

n
t Z


Tabel 12.2
70
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
usaldusvahemiku leidmist ksitlesime eespool punktis 11.3. Seal time sisse jrgmised t-
histused ja leidsime jrgmised seosed:
ldkeskmine (st. suhteline sagedus ldkogumis): = p
ldkeskmise dispersioon:
2
= pq
valimikeskmine (st. suhteline sagedus valimis): p = X
valimikeskmise dispersioon:
n
pq
=
n

=
2
2
X
Selles osas tegeleme sageduse kohta kivate hpoteesidega. Thistame meie poolt
arvatava sageduse vrtust smboliga p
0
. Kuna lhtume sellest, et see vrtus on ige, siis tu-
leneb temast ka valimikeskmise dispersioon
n
q p
=
0 0 2
X
, kus q
0
=1-p
0
.
Nagu lalpool eldud, on sageduse korral tegemist ldkeskmise erijuhuga. Suurte va-
limite korral on valimikeskmine
X
(praegu p ) tsentraalse piirteoreemi kohaselt jaotunud
normaaljaotusega ning peab paika kik, mis eespool oli eldud ldkeskmise hpoteeside kor-
ral. Normaaljaotuse - tiendkvantiiliga (vi /2-tiendkvantiiliga) vrreldav teststatistik Z
asendub laltoodud thistusi arvestades teststatistikuga kujul:
0 0
0 0
) ( ) (
q p
n p p X
Z
X

.
Hpoteeside kontrollimiseks saame tabeli:
Kui hpoteesides ldkeskmise kohta saime vikese kontrollvalimi korral kasutada Studenti
jaotuse tiendkvantiile, siis sageduse hindamisel seda teha ei saa.
Nide 12.3. Muudatuste tegemiseks tkorralduses ksitleti 120 tlist. Nendest 65 tles
"pooldan muudatusi". Kas olulisusnivool = 0.05 vime vita, et le poolte tlistest
pooldab muudatusi?
Lahendus. Kontrollitav sagedus p
0
= 0,5 ning tahame teada, kas tehtud valim testab vite
p > 0,5. Saame hpoteesid:
H
0
: p 0,5 (las olla nii nagu on)
H
0
: p > 0,5 (enamus pooldab muudatusi)
Suur valim
Hpotees Kehtib hpotees
A
H
0
: p = p
0
H
1
: p p
0
H
0,
kui
2 /
z Z <
H
1
, kui
2 /
z Z
B
H
0
: p p
0
H
1
: p > p
0
H
0,
kui

z Z <

H
1
, kui

z Z
C
H
0
: p p
0
H
1
: p < p
0
H
0,
kui

z Z <
H
1
, kui

z Z

71
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Leiame sageduse valimis: 0.54 =
120
65
= p ning teststatistiku vrtuse
876 , 0
5 , 0 5 , 0
120 ) 5 , 0 54 , 0 ( ) (
0 0
0

q p
n p p
Z
Kuna
65 , 1
05 , 0
z
siis teststatistik Z on viksem tiendkvantiilist ja me jme nullhpo-
teesi juurde - ei saa vita, et enamik toetab muudatusi.
Suhteline sagedus toodud nites
0.54 =
120
65
= p
on siiski kindlalt le poole ning tule-
museks saadud vide, et le poole ei toeta muudatusi on tavainimesele arusaamatu. Milles on
asi?
Vaatame, kuidas valimi suurendamine mjutab vastuvetavat otsust. Vtame esialgse nite
ja oletame, et 120 tlise asemel ksitleti 200 inimest, kusjuures "jah/ei" proportsioon ji
samaks 0,54. Sel juhul teststatistik
1.13 = 200
0.5 0.5
0.5 - 0.54
= z

ning kuna 1.13 < 1.65, siis j-


me ikkagi nullhpoteesi juurde.
Suurendades veelgi ksitletavate arvu, ksitledes 500 inimest, siis sama "jah/ei" pro-
portsiooni korral saame tulemuseks Z = 1,78. Seega Z > 1.65, siis peame vastu vtma al-
ternatiivse hpoteesi.
Intuitiivselt vttes on tulemus arusaadav mida suurem on valim, seda usaldatavam on tu-
lemus. Iga valimi korral saame leida olulisustenosuse (vt 12.3.1), mille korral vetakse
vastu alternatiivne hpotees. Lahendatud lesande korral nitab valimimahu ja olulisuste-
nosuse vahelist seost tabel:
Valimi
maht
Teststatistik Z Olulisustenosus
120 0,88 0,19
200 1,13 0,13
500 1,78 0,04

Arvestades seda, et suurema valimi korral on tulemus alati tpsem, siis vime toodud nite
phjal teha ka jrelduse mida viksem on olulisustenosus, seda usaldatavam on leminek
alternatiivsele hpoteesile.
Sellest nitest saame veel he tdemuse, mida kasutatakse praktikas. Nimelt, me ei
pea ette andma olulisusnivood, vaid otsustame nullhpoteesi vi alternatiivse hpoteesi vahel
lhtudes olulisustenosusest: piisavalt vikese olulisustenosuse korral vtame vastu al-
ternatiivse hpoteesi. Milline on see piisavalt vike suurus, seda teooria ette elda ei saa, see
sltub uuritavast probleemist. Enamiku tavalesannete korral vetakse olulisustenosuse
vrtuseks 0,05.
Siin on hea mrkida ka usaldusvahemiku ja hpoteeside kontrollimise duaalsust
sama valimi korral on lppjreldus alati sama. Kui leiame ldkeskmisele usaldusvahemiku
72
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
olulisusnivool ning see ei sisalda nullhpoteesis vljapakutud vrtust (w
0
vi

p
0
) siis samal
olulisusnivool lbi viidud hpoteeside kontroll ksib vastu vtta alternatiivse hpoteesi.
Vastupidi, kui leiame ldkeskmisele usaldusvahemiku olulisusnivool ning see usaldusvahe-
mik hlmab ka nullhpoteesis vljapakutud vrtust (w
0
vi

p
0
) siis (samal olulisusnivool lbi
viidud) hpoteeside kontroll nuab nullhpoteesi juurde jmist.
12.5 Hpoteesid ldkeskmiste vahe kohta
Kllaltki sageli on praktikas lesandeid, kus tuleb vrrelda kahte ldkogumit nende min-
gite parameetrite osas. Kesolevas kursuses piirdume vaid kahe parameetri - ldkeskmise ja
mingi vrtuse suhtelise sageduse vaatlemisega. Niteks vib pstitada lesande teha kind-
laks kas meeste palk erineb naiste palgast, on ta suurem vi viksem; kas kahe pakkeauto-
maadi poolt pakitud kotid erinevad keskmise kaalu poolest; kas spordiga tegelevad inimesed
on tervemad kui mittetegelevad jne.
Snastame selle lesande matemaatiliselt. Olgu antud kaks ldkogumit X ja Y, millel on
ldkeskmised
X
ja
Y
. ldkeskmiste tegelikke vrtusi me ei tea. Kui teaksime, taanduks
kogu probleem vaid kahe arvu vrdlemisele. Vaatleme probleemi natukene ldisemalt, kus
me ei vaatle ainult vrdust, vaid anname hinnangu ka ldkeskmiste erinevusele. Seega taha-
me anda ka hinnangu suhetele:

X

Y
= D vi

X

Y
> D vi

X

Y
< D,
kus D on mingi arvatav erinevuse suurus.
ldkeskmiste oletatava erinevuse vi mitteerinevuse testamiseks pstitame hpoteeside
paarid: A: H
0
:
X
-
Y
= D B: H
0
:
X
-
Y
D C: H
0
:
X
-
Y
D
H
1
:
X

Y
D H
1
:
X
-
Y
> D H
1
:
X
-
Y
< D
Kuna ritame alati testada alternatiivset hpoteesi H
1
, siis viksime nullhpoteesis kirju-
tada ka vrduse H
0
:
X
-
Y
= D kikide hpoteesitpide korral, kuid jme antud juhul siis-
ki laltoodud kuju juurde.
Hpoteeside kontrollimiseks teeme kummastki ldkogumist piisavalt suured sltumatud
valimid
7
suurustega n
1
ja n
2
ning leiame valimikeskmised
X
ja
Y
, mis on juhuslikud
suurused. Vastavalt tsentraalsele piirteoreemile (osa 7.3.1) on piisavalt suurte valimite korral
juhuslikud suurused
X
ja
Y
normaaljaotusega. Toome sisse uue juhusliku suuruse
Y - X W
. Saab nidata, juhuslik suurus W on normaaljaotusega, keskvrtusega
Y X
EW ja standardhlbega
2
2
Y
1
2
X
Y X W
n

+

.
Seega oleme taandanud probleemi ldkeskmiste vahe kohta pstitatud hpoteeside prob-
leemi osas 12.3 ksitletud juhule suure valimimahu korral. Tuginedes sellele vime vahetult
vlja kirjutada:
*7 Valimid on sltumatud, kui nad ei sisalda samu objekte ning objekti valik hte valimisse ei mjusta objek-
ti valimist teise
73
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Hpoteesi kuju
Kehtivuse tingimus
A
H
0
:
X
-
Y
= D
H
1
:
X
-
Y
D
H
0,
kui
2 /
z Z <

H
1
, kui
2 /
z Z
B
H
0
:
X
-
Y
D
H
1
:
X
-
Y
> D
H
0,
kui

z Z <
H
1
, kui

z Z
C
H
0
:
X
-
Y
D
H
1
:
X
-
Y
< D
H
0,
kui

z Z <

H
1
, kui

z Z

Siin
Y X

D ) Y X (
Z

ning
Y X


arvutatakse laltoodud valemi phjal, kui on teada ldko-
gumite standardhlbed vi valemi
2
2
Y
1
2
X
Y X
n
s
n
s
+

abil, kus s
X
ja s
Y
on vastavate valimite
standardhlbed.
Tuletan meelde, et me eeldasime suuri valimeid. Kui kasvi ks valimitest ei ole piisavalt
suur, saame vaadelda vaid juhtu, kus tunnused on normaaljaotusega ja enam-vhem sama
standardhlbega. Muutub uue juhusliku suuruse
Y - X W
standardhlbe arvutamise eeskiri
ja hpoteeside kontrollimisel peame normaaljaotuse asemel kasutama Studenti jaotust. Kuna
ldine lhenemine on osaga 12.3 sarnane, siis toome siinjuures ra vaid lpptulemuse, mille
vormistame alljrgneva tabelina.
Seejuures vikeste valimite korral (eeldusel, et ldkogumid on normaaljaotusega ja enam-
vhem vrdsete dispersioonidega) leiame valimikeskmiste vahe standardhlbe
Y X


, siis
2
2
1
2
) (
n
s
n
s
p p
Y X
+

, kus
2 -
n
+
n
1) -
n
(
s
+ 1) -
n
(
s
=
s
2 1
2
2
Y 1
2
X 2
p
Mrgime siinjuures, et sna sageli huvitab vaid ldkeskmiste omavaheline suhe:
X
=
Y
vi
X
<
Y
vi
X
>
Y
. See on erijuht eelnevast, kus eeldatava erinevuse suurus on vetud
vrdseks nulliga: D = 0. Siin viitame veel hele tihti kasutatavale vitele: juhul kui testa-
takse hpotees H
1
:
X

Y

siis eldakse, et vaadeldavad kogumid (millest tehti valimid) ei
ole vastaval olulisusnivool statistiliselt eristatavad ldkeskmise mttes.
Nide 12.4. Kaalujlgijad tegutsesid kahe eri metoodika jrgi. Poole aasta mdudes hi-
nnati, kas kasutatud metoodikate tulemuses on olulist erinevust. Selleks tehti kummagi me-
toodika jrgi tegutsenud inimeste hulgast valimid (kumbki 60 inimest) ja leiti keskmine kaalu
Suur valim Vike valim
Hpotees
Kehtib hpotees Kehtib hpotees
A
H
0
:
X
-
Y
= D
0
H1:
X
-
Y
D
0
H
0,
kui
2 /
z Z <
H
1
, kui
2 /
z Z
H
0,
kui
f
t Z
, 2 /
<
H
1
, kui
f
t Z
, 2 /

B
H
0
:
X
-
Y
D
0
H
1
:
X
-
Y
> D
0
H
0,
kui

z Z <

H
1
, kui

z Z

H
0,
kui
f
t Z
,
<

H
1
, kui
f
t Z
,


C
H
0
:
X
-
Y
D
0
H
1
:
X
-
Y
< D
0
H
0,
kui

z Z <
H
1
, kui

z Z
H
0,
kui
f
t Z
,
<

H
1
, kui
f
t Z
,


kus
f = min(n
1
1, n
2
1)
ja
Y X

D - ) Y X (
Z

74
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
vhenemine:
X
= 10 kg ja
Y
= 11 kg, kusjuures arvutati ka s
1
= 5 ja s
2
= 6. Kas metoodi-
kates on erinevust?
Lahendus. Pstitame hpoteesid: H
0
:
X
=
Y
H
1
:
X

Y
Arvutame teststatistiku
1 =
60
36
+
60
25
1
=
n
s
+
n
s
)
Y
-
X
(
=

)
Y
-
X
(
= Z
2
2
2
1
2
1
)
X
-
X
(
2 1
Nii olulisusnivool 0,05
( , )
/
z
2
196
kui ka olulisusnivool 0.1
( , )
/
z
2
168
nuavad and-
med nullhpoteesi juurde jmist - ei saa vita erinevuse eksisteerimist kahe metoodika tule-
muste vahel.
12.6 Hpoteesid sageduste vahe kohta
Sageli on praktikas tarvis hinnata suhtelise sageduse (protsendi) muutusi, st. anda hinnang
suhteliste sageduste vahele. Niteks on tavaline, et antakse hinnanguid erakondade poolehoid-
jate protsendi muutumisele, reklaamikampaania mjule jne. Nagu eespool vaatlesime (osa
11.3), on sagedus ldkeskmise erijuht (tunnus omandab vaid vrtusi 0 ja 1) ning phimtte-
liselt saame suurte valimite korral kasutada kiki ldkeskmise kohta toodud hinnanguid.
Arvestades aga tunnuse eripra omandavad nii pstitatavad hpoteesid kui ka kasutatavad
valemid veidi teistsuguse kuju. Laskumata tpsetesse selgitustesse toome siinjuures vaid t-
histused ja protsentide vahe kohta pstitatud hpoteeside kontrollimise koondtabeli.
Olgu antud kaks ldkogumit ning nendes arvutatud tunnuse vrtuse 1 suhtelised
sagedused p
1
ja p
2
. Olgu esimesest ldkogumist tehtud valim suurusega n
1
ning selle phjal
arvutatud suhteline sagedus
1
1
1
n
m
p
; teise valimi korral
2
2
2
n
m
p
. Hpoteeside kontrollimiseks
arvutatakse kahe kogumi hine standardhlve:
)
n
1
n
1
)( p - (1 p s
2 1
p
+

kus
2 1
2 1
n n
m m
p
+
+

.
Hpoteeside kontrollimise tabel kahe kogumi suhteliste sageduste vrdlemisel on:
Hpotees Kehtib hpotees
A
H
0
: p
1
= p
2
H
1
: p
1
p
2
H
0,
kui
2 /
z Z
p
<

H
1
, kui
2 /
z Z
p

B
H
0
: p
1
= p
2
H
1
: p
1
> p
2
H
0,
kui

z Z
p
<

H
1
, kui

z Z
p


C
H
0
: p
1
= p
2
H
1
: p
1
< p
2
H
0,
kui

z Z
p
<

H
1
, kui

z Z
p


kus
p
p
s
p p
Z
2 1


Nide 12.5. Oletame, et enne reklaamikampaaniat oli erakonna Liberaalid pooldajaid 100
ksitletu phjal 20%. Prast kampaaniat oli toetajaid 24%. Kas olulisusnivool 5% vime vi-
ta, et pooldajate arv suurenes?
Lahendus. Tahame nidata, et pooldajate arv suurenes. Seega pstitame hpoteesid:
75
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
H
0
: p
1
= p
2
H
1
: p
1
< p
2
Arvutame: 0,2 p
1
, 24 , 0
2
p , 0,22
200
24 20
p
+

,

0,06 0,01) 0,78(0,01 * 0,22 )
n
1
n
1
)( p - (1 p s
2 1
p
+ +


ning teststatistik Z
p
= (0,2-0,24/0,06) = -0,67.
Olulisusnivoole 0,05 vastab normaaljaotuse tiendkvantiil
1,65 z
0,05

ja kuna -Z
p
=
0,67 < 1,65 siis jme nullhpoteesi juurde.
Seega kuigi silmaga nhtavalt tusis toetajate hulk 4% vrra, ei saa sellest siiski teha
jreldust kampaania edukusest. Probleemseisneb selles, et antud juhul oli 100 ksitletut liiga
vhe usaldusvrseks erinevuse testamiseks.
76
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
13 JAOTUSE LEIDMINE
Senises ksitluses eeldasime, et lesannet lahendama asudes me teame, millise jaotusega
on parajasti vaadeldav juhuslik suurus. Niteks eeldasime, et telefoniarve suurus on normaal-
jaotusega, kosmoselaeva tabanud meteoriitide arv on Poissoni jaotusega jne. Kuidas aga tege-
likkuses teha kindlaks, millise jaotusega on juhuslik suurus? Praktikas on juhuslik suurus an-
tud mingi oma vrtuste hulgaga (niteks valimisse vetud lipilaste telefoniarved). Vib
kohe vita, et ei ole sellist meetodit, mille korral, lhtudes uuritava juhusliku suuruse vr-
tustest, saab vahetult tuletada tema jaotuse. Jb le ks tee pstitada oletus jaotuse kohta,
teha valim ja vaadata, kas meie oletus sobib vi ei. See on tpiline hpoteeside pstitamise
ja kontrollimise skeem.
Teeme seda ja pstitame hpoteesid:
H
0
: F = F
0
(Q)
H
1
: F

F
0
(Q)
kus nullhpoteesiga H
0
tleme, et juhusliku suuruse jaotus F on meie arvates F
0
parameetrite
hulgaga Q. Tehes valimi tahame veenduda, kas valim viib meid alternatiivse hpoteesi F


F
0
(Q) juurde vi ei.
ldjuhul antakse juhusliku suuruse jaotus eeskirjaga (funktsiooniga), mis mrab tema va-
hemikku langemise tenosuse. Nii et praegusel juhul me ei saa piirduda lihtsalt arvude vrd-
lemisega, nagu tegime eespool hpoteeside kontrollimisel, vaid peame vrdlema juhusliku
suuruse vahemikku langemise sagedusi eeldatava jaotuse F
0
(Q) korral vahemikku langemise
sagedustega valimis. Seega omavahel on tarvis vrrelda vrtuste tabeleid. Kui erinevus
nende vahel on kllaltki vike, vib arvata, et nullhpoteesis antud jaotus kirjeldab piisavalt
hsti juhuslikku suurust, igal juhul valim seda ei kummuta.
Kust vtta oletatav jaotuse kuju? Ilmselt mngib siin suurt rolli uurija kogemus, aga samu-
ti vib mtteid suunata ka juhusliku suuruse vrtuste saamise protsessi olemus (viiteid vas-
tavat juhuslikku suurust genereerivale protsessile time iga vaadeldava teoreetilise jaotuse
juures). Iga eeldatav teoreetiline jaotus on seotud mingite parameetrite hulgaga Q, niteks
normaaljaotusel keskvrtus ja standardhlve. Oletatavas jaotuses parameetrite leidmisel vi-
me kasutada valimit, kui meil kusagilt ei ole vtta paremat oletust.
Jaotuse kohta kivate hpoteeside kontrollimiseks on mitmeid meetodeid. Meie vaatleme
siinkohal vaid hte,
2
-statistikul phinevat meetodit (hii-ruut-testi), mis sobib jrelduste te-
gemiseks piisavalt suurte (n 30) valimite phjal.
Kuidas vrrelda vrtuste hulki oletatava vrtuse jrgi arvutatuid valimi phjal leitutega
ja millal vime vita, et erinevus on piisavalt suur alternatiivse hpoteesi vastuvtmiseks.
Siin on olemas tielik sarnasus eelmistes osades vaadeldud hpoteeside pstitamise ja
testamisega tabelite phjal leitav vrtuste erinevus on juhuslik suurus ning kui me teame
tema jaotust, saame vajaliku olulisusnivoo korral leida arvu (tiendkvantiili), mille letamisel
peame vastu vtma alternatiivse hpoteesi.
Selgitame seda tpsemalt. Olgu meil oletatav jaotus F
0
(Q) ja tehtud kontrollvalim. Nende
phjal moodustame sagedustabeli, millesse kanname objektide arvu tunnuse vrtusvahe-
mikes eeldatava jaotuse jrgi ja sageduse kontrollvalimis. Seega vaatleme tabelit:
77
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Vahemik 1: Xx
1
2: x
1
<Xx
2
... j: x
j-1
<Xx
j
... K: x
k-1
<Xx
k
Tenosus F
0
(Q) jrgi
p
1
=P(Xx
1
) p
2
=P(x
1
<Xx
2
) ... p
j
=P(x
j-1
<Xx
j
) ... p
k
=P(x
k-1
<Xx
k
)
Sagedus eeldatava jaotuse
korral: e
i
=p
j
n
e
1
=p
1
n e
2
=p
2
n ... e
i
=p
j
n ... e
k
=p
k
n
Suhteline sagedus valimi
phjal
v
1
=S(Xx
1
) v
2
=S(x
1
<Xx
2
) ... v
j
=S(x
j-1
<Xx
j
) ... v
k
=S(x
k-1
<Xx
k
)
Thistused e
j
ja v
j
vtsime kasutusele, kuna selliselt on nad olemas mitmetes pikutes ja neid
viks tlgendada kui e eeldatav vrtus ja v valimist saadud vrtus.
On selge, et eeldatava ja valimist saadud sageduste vahet isaloomustav summa

k
i i
i i
e
e v
h
1
2
) (
on juhuslik suurus. Oma olemuselt vljendab see just seda, mida soovisime
leida hinnangut tabeli vastavate ridade erinevusele. Saab nidata, et see juhuslik suurus on
nn
2
- jaotusega*
8
, ning teda saab kasutada hpoteeside kontrollimisel teststatistikuna. Selle
olemust me siinjuures selgitama ei hakka.
Thistades nd
2
-jaotuse tiendkvantiili olulisusnivool thega
f ,
h

, vime snastada:
hpoteeside kontrolli tingimused jrgmiselt:
- jme nullhpoteesi H
0
juurde, kui h <
f ,
h

ja
- vtame vastu alternatiivse hpoteesi H
1
, kui h
f ,
h

,
kus
2
-jaotuse tiendkvantiil
f ,
h

on vabadusastmete arvuga f=k-d-1 ja d on valimi phjal hi-


nnatud jaotuse parameetrite arv.
Jaotuse kontrollimisel
2
-testiga peavad olema tidetud teatud lisatingimused nii valimi
mahu kui ka klassidesse jaotamise osas. Nimelt,
valimimaht n peab olema le 30,
keskmine objektide arv klassis peab statistilise jaotuse korral olemal vhemalt 5
objekti 5
k
n
,
teoreetilise jaotuse jrgi arvutades peab igas klassis olema vhemalt 5 objekti: e
i
5,
teoreetilise jaotuse jrgi arvutatud klassid peavad olema ligikaudu vrdsed: e
i
e
j
.

Nide 13.1. Oletame, et tahame teha kindlaks doktorikraadi kaitsjate vanuselise jaotuse.
Ksitleme 37 kraadi kaitsnud isikut (valim) ja koondame tulemused jrgmisse tabelisse.
isiku vanus 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37
isikute arv v
i
1 1 3 5 4 4 1 3 4 2 3 2 1 2 1 37
Nende andmete phjal saame leida valimikeskmise
29,5 =
37
1 * 37 + .... 3 * 25 + 1 * 24 + 1 * 23
= X
+
*8
2
-jaotuse olemust me ei vaatle, vtame teadmiseks vaid, et tema vrtused on samuti nagu normaal -
jaotuse korralgi tabuleeritud ning seotud teststatistiku vrreldavate paaride arvuga.
78
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
ja valimi standardhlbe
7 , 3 ...
1
) (
2

n
X x
s
i
i
.
Vimaliku jaotuse kohta idee saamiseks esitame andmed graafikul:
Selle joonise phjal on vga raske ennustada, mis jaotusega on tegemist. Vib teha vaid
he jrelduse - vaadeldava isikute hulga kohta on meie vrtuste (vaadeldavate vanuste) arv
liiga suur. Vhendame seda jaotades vanused rhmadesse (klassidesse) ja leiame kraadikaits-
jate arvu vastavas klassis. Vttes niteks intervalliks he aasta asemel kolm aastat, on tabel
oluliselt selgem:
x
i
23 24 25 26 27 28 29 30 31 32 33 34 35 36 37
v
i
1 1 3 5 4 4 1 3 4 2 3 2 1 2 1 37
v
i
5 13 8 7 4 37
Joonistades nd tabeli phjal graafiku, saame juba jaotuse prognoosimiseks kllaltki sel-
ge pildi:
Vaadates seda graafikut vib oletada, et tegu on normaaljaotusega. Kontrollime seda,
arvestades lalpool leitud valimikeskmist ja valimi standardhlvet. Seega saame kontrollitava
hpoteesidepaari:
H
0
: F = N(29,5; 3,7)
H
1
: F N(29,5; 3,7)
Kuna vastavalt tehtud eeldusele on tegemist normaaljaotusega N(29.5, 3.7), siis saame lei-
da ka arvud e
i
, mis nitavad, kui palju kraadikaitsjaid 37-st ksitletust oleks pidanud jaotu-
sest tulenevalt olema vastavas vanusevahemikus.
0.11 = (-1.21) = )
3.7
29.5 - 25
( = 25) < P(X
0
2
4
6
8
10
12
14
23-25 26-28 29-31 32-34 35-37
vi
0
1
2
3
4
5
6
23 24 25 26 27 28 29 30 31 32 33 34 35 36 37
isikute arv vi
79
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Siin esimese vahemiku vtsime mitte 23-24, vaid llitasime vahemiku koosseisu ka kik
23 aastast nooremad. Samuti tegime ka viimase vahemikuga, vaadeldes teda kui 35 aastat ja
rohkem. Sellega saime vikese ebatpsuse, kuid antud juhul ei ole see oluline. Lbiviidud
arvutuste tulemusena saame tabeli:
x
i
23 24 25 26 27 28 29 30 31 32 33 34 35 36 37
v
i
1 1 3 5 4 4 1 3 4 2 3 2 1 2 1 37
v
i
5 13 8 7 4 37
P(x
i
<X<x
i+1
) 0.11 0.23 0.32 0.23 0.11 1
e
i
=n*p
i
4.07 8.51 11.8 8.51 4.07 36.96
Hpoteeside kontrollimiseks arvutame teststatistiku:
096 , 4 ...
) (
1
2

k
i i
i i
e
e v
h
,
kus k=5 on praegusel juhul vrreldavate vrtuste (klasside) arv.
Valides olulisusnivooks = 0,1 ja arvestades vabadusastmete arvu f = 5-2-1 = 2 saame
2
-
jaotuse tabelist leida tiendkvantiili
f ,
h

vrtuse 605 , 4 h
2 ; 1 , 0
.
Kuna
4,605 =
h
< 4,096 = h
f ,
, siis antud valimi korral on erinevus normaaljaotusest liiga
vike selleks, et nullhpoteesi mber lkata ja me ei saa vita, et andmed ei prineks vas-
tavast normaaljaotusest.
0.23 = 0.13 - (-0.41) = 0.11 - )
3.7
29.5 - 28
( = F(25) - F(28) = 28) < X P(25
0.32 = 0.34 - (0.41) = 0.34 - )
3.7
29.5 - 31
( = F(28) - F(31) = 31) < X P(28
0.11 = 0.89 - 1 = F(34) - 1 = X) P(34
80
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
14 TUNNUSTEVAHELISED SEOSED
14.1 Kahe tunnuse hisjaotus
ldkogumi igal objektil on palju erinevaid tunnuseid. Eelmistes paragrahvides me valisi-
me he tunnuse ja tegelesime selle tunnuse uurimisega - leidsime tema keskmise, standard-
hlbe, jaotuse jms. Sageli on aga vaja uurida kahe vi enama tunnust nende koosmju sei-
sukohalt, niteks: seos keskmise hinde ja palga vahel prast likooli lpetamist, seos inimese
iseloomutbi ja laste arvu vahel, seos reklaamikampaania maksumuse ja valituks osutunud
saadikute arvu vahel jne.
Allpool piirdume vaid kahe tunnuse vaheliste seoste uurimisega.
Kigepealt kirjeldame lahendatavat lesannet matemaatiliselt. Olgu vetud vaatluse alla
kaks tunnust X ja Y oma vimalike vrtustega X = {x
1
, x
2
, ..., x
n
} ja Y = {y
1
, y
2
, ..., y
m
}.
Tunnuste X ja Y hissagedustabeliks nimetame tabelit, mis iga vrtuste paari (x
i
, y
j
) korral
nitab selle esinemissagedust p
ij
vaadeldavas kogumis:
Y/ X x
1
x
2
... x
n
y
1
p
11
p
12
... p
1n
y
2
p
21
p
22
... p
2n
... ... ... ... ...
y
m
p
m1
p
m2
... p
mn
Kogumiks on kas ldkogum vi valim. Viimasel juhul tahame kik valimi phjal tehtud
jreldused kanda le ldkogumile.
Kahe tunnuse vahelise seose uurimisel huvitavad meid eelkige jrgmised ksimused:
1) kas kahe tunnuse vahel on olemas seos,
2) kuidas vljendada seose tugevust arvuliselt,
3) kuidas prognoosida he tunnuse vrtusi teise tunnuse phjal.
Otsime nendele ksimustele vastuseid allpool, kasutades enamasti ra eespool saadud tule-
musi.
14.2
2
- test sltuvuse avastamiseks
Olgu vaatluse all kaks tunnust, mille kohta tahame kindlaks teha, kas nende vahel on
olemas mingi statistiline sltuvus. Niteks, kas on olemas sltuvus lipilaste materiaalse
olukorra ja ppeedukuse vahel, kas on olemas sltuvus firma edukuse ja juhtkonna haridus-
taseme vahel, jne. Kuna tunnuste uurimisel lhtume hisest sagedustabelist, siis ei ole oluline,
kas tegemist on arvuliste vi mittearvuliste tunnustega. Pideva tunnuse korral moodustame
vrtusklassid ja vaatleme sagedusi vastavates vrtusklassides.
Eespool kasutasime
2
- testi he tunnuse jaotuse kindlaks tegemisel, kus vrdlesime va-
limi vrtuste esinemissagedusi nendega, mis oleks pidanud olema tulenevalt eeldatavast teo-
reetilisest jaotusest. Kahe tunnuse vahelise sltuvuse kindlaks tegemine on tegelikult sarnane
lesanne: vrreldakse valimi phjal leitud sagedusi teoreetiliste sagedustega. Teoreetilised
sagedused leitakse eeldusel, et tunnuste vahel seost ei ole (seose puudumise korral on tegu
htlase jaotusega, kus iga paari esinemissagedus on proportsionaalne vastavate vrtustega
objektide esinemisega valimis).
81
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Seega pstitame hpoteesid:
H
0
: tunnuste vahel ei ole seost (nad on sltumatud)
H1 : tunnuste vahel on seos (nad on sltuvad)
Hpoteeside kontrollimiseks kasutatakse
2
- jaotusel phinevat h-statistikut, mis vaadel-
daval juhul avaldub kujul:
e
)
e
-
v
(
= h
j i,
2
j i, j i,
j i,

. Jme nullhpoteesi juurde, kui teststatistik


on viksem kui olulisusnivool mratud tiendkvantiil:
f ,
h h <
, kus vabadusastmete arv
f=(ridade arv-1)*(veergude arv -1) ja vtame vastu sisuka hpoteesi vastupidisel juhul.
Nide 14.1. Oletame, et tahame leida, kas Tartu linnas on olemas sltuvus palgataseme ja
elukoha vahel. Olgu vimalikud palgatasemed: krge, keskmine ja madal ning vimalikud
elukohad Supilinn, Veeriku, Annelinn ja Ropka. Ksitlustulemused koondame jrgmisse ta-
belisse.
Krge Keskmine Madal Kokku
Annelinn 42 28 16 86
Veeriku 21 6 9 36
Supilinn 8 10 25 43
Ropka 14 10 11
35
Kokku 85 54 61 200
Tabelis on toodud ksitlusest saadud vastavate vrtuspaaride sagedused. Kui seost kahe
tunnuse vahel ei oleks, siis niteks Annelinnas elavate krgepalgaliste inimeste arv oleks pro-
portsionaalne krgepalgaliste inimeste arvuga ksitletute hulgas, seega 86
200
85
11
=
e
. ldju-
hul saame elemendi e
ij
arvutamiseks valemi
n
v r
=
e
j i
ij

, kus r
i
on vastava rea elementide sum-
ma ja v
j
on veeru elementide summa.
Kasutades seda arvutusreeglit leiame eeldatavad vrtused ja tiendame tabelit:
Krge
v
i,1
e
i,1
Keskmine
v
i 2
e
i 2
Madal
v
i 3
e
i 3
Kokku
Annelinn 42 36,55 28 23,22 16 26,23 86
Veeriku 21 15,3 6 9,72 9 10,98 36
Supilinn 8 18,28 10 11,61 25 13,12 43
Ropka 14 14,88 10 9,45 11 10,68 35
Kokku 85 54 61 200
Tabeli phjal leiame nd teststatistiku
26,53 ... =
e
)
e
-
v
(
= h
j i,
2
j i, j i,
j i,

. Valime olulisusni-
voo =0,05, millele vastab tiendkvantiil
12,6 h
6 0,05,

. Seega
6 0,05,
h h >
ja peame vastu vt-
ma alternatiivse hpoteesi: antud andmete phjal on olemas seos sissetuleku ja elukoha vahel.
See oli sltuvuse avastamise test, kui on tarvis leida ka sltuvuse arvulist suurust ja
suunda, kasutatakse korrelatsioonanalsi.
82
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
14.3 Korrelatiivne sltuvus
Eespool vaatlesime,
2
- testi seose (sltuvuse) avastamiseks kahe tunnuse vahel.
Seose leidmiseks vaatlesime tunnuste vrtuste kikvimalikke paare ja nende koosesinemise
sagedusi. lesande sellises ksitluses ei hirinud meid asjaolu, et mlemad tunnused visid
omandada mittearvulisi vrtusi. Lbiviidud analsi tulemusena vtsime vastu alternatiivse
hpoteesi sltuvad vi siis jime nullhpoteesi "sltumatud" juurde. Kuigi varieerides olu-
lisusnivooga vime kaudselt hinnata ka sltuvuse tugevust, on arvuliste tunnuste korral vi-
malik tuletada ka tpsemaid, sealhulgas arvulisi hinnanguid sltuvuse tugevusele.
14.3.1 Lineaarse korrelatsiooni kordaja
Tunnuste vahelise sltuvuse arvulise suuruse mramiseks on mitmeid meetodeid.
heks enimkasutatavaks on Pearsoni lineaarse korrelatsiooni kordaja, millel on ka korrektne
tenosusteoreetiline tagamaa". Selle kordaja arvutamiseeskirja oskame tuletada ka oma se-
niste teadmiste phjal. Asjast huvitatute tarbeks on see peenemas kirjas toodud mittekohus-
tusliku osana.
Olgu antud juhuslikud suurused X ja Y. Kui X ja Y on teineteisest sltumatud, siis nitasime eespool, et nen-
de summa dispersioon vrdub dispersioonide summaga: D(X+Y) = DX + DY.
Kui juhuslikud suurused on teineteisest sltuvad, siis saame:
D(X+Y) = E(X+Y - E(X+Y))
2
=E((X-EX)+ (Y-EY))
2
=
=E(X-EX)
2
+2E((X-EX)(Y-EY))+E(X-EX)
2
=
=DX + DY + 2 E((X-EX)(Y-EY))
Liiget E((X-EX)(Y-EY)) nimetatakse kovariatsiooniks ja kirjutatakse
cov(XY) = E((X-EX)(Y-EY))
Juhuslike suuruste X ja Y kovariatsioonil on jrgmised omadused:
1. Kui juhuslikud suurused X ja Y on sltumatud, siis cov(X,Y) = 0.
Tepoolest: cov (X,Y) = E((X-EX)(Y-EY))= E(XY-YEX - XEY + EX EY =EXY-EYEX -E XEY + EX EY = 0
2. Kui suurused X ja Y on lineaarses sltuvuses, st Y=aX+b, siis
cov( ) XY DX DY
.
Tepoolest, kuna EY = aEX + b, siis Y-EY = aX + b - aEX -b = a(X-EX) ning cov (X,Y) = aE(X-EX)
2
= a
DX, ja teiselt poolt DY = D(aX +b) = a
2
DX kust saame
DX
DY
a , mille asendamine valemisse cov
(X,Y) =a DX annab tulemuseks
DY DX = Y) cov(X,
Kovariatsiooni vrtus vib olla nii positiivne kui ka negatiivne. Lhtudes kovariatsiooni definitsioonist ne-
me, et positiivse kovariatsiooni korral on prevaleerivad muutujate samasuunalised muutused, negatiivse korral
aga erisuunalised (he suuruse kasvamisele vastab teise kahanemine).
Silmas pidades nii kovariatsiooni definitsiooni kui ka omadusi vib kovariatsiooni vaadelda sltuvuse m-
duna juhuslike suuruste X ja Y vahel, mis omandab vrtuse 0 sltumatuse korral kuni
DY * DX t
lineaarse
sltuvuse korral.
Sltuvuse mthikuna ei kasutata aga kovariatsiooni otseselt, vaid ta normeeritakse vrtusega
DY * DX
ning saadud nitajat
DY DX
EY Y EX X E
DY DX
Y X
Y X r

)) )( (( ) , cov(
) , (
(14.1)
83
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
nimetatakse korrelatsioonikordajaks.
Arvestades kovariatsiooni omadusi vime vita: korrelatsioonikordaja nitab juhuslike suuruste X ja Y vahelist
lineaarset sltuvust ning muutub vahemikus [-1, -1].
Vaatleme objektide kogumit, millel on mdetud kahe tunnuse vrtused. Tunnuste vas-
tavate vrtuste koos esinemise vib vlja kirjutada kas lalpool toodud viisil hissagedusta-
belina vi lihtsalt vastavate paaride jadana (koos kordustega):
X x
1
x
2
.... x
n
Y y
1
y
2
.... y
n
Tunnuseid vaadeldakse juhuslike suurustena, kusjuures tunnused vivad olla teineteisest
sltuvad. Sltuvuse tugevuse hindamiseks vib kohaldada lalpool tuletatud lineaarse kor-
relatsioonikordaja valemit (14.1) Thistades
X = EX
ja
Y = EY
ning arvestades, et vaadelda-
vas paaride hulgas on iga paari kogumis esinemise tenosus p(x
i
, y
i
) = 1/n, saab korrela-
tsiooni arvutamiseks valemi kirjutada kujul:
) Y - y ( ) X -
x
(
) Y - y )( X -
x
(
= Y) r(X,
2
i
n
=1 i
2
i
n
=1 i
i
i
n
=1 i

(14.2)
Suurust r(X,Y) nimetatakse lineaarse korrelatsiooni kordajaks ehk Pearsoni korrelatsiooni-
kordajaks. Lineaarse korrelatsiooni kordaja hindab tunnustevahelise lineaarse seose tugevust
ja suunda. Lineaarse seose korral kirjutatakse tunnuste vaheline seos lineaarse vrrandiga
kujul Y=aX+b, kus a ja b on arvulised konstandid, mille leidmist vaatleme punktis 14.4.
Tulenevalt korrelatsioonikordaja leidmisel lhtealuseks olevast valemist (14.1), vib kor-
relatsioonikordaja omandada vaid vrtusi vahemikust [-1 , 1], kus negatiivsed vrtused ni-
tavad prdvrdelise seose olemasolu, positiivsed vrtused aga vrdelise sltuvuse olemas-
olu. Vrtus r(X,Y)= 0 nitab lineaarse sltuvuse puudumist.
Kui me korrelatsioonikordaja leidmisel vtame aluseks ldkogumi, siis nitab valemi
(14.2) jrgi arvutatud korrelatsioonikordaja lineaarse korrelatsiooni suurust kahe selle ldko-
gumi tunnuse vahel. Enamasti on aga ldkogum tema terviklikuks ksitlemiseks liiga suur ja
nagu ikka, kasutame valimit. Valimi phjal arvutatud korrelatsioonikordaja on ldkogumi
korrelatsioonikordaja hinnanguks. Nagu kikide teiste ldkogumi parameetrite hindamise
korral, nii ka vaadeldaval juhul, saab anda hinnangu saadud tulemuse tpsusele, st saab leida
tenosuse P(|r-|<)=1-
kus thistab ldkogumi korrelatsioonikordajat ja r valimi phjal leitud korrelatsiooni-
kordajat.
Sageli ei taheta teada mitte korrelatsioonikordaja suurust, vaid hinnata kas lineaarse kor-
relatsioonisltuvuse on olemas ja mrata tema suund. Sel juhul pstitatakse hpoteesid:
A. H
0
:=0 ei ole korrelatiivset sltuvust
H
1
: 0 on korrelatiivne sltuvus
B. H
0
:0 ei ole positiivset korrelatiivset sltuvust
H
1
: >0 on positiivne korrelatiivne sltuvus
84
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
C. H
0
:0 ei ole negatiivset korrelatiivset sltuvust
H
1
: <0 on negatiivne korrelatiivne sltuvus
Pstitatud hpoteeside kontrollimisel kasutatakse erilist nn. Fischeri jaotust. Kesolevas
kursuses ei ole aga mtet sisse tuua veel hte jaotuse tabelit, kuna praktikas abistab selliste
hpoteeside kontrollimisel ikkagi vastav statistika tarkvarapakett, mis leiab olulisuste-
nosuse, mille korral lugeda testatuks alternatiivne hpotees.
Lineaarne korrelatsioonikordaja ei ole "kikvimas" vahend seose tugevuse mramiseks.
Alati tuleb silmas pidada, et ta on vaid lineaarse seose nitaja ja ta vib anda seose puudu-
mise, kuigi tunnuste vahel on mingi teise funktsiooniga avaldatav seos vi on andmekogumil
mingi raskesti arvestatav eripra (niteks objektid ldkogumis on jaotunud mitmesse rhma).
Toome allpool nite, kus lineaarne korrelatsioonikordaja ei kirjelda tunnustevahelist seost
adekvaatselt.
Nide 14.2.*
9
Olgu katsealustel hiirtel mdetud pikkus ja kaal antud tabelina:
Kaal 11 10 10,6 9,8 10,2 11,5 15,9 10,2 11,6 10,6 12,1 11,1 10,5
Pikkus 22 25 23 20 20 28 36 23 22 25 25 22 21
Arvutades selle phjal korrelatsioonikordaja saame r(X,Y) = 0,87 ning vime vita, et pik-
kus ja kaal on positiivselt kllaltki hsti koreleerunud.
Vaatleme esitatud andmeid graafikul:
0
10
20
30
40
0 5 10 15 20
Kaal
P
i
k
k
u
s
Neme, et vrreldes teistega on ks hiir oma pikkuse ja kaalu poolest erandlik. Ilmselt m-
justab ta ka korrelatsioonikordaja ldhinnangut tugevasti. Jtame selle hiire (15,9; 36) oma
valimist vlja ja arvutame lejnute korral korrelatsioonikordaja. Seega vaatleme tabelit:
Kaal 11 10 10,6 9,8 10,2 11,5 10,2 11,6 10,6 12,1 11,1 10,5
Pikkus 22 25 23 20 20 28 23 22 25 25 22 21
Arvutades nd korrelatsioonikordaja saame r(X,Y)= 0,47. Seega meie seose tugevus
vhenes tunduvalt.
Veelgi ilmekama nite vime tuua, kui eeldama tunnustevahelist mittelineaarset seost
(niteks ruutseost Y=aX
2
+b). Kuigi sel juhul on tunnuste vahel seos olemas, nitab Pearsoni
korrelatsioonikordaja seose puudumist ja seda igusega lineaarset seost ju ei ole.
*9 Nide on vetud raamatust A-M. Parring, M.Vhi, E.Krik. Statistilise andmettluse algpetus. Tartu
likooli Kirjastus, 1997
85
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
14.3.2 Spearmani korrelatsioonikordaja
Krvuti lineaarse korrelatsioonikordajaga kasutatakse veel mitmeid teisi korrelatsiooni-
kordajaid: Spearmani, Kendalli jpt. Allpool vaatlema Spermani korrelatsioonikordajat e.
astakkorrelatsioonikordajat.
Spermani korrelatsioonikordaja korral vetakse otseste mtmistulemuste asemel
kasutusele astakud. Astak on mdetava tunnuse jrjekorranumber vastava mtmistulemuse
jrjestatud reas. See vhendab erindite osakaalu kskik kui suur on ka erindi vastava tun-
nuse vrtus, Spermani korrelatsioonikordaja arvutamises suureneb ta eelmisega vrreldes
vaid he vrra.
Nide 14.3. Vaatleme veelkord hiirte uurimise nidet 14.2 ja leiame tema astakkorrelatsiooni
kordaja.
Arvutuste tulemused koondame tabelisse:
Jrk Kaal Pikkus
Kaalu
astak
Pikkuse
astak
1 11 22 4 3
2 10 25 2 5
3 10,6 23 5 4
4 9,8 20 1 1
5 10,2 20 3 1
6 11,5 28 7 6
7 15,9 36 10 7
8 10,2 23 3 4
9 11,6 22 8 3
10 10,6 25 5 5
11 12,1 25 9 5
12 11,1 22 6 3
13 10,5 21 4 2
Lineaarne korrelatsioonikordaja astakute vahel on r(X,Y) = 0,62.
Kui mtmistulemused on kik erinevad, saab lineaarse korrelatsiooni kordaja arvutamist
lihtsustada ja Spearmani korrelatsioonikordaja leida valemist:
) 1 (
)) ( ) ( 6
1 ) , (
2
2

n n
y astak - x (astak
= Y X r
i i
n
=1 i
S
Vaadeldava nite korral saame tulemuseks r
s
(X,Y) = 0,78.
Nagu nha, on saadud tulemused laltoodud lihtsa nite korral erinevad. Vrreldes
lineaarse korrelatsioonikordaja ja Spearmani korrelatsioonikordaja olemust peame meeles:
kui lineaarne korrelatsioonikordaja mdab tunnuste vahelise lineaarse seose tugevust, siis
Spearmani korrelatsioonikordaja mdab tunnuste vahelise monotoonse seose tugevust.
Nagu mainitud, on tunnustevahelise korrelatsiooni kordajaid palju. Millist neist valida,
sltub uuritavate andmete sisulisest analsist. Sageli aitab sellele kaasa graafiline pilt, mis
nitab andmetekogumi struktuurilist iserasust.
86
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
LISAD
Standardiseeritud normaaljaotuse tabel
x 0 1 2 3 4 5 6 7 8 9
-3,0 0,0013 0,0013 0,0013 0,0012 0,0012 0,0011 0,0011 0,0011 0,0010 0,0010
-2,9 0,0019 0,0018 0,0018 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014
-2,8 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019
-2,7 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026
-2,6 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036
-2,5 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048
-2,4 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064
-2,3 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084
-2,2 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,0110
-2,1 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143
-2,0 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183
-1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233
-1,8 0,0359 0,0351 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294
-1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367
-1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455
-1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559
-1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681
-1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823
-1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985
-1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170
-1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379
-0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611
-0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867
-0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148
-0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451
-0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776
-0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121
-0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483
-0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859
-0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4,0
0,9987 0,9990 0,9993 0,9995 0,9997 0,9998 0,9998 0,9999 0,9999 1,0000 1,0000
Normaaljaotusega juhusliku suuruse
X~N(0, 1) jaotusfunktsiooni vrtused
-
3
,
0
-
2
, 5
-
2
, 0
-
1
,
5
-
1
, 0
-
0
, 5
0
, 0
0
, 5
1
, 0
1
, 5
2
, 0
2
, 5
3
, 0
(x)
x
87
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Studenti jaotuse tiendkvantiilide tabel
0,2 0,15 0,1 0,05 0,025 0,02 0,01 0,005
1 1,963 1,963 3,078 6,314 12,706 15,894 31,821 63,656
2 1,061 1,386 1,886 2,920 4,303 4,849 6,965 9,925
3 0,978 1,250 1,638 2,353 3,182 3,482 4,541 5,841
4 0,941 1,190 1,533 2,132 2,776 2,999 3,747 4,604
5 0,920 1,156 1,476 2,015 2,571 2,757 3,365 4,032
6 0,906 1,134 1,440 1,943 2,447 2,612 3,143 3,707
7 0,896 1,119 1,415 1,895 2,365 2,517 2,998 3,499
8 0,889 1,108 1,397 1,860 2,306 2,449 2,896 3,355
9 0,883 1,100 1,383 1,833 2,262 2,398 2,821 3,250
10 0,879 1,093 1,372 1,812 2,228 2,359 2,764 3,169
11 0,876 1,088 1,363 1,796 2,201 2,328 2,718 3,106
12 0,873 1,083 1,356 1,782 2,179 2,303 2,681 3,055
13 0,870 1,079 1,350 1,771 2,160 2,282 2,650 3,012
14 0,868 1,076 1,345 1,761 2,145 2,264 2,624 2,977
15 0,866 1,074 1,341 1,753 2,131 2,249 2,602 2,947
16 0,865 1,071 1,337 1,746 2,120 2,235 2,583 2,921
17 0,863 1,069 1,333 1,740 2,110 2,224 2,567 2,898
18 0,862 1,067 1,330 1,734 2,101 2,214 2,552 2,878
19 0,861 1,066 1,328 1,729 2,093 2,205 2,539 2,861
20 0,860 1,064 1,325 1,725 2,086 2,197 2,528 2,845
21 0,859 1,063 1,323 1,721 2,080 2,189 2,518 2,831
22 0,858 1,061 1,321 1,717 2,074 2,183 2,508 2,819
23 0,858 1,060 1,319 1,714 2,069 2,177 2,500 2,807
24 0,857 1,059 1,318 1,711 2,064 2,172 2,492 2,797
25 0,856 1,058 1,316 1,708 2,060 2,167 2,485 2,787
26 0,856 1,058 1,315 1,706 2,056 2,162 2,479 2,779
27 0,855 1,057 1,314 1,703 2,052 2,158 2,473 2,771
28 0,855 1,056 1,313 1,701 2,048 2,154 2,467 2,763
29 0,854 1,055 1,311 1,699 2,045 2,150 2,462 2,756
30 0,854 1,055 1,310 1,697 2,042 2,147 2,457 2,750
31 0,853 1,054 1,309 1,696 2,040 2,144 2,453 2,744
32 0,853 1,054 1,309 1,694 2,037 2,141 2,449 2,738
33 0,853 1,053 1,308 1,692 2,035 2,138 2,445 2,733
34 0,852 1,052 1,307 1,691 2,032 2,136 2,441 2,728
35 0,852 1,052 1,306 1,690 2,030 2,133 2,438 2,724
36 0,852 1,052 1,306 1,688 2,028 2,131 2,434 2,719
37 0,851 1,051 1,305 1,687 2,026 2,129 2,431 2,715
38 0,851 1,051 1,304 1,686 2,024 2,127 2,429 2,712
39 0,851 1,050 1,304 1,685 2,023 2,125 2,426 2,708
40 0,851 1,050 1,303 1,684 2,021 2,123 2,423 2,704
41 0,850 1,050 1,303 1,683 2,020 2,121 2,421 2,701
42 0,850 1,049 1,302 1,682 2,018 2,120 2,418 2,698
43 0,850 1,049 1,302 1,681 2,017 2,118 2,416 2,695
44 0,850 1,049 1,301 1,680 2,015 2,116 2,414 2,692
45 0,850 1,049 1,301 1,679 2,014 2,115 2,412 2,690
46 0,850 1,048 1,300 1,679 2,013 2,114 2,410 2,687
47 0,849 1,048 1,300 1,678 2,012 2,112 2,408 2,685
48 0,849 1,048 1,299 1,677 2,011 2,111 2,407 2,682
49 0,849 1,048 1,299 1,677 2,010 2,110 2,405 2,680
50 0,849 1,047 1,299 1,676 2,009 2,109 2,403 2,678
51 0,849 1,047 1,298 1,675 2,008 2,108 2,402 2,676
52 0,849 1,047 1,298 1,675 2,007 2,107 2,400 2,674
53 0,848 1,047 1,298 1,674 2,006 2,106 2,399 2,672
54 0,848 1,046 1,297 1,674 2,005 2,105 2,397 2,670
55 0,848 1,046 1,297 1,673 2,004 2,104 2,396 2,668
56 0,848 1,046 1,297 1,673 2,003 2,103 2,395 2,667
57 0,848 1,046 1,297 1,672 2,002 2,102 2,394 2,665
58 0,848 1,046 1,296 1,672 2,002 2,101 2,392 2,663
59 0,848 1,046 1,296 1,671 2,001 2,100 2,391 2,662
60 0,848 1,045 1,296 1,671 2,000 2,099 2,390 2,660
>60 0,842 1,036 1,282 1,645 1,960 2,054 2,326 2,576
indeks (a vi a/2)
f
t-jaotuse tiendkvantiilid
88
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013

2
- jaotuse tiendkvantiilide tabel
f \ tn 0.99 0.975 0.95 0.9 0.1 0.05 0.025 0.01 0.005
1 0.00 0.00 0.00 0.02 2.71 3.84 5.02 6.63 7.88
2 0.02 0.05 0.10 0.21 4.61 5.99 7.38 9.21 10.60
3 0.11 0.22 0.35 0.58 6.25 7.81 9.35 11.34 12.84
4 0.30 0.48 0.71 1.06 7.78 9.49 11.14 13.28 14.86
5 0.55 0.83 1.15 1.61 9.24 11.07 12.83 15.09 16.75
6 0.87 1.24 1.64 2.20 10.64 12.59 14.45 16.81 18.55
7 1.24 1.69 2.17 2.83 12.02 14.07 16.01 18.48 20.28
8 1.65 2.18 2.73 3.49 13.36 15.51 17.53 20.09 21.95
9 2.09 2.70 3.33 4.17 14.68 16.92 19.02 21.67 23.59
10 2.56 3.25 3.94 4.87 15.99 18.31 20.48 23.21 25.19
11 3.05 3.82 4.57 5.58 17.28 19.68 21.92 24.73 26.76
12 3.57 4.40 5.23 6.30 18.55 21.03 23.34 26.22 28.30
13 4.11 5.01 5.89 7.04 19.81 22.36 24.74 27.69 29.82
14 4.66 5.63 6.57 7.79 21.06 23.68 26.12 29.14 31.32
15 5.23 6.26 7.26 8.55 22.31 25.00 27.49 30.58 32.80
16 5.81 6.91 7.96 9.31 23.54 26.30 28.85 32.00 34.27
17 6.41 7.56 8.67 10.09 24.77 27.59 30.19 33.41 35.72
18 7.01 8.23 9.39 10.86 25.99 28.87 31.53 34.81 37.16
19 7.63 8.91 10.12 11.65 27.20 30.14 32.85 36.19 38.58
20 8.26 9.59 10.85 12.44 28.41 31.41 34.17 37.57 40.00
21 8.90 10.28 11.59 13.24 29.62 32.67 35.48 38.93 41.40
22 9.54 10.98 12.34 14.04 30.81 33.92 36.78 40.29 42.80
23 10.20 11.69 13.09 14.85 32.01 35.17 38.08 41.64 44.18
24 10.86 12.40 13.85 15.66 33.20 36.42 39.36 42.98 45.56
25 11.52 13.12 14.61 16.47 34.38 37.65 40.65 44.31 46.93
26 12.20 13.84 15.38 17.29 35.56 38.89 41.92 45.64 48.29
27 12.88 14.57 16.15 18.11 36.74 40.11 43.19 46.96 49.65
28 13.56 15.31 16.93 18.94 37.92 41.34 44.46 48.28 50.99
29 14.26 16.05 17.71 19.77 39.09 42.56 45.72 49.59 52.34
30 14.95 16.79 18.49 20.60 40.26 43.77 46.98 50.89 53.67
40 22.16 24.43 26.51 29.05 51.81 55.76 59.34 63.69 66.77
50 29.71 32.36 34.76 37.69 63.17 67.50 71.42 76.15 79.49
60 37.48 40.48 43.19 46.46 74.40 79.08 83.30 88.38 91.95
70 45.44 48.76 51.74 55.33 85.53 90.53 95.02 100.43 104.21
80 53.54 57.15 60.39 64.28 96.58 101.88 106.63 112.33 116.32
90 61.75 65.65 69.13 73.29 107.57 113.15 118.14 124.12 128.30
100 70.06 74.22 77.93 82.36 118.50 124.34 129.56 135.81 140.17
89
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Valemite koondtabel
A. ldised teadmised
1. Kombinatsioonid:
)! ( !
!
m n m
n
n
m
m
n
C

,
_


2. Ruutvrrandi: ax
2
+bx+c=0 lahend
a
ac b b
x
2
4
2
t

3. Arvu e avaldised lpmatu summana




0 0
! !
1
k
k
k
e
k
e
k

;
4. Kahaneva geomeetrilise jada summa
q
a
S

1
0
, kus a
0
esimene liige ja q tegur
B. Sndmus ja tema tenosus
1. p(A)=
n
k
;
k
n
k
n
k
n
C
C C
A p
2
2
1
1
) (
, kus A on sndmus, et n-elemendilisest hulgast, mis sisaldab n
1
ht liiki ja n
2
teist liiki elementi (n
1
+n
2
=n), valitakse k elementi, milles on antud jaotus
elementide liikide jrgi: k
1
esimest ja k
2
teist liiki elementi (k
1
+ k
2
=k).
2. ) ( 1 ) ( A p A p .
3. Sndmuste summa tenosus: p(AUB)=p(A)+p(B)-p(AB) ja korrutise tenosus: p(AB)=
p(A|B)p(B). Kui sndmused A ja B on sltumatud, siis p(A|B)=p(A).
4. Tistenosus: )) H | P(A ) (P(H P(A)
i
n
1 i
i


)) H | P(A ) (P(H
) H | P(A ) P(H
A) | P(H
i
n
1 i
i
k k
k

C. Juhuslik suurus
1.

X x
i i
i
) p(x x EX
; DX = E(X-EX)
2
;


i
i
2
i
) p(x ) x (EX DX
; DX = EX
2
- (EX)
2
).
2.


xf(x)dx EX ; dx f(x) x) (EX DX
2



3. F(x)=P(Xx); P(a<Xb)=F(b)-F(a)
4.
k n k k
n
p) (1 p C k) P(n,

,
5.
e
k!

= P(k)
-
k
, EX = ; DX =
6.
e
k!
) (np
p) B(n,
np -
k


7. :
e
2
2
2
) (x
2
1
(x)

; EX = ja DX =
2
; F(x)=((x-)/)
8.
e
2npq
np) (k
n
2
npq 2
1
(k) P

,
_

,
_

npq
np k

npq
np k
) k ; (k P
1 2
2 1
n
.
90
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
D. Statistilised hinnangud
1. ldkogum: x
N
1
=
i
N
1 = i

; ) -
x
(
N
1
=
i
2
N
1 = i
2

2. Valim: x
n
1
= X
i
n
1 = i

) X -
x
(
1 - n
1
=
s
i
2
n
1 = i
2

= X E
n
s
n

=
X

3. ldkeskmise usalduspiiride leidmine
Tunnuse jaotus
Normaaljaotus Teadmata
Suur
valim
n60
teada
n
z
+ X < <
n
z
- X
/2 /2



ei ole
teada
n
s
z
+ X < <
n
s
z
- X
/2 /2



Vike
valim
n<60
teada
n
z
+ X < <
n
z
- X
/2 /2



ei ole
teada
n
s
t + X < <
n
s
t - X
n n

1 , 2 / 1 , 2 /

Ei ksitle antud
kursuses
- ldkogumi
standardhlve
s valimi standard-
hlve
2 /
z -normaal-
jaotuse tiendkvantiil
f
t
, 2 /
- Studenti
jaotuse tiendkvantiil
1- usaldusnivoo,
olulisusnivoo
Valimi maht:
2
2 /

,
_

z
n vi
2

,
_

s *
z
= n
/2
4. ldkeskmiste vahe usalduspiirid :
Tunnuse jaotus
Normaaljaotus Teadmata
Suur valim
n1,n2 60
1 ja 2
on teada
1 ja 2
ei ole
teada
Vike
valim
n1,n2 <60
1 ja 2
ei ole
teada
Ei saa lei-
da

1
ja
2
- ldkogumite
standardhlbed
s
1
ja s
2
valimite standardhl-
bed
2 /
z -normaaljaotuse tiend-
kvantiil
f
t
, 2 /
- Studenti jaotuse
tiendkvantiil
f=n1+n2-2
3 : 3 / 1
2
1
2
2
s s
2
) 1 ( ) 1 (
2 1
2
2 2
2
1 1
+
+

n n
s n s n
s
p
2
2
2
1
2
1
2
2 1
) (
2 1
n n
z X X I


+ t

2
2
2
1
2
1
2
2 1
) (
2 1
n
s
n
s
z X X I + t

2 1
;
2
2 1
1 1
) (
2 1
n n
s t X X I
p
f
+ t

91
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
6. Sageduse vahemikhinnang:
n
q p
z + p < p <
n
q p
z - p
/2 /2

ja valimi maht
2

2
/2

z
n
q p *
=

E. Hpoteesid
1. ldkeskmise kohta pstitatud hpoteeside kontrollimine:
Suur valim Vike valim
Hpotees Kehtib hpotees Kehtib hpotees
A
H
0
: =
0
H
1
:
0
H
0,
kui
2 /
z Z <

H
1
, kui
2 /
z Z
H
0,
kui
1 , 2 /
<
n
t Z


H
1
, kui
1 , 2 /

n
t Z

B
H
0
:
0
H
1
: >
0
H
0,
kui

z Z <
H
1
, kui

z Z
H
0,
kui
1 ,
<
n
t Z


H
1
, kui
1 ,

n
t Z


C
H
0
:
0
H
1
: <
0
H
0,
kui

z Z <
H
1
, kui

z Z
H
0,
kui
1 ,
<
n
t Z


H
1
, kui
1 ,

n
t Z


kus
X
X
Z

n
X


vi
n
s
X

z - normaaljaotuse tiendkvantiil
t - Studenti jaotuse tiendkvantiil
1- -usaldusnivoo
2. Hpoteesid ldkeskmiste erinevuse kohta
Suur valim Vike valim
Hpotees Kehtib hpotees Kehtib hpotees
A
H
0
:
X

-
Y

= D
0
H
1
:
X
-
Y
D
0
H
0,
kui
2 /
z Z <
H
1
, kui
2 /
z Z
H
0,
kui
f
t Z
, 2 /

H
1
, kui
f
t Z
, 2 /
>
B
H
0
:
X

-
Y

D
0
H
1
:
X

-
Y
>D
0
H
0,
kui

z Z <
H
1
, kui

z Z
H
0,
kui
f
t Z
,


H
1
, kui
f
t Z
,
>

C
H
0
:
X

-
Y

D
0
H
1
:
X

-
Y
<D
0
H
0,
kui

z Z <
H
1
, kui

z Z
H
0,
kui
f
t Z
,
<

H
1
, kui
f
t Z
,


kus f = n
1
+ n
2
2
) Y X (
0
D ) Y X (
Z

z - normaaljaotuse tiendkvantiil
t - Studenti jaotuse tiendkvantiil
1- -usaldusnivoo
Valimikeskmiste vahe standardhlve arvutatakse:
a) kui on teada ldkogumite standardhlbed
X
ja
Y,
siis
2
2
Y
1
2
X
) Y X (
n

b) kui valimid suured, ldkogumite standardhlbed


X
ja
Y,
ei ole teada, kuid eeldatakse
enam-vhem vrdseiks, siis
2
2
Y
1
2
X
) Y X (
n
s
n
s
+

92
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
c) kui valimid on vikesed, ldkogumid normaaljaotusega, enam-vhem vrdsed disper-
sioonid, siis
2
2
p
1
2
p
) Y X (
n
s
n
s
+

, kus
2 -
n
+
n
1) -
n
( s + 1) -
n
( s
=
s
2 1
2
2
Y 1
2
X 2
p
3. Hpoteesid sageduse kohta:
Suur valim
Hpotees Kehtib hpotees
A
H
0
: p=p
0
H
1
: pp
0
H
0,
kui
2 /
z Z <

H
1
, kui
2 /
z Z
B
H
0
: pp
0
H
1
: p>p
0
H
0,
kui

z Z <
H
1
, kui

z Z

C
H
0
: pp
0
H
1
: p<p
0
H
0,
kui

z Z <

H
1
, kui

z Z
kus

0 0
0
q p
n ) p p (
Z

z - normaaljaotuse tiendkvantiil
1- -usaldusnivoo
4. Hpoteesid sageduste erinevuse kohta
Hpotees Kehtib hpotees
A
H
0
: p
1
=p
2
H
1
: p
1
p
2
H
0,
kui
2 /
z Z
p
<

H
1
, kui
2 /
z Z
p

B
H
0
: p
1
p
2
H
1
: p
1
>p
2
H
0,
kui

z Z
p
<

H
1
, kui

z Z
p


C
H
0
: p
1
p
2
H
1
: p
1
<p
2
H
0,
kui

z Z
p
<

H
1
, kui

z Z
p


kus
p
2 1
p
s
p p
Z

)
n
1
n
1
)( p (1 p s
2 1
p
+


2 1
2 1
n n
m m
p
+
+

1
1
1
n
m
p
ja
2
2
2
n
m
p
6. Hpoteesid seose olemasolu kohta
93
K. remaa & A. Kaasik. Tenosusteooria ja matemaatiline statistika 2013
Hpoteesid Kehtib hpo-
tees
H
0
: seos puudub
H
1
: on seos
H
0,
kui
f
h h
,
<
H
1
, kui
f
h h
,

v
ij
-vaatlusest tulenev suhteline
sagedus
eij eeldusest tulenev suhteline
sagedus
f = (ridade arv-1)*(veergude arv -1)
7. Hpoteesid jaotuse kontrollimiseks
Hpoteesid Kehtib hpotees
H
0
: F=F
0
H
1
: F

F
0
H
0,
kui
f
h h
,
<
H
1
, kui
f
h h
,

v
ij
-vaatlusest tulenev suhteline
sagedus
eij eeldusest tulenev suhteline
sagedus
f=k-d-1 (d on vaadeldava jaotuse valimilt hinnatud para-
meetrite arv)
F. Seosekordajad
1. Lineaarse korrelatsiooni kordaja:
DY DX
EY)) EX)(Y E((X
DY DX
Y) cov(X,
Y) r(X,

ehk
) Y - y ( ) X -
x
(
) Y - y )( X -
x
(
= Y) r(X,
2
i
n
1 = i
2
i
n
1 = i
i
i
n
1 = i

2. Spearmani astakkorrelatsiooni kordaja:


1) n(n
)) y astak( - )
x
(astak( 6
1 = r
2
2
i
i
n
1 = i
S

, kus astak on muutuja vastava vrtuse jrjekorranu-


m-ber tema vrtuste jrjestatud tabelis.
3. Regressioonisirge y=bx + a kordajate hinnangud: X b Y a ja

n
1 i
2
i
n
1 i
i i
) X (x
) Y )(y X (x
b
e
)
e
-
v
(
= h
j i,
2
j i, j i,
j i,

k
1 i i
2
i i
e
) e (v
h
94

You might also like