Download as pdf or txt
Download as pdf or txt
You are on page 1of 45

Kvantitative Analyseredskaber

Tema i dag: Kontinuerte sandsynlighedsfordelinger

Dato Emne Litteratur Tilhørende


øvelser

Kontinuerte BO kap. 6-7: EMB kap. 5-6 11-13


sandsynlighedsfordelinger
6.1-6.5 NKS sæt 5
• Normalfordelingen
7. marts og
• Normal og binomialfordelingen
7.1-7.3
• Eksponentialfordelingen

Matematik og statistik Del 2 – Statistik, forår 2023 1


Kontinuerte sandsynlighedsfordelinger

Planen for i dag


▪ Kontinuerte sandsynlighedsfordelinger
▪ Normalfordelingen, herunder Z-fordelingen
▪ Normalfordelingen og binomialfordelingen
▪ Eksponentialfordelingen
▪ Den centrale grænseværdisætning (Central Limit
Theorem)

Matematik og statistik Del 2 – Statistik, forår 2023 2


Diskrete & kontinuerte variabler
▪ Diskret variabel: ▪ Kontinuert variabel:
▪ Tæller hændelser ▪ Måler (højde, vægt, hastighed, løn)
▪ Har et tællelig antal af mulige værdier ▪ Har et uendelig antal af mulige værdier
▪ Har diskrete hop mellem efterfølgende ▪ Går kontinuert fra værdi til værdi
værdier ▪ Har ingen målelig sandsynlighed til
▪ Har målelige sandsynligheder for hver hver individuel værdi
enkelt værdi ▪ Sandsynlighed er areal
▪ Sandsynlighed er højde

Eksempel: Eksempel:
Binomial Det skraverede
n=5 p=0.3 område angiver
x P(x) sandsynligheden
0 0.168 for mellem 2 og
1 0.360 3.
2 0.309
3 0.132
4 0.028
5 0.002
1.000

Matematik og statistik Del 2 – Statistik, forår 2023 3


Sandsynlighedstæthedsfunktionen
Probability density function (PDF)

Tæthedsfunktionen f(x)

Arealet under
kurven f(x) er lig
1.

Sandsynligheden for x
mindre end 3 er det
røde areal.

Matematik og statistik Del 2 – Statistik, forår 2023 4


Tæthedsfunktion (opsummering)
Nedenfor vises en normalfordelt variabel
For alle kontinuerte sandsynlighedsfordelinger gælder følgende:
▪ Tæthedsfunktionen har kun positive værdier: f(x) ≥ 0
▪ Sandsynligheden for, at x ligger mellem a og b, er lig med det grønne
område under f(x).
▪ Det totale område under tæthedsfunktionen f(x) er lig 1.
▪ Ingen enkeltværdi af x har en sandsynlighed, dvs. f(a) = 0. Kun områder er
sandsynligheder. Dvs.: P(a ≤ x ≤ b) = P(a < x < b).

Matematik og statistik Del 2 – Statistik, forår 2023 5


Den kumulative fordelingsfunktion

Den kumulative
fordelingsfunktion F(x)
(eller bare
fordelingsfunktionen).
Den viser udviklingen i
arealet under
tæthedsfunktionen til
venstre for x, når x
stiger/forøges.

Tæthedsfunktionen
f(x)

Matematik og statistik Del 2 – Statistik, forår 2023 6


Kontinuerte sandsynlighedsfordelinger

▪ Kontinuerte sandsynlighedsfordelinger
▪ Normalfordelingen, herunder Z-fordelingen
▪ Normalfordelingen og binomialfordelingen
▪ Eksponentialfordelingen
▪ Den centrale grænseværdisætning (Central Limit
Theorem)

Matematik og statistik Del 2 – Statistik, forår 2023 7


Normalfordelingen

▪ Normalfordelingen er en vigtig fordeling, blandt andet fordi


mange andre fordelinger, kan approksimeres til den.
▪ Blandt andre Carl F. Gauss (1777-1855) fandt frem til den,
derfor kaldes den også den gaussiske fordeling.

Gauss
Gaussfordeling
function(x) dnorm(x) (x)

0.4
0.2
0.0

-4 -2 0 2 4

Matematik og statistik Del 2 – Statistik, forår 2023 8


Normalfordelingen - Kendetegn

▪ Klokkeformet og symmetrisk omkring dens middelværdi.


▪ Middelværdi = median = toppunkt.
▪ Den er karakteriseret ved en middelværdi μ og varians σ² (eller
standardafvigelse σ).
▪ Notation: X~N(μ,σ²). Denne måde at skrive det på betyder, at
variablen X følger en normalfordeling med middelværdi μ og
varians σ².
▪ Er defineret for alle x (dvs. x kan antage værdier fra minus
uendelig til plus uendelig).

Matematik og statistik Del 2 – Statistik, forår 2023 9


Tæthedsfunktionen for normalfordelingen

Tæthedsfunktionen for normalfordelingen:


 ( x−  )2  Normalfordelingen: µ = 0, 2 = 1
− 
1  2 2 
f ( x) =  
for −   x  
0.4
e
2 2
0.3

f(x)
0.2

0.1

hvor e = 2,7182818 og π = 3,14159265


0.0
-5 0 5
x

Matematik og statistik Del 2 – Statistik, forår 2023 10


Eksempler på normalfordelinger
μ = 0,0 μ = 1,0 μ = 2,0

Samme
standard-
afvigelse,
forskellig
middelværdi.

Samme
σ = 2,0 σ = 0,5 middelværdi,
σ = 1,0 forskellig
standard-
afvigelse.

Matematik og statistik Del 2 – Statistik, forår 2023 11


Standard normalfordelingen (Z-fordelingen)
▪ Standard normalfordelingen er normalfordelingen med middelværdi
μ = 0 og standardafvigelse σ = 1.
▪ Denne fordeling betegnes også som Z-fordelingen.
▪ Notation: Z~N(0,1). Grafisk illustreret:

Standard Normalfordeling

f(z) 0,4

=1
0,3

{
0,2

0,1

0,0
-5 -4 -3 -2 -1 0 1 2 3 4 5
=0
z

Matematik og statistik Del 2 – Statistik, forår 2023 12


Tabelopslag – find sandsynlighed

▪ Den kumulative
fordelingsfunktion F(z) for
standard
P(z≤1,21) normalfordelingen er
tabellagt i Tabel A.3 i
appendikset i Bowerman,
5. udg., side 607, for
F(1,21)
F(z) = P(Z ≤ z) positive værdier af z.

▪ Figuren viser
P(z ≤ 1,21) = F(1,21)

Matematik og statistik Del 2 – Statistik, forår 2023 13


Find P(Z < 1,21) vha. tabelopslag

P(z ≤ 1,21 ) = F(1,21) = 0,8869

88,69%
Standard normalfordelingen
er tabellagt i Bowerman for
z = -3,99 til 3,99.

Hele z-værdien
2. decimalen i
angivet
z-værdien
med 1 decimal:

Bowerman, s. 607:

Matematik og statistik Del 2 – Statistik, forår 2023 14


Forelæsningsøvelse – 10 min.

▪ Hvor ligger P(1 ≤ z ≤ 2) i


figurerne?

▪ Beregn P(1 ≤ z ≤ 2)
(sandsynligheden for at z ligger
mellem 1 og 2) via opslag i
tabellen i Bowerman, s. 607.

▪ PS: Har I ikke bogen med, ligger tabellen på


itslearning under dagens forelæsning.

Matematik og statistik Del 2 – Statistik, forår 2023 15


Forelæsningsøvelse – Find P(1 ≤ z ≤ 2)

▪ Hvor ligger P(1 ≤ z ≤ 2) i


P(z ≤ 1) figurerne?
P(1 ≤ z ≤ 2)
▪ Vi beregner P(1 ≤ z ≤ 2)
således:
P(1  z  2) = P( z  2) − P( z  1)
= F (2) − F (1)
= 0,9772 − 0,8413
P(z ≤ 2) = 0,1359

▪ Vi finder P(z ≤ 1) og P(z ≤ 2) i


Bowerman, jf. næste slide.

Matematik og statistik Del 2 – Statistik, forår 2023 16


Vi finder P(z ≤ 2) og P(z ≤ 1) i tabel:

P(z ≤ 1)

P(z ≤ 2)

Bowerman, s. 607. P(1  z  2) = P( z  2) − P( z  1) = 0,9772 − 0,8413 = 0,1359


Matematik og statistik Del 2 – Statistik, forår 2023 17
Transformation til standardnormal

▪ Vi kan transformere en normalfordelt variabel, X~N(,2), om til


en standard normalfordeling, Z~N(0,1), ved følgende lineære
transformation:

x−
z=

▪ Formålet er, at vi dermed kan bruge den kumulative
fordelingsfunktion for standard normalfordelingen F(z) til at
beregne sandsynligheder knyttet til en hvilken som helst
normalfordeling X~N(,2).

Matematik og statistik Del 2 – Statistik, forår 2023 18


Transformation til Z
Spørgsmål: Hvad svarer x = 12 til
ovre i z-fordelingen?
𝑥−𝜇 𝑥−6
X ~N(𝜇,σ2) 𝑧= 𝑧=
𝜎 2
X ~N(6,22) 12 − 6
𝑧= =3
2
f(x) f(z)
0.8 0.8
0.7 0.7
0.6 0.6
0.5 0.5
0.4 Transforma- 0.4
0.3
0.2 tion over i z- 0.3
0.2
0.1
fordeling 0.1
0.0
x 0.0
z
6 0
12 3

Matematik og statistik Del 2 – Statistik, forår 2023 19


Transformation til standardnormal

▪ Sandsynlighederne knyttet til X ~ N(,2) bliver derfor:

 a−
P ( x  a ) = P z  
  

 b−
P ( x  b ) = P z  
  

a− b−
P ( a  x  b ) = P z 
   

Matematik og statistik Del 2 – Statistik, forår 2023 20


Transformation: Eksempel
▪ Antag studerendes score til eksamen er normalfordelt med
middelværdi 60 og standardafvigelse 15.
▪ Dvs. score X ~ N(60,152)
▪ Spørgsmål: Hvor stor en andel af de studerende har en score
under 95? P(X ≤ 95) = ?
▪ Idé: Transformer problemet til et, der vedrører en standard
normalfordelt variabel:
 x −  95 −    95 − 60 
P ( x  95) = P   = P z  
     15 
 95 − 60 
= P z   = P ( z  2,33) = F (2,33) = 0,9901
 15 
▪ Dvs. 99,01% af de studerende har en score under 95.

Matematik og statistik Del 2 – Statistik, forår 2023 21


Find P(z ≤ 2,33) i tabelopslag.

Bowerman, s. 607.
Matematik og statistik Del 2 – Statistik, forår 2023 22
Vi kan også bruge Excel!
▪ Excel: Formler / Indsæt funktion / Statistisk / NORMAL.FORDELING
(og angiv den ønskede x-værdi, middelværdien, standardafvigelsen
samt skriv SAND for at få den akkumulerede sandsynlighed).

Matematik og statistik Del 2 – Statistik, forår 2023 23


Forelæsningsøvelse - 10 min.

▪ Antag studerendes pointscore til eksamen er normalfordelt med


middelværdi 60 og standardafvigelse 15.
▪ Dvs. pointscore X ~ N(60,152)
▪ For at bestå eksamen skal man opnå mindst 40 point.
▪ Spørgsmål: Hvor stor en andel af de studerende kan forventes
ikke at bestå eksamen? Beregn altså sandsynligheden for at
opnå mindre end 40 point, dvs. hvad er P(X ≤ 39)?
▪ Idé: Transformer problemet til et, der vedrører en standard
normalfordelt variabel og find sandsynligheden via tabelopslag
(se på itslearning eller i bog). Derefter kan du evt. finde
sandsynligheden ved hjælp af Excel.

Matematik og statistik Del 2 – Statistik, forår 2023 24


Forelæsningsøvelse - 10 min.
▪ Antag studerendes pointscore til eksamen er normalfordelt med
middelværdi 60 og standardafvigelse 15. Dvs. score X ~ N(60,152).
▪ For at bestå eksamen skal man mindst opnå 40 point.
▪ Spørgsmål: Hvor stor en andel af de studerende kan forventes
ikke at bestå eksamen? Beregn altså sandsynligheden for at opnå
mindre end 40 point, dvs. hvad er P(X ≤ 39)?
▪ Svar: Vi transformer problemet til et, der vedrører en standard
normalfordelt variabel:
 x −  39 −    39 − 60 
P ( x  39) = P   = P  z  
     15 
 39 − 60 
= P z   = P ( z  −1,4) = F (−1,4) = 0,0808
 15 
▪ Dvs. 8,08% kan forventes ikke at bestå eksamen.
Matematik og statistik Del 2 – Statistik, forår 2023 25
Find P(z ≤ -1,4) i tabelopslag.

Bowerman, s. 606.
Matematik og statistik Del 2 – Statistik, forår 2023 26
Forelæsningsøvelse – 10 min.
▪ Excel: Formler / Indsæt funktion / Statistisk / NORMAL.FORDELING
(og angiv den ønskede x-værdi, middelværdien, standardafvigelsen
samt skriv SAND for at få den akkumulerede sandsynlighed).

Matematik og statistik Del 2 – Statistik, forår 2023 27


Kontinuerte sandsynlighedsfordelinger

▪ Kontinuerte sandsynlighedsfordelinger
▪ Normalfordelingen, herunder Z-fordelingen
▪ Normalfordelingen og binomialfordelingen
▪ Eksponentialfordelingen
▪ Den centrale grænseværdisætning (Central Limit
Theorem)

Matematik og statistik Del 2 – Statistik, forår 2023 28


Standard normal- og binomialfordelingen
▪ Binomialfordelingen beskriver udfaldet af For eksempel:
Binomial
gentagne forsøg, hvor der i hvert forsøg n=5 p=0.3
er to udfaldsmuligheder: Succes (med x P(x)
sandsynlighed p) eller fiasko (med 0 0.168
1 0.360
sandsynligheden q = 1-p). 2 0.309
▪ Middelværdi µ = np. Varians 2 = npq. 3 0.132
4 0.028
5 0.002
1.000
▪ Vi kan bruge normalfordelingen som en approksimation af binomial-
fordelingen, hvis np ≥ 5 og nq ≥ 5.
▪ Så kan vi fx beregne sandsynligheden for, at værdien ligger mellem a og b
(bemærk at vi transformerer til Z-fordelingen):

 a − np b − np 
P(a  x  b) = P z 

 npq npq 
Matematik og statistik Del 2 – Statistik, forår 2023 29
Eksempel
▪ Et uddannelsessted vil lave en spørgeskemaundersøgelse blandt
tidligere studerende, og man vil gerne opnå mindst 200 svar.
Erfaringsmæssigt er svarprocenten 25% i sådanne undersøgelser.
▪ Spørgsmål: Hvad er sandsynligheden for at få færre end 200 svar
tilbage, hvis man udsender 900 spørgeskemaer?
▪ Metode: Vi kan bruge Z-fordelingen som en approksimation af
binomialfordelingen, da np = 900*0,25 = 225 > 5 og nq = 900*(1-
0,25) = 675 > 5:
 x − np     
P( x  200) = P z  = P  z  200 − 900(0,25)  = P z  200 − 225 
npq   900(0,25)(0,75)   168,75 
  
 − 25 
= P z   = P( z  −1,92) = F (−1,92) = 0,0274
 12,99 

▪ Dvs. 2,74% sandsynlighed for at få færre end 200 svar tilbage.

Matematik og statistik Del 2 – Statistik, forår 2023 30


Transformation til Z
X ~N(𝜇,σ2) Spørgsmål: Hvad svarer x = 200 til ovre
i z-fordelingen?
𝜇 = 𝑛𝑝 = 900 0,25 = 225
𝑥−𝜇 𝑥 − 225
𝜎 = 𝑛𝑝𝑞 = 900(0,25)(0,75)=12,99 𝑧= 𝑧=
𝜎 12,99

X ~N(225,12,992) 200 − 225


𝑧= = −1,92
12,99

f(x) f(z)
0.8 0.8
0.7 0.7
0.6 0.6
0.5 0.5
0.4 Transforma- 0.4
0.3
0.2 tion over i z- 0.3
0.2
0.1
fordeling 0.1
0.0

225 x 0.0
z
0
200 -1,92

Matematik og statistik Del 2 – Statistik, forår 2023 31


Kontinuerte sandsynlighedsfordelinger

▪ Kontinuerte sandsynlighedsfordelinger
▪ Normalfordelingen, herunder Z-fordelingen
▪ Normalfordelingen og binomialfordelingen
▪ Eksponentialfordelingen
▪ Den centrale grænseværdisætning (Central Limit
Theorem)

Matematik og statistik Del 2 – Statistik, forår 2023 32


Eksponentialfordelingen
▪ Antag at en given hændelse indtræffer λ (lambda) gange indenfor en
tidsperiode, fx at der kommer 3 kunder ind i en butik per 10 minutter.
▪ Eksponentialfordelingen bruges til at finde sandsynligheden for, at
hændelsen er sket efter at en vis tid er gået, fx sandsynligheden for at 1
kunde er kommet ind i butikken 5 minutter efter at butikken har åbnet.
Eksponentialfordelingen betegnes: X ≈ E(λ).
▪ Vi antager i øvrigt, at der for hvert sub-tidsinterval inden for perioden er lige
så stor sandsynlighed for, at hændelsen indtræffer.
▪ Tæthedsfunktionen er givet ved:

f ( x ) =  e − x

▪ hvor e = 2,71828…
▪ Både middelværdi og standardafvigelse er lig 1/λ: µ = σ = 1/ λ.

Matematik og statistik Del 2 – Statistik, forår 2023 33


Beregning af sandsynligheder

▪ Sandsynligheder beregnes på følgende måder:

▪ Sandsynlighed for at der går mere end fx a minutter, inden hændelsen sker:
− a
P( x  a) = e
▪ Sandsynlighed for at der går mindre end fx a minutter, inden hændelsen sker:

P ( x  a ) = 1 − e − a
▪ Sandsynlighed for at der går mellem fx a og b minutter, inden hændelsen sker:
− a − b
P ( a  x  b) = e −e

Matematik og statistik Del 2 – Statistik, forår 2023 34


Beregning af sandsynligheder

▪ Sandsynlighed for at der går mellem fx 2 og 4 minutter, inden hændelsen sker:

𝑃(2 < 𝑥 < 4) = 𝑒 −𝜆2 − 𝑒 −𝜆4

Matematik og statistik Del 2 – Statistik, forår 2023 35


Eksponentialfordelingen – Eksempel 1
▪ En computer bryder ned 2 gange i timen.
▪ Dvs. at λ=2 og µ=1/2 (dvs. nedbrud 1 gang hver ½ time).
▪ Vores tidsenhed er i timer, dvs. x = 1 betyder x = 1 time.
▪ Idet x angiver tiden i timer, der går inden computeren bryder ned, fra man
har startet computeren, hvad er sandsynligheden for, at der går mere end
1 time, inden det sker?

− x
P( X  x) = e

P( X  1) = e −2(1) = 0,1353

Matematik og statistik Del 2 – Statistik, forår 2023 36


Eksponentialfordelingen – Eksempel 2
▪ I en bank kommer der gennemsnitlig 3 kunder per 10 minutters periode
op til skranken.
▪ Dvs. at λ=3 og µ=1/3 (dvs. 1 kunde hvert 3 minut og 20 sek.).
▪ Vores tidsenhed er 10 minutter, dvs. x = 1 betyder x = 10 minutter.
▪ Spørgsmål: Hvad er sandsynligheden for, at den første kunde vil komme
inden for 5 minutter? (Bemærk: x måles i forhold til tidsenheden 10
minutter, dvs. 5 minutter betyder, at x = 0,5.)

− x
P( X  x) = 1 − e
−3( 0 , 5 )
P( X  0,5) = 1 − e = 1 − 0,2231 = 0,7769

Matematik og statistik Del 2 – Statistik, forår 2023 37


Vi kan også bruge Excel!
▪ Excel: Formler / Indsæt funktion / Statistisk / EKSP.FORDELING
(og angiv den ønskede x-værdi, Lambda, samt skriv SAND for at
få den akkumulerede sandsynlighed).

Matematik og statistik Del 2 – Statistik, forår 2023 38


Kontinuerte sandsynlighedsfordelinger

Planen for i dag


▪ Kontinuerte sandsynlighedsfordelinger
▪ Normalfordelingen, herunder Z-fordelingen
▪ Normalfordelingen og binomialfordelingen
▪ Eksponentialfordelingen
▪ Den centrale grænseværdisætning (Central Limit
Theorem)

Matematik og statistik Del 2 – Statistik, forår 2023 39


Den centrale grænseværdisætning
Problem:

Vi udtager mange stikprøver fra en population. Hvad er


stikprøvernes middelværdi og standardafvigelse?

Eller formuleret anderledes:


Hvad er stikprøvefordelingens middelværdi og
standardafvigelse i forhold til populationens middelværdi
og standardafvigelse (sidstnævnte er ukendte for os)?

Matematik og statistik Del 2 – Statistik, forår 2023 40


Central limit theorem

Populationens
fordeling:
X ≈ N(µ,σ2)

µ
𝑥ҧ 𝑥ҧ 𝑥ҧ 𝑥ҧ 𝑥ҧ 𝑥ҧ Stikprøve-
𝑥ҧ 𝑥ҧ 𝑥ҧ 𝑥ҧ 𝑥ҧ fordelingen:
𝑥ҧ 𝑥ҧ 𝑥ҧ 𝑥ҧ 𝑋ത ≈ N(µ,σ2/n)

Matematik og statistik Del 2 – Statistik, forår 2023 41


Den centrale grænseværdisætning
▪ Når vi udtager gentagne stikprøver fra en population, vil middelværdierne
___ af
stikprøverne være en stokastisk variabel, som vi betegner X.

▪ Når vi udtager gentagne stikprøver fra en population der er normalfordelt


med middelværdi µ og standardafvigelse , så vil stikprøvernes middelværdi
følge en normalfordeling med middelværdi µ og standardafvigelse  / n :

2 X −
X  N ( , ) eller Z =  N (0,1)
n / n
Derfor:
▪ Stikprøvefordelingens middelværdi er den samme som populationens.
▪ Stikprøvefordelingens standardafvigelse er mindre end populationens.

Matematik og statistik Del 2 – Statistik, forår 2023 42


Den centrale grænseværdisætning
▪ Når vi udtager gentagne stikprøver fra en population, der ikke er
normalfordelt med middelværdi µ og standardafvigelse , så vil
stikprøvernes middelværdi være normalfordelte med middelværdi µ og
standardafvigelse  / n , hvis n er tilpas stor (tommelfingerregel: n > 30).
Det vil sige, når n er tilpas stor, gælder stadigvæk:

2 X −
X  N ( , ) eller Z =  N (0,1)
n / n
Derfor:
▪ Stikprøvefordelingens middelværdi er den samme som populationens.
▪ Stikprøvefordelingens standardafvigelse er mindre end populationens.

Matematik og statistik Del 2 – Statistik, forår 2023 43


Den centrale grænseværdisætning

Altså: Uanset om populationen er normalfordelt eller ej,


vil stikprøvefordelingen være normalfordelt ved stor stikprøvestørrelse (n>30).

Matematik og statistik Del 2 – Statistik, forår 2023 44


Næste gang
Øvelser der hører til denne forelæsning
▪ Opgaver 11-13.

Emne næste forelæsning


▪ Konfidensintervaller

Litteratur til næste forelæsning


▪ BO, kap. 8 (8.1 - 8.4) og kap. 9 (9.6 – 9.7)
▪ EMB, kap. 7 og 8
▪ NKS 6 (BB)

Matematik og statistik Del 2 – Statistik, forår 2023 45

You might also like