Professional Documents
Culture Documents
Mintavétel Mester Vez Szerv
Mintavétel Mester Vez Szerv
Marketing mesterszak
2
Lehetőségek
előadás gyakorlat konzultáció
egyéni munka
3
Magyarország számokban, 2021
• Népesség száma: 9,7 millió fő (2022. január 1.)
• Születéskor várható átlagos élettartam: 78,7 év (nők) 72,2 év (férfiak)
(2020)
• Ezer férfira jutó nők száma: 1086 (2022. január 1.)
• Személygépkocsik ezer lakosra jutó száma, 415 év végén (2021)
• A távmunkában dolgozók aránya a 15-64 évesek körében, 9,3 % (2021)
• Gazdasági fejlettség?
• GDP 47 988 479 (millió Ft) (2020)
• 1 főre jutó GDP 4 922 (1000Ft/fő) (2020)
• 2021-ben az 1 főre jutó GDP vásárlóerő-paritáson számított értéke
Magyarországon 76%-a volt az EU átlagának.
4
Magyarország számokban, 2021
és ami mögötte van
• Népesség száma: 9,7 millió fő (2022. január 1.)
• Születéskor várható átlagos élettartam: 78,7 év (nők) 72,2 év (férfiak)
(2020)
• Ezer férfira jutó nők száma: 1086 (2022. január 1.)
• Személygépkocsik ezer lakosra jutó száma, 415 év végén (2021)
• A távmunkában dolgozók aránya a 15-64 évesek körében, 9,3 % (2021)
• Gazdasági fejlettség?
• GDP 47 988 479 (millió Ft) (2020)
• 1 főre jutó GDP 4 922 (1000Ft/fő) (2020)
• 2021-ben az 1 főre jutó GDP vásárlóerő-paritáson számított értéke
Magyarországon 76%-a volt az EU átlagának.
5
Mire jó a statisztika?
• Modern tudomány – nem tudunk mindent
• Ezután a megfigyelés és a matematika középpontba helyezése
• Adatgyűjtés, következtetések.
• 1744 Skócia, két presbiteriánus lelkész életbiztosítási alapot hozott
létre. A befizetendő összeg megahtározásához számítások kellettek.
• Egy esemény bekövetkezését nehéz előre megmondani, de sok
hasonló esemény átlagos kimenetét lehetséges.
Valószínűségszámítás kezdete.
Yuval Noah Harari: Sapiens – Az emberiség rövid története
„A tudás hatalom” (237-241. oldal)
6
Mire jó a statisztika?
A boldogság közgazdaságtana
A bruttó nemzeti boldogság mérése? Bhután
Nádorúján „Raj” Chetty - Harvard University, indiai születésű amerikai
közgazdász, professzor a Harvard Egyetemen. Chetty néhány
közelmúltbeli tanulmánya az esélyegyenlőség kérdését az Egyesült
Államokban, valamint a tanárok tanulói teljesítményre
gyakorolt hosszú távú hatását tanulmányozta.
60. Közgazdász-vándorgyűlés Szeged, 2022. szeptember 22-23.
Fókuszban az élelmiszerellátás és az agrárium.
A statisztikus feladata a mérés, mérhetőség, de hogyan?
7
STATISZTIKA ÉS VALÓSZÍNŰSÉGSZÁMÍTÁS
A modern tudomány jellemzői:
➢ Hajlandóság a tudatlanság beismerésére
➢ A megfigyelés és a matematika középpontba helyezése
➢ Új erő megszerzése, modern tudomány új technológiák fejlesztésére
Tudománytörténet:
1. Newton a természet könyve, matematika
2. A valóság leképezéséhez, statisztika
3. A statisztika és a valószínűségszámítás terén elért áttörések
(Bernoulli, Webster, Wallace, Malthus, Galton, Wald, Gauss,
Gallup,…)
8
Kétféle probléma (tfh. a minőség megfelelő)
Túl kevés az adat (régebben) Túl sok az adat (ma)
9
STATISZTIKAI MÓDSZERTAN CSOPORTOSÍTÁSA
1. Bonyolultság szerint:
Leíró Következtető
2. A vizsgálat tárgya szerint:
ágazati statisztikák, szociális ellátás és egészségügyi statisztika,
fenntarthatósági statisztika stb.
10
MINTAVÉTEL ÉS BECSLÉS
11
BEVEZETÉS A MINTAVÉTEL ELMÉLETÉBE ÉS
ALKALMAZÁSÁBA
„A kíváncsiság minden tudomány kezdete.”
Témakörök: Pierre La Mure
• A mintavételről
• Mintavételi módok
• A mintavétel alapjai
• A mintajellemzők tulajdonságai
• Értelmezés és kritika
• Alkalmazások
• Összegzés
12
12
TÉMÁINK
• Adatszerzési módok
• Részleges adatfelvétel
• Mintavétel alapjai
• Statisztikai következtetések
• Becslés
• Becslési módok
• Összegzés
Adatfelvétel
14
Mérés és mérhetőség
Mérés elméleti megközelítésben
• A mérés fogalma, feladata
• A mérőeszköz megválasztása
• A mérés bizonytalansága
• Az adatok feldolgozása
• Mérhető és nem mérhető dolgok
• Mérési szabályok
15
A MINTAVÉTELRŐL I.
LÁSSUNK ÁT A SZÁMOK ERDEJÉN!
Vajon mennyit érnek a számok?
• Gazdasági növekedés, kereskedelmi forgalom, infláció,
munkanélküliség …
• Hogyan gyűjtik össze a mutatók képzéséhez szükséges adatokat?
• Néhány adatot figyelnek csak meg.
• Igény: jól reprezentáljon.
• Kérdés. Hogyan válasszuk ki azokat?
• Ha elrontjuk a mintát akkor a tükör torzítani fog.
16
16
MIT JUT ESZÜNKBE A MINTAVÉTELRŐL?
17
MIT JUT ESZÜNKBE A MINTAVÉTELRŐL?
Gyakorlat:
• Közvélemény-kutatások
• Munkerő-piaci felmérések
• Fogyasztói kosár
Elmélet:
• Visszatevéses,
• Visszatevés nélküli mintavétel
18
A munkaügyi statisztika területei
Fontosabb vizsgálati témakörök:
• Foglalkoztatottság, munkanélküliség, mint a munkaerőpiac
állapotjellemzői
• Kereset és annak elemei, munkajövedelem
• Munkaerőköltség
• Munkaidő, munkaidő-kiesés, műszakrend
• Sztrájk
• Egyéb munkakörülményi jellemzők
• Üres álláshelyek 19
Az EU legfontosabb munkaerő-piaci mutatói I.
Foglakoztatási ráta (Lisszaboni stratégia, EU 2020). Jelentős eltérések.
Foglalkoztatási ráta országonként, 20–64 éves korosztály, 2020 (%)
https://ec.europa.eu/eurostat/web/products-eurostat-news/-/ddn-20210421-1
20
Az EU legfontosabb munkaerő-piaci mutatói II.
Munkanélküliségi ráta országonkénti bontásban, 2019-ben és 2020-ban (%-ban) (Eurostat, 2021)
20
18
16
14
12
10
2019 2020
21
Magyarországi gyakorlat I.
Hazánkban a munkaügyi adatforrások három komponensből tevődnek
össze:
• Intézményi munkaügyi felvételek,
• változás 2019-től az adattartalomban
• adatszolgáltatás a hivatalos statisztikáról szóló 2016. évi CLV. törvény alapján.
• Lakossági adatgyűjtések és
• Adminisztratív adatforrások.
22
Magyarországi helyzetkép I.
4 millió 616 ezer fő volt a foglalkoztatottak száma
• 2021 márciusában a 15–74 éves foglalkoztatottak átlagos havi
létszáma 4 millió 616 ezer fő volt,
• ami az előző év azonos időszakát 41 ezer, míg az előző hónapot 66
ezer fővel haladta meg.
• A 2021. január–márciusi időszakban a foglalkoztatottak átlagos
létszáma 4 millió 568 ezer fő volt,
• ami 39 ezer fővel elmaradt az előző év azonos időszakitól.
• Elsősorban a magyarországi háztartások külföldön dolgozó tagjai
körében csökkent a foglalkoztatottság.
Forrás: KSH Gyorsjelentés, 2021. március
https://www.ksh.hu/docs/hun/xftp/gyor/fog/fog2103.html
23
Magyarországi helyzetkép II.
4,0% volt a munkanélküliségi ráta
• 2021 márciusában a munkanélküliek száma 194 ezer fő volt,
• 25 ezerrel több az előző év azonos időszakinál, viszont 19 ezer fővel
kevesebb a februárinál.
• A munkanélküliségi ráta 0,5 százalékponttal, 4,0%-ra emelkedett.
• A 2021. január–márciusi időszakban a munkanélküliek átlagos
létszáma 215 ezer fő volt,
• 42 ezerrel több, mint egy évvel korábban.
• A munkanélküliségi ráta 4,5%-os értéke 0,9 százalékponttal
meghaladta az előző évit.
Forrás: KSH Gyorsjelentés, 2021. március
https://www.ksh.hu/docs/hun/xftp/gyor/fog/fog2103.html 24
NÉZZÜK MEG A GYAKORLATBAN!
https://www.youtube.com/watch?v=Zja7IP56pRM
25
A MINTAVÉTELRŐL II.
Közvélemény-kutatások
Elnökválasztás ─ USA,1936,
• Franklin Roosevelt (gazdaságélénkítés)
• Alfred Landon (takarékosság)
Előrejelzések:
• Literary Digest:
Mintavétel,tízmillió címzett, két millió beérkezett válasz, nagy minta ─ téves előrejelzés
• George Gallup:
Viszonylag kisebb minta, de összetétele:
• Nem, iskolai végzettség, jövedelem hasonló volt a választópolgárok
összességéhez. 1948-ig sikeres előrejelzések
• Szavazási szándékban is hasonlítson a teljes népességre a minta!
VÉLETLENSZERŰ KIVÁLASZTÁS
26
26
A MINTAVÉTELRŐL III.
A MINTAVÉTEL ADATSZERZÉSEN TÚLI FUNKCIÓJA
Statisztikai következtetéselmélet:
• célja
• területei:
• mintavétel
• becslés
• hipotézisvizsgálat
27
27
MINTAVÉTELI MÓDOK I.
Véletlen (valószínűségi) mintavételi eljárások:
• Független azonos eloszlású minta (FAE)
• Egyszerű véletlen minta (EV)
• Rétegezett mintavétel
• Többlépcsős (csoportos) mintavétel
Nemvéletlen (nem valószínűségi) mintavételi eljárások
• Önkényes mintavétel
• Koncentrált
• Kvóta szerinti
• Hólabda kiválasztás
Egyéb közelítő eljárások 28
28
MINTAVÉTELI MÓDOK II.
Egyéb véletlenen alapuló mintavételi eljárások.
Részminták módszere
A becslés standard hibája: su = 1 ( 6600 − 6680 )2 + ... + ( 6500 − 6680 )2 = 142,83 ezer forint
5 ( 5 − 1)
29
A MINTAVÉTEL ALAPJAI I.
Fontosabb fogalmak:
• alapsokaság, mintasokaság
• minta elemszáma
• mintavételi keret
n
• kiválasztási arány
N
• kiválasztás módja:
• visszatevéssel
• visszatevés nélkül
30
30
A MINTAVÉTEL ALAPJAI II.
A mintavétel lépései:
• a minta és a mintavétel megtervezése
• (adatok minősége, kérdőívek szerepe)
• a kijelölt mintaelemek megfigyelése
A statisztikai hiba
• mintavételi
• nem mintavételi
A mintanagyság szerepe
• kis és
• nagy minta 31
31
A MINTAVÉTEL ALAPJAI III.
A mintanagyság és a mintavételi hiba
kapcsolata
Mintavételi hiba
Mintanagyság
32
32
A MINTAJELLEMZŐK TULAJDONSÁGAI I.
33
A MINTAJELLEMZŐK TULAJDONSÁGAI II.
Nézzük az előadáslapot!
20 + 24 + 32 + 36 + 42
X = = 30,8 perc
5
34
34
AZ ÁTLAGBECSLÉS TORZÍTATLANSÁGA I.
Valamely autószalonban az egyik délelőtt 5 érdeklődővel foglalkozott az egyik
eladó. Az egyes emberekre fordított idő percekben a következő:
20 24 32 36 42
20 + 24 + ... + 42
X = = 30,8 A sokasági átlag 30,8 perc.
5
35
AZ ÁTLAGBECSLÉS TORZÍTATLANSÁGA II.
36
AZ ÁTLAGBECSLÉS TORZÍTATLANSÁGA III.
Vegyük az összes lehetséges kételemű mintát, s határozzuk meg a mintaátlagokat!
Minta sorszáma Minta elemei Mintaátlag
1 20 20 20
2 20 24 22
3 20 32 26
4 20 36 28
5 20 42 31
6 24 20 22
7 24 24 24
8 24 32 28
9 24 36 30
10 24 42 33
11 32 20 26
12 32 24 28
13 32 32 32
14 32 36 34
15 32 42 37
16 36 20 28
17 36 24 30
18 36 32 34
19 36 36 36
20 36 42 39
21 42 20 31
22 42 24 33
23 42 32 37
2 42 36 39
25 42 42 42 37
A MINTAJELLEMZŐK TULAJDONSÁGAI III.
Határozzuk meg a mintaátlagok átlagát!
20 + 22 + ... + 39 + 42
X = = 30,8
25
A mintaátlag szórása:
x =
(20 − 30,8) 2
+ ... + (42 − 30,8)
2
= 5,628
25 38
38
A MINTAJELLEMZŐK TULAJDONSÁGAI IV.
A standard hiba kiszámítása az alapsokasági szórásból
kiindulva:
Alapsokasági szórás:
=
(20 − 30,8) 2
+ ... + (42 − 30,8)
2
= 7,96
5
Standard hiba:
7,96
x = = = 5,628
n 2 39
39
VÁLASZOLJUNK A KÖVETKEZŐ KÉRDÉSEKRE!
Egy kérdése a statisztikushoz: „Nem értem miért állítják azt, hogy a mintaátlag ( x ) nagy minta esetén
normális eloszlású. Vettem egy nagy mintát, kiszámítottam az átlagát, 𝑥ҧ és kaptam rá egy értéket. Hogy
lehet egy érték normális eloszlású?
Igaz-e az, hogy ha egy felvétel során a lakosság minden eleme egyforma valószínűséggel kerülhet a
mintába, akkor egyszerű véletlen mintavételről beszélünk?
40
40
ÉRTELMEZÉS ÉS KRITIKA I.
Egy légitársaság sok éves tapasztalata: az utasok 15%-a nem
jelentkezik utazásra a megadott időpontban. Ezért a
férőhelyeknél 10%-kal többet értékesít. Így pl. ha egy járaton
400 hely van, rendszeresen 440-et.
41
ÉRTELMEZÉS ÉS KRITIKA II.
Normális eloszlás alapján
BÍRÁLAT:
43
43
ÉRTELMEZÉS ÉS KRITIKA IV.
Nemválaszolások – adathiányos helyzet
44
44
ÉRTELMEZÉS ÉS KRITIKA V.
Közvélemény kutatások
• megbízhatóság
• érvényesség
• reprezentatívitás
• mintanagyság
• mintavétel
• adatgyűjtés
• válaszmegtagadás, véleményhiány
• súlyozás
• interpretáció
45
45
ALKALMAZÁSOK I.
A mintavétel szerepe:
• a könyvvizsgálatban
• a kvalitatív kutatásmódszertanban (mintavételi eljárások
kombinációit használják)
• a hivatalos statisztikában
• gazdasági felvételek – Gazdasági Szervezetek
Regisztere
• lakossági felvételek – Lakossági Címregiszter
(ld.: irodalomjegyzék)
46
46
A könyvvizsgálatban jelenleg alkalmazott
mintavételi módok I.
Könyvvizsgálati mintavételezés lényege:
a könyvvizsgálat szempontjából releváns sokaságon belül a tételek
kevesebb, mint 100%-ának megfigyelése oly módon, hogy valamennyi
mintavételezési egységnek esélye legyen a kiválasztásra, így a
könyvvizsgáló következtethet a teljes sokaságra.
Véletlenszerű kiválasztás
48
A könyvvizsgálatban jelenleg alkalmazott
mintavételi módok III.
A nem statisztikai mintavétel felderítő, elemző célú mintavétel.
Alkalmazása a könyvvizsgálatban:
Az elemző célú (nem statisztikai) mintavételeket a
kockázatelemzésnél használják.
Segítségével azon részterületeket jelöli ki a könyvvizsgáló, amelyek
nagyobb eséllyel tartalmaznak hibát.
49
Hogyan haladjon a könyvvizsgáló a
mintavétellel I.
Egy újabb dilemma:
50
Hogyan haladjon a könyvvizsgáló a
mintavétellel II.
Lépések:
1. A könyvvizsgáló kiszűri a kiugróan magas értékű tételeket és azokat
egyedileg megvizsgálja. Amennyiben ezeknek a tételeknek az
összértéke lefedi a vizsgálni kívánt sokaság értékének kétharmadát,
már kellő bizonyossággal fogalmazhatunk meg állításokat a
sokaságról.
2. Az adatállomány tanulmányozása, leíró statisztikai módszerekkel.
3. Majd a tételek átlagos értékét is meghatározhatjuk. De az átlagot
„kezelni” kell tudni.
51
Hogyan haladjon a könyvvizsgáló a
mintavétellel III.
4. Az átlag mögé is kell nézzünk és megvizsgáljuk az egyes tételeknek az
átlagtól való átlagos eltérését. Ezt a szórás mutatja meg számunkra.
53
Hogyan haladjon a könyvvizsgáló a
mintavétellel IV.
7. Hasznos lehet az adatok vizuális megjelenítése is.
54
Hogyan haladjon a könyvvizsgáló a
mintavétellel IV.
8. Ha viszonylag jelentős ferdeség rajzolódik ki a könyvvizsgáló előtt,
akkor érdemes megnézni, hogy az átlag és a módusz mennyivel tér el
egymástól, és amennyiben ez az eltérés abszolút értékben meghaladja
a szórás 50%-át, akkor érdemes és szükséges a maradék halmazból
mintát venni és további bizonyítékokat szerezni a megbízható és valós
kép kialakításához az adott adatállományról.
9. A leíró statisztika további jellemzőket is közöl a felhasználóval;
megmutatja a medián és a kvartilis értékeit is.
55
Hogyan haladjon a könyvvizsgáló a
mintavétellel IV.
Célszerű elhelyezkedésüket grafikusan is megvizsgálni, amelyeket szintén
automatikusan kirajzol előttünk pl. az Excel is.
56
Hogyan haladjon a könyvvizsgáló a
mintavétellel IV.
Mire jó mindez?
Elérhetjük, hogy hogy a könyvvizsgáló jobban megismerje a vizsgálat
sokaságot, és ha további vizsgálat, illetve mintavétel indokolt, akkor
megalapozottá tegye pl. a vizsgálati lényegesség beállítását a programban.
A vizsgálati lényegeség lehet:
• a számtani átlag és a tipikus érték (módusz) különbsége abszolút
értékben a szórás értékének kétszerese,
• vagy a felső kvartilis és a medián, illetve a medián és az alsó kvartilis
közötti távolság (abszolút értékben) közül a nagyobb különbség
háromszorosa.
57
A pénzegység alapú mintavételről I.
Ha eddig vizsgálataink azt mutatják, hogy szükséges mintát venni
elérkezünk az újabb dilemmához;
Hogyan tegyük ezt meg?
Egyszerű véletlen mintavétel?
Rétegezett mintavétel? (arányos, nem arányos, optimális, stb.)
Pénzegységalapú mintavétel? (Nemzetközi gyakorlatban ajánlott.)
Elméleti alapja: az elemszámmal arányos valószínűségek, olyan
visszatevés nélküli minta kiválasztásával, ahol minden sokasági elem
mintába kerülési valószínűsége egyenesen arányos annak könyv szerinti
értékével.
58
A pénzegység alapú mintavételről II.
Esettanulmány a későbbiekre!
Néhány gyakorlati példa a pénzegységalapú mintavétel alkalmazására:
A megoldás során a szakirodalom által javasolt, alábbi táblázatot fogjuk használni, valamint 5%-os
mintavételezési kockázattal és 800.000 Ft-os mintavételi intervallummal számolunk.
60
A pénzegység alapú mintavételről IV.
3. Felülértékelések
61
A pénzegység alapú mintavételről V.
3. Felülértékelések
62
A pénzegység alapú mintavételről VI.
3. Felülértékelések
63
A pénzegység alapú mintavételről VII.
3. Felülértékelések
c) Részben hibás tételek, amelyek kisebbek, mint a mintavételi intervallum
5 részben hibás tételt találtunk:
Sorszám Könyv szerinti érték Tényleges érték Hiba
1. 1.000 100 900
2. 500.000 400.000 100.000
3. 10.000 9.000 1.000
4. 200.000 20.000 180.000
5. 250.000 120.000 130.000
Összesen 961.000 549.100 411.900
65
A pénzegység alapú mintavételről IX.
Összegezve a felülértékelések példáit:
Eset Tényleges Kivetített Statisztikai Hiba felső
hiba hiba mintavétel hibája határa
a.) 3.000.000 3.000.000 2.400.000 5.400.000
b.) 790.200 3.200.000 4.128.000 7.328.000
c.) 600.000 600.000 2.400.000 3.000.000
d.) 549.100 2.096.000 1.220.160 3.316.160
Összesen 4.939.300 8.896.000 7.748.160* 16.644.160
66
A pénzegység alapú mintavételről X.
Előnyei:
• a mintát nem szükséges rétegezni és ez egyszerűsíti a mintavételt;
• a minta elemszámának meghatározásához nem szükséges a sokaság, azaz az
összetétel statisztikai tulajdonságainak (átlag, szórás, eloszlás) ismerete;
• ha a várható hiba alacsony, akkor hatékony mintaméretet ad.
Hátrányai:
• a hiba nagysága egyetlen tételnél sem haladhatja meg a könyv szerinti értéket;
• elsősorban felülértékelések felfedésére használható, az alulértékelések
vizsgálatára korlátozottan alkalmas;
• amennyiben sok a várható hiba, nagyon magas mintaelemszámot eredményez.
67
Következtetések, javaslatok I.
• A mintavétel alkalmazása a könyvvizsgálatban elkerülhetetlen, de bármelyik
mintavételi módot választjuk is az értelmezésnél mindig ügyelni kell a
reprezentatív minta fogalmának használatára.
• A reprezentatívitás mint cél arra utal, hogy a sokaság bizonyos egységei (a minta)
azzal a céllal kerülnek kiválasztásra, hogy a sokaság egységeit (sokaság egészét)
megfelelő módon képviseljék. Így a minta elemzéséből a sokaság jellemzőire
következtethetünk.
• Ne használjuk a reprezentatív minta kifejezést a mintavételből származó adatok
jellemzésére, anélkül, hogy pontosan leírnánk, miként biztosítottuk, hogyan
ellenőriztük azt.
68
ALKALMAZÁSOK II.
69
69
STATISZTIKAI KÖVETKEZTETÉSEK TIPUSAI
BECSLÉS:
Ismeretlen paraméter közelítő értékének meghatározása a
mintából
HIPOTÉZISVIZSGÁLAT:
Az alapsokaságról adott állítás ellenőrzése a minta
alapján, hogy ez az állítás elfogadható-e
70
70
STATISZTIKAI BECSLÉS
– lényege
– célja
– eszköze
– menete:
• becslőfüggvény értéke
• átlagos hiba
• maximális hiba
• konfidencia-intervallum
71
71
A BECSLŐFÜGGVÉNYEKKEL SZEMBEN
TÁMASZTOTT KÖVETELMÉNYEK I.
1. Torzítatlanság:
M
=
2. Konzisztencia:
lim P − = 1
n →
72
72
A BECSLŐFÜGGVÉNYEKKEL SZEMBEN
TÁMASZTOTT KÖVETELMÉNYEK II.
3. Hatásosság:
D
1
D
2
4. Elégségesség
73
73
MINTAVÉTEL ÉS BECSLÉS I.
A mintaátlag, mint valószínűségi változó
FAE minta esetén
• Várható értéke:
M (1 + 2 + ... + n ) = M (1 ) + M ( 2 ) + ...
+ M ( n ) = n
+ 2 + ... + n
M 1 = M
=
• Szórásnégyzete: n
2 1 + 2 + ... + n 2
D = D =
2
n n
74
MINTAVÉTEL ÉS BECSLÉS II.
D = =
n
MINTAÁTLAG STANDARD HIBÁJA
75
MINTAVÉTEL ÉS BECSLÉS III.
Mintaátlag szórása: (EV minta esetén)
n
D = = n 1−
N
A korrekciós tényező használatától 5%-os kiválasztási arány alatt
eltekinthetünk.
76
MINTAVÉTEL ÉS BECSLÉS IV.
Intervallum becslés lépései:
Egy piaci bevezetésre váró 500 g-os arckrémet automata-gép tölti. A töltési
mennyiség beállítására 10 elemű FAE mintából akarunk becslést adni.
Mérési eredményeink a következők:
495, 501, 503, 480, 485, 499, 510, 502, 492, 503
Feltételezhetjük a töltési mennyiség normális eloszlását.
Készítsünk 95%-os megbízhatósággal intervallumbecslést a várható töltési
mennyiségre!
77
BECSLÉS I.
1. lépés: a mintaátlag meghatározása
x 495 + ... + 503
x = = = 497 g
n 10
2. lépés: a standard hiba, amihez először kiszámítjuk a
mintabeli szórást
1−
79
NORMÁLIS ELOSZLÁS
1 −
( x −m )2
Sűrűségfüggvénye: f ( x) = e 2 2
2
80
STANDARD NORMÁLIS ELOSZLÁS I.
A (0,1) paraméterű normális eloszlású váltózót standard normális eloszlásúnak nevezzük.
Paraméterei
E(X) = 0
D( X ) = 1
Sűrűségfüggvény
− z2
(z ) =
1
e 2
zR
2 -z 0 z
Eloszlásfüggvény
z
(z) = (u )du zR
−
(−z) = 1 − (z)
=NORM.S.ELOSZLÁS(z;IGAZ)
81
INTERVALLUMBECSLÉS LÉPÉSEI I.
Pontbecslés: paraméter meghatározása a mintából x
Standard hiba (átlagos hiba) x =
n
Tudjuk, hogy normális eloszlású sokaság esetén a mintaátlag is normális eloszlású, x N ,
n
x −
z=
z N ( 0,1)
n
Mekkora lesz az a szimmetrikus intervallum, amelybe változónk 1-α valószínűséggel esik?
x −
P − z z = ( z ) − ( − z ) = 2 ( z ) − 1 = 1 − Az ismeretlen nem az α, hanem a „z”
n
82
INTERVALLUMBECSLÉS LÉPÉSEI II.
1 = 0, 27%
2 = 4,55%
3 = 31, 73%
Konfidencia-intervallum: Hibahatár:
P x − z x + z = 1− x = z
1− 1− 1−
2 n 2 n 2 n
83
BECSLÉS II.
3. lépés: táblázatból keresés:
95 % = 0,05 szf = n − 1
p =1− = 0,975 9
t0 ,975 = 2, 26
2
4. lépés: a hibahatár meghatározása:
s
x = t szf
p = 2,26 2,88 = 6,51g
n
5. lépés: a konfidencia-intervallum kijelölése:
x x
497 6,51 (490,49 - 503,51)g 84
BECSLÉS III.
Megoldás
N x x =
= 1000 497 6,51 =
490490 g - 503510g =
= 490,5kg - 503,5kg
Értelmezés 85
85
STANDARD NORMÁLIS ELOSZLÁS II.
Hosszú évek tapasztalata alapján Magyarországon a
lánycsecsemők élve születési súlya normális eloszlást követ 3,2
kg átlaggal és 0,6 kg szórással.
1. Mi a valószínűsége annak, hogy egy véletlenszerűen
kiválasztott lánycsecsemő súlya 3,8 kg alatt van?
3,8 − 3,2
P( X < 3,8) = = (1) = 0,8413
0,6
2. Mi a valószínűsége annak, hogy egy véletlenszerűen
kiválasztott lánycsecsemő súlya 2,6 - 3,8 kg között van?
86
NORMÁLIS ELOSZLÁS - EXCEL
87
STANDARD NORMÁLIS ELOSZLÁS EXCEL I.
88
STANDARD NORMÁLIS ELOSZLÁS EXCEL II.
89
INTERVALLUMBECSLÉS LÉPÉSEI
1. lépés: Pontbecslés
5. lépés: Konfidencia-intervallum
90
A SOKASÁG VÁRHATÓ ÉRTÉKÉNEK
BECSLÉSE
Lehetséges esetek:
91
A rendelésállomány átvételénél
500 elemű mintát vizsgálunk: kiválasztási arány 10%
Üdítőital mennyisége Palackok száma
(ml) (db)
- 960 50
961 – 980 75
981 - 1000 300
1001 - 1020 50
1021 - 1040 25
Összesen 500 92
92
Készítsünk intervallumbecslést a palackok átlagos
töltősúlyára 95%-os megbízhatósági szinten!
Megoldás:
50 950 + ... + 25 1030
x = = 987 g
500
50(950 − 987 )2 + ... + 25(1030 − 987 )2
s = = 18,2 g
499
18,2
sx =
1 − 0,1 = 0,77 g
500
,975 = z 0,975 = 1,96
499
t0
= 1,96 0,77 = 1,51g
985,49 - 988,51gramm
93
93
ARÁNYBECSLÉS
Képzésének alapgondolata:
Az alternatív ismérvátlaga és szórása
A becslést az átlag-becslésre vezetjük vissza.
Menete:
1. lépés: a mintabeli arány meghatározása
kn
2. lépés: a standard hiba
p =
n
p (1 − p )
sp =
n
94
94
3. lépés: táblázatból keresés
p = 1− zp = ?
2
4. lépés: maximális hiba meghatározása
p = zp sp
5. lépés: konfidencia-intervallum
p p
95
Készítsünk intervallumbecslést az 1000 ml töltési
mennyiség feletti üvegek arányára 90%-os
megbízhatósági szinten!
Megoldás:
75
p = = 0,15
500
0,15 (1 − 0,15 )
sp = 1 − 0,1 = 0,015
500
z 0,95 = 1,65 (1 − = 0,9 )
= 1,65 0,015 = 0,025
12,5% - 17,5%
96
96
A SZÓRÁS BECSLÉSE
A sokasági szórásnégyzet becslésére a torzítatlan becslést eredményező korrigált
tapasztalati szórásnégyzetet használjuk.
A becslés során a 2
eloszlást, n − 1 szabadságfokkal használjuk.
(n − 1) s (n − 1) s
2 2
( ; )
( szf ) ( szf )
2 2
1−
2 2 97
Egy könyvtárban egy adott héten a beiratkozott olvasók 5%-a fordult meg
és kölcsönzött könyvet.
Elemzés céljából feljegyezték az olvasók által kölcsönzött könyvek számát.
1 − = 0,95 1− = 0,975 = 0,025
2 2
Alkalmazás:
• Növekedési ütem
• Indexek meghatározása
Eljárás:
Két sokasági jellemzőből (várható értékből, értékösszegből,..) viszonyszámot képezünk és ezt a
viszonyszámot kívánjuk megbecsülni mintákból.
Jellemző:
Torzított becslés, de a minta elemszámának növelésével a torzítás csökken és tart nullához, azaz
aszimptotikus torzítatlanságról van szó.
101
HÁNYADOS BECSLÉS II.
Részminták segítségével. Legyen két paraméter U és W, ezek torzítatlan becslései az i-edik részmintából
rendre ui , wi kombinált becslései pedig: u ; w
u
A hányados H=
U a hányados becslése: h =
W w
C (u , w) a becslések standard
A két mintaátlag korrelációs együtthatójának becslése: r (u , w) = ahol: su ; sw
su sw hibái
102
102
ÖSSZEGZÉS I.
• A társadalmi-gazdasági statisztikában a mintavétel az adatokhoz jutás egyik
legfontosabb eszköze
• A mintavétel a következtető statisztika része
• Az elméleti igényeknek a véletlen (valószínűségi) minta felel meg.
• A mintából számított bármilyen mutató változó, azaz értéke mintáról mintára
ingadozik, ezért a mintavétel során az ebből adódó hibával (mintavételi hiba)
mindenképpen számolni kell.
• Ügyelni kell az összehasonlíthatóságra, a megfelelő mintavételi módszerre
• Nemválaszolás problémaköre, utólagos pontosítás
103
103
ÖSSZEGZÉS II.
• Statisztikai becslés szerepe, lényege
• Pontbecslés, intervallumbecslés
• Pontosság - megbízhatóság
• Paraméterek: átlag, értékösszeg, arány
• Szórásbecslés
• Hányados-becslés
104
104
Összegzés III.
„A statisztika egy eszköz, amivel válaszokat lehet keresni, de válaszokat
nem ad. A válaszokat, az adatok interpretációját mindig nekünk kell
adnunk.” (Kun Ádám)
105
AJÁNLÁS
Seth Stephens-Davidowitz:
106
106
KÖSZÖNÖM A MEGTISZTELŐ FIGYELMET !
kriszt.eva@uni-bge.hu
107