Download as pdf or txt
Download as pdf or txt
You are on page 1of 107

Matematikai statisztika

Marketing mesterszak

Sándorné Prof. Dr. Kriszt Éva


intézetvezető, egyetemi tanár
1
Miről lesz szó?
• Bemutatkozás
• Útmutatóról röviden
• Kommunikációs csatornák és azok használata
• Tananyag

2
Lehetőségek
előadás gyakorlat konzultáció

egyéni munka

3
Magyarország számokban, 2021
• Népesség száma: 9,7 millió fő (2022. január 1.)
• Születéskor várható átlagos élettartam: 78,7 év (nők) 72,2 év (férfiak)
(2020)
• Ezer férfira jutó nők száma: 1086 (2022. január 1.)
• Személygépkocsik ezer lakosra jutó száma, 415 év végén (2021)
• A távmunkában dolgozók aránya a 15-64 évesek körében, 9,3 % (2021)
• Gazdasági fejlettség?
• GDP 47 988 479 (millió Ft) (2020)
• 1 főre jutó GDP 4 922 (1000Ft/fő) (2020)
• 2021-ben az 1 főre jutó GDP vásárlóerő-paritáson számított értéke
Magyarországon 76%-a volt az EU átlagának.
4
Magyarország számokban, 2021
és ami mögötte van
• Népesség száma: 9,7 millió fő (2022. január 1.)
• Születéskor várható átlagos élettartam: 78,7 év (nők) 72,2 év (férfiak)
(2020)
• Ezer férfira jutó nők száma: 1086 (2022. január 1.)
• Személygépkocsik ezer lakosra jutó száma, 415 év végén (2021)
• A távmunkában dolgozók aránya a 15-64 évesek körében, 9,3 % (2021)
• Gazdasági fejlettség?
• GDP 47 988 479 (millió Ft) (2020)
• 1 főre jutó GDP 4 922 (1000Ft/fő) (2020)
• 2021-ben az 1 főre jutó GDP vásárlóerő-paritáson számított értéke
Magyarországon 76%-a volt az EU átlagának.
5
Mire jó a statisztika?
• Modern tudomány – nem tudunk mindent
• Ezután a megfigyelés és a matematika középpontba helyezése
• Adatgyűjtés, következtetések.
• 1744 Skócia, két presbiteriánus lelkész életbiztosítási alapot hozott
létre. A befizetendő összeg megahtározásához számítások kellettek.
• Egy esemény bekövetkezését nehéz előre megmondani, de sok
hasonló esemény átlagos kimenetét lehetséges.
Valószínűségszámítás kezdete.
Yuval Noah Harari: Sapiens – Az emberiség rövid története
„A tudás hatalom” (237-241. oldal)
6
Mire jó a statisztika?
A boldogság közgazdaságtana
A bruttó nemzeti boldogság mérése? Bhután
Nádorúján „Raj” Chetty - Harvard University, indiai születésű amerikai
közgazdász, professzor a Harvard Egyetemen. Chetty néhány
közelmúltbeli tanulmánya az esélyegyenlőség kérdését az Egyesült
Államokban, valamint a tanárok tanulói teljesítményre
gyakorolt ​hosszú távú hatását tanulmányozta.
60. Közgazdász-vándorgyűlés Szeged, 2022. szeptember 22-23.
Fókuszban az élelmiszerellátás és az agrárium.
A statisztikus feladata a mérés, mérhetőség, de hogyan?
7
STATISZTIKA ÉS VALÓSZÍNŰSÉGSZÁMÍTÁS
A modern tudomány jellemzői:
➢ Hajlandóság a tudatlanság beismerésére
➢ A megfigyelés és a matematika középpontba helyezése
➢ Új erő megszerzése, modern tudomány új technológiák fejlesztésére
Tudománytörténet:
1. Newton a természet könyve, matematika
2. A valóság leképezéséhez, statisztika
3. A statisztika és a valószínűségszámítás terén elért áttörések
(Bernoulli, Webster, Wallace, Malthus, Galton, Wald, Gauss,
Gallup,…)
8
Kétféle probléma (tfh. a minőség megfelelő)
Túl kevés az adat (régebben) Túl sok az adat (ma)

9
STATISZTIKAI MÓDSZERTAN CSOPORTOSÍTÁSA
1. Bonyolultság szerint:

Leíró Következtető
2. A vizsgálat tárgya szerint:
ágazati statisztikák, szociális ellátás és egészségügyi statisztika,
fenntarthatósági statisztika stb.

3. Hierarchikus felépítés szerint:


mikro-, makro- és mezo-statisztika

10
MINTAVÉTEL ÉS BECSLÉS

SÁNDORNÉ KRISZT ÉVA


2022. február

11
BEVEZETÉS A MINTAVÉTEL ELMÉLETÉBE ÉS
ALKALMAZÁSÁBA
„A kíváncsiság minden tudomány kezdete.”
Témakörök: Pierre La Mure
• A mintavételről
• Mintavételi módok
• A mintavétel alapjai
• A mintajellemzők tulajdonságai
• Értelmezés és kritika
• Alkalmazások
• Összegzés
12

12
TÉMÁINK
• Adatszerzési módok
• Részleges adatfelvétel
• Mintavétel alapjai
• Statisztikai következtetések
• Becslés
• Becslési módok
• Összegzés

„A gondolkodás érdekesebb, mint a tudás, de nem érdekesebb, mint


a felismerés.” 13
Geothe
HOGYAN JUTHATONK ADATOKHOZ?
ADATSZERZÉSI MÓDOK

Adatfelvétel

Teljes körű Részleges

Reprezentatív Egyéb részleges

Véletlenen alapuló Nem véletlen


14

14
Mérés és mérhetőség
Mérés elméleti megközelítésben
• A mérés fogalma, feladata
• A mérőeszköz megválasztása
• A mérés bizonytalansága
• Az adatok feldolgozása
• Mérhető és nem mérhető dolgok
• Mérési szabályok
15
A MINTAVÉTELRŐL I.
LÁSSUNK ÁT A SZÁMOK ERDEJÉN!
Vajon mennyit érnek a számok?
• Gazdasági növekedés, kereskedelmi forgalom, infláció,
munkanélküliség …
• Hogyan gyűjtik össze a mutatók képzéséhez szükséges adatokat?
• Néhány adatot figyelnek csak meg.
• Igény: jól reprezentáljon.
• Kérdés. Hogyan válasszuk ki azokat?
• Ha elrontjuk a mintát akkor a tükör torzítani fog.

16

16
MIT JUT ESZÜNKBE A MINTAVÉTELRŐL?

17
MIT JUT ESZÜNKBE A MINTAVÉTELRŐL?
Gyakorlat:
• Közvélemény-kutatások
• Munkerő-piaci felmérések
• Fogyasztói kosár
Elmélet:
• Visszatevéses,
• Visszatevés nélküli mintavétel

18
A munkaügyi statisztika területei
Fontosabb vizsgálati témakörök:
• Foglalkoztatottság, munkanélküliség, mint a munkaerőpiac
állapotjellemzői
• Kereset és annak elemei, munkajövedelem
• Munkaerőköltség
• Munkaidő, munkaidő-kiesés, műszakrend
• Sztrájk
• Egyéb munkakörülményi jellemzők
• Üres álláshelyek 19
Az EU legfontosabb munkaerő-piaci mutatói I.
Foglakoztatási ráta (Lisszaboni stratégia, EU 2020). Jelentős eltérések.
Foglalkoztatási ráta országonként, 20–64 éves korosztály, 2020 (%)

2016-ban az EU-28-ban a 20–64 éves


korcsoport foglalkoztatási rátája az európai
uniós munkaerő-felmérés szerint 71,1 % volt,
2019-re pedig már 73,1%-ra emelkedett, amely
az Unióban valaha mért legmagasabb éves
átlag, 2020-ban a pandémia okozta válság
következtében 72,4%-ra csökkent.
Az Európa 2020 stratégiában a 20-64 éves
lakosság esetében a cél a 75 százalékos érték.

https://ec.europa.eu/eurostat/web/products-eurostat-news/-/ddn-20210421-1

20
Az EU legfontosabb munkaerő-piaci mutatói II.
Munkanélküliségi ráta országonkénti bontásban, 2019-ben és 2020-ban (%-ban) (Eurostat, 2021)
20

18

16

14

12

10

2019 2020

21
Magyarországi gyakorlat I.
Hazánkban a munkaügyi adatforrások három komponensből tevődnek
össze:
• Intézményi munkaügyi felvételek,
• változás 2019-től az adattartalomban
• adatszolgáltatás a hivatalos statisztikáról szóló 2016. évi CLV. törvény alapján.
• Lakossági adatgyűjtések és
• Adminisztratív adatforrások.

22
Magyarországi helyzetkép I.
4 millió 616 ezer fő volt a foglalkoztatottak száma
• 2021 márciusában a 15–74 éves foglalkoztatottak átlagos havi
létszáma 4 millió 616 ezer fő volt,
• ami az előző év azonos időszakát 41 ezer, míg az előző hónapot 66
ezer fővel haladta meg.
• A 2021. január–márciusi időszakban a foglalkoztatottak átlagos
létszáma 4 millió 568 ezer fő volt,
• ami 39 ezer fővel elmaradt az előző év azonos időszakitól.
• Elsősorban a magyarországi háztartások külföldön dolgozó tagjai
körében csökkent a foglalkoztatottság.
Forrás: KSH Gyorsjelentés, 2021. március
https://www.ksh.hu/docs/hun/xftp/gyor/fog/fog2103.html
23
Magyarországi helyzetkép II.
4,0% volt a munkanélküliségi ráta
• 2021 márciusában a munkanélküliek száma 194 ezer fő volt,
• 25 ezerrel több az előző év azonos időszakinál, viszont 19 ezer fővel
kevesebb a februárinál.
• A munkanélküliségi ráta 0,5 százalékponttal, 4,0%-ra emelkedett.
• A 2021. január–márciusi időszakban a munkanélküliek átlagos
létszáma 215 ezer fő volt,
• 42 ezerrel több, mint egy évvel korábban.
• A munkanélküliségi ráta 4,5%-os értéke 0,9 százalékponttal
meghaladta az előző évit.
Forrás: KSH Gyorsjelentés, 2021. március
https://www.ksh.hu/docs/hun/xftp/gyor/fog/fog2103.html 24
NÉZZÜK MEG A GYAKORLATBAN!
https://www.youtube.com/watch?v=Zja7IP56pRM

25
A MINTAVÉTELRŐL II.
Közvélemény-kutatások
Elnökválasztás ─ USA,1936,
• Franklin Roosevelt (gazdaságélénkítés)
• Alfred Landon (takarékosság)
Előrejelzések:
• Literary Digest:
Mintavétel,tízmillió címzett, két millió beérkezett válasz, nagy minta ─ téves előrejelzés
• George Gallup:
Viszonylag kisebb minta, de összetétele:
• Nem, iskolai végzettség, jövedelem hasonló volt a választópolgárok
összességéhez. 1948-ig sikeres előrejelzések
• Szavazási szándékban is hasonlítson a teljes népességre a minta!

VÉLETLENSZERŰ KIVÁLASZTÁS
26

26
A MINTAVÉTELRŐL III.
A MINTAVÉTEL ADATSZERZÉSEN TÚLI FUNKCIÓJA

Statisztikai következtetéselmélet:

• célja
• területei:
• mintavétel
• becslés
• hipotézisvizsgálat

27

27
MINTAVÉTELI MÓDOK I.
Véletlen (valószínűségi) mintavételi eljárások:
• Független azonos eloszlású minta (FAE)
• Egyszerű véletlen minta (EV)
• Rétegezett mintavétel
• Többlépcsős (csoportos) mintavétel
Nemvéletlen (nem valószínűségi) mintavételi eljárások
• Önkényes mintavétel
• Koncentrált
• Kvóta szerinti
• Hólabda kiválasztás
Egyéb közelítő eljárások 28

28
MINTAVÉTELI MÓDOK II.
Egyéb véletlenen alapuló mintavételi eljárások.
Részminták módszere

Alapgondolata: a mintaátlagok (vagy más becsült értékek) eloszlását tapasztalati úton


közelítjük meg, és az eredmények pontosságának mértékét ebből a tapasztalati
eloszlásból vezetjük le.
Példa: 5 egymástól függetlenül kiválasztott napon 40 elemű minta alapján becsültük egy
bolthálózat átlagos napi forgalmát. A mintaátlagok az öt napon (ezer Ft-.ban): 6600;
6300; 6900; 7100; 6500. 6600 + 6300 + 6900 + 7100 + 6500 33400
Az átlagos forgalom becslése: u = = = 6680 ezer forint
5 5

A becslés standard hibája: su = 1 ( 6600 − 6680 )2 + ... + ( 6500 − 6680 )2  = 142,83 ezer forint
5 ( 5 − 1)  

95%-os megbízhatósági szinten t=2,776 (szf. 4)


Hibahatár:  = 2, 776 142,83 = 396,5

Konfidencia-intervallum: 6680  396,5 ezer forint


29

29
A MINTAVÉTEL ALAPJAI I.
Fontosabb fogalmak:
• alapsokaság, mintasokaság
• minta elemszáma
• mintavételi keret
 n 
• kiválasztási arány  
N
• kiválasztás módja:
• visszatevéssel
• visszatevés nélkül
30

30
A MINTAVÉTEL ALAPJAI II.
A mintavétel lépései:
• a minta és a mintavétel megtervezése
• (adatok minősége, kérdőívek szerepe)
• a kijelölt mintaelemek megfigyelése
A statisztikai hiba
• mintavételi
• nem mintavételi
A mintanagyság szerepe
• kis és
• nagy minta 31

31
A MINTAVÉTEL ALAPJAI III.
A mintanagyság és a mintavételi hiba
kapcsolata

Mintavételi hiba

Mintanagyság
32

32
A MINTAJELLEMZŐK TULAJDONSÁGAI I.

A mintajellemzők mintáról mintára ingadoznak, változók


A mintaátlag, mint valószínűségi változó jellemzői:
• átlaga
• szórása
• eloszlása

33
A MINTAJELLEMZŐK TULAJDONSÁGAI II.
Nézzük az előadáslapot!

Valamely autószalonban az egyik délelőtt 5 érdeklődővel


foglalkozott az eladó. Az egyes emberekre fordított idő percben
kifejezve a következő:
20 24 32 36 42

20 + 24 + 32 + 36 + 42
X = = 30,8 perc
5
34

34
AZ ÁTLAGBECSLÉS TORZÍTATLANSÁGA I.
Valamely autószalonban az egyik délelőtt 5 érdeklődővel foglalkozott az egyik
eladó. Az egyes emberekre fordított idő percekben a következő:
20 24 32 36 42
20 + 24 + ... + 42
X = = 30,8 A sokasági átlag 30,8 perc.
5

A szalon tulajdonosa nem teljes körű felméréssel, hanem mintavételes technikával


szeretné felmérni azt, hogy egy eladó átlagosan mennyi időt foglalkozik az
érdeklődőkkel. Szimulációs „játékunkban” 2 elemű mintákat vesznek.

35
AZ ÁTLAGBECSLÉS TORZÍTATLANSÁGA II.

Öt elemű (alap)sokaságból összesen 25 féleképpen tudunk 2 elemű


mintát venni.

Most kivételesen leválogattuk az összes lehetséges mintát.

A 25 minta adatai a következő dián láthatóak.

36
AZ ÁTLAGBECSLÉS TORZÍTATLANSÁGA III.
Vegyük az összes lehetséges kételemű mintát, s határozzuk meg a mintaátlagokat!
Minta sorszáma Minta elemei Mintaátlag
1 20 20 20
2 20 24 22
3 20 32 26
4 20 36 28
5 20 42 31
6 24 20 22
7 24 24 24
8 24 32 28
9 24 36 30
10 24 42 33
11 32 20 26
12 32 24 28
13 32 32 32
14 32 36 34
15 32 42 37
16 36 20 28
17 36 24 30
18 36 32 34
19 36 36 36
20 36 42 39
21 42 20 31
22 42 24 33
23 42 32 37
2 42 36 39
25 42 42 42 37
A MINTAJELLEMZŐK TULAJDONSÁGAI III.
Határozzuk meg a mintaátlagok átlagát!

20 + 22 + ... + 39 + 42
X = = 30,8
25
A mintaátlag szórása:

x =
(20 − 30,8) 2
+ ... + (42 − 30,8)
2
= 5,628
25 38

38
A MINTAJELLEMZŐK TULAJDONSÁGAI IV.
A standard hiba kiszámítása az alapsokasági szórásból
kiindulva:
Alapsokasági szórás:

 =
(20 − 30,8) 2
+ ... + (42 − 30,8)
2
= 7,96
5

Standard hiba:
 7,96
x = = = 5,628
n 2 39

39
VÁLASZOLJUNK A KÖVETKEZŐ KÉRDÉSEKRE!
Egy kérdése a statisztikushoz: „Nem értem miért állítják azt, hogy a mintaátlag ( x ) nagy minta esetén
normális eloszlású. Vettem egy nagy mintát, kiszámítottam az átlagát, 𝑥ҧ és kaptam rá egy értéket. Hogy
lehet egy érték normális eloszlású?

Egy kiskereskedő egy dinnyeszállítmány minőségét kívánja ellenőrízni mintavétel segítségével.


Mit jelentene ez esetben az:
• egyszerű véletlen,
• rétegezett,
• csoportos,
• kétlépcsős mintavétel?

Indokolja meg, melyiket ajánlaná a dinnyeárusnak!

Igaz-e az, hogy ha egy felvétel során a lakosság minden eleme egyforma valószínűséggel kerülhet a
mintába, akkor egyszerű véletlen mintavételről beszélünk?

40

40
ÉRTELMEZÉS ÉS KRITIKA I.
Egy légitársaság sok éves tapasztalata: az utasok 15%-a nem
jelentkezik utazásra a megadott időpontban. Ezért a
férőhelyeknél 10%-kal többet értékesít. Így pl. ha egy járaton
400 hely van, rendszeresen 440-et.

Kérdés: Ha a 440 jegyigénylő véletlen mintának tekinthető,


mekkora a valószínűsége annak, hogy 400 utasnál több
megy el az utazásra?
41

41
ÉRTELMEZÉS ÉS KRITIKA II.
Normális eloszlás alapján

x = np = 440  0,85 = 374


 = npq = 440  0,85  0,15 = 7,49
 400 − 374 
P ( x  400) = P z  =
 7,49 
P ( z  3,47) =
1 − P ( z  3,47) =
1 − 0,9997 = 0,0003 = 0,03% 42
ÉRTELMEZÉS ÉS KRITIKA III.

BÍRÁLAT:

Pl. Nem függetlenek a mintaelemek egymástól,


mert lehet, hogy a családok együtt mondják le az
utazásokat.

43

43
ÉRTELMEZÉS ÉS KRITIKA IV.
Nemválaszolások – adathiányos helyzet

Okai sokfélék lehetnek

A torzítás kiküszöbölésére szolgáló módszer pl.:


• Hansen és Hurwitz módszere

További módszerek a pontosításra


• Imputáció
• Átsúlyozások

44

44
ÉRTELMEZÉS ÉS KRITIKA V.
Közvélemény kutatások
• megbízhatóság
• érvényesség
• reprezentatívitás
• mintanagyság
• mintavétel
• adatgyűjtés
• válaszmegtagadás, véleményhiány
• súlyozás
• interpretáció
45

45
ALKALMAZÁSOK I.
A mintavétel szerepe:
• a könyvvizsgálatban
• a kvalitatív kutatásmódszertanban (mintavételi eljárások
kombinációit használják)
• a hivatalos statisztikában
• gazdasági felvételek – Gazdasági Szervezetek
Regisztere
• lakossági felvételek – Lakossági Címregiszter
(ld.: irodalomjegyzék)

Leslie Kish-ről (1910-2000),


„Leslie Kish-kulcs”

46

46
A könyvvizsgálatban jelenleg alkalmazott
mintavételi módok I.
Könyvvizsgálati mintavételezés lényege:
a könyvvizsgálat szempontjából releváns sokaságon belül a tételek
kevesebb, mint 100%-ának megfigyelése oly módon, hogy valamennyi
mintavételezési egységnek esélye legyen a kiválasztásra, így a
könyvvizsgáló következtethet a teljes sokaságra.

Véletlenszerű kiválasztás

Véletlen mintavétel esetén tehát a statisztikai hiba számszerűsíthető és az


általánosítás megbízhatósági szintje meghatározható.
47
A könyvvizsgálatban jelenleg alkalmazott
mintavételi módok II.
Többféle statisztikai mintavételi mód létezik, de fontos a reprezentativitás és
annak pontos használata.
Azaz a sokaság bizonyos egységei (a minta) azzal a céllal kerülnek
kiválasztásra, hogy a sokaság egységeit (sokaság egészét) megfelelő
módon képviseljék. Így a minta elemzéséből a sokaság jellemzőire
következtethetünk.

48
A könyvvizsgálatban jelenleg alkalmazott
mintavételi módok III.
A nem statisztikai mintavétel felderítő, elemző célú mintavétel.
Alkalmazása a könyvvizsgálatban:
Az elemző célú (nem statisztikai) mintavételeket a
kockázatelemzésnél használják.
Segítségével azon részterületeket jelöli ki a könyvvizsgáló, amelyek
nagyobb eséllyel tartalmaznak hibát.

49
Hogyan haladjon a könyvvizsgáló a
mintavétellel I.
Egy újabb dilemma:

Egyáltalán milyen esetben van szükség a mintavételre és mikor lehet


attól eltekinteni?

A könyvvizsgáló a mérlegsorok és az eredménykimutatás sorai


szerinti haladáson alapulva tervezi meg munkáját.

50
Hogyan haladjon a könyvvizsgáló a
mintavétellel II.
Lépések:
1. A könyvvizsgáló kiszűri a kiugróan magas értékű tételeket és azokat
egyedileg megvizsgálja. Amennyiben ezeknek a tételeknek az
összértéke lefedi a vizsgálni kívánt sokaság értékének kétharmadát,
már kellő bizonyossággal fogalmazhatunk meg állításokat a
sokaságról.
2. Az adatállomány tanulmányozása, leíró statisztikai módszerekkel.
3. Majd a tételek átlagos értékét is meghatározhatjuk. De az átlagot
„kezelni” kell tudni.
51
Hogyan haladjon a könyvvizsgáló a
mintavétellel III.
4. Az átlag mögé is kell nézzünk és megvizsgáljuk az egyes tételeknek az
átlagtól való átlagos eltérését. Ezt a szórás mutatja meg számunkra.

5. Nem mindegy azonban, hogy mekkora átlagtól nézzük az átlagos


eltérést, ezért kiszámítjuk a szórás és az átlag hányadosát, amit relatív
szórásnak hívunk és általában százalékos formában értelmezünk. A
szokásos határ 10%.
Mutatószám Példa I. Kft. Példa II. Kft.
Havi átlagkereset E Ft/hó 300 500
Szórás E Ft 150  160

Relatív szórás (%) 50 〉 32 52


Hogyan haladjon a könyvvizsgáló a
mintavétellel III.
6. De előfordulhat, hogy az átlag nem jellemzi igazán jól a sokaságot,
mert az értékek zöme nem az átlag körül helyezkedik el, hanem más
érték körül tömörül.
Az így meghatározott tömörülési helyet módusznak nevezzük és
tipikus értéknek is hívjuk.

53
Hogyan haladjon a könyvvizsgáló a
mintavétellel IV.
7. Hasznos lehet az adatok vizuális megjelenítése is.

54
Hogyan haladjon a könyvvizsgáló a
mintavétellel IV.
8. Ha viszonylag jelentős ferdeség rajzolódik ki a könyvvizsgáló előtt,
akkor érdemes megnézni, hogy az átlag és a módusz mennyivel tér el
egymástól, és amennyiben ez az eltérés abszolút értékben meghaladja
a szórás 50%-át, akkor érdemes és szükséges a maradék halmazból
mintát venni és további bizonyítékokat szerezni a megbízható és valós
kép kialakításához az adott adatállományról.
9. A leíró statisztika további jellemzőket is közöl a felhasználóval;
megmutatja a medián és a kvartilis értékeit is.

55
Hogyan haladjon a könyvvizsgáló a
mintavétellel IV.
Célszerű elhelyezkedésüket grafikusan is megvizsgálni, amelyeket szintén
automatikusan kirajzol előttünk pl. az Excel is.

56
Hogyan haladjon a könyvvizsgáló a
mintavétellel IV.
Mire jó mindez?
Elérhetjük, hogy hogy a könyvvizsgáló jobban megismerje a vizsgálat
sokaságot, és ha további vizsgálat, illetve mintavétel indokolt, akkor
megalapozottá tegye pl. a vizsgálati lényegesség beállítását a programban.
A vizsgálati lényegeség lehet:
• a számtani átlag és a tipikus érték (módusz) különbsége abszolút
értékben a szórás értékének kétszerese,
• vagy a felső kvartilis és a medián, illetve a medián és az alsó kvartilis
közötti távolság (abszolút értékben) közül a nagyobb különbség
háromszorosa.
57
A pénzegység alapú mintavételről I.
Ha eddig vizsgálataink azt mutatják, hogy szükséges mintát venni
elérkezünk az újabb dilemmához;
Hogyan tegyük ezt meg?
Egyszerű véletlen mintavétel?
Rétegezett mintavétel? (arányos, nem arányos, optimális, stb.)
Pénzegységalapú mintavétel? (Nemzetközi gyakorlatban ajánlott.)
Elméleti alapja: az elemszámmal arányos valószínűségek, olyan
visszatevés nélküli minta kiválasztásával, ahol minden sokasági elem
mintába kerülési valószínűsége egyenesen arányos annak könyv szerinti
értékével.
58
A pénzegység alapú mintavételről II.
Esettanulmány a későbbiekre!
Néhány gyakorlati példa a pénzegységalapú mintavétel alkalmazására:
A megoldás során a szakirodalom által javasolt, alábbi táblázatot fogjuk használni, valamint 5%-os
mintavételezési kockázattal és 800.000 Ft-os mintavételi intervallummal számolunk.

1. Ha nem találtunk hibát


Ebben az esetben a kivetített hiba 0.
A megbízhatósági együttható 3,00, így a statisztikai mintavétel hibája 3,00 * 800.000 = 2.400.000 Ft.
A hiba felső határa: 0 + 2.400.000 = 2.400.000 Ft.
59
A pénzegység alapú mintavételről III.
2. Alulértékelések
A módszer alulértékelések esetén csak igen korlátozottan alkalmazható, hiszen az alulértékelt
tételek kisebb eséllyel kerülnek a mintába, mint ha ténylegesen értékelnénk őket. Nem
használható a módszer, ha
• van olyan hiba, amely nagyobb, mint a könyv szerinti érték;
• ha az összes hibás tétel legalább 10 százaléka alulértékelés;
• ha az alulértékelések értékösszegének abszolút értéke meghaladja a felülértékelések
összegének 10 százalékát (az utóbbi két feltétel a 10%-os határ darabszámban és értékben).
Amennyiben a fentiek nem állnak fenn, akkor a hibák abszolút értékére a felülértékelések szerint
kell eljárnunk.

60
A pénzegység alapú mintavételről IV.
3. Felülértékelések

a) Teljes mértékben hibás tételek, amelyek nagyobbak, mint a mintavételi intervallum


Két hibás tételt találtunk: az egyik 1 millió Ft, a másik 2 millió Ft.
A kivetített hiba (mivel mindkettő nagyobb a mintavételi intervallumnál, a 800.000 Ft-nál) = a
tényleges hiba: 1 + 2 = 3 millió Ft.
A statisztikai mintavétel hibája (ld. 1. pont): 3,00 * 800.000 = 2.400.000 Ft.
A hiba felső határa: 3.000.000 + 2.400.000 = 5.400.000 Ft.

61
A pénzegység alapú mintavételről V.
3. Felülértékelések

a) Teljes mértékben hibás tételek, amelyek kisebbek, mint a mintavételi intervallum


4 hibás tételt találtunk: 2 db 100 Ft-os, 1 db 5.000 Ft-os és egy 785.000 Ft-os.
A kivetített hiba (mivel mindegyik kisebb a mintavételi intervallumnál, a 800.000 Ft-nál, így a teljes
intervallumot hibásnak tekintjük) = a mintavételi intervallummal: 4 * 800.000 = 3.200.000 Ft.
A megbízhatósági együttható (fenti táblázat 4 hiba, 5%) 9,16.
A hiba felső határa: 9,16 * 800.000 = 7.328.000 Ft.
A statisztikai mintavétel hibája: 7.328.000 – 3.200.000 = 4.328.000 Ft.

62
A pénzegység alapú mintavételről VI.
3. Felülértékelések

b) Részben hibás tételek, amelyek nagyobbak, mint a mintavételi intervallum


2 részben hibás tételt találtunk: az egyik könyv szerinti értéke 1.000.000 Ft, tényleges értéke
900.000 Ft (hiba 100.000 Ft), a másik könyv szerinti értéke 1.200.000 Ft, tényleges értéke
700.000 Ft (hiba 500.000 Ft).
A kivetített hiba a hibák értékének összege: 100.000 + 500.000 = 600.000 Ft.
A megbízhatósági együttható 3,00, így a statisztikai mintavétel hibája 3,00 * 800.000 =
2.400.000 Ft. Ennek oka, hogy a talált hibákhoz tartozó logikai egységek lefedik a mintavételi
intervallumot (ld. 1. pont).
A hiba felső határa: 600.000 + 2.400.000 = 3.000.000 Ft.

63
A pénzegység alapú mintavételről VII.
3. Felülértékelések
c) Részben hibás tételek, amelyek kisebbek, mint a mintavételi intervallum
5 részben hibás tételt találtunk:
Sorszám Könyv szerinti érték Tényleges érték Hiba
1. 1.000 100 900
2. 500.000 400.000 100.000
3. 10.000 9.000 1.000
4. 200.000 20.000 180.000
5. 250.000 120.000 130.000
Összesen 961.000 549.100 411.900

Megnézzük a hibák százalékos arányát, és a kivetített hiba a mintavételi intervallum arányos


részével lesz egyenlő:
Sorszám Könyv szerinti Hiba Hiba aránya Kivetített
érték (%) hiba
1. 1.000 900 90,00 720.000
2. 500.000 100.000 20,00 160.000
3. 10.000 1.000 10,00 80.000
4. 200.000 180.000 90,00 720.000
5. 250.000 130.000 52,00 416.000
Összesen 961.000 411.900 42,86 2.096.000
64
A pénzegység alapú mintavételről VIII.
A táblázatból jól látható, hogy az 1. tételnél talált 900 Ft-os hiba jelentősen nagyítja a kivetített
hibát, ezért a nagyon kis értékű tételeket célszerű előre kivenni.
A kivetített hibákat csökkenő sorrendbe rendezzük, majd a megbízhatósági együttható változását a
kivetített hibákhoz rendeljük:
Sorszám Kivetített Megbízhatóság Megbízhatósági Hiba felső
hiba i együttható együttható változása határa
. 3,00 -
1. 720.000 4,75 1,75 1.260.000
4. 720.000 6,30 1,55 1.116.000
5. 416.000 7,76 1,46 607.360
2. 160.000 9,16 1,40 224.000
3. 80.000 10,52 1,36 108.800
Összesen 2.096.000 - - 3.316.160

A statisztikai mintavétel hibája: 3.316.160 – 2.096.000 = 1.220.160 Ft.

65
A pénzegység alapú mintavételről IX.
Összegezve a felülértékelések példáit:
Eset Tényleges Kivetített Statisztikai Hiba felső
hiba hiba mintavétel hibája határa
a.) 3.000.000 3.000.000 2.400.000 5.400.000
b.) 790.200 3.200.000 4.128.000 7.328.000
c.) 600.000 600.000 2.400.000 3.000.000
d.) 549.100 2.096.000 1.220.160 3.316.160
Összesen 4.939.300 8.896.000 7.748.160* 16.644.160

*Mivel a 0 hibás megbízhatósággal kétszer számoltunk, ezért az egyiket le kell vonni


(2.400.000).
A hiba felső határát végül összehasonlítjuk az elfogadható hibával, ami alapján meghozzuk a
döntést.

66
A pénzegység alapú mintavételről X.
Előnyei:
• a mintát nem szükséges rétegezni és ez egyszerűsíti a mintavételt;
• a minta elemszámának meghatározásához nem szükséges a sokaság, azaz az
összetétel statisztikai tulajdonságainak (átlag, szórás, eloszlás) ismerete;
• ha a várható hiba alacsony, akkor hatékony mintaméretet ad.

Hátrányai:
• a hiba nagysága egyetlen tételnél sem haladhatja meg a könyv szerinti értéket;
• elsősorban felülértékelések felfedésére használható, az alulértékelések
vizsgálatára korlátozottan alkalmas;
• amennyiben sok a várható hiba, nagyon magas mintaelemszámot eredményez.
67
Következtetések, javaslatok I.
• A mintavétel alkalmazása a könyvvizsgálatban elkerülhetetlen, de bármelyik
mintavételi módot választjuk is az értelmezésnél mindig ügyelni kell a
reprezentatív minta fogalmának használatára.
• A reprezentatívitás mint cél arra utal, hogy a sokaság bizonyos egységei (a minta)
azzal a céllal kerülnek kiválasztásra, hogy a sokaság egységeit (sokaság egészét)
megfelelő módon képviseljék. Így a minta elemzéséből a sokaság jellemzőire
következtethetünk.
• Ne használjuk a reprezentatív minta kifejezést a mintavételből származó adatok
jellemzésére, anélkül, hogy pontosan leírnánk, miként biztosítottuk, hogyan
ellenőriztük azt.

68
ALKALMAZÁSOK II.

SOHA NE FELEDJÜK EL!

A legvalószínűbb nem egyenlő az abszolút biztossal,


hacsak, természetesen később el nem megyünk, és meg
nem nézzük.

Ezt hívjuk értékelésnek.

69

69
STATISZTIKAI KÖVETKEZTETÉSEK TIPUSAI
BECSLÉS:
Ismeretlen paraméter közelítő értékének meghatározása a
mintából
HIPOTÉZISVIZSGÁLAT:
Az alapsokaságról adott állítás ellenőrzése a minta
alapján, hogy ez az állítás elfogadható-e

70

70
STATISZTIKAI BECSLÉS
– lényege
– célja
– eszköze
– menete:
• becslőfüggvény értéke
• átlagos hiba
• maximális hiba
• konfidencia-intervallum
71

71
A BECSLŐFÜGGVÉNYEKKEL SZEMBEN
TÁMASZTOTT KÖVETELMÉNYEK I.
1. Torzítatlanság:

M 
   = 
 
2. Konzisztencia:
 
  
lim P  −    = 1
n →  
 
72

72
A BECSLŐFÜGGVÉNYEKKEL SZEMBEN
TÁMASZTOTT KÖVETELMÉNYEK II.
3. Hatásosság:

    
D
 1 
  D 
  2 

   
4. Elégségesség
73

73
MINTAVÉTEL ÉS BECSLÉS I.
A mintaátlag, mint valószínűségi változó
FAE minta esetén
• Várható értéke:
M (1 +  2 + ... +  n ) = M (1 ) + M ( 2 ) + ...
+ M ( n ) = n  

  +  2 + ... + n    
M 1  = M 
  
 = 

• Szórásnégyzete: n   

D 2 = (1 +  2 + ... +  n ) = D 2 (1 ) + D 2 ( 2 ) + ... + D 2 ( n ) = n   2

2  1 +  2 + ... +  n      2
D  = D  =
2
   
 n    n
74
MINTAVÉTEL ÉS BECSLÉS II.

A mintaátlag szórása: (FAE minta)

 
D   =   =
   n
MINTAÁTLAG STANDARD HIBÁJA

ÁTLAGOS HIBANAGYSÁGOT MUTAT

75
MINTAVÉTEL ÉS BECSLÉS III.
Mintaátlag szórása: (EV minta esetén)

  n

D  = = n  1−
   N
A korrekciós tényező használatától 5%-os kiválasztási arány alatt
eltekinthetünk.

76
MINTAVÉTEL ÉS BECSLÉS IV.
Intervallum becslés lépései:

Egy piaci bevezetésre váró 500 g-os arckrémet automata-gép tölti. A töltési
mennyiség beállítására 10 elemű FAE mintából akarunk becslést adni.
Mérési eredményeink a következők:
495, 501, 503, 480, 485, 499, 510, 502, 492, 503
Feltételezhetjük a töltési mennyiség normális eloszlását.
Készítsünk 95%-os megbízhatósággal intervallumbecslést a várható töltési
mennyiségre!

77
BECSLÉS I.
1. lépés: a mintaátlag meghatározása
x 495 + ... + 503
x = = = 497 g
n 10
2. lépés: a standard hiba, amihez először kiszámítjuk a
mintabeli szórást

 (x − x ) (495 − 497 ) + ... + (503 − 497 )


2 2 2
s= = = 9,12 g
n −1 10 − 1
s 9,12
sx = = = 2,88 g
n 10
78
INTERVALLUMBECSLÉS
Egyetlen minta alapján olyan intervallumot határozunk meg, amely előre megadott (nagy)
valószínűséggel tartalmazza az ismeretlen sokasági jellemzőt. (Konfidencia-intervallum)

Megbízhatósági szint (az előre megadott nagy valószínűség):

1−

Szignifikancia-szint (az intervallumon kívül esés valószínűsége):


79
NORMÁLIS ELOSZLÁS
1 −
( x −m )2

Sűrűségfüggvénye: f ( x) = e 2 2

2 

80
STANDARD NORMÁLIS ELOSZLÁS I.
A (0,1) paraméterű normális eloszlású váltózót standard normális eloszlásúnak nevezzük.
Paraméterei
E(X) = 0
D( X ) = 1
Sűrűségfüggvény
− z2
(z ) =
1
e 2
zR
2 -z 0 z
Eloszlásfüggvény
z
(z) =  (u )du zR
−
(−z) = 1 − (z)
=NORM.S.ELOSZLÁS(z;IGAZ)

81
INTERVALLUMBECSLÉS LÉPÉSEI I.
Pontbecslés: paraméter meghatározása a mintából x

Standard hiba (átlagos hiba) x =
n
  
Tudjuk, hogy normális eloszlású sokaság esetén a mintaátlag is normális eloszlású, x N  , 
 n
x −
z=
 z N ( 0,1)
n
Mekkora lesz az a szimmetrikus intervallum, amelybe változónk 1-α valószínűséggel esik?
 
 x − 
P  − z  z  =  ( z ) −  ( − z ) = 2 ( z ) − 1 = 1 −  Az ismeretlen nem az α, hanem a „z”
  
 
 n 

82
INTERVALLUMBECSLÉS LÉPÉSEI II.
1 = 0, 27%
 2 = 4,55%
 3 = 31, 73%

Konfidencia-intervallum: Hibahatár:

    
P x − z   x + z   = 1− x = z 
1− 1− 1−
 2 n 2 n 2 n
83
BECSLÉS II.
3. lépés: táblázatból keresés:
95 %  = 0,05 szf = n − 1

p =1− = 0,975 9
t0 ,975 = 2, 26
2
4. lépés: a hibahatár meghatározása:
s
x = t szf
p  = 2,26  2,88 = 6,51g
n
5. lépés: a konfidencia-intervallum kijelölése:
x   x
497  6,51 (490,49 - 503,51)g 84
BECSLÉS III.
Megoldás

N  x   x  =
= 1000  497  6,51 =
490490 g - 503510g  =
= 490,5kg - 503,5kg 

Értelmezés 85

85
STANDARD NORMÁLIS ELOSZLÁS II.
Hosszú évek tapasztalata alapján Magyarországon a
lánycsecsemők élve születési súlya normális eloszlást követ 3,2
kg átlaggal és 0,6 kg szórással.
1. Mi a valószínűsége annak, hogy egy véletlenszerűen
kiválasztott lánycsecsemő súlya 3,8 kg alatt van?

 3,8 − 3,2 
P( X < 3,8) =    = (1) = 0,8413
 0,6 
2. Mi a valószínűsége annak, hogy egy véletlenszerűen
kiválasztott lánycsecsemő súlya 2,6 - 3,8 kg között van?

86
NORMÁLIS ELOSZLÁS - EXCEL

87
STANDARD NORMÁLIS ELOSZLÁS EXCEL I.

88
STANDARD NORMÁLIS ELOSZLÁS EXCEL II.

89
INTERVALLUMBECSLÉS LÉPÉSEI
1. lépés: Pontbecslés

2. lépés: Standard hiba


Fordítsuk meg a kérdést! Adott
3. lépés: Táblázatos érték valószínűségi szinthez, milyen z
érték tartozik?
4. lépés: Hibahatár (maximális hiba): ∆

5. lépés: Konfidencia-intervallum

90
A SOKASÁG VÁRHATÓ ÉRTÉKÉNEK
BECSLÉSE
Lehetséges esetek:

a) Normális eloszlású sokaság, a sokasági szórás ismert.

b) Normális eloszlású sokaság, a sokasági szórás nem ismert, kis minta.

c) Nem normális, de ismert eloszlású sokaság, ha a minta nagy.

d) Nem normális, de ismert eloszlású sokaság, ha a minta kicsi; illetve


ismeretlen eloszlású alapsokaság.

91
A rendelésállomány átvételénél
500 elemű mintát vizsgálunk: kiválasztási arány 10%
Üdítőital mennyisége Palackok száma
(ml) (db)

- 960 50
961 – 980 75
981 - 1000 300
1001 - 1020 50
1021 - 1040 25
Összesen 500 92

92
Készítsünk intervallumbecslést a palackok átlagos
töltősúlyára 95%-os megbízhatósági szinten!
Megoldás:
50  950 + ... + 25  1030
x = = 987 g
500
50(950 − 987 )2 + ... + 25(1030 − 987 )2
s = = 18,2 g
499
18,2
sx =
 1 − 0,1 = 0,77 g
500
,975 = z 0,975 = 1,96
499
t0
 = 1,96  0,77 = 1,51g
985,49 - 988,51gramm
93

93
ARÁNYBECSLÉS
Képzésének alapgondolata:
Az alternatív ismérvátlaga és szórása
A becslést az átlag-becslésre vezetjük vissza.
Menete:
1. lépés: a mintabeli arány meghatározása
kn
2. lépés: a standard hiba
p =
n
p (1 − p )
sp =
n
94

94
3. lépés: táblázatból keresés

 p = 1− zp = ?
2
4. lépés: maximális hiba meghatározása

 p = zp  sp

5. lépés: konfidencia-intervallum

p p
95
Készítsünk intervallumbecslést az 1000 ml töltési
mennyiség feletti üvegek arányára 90%-os
megbízhatósági szinten!
Megoldás:
75
p = = 0,15
500
0,15  (1 − 0,15 )
sp =  1 − 0,1 = 0,015
500
z 0,95 = 1,65 (1 −  = 0,9 )
 = 1,65  0,015 = 0,025
12,5% - 17,5% 

96

96
A SZÓRÁS BECSLÉSE
A sokasági szórásnégyzet becslésére a torzítatlan becslést eredményező korrigált
tapasztalati szórásnégyzetet használjuk.
A becslés során a  2
eloszlást, n − 1 szabadságfokkal használjuk.

Csak pozitív értékei vannak, nem szimmetrikus

A sokasági szórásra adott konfidencia-intervallum:

(n − 1)  s (n − 1) s
2 2
( ; )
  ( szf )   ( szf )
2 2
1−
2 2 97
Egy könyvtárban egy adott héten a beiratkozott olvasók 5%-a fordult meg
és kölcsönzött könyvet.
Elemzés céljából feljegyezték az olvasók által kölcsönzött könyvek számát.

A kölcsönzött könyvek Olvasók száma n


száma = 5%
N
1 14
2 15
3 24
4 20
5 15
6 10
7 8
8 4
98
Összesen 110
Feladat:
a) Adjunk 90%-os megbízhatósági intervallumot a háromnál több könyvet
kölcsönzők arányára vonatkozóan!

1. lépés: Pontbecslés : mintabeli arány meghatározása


57
p= = 0,518
2. lépés: standard hiba meghatározása 110
p  (1 − p ) n 0,518  (1 − 0,518)
sp =  1− =  1 − 0,05 = 0,0464
n N 110
3. lépés: táblázat 
Megbízhatósági szint: 90%  = 0,1 1− = 0,95
2
z 0 , 95 = 1,645
4. lépés: hibahatár meghatározása  = 1,645  0,0464 = 0,076
5. lépés: konfidencia-intervallum 0,518  0,076
99
[ 44,2; 59,4]%
b) Milyen szóródást mutat a mintában a kölcsönzött könyvek száma? (A
szórás mutatószámával mérve.)

14 1 + ... + 4  8 14  (1 − 3,81) 2 + ... + 4  (8 − 3,81) 2


x= = 3,81 s= = 1,91
110 109

c) Milyen határok között becsülhető -95%-os megbízhatósági szinten- a szórás


mutatószáma?

 
1 −  = 0,95 1− = 0,975 = 0,025
2 2

szf = n − 1 = 109 → 100 


2
0 , 975 = 129,6  02, 025 = 74,2

109 1,912 109 1,912


= 1,75 = 2,31
129,6 74,2 100
HÁNYADOS BECSLÉS I.
Cél:
• Viszonyszámok becslése

Alkalmazás:
• Növekedési ütem
• Indexek meghatározása

Eljárás:
Két sokasági jellemzőből (várható értékből, értékösszegből,..) viszonyszámot képezünk és ezt a
viszonyszámot kívánjuk megbecsülni mintákból.

Jellemző:
Torzított becslés, de a minta elemszámának növelésével a torzítás csökken és tart nullához, azaz
aszimptotikus torzítatlanságról van szó.

101
HÁNYADOS BECSLÉS II.
Részminták segítségével. Legyen két paraméter U és W, ezek torzítatlan becslései az i-edik részmintából
rendre ui , wi kombinált becslései pedig: u ; w
u
A hányados H=
U a hányados becslése: h =
W w

A két mintaátlag kovarianciájának becslése:


k
1
C  u , w =  ( ui − u )( wi − w )
k ( k − 1) i =1

C (u , w) a becslések standard
A két mintaátlag korrelációs együtthatójának becslése: r (u , w) = ahol: su ; sw
su sw hibái

A hányadosbecslés relatív szórását (relatív standard hibáját a következők szerint számíthatjuk:

Vh2 = Vu2 + Vw2 − 2rVuVw ahol: Vu , VW Az u és w becslések relatív standard hibája

102

102
ÖSSZEGZÉS I.
• A társadalmi-gazdasági statisztikában a mintavétel az adatokhoz jutás egyik
legfontosabb eszköze
• A mintavétel a következtető statisztika része
• Az elméleti igényeknek a véletlen (valószínűségi) minta felel meg.
• A mintából számított bármilyen mutató változó, azaz értéke mintáról mintára
ingadozik, ezért a mintavétel során az ebből adódó hibával (mintavételi hiba)
mindenképpen számolni kell.
• Ügyelni kell az összehasonlíthatóságra, a megfelelő mintavételi módszerre
• Nemválaszolás problémaköre, utólagos pontosítás

103

103
ÖSSZEGZÉS II.
• Statisztikai becslés szerepe, lényege
• Pontbecslés, intervallumbecslés
• Pontosság - megbízhatóság
• Paraméterek: átlag, értékösszeg, arány
• Szórásbecslés
• Hányados-becslés

104

104
Összegzés III.
„A statisztika egy eszköz, amivel válaszokat lehet keresni, de válaszokat
nem ad. A válaszokat, az adatok interpretációját mindig nekünk kell
adnunk.” (Kun Ádám)

105
AJÁNLÁS

Seth Stephens-Davidowitz:

Athenaeum Kiadó, Budapest, 2019


ISBN 978 963 293 868 4

106

106
KÖSZÖNÖM A MEGTISZTELŐ FIGYELMET !
kriszt.eva@uni-bge.hu

MTA STAB :”… minden statisztikai becslésre: akkor értékesek, ha


Állásfoglalás,
2020. január
tisztelettel bánunk velük és megértjük ’üzeneteiket’, nem
abszolút igazságnak kell őket tekinteni, hanem
útikalauznak.”
Harris
107

107

You might also like