Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 10

Üzleti statisztika alapjai

Diszkrét ismérvek esetén használatos képletek:


1. Relatív gyakoriság:
fi
gi =
n
A relatív gyakoriság az i−edik osztály f i tapasztalati gyakoriságának és az n
mintaelemszámnak a hányadosa.
A relatív gyakoriság megmutatja, hogy a minta hányad része tartozik az adott osztályba.
2. Kumulált relatív gyakoriság:
i
g'i=∑ g r
r=1

Az i−edik osztály kumulált relatív gyakorisága: az első i osztály g r relatív gyakoriságainak


összege (beleértve a szóban forgó osztály relatív gyakoriságát is).
3. Gyakorisági táblázat:
Példa: Egy internetszolgáltató az elmúlt 100 napban vizsgálta az egy nap alatt
bekövetkező szerverleállások számát, amely eredményeit a következő táblázat
tartalmazza.

A gyakorisági táblázat tartalma:


 a kialakított osztályok,
 fi: az osztályba tartozó mintaelemek száma=gyakorisága (db)
 gi: a relatív gyakoriságok (%-os forma),
'
 f i: kumulált tapasztalati gyakoriságok (gyakorisági sor [fi] elemeinek összege
'
 gi: kumulált relatív gyakoriságok (relatív gyakorisági sor [gi] elemeinek összege
4. Módusz:
Diszkrét ismérv esetén a módusz (ha létezik) a leggyakrabban előforduló ismérvérték.
A módusz a legnagyobb gyakoriságú osztályhoz tartozó ismérvérték és nem az osztály
tapasztalati gyakorisága.
Jele: Mo
5. Medián:
Fogalom: A medián a változó azon számértéke, aminél az előforduló értékek fele kisebb, fele
nagyobb, azaz, a megfigyeléseket két, egyenlő gyakoriságú osztályra bontja.
A medián számítása ha az ismérvértékek ismertek:
Diszkrét ismérv esetén a medián a nagyság szerint sorba rendezett megfigyelések közül a
𝑛+1
-edik pozícióban (azaz, az adatsor közepén) lévő elem, azaz
2

 ha az n mintaelemszám páratlan, a középső elem,


 ha a minta n elemszáma páros, a két középső elem átlaga
(megjegyzés: a mediánt nem tanácsos használni, ha sok az egyforma ismérvérték)

Üzleti statisztika alapjai


Folytonos ismérvek esetén használatos képletek:
1. Gyakorisági táblázat készítése:
Példa: A következő táblázat 1 liter benzin árát tartalmazza 25 véletlenszerűen kiválasztott
kútnál.

A minta elemei egyenlő osztályköz-hosszúságú osztályokba kerültek besorolásra.


Az egyedi ismérvértékek helyett, az osztályközepek használandóak további számításokhoz.
2. Relatív gyakoriság kiszámítása:
𝑓𝑖
Képlet: 𝑔 𝑖=
𝑛
Fogalom: A relatív gyakoriság az i−edik osztály f i tapasztalati gyakoriságának és az n
mintaelemszámnak a hányadosa. Megmutatja, hogy a minta hányad része tartozik az adott
osztályba.
𝑓1 2
 az első osztály relatív gyakorisága: 𝑔 1= = =0 , 08
𝑛 25
𝑓2 5
 a második osztály relatív gyakorisága: 𝑔 2= = =0 , 2 stb...
𝑛 25
3. Kumulált relatív gyakoriság kiszámítása:
𝑖
Képlet: 𝑔 =∑ 𝑔𝑟

𝑖
𝑟 =1

Fogalom: Az i−edik osztály kumulált relatív gyakorisága: az első i osztály g r relatív


gyakoriságainak összege (beleértve a szóban forgó osztály relatív gyakoriságát is).
Példa: az ötödik osztály kumulált relatív gyakorisága
5
𝑔 ′5=∑ 𝑔𝑟 =𝑔 1+ 𝑔2 +𝑔3 +𝑔 4 +𝑔 5=0 , 8+0 ,2+0 , 28+0 , 16=0 , 92
𝑟 =1

4. Osztályközép kiszámítása:
Jele: 𝑋 ∗𝑖
Az i−edik osztály osztályközepe az adott osztály alsó és felső osztályhatárának egyszerű
számtani átlaga, ahol 𝑋 𝑖,𝑎 az i−edik osztály alsó-, 𝑋 𝑖, 𝑓 pedig az osztály felső osztályhatára.

𝑋 𝑖,𝑎 + 𝑋 𝑖 , 𝑓
Képlet: 𝑋 ∗𝑖 =
2
Példa: harmadik osztály osztályközepe

∗ 𝑋 3 ,𝑎+ 𝑋 3 , 𝑓 395+405
𝑋 3= = =400
2 2

5. Módusz becslése:
Jele: Mo
Fogalom: A módusz a leggyakrabban előforduló ismérvérték, folytonos ismérv esetén a
gyakorisági görbe maximumhelye(i).

Képlet:
Ahol:
 𝑋 𝑀𝑜 ,𝑎 = a móduszt tartalmazó, legnagyobb gyakoriságú osztály alsó osztályhatára,

 h 𝑀𝑜 = ennek az osztálynak az osztályköz-hosszúsága (a felső és az alsó osztályhatár


különbsége),
illetve:
𝑑 𝑎= 𝑓 𝑀𝑜 − 𝑓 𝑀𝑜− 1 és 𝑑 𝑓 = 𝑓 𝑀𝑜 − 𝑓 𝑀𝑜+ 1
Ahol: 𝑓 𝑀𝑜 , 𝑓 𝑀𝑜 −1 és 𝑓 𝑀𝑜 +1 rendre a móduszt tartalmazó, illetve a gyakorisági táblázatban az
azt megelőző és az azt követő osztály tapasztalati gyakorisága.
Képlet átalakítva:

Nyers
módusz:
A legnagyobb gyakoriságú modális osztály osztályközepét nyers módusznak nevezik.
Példánál: A 3.-adik osztály gyakorisága a legnagyobb (mert 𝑓 𝑖=7), így ennek az
osztályközepe, 𝑋 ∗3 ≈ 400 ft/l a nyers módusz

6. Medián becslése:
Jele: Me
Fogalom: A medián a változó azon számértéke, amelynél az összes előforduló megfigyelt
érték fele kisebb, másik fele nagyobb, így a medián a rangsorba rendezett megfigyelt
értékeket két, egyenlő gyakoriságú osztályra bontja

Képlet:
Ahol:
 𝑋 𝑀𝑒 ,𝑎 = a mediánt tartalmazó osztály alsó osztályhatára,

 n = a minta elemszáma,

 𝑓 𝑀𝑒 −1 = a mediánt megelőző osztály kumulált tapasztalati gyakorisága,

 𝑓 𝑀𝑒 = a mediánt tartalmazó osztály tapasztalati gyakorisága és

 h 𝑀𝑒 = a mediánt tartalmazó osztály osztályköz hosszúsága, ami a felső és az alsó
osztályhatár különbségeként adható meg.
𝑛 ′
A mediánt mindig az az osztály tartalmazza, amelyre ≤ 𝑓 𝑀𝑒 elsőként teljesül (azaz amelyik
2
osztály kumulált tapasztalati gyakoriságára elsőként igaz az, hogy nagyobb a mintaelemszám
felénél).

7. Számtani átlag meghatározása:


Mivel az egyedi ismérvértékek nem ismertek az osztályközös gyakorisági soroknál, ezért a
számtani átlag meghatározása az osztályközepek segítségével történik.
𝑟

Képlet:
∑ 𝑓 𝑖 × 𝑋 ∗𝑖
𝑋 = 𝑖=1
𝑛
ahol: ahol 𝑋 ∗𝑖 az i−edik osztály osztályközepe, 𝑓 𝑖 pedig ezen osztály tapasztalati gyakorisága.

8. Tapasztalati szórás számítása:


Jele: s
Fogalom: A tapasztalati szórás az egyes megfigyelt értékeknek az átlagos eltérése a számtani
átlagtól.


𝑟

∑ 𝑓 𝑖 × ( 𝑋 ∗𝑖 − 𝑋 )
2
Képlet: 𝑖=1
𝑠=
𝑛 −1
Ahol:

 𝑋 𝑖 az adott osztály osztályközepe,
 𝑓 𝑖 ennek az osztálynak a tapasztalati gyakorisága,

 𝑋 pedig a minta számtani átlaga


𝑟
 a ∑ 𝑓 𝑖 × ( 𝑋 𝑖 − 𝑋 ) mennyiséget eltérésnégyzetösszegnek szokás nevezni

𝑖=1

9. z-érték :
A z−érték egy adott ismérvérték helyét mutatja a számtani átlaghoz viszonyítva.
Fogalom: A z−érték kifejezi egy adott megfigyelés szórásegységben mért távolságát a
számtani átlagtól.
𝑥− 𝑋
Képlet: 𝑧 =
𝑠
ahol:
 x = a megfigyelt ismérvérték
 𝑋 = a számtani átlag
 s = a tapasztalati szórás
Üzleti statisztika alapjai
1. Heterogén sokaság vizsgálata - képletek:
Példa: Egy karbantartó üzemben háromféle motorvonatot, Desirot (D), Flirtet (F) és Lintet (L)
tartanak karban. Egy napon, az aznap napi átvizsgálásra beérkezett 20 szerelvény
átvizsgálásához szükséges időt (percben) mutatja az alábbi táblázat.

2. Részátlag számítása:
Fogalom: A j−edik részsokaság részátlaga az ebbe a részsokaságba tartozó elemek egyszerű
számtani átlaga. Az ismérv átlagos értékét mutatja a szóban forgó részsokaságban.
𝑁𝑗
1
Képlet: 𝑌 𝑗= ∑𝑌
𝑁 𝑗 𝑖=𝑖 𝑖, 𝑗
Példa: A Desirok részátlagának kiszámítása:
ND = 6 (6 Desiro átvizsgálásához szükséges átlagos idő)
𝑁𝐷

∑ 𝑌 𝐷 ,𝑖 50+ 48+58+54 +55+59


𝑖=𝑖
𝑌 𝐷= = =54
𝑁𝐷 6

3. Részszórás számítása:
Fogalom: A részszórás az adott részsokaságba tartozó elemek saját részátlaguktól való átlagos
eltérése az éppen vizsgált részsokaságban.


𝑁𝑗

Képlet: ∑ ( 𝑌 𝑖𝑗 −𝑌 𝑗 ) 2
𝑖=1
𝜎 𝑗=
𝑁𝑗

𝑁𝑗
Megjegyzés: a ∑ ( 𝑌 𝑖𝑗 − 𝑌 𝑗 )2 kifejezés az adott sokaságra vonatkozó eltérésnégyzetösszeg
𝑖=1

( ELTNÖ)

!FONTOS: A részátlag, illetve a részszórás számítása kizárólag az adott részsokaságba


tartozó egyedek értékeiből történik!
4. Belső szórás számítása:
Fogalom: A részsokaságokba tartozó elemek saját részátlaguktól való átlagos eltérését,
minden vizsgált részsokaságban együttesen vizsgálva, belső szórásnak nevezzük.

√ √
𝑀 𝑁𝑗 𝑀

Képlet: ∑ ∑ ( 𝑌 𝑖𝑗 − 𝑌 𝑗 )2 ∑ 𝑁 𝑗 × 𝜎 2𝑗
𝑗 =1 𝑖=1 𝑗=1
𝜎 𝐵= =
𝑁 𝑁
A belső szórás meghatározása az összes elemre vonatkozik / összes elemmel kell számolni
(csak a szórásnégyzetek összegezhetőek, a szórások NEM!).
𝑀 𝑁𝑗
Megjegyzés: ∑ ∑ ( 𝑌 𝑖𝑗 −𝑌 𝑗 )2 mennyiséget belső eltérésnégyzetösszegnek, SSB-nek
𝑗 =1 𝑖=1

nevezzük. Ez egyenlő a három részsokaság eltérésnégyzetösszegének összegével.

5. Külső szórás számítása:


Fogalom: A külső szórás a részátlagok főátlagtól való átlagos eltérése.


𝑀

Képlet: ∑ 𝑁 𝑗 × ( 𝑌 𝑗 − 𝑌 ❑)2
𝑗 =1
𝜎 𝐾=
𝑁
𝑀
A ∑ 𝑁 𝑗 × ( 𝑌 𝑗 − 𝑌 ) mennyiséget külső eltérésnégyzetösszegnek, SSK-nak nevezzük.
2

𝑗 =1

6. Főátlag számítása:
Fogalom: A fősokaságba tartozó valamennyi ismérvérték átlaga.
𝑀 𝑁𝑗
1
Képlet: 𝑌 = ∑∑ 𝑌
𝑁 𝑗 =1 𝑖=1 𝑖 , 𝑗
A főátlag kiszámolható a részátlagok megfelelő részsokasági elemszámmal súlyozott
𝑀

átlagaként is:
∑ 𝑁 𝑗 ×𝑌 𝑗
𝑌 = 𝑗=1
𝑁
A főátlag számítása a fősokaság elemszámával történik, ami a részsokaságok elemszámának
összege.
7. Teljes szórás számítása:
Fogalom: A teljes szórás valamennyi ismérvérték főátlagtól vett átlagos eltérése.


𝑀 𝑁𝑗

Képlet: ∑ ∑ ( 𝑌 𝑖𝑗 −𝑌 )2
𝑗=1 𝑖=1
𝜎𝑇 =
𝑁
𝑀 𝑁𝑗
A ∑ ∑ ( 𝑌 𝑖𝑗 −𝑌 )2 mennyiséget teljes eltérésnégyzetösszegnek, SST−nek nevezzük.
𝑗 =1 𝑖=1
Kihasználva a teljes eltérés felbontását, a teljes variancia kifejezhető a külső és a belső
variancia összegeként.
Szórásnégyzet felbontása:
A teljes variancia a külső és a belső variancia összege: 𝜎 𝑇2 =𝜎 2𝐾 + 𝜎 2𝐵
!FONTOS : 𝜎 𝑇 ≠ 𝜎 𝐾 + 𝜎 𝐵 !
Általánosságban igaz, hogy összegezni csak varianciákat (szórások négyzeteit) lehet,
szórásokat nem. Tárgyi jelentése ugyanakkor csak a szórásértékeknek van.
8. Varianciahányados mutató kiszámítása:
2
2 𝑆𝑆𝐾 𝜎 𝐾
𝐻= = , amely az Y mennyiségi ismérv szórásnégyzetének (nem abszolút
𝑆𝑆𝑇 𝜎 2𝑇

nagyságának!) a csoportképző X ismérv által magyarázott hányada.


Megmutatja, hogy a csoportosító (minőségi/területi) ismérv milyen hányadban, hány
százalékban magyarázza a vizsgált mennyiségi ismérv szóródását.
9. Szóráshányados mutató kiszámítása:
2

𝐻=+¿ 𝐻 √¿ ¿ , amely az Y mennyiségi ismérv és a csoportképző X ismérv közötti kapcsolat


szorosságát méri.
A kapcsolat szorosságát 0-1 közötti értékkel méri.
 0 ¿ H ¿ 0,3 → gyenge kapcsolat
 0,3 ¿ H ¿ 0,7 →közepesen erős
 0,7 ¿ H ¿ 1 →erős

You might also like