Download as pdf or txt
Download as pdf or txt
You are on page 1of 7

Változékonyság (szóródás)

 A középértékek a sokaság elemeinek


értéknagyságbeli különbségeit
eltakarhatják.
STATISZTIKA I.  A változékonyság az azonos
tulajdonságú, de eltérő értéknagyságú
5. Előadás adatok egymástól vagy középértéktől való
különbözőségét méri.
 Leggyakrabban a számtani átlaghoz képest
Szóródási mutatók állapítjuk meg
 Minél kisebb a szóródás annál jellemzőbb,
megbízhatóbb az átlag

A szóródás mutatószámai Terjedelem


 A szóródás terjedelme  A szóródás terjedelme a statisztikai sor
 Kvantilisek: legnagyobb és legkisebb eleme közötti
 Kvartilis eltérés különbség.
 Percentilis
 Százalékrang
 Középeltérés R  xmax  xmin
 Szórás
 Szóródási együttható (relatív szórás)
 Relatív szóródási együttható

Excel függvények Forgalom terjedelem


=MAX(FORGALOM)=486133 kg/év
=MIN(FORGALOM)=35 kg/év
Függvénykategória: Statisztikai
Terjedelem=486133 - 35 = 486 098 kg/év
R=MAX(adatok) – MIN(adatok)
Ez a legnagyobb ingadozás!

1
Kvartilis eltérés Kvartilis ábra (box-plot)
Az adatok helyzeti eloszlását mutatja. maximum

Gyakoriságon alapul. A nagyság szerint rendezett


adatokat négy egyenlő részre osztja. Q3
n 1
alsó kvartilis : nQ1 
4
Q2
n 1
középső kvartilis : nQ 2 
2
3( n  1)
fels ő kvartilis : nQ 3  Q1
4
interkvart ilis terjedelem : iQ  Q3  Q1
minimum
Q3  Q1
kvartilis eltérés : Qe 
2

Az alsó (Q1) és felső (Q3) kvartilisek


Excel függvény
meghatározása nem egyértelmű
Q1 Q3
KVARTILIS(tömb;kvart)
Eljárás páros n páratlan n páros n páratlan n
Minitab n+ 1 n 1 3n  3 3n  3
4 4 4 4
A kvart értéke A KVARTILIS eredménye Tukey (Hoag lin et al., n3 n2 3n  1 3n  2
4 4 4 4
0 Minimális érték 1983)
n 1 n2 3n  3 3n  2
1 Első kvartilis (25%) Moore and McCabe
4 4 4 4
(2002)
2 Medián (50%)  n  1  n  1 3n  3 3n 3
Mendenhall and Sincich
 4   4  
 4  
 4 
3 Harmadik kvartilis (75%) (1955)
 

4 Maximális érték Freund and Perles n3 n3 3n  1 3n  1


4 4 4 4
(1987)

Példa Percentilis
1, 2,3,4 1,2,3,4,5 1,2,3,4,5,6  Latin per centum = százalék
 Az n%-os (vagy n-edik) percentilis azt jelenti,
hogy az adatok n%-a kisebb, mint ez az érték.
Eljárás Q1 , Q3 Q1 , Q3 Q1 , Q3
 A medián az 50%-os percentilisnek, az alsó és
felső kvartilisek pedig a 25% ill. 75%-os
Excel 1, 75 , 2,4 2,25 , 4,75 percentilisnek felelnek meg.
3, 25  A percentiliseknek óriási jelentősége van a
„mit tekintünk normálisnak?” kérdés
eldöntésében.
SPSS 1, 25 , 1,5 , 4,5 1,75 , 5,25  Az alsó és felső néhány percentilis közötti
3, 75 részt (2,5% - 97,5%, vagy 5% - 95%) szokás
normális (referencia) értéknek elfogadni.

2
Excel függvény Százalékrang
PERCENTILIS(tömb;k)
 Érték adathalmazon belül vett
tömb: Az egymáshoz viszonyítandó adatokat tartalmazó százalékos rangját (elhelyezkedését)
tömb vagy tartomány. mutatja.
k: A százalékosztály száma a 0-1 intervallumban, a
végpontokat is beleértve.  Pl. teszteredmények kiértékelése
Megjegyzés
 Ha a tömb üres vagy 8191 adatpontnál többet tartalmaz, akkor
a PERCENTILIS eredménye a #SZÁM! hibaérték lesz. 1, 1, 1, 2, 3, 4, 8, 11, 12, 13
 Ha a k értéke nem szám, akkor a PERCENTILIS az #ÉRTÉK!
hibaértéket adja vissza.
 Ha k < 0 vagy k > 1, akkor a PERCENTILIS eredménye a
#SZÁM! hibaérték lesz. 2 százalékrangja: 33,3%
 Ha a k nem az 1/(n - 1) többszöröse, akkor a PERCENTILIS a
k-adik százalékosztályt interpolációval határozza meg. 8 százalékrangja: 66,6%

Excel függvény Középeltérés


SZÁZALÉKRANG(tömb;x;pontosság) Egy statisztikai sor tagjainak
Egyszerű formában
Tömb: Az egymáshoz viszonyítandó számadatokat a mediántól vett eltérések
n
tartalmazó tömb vagy tartomány. abszolút értékét (előjelek
figyelmen kívül hagyása
 x  Me i
x: Az az érték, amelynek a rangját meg kell d i 1

határozni. mellett) összeadjuk és n


osztjuk a sor tagjainak a
Pontosság: Az eredményül kapott százalékérték számával Súlyozott formában
értékes jegyeinek számát határozza meg, nem n
kötelező megadni. Ha nem adjuk meg, akkor a f i xi  Me
SZÁZALÉKRANG három tizedes jegyet d i 1
n

használ (0,xxx). f
i 1
i

Átlagos eltérés Excel függvény


Egyszerű formában ÁTL.ELTÉRÉS(szám1;szám2;...)
 kevésbé használatos n
 mértékegységgel rendelkezik x x i szám1, szám2...: 1 és 30 közötti számú argumentum,
amelyek abszolút eltérésének átlagát keressük.
 az átlagtól mindkét irányban d i 1
Pontosvesszőkkel elválasztott argumentumok helyett
értelmezzük n egyetlen tömböt vagy erre mutató hivatkozást is
használhatunk.
Súlyozott formában
n
Megjegyzés
f i xi  x Az argumentumok számok, számokat tartalmazó tömbök vagy
d i 1
n
számokra mutató nevek, illetve hivatkozások lehetnek.

f
i 1
i
A függvény a tömbben vagy hivatkozásban szereplő értékek
közül csak a számokat használja, az üres cellákat, logikai
értékeket, szöveget és hibaüzeneteket figyelmen kívül hagyja,
de a nullát tartalmazó cellákat számításba veszi.

3
Forgalom átlagos abszolút eltérés Szórás
Számtani átlag = 59 075 kg/év
Az elméleti szórás jele: σ
Átlagos eltérés = 64 754 kg/év
A mintából becsült szórás jele: s
Hisztogram

400
350
300
Gyakoriság

250
200
150
100
50
0
3909,471074

33092,09575

62274,72043

91457,34511

120639,9698

149822,5945

179005,2192

208187,8438

237370,4685

266553,0932

295735,7179

324918,3425

354100,9672

383283,5919

412466,2166

Rekesz

Szórás becslése 1. Szórás becslése 2.


Minta alapján: Sokaság alapján:
Egyszerű formában: Súlyozott formában: Egyszerű formában: Súlyozott formában:

n n

 f ( x  x)
n

n 2

 ( xi  x) 2

s i 1
f i ( xi  x )2
 ( xi  x ) 2

s i 1
i i

s i 1 n s i 1 n
n 1 
i 1
fi  1 n f
i 1
i

A szórás tulajdonságai 1. A szórás tulajdonságai 2.


 A szórás ± vagy nulla  A szórások nem adhatók össze
 Az értékekhez ugyanazt a számot
 A szórás mértékegysége megegyezik az hozzáadva vagy levonva a szórás nem
adatok mértékegységével változik
 Az értékeket egy közös számmal
 A szórás értéke nagyon megnő, ha szorozva a szórás a szám abszolút
kiugró adat van az adatok között értékével szorzódik
 A szórás kiszámítható a négyzetes és
számtani átlagból is

4
A szórás tulajdonságai 3. Excel függvény

 x A   x
SZÓRÁS(szám1;szám2;...)
szám1, szám2...: A statisztikai mintát reprezentáló
argumentumok, számuk 1 és 30 között lehet.
Az argumentumokban pontosvesszővel

 Bx  B  x elválasztott értékek helyett egyetlen tömb vagy


tömbhivatkozás is használható.
Megjegyzés
A SZÓRÁS függvény az argumentumokat

  xq  x 2 2 statisztikai sokaság mintájának tekinti. Ha az adatok


a teljes sokaságot jelentik, akkor a szórást a
SZÓRÁSP függvénnyel kell kiszámolni.
A függvény a szórást a „torzítatlan” vagy „n-1”
módszerrel számítja ki.

Excel függvény Forgalom szórása


SZÓRÁSP(szám1;szám2;...)
szám1, szám2...: A statisztikai sokaságot =SZÓRÁS(Forgalom) = 83 927 kg
reprezentáló argumentumok, számuk 1 és 30
között lehet. Az argumentumokban
pontosvesszővel elválasztott értékek helyett =SZÓRÁSP(Forgalom) = 83 877 kg
egyetlen tömb vagy tömbhivatkozás is
használható.

Megjegyzés
A SZÓRÁSP az argumentumokat a teljes statisztikai
sokaságnak tekinti. Ha az adatok a teljes sokaság mintáját
jelentik, akkor a szórást a SZÓRÁS függvénnyel kell
kiszámítani.
Nagyméretű mintáknál a SZÓRÁS és a SZÓRÁSP
megközelítőleg azonos eredmény ad.

Hiba oszlopdiagram (Error Bar) Variancia vagy szórásnégyzet


Egyszerű formában:
30
 Összeadhatók,
n
kivonhatók
20
 Arányosíthatók  ( x  x) i
2
Mean +- 2 SD T_atlag

s 
2 i 1
10
n 1
n Súlyozott formában:
 ( x  x) 2
0

i n
-10
s 
2 i 1  f ( x  x)
i i
2

n s2  i 1
n

f
-20

1 2 3 4 5 6 7 8 9 10 11 -32 i 1
-32
i 1
hónap

5
Variancia gyakorlati
Excel függvény
meghatározása
VAR(szám1;szám2;...)

 x  2 szám1, szám2...: A statisztikai mintát reprezentáló

x
argumentumok, számuk 1 és 30 között lehet.
2

s 
2  ( x  x )2
 n Megjegyzés
A VAR függvény az argumentumokat egy
n 1 n 1 statisztikai sokaság mintájának tekinti. Ha az adatok
a teljes sokaságot jelentik, akkor a varianciát a
VARP függvénnyel kell kiszámítani.
A logikai értékeket, például IGAZ vagy HAMIS,
Előnye: valamint a szöveget a függvény figyelmen kívül
hagyja. Ha a logikai értékeket és a szöveget is
Csak az x és x négyzetet kell tárolni és összegezni számításba szeretnénk venni, használjuk a VARA
munkalapfüggvényt.

Excel függvény Szórások átlagolása


VARP(szám1;szám2;...)  A csoportok közös szórása
szám1, szám2...: A statisztikai sokaságot  Belső szórás
reprezentáló argumentumok, számuk 1
 Pooled szórás
és 30 között lehet.
Megjegyzés
A VARP az argumentumokat a teljes A SZÓRÁSOKAT NEM LEHET
statisztikai sokaságnak tekinti. Ha az adatok
a teljes sokaságnak csak mintáját képezik, ÁTLAGOLNI!
akkor a varianciát a VAR függvénnyel kell
kiszámítani.

Varianciák átlaga több mintából Szórások átlagolása

( n1  1) s12  ( n2  1) s22    ( nk  1) sk2


( n1  1) s  (n2  1) s    ( nk  1) s
2 2 2
ssúly 
2
ssúly  1 2 k
nk
nk

6
n1=n2=n3 Négyzetes átlag
n

ssúly 
(n1  1)( s12  s22  s32 ) x 2
i
3n1  3 Xq  i 1
n
( n1  1)( s12  s22  s32 ) Súlyozott
ssúly 
3(n1  1) k

fx i
2
i
Xq  i 1
s12  s22  s32 k
ssúly 
3 f i 1
i

Variációs együttható vagy relatív


Forgalom CV
szórás
 alkalmas eltérő jelenségek szórásának
összehasonlítására, s
 az eredményt %-ban fejezzük ki,
Vr  CV  100
0 – 10% homogén, x
10 – 20% közepesen változékony,
20 – 30% erősen változékony, 83 927
30% fölött szélsőségesen ingadozó, az átlag nem
alkalmas a sokaság jellemzésére. 100  142%
s 59 075
Vr  CV  100
x

Relatív variációs együttható


s
maximuma n
x
s x 100s
CVr (%)  100 
n x n

Értéke 0-100% lehet.

You might also like