Download as pptx, pdf, or txt
Download as pptx, pdf, or txt
You are on page 1of 26

Biometria-II.

előadás
Valószínűségi változók típusai és azok ábrázolása

Dr. Dergez Timea


Folyamatok a Biometriában

ADAT KÖVETKEZTET
adatelemzé
JELENSÉG kísérletek
(számolás, mérés,
minősítés)
s
ÉS

logikai Szakmai
ADAT= a véletlen valószínűségi változó értéke (orvosi)
Véletlen Valószínűségi Változók

 a valószínűségszámítás egyik legfontosabb fogalma


 lényegében olyan jelenségek matematikai megfogalmazására, modellezésére alkalmas,
melyek véletlentől függő értéket vesznek fel
 a statisztikai elemzések során a vizsgálati, vagy megfigyelési egységeket különböző
jellemzők mentén vizsgáljuk, adatokat gyűjtünk
 ezek a jellemzők általában vizsgálati egységről vizsgálati egységre változnak, ezért ezeket
statisztikai változóknak vagy valószínűségi változóknak nevezzük
Adatmátrix

Vizsgált Nem Iskolai Intelligencia Testmagasság


személy végzettség hányados (cm)
Személy 1 Férfi Alapfokú 98 190
Személy 2 Férfi Felsőfokú 122 176
Személy 3 Nő Középfokú 120 168
Személy 4 Nő Posztgraduális 140 165
Személy 5 Férfi Középfokú 110 170
Személy 6 Nő Alapfokú 101 165
Személy 7 Férfi Felsőfokú 118 179
Adatmátrix
A valószínűségi változók értékeiről beszélünk, és ezeket az értékeket
konvencionálisan számokkal reprezentáljuk.
Vizsgált Nem Iskolai Intelligencia Testmagasság
személy végzettség hányados (cm)
Személy 1 1 1 98 190
Személy 2 1 3 122 176
Személy 3 2 2 120 168
Személy 4 2 4 140 165
Személy 5 1 2 110 170
Személy 6 2 1 101 165
Személy 7 1 3 118 179
Valószínűségi változók típusai I.

 Számoknak számos különböző tulajdonsága van:


 Sorba rendezhetők
 Összegük (különbvségük) is értelmes
 Hányadosuk is értelmes
 A statisztikai változók megkülönböztethetők aszerint, hogy a fenti tulajdonságok közül
melyekkel rendelkeznek!
 Ez alapján négy ún. mérési skáláról beszélhetünk statisztikai változók esetén:
 Nominális skála
 Ordinális skála
 Intervallum skála
 Arány skála
Nominális skála
A változó a számok egyetlen tulajdonságával sem rendelkezik.

 Kit kedvel a leginkább a következő festők közül?


1. Salvador Dalí
2. Szinyei Merse Pál
3. Vincent Van Gogh
4. Leonardo Da Vinci
 Milyen cigarettát szív?
1. Marlboro
2. Sopiane
3. PallMall
4. Dunhill
Ordinális skála
A számok tulajdonságai közül rendelkezik a sorbarendezhetőséggel.

 Milyen az Ön legmagasabb iskolai végzettsége?


1. Alapfokú, vagy az sem
2. Középfokú
3. Felsőfokú
4. Posztgraduális

 Ordinális skála esetén igaz az, hogy 1<2<3<4


 DE: nem mondhatjuk, hogy: 2-1=4-3
Intervallum skála
Értékei sorba rendezhetők és összegük (különbségük) is értelmes.

 Intelligencia teszten elért pontszámok


 Sorba rendezhető: 99<100<101
 A különbségük értelmes: 75-70=120-115
 DE: az arányuk már nem értelmezhető:
NEM mondhatjuk, hogy a 90-es IQ a 180-as IQ fele
Arány skála
A változó értékei sorba rendezhetők, különbségük és arányuk is értelmes.

 Testmagasság
 Sorba rendezhető: 160<170<171
 A különbségük értelmes: 75-70=190-185
 Az arányuk is értelmes: 80 cm éppen 160 cm fele
Skála-típusok összefoglalása

Skála-típus Sorbarendezhető Különbség értelmes Arány értelmes


Nominális nem nem nem
Ordinális igen nem nem
Intervallum igen igen nem
Arány igen igen igen
Valószínűségi változók típusai II.
Attól függően, hogy számszerűsíthető-e egy adott változó két típust
különböztethetünk meg:
 Kvalitatív változó: bár a változó értékei számokká konvertálhatók, ám ezek a számok nem
rendelkeznek a számok egyetlen tulajdonságával sem (nominális skála) vagy csak
sorrendbe állíthatók (ordinális skála).
Pl.: hajszín, szemszín, biológiai nem, családi állapot, iskolai végzettség
 Kvantitatív változó: A változó értékei számszerűsíthetők.
Pl.: reakcióidő, testmagasság
Az alapján, hogy hány különböző értéket vehet fel egy adott kvantitatív változó két típust
különböztethetünk meg:
 Diszkrét változó: véges számú (diszkrét) különböző értéket vehet fel, és az értékek egymástól jól
elkülönülnek. Pl.: testvérek száma, hallgatók száma egy évfolyamon
 Folytonos változó: értékei folytonosan helyezkednek el, bármilyen értéket felvehet. Pl.: reakcióidő,
testmagasság
Valószínűségi változók ábrázolása

 Az összegyűjtött adatokat adatmátrixban rögzítjük, melyben jellemzően egy megfigyelési


egység (eset) egy sor, míg az egyes oszlopok egy-egy változót reprezentálnak.
 Minthogy azonban az ideális minta nagyszámú megfigyelési egységet tartalmaz, az
adatmátrix általában túlontúl terjedelmes ahhoz, hogy egyszerű megtekintés útján
megállapíthassuk az adatok lényeges tulajdonságait.
 Az adatok lényeges ismérveinek jellemzésére, leírására ún. leíró statisztikákat használunk.
Erre a célra használhatunk:
 • Grafikus módszereket
 • Az adatokból számolt összegző statisztikákat
Valószínűségi változók és ábrázolásuk
Kvalitatív valószínűségi változók esetén

 Egy változó jellemezhető azzal, hogy különböző értékei hányszor, milyen gyakran fordulnak elő az adott
mintában. A gyakorisági eloszlás éppen ezt, a változó értékeinek gyakoriságát fejezi ki. (n=520)

 Pl. Etnikai hovatartozás gyakoriság relatív gyakoriság százalék


1. Latin 135 0.26 26 %
2. Fehér 309 0.60 60 %
3. Ázsiai 5 0.01 1%
4. Afrikai 9 0.02 2%
5. Indián 9 0.02 2%
6. Multietnikai 13 0.03 3%
7. Egyéb 38 0.07 7%
Valószínűségi változók és ábrázolásuk
Kvalitatív valószínűségi változók esetén-oszlopdiagram vagy kördiagram
Valószínűségi változók és ábrázolásuk
Kvalitatív valószínűségi változók esetén-oszlopdiagram vagy kördiagram
Valószínűségi változók és ábrázolásuk
Kvantitatív/diszkrét valószínűségi változók esetén

 Egy gyógyszergyárban 24 napig regisztrálták, hogy 24 óra alatt hányszor történik


gépleállás.

Leállások száma Gyakoriság Relatív gyakoriság Százalék (%)


0 3 0,125 12,5
1 5 0,208 20,8
2 5 0,208 20,8
3 4 0,168 16,8
4 3 0,125 12,5
5 2 0,083 8,3
6 2 0,083 8,3
összesen: 24 1,000 100
Valószínűségi változók és ábrázolásuk
Kvantitatív/diszkrét valószínűségi változók esetén
Valószínűségi változók és ábrázolásuk
Kvantitatív/folytonos valószínűségi változók esetén
 Folytonos változók esetén az oszlopdiagram nem a megfelelő megoldás az adatok grafikus
megjelenítésére, mert a változónak túl nagyszámú értéke van, amelyek gyakorisága
meglehetősen kicsi lesz, még nagy minta esetén is.
 Pl. Páciensek vércukorszint (mmol/l) értékének mérése esetén.

4,67 4,97 5,67 5,78


5,11 5,67 9,89
5,33 6,22 10,08
6,50 7,00 5,16 4,65
5,44 5,44
10,11
8,49 6,50
10,67
Valószínűségi változók és ábrázolásuk
Kvantitatív/folytonos valószínűségi változók esetén
 Az értékeket intervallumokba soroljuk, és az egyes intervallumokba eső értékek gyakoriságára
koncentrálunk. Ha pl. a vércukorszint értékeket 4 intervallumba (4,00-6,00, 6,00-8,00, 8,00-10,00,
10,00-12,00) soroljuk, az alább látható hisztogramot kapjuk.
Valószínűségi változók és ábrázolásuk
Kvantitatív/folytonos valószínűségi változók esetén
 Az intervallumok száma (bizonyos határok között) önkényesen megválasztható, azonban a túl sok
vagy túl kevés intervallum sem jó, mivel az előbbi esetben nem tömörítjük kellőképpen az
információt, míg az utóbbi esetben pedig éppen fordítva, olyannyira tömörítjük, ami már
információvesztést okozhat.
Hogyan készíthetünk hisztogramot?
 A kategorizálás folyamatos, nem átfedő intervallumsorozat készítésével
történik, így minden mérési eredmény egy és csakis egy intervallumba esik.

 Az intervallumokat osztályintervallumok:
• Kiszámolhatjuk az intervallumok
számát a következő képletek
valamelyikével:

𝑘= 2 ,5 ⋅ √ 𝑁
4
Nagy minta (esetszám)
esetén (n>80)

𝑘
2 >𝑁
Ahol, ‚k’ a legkisebb olyan egész szám, amely az
Kis minta (esetszám)
egyenlőséget/egyenlőtlenséget igazzá teszi és is ‚n’
𝑘= √ 𝑁 esetén (n<80)
az összes adatszám.
 Terjedelem (R): távolság a legnagyobb és legkisebb érték között:

R=maximum-minimum

 Szélesség (W): az osztályintervallumok szélességét úgy határozzuk meg, hogy


elosztjuk a terjedelmet az intervallumok számával:
A sűrűségfüggvény
 Mint láttuk, a folytonos változók mintabeli eloszlását hisztogrammal
reprezentáljuk, de ha a folytonos változók populációbeli eloszlását
tekintjük, azt legjobban az ún. sűrűségfüggvénnyel lehet leírni.
 A sűrűségfüggvény jellemzői:
 X változó minden x értékéhez egy nem negatív számot rendel (ez a szám nagyobb
azon x-ek közelében, ahol az adatok jobban sűrűsödnek)
 Az egy-egy szakaszra eső terület a populáció ezen szakaszra eső arányát adja meg
(tetszőleges intervallum valószínűsége határozható meg )
 A sűrűségfüggvény alatti összterület 1, azaz 100%
 más néven eloszlásgörbének is nevezzük

Pl.: Normális eloszlás


sűrűségfüggvénye
Köszönöm a figyelmet!

You might also like