Download as pdf or txt
Download as pdf or txt
You are on page 1of 30

STATISZTIKAI ÍZELÍT AZ SPSS-EN KERESZTÜL

Szappanos Adrienn
Ajánlással Varga Gábornak,
köszönettel Singer Júliának.

A statisztikai következtetések

Mivel egy statisztikai számítás során egy mintából következtetünk a nagyobb populáció
tulajdonságaira, sosem lehetünk benne teljesen biztosak, hogy a mintából kimaradt értékek
nem cáfolnak rá állításainkra. A következtetések éppen ezért megfogalmazásukban mindig
tartalmaznak egy valószín ségi értéket, amely azt határozza meg, mennyire lehetünk
biztosak az állítás helyességében.

A statisztikai következtetések két fajtája a kvantitatív következtetés, más néven becslés


(estimation) és a kvalitatív következtetés, azaz a hipotézisvizsgálat. A gyakorlatban a
becsléseket többnyire megel zi egy hipotézisvizsgálat, mely egy el zetesen feltett kérdésre
ad egy igen/nem típusú választ. Ezt a kérdést nullhipotézis formájában közelítjük meg, ami
a kérdésre adott tagadó választ megfogalmazó állítás. Egy változóban feltételezett bármiféle
megváltozást, vagy több változó közötti különbséget vagy kapcsolatot mindig valamilyen
paraméter méri, melynek értéke nulla, amennyiben a változón belül nincs megváltozás,
illetve a több változó között nincs különbség vagy kapcsolat. Egy vizsgálat során feltesszük a
nullhipotézis helyességét, melyet meger sítve vagy megcáfolva fogadjuk el a tagadó, ill.
igenl választ az eredeti kérdésre. A hipotézisvizsgálat eszköze a statisztikai próba, melynek
során a minta összetételének és a kérdés jellegének megfelel en kiválasztott próbafüggvény
lehetséges értékeinek tartományát osztópontok segítségével két egymást nem fed
tartományra bontjuk, az elfogadási és az elutasítási tartományra, és a függvény kritikus
tartományba esésének valószín ségét jelöljük a próba szignifikancia-szintjével. El fordulhat,
hogy a nullhipotézissel szemben logikailag lehetséges két ellentétes alternatíva közül
szakmai megfontolások alapján csak az egyiket vesszük figyelembe, a másikra pedig úgy
tekintünk, hogy a kérdés szempontjából egyenérték a nullhipotézissel (pl. ha szorongás
csökkentésére alkalmas terápiát keresünk, a szorongás növekedésének lehet ségét kihagyjuk
a modellb l). Az ilyenformán lesz kített ellenhipotézist egyoldalú ellenhipotézisnek, azokat
a statisztikai próbákat pedig, amelyekben a nullhipotézissel szemben csak ilyen egyirányú
alternatívát állítunk, egyoldalú próbáknak nevezzük. A leggyakrabban alkalmazott
megoldás azonban az, ha a nullhipotézissel szemben mindkét alternatívát magában foglaló
ellenhipotézist fogalmazunk meg (kétoldalú statisztikai próbák). A nullhipotézis
indokolatlan elvetése az els fajta hiba (type I. error), míg ha egy értéket a nulla körüli
eloszláshoz tartozónak hiszünk, és nem vetjük el a nullhipotézist, pedig a paraméter értéke
nem nulla, az a hipotézisvizsgálat során elkövethet második fajta hiba (type II. error). A
szignifikancia-szint megválasztása tetsz leges, de leggyakrabban szokásos értéke 5% (p =

1.
0,05), ami azt jelenti, hogy ha a mintavételt végtelen sokszor végrehajtjuk, akkor száz esetb l
mindössze átlagosan ötször fordul el az, hogy a próbafüggvény minta alapján kiszámított
értéke a kritikus tartományba esik. Egy-egy kérdés felmerülésekor rendszerint többféle
statisztikai próba is szóba jöhet. Mindig meg kell vizsgálni, hogy a feladatban teljesülnek-e a
próba alkalmazhatósági feltételei, melyek a kísérlet bizonyos küls sajátosságaira, a
csoportok egymáshoz való viszonyára, egyes statisztikai jellemz kre (leggyakrabban a
szórásra), az adatok számára, vagy egyszer en csak magukra az adatokra vonatoznak (pl.
normális eloszlás).

A becslés legegyszer bb formája a pontbecslés, amikor a becsl függvény egyetlen értéket


rendel a mintához. Ennek legszokványosabb módja, ha az elméleti paramétert a megfelel
mintabeli statisztikai jellemz vel becsüljük: az elméleti átlagot a mintaátlaggal, az elméleti
szórást a mintabeli szórással, stb. Ezzel szemben az intervallumbecslés egy szakaszt jelöl ki a
számegyenesen, és csak annyit állít, hogy a keresett paraméter ezen a szakaszon belül
helyezkedik el. E megbízhatósági intervallum (confidence interval) kijelöléséhez a p
valószín ség megadása is társul, amit úgy kell értelmezni, hogy a kapott szakasz alsó és
fels határa akkora valószín séggel fogja közre a becsülni kívánt paramétert.

Egy hipotézisvizsgálat korrekt menete a következ :

1. kérdésfeltevés, mely tartalmazza azt is, hogy a feltételezett hatás (megváltozás,


különbség, kapcsolat) melyik változóra vonatkozik
2. a paraméter (ami a feltett kérdésre a legmegfelel bb módon adja a választ) és a
statisztikai próba (amivel a paramétert meg tudjuk közelíteni) kiválasztása
3. nullhipotézis megfogalmazása
4. szignifikancia-szint meghatározása
5. kísérleti terv (elemszám megállapítása, csoportok elkülönítése, stb.)
6. végrehajtási terv (vizsgálat menete, személyek kiválasztása, mérési körülmények
meghatározása, stb.)
7. adatgy jtés megfigyelés vagy mérés útján
8. számítások elvégzése
9. döntéshozatal, azaz a nullhipotézis megtartása vagy elvetése

Az adatbázis leírása

A felhasznált adatbázishoz 2002 telén jutottunk hozzá Óturai Gabriellával, annak a


vizsgálatnak a keretében, melyben az akkoriban induló, és igen hamar nagy népszer séget
szerz valóságshow-k nézésének motivációs tényez it térképeztük fel 11. és 12. évfolyamos
középiskolások körében. Egy el vizsgálatban megkértünk 53 diákot, fejtsék ki véleményüket

2.
a valóságshow-król, írják le, miért nézik, ill. miért nem nézik ket. Válaszaik alapján 12
motivációs csoportot láttunk elkülönülni:

1. szerepl k: a szerepl knek tulajdonított pozitív vagy negatív jellemvonások motiválják a


néz ket (szerep)
2. különleges helyzet: a szerepl k bezártsága, külvilágtól való elszakítottsága és életük 24
órán át történ nyomon követése (kulhey)
3. konfliktusok: a veszekedések, konfliktusok kibontakozása és megoldása (konfl)
4. kikapcsolódás: a valóságshow-k szórakoztató jellege (kikapcs)
5. újdonság: hazánkban ez a m faj eddig ismeretlen volt (ujdons)
6. valóságosság: a szappanoperákkal ellentétben itt a szerepl k hétköznapi emberek (nem
színészek), s a megjelen élethelyzetek is valóságosak (valos)
7. kényszer: f m sorid ben mindkét kereskedelmi TV-csatorna valóságshow-t sugároz;
ezen kívül a család, illetve lakótársak m sorpreferenciája is kényszerít leg hathat
(kenysz)
8. kukkolás: más emberek magánélete iránti intenzív érdekl dés (kukk)
9. paraszociális interakció: olyan egyoldalú kapcsolat, ami annak köszönhet , hogy
hajlamosak vagyunk ismeretségi körünk tagjának elfogadni olyan személyeket is, akik
csak a média közvetítésével jelennek meg környezetünkben (psi)
10. értékrend: a szerepl k és az egész m sor által közvetített értékek helyeslése (ertekr)
11. TV-függ ség: a m sor jellege irreleváns, a tévénézés, mint tevékenység a meghatározó
(tvfugg)
12. szociális nyomás: a m sor eseményei mindennapi beszédtémává válnak, s az ilyen
baráti beszélgetésekb l és esélylatolgatásokból kellemetlen dolog kimaradni (szocny)

Ezen motivációs tényez k mindegyikéhez kidolgoztunk négy kérdést, melyek közül kett
egyenes, kett fordított volt, amire a választ hatfokú skálán kellett megadni. Azért
választottuk akkor a hatos számot, mert úgy gondoltuk, ha páros számú lehet séget adunk
meg, ezzel kiküszöbölhetjük, hogy a vizsgálati személyek túlnyomórészt a középs értéket
válasszák, azonban azzal nem számoltunk, hogy ennek ellenére a diákok a hármas számot
jelölik abban az esetben, ha véleményük semleges. A 48 kérdést randomizált sorrendben
helyeztük el a kérd íven, és adatfeldolgozás során a fordított kérdésekre kapott válaszpontot
átkonvertáltuk egyenes érték re, így egyetlen motivációs tényez t jellemz négy darab szám
a személynek ebben a dimenzióban való intenzitását írja le.

Az egyes változók bemutatása

A változók típusa meghatározza, hogy a velük kapcsolatban megfogalmazott kérdések


megválaszolására milyen statisztikai eljárások alkalmasak. A változók értékskálájának négy
típusa létezik:

3.
1. nominális skála: nincs olyan értelmes szempont, amelynek alapján a változó értékei
sorrendbe helyezhet k (értelmes: x = y vagy x y), pl. nem, diagnózis.
2. ordinális skála: az értékek sorba rendezhet k (értelmes: x < y, x > y), pl. iskolai
végzettség, év végi érdemjegy.
3. intervallum-skála: az értékek sorba rendezhet k, és ezek azonos számszer különbségei
szakmailag azonos mérték különbséget jeleznek (értelmes: x–y, y–x), pl.
testh mérséklet, MAWI-IQ.
4. arányskála: a változó értékei sorba rendezhet k, és különbségeik mellett arányaik
azonos értékei is szakmailag azonosan értelmezhet mennyiségek (értelmes: x/y,
y/x), pl. testsúly, reakcióid .

A vizsgálati személyeket jellemz adatok:

1. iskola: a középiskola típusa (nominális változó: szakközépiskola vagy gimnázium)


2. nem (nominális változó: fiú vagy lány)
3. rsnezes: annak mértéke, hogy a személy milyen gyakran néz valóságshow-kat
(intervallum-skálaváltozó 1-t l 4-ig, ahol 1 = soha, 4 = hetente minimum három
alkalommal)

Eljárás SPSS-ben:
Analyze Descriptive Statistics Frequencies…
Statistics… Mean, Median, Mode, Minimum, Maximum
Charts… Bar charts

Statistics

ISKOLA NEM RSNEZES


N Valid 237 226 237
Missing 0 11 0
Mean 1,51 1,47 2,97
Median 2,00 1,00 3,00
Mode 2 1 4
Std. Deviation ,501 ,500 ,967
Range 1 1 3
Minimum 1 1 1
Maximum 2 2 4

Ebb l a táblázatból az olvasható ki, hogy a teljes minta létszáma (N) 237 személy, közülük 11
valamiért nem jelezte nemét a kérd íven. Az átlag (mean) az eloszlás (distribution) várható
értéke, aminek jelen esetben csak annyi szerepe van, hogy láthatjuk, a két bináris változó
(iskola és nem) értékei nagyjából azonos gyakorisággal szerepelnek, tehát az iskolatípusok és
a nemek aránya kiegyenlített. A medián (median) a nagyság szerint sorba állított adatok
közül a középs vel egyenl (páros számú adat esetén a két középs számtani közepével), a
módusz (mode) pedig az az érték, amelyikb l a legtöbb el fordul (azaz a gyakorisági eloszlás

4.
csúcsának megfelel érték). Ha egy minta eloszlása tökéletesen szimmetrikus, e három
paraméter értéke azonos, de mivel ilyen szinte soha nincs, a paraméterek egymáshoz való
viszonyából gyorsan kiolvashatunk bizonyos jellemz ket az adott változóról. A
valóságshow-k nézésének dimenziójában például a legstabilabb mutató, az átlag 3 felé
közelít, azaz a fiatalok túlnyomó része hetente egyszer-kétszer nézte a valóságshow-kat
2002-ben, a módusz 4-es eredményéb l pedig azt tudhatjuk meg, hogy a négyfokú skála
legmagasabb értékével válaszoltak leggyakrabban. Az átlag 2,97 tehát nagy valószín séggel
úgy alakult ki, hogy a rengeteg 4-es számú felelet mellett körülbelül ugyanennyi 2-es számú
fordult el , és 1-esek csak elvétve.

Egy változó skálatípusa meghatározza azt is, milyen középértéket értelmes számolni vele
kapcsolatban. Az átlag csak kvantitatív (intervallum- és arányskálájú) változók esetén
ajánlott, a medián kiszámításához viszont már elegend az is, ha a változó ordinális skálájú.
Végül a módusz esetében nincsen semmi korlátozás a skálatípusra vonatkozóan, hiszen
„tipikus érték” akár nominális változón belül is lehetséges.

Ezek a középértékek egyetlen számmal adják meg a változó adatainak nagyságát, de hogy ez
az érték mennyire alkalmas az összes adat jellemzésére, az attól függ, mekkora eltérések,
ingadozások fordulnak el benne. A szórás (standard deviation) annak mér száma, hogy az
egyes adatok milyen közel helyezkednek el az átlaghoz viszonyítva. A fenti példánál
maradva, a valóságshow-nézés mértékénél a 0,9-es szórásérték illeszkedik az egyes értékek
el fordulási gyakoriságairól említettekhez, miszerint a két legjellemz bb válasz a 2-es és 4-es
érték volt. A terjedelem (range) a szóródás legegyszer bb mér száma, ami a legkisebb
(minimum) és legnagyobb (maximum) adat különbsége. Ez jelen esetben nem mond semmi
újat, hanem inkább a végtelen terjedelm eloszlásoknál van információértéke.

A fenti számszer adatok értelmezését nagyban megkönnyíti, ha oszlopdiagramon


ábrázoljuk ket. Az oszlopdiagram kategoriális, míg a hisztogram normális eloszlású
skálaértékeknek tekinti az adatokat. A diagram jellemz inél érdemes az eredményeket
százalékos formában kérni, hogy ne kelljen minden adatot a minta elemszámához
viszonyítanunk.

ISKOLA NEM RSNEZES


60 60 50

50 50
40

40 40
30

30 30

20
20 20

10
10 10
Percent

Percent
Percent

0 0 0
szakkozepiskola gimnazium fiu lany 1 2 3 4

ISKOLA NEM RSNEZES

5.
A motivációs tényez ket feltáró változók skalárisak 1-t l 6-ig, neveik pedig a kategória
nevének rövidítéséb l és a kategóriához tartozó kérdés számából (1-4) állnak. A négy darab
hatféle értéket felvenni képes változó összegéb l létrehoztunk 12 olyan új változót, melyek
így egy 4-t l 24-ig tartó ad hoc skálán differenciáltabb számításokat tesznek lehet vé. (Eljárás
SPSS-ben: Transform Compute… pl. szerep = szerep_1 + szerep_2 + szerep_3 +
szerep_4).

Leíró statisztikát nem csak az Analyze Descriptive Statistics Frequencies… tud


nyújtani, hanem ugyanitt a Descriptives… is, ami kevesebb opcióval rendelkezik, viszont sok
azonos tulajdonságokkal rendelkez változó jellemzésénél könnyebben átlátható táblázatot
ad.

Descriptive Statistics

N Minimum Maximum Mean Std. Deviation


SZEREP 225 4 24 12,07 4,904
KULHEY 231 4 24 15,00 3,741
KONFL 232 4 24 15,44 4,003
UJDONS 232 4 24 14,74 5,613
KENYSZ 231 4 24 12,05 4,956
KUKK 227 4 24 12,96 4,507
PSI 227 4 24 13,36 3,866
ERTEKR 226 4 24 14,33 4,142
SZOCNY 232 4 24 14,41 3,679
KKAPCS 229 4 24 13,59 5,747
VALOS 222 4 24 11,70 4,344
TVFUGG 236 4 24 13,81 4,870
Valid N (listwise) 191

Mivel számos kvantitatív változókkal kapcsolatos statisztikai eljárás érvényességét csak a


változók normális eloszlása (normal distribution) esetén lehet garantálni, érdemes megnézni,
egyáltalán mely változók jöhetnek szóba e függvények lefuttatása esetén. A normális eloszlás
folytonos, egycsúcsú, szimmetrikus eloszlástípus, melyre egy olyan haranggörbe (vagy
Gauss-görbe) jellemz , aminek szárai mindkét irányban a végtelenbe nyúlnak, az x
tengelyhez azonban annyira közel, hogy nem is rajzolhatók. Ez annyit jelent, hogy a
maximum helyének megfelel értékt l távolabbra es adatok olyan ritkán fordulnak el ,
hogy azokra gyakorlatilag nem kell számítanunk. A normalitás sok esetben azért sérül, mert
az értékskálának van egy természetes alsó vagy fels korlátja, például pozitív mennyiségek
esetén a nulla minden esetben egy áthághatatlan alsó korlát. Az imént létrehozott 12 változó
értékei szintén a 4-es alsó és 24-es fels korlát közé vannak szorítva, de mivel jelen esetben
nem az adatbázisból levont érvényes következtetések megfogalmazása a cél, a statisztikai
próbákat ennek ellenére lefuttatjuk. J

6.
Eljárás SPSS-ben:
Analyze Descriptive Statistics Explore…
Plots… Normaliy plots with tests

Tests of Normality
a
Kolmogorov-Smirnov Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
SZEREP ,067 191 ,036 ,974 191 ,001
KULHEY ,066 191 ,043 ,989 191 ,128
KONFL ,073 191 ,014 ,985 191 ,037
KKAPCS ,084 191 ,002 ,963 191 ,000
UJDONS ,089 191 ,001 ,959 191 ,000
VALOS ,082 191 ,004 ,980 191 ,007
KENYSZ ,081 191 ,004 ,967 191 ,000
KUKK ,071 191 ,022 ,984 191 ,025
PSI ,067 191 ,037 ,991 191 ,248
ERTEKR ,094 191 ,000 ,983 191 ,018
TVFUGG ,079 191 ,006 ,983 191 ,020
SZOCNY ,102 191 ,000 ,984 191 ,026
a. Lilliefors Significance Correction

Általában a Kolmogorov-Smirnov eredményt vesszük figyelembe a 2000 minta-elemszám


feletti adatbázisok esetében, míg ha az N kevesebb, mint 2000 f , a Shapiro-Wilk értéket
nézzük. A normalitás-vizsgálat a Gauss-görbére való illeszkedés eltérését tekinti
nullhipotézisnek, tehát akkor tekinthet a változó normális eloszlásúnak, ha a
szignifikanciaszint 5%-nál nagyobb, azaz jelen esetben a ’különleges helyzet’ (kulhey) és a
paraszociális interakció (psi) mutatja ezt a mintázatot.

A t-próbák

Az egymintás t-próba (One-sample T-test) legtipikusabb alkalmazási területe az, amikor azt
vizsgáljuk, hogy egy kvantitatív változó értékszintje megváltozik-e két helyzet vagy id pont
között. Ez esetben a nullhipotézis az, hogy a változás mértéke nulla. A próba
alkalmazhatóságának feltétele mindössze annyi, hogy a szóban forgó változó normális
eloszlást mutasson. Az alábbiakban azt vizsgálom meg, a valóságshow-k nézésének mértéke
a mintán belül szignifikánsan eltér-e az 1-es értékt l, ami a kérd íven a „soha nem nézem”
választ képviselte.

Eljárás SPSS-ben:
Analyze Compare Means One-Sample T test…
Test Variable(s): rsnezes
Test Value: 1

7.
One-Sample Test

Test Value = 1
95% Confidence
Interval of the
Mean Difference
t df Sig. (2-tailed) Difference Lower Upper
RSNEZES 31,362 236 ,000 1,97 1,85 2,09

A t-próba a szignifikancia szintjét a szimmetrikus eloszlást alapul véve adja meg (2-tailed),
azaz ha a mi mintázatunk nem ilyen, akkor a kapott értéket el kell osztani kett vel (1-tailed).
Egy eloszlás akkor szimmetrikus, ha az x skálának van olyan szimmetriatengelye, amelyre
nézve a tengelyt l azonos távolságra lév x értékek ugyanakkora eséllyel fordulnak el . Az
átlagos eltérés (Mean Difference) azt adja meg, hogy a mintának ezen a változón belül
számított átlaga mennyivel tér el az elméleti értékt l (Test Value). Ez jelen esetben 1,97,
hiszen – mint azt el leg a leíró statisztika során láthattuk – a rsnezes változó átlaga 2,97. Az
elméleti értékt l való eltérés minimuma és maximuma 95%-os konfidencia-intervallum
mellett azt jelenti, hogy az elméleti értékt l való eltérés 95%-os eséllyel e két érték (lower és
upper) között található.

Kétmintás t-próba (Independent-Samples T-test vagy Paired-samples T-test) során kett ,


egymástól független csoport közötti különbséget vizsgálhatjuk egy kvantitatív változó
átlagának segítségével. Ezzel az a nullhipotézis tesztelhet , hogy a kérdéses változó átlaga
ugyanakkora a két csoport által képviselt populációban. A próba alkalmazásának feltétele a
normális eloszláson túl az, hogy a változó varianciája (szórásnégyzete) ugyanakkora legyen a
két összevetend csoportban (szóráshomogenitás feltétele). Ha a két mintában különböz
egyedekt l származó adatok vannak, és a két minta egymástól függetlenül lett kiválasztva,
akkor a két minta független egymástól (Independent-Samples), míg ha a két adatminta párok
szerint összetartozó adategyüttes, akkor a két minta összetartozó (Paired-samples). Ez
utóbbihoz úgy juthatunk, hogy egy vizsgálatot ugyanazokkal a személyekkel megismétlünk,
vagy a vizsgálati egyedeket egyidej leg két változóval jellemezzük. Ahhoz, hogy valóban a
feltett kérdésre kapjunk választ, a két összehasonlítandó csoportnak minden szempontból
egyformának kell lennie, azt az egyetlen szempontot leszámítva, aminek a különbséget
okozó hatását kutatjuk. A nemek közötti különbségek vizsgálata például a paraszociális
interakció (psi) változó mentén a következ képpen néz ki.

Eljárás SPSS-ben:
Analyze Compare Means Independent-Samples T test…
Test Variable(s): psi
Grouping Variable: nem

8.
(Összetartozó minták esetén csak a két változót kell megjelölni a ’Paired Variables’ ablakban,
pl. szívfrekvencia egy gyógyszer bevétele el tt és után. Az értelmezésre lehet séget adó
táblázat lényegesen nem különbözik a független mintás t-próba esetén kapott táblázattal.)

Independent Samples Test

Levene's Test for


Equality of Variances t-test for Equality of Means
95% Confidence
Interval of the
Mean Std. Error Difference
F Sig. t df Sig. (2-tailed) Difference Difference Lower Upper
PSI Equal variances
1,170 ,281 -1,667 214 ,097 -,87 ,524 -1,907 ,159
assumed
Equal variances
-1,660 206,625 ,099 -,87 ,527 -1,912 ,164
not assumed

A varianciák homogenitását a Levene-próba eredménye mutatja, melynek nullhipotézise


szerint a két minta szórása egyenl . Jelen esetben ez az érték nagyobb, mint 5%, azaz a
minták szórásnégyzete eltér egymástól, és ilyenkor a kapott eredményeket az ’Equal
variances not assumed’ sorban kell néznünk. Mivel itt már dönt jelent ség , hogy a psi
változó szimmetrikus eloszlást mutat-e (hiszen 0,099-et osztva kett vel éppen a
szignifikancia-határon belüli eredményt kapunk), a már korábban megismert Analyze
Descriptive Statistics Frequencies… segítségével ezt ellen rizhetjük. Ha ugyanis egy
változó szimmetrikus eloszlású, akkor elméleti átlaga pontosan a mediánjával egyenl .

Statistics PSI
14

PSI 12

N Valid 227 10
Missing 10
8
Mean 13,36
6
Median 13,00
Skewness ,062 4

Std. Error of Skewness ,162


Percent

Kurtosis -,134 0
4 6 8 10 12 14 16 18 20 22 24
Std. Error of Kurtosis ,322
PSI

Szintén az eloszlás szimmetrikus voltát fejezi ki a ferdeségi együttható (Skewness), melynek 0


értéke esetén állíthatjuk azt, hogy az eloszlás nem nyúlik el sem balra (negatív érték), sem
jobbra (pozitív érték). Mivel az átlag és a medián nem azonosak, és a ferdeségi együttható
sem egyenl nullával, a psi változó eloszlása az oszlopdiagramon látható szimmetrikusnak
mintázat ellenére asszimetrikusnak mondható. (A ’Kurtosis’ az eloszlás csúcsosságát
jellemzi, azaz, hogy a szélek milyen arányban fordulnak el az átlag körüli
középtartományhoz viszonyítva. A magas, pozitív csúcsossági együtthatóval rendelkez

9.
eloszlások hegyesek és hosszú szél ek, míg az alacsony, negatív érték ek lapos, kurta
mintázatot mutatnak.)

Mivel megállapításunk szerint a jelenleg vizsgált psi változó tehát nem mutat szimmetrikus
eloszlást, a 0,099-es szignifikancia-értéket felezve p < 5%, azaz felfedezhet a különbség a
paraszociális interakcióra való hajlandóság tekintetében a középiskolás lányok és fiúk között.
Hogy ennek az eltérésnek az irányáról is tudomást szerezzünk, az Analyze Descriptive
Statistics Explore… útvonalon nemek szerinti diagramot készíthetünk (Dependent List:
psi, Factor List: nem).

A piros rész maga az interpartilis 30

terjedelem, melyen belül a fekete csík a


mediánt mutatja. Az ábrán világosan 134

látszik, hogy a nemek közötti különbség 20


107
86
181

annak köszönhet , hogy a lányok adtak


magasabb pontszámokat azokra a
kérdésekre, melyek a paraszociális
10
interakció mutatójaként szolgáltak.
PSI

0
N= 113 103

fiu lany

NEM

Varianciaanalízis

Ha a független minták összehasonlítását az átlagok alapján végezzük el, a kétmintás t-próba


közvetlen általánosításaként jutunk a varianciaanalízis módszeréhez (Analysis of Variance,
ANOVA), ami ebben az esetben az egyszempontos, független vagy összetartozó mintás
ANOVA. Szempont alatt azt a csoportosító változót értjük, amely szerint a mintákat
megkülönböztetjük egymástól. Ugyanúgy, mint a kétmintás t-próba esetében, az
egyszempontos ANOVA érvényes alkalmazásának feltétele a normalitás és a
szóráshomogenitás. A nullhipotézis az, hogy a vizsgált kvantitatív változó átlaga
ugyanakkora az összevetend populációkban. Az alábbiakban a paraszociális interakció
mértékét vizsgálom a valóságshow-nézés mértékének függvényében egyszempontos
varianciaanalízissel.

Eljárás SPSS-ben:
Analyze General Linear Model Univariate…
Dependent Variable: psi
Fixed Factor(s): rsnezes

10.
(’Fixed Factor(s)’-ba a kategoriális változók, ezzel szemben a kvantitatív független
változók a ’Covariate(s)’ ablakba kerülnek.)
Model… Sum of squares: Type III
(’Type III’: nem súlyoz, ’Type II’: a csoport mérete szerint súlyoz, ’Type I’: az els
kiválasztott szempont után következ már csak az els kiegészít hatásait teszteli. Mivel
az ANOVA alapvet en átlagokkal számol, a csoportonkénti kiegyenlítetlen elemszámok
nem jelentenek eleve súlyozott feldolgozást. Különbségek akkor vannak, ha a
kiegyenlítetlen elemszámok egy változón belül fordulnak el .)

Tests of Between-Subjects Effects

Dependent Variable: PSI


Type III Sum
Source of Squares df Mean Square F Sig.
Corrected Model 482,513a 3 160,838 12,387 ,000
Intercept 16352,838 1 16352,838 1259,395 ,000
RSNEZES 482,513 3 160,838 12,387 ,000
Error 2895,584 223 12,985
Total 43876,000 227
Corrected Total 3378,097 226
a. R Squared = ,143 (Adjusted R Squared = ,131)

A ’Corrected Model’ sorban a teljes


szignifikancia-érték látható, ami, ha
Estimated Marginal Means of PSI
csupán egy változó mentén végezzük az 16

analízist, azonos ennek a változónak a


15
szignifikancia-szintjével. Az ’Intercept’
szignifikanciája azt mutatja meg, hogy ha 14
Estimated Marginal Means

a teljes adathalmazt átlagoljuk, az 13

különbözik-e a nullától. Az eredmények


12
szerint az aktuálisan vizsgált két változó
közötti szignifikáns kapcsolat lineáris 11

formát ölt, azaz minél intenzívebben 10

követi valaki valamelyik valóságshow soha hetente 1-2×


néha hetente 3-nál többsz
történetét, annál inkább hajlamos
RSNEZES
szerepl ivel paraszociális interakciót
kialakítani.

Ha a varianciaanalízis arra az eredményre vezet, hogy az átlagok nem különböznek


egymástól, nincs több dolgunk, szignifikáns esetben azonban további statisztikai elemzések
szükségesek az eredmények pontosításához. Már a kétmintás t-próba esetén is fontos volt
tudni, hogy az ellenhipotézis elutasítása milyen irányú minták közötti eltérésnek
köszönhet , kett nél több populációt összehasonlítva pedig jóval több a lehetséges

11.
ellenhipotézisek száma. A mintaátlagok páronkénti összehasonlításának sok különböz
módszere létezik, melyek közül a legismertebb Scheffé módszere, aminek azonban igen kicsi az
ereje, és emiatt a létez elméleti különbségek kimutatásához viszonylag nagy mintákra van
szükség (konzervatív próba). Ugyanez igaz az LSD és a Bonferroni módszerre is. Hasonló
érvényesség , de jelent sen nagyobb erej a Tukey-féle eljárás, melynek érvényességéhez a
Scheffé módszerhez hasonlóan szükség van a normalitás és a szóráshomogenitás feltételére.
Ha ez utóbbi nem teljesül, a statisztikán egy kis korrekciót végrehajtva jutunk a Games-
Howell-féle páros összehasonlítás módszeréhez. Amennyiben a minták között van egy ún.
kontrollminta, melynek átlagát össze akarjuk hasonlítani a többi minta átlagával, ezt az
együttes összehasonlítást a Dunnett-próba segítségével tehetjük meg, ami nem végez el
minden lehetséges összevetést, csak a kijelölt kontrollcsoporttal párosítva a többit. A Duncan-
próba arra a kérdésre keresi a választ, hogy mely populációk egyformák, azaz homogén
csoportokra bontja a mintát.

Eljárás SPSS-ben:
Analyze General Linear Model Univariate…
Dependent Variable: psi
Fixed Factor(s): rsnezes
Post Hoc… Games-Howell

Multiple Comparisons

Dependent Variable: PSI


Games-Howell

Mean
Difference 95% Confidence Interval
(I) RSNEZES (J) RSNEZES (I-J) Std. Error Sig. Lower Bound Upper Bound
soha néha -1,28 1,336 ,777 -5,35 2,80
hetente 1-2× -3,11 1,359 ,161 -7,21 ,99
hetente 3-nál többször -4,37* 1,307 ,035 -8,42 -,31
néha soha 1,28 1,336 ,777 -2,80 5,35
hetente 1-2× -1,83* ,677 ,039 -3,60 -,07
hetente 3-nál többször -3,09* ,566 ,000 -4,56 -1,62
hetente 1-2× soha 3,11 1,359 ,161 -,99 7,21
néha 1,83* ,677 ,039 ,07 3,60
hetente 3-nál többször -1,26 ,620 ,184 -2,88 ,36
hetente 3-nál többször soha 4,37* 1,307 ,035 ,31 8,42
néha 3,09* ,566 ,000 1,62 4,56
hetente 1-2× 1,26 ,620 ,184 -,36 2,88
Based on observed means.
*. The mean difference is significant at the ,05 level.

12.
A ’Mean Difference’ az egyes csoportok átlagainak eltérése irányát és mértékét mutatja,
csillaggal jelölve a szignifikáns különbségeket, melynek pontos értéke két oszloppal arrébb is
látható.

Eljárás SPSS-ben:
Analyze General Linear Model Univariate…
Dependent Variable: psi
Fixed Factor(s): rsnezes
Post Hoc… Duncan
(annak ellenére, hogy a Duncan-próba feltételei között is szerepel a szóráhomogenitás)

PSI
a,b,c
Duncan
Subset
RSNEZES N 1 2 3
soha 9 10,44
néha 75 11,72 11,72
hetente 1-2× 47 13,55 13,55
hetente 3-nál többször 96 14,81
Sig. ,207 ,070 ,212
Means for groups in homogeneous subsets are displayed.
Based on Type III Sum of Squares
The error term is Mean Square(Error) = 12,985.
a. Uses Harmonic Mean Sample Size = 25,618.
b. The group sizes are unequal. The harmonic mean of the group
sizes is used. Type I error levels are not guaranteed.
c. Alpha = ,05.

A ’Subset’ alatti oszlopok az rsnezes változó egyes csoportjainak átlagait tartalmazza,


összevetve a vele szomszédos csoport átlagával, mely összehasonlításnak a szignifikancia-
értéke a legalsó sorban látható. Ha ezt a táblázatot összevetjük a Games-Howell-féle eljárás
eredményeivel, az t nik szembe, hogy a „néha” és „hetente 1-2×” választ adó populációk
közötti eltérést a Duncan-próbával ellentétben (p = 0,070) a Games-Howell módszer
szignifikánsnak ítélte (p = 0,039), ami éppen a már korábban említett szóráshomogenitás
feltételének hiánya miatti korrekcióból fakad.

További szempontként bevonva a számításba a nem változót eljutunk a többszempontos


varianciaanalízis m veletéhez, mely lehet vé teszi, hogy egyidej leg egynél több tényez
hatását is megvizsgálhassuk a kérdéses változó nagyságszintjére. Ez az elemzési mód
reálisabb eredményeket szolgáltathat, mint az egyszempontos ANOVA, mert a valóságban a
különböz hatótényez k rendszerint nem elszigetelten, egymástól függetlenül, hanem
együttm ködve fejtik ki hatásukat a függ változóra.

13.
Eljárás SPSS-ben:
Analyze General Linear Model Univariate…
Dependent Variable: psi
Fixed Factor(s): rsnezes, nem
Model… Sum of squares: Type I

Tests of Between-Subjects Effects

Dependent Variable: PSI


Type I Sum
Source of Squares df Mean Square F Sig.
Corrected Model 564,578a 7 80,654 6,339 ,000
Intercept 38320,042 1 38320,042 3011,875 ,000
RSNEZES 495,592 3 165,197 12,984 ,000
NEM 32,157 1 32,157 2,527 ,113
RSNEZES * NEM 36,829 3 12,276 ,965 ,410
Error 2646,381 208 12,723
Total 41531,000 216
Corrected Total 3210,958 215
a. R Squared = ,176 (Adjusted R Squared = ,148)

Egy-egy szempont önálló hatását f hatásnak nevezzük, ami azt mutatja meg, hogy a vizsgált
változó átlaga ugyanakkora-e az adott szempont egyes szintjein. Mint az el bb az
egyszempontos varianciaanalízis során már kiderült, a valóságshow-nézés mértéke
befolyással van a paraszociális interakcióra, ezzel szemben a nemi hatás itt nem éri el a
szignifikáns szintet, ellentétben a független mintás t-próba során kapott eredményekkel. Ez a
különbség olyankor fordulhat el , ha a két szempont metszeteiben túl nagy eltérés van az
elemszámok között, és ilyen esetben a varianciaanalízissel számolt f hatások nem
vizsgálhatók egymástól függetlenül. Két szempont interakciója (más néven kereszthatás) azt
jelenti, hogy ha rögzítjük az egyik független változó értékét, akkor a másik független változó
mentén másképpen viselkedik a függ változó, mintha ezt az értéket másképpen
rögzítenénk (rsnezes * nem). Ez nem azt jelenti, hogy a két szempont egymással kapcsolatban
van, hanem azt, hogy együttes hatásuk a függ változó átlagára nem írható fel egyedi
hatásuk sima összegeként (azaz a kombinált hatás nem additív). Interakció jelenlétér l az
tanúskodik, ha a kapott diagramon a szempontokat reprezentáló egyenesek nem
párhuzamosak egymással. El leg a t-próba során csak annyit tudhattunk meg, hogy a
lányok hajlamosabbak paraszociális interakció kialakítására, de itt az is kit nik, hogy ez a
tendencia csak azokra az esetekre érvényes, amikor figyelemmel kísérik a valóságshow-kat,
mivel az rsnezes változó legalsó szintjén (soha) a helyzet megfordul. Ez interpretálható
lehetne úgy is, hogy alapvet en a fiúk hajlamosabbak a paraszociális interakcióra, de ebben
az új televíziós m fajban mégis a lányok alakítanak ki efféle kapcsolatot a show szerepl ivel.
Az interakció szignifikancia-szintje viszont több, mint 5%, ami feltehet leg a „soha” válaszok

14.
igen csekély számának köszönhet , azaz ilyen messzemen következtetésekbe nem
bocsátkozhatunk.

Estimated Marginal Means of PSI


16

15

14 Between-Subjects Factors
Estimated Marginal Means

13 Value Label N
RSNEZES 1 soha 9
12
2 néha 72
11 NEM 3 hetente
45
1-2×
10 fiu 4 hetente
9 lany
3-nál 90
soha hetente 1-2× többször
néha hetente 3-nál többsz NEM 1 fiu 113
RSNEZES
2 lany 103

Nemparaméteres eljárások

Azokat a statisztikai próbákat, melyek alkalmazása csak folytonos változók által


meghatározott, el írt eloszlású minta esetén lehetséges, paraméteres eljárásoknak nevezzük,
míg a nemparaméteresek azok, amelyek bármely eloszlású minta esetén alkalmazhatók, és a
vizsgált változók is felvehetnek diszkrét értékeket. A nemparaméteres próbák nagy része a
rangsoroláson alapul. Ezek a próbák az adatok tényleges számértéke helyett csak azok
egymáshoz viszonyított nagyságrendjét veszik figyelembe. A rangsoroláson alapuló próbák
még olyan típusú adatokra is alkalmazhatók, amelyeknek az értékeit nem lehet pontos
számmal jellemezni, csak bizonyos rendezett kategóriákkal (nominális és ordinális skálán
mért adatok).

Két összetartozó minta közötti összefüggések vizsgálatára alkalmas az el jelpróba és a


Wilcoxonn-féle eljárás, melyek nullhipotézise az, hogy a két minta eloszlása megegyezik. Az
el jelpróba elvégzéséhez el ször képezzük a két minta különbségét, majd megszámoljuk a
negatív és a pozitív különbségek számát (a nullákat kihagyva). Ha az eredeti két változó
azonos eloszlású, akkor körülbelül azonos számú negatív és pozitív különbséget kapunk. Az
el jelpróbát egyszer sége miatt általában gyors tájékozódás céljára használják. A Wilcoxon-
féle el jeles rangpróba nem csak az el jeleket, hanem a különbségek közötti nagyságrendeket is
figyelembe veszi, így nagyobb erej , mint az el jelpróba. Az el jelpróbával szemben ennél a
próbánál feltétel, hogy a különbség-eloszlás szimmetrikus legyen. Végrehajtása során a
mintaelemek közötti különbségeket rangsoroljuk az el jelekt l függetlenül (az esetleges
nullákat itt is kihagyva) oly módon, hogy az adatsort nagyság szerint sorba rendezzük, és a

15.
legkisebbnek adjuk az 1-es rangszámot, a következ nek a 2-est, stb. Összesen N rangszámot
osztunk ki, és egyenl adatok esetén is egyre növekv rangszámot adunk, majd az egyenl
adatokhoz tartozó rangszámokat utólag korrigáljuk a megfelel rangszámok átlagával (a
korrigált rangszámokat kapcsolt rangszámoknak nevezzük), és ezután külön összeadjuk a
pozitív vagy a negatív különbségekhez tartozó rangszámokat (s t, elég csak az egyiket). Ha
igaz a nullhipotézis, és a két sokaság azonos eloszlású, akkor a pozitív és a negatív
különbségekhez tartozó rangszámösszegek körülbelül egyformák lesznek. Minél nagyobb az
eltérés a két minta között, annál nagyobb lesz az eltérés a két rangszámösszeg között is.

Eljárás SPSS-ben:
Analyze Nonparametric Tests 2 Related Samples…
Test Type: Sign (el jelpróba), Wilcoxon

Megkülönböztetésül az összetartozó adatok kiértékelésére szolgáló Wilcoxon-féle el jeles


rangpróbától, a független minták összehasonlítására szolgáló eljárás a Mann-Whitney próba. A
módszer során a két mintát együtt rangsoroljuk, vagyis csoporttól függetlenül készítjük el a
rangszámokat (egyenl adatok esetén itt is korrigálunk a rangszámok átlagával), végül
csoportonként külön-külön összeadjuk a rangszámokat (elég az egyiket, pl. a kisebb
elemszámú csoportét). Ha igaz a nullhipotézis, a két rangszámösszeg közel egyforma lesz, és
minél nagyobb a két rangszámösszeg közötti eltérés, annál inkább gondolhatunk arra, hogy
az egyik populációban eleve nagyobb értékek vannak, mint a másikban.

Eljárás SPSS-ben:
Analyze Nonparametric Tests 2 Independent Samples…
Test Type: Mann-Whitney U

Test Statisticsa

PSI
Ranks Mann-Whitney U 4853,500
NEM N Mean Rank Sum of Ranks Wilcoxon W 11294,500
PSI fiu 113 99,95 11294,50 Z -2,113
lany 103 117,88 12141,50 Asymp. Sig. (2-tailed) ,035
Total 216 a. Grouping Variable: NEM

A ’Ranks’ táblázat utolsó oszlopa azokat a rangszámösszegeket mutatja, melyeket


felhasználva a próba a két csoport közötti eltérés mértékét méri fel. Mivel a Mann-Whitney
módszer tulajdonképpen a független mintás t-próbának a nemparaméteres megfelel je,
várható volt az eredmény, miszerint a paraszociális interakcióra való hajlandóság
tekintetében különbséget fogunk kapni a fiúk és a lányok között (p = 0,035).

Több csoport is képezhet összetartozó mintát, és ilyenkor nem helyes a fentebb ismertetett
Wilcoxon-próbát páronként alkalmazni, hanem helyette a Friedman próba áll rendelkezésre,

16.
melynek nullhipotézise szerint a több összetartozó minta ugyanazon populációból
származik. Az eljárás során az adatokat egyedenként rangsoroljuk, 1-t l t-ig (ahol t az
ismételt mérések száma), majd a kapott rangszámokat mérésenként összeadjuk (az összeg
jele Ri, ahol i = 1,… t). Ha egyes ismételt mérések között nincs különbség, akkor csak a
véletlent l függ, hogy melyik rangszám melyik ismétléshez kerül, következésképpen a
rangszámösszegek is körülbelül egyformák, és a Friedman próba ett l az egyformaságtól
való eltérést teszteli.

Eljárás SPSS-ben:
Analyze Nonparametric Tests K Related Samples…
Test Type: Friedman

Az egyszempontos varianciaanalízis nemparaméteres megfelel módszere a Kruskal-Wallis


próba, melynek végrehajtása hasonló a Mann-Whitney U próbához, s t, két független csoport
esetén mindkét módszer azonos eredményt ad. A mintákat együtt rangsoroljuk, vagyis
csoporttól függetlenül készítjük el a rangszámokat (egyenl adatok esetén korrigálunk a
rangszámok átlagával), végül ezeket csoportonként külön-külön összeadjuk. Az
eredményképpen kapott szignifikancia-érték alapján csak annyit tudunk megállapítani, van-
e a csoportok között a többit l eltér , de további elemzésekre az egyszempontos ANOVA-
hoz hasonlóan ezután is lehet ség nyílik.

Eljárás SPSS-ben:
Analyze Nonparametric Tests K Independent Samples…
Test Type: Kruskal-Wallis H

Ranks Test Statisticsa,b

RSNEZES N Mean Rank PSI


PSI soha Chi-Square 31,545
9 71,33
néha df 3
75 85,22
Asymp. Sig. ,000
hetente 1-2× 47 119,02
hetente 3-nál többször 96 138,03 a. Kruskal Wallis Test
Total 227 b. Grouping Variable: RSNEZES

A ’Ranks’ táblázat utolsó oszlopa a rangszámok átlagait mutatja, melyekb l a Kruskal-Wallis


próba azt az eredményt állapította meg (az ugyanezekb l az adatokból számolt
egyszempontos varianciaanalízis végeredményével összhangban), hogy a két változó közötti
szignifikáns különbség van (azaz minél intenzívebben követi valaki valamelyik valóságshow
történetét, annál inkább hajlamos szerepl ivel paraszociális interakciót kialakítani).

17.
Reliabilitás-elemzés

A reliabilitás (megbízhatóság) az ismételt mérések konzisztenciáját jelenti, azaz ha egy


vizsgálatot magas fokú reliabilitás jellemez, akkor az következetességr l és
megismételhet ségr l tanúskodik. Ennek vizsgálata olyan elemzés, melybe tételek egy
csoportját vonjuk be abból a célból, hogy meghatározzuk, milyen azok egymáshoz való
viszonya. Amikor egy mér eszköz skálájának reliabilitására vagyunk kíváncsiak, akkor azt
szeretnénk megtudni, hogy a skálát alkotó tételek hasonló dolgot mérnek-e. Egy új
mér eszköz elkészítésénél ez az egyik legfontosabb pszichometriai tulajdonság, hiszen egy
új teszt esetében kíváncsiak vagyunk arra, hogy az elméleti vagy empirikus alapokon egy
skálába válogatott tételek valóban egy skálába tartoznak-e. A reliabilitás vizsgálatának több
lehetséges módja létezik, melyek közül a Cronbach-alfa értékkel számolt variáció úgy méri a
bels konzisztenciát, hogy a kérd ívben szerepl itemek között számol korrelációt. Ilyen
úton ellen rizhet az, hogy az el zetesen kialakított motivációs csoportok megbízhatóak-e,
vagyis azok a kérdések, melyeket egy-egy motivációs tényez köré kvázi önkényesen
szerkesztettünk, valóban ugyanazt az egy összetev t mérik-e.

Eljárás SPSS-ben:
Analyze Scale Reliability Analysis…
Items: a 12 db motivációs tényez höz tartozó 4 kérdés válaszaiból alkotott változó
minden tényez esetében külön-külön számítva (tehát összesen 12 db reliabilitás-
vizsgálat)
Model: Alpha
Statistics… Descriptives for ’Scale if item deleted’

Az eredményt a 12 motivációs tényez közül nézzük meg azt a négy kérdést a vizsgálat alá
helyezve, melyek azt voltak hivatottak felmérni, hogy a valamely valóságshow nyomon
követését mennyire motiválja az, hogy ez a m faj eddig hazánkban ismeretlen volt (ujdons).

R E L I A B I L I T Y A N A L Y S I S - S C A L E (A L P H A)

Item-total Statistics

Scale Scale Corrected


Mean Variance Item- Alpha
if Item if Item Total if Item
Deleted Deleted Correlation Deleted

UJDONS_1 10,4461 21,3250 ,4517 ,8039


UJDONS_2 11,3793 18,1499 ,6539 ,7065
UJDONS_3 10,8039 18,3824 ,6391 ,7144
UJDONS_4 11,5884 18,0257 ,6476 ,7095

18.
Reliability Coefficients
N of Cases = 232,0 N of Items = 4
Alpha = ,7885

Maga az ’Alpha’ érték a mutatója annak, hogy a tanulmányozott négy kérdés összességében
mennyire korrelált egymással ( = (N × ) / (1 + (N - 1) × ), ahol az itemek közötti
korreláció átlaga), az ’Alpha if Item Deleted’ pedig azt mutatja, hogy ha az adott itemet
törölnénk, akkor a skála -koefficiense hogyan változna. Egy kérdéscsoportot akkor
tekinthetünk érvényesnek, ha a bel lük kapott -érték nagyobb, mint 0,7, tehát jelen
példában a m faj újdonságának hatását a hozzá alkotott kérdések megbízhatóan leírják
(’ujdons 1’: „Ezek a m sorok semmiben sem hoztak újat, hiszen ugyanezt látjuk a
szappanoperákban is.” (fordított item); ’ujdons 2’: „Érdekesnek találom a valóságshow-kat,
mert eddig ilyen nálunk még nem volt.”; ’ujdons 3’: „Magyarországnak semmi szüksége
ilyen m sorokra.” (fordított item); ’ujdons 4’: „Ideje volt már, hogy ez a m faj a hazai
néz közönséghez is eljusson.”). Mindemellett az is kiderül, hogy a megfogalmazott négy
item közül az els (’ujdons 1’) mondható legkevésbé reliabilisnek, hiszen ha ezt nem
vennénk bele az analízisbe, az -érték még magasabb lenne (0,8039).

Regresszióanalízis

A kétváltozós minták egy kétváltozós pontdiagram segítségével ábrázolhatók, melyr l


leolvasható, hogy a kett között milyen jelleg kapcsolat van. Ennek legegyszer bb formája
a lineáris kapcsolati típus, amikor az összefüggést egy egyenes írja le. A lineáris regresszió f
kérdése, hogy mi az a lineáris függvény segítségével megadható szabály, amellyel az egyik
változó (x) értékét megismerve el rejelzést tehetünk egy másik változó (y) értékére
vonatkozóan (regressziós függvény). A lineáris regresszióanalízis az a statisztikai eljárás,
amellyel megtalálhatjuk a pontdiagram pontjaira legjobban illeszked egyenest. Azt, hogy ez
az el rejelzés mennyire jó, a determinációs együtthatónak nevezett mér számmal fejezzük ki. A
korrelációs együttható azt mutatja meg, hogy két kvantitatív változó között milyen szoros
lineáris kapcsolat van. A korrelációs együttható csak -1 és +1 közötti értéket vehet fel,
melynek el jele a kapcsolat irányát, abszolút értéke pedig a kapcsolat szorosságát jellemzi. A
valóságban azonban ritkán lehet két változó kapcsolatát elszigetelten vizsgálni, általában
ezek mellett vagy mögött vannak még egyéb tényez k is, melyek hatnak x vagy y változóra,
és ezáltal a kettejük kapcsolatára. A parciális korrelációs együttható olyan mér szám, amely
megmutatja, mekkora lenne az x és y közötti lineáris korreláció, ha a többi háttértényez t
állandó szinten tartanánk, tehát nem engednénk, hogy hassanak a vizsgált változókra.

Mivel a pontokra legjobban illeszked egyenest arra akarjuk használni, hogy x-b l y-ra
következtessünk, a legjobb egyenes az lesz, amellyel az el rejelzés hibája a legkisebb.
Minden egyes személyhez tartozik egy (x, y) adatpár, ami az i–edik személy esetében (xi, yi),
ahol yi az xi-hez tartozó valódi y-érték. Ugyanehhez az xi-hez az egyenes segítségével

19.
bejósolt y-értéket jelöli a i. Ha a jósló lineáris függvény alakja y = a + bx, akkor az xi-hez
bejósolt y-érték i = a + bxi. Ennél a személynél az adott egyenessel való jóslás ei-vel jelölt
hibája a valódi és a jósolt érték különbsége, azaz ei = yi - i. A teljes mintára vonatkozó hiba
lehetne például a személyenkénti hibák abszolút értékének átlaga (átlag abszolút eltérése), de
ehelyett a matematikai statisztikában ezt a személyenkénti ei hibák négyzetének átlagával
mérjük, és a szóban forgó egyenessel történ becslés reziduális vagy maradék hibájának
nevezzük (Res). A regressziós egyenes meghatározásának ezt a módját, mellyel az ei becslési
hibák négyzetösszegét minimalizáljuk, a legkisebb négyzetek módszerén alapuló
regressziónak nevezik.

A regressziós becslés jóságának mérésére a jósolt és a valódi y érték varianciájának


hányadosa használható, melyet az y változó x-re vonatkozó elméleti lineáris determinációs
együtthatójának nevezünk (tehát Det(y,x) = Var( ) / Var(y)). (Mivel Var( ) = Var(y) – Res, ha
Res = 0, akkor Det(y,x) = 1, azaz y-t teljes mértékben x határozza meg, ellenben Det(y,x) = 0
csak akkor teljesülhet, ha Res = Var(y), azaz, amikor x nem tartalmaz semmiféle lineáris
jelleg információt y-re nézve.) Az „y változó x-t l való meghatározottsága” azonban
félreérthet megfogalmazás, mert a korrelációhoz hasonlóan a regresszió sem feltételez
egymástól való függést, csak együttjárást.

Eljárás SPSS-ben:
Analyze Regression Linear…
Dependent Variable: psi
Independent(s): a többi 11 db 24-érték változó
Method: Stepwise
(Csak azokat a független változókat lépteti be az elemzésbe, melyeknek önálló prediktív
értékük van a függ változóra nézve, és ezt lépésenként teszi, ami által kiderül, a
bekerültek közül melyik a leginformatívabb független változó a függ változóra nézve.)
Plots… Y: *RESID, X: DEPENDENT (a reziduálisok grafikus vizsgálata)

Model Summarye

Adjusted Std. Error of


Model R R Square R Square the Estimate
1 ,508a ,258 ,254 3,353
2 ,567 b ,322 ,315 3,214
3 ,596c ,355 ,345 3,142
4 ,609 d ,370 ,357 3,113
a. Predictors: (Constant), SZEREP
b. Predictors: (Constant), SZEREP, ERTEKR
c. Predictors: (Constant), SZEREP, ERTEKR, KKAPCS
d. Predictors: (Constant), SZEREP, ERTEKR, KKAPCS,
VALOS
e. Dependent Variable: PSI

20.
A számításba vett tizenegy változó közül csupán négynek van önálló prediktív értéke a
paraszociális interakció mértékére (psi), és ezek közül a szerepl knek tulajdonított pozitív
vagy negatív jellemvonásokat jellemz változó a leginformatívabb, mely önmagában a
variancia 25%-át magyarázza (azaz a szerep változó ennyivel csökkenti a hibát az induló psi-
varianciához képest). A másik három változónak már nincs nagy szerepe, ezek együttesen
10%-ot magyaráznak a szerep 25%-án túl. Az ’Adjusted R Square’ a korrigált tapasztalati
variancia, ami az ’R Square’-b l számított, torzítatlanabb érték. A kett különbsége
mindössze annyi, hogy a mintabeli variancia képletének nevez jében (Var = Q/n) n helyett
n–1-gyel osztunk annak érdekében, hogy kisebb számmal osztva jobb becslést adjon a
populációra nézve. Persze ha nagy mintával dolgozunk, e kett között nincs nagy különbség,
de kis minta esetén nagy lehet az eltérés. A ’Standard Error of the Estimate’ szintén a
regressziós egyenes illeszkedését jelzi, hiszen ez a reziduálisok szórását jelenti. Minél
nagyobb az értéke, annál inkább számíthatunk olyan adatokra a független változóban,
amelyek igen messze esnek a regressziós egyenes által becsült értékt l. A szerep változó
esetében ez az érték 3,3, azaz a 24 értéket felvenni képes változón belül 3,3 egységnyi
pontossággal tudom megbecsülni az erre adott válasz-pontszámot.

Coefficientsa

Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 8,603 ,651 13,207 ,000
SZEREP ,406 ,050 ,508 8,104 ,000
2 (Constant) 13,888 1,401 9,912 ,000
SZEREP ,286 ,056 ,358 5,136 ,000
ERTEKR -,271 ,064 -,294 -4,213 ,000
3 (Constant) 12,288 1,463 8,399 ,000
SZEREP ,178 ,065 ,223 2,752 ,007
ERTEKR -,228 ,064 -,248 -3,547 ,000
KKAPCS ,168 ,054 ,246 3,115 ,002
4 (Constant) 10,957 1,581 6,929 ,000
SZEREP ,159 ,065 ,199 2,464 ,015
ERTEKR -,201 ,065 -,218 -3,088 ,002
KKAPCS ,140 ,055 ,205 2,539 ,012
VALOS ,133 ,063 ,146 2,108 ,036
a. Dependent Variable: PSI

A ’Coefficients’ táblázatban a regressziós egyenes paramétereit találjuk meg, azaz a


konstanst és a meredekséget jelz értéket (hiszen a függvény alakja y = a + bx). A szerep
változó esetében az a konstans értéke 8,603, míg a b értéke 0,406, azaz a regressziós egyenes
egyenlete = 8,603 + 0,406 × szerep. A Beta-súly a standardizált regressziós együttható,
melynek abszolút értéke a független változó prediktív értékét képviseli, iránya pedig azonos
a b érték irányával, azaz azt jelzi, hogy a két változó között fennálló kapcsolat pozitív vagy
negatív.

21.
Faktoranalízis

A faktoranalízis olyan adatredukciós eljárás, amellyel az egymással lineáris összefüggésben


lév változók közös lényegét kifejez faktorok tárhatók fel. Az elemzés azt feltételezi, hogy a
változók hátterében olyan nem mérhet , latens struktúrák állnak, melyeket e módszerrel
kiragadva kis információveszteséggel leírható az adathalmaz. Erre akkor van szükség,
amikor meg akarunk bizonyosodni arról, hogy a mintában kapott válaszokból kibontható
latens struktúra illeszkedik az elemi, mért változókra. Az analízis során kapott faktorok
száma lényegesen kevesebb, mint az eredeti változóké, és ha ezekkel szeretnénk dolgozni,
tudnunk kell, jogunk van-e az adatredukcióra, azaz a mért változók ugyanúgy viselkednek-
e, mint a latens változók. A két csoport illeszkedését két korrelációs mátrix
összehasonlításával mérjük, melyek egyformaságának megítélésére kiválóan alkalmas a 2

(khí-négyzet) próba. A faktoranalízisnek ez a variációja exploratív jelleg , hiszen sok mért


változóból kevés aggregált változót hoz létre, míg a konfirmatív (modelltartó) elemzés egy
el zetes hipotézis (korábban talált faktorok) tesztelésére alkalmas.

Eljárás SPSS-ben:
Analyze Data Reduction Factor…
Variables: a motivációs tényez ket reprezentáló 12 változó
Extraction… Maximum likelihood
(A legnagyobb valószín ség korrelációs mátrixot adja meg, viszont ezáltal a változók
egyedi információtartalma elvész.)

Communalities

Initial Extraction
SZEREP ,588 ,609
KULHEY ,174 9,442E-02
KONFL ,167 ,170
UJDONS ,703 ,734
KENYSZ ,600 ,682
KUKK ,589 ,618
PSI ,396 ,467
ERTEKR ,419 ,502
SZOCNY ,208 ,193
KKAPCS ,713 ,765
TVFUGG ,349 ,348
VALOS ,356 ,354
Extraction Method: Maximum Likelihood.

Az iniciális kommunalitás (Initial) többé-kevésbé jól el rejelzi, hogy mely változók lesznek
azok, amelyek nem simulnak bele a latens struktúrába, és el bb-utóbb meg kell válnunk
lük. A kulhey, konfl és szocny változóval kapcsolatos negatív elvárásainkat rögtön igazolják

22.
is az ezekhez tartozó végs kommunalitás-értékek (Extraction), vagyis azt láthatjuk, hogy az
analízis során létrehozott faktorok a mért változók szóródásának hány százalékát
magyarázzák. (Kommunalitás: egy változónak az az információtartalma, amely a többi
változóban nincs benne. Ha egy változónak kicsi a kommunalitása, nem érdemes bevonni a
faktoranalízisbe, mert nincs értelme a jelenlétének, míg ha egy változó túl nagy egyedi
információértékkel bír, az nincs összhangban a többi változó kommunalitásának
mértékével.) Elfogadható módon leképezettnek tekinthetünk minden olyan változót,
melynek kommunalitása eléri a 0,25 értéket, azaz ha ragaszkodunk az lefuttatott analízis
által kapott faktorstruktúrához, akkor a fent említett három változótól meg kell válnunk.

Total Variance Explained

Initial Eigenvalues Extraction Sums of Squared Loadings


Factor Total % of Variance Cumulative % Total % of Variance Cumulative %
1 5,529 46,072 46,072 5,075 42,294 42,294
2 1,084 9,030 55,103 ,461 3,844 46,138
3 ,986 8,218 63,320
4 ,837 6,971 70,291
5 ,740 6,166 76,457
6 ,588 4,899 81,356
7 ,526 4,383 85,739
8 ,483 4,024 89,763
9 ,406 3,386 93,149
10 ,329 2,743 95,892
11 ,299 2,491 98,383
12 ,194 1,617 100,000
Extraction Method: Maximum Likelihood.

Az ’Extraction Sums of Squared Loadings’ fejléchez tartozó oszlopok a kapott faktorokban


megtestesül információtartalmat mutatják. Mivel az elemzésbe 12 változót vontunk be, az
általuk reprezentált összinformáció mennyisége 12 egység, amib l az els faktor 5,075, a
második pedig 0,461 egységnyit képvisel. A kumulatív százalékokat tartalmazó oszlop
(Cumulative %) azt mutatja, hogy a két faktor együttesen a változók információtartalmából 46
%-ot riz meg. Általában akkor tekintjük elfogadhatónak a faktorok által meg rzött
információmennyiséget, ha az meghaladja a 33 %-ot.

23.
Factor Matrixa

Factor
1 2
SZEREP ,779 -4,69E-02
KULHEY -,298 7,557E-02
KONFL ,279 -,303
UJDONS ,857 1,455E-03
KENYSZ ,782 ,267
KUKK ,781 -8,92E-02
PSI ,599 -,328
ERTEKR -,621 ,342
SZOCNY ,432 7,974E-02
KKAPCS ,866 ,123
TVFUGG ,568 ,158
VALOS ,585 -,106
Extraction Method: Maximum Likelihood.
a. 2 factors extracted. 4 iterations required.

A harmadik táblázatban a faktorsúlyok szerepelnek, amelyek azt jelzik, hogy az egyes


változók milyen irányban és mekkora súllyal alakítják a kapott faktorokat. A faktormátrixon
múlik az interpretáció folyamata, azaz hogy tudunk-e jelentést, címkét adni az egyes
faktoroknak. Nem tekintjük egy faktor alkotóelemének azokat a változókat, amelyekhez
tartozó faktorsúly nem éri el a 0,25 értéket. Amennyiben a faktorokat nehéz értelmezni, a
rotáció m velete segíthet, aminek során a faktorokat megfelel szögben forgatva azok
könnyebben interpretálhatóvá válnak, mert közelebb kerülnek a változókhoz.

Az elforgatástól nem változik sem a modell illeszkedése,


sem az egyes változók végs kommunalitása, sem az az
információtartalom, amelyet a faktorok együttesen
meg riznek, megváltozik viszont az a mód, ahogyan az
egyes faktorok a meg rzött információ mennyiségén
osztozkodnak.

Eljárás SPSS-ben:
Analyze Data Reduction Factor…
Rotation… Varimax
(Rotálni többféle módszerrel lehet, de mindegyik arra törekszik, hogy egy változó csakis
egy faktorhoz köt djön nagy súllyal, és a Varimax technika ezt a faktorsúlyok
négyzetösszegének maximalizálásával éri el.)

24.
Factor Matrixa Rotated Factor Matrixa

Factor Factor
1 2 1 2
SZEREP ,779 -4,69E-02 SZEREP ,628 ,463
KULHEY -,298 7,557E-02 KULHEY -,209 -,225
KONFL ,279 -,303 KONFL 6,914E-02 ,406
UJDONS ,857 1,455E-03 UJDONS ,720 ,465
KENYSZ ,782 ,267 KENYSZ ,801 ,201
KUKK ,781 -8,92E-02 KUKK ,607 ,500
PSI ,599 -,328 PSI ,324 ,601
ERTEKR -,621 ,342 ERTEKR -,335 -,624
SZOCNY ,432 7,974E-02 SZOCNY ,406 ,168
KKAPCS ,866 ,123 KKAPCS ,793 ,368
TVFUGG ,568 ,158 TVFUGG ,563 ,176
VALOS ,585 -,106 VALOS ,433 ,407
Extraction Method: Maximum Likelihood. Extraction Method: Maximum Likelihood.
a. 2 factors extracted. 4 iterations required. Rotation Method: Varimax with Kaiser Normalization.
a. Rotation converged in 3 iterations.

További kedvez tlen illeszkedés esetén a rossz kommunalitású változók kihagyásának és az


így kapott modellek rotációjának kombinációjával lehet alakítani a modellt egészen addig,
amíg olyan faktorstruktúrát kapunk, amir l a 2-próba azt állítja, hogy a mért változók és a
faktorokból becsült változók korrelációs mátrixa nem különbözik szignifikánsan egymástól
(Goodness-of-fit Test), vagyis a faktorok jól képezik le a mért változók annyi dimenziós terét,
amennyi változót a végleges modellben hagytunk.

Diszkriminanciaanalízis

Ha egy kvantitatív függ változó mérési skálája nominális, és el rejelzéséhez több


kvantitatív változó áll rendelkezésre, akkor a diszkriminanciaanalízis technikájával lehet
megfelel el rejelzési szabályt kialakítani. Az eljárás során a magyarázó változókból a
faktoranalízishez hasonlóan olyan új változók (azaz diszkrimináló függvények) jönnek létre,
melyek a legnagyobb különbséget produkálják a függ változóban definiált csoportok
között. Az új változó létrehozása a következ képlet alapján történik: Dj = d0j + d1jx1 + d2jx2 +
… + dkjxk, ahol j az adott diszkrimináló függvény sorszáma, az xi-k a mért változók, d0 egy
alkalmasan megválasztott konstans, dij pedig az xi mért változó j-edik diszkrimináló
függvényhez tartozó együtthatója. Ez a képlet a többváltozós regressziós egyenletekre
emlékeztet, hiszen a független változók által kifeszített térben megrajzolható hipersíkot írja
le, azonban diszkriminanciaanalízis során a célfüggvény nem a függ változó valóságos
értékeinek legjobb közelítését jelentik, hanem az eljárás úgy komponálja össze a mért
változókat, hogy a létrejött új változók átlagai a függ változó egyes kategóriáiban a lehet

25.
legjobban különbözzenek. Ezeknek a diszkrimináló függvényeknek éppen úgy meg kell
próbálni jelentést adni, ahogyan a faktoranalízis esetében tettük.

Eljárás SPSS-ben:
Analyze Classify Discriminant…
Grouping Variable: nem
Independents: a motivációs tényez ket reprezentáló 12 változó
(Use stepwise method: ha egy új változó beléptetésével egy már bent lév változó
magyarázóereje oly mértékben lecsökken, hogy a hozzá tartozó t-érték nem szignifikáns
magyarázatot jelez, a „legyengült” változó kilép a modellb l.)
Classify… Summary-table (találatmátrix)

Wilks' Lambda

Number of Exact F
Step Variables Lambda df1 df2 df3 Statistic df1 df2 Sig.
1 1 ,977 1 1 180 4,330 1 180,000 3,887E-02
2 2 ,939 2 1 180 5,770 2 179,000 3,730E-03
3 3 ,915 3 1 180 5,488 3 178,000 1,252E-03

A ’Wilks’ Lambda’ értékei (a bels és a teljes négyzetösszeg hányadosa) és a megfelel


szignifikanciák az egyes diszkriminancia-függvényekhez vannak hozzárendelve, melyek
együttesen arról tanúskodnak, mennyire sikerült olyan függvényeket találnunk, melynek
értékei a lehet legnagyobb mértékben eltérnek az egyes típusok között. Bár a
megmagyarázatlan hányadok nagyok, a függvények szignifikáns különbséget mutatnak a
függ változó egyes kategóriái között.

Classification Resultsa

Predicted Group
Membership
NEM fiu lany Total
Original Count fiu 64 42 106
lany 41 58 99
Ungrouped cases 4 7 11
% fiu 60,4 39,6 100,0
lany 41,4 58,6 100,0
Ungrouped cases 36,4 63,6 100,0
a. 59,5% of original grouped cases correctly classified.

A modell illeszkedésének tesztje úgy néz ki, hogy a valóságos csoportba tartozásokat
összevetjük a diszkrimináló függvények alapján történt, becsült besorolásokkal, melynek
eredményei a találatmátrixban (Classification Results) látható. A helyesen besorolt elemek

26.
aránya 59,5 %, ami a véletlen szintet képvisel 50%-hoz képest nem túl jó eredmény, mert ez
azt jelenti, hogy a teljes minta több, mint 40%-a kimaradt az eljárásból.

Klaszteranalízis

A klaszteranalízis olyan dimenziócsökkent eljárás, amelyben a megfigyelési egységekhez


rendelt változók jelentik azokat a dimenziókat, melyek mentén a megfigyelteket
csoportosítani kívánjuk oly módon, hogy az egy csoportba tartozók minden változó mentén
közel legyenek egymáshoz, illetve minden más csoporttól (azaz klasztert l) távol essenek.
Olyan exploratív módszer ez tehát, ami az egyes objektumok egymáshoz való távolságát
vizsgálva képez homogén alcsoportokat.

A hierarchikus klaszterelemzés azon az elgondoláson alapszik, hogy els lépésben


valamennyi besorolásra váró esetet külön egyszemélyes klaszterekben képzeljük el (eze
esetben tehát annyi klaszterünk van, ahány elem a mintánk), majd abból a két elemb l,
amely a legközelebb van egymáshoz, az analízis közös klasztert készít (ekkor a klaszterek
száma N – 1). Harmadik lépésben két dolog történhet: vagy talál az eljárás egy olyan elemet,
amely közel van az imént kialakított kételem klaszterhez, és azt három elem re b víti, vagy
talál két, ett l a csoporttól különálló, de egymáshoz közel es elemet, melyekb l egy újabb
kételem klasztert képez. Ez az építgetés mindaddig folytatódik, míg valamennyi elemünk
egyetlen, ám meglehet sen heterogén klaszterben tömörül.

Eljárás SPSS-ben:
Analyze Classify Hierarchical Cluster…
Variable(s): a motivációs tényez ket reprezentáló 12 változó
Statistics… Agglomeration Schedule (a klaszterképzés története)
Method…
Cluster Method: Between-groups lingage

27.
(A klaszterek valamennyi (már besorolt és még besorolatlan) elemét figyelembe veszi,
miközben az adott elem és az összes klaszterelem közötti átlagos távolságot veszi az
összevonás alapjául.)
Measure: Euclidean distance
(Az a mód, ahogyan két elem közötti távolságot definiálni akarunk, jelen esetben az
átlagos euklidészi távolsággal. A Pearson-féle mérés csak két eset válaszmintázatának
azonosságát vizsgálja, függetlenül az y tengelyen elfoglalt helyükt l, míg az
euklidészi módszer az abszolút távolságot is figyelembe veszi a csoportképzés során.)

Case Processing Summarya,b


A 237 elemszámú
Cases
mintából 46 db
Valid Missing Total
hiányos adatsor N Percent N Percent N Percent
miatt az elemzés 191 80,6 46 19,4 237 100,0
a. Euclidean Distance used
csak 191 eset
b. Average Linkage (Between Groups)
bevonásával történt.

Az ’Agglomeration Schedule’ (jelen esetben ennek eleje és vége összevágva látható) els
oszlopában az elemek klaszterekbe tömörítésének lépései vannak jelölve (azért 190 lépés,
mert a kiinduló állapotot nem tekinti annak, nevezetesen, amikor az összes elem külön
klasztert képez). Els ként a 93-as és 125-ös elem került egy klaszterbe, összevonásuk okát
pedig a „Coefficients” oszlopban találjuk, ami nem más, mint a két megfigyelés közötti
euklidészi távolság együtthatója. A táblázat utolsó oszlopában (Next Stage) az látszik, hogy

28.
ez a kételem klaszter a 86. lépésben fog újabb elemmel b vülni. Ennek átlátásához azt kell
tudnunk, hogy a táblázat nem sorolja fel a klaszterek valamennyi alkotóelemét, hanem úgy
utal egy-egy csoportra, hogy annak legkisebb sorszámú elemét használja jelölésképpen.

Ilyen nagy elemszám mellett az ’Agglomeration Schedule’ táblázat olyan nagy méret , hogy
áttekinthetetlenné válik, és nem ad módot az egyes klaszterek interpretálásra. A nagy
adatbázisokon alkalmazható nem hierarchikus analízis ahelyett, hogy az elemszámmal
megegyez számú egyelem klaszterek összeépítésével juttat el az optimális klaszter-
struktúrához, el zetes elvárásokra támaszkodva, vagy kedvez tlenebb esetben vakon kell
eldöntenünk, hány klaszterbe kívánjuk tömöríteni az elemeket. Az eljárás minden
klaszterhez egy-egy középpontot rendel, melyek a mintából meghatározott módon
kiválasztott elemek adatai. Az iniciális középpontok els lépésben a minta els k elemének
adatait jelentik, ahol k a kért klaszterek száma. Az ezt kiválasztó algoritmus lényege, hogy az
els k elem kiválasztása után a módszer sorba veszi a minta maradék elemeit,, és akkor cserél
ki egy már kiválasztott középpontot másik esetre, ha ennek az új esetnek a távolsága a hozzá
legközelebb es klaszterközépponthoz képest nagyobb, mint a két egymáshoz legközelebb
es , már kiválasztott középpont távolsága. Az algoritmus végén kapott középpontoknak
annyi koordinátája van, ahány változó mentén klasztereztük ket.
Eljárás SPSS-ben:
Analyze Classify K-Means Cluster…
Variables: a motivációs tényez ket reprezentáló 12 változó
Number of Clusters: 3

Initial Cluster Centers Final Cluster Centers

Cluster Cluster
1 2 3 1 2 3
SZEREP 19 13 4 SZEREP 16 12 7
KULHEY 24 12 19 KULHEY 13 15 16
KONFL 4 22 5 KONFL 16 16 13
UJDONS 24 17 4 UJDONS 21 15 8
KENYSZ 24 14 9 KENYSZ 17 12 7
KUKK 24 12 4 KUKK 17 13 8
PSI 14 16 4 PSI 16 14 10
ERTEKR 14 14 24 ERTEKR 11 14 18
SZOCNY 14 21 4 SZOCNY 17 14 13
KKAPCS 24 11 9 KKAPCS 20 13 7
TVFUGG 21 8 4 TVFUGG 17 14 10
VALOS 19 10 7 VALOS 14 12 8

Az ’Initial Cluster Centers’ táblázat az induló középpontok, a ’Final Cluster Centers’ táblázat
pedig a folyamat végén keletkez stabil klaszterek középpontjainak koordinátáit
tartalmazzák, melyek segítségével az egyes csoportokat a faktoranalízis folyamatanak
végéhez hasonlóan interpretálhatjuk.

29.
Felhasznált segédanyagok

Hajtman, B. (2000) A biometria alapjai. Semmelweis Orvostudományi Egyetem, Bp.


Korpás, A. (1997) Általános statisztika II. Nemzeti Tankönyvkiadó, Bp.
Székelyi, M., Barna, I. (2002) Túlél készlet az SPSS-hez. Többváltozós elemzési technikákról
társadalomkutatók számára. Typotex Kiadó, Bp.
Vargha, A. (2000) Matematikai statisztika. Pszichológiai, nyelvészeti és biológiai alkalmazásokkal. Pólya
Kiadó, Bp.

Hajtman Béla: Bevezetés a biostatisztikába. 2001/2002. I. félév, PPKE-BTK


Hajtman Béla: Statisztikai módszerek. 2001/2002. II. félév, PPKE-BTK
Singer Júlia: Statisztikai elemzések számítógépen. 2004/2005. I. félév, PPKE-BTK
Vargha András: Többváltozós statisztikai eljárások. 2005/2006. I. félév., ELTE-PPK

http://www.hik.hu/tankonyvtar/site/books/b163/index.html
http://www.maxem17.amigo.hu/keret.cgi?/index.html/spsstut.htm
http://www.utexas.edu/its/rc/tutorials/stat/

30.

You might also like