Download as pdf or txt
Download as pdf or txt
You are on page 1of 40

(Master)

Ligjerata 5

Metodologjia hulumtuese
Analiza e t dhnave
Prof.asc. Avdullah Hoti

2013/14
1

Literatura pr kt ligjrat
Research methods for Business Students, Saunder,

M., Lewis, P. And Thornill, A., Pearson Education


Limited, Essex, 2009
Kapitulli 12, faqe 414-479

Prmbatja
a) Analiza e t dhnave statistikore
1. Mesatarja
2. Treguesit e pozicionit: moda dhe mediana
3. Treguesit e variacionit: varianca; devijimi
standard; koeficienti i variacionit
4. Indekset
5. Matsit e ndrlidhjeve n mes t variablave:
kovarianca dhe koeficienti i korelacionit
b) Teknikat prshkruese t t dhnave
c) Interpretimi i t dhnave

a) Analiza e t dhnave
Analiza e t dhnave:
Pr t prodhuar tregues statistikor prmes t cilve

nxjerren prfundime cilsore pr dukurin e studiuar.


Analiza statistikore statike:
hulumtimi i dukuris n nj moment t caktuar.

Analiza dinamike:
hulumtimi i dukuris npr koh; ndryshimi i

variablave/ndryshoreve npr koh


4.4

Analiza e t dhnave
1. Mesatarja
1. Mesatarja aritmetike e thjesht
pr t dhnat e pagrupuara
2. Mesatarja aritmetike e ponderuar
pr t dhnat e grupuara/frekuenca
3. Mesatarja aritmetike nga t dhnat e
shprehura n interval

Mesatarja aritmetike e thjesht


sht adekuate pr t prshkruar t dhnat sasiore
sht e ndikuar nga vlerat ekstreme (outliers).
Shembull:
Nse nr mesatar i puntorve pr firm sht 20.
n sektor hyn nj firm e re q punson 1000 puntor menjher,
rritet numri mesatar i puntorve pr firm

Popullacioni

Mostra

x1 x2 x3 x4 x5 x6
6
i 1deri _ n; n 6
x

Mesatarja aritmetike e ponderuar


Raporti i shums s fituar nga shumzimi i t dhnave
me frekuencat e tyre, pjestuar me numrin total t
frekuencave

x
f

x1 f1 x2 f 2 x3 f 3 x4 f 4 x5 f 5 x6 f 6
f1 f 2 f 3 f 4 f 5 f 6

frekuencat

Mesatarja aritmetike nga t dhnat interval


T dhnat shprehen n intervale ngase:
M praktike:

mosha; vitet n shkollimi

Konfidencialiteti:

pr t mbrojtur privatsin sot ligje pr formn e pyetjeve t


shtruara n pyetsor: shitjet, t ardhura personale

Mesatarja llogaritet si mesi i intervalit

Pr kufirin e ult dhe t lart merret vlera e shnuar ose

inspektohen t dhnat.

Cilsit e mesatares aritmetike


Renditja e t dhnave nuk ndikon n mesataren
aritmetike
Shuma e shmangieve t t dhnave individuale nga
mesatarja sht baraz me zero

Barazohen shmangjet pozitive me ato negative t


observimeve individuale ndaj mesatares

Zvoglimi, zmadhimi, shumzimi apo pjestimit i t


gjtha observimeve me nj madhsi konstante (a),
rezulton me t njejtin efekt n madhsin e mesatares
aritmetike.

2. Treguesit e pozicionit
Dy tregues t pozicionit
Moda: observimi me frekuencn m t lart (q paraqitet m s

shpeshti)
Nota m e shpesht, smundja m e shpesht, lloji m i shpesht i

aksidenteve
Mediana: mesi i seris
Observimet tek: {35,34,38,40,37,33,28,36,39}, N=9, (N+1)/2

Listo min-to-max: {28, 33, 34, 35, 36, 37, 38, 39, 40} = (9 + 1)/2=5
i pesti vrojtim n renditje = 36

Observimet qift: {19,12,19,26,28,22}, N=6, (N+1)/2

Listo min-to-max: {12,16,19,22,26,28}=(6+1)/2=3.5


Vrojtimet 3 dhe 4 = 19 dhe 22
mediana = (19+22)2 = 41/2=20.5

2. Treguesit e pozicionit
Mesi i seris: (min+max)/2

Por, problem kur ka vlera ekstreme (outliers)


Shembull:
90% e t punsuarve kan pag prej 200-500 euro n
muaj,
7% kan pag 501-800 euro n muaj
2% kan pag 801-1100 euro n muaj
1% kan pag 10,000 euro n muaj
Mesatarja trimmed
E dizajnuar pr t evituar efektin e vlerave ekstreme

Gjendet mesatarja aritmetike pas heqjes s vlerave

ekstreme

3.Treguesit e variacionit
Matsit e lokacionit mesatar nuk tregojn gjendjen e plto

pr shprndarjen e t dhnave rreth qendrs/mesatares


Shembull:
Dy grupe studentsh me
nga 50 student
Rezultati mesatar n testin
A = 50% pr t dy grupet:
Pra mesatarja e
kalueshmris sht
e njjt pr dy grupet
Por klasa me t kuqe ka m
shum variacion n rezultat
se klasa me t kaltr.

4.12

3.Treguesit e variacionit
Gjrsia e variacionit
Treguesi me i thjesht i variacionit

= vrojtimi me vlern m t lart (maksimale) vrojtimi


me vlern m t vogl (minimale)
Shembull
T dhnat: {4, 4, 4, 4, 50}
T dhnat : {4, 8, 15, 24, 39, 50}

Range = 46
Range = 46

Leht llogaritet
E met kryesore: pamundsia pr t ditur shprndarjen e

t gjitha vrojtimeve n mes min dhe max


Andaj m informues matsi i variacionit q prfshin t
gjitha t dhnat e jo vetm vlerat minimale dhe
maksimale.

3. Treguesit e variacionit
Varianca (shmangia mesatare kuadratike)
paraqet madhesine mesatare te diferencave absolute ne mes te

mesatares aritmetike dhe vlerave individuale te serise statistikore.


Llogarit mesataren aritmetike
n
2
(
X

X
)
Serit e thjeshta:

i
2
i 1
Llogarit devijimin e secilit vrojtim nga mesatarja,
n
t gjitha n katror, dhe
shumn e devijimeve e pjeston me numrin e vrojtimeve.
n
Serit e ponderuara:
i( X i X )2

Llogarit devijimin e secilit vrojtim nga mesatarja, 2 i 1



i
t gjitha n katror,
shumzo me numrin e frekeuncave prkatse dhe
shumn pjesto me numrin e frekuencave.

4.14

3. Treguesit e variacionit
Devijimi standard
sht rrnja katrore e variancs
Prdoret pr t krahasuar variacionin e distribuimeve dhe
formn e distribuimit.
Nse histogrami ka formn e ziles ather, rregulla empirike:
Rreth 68% e t gjitha observimeve gjinden brenda 1 devijimi
standard nga mesatarja.
Rreth 95% e t gjitha observimeve gjinden brenda 2
devijimeve standarde nga mesatarja.
Rreth 99.7% e t gjitha observimeve gjinden brenda 3
devijimive standarde nga mesatarja.

4.15

3. Treguesit e variacionit
Devijimi standard: Interpretimi
Sa m i vogl, observimet jan m afr

mesatares aritmetike.

Rreth 68% e t gjitha observimeve gjinden

brenda 1 devijimi standard nga mesatarja.


Rreth 95% e t gjitha observimeve gjinden

brenda 2 devijimeve standarde nga mesatarja.

Rreth 99.7% e t gjitha observimeve gjinden

brenda 3 devijimeve standarde nga mesatarja.


4.16

3. Treguesit e variacionit
Devijimi standard: Interpretimi
Mesatarja e shpenzimeve telefonike 14 euro
Devijimi standard 4 euro

Bazuar n Rregulln empirike


rreth 68% e personave shpenzojn n mes t (14-4) dhe

(14+4)=10-18 euro
Rreth 95% e personave shpenzojn n mes t (14-4*2)
dhe (14+4*2)=6-22 euro
Rreth 98% e personave shpenzojn n mes t (14-4*3)
dhe (14+4*3)=2-26 euro

3. Treguesit e variacionit
Koeficienti i varicionit:
Devijimi standard pjestuar me mesataren: Kv

100

Shpreh shmangiet mesatare t vrojtimeve n % nga

mesatarja aritmetike.
Sa m homogjene t dhnat, aq m i vogl Kv
Devijimi standard prej 10 mund t konsiderohet i
lart kur mestarja sht 100,
por jo shum i lart nse mesatarja sht 500,
andaj koeficienti i variacionit eshte tregues m i qart

4. Indekset
Pr studimin e dinamiks s dukurive dhe

krahasimin n mes tyre prdoren treguesit


relativ
indekset

Llojet e indekseve
Indekset baz

Indekset zinxhir

4. Indekset:
Baz
Raporti i nivelit t seris kohore ndaj nivelit apo

madhsis s asaj serie t zgjedhur si baz konstante.


Baza: Seria baz N1
I1={(N2/N1)*100}-100
I2={(N3/N1)*100}

Mbetja pozitive nnkupton rritje n krahasim me serin

baz
Mbetja negative nnkupton rnie n krahasim me serin
baz

4. Indekset
Zinxhirore
Shprehin raportin e secils seri raportuese ndaj

madhsis/seris paraprake si baz


Vargore-zinxhirore ngase nivelet e seris kalojn prej
pozits raportuese n pozitn e bazs s indeksit
pasardhs
Baza e llogaritjes s indekseve ndryshon
I1=(N2/N1)*100; I2=(N3/N2)*100; I3=(N4/N3)*100
Interpretimi n raport me periudhn paraprake
=100 i pandryshuar;

mbi 100 rritje dhe


nn 100 rnie

5. Treguesit e ndrlidhjeve n mes t


variablave
Fuqia dhe drejtimi i lidhjeve lineare n mes t

dy variablave (nse egziston ndrlidhja).


Kovarianca a egziston ndonj ndrlidhje n
lvizjen e dy variablave?
Koeficienti i korelacionit sa e fort sht
ndrlidhja n mes dy variablave?

4.22

5. Matsit e ndrlidhjeve n mes t variablave:


Kovarianca
Mesatarja e variabls X dhe e Y

Kur dy variabla lvizin n t njejtin drejtim,


kovarianca sht pozitive.

Kur dy variabla lvizin n drejtime t kundrta,


kovarianca sht negative.

Kur nuk egziston kurrfar lidhje


kovarianca sht numr i vogl.

4.23

5. Matsit e ndrlidhjeve n mes t variablave:


Kovarianca

Tri sete: X dhe Y t njejta, ndryshon renditja e Y


Set 1: me rritjen e X rritet Y, Sxy pozitive dhe e lart
Set 2: me rritjen e X bie Y, Sxy negative dhe e lart
Set 3: me rritjen e X nuk ndyrshon Y, Sxy ult
4.24

5. Matsit e ndrlidhjeve n mes t variablave:


Koeficienti i korelacionit
Definohet si kovarianc pjestuar me devijimin standard t
t dy variablave:

Koeficienti tregon sa e fort sht ndrlidhja n mes t


X and Y?
Nse mbi 0.5 lidhja e fort
Merr vlera nga 0 deri 1
Nse dy variabla jan t lidhura pozitivisht,
koeficienti do t marr vler afr +1
Nse dy variabla jan t lidhura negativisht,
koeficienti do t marr vler afr -1
4.25

5. Matsit e ndrlidhjeve n mes t variablave:


Koeficienti i korelacionit
+1 Lidhje pozitive

r ose r =

Nuk egziston ndonj lidhje

-1 Lidhje negative

4.26

5. Matsit e ndrlidhjeve n mes t variablave:


Koeficienti i korelacionit

Shembull
Kovarianca 26.16
koeficienti i korelacionit 0.5365
Shpjegimi:
Egziston lidhje pozitive n mes t dy

variablave t studiuara (kovarianca)


Ndrlidhja e variablave sht mesatarisht e
fort (koeficienti i korelacionit)
4.27

Simbolet n statistik
Madhsia

Popullacioni

Mostra

Mesatarja
Varianca

S2

Devijimi
Standard

Koeficienti i
variacionit

CV

cv

Kovarianca

Sxy

Koeficienti i
korelacionit

r
4.28

b) Teknikat prshkruese t t
dhnave
Statistika sht mnyr e prfitimit t

informacioneve nga t dhnat


Prshkrimi i t dhnave pr:
Pr raportime

Udhzojn pr analiza t mtutjeshme

Paraqitja tabelare dhe grafike

Paraqitja e statistikave t dy variablave


Cross tabulation-tabulimi pr t shpjeguar marrdhnien n mes
dy variablave
Nj mostr e lexuesve t gazetave t pyetur se cilat gazeta ata lexojn: Globe and
Mail (1), Post (2), Star (3), ose Sun (4), dhe t shnojn nse ata jan puntor t
pashkolluar (1), t shkolluar (2), ose professional (3).

Grafiket per lidhjen ne ms te dy variablave

Profesionalistet
tentojne te lexojne
me shume Globe &
Mail dy here me
shume sesa Star ose
Sun

2.32

Diagramet
Sa m e madhe shtpia m i shtrenjt cmimi i shtpis
Zakonisht dukurit dinamike

Diagramet scatter

Lidhje pozitive

Lidhje negative

Lidhje e dobet ose nuk egziston lidhje


2.34

c) Interpretimi i t dhnave
Prmbledh shtjet kye q dalin nga

tabela (ne vend te shih Tabelen X)


Evito tendencn pr t raportuar t
gjitha shifrat n tabel ose grafik

c) Interpretimi i t dhnave
N vitin 1986, eksplodimi i anijes kozmike, ku 7
astronaut kan vdekur, sht shembulli m i mir i
komunikimit t dobt t numrave. Nj nat para se t
nisej, u udhzua t mos nisej anija pr shkak t
temperaturave t ulta q do t dmtonin disa pjes t
anijes. Grafikt e pregatitur n nxitim u fokusuan n
informata selektive (ndikimi i temperaturave t ulta)
duke harruar informata t rndsishme. NASA (The
National Aeronautics and Space Administration) nuk u
bind nga argumentet dhe anija u lshua duke eksploduar
brenda 7 sekondave.

36

c) Interpretimi i t dhnave
Prej vitit 1993 deri ne vitin 2001 n Amerik kishte rritje t
madhe t t hyrave nga tatimet, kur edhe filloi rnia.

2.37

c) Interpretimi i t dhnave

Reth gjysma e faturave (71+37=108)


Jan t vogla,
M pak se $30

Jan vetm disa fatura


telefonike t madhsis
mesatare.

Rretj 1/3 e telfonatave jan


$90 e m shum

Disa rregulla pr paraqitjen e t dhnave


n tabela dhe grafik
Para tabels ose diagramve njofto lexuesin me tabel:
konkludimin e nxjerr nga tabela
Seksioni/kapitulli nuk prfundohet me tabel
Titulli i tabels: periudha, njsia matse
Burimi i t dhnave
Rrumbullakso vlerat (249,567 sheno si 250,000)
T dhnat q krhasohen vendosi afr
Vijat npr tabel pengojn krahasimin.
Vendos vlerat n t djatht
Evitoni shkurtesat
Totali
39

Shembull.1
Duke prdorur t dhna pr nj problem
hulumtues me interes pr ju, llogaritni:
a) Mesatarn
b) Moda dhe mediana
c) Gjeresia e variacionit
d) Shmangia mesatare absolute
e) Variacioni
f) Devijimi satandard,dhe
g) Koeficienti i variances

You might also like