Professional Documents
Culture Documents
Ekonometri, L5
Ekonometri, L5
Ekonometri, L5
Leksioni 6
Tema:Regresioni me ndryshore të varur cilësorë
Regresi logjistik
Viti akademik 2022-2023
Çështjet që do trajtohen:
• Modele me variabla të varur të limituar (Models with limited
dependent variables)
• Modeli logit dhe probit
• Zbatime në eviews
Ka raste kur ndryshorja e varur është zero për një pjesë të popullimit
dhe pozitive (me disa outcomes) për pjesën tjetër të popullimit.
Në këto raste përdoret Modeli Tobit.
Modeli Binar
Mendojmë se jemi të interesuar të shpjegojmë nëse një familje ka ose
jo makinë. Ndryshorja e varur merr dy vlera: familja ka makinë ose
familja nuk ka makinë (ndryshore binare).
y=
Modeli binar
Në rastet kur ndryshorja e varur y është cilësore, objektivi ynë është të
gjejmë probabilitetin që të ndodhë njëra nga ngjarjet, përgjithësisht për
ngjarjen për të cilën jemi të interesuar, psh që banka të aprovojë
kërkesën për kartë, që një individ të jetë i punësuar etj.
P() = E() =
Modeli i probabilitetit linear
Pse ndodh kështu?
Ndryshorja e varur, mund të shihet si një ndryshore rasti me
shpërndarje Bernoulli, me vlera 1 dhe 0.
E(|)= =
Kur = me probabilitet
Problemet:
Kjo do të thotë se termat e gabimit ndjekin shpërndarjen bernuli dhe jo
atë normale.
Duke ditur se varianca e termit të gabimit është:
atëherë ekuacioni:
P(y=1) = Ʌ( +
P(y=1)=E(y)=
=vlerësim i P(y=1)=
Modeli Probit
F()= + = φ()+
P(y=1)=E(y)=
del se:
= ose
ln()=++……= (Odds)
Dallimet mes modeleve
• Të dy modelet vlerësohen duke përdorur Metodën e Përgjasisë
Maksimale (Method of maximum likelihood) .
• përveç pikëprerjes
• +0.5 për pikëprerjen
•
Regresi Logjistik
• Nëse , atëherë themi se kur rritet rritet probabiliteti që y=1
• Nëse , atëherë themi se kur rritet zvogëlohet probabiliteti që y=1
• (kujdes! Bëni diferencën me regresin linear)
• Në të dy rastet, nuk bëhet interpretimi i vlerës absolute meqë efektet
marxhinale nuk janë konstante.
Interpretimi i parametrave
Nëse ndryshorja është e vazhduar, atëherë efekti i pjesshëm i saj jepet
si derivat i pjesshëm i probabilitetit që y=1.Pra:
=)
F() – F()
Kontrollet e rëndësisë
Kontrolli i rëndësisë së modelit:
Kontrollet individuale:
Hipotezat janë:
Kriteri:
nëse p, hedhim poshtë hipotezën bazë
nëse p, nuk e hedhim dot poshtë hipotezën bazë
Shembull
Një kompani zotëron një rrjet kombëtar dyqanesh me veshje për
femra.Është prodhuar një katalog mjaft i shtrenjtë që përmban një
kupon për 50$ zbritje për çdo blerje prej 200 ose më shumë $.Katalogët
janë të shtrenjtë dhe menaxherët mendojnë t’jua dërgojnë klientëve që
kanë probabilitet të madh për ta përdorur kuponin.
Shembull
Drejtuesit mendojnë që shpenzimet vjetore në këtë rrjet dhe të pasurit
e një karte krediti janë dy ndryshore që do ndihmojnë për të
parashikuar nëse një klient që merr katalogun do të përdorë kuponin.
Shembull
Bazuar në një zgjedhje rasti prej 100 klientësh (50 me kartë dhe 50 pa kartë) dhe
duke shënuar me:
y=
•=
Shembull
Gjejmë ekuacionin e vlerësuar të regresit logjistik:
=vlerësim i P(y=1)=
0 0
Kujdes:
Nëse d(/dX është negative (pozitive),
atëherë dProb(Y)/dX është gjithashtu negative (pozitive).
Shembull
Dependent Variable: KUPONI
Method: ML - Binary Logit (Quadratic hill climbing)
Date: 11/23/16 Time: 14:37
Sample: 1 100
Included observations: 100
Convergence achieved after 3 iterations
Covariance matrix computed using second derivatives
Variable Coefficient Std. Error z-Statistic Prob.
C -2.146373 0.577245 -3.718304 0.0002
SHPENZIME 0.341643 0.128673 2.655138 0.0079
KARTA 1.098732 0.444696 2.470747 0.0135
McFadden R-squared 0.101250 Mean dependent var 0.400000
S.D. dependent var 0.492366 S.E. of regression 0.462621
Akaike info criterion 1.269739 Sum squared resid 20.75972
Schwarz criterion 1.347894 Log likelihood -60.48695
Hannan-Quinn criter. 1.301370 Restr. log likelihood -67.30117
LR statistic 13.62844 Avg. log likelihood -0.604869
Prob(LR statistic) 0.001098
Obs with Dep=0 60 Total obs 100
Obs with Dep=1 40
Shembull
Nga outputi kemi:
Z = -2.1464+0.3416shpenzime+1.0987karta
Shpenzimet vjetore
1000$ 2000$ 3000$ 4000$ 5000$ 6000$ 7000$
Kartë po 0.3305 0.4099 0.4943 0.579 0.6593 0.7314 0.7931
Kartë jo 0.1413 0.188 0.2457 0.3143 0.3921 0.4758 0.5609
Ekuacioni i vlerësuar i modelit të probabilitetit linear
Vlerësim P(y=1| xi) = 0.03 + 0.08 shpenzimet + 0.24 karta
=vlerësim i P(y=1)==
=Φ(0.66*1) =
=Φ(-1.3+0.42+0.66)=Φ(-1.3+1.08) = Φ( -0.22) = 0.41 = 41%
Vlera e fundit gjendet nga tabela e shpërndarjes normale standarte.
Shembull
We study the factors influencing the purchase of health insurance.
Using data set from the Health and Retirement Study (HRS), wave 5
(2002) collected by the National Institute of Aging.
Dependent variable: whether or not a person has health insurance (0 or
1).
Independent variables: retired, age, good health status, household
income, education years, married, Hispanic.
Shembull
Estimating regression model, logit, and probit models.
• Odds = =
• Ka raste kur ka vlerë të llogaritet raporti i Odds:
Raporti i odds =
Raporti i Odds
Supozojmë se duam të krahasojmë odds e ngjarjes së blerjes prej
200$ për klientët që shpenzojnë 2000$ në vit dhe kanë kartë
krediti me odds të ngjarjes së blerjes prej 200$ për klientët të cilët
shpenzojnë 2000$ në vit por nuk kanë kartë krediti.
• Vlerësojmë odds për ngjarjen e parë = = 0.6946