Regression Analysis:: O'zgaruvchilar To'plami O'rtasidagi Munosabatlarni Topish Uchun Ishlatiladigan Statistik Protsedura

You might also like

Download as ppt, pdf, or txt
Download as ppt, pdf, or txt
You are on page 1of 12

Regression Analysis:

O'zgaruvchilar to'plami
o'rtasidagi munosabatlarni
topish uchun ishlatiladigan
statistik protsedura
Regressiya tahlilida siz tushuntirmoqchi
bo'lgan qaram o'zgaruvchi va u bilan bog'liq
bo'lgan bir yoki bir nechta mustaqil
o'zgaruvchilar mavjud.

Siz munosabatlarni chiziqli tenglama sifatida


ifodalashingiz mumkin, masalan:

y = a + bx
y = a + bx
•y - qaram o'zgaruvchi
• x mustaqil o'zgaruvchidir
• a doimiydir
• b - chiziqning qiyaligi
• X ning har 1 ga ortishi uchun y b ga teng miqdorga o'zgaradi
• Ba'zi munosabatlar mukammal chiziqli va bu tenglamaga
to'liq mos keladi. Masalan, sizning mobil telefoningiz uchun
to'lov quyidagicha bo'lishi mumkin:

•Umumiy toʻlovlar = Asosiy toʻlov + 30¢ (ortiqcha daqiqalar)

•Agar siz asosiy to'lovni va ortiqcha daqiqalar sonini bilsangiz,


umumiy to'lovlarni aniq taxmin qilishingiz mumkin.
Boshqa munosabatlar unchalik
aniq bo'lmasligi mumkin.
Masalan, vazn qaysidir
ma'noda balandlik 220
funktsiyasidir, ammo
balandlikning o'ziga xos 200
o'zgarishlari bor.
180
O'rtacha, sizda shunday

Weight
tenglama bo'lishi mumkin: 160
Og'irligi = -222 + 5,7 *
Balandligi 140
Haqiqiy balandliklar va
120
vaznlarning namunasini
olsangiz, o'ngdagi grafik kabi 100
narsalarni ko'rishingiz mumkin. 60 65 70 75
Height
Grafikdagi chiziq tenglama bilan
tavsiflangan o'rtacha munosabatni
220 ko'rsatadi. Ko'pincha, haqiqiy
kuzatuvlarning hech biri chiziqda
yotmaydi. Chiziq va har qanday
200 individual kuzatuv o'rtasidagi farq
xatodir.
180 Yangi tenglama quyidagicha:
Weight

Og'irligi = -222 + 5,7 * Balandlik + e


160 Bu tenglama etarlicha past bo'lgan
odamlar salbiy vaznga ega
bo'lishini anglatmaydi. Ushbu
140 tahlilga hissa qo'shgan kuzatuvlar
5 ' va 6'4 ” oralig'idagi balandliklar
120 uchun edi. Model, ehtimol, bu
balandlik oralig'idagi har bir kishi
uchun oqilona baho beradi. Biroq,
100 natijalarni kuzatilganlardan tashqari
60 65 70 75 balandliklarga ekstrapolyatsiya qila
olmaysiz. Regressiya natijalari
Height faqat haqiqiy kuzatuvlar diapazoni
uchun amal qiladi.
Regressiya kuzatishlarga eng mos keladigan chiziqni topadi.
Buni kvadrat xatolarning eng kichik yig'indisiga olib keladigan
chiziqni topish orqali amalga oshiradi. Chiziq mustaqil
o'zgaruvchilar ta'sirining o'rtacha qiymatini tavsiflaganligi
sababli, ta'rifga ko'ra, haqiqiy xatolar yig'indisi nolga teng
bo'ladi. Agar siz qaram o'zgaruvchining barcha qiymatlarini
qo'shsangiz va model tomonidan bashorat qilingan barcha
qiymatlarni qo'shsangiz, yig'indi bir xil bo'ladi. Ya'ni, salbiy
xatolar yig'indisi (chiziq ostidagi nuqtalar uchun) ijobiy xatolar
yig'indisini to'liq qoplaydi (chiziq ustidagi nuqtalar uchun).
Faqatgina xatolarni yig'ish foydali bo'lmaydi, chunki yig'indi har
doim nolga teng. Shunday qilib, buning o'rniga, regressiya
xatolar kvadratlarining yig'indisidan foydalanadi. Oddiy eng
kichik kvadratlar (OLS) regressiyasi kvadratik xatolarning eng
kam yig'indisiga olib keladigan chiziqni topadi.
Multiple Regression
Mustaqil o'zgaruvchiga bir nechta omillar ta'sir etsa
nima bo'ladi?
Misol tariqasida, uyning narxini qaram o'zgaruvchi
sifatida tasavvur qiling. Uyning narxiga bir necha
omillar ta'sir qiladi ... ular orasida kvadrat metr,
yotoq xonalari soni, hammom soni, uyning yoshi,
garaj yoki basseyn bor yoki yo'qligi, agar ikkala
markaziy issiqlik mavjud bo'lsa. va konditsioner,
qancha kamin bor va, albatta, joylashuvi.
The Multiple Regression Equation
Ushbu omillarning har biri uyning narxiga alohida bog'liqlik
qiladi. Ko'p regressiya munosabatlarini tavsiflovchi
tenglama:

y = a + b1x1 + b2x2 + b3x3 + … bnxn + e

Ushbu tenglama har bir alohida mustaqil o'zgaruvchini


qolganlaridan ajratib turadi va har biriga bog'liq
o'zgaruvchiga munosabatini tavsiflovchi o'z koeffitsientiga
ega bo'lish imkonini beradi. Agar kvadrat metr mustaqil
o'zgaruvchilardan biri bo'lsa va u 50 dollar koeffitsientiga
ega bo'lsa, u holda har bir qo'shimcha kvadrat fut uyning
narxiga o'rtacha 50 dollar qo'shadi.
Model qanchalik yaxshi?
Modelning ma'lumotlarni qanchalik to'g'ri
tushuntirishini ko'rsatadigan ko'rsatkichlardan biri
R2 qiymatidir. Model bilan izohlanmagan
kuzatuvlar orasidagi farqlar xato atamasida qoladi.
R2 qiymati ushbu farqlarning necha foizi model
tomonidan tushuntirilganligini aytadi. R2 .68
bo'lishi, qaram o'zgaruvchining kuzatilgan
qiymatlaridagi dispersiyaning 68% model
tomonidan izohlanganligini va bu farqlarning 32%
xato atamasida tushuntirilmaganligini anglatadi.
“p-values” and Significance Levels
Har bir mustaqil o'zgaruvchiga regressiya natijalarida
boshqa raqam biriktirilgan ... uning "p-qiymati" yoki
ahamiyatlilik darajasi.
p-qiymati foizdir. Bu sizga mustaqil o'zgaruvchining
koeffitsienti tasodifan paydo bo'lganligi va haqiqiy
munosabatni tasvirlamasligi mumkinligini aytadi.
p-qiymati .05, munosabatlarning tasodifiy paydo bo'lish
ehtimoli 5% va munosabatlarning haqiqiy bo'lish ehtimoli
95% ekanligini anglatadi.
P-qiymati .1 dan kam bo'lgan o'zgaruvchilarni muhim deb
hisoblash umumiy qabul qilingan amaliyotdir, garchi bu
chegaraning yagona asosi konventsiyadir.
Some Things to Watch Out For

• Multicollinearity

• Omitted Variables

• Endogeneity

• Other
Qo`shimcha
Turli sabablarga ko'ra modelda mavjud bo'lishi
mumkin bo'lgan bir qancha boshqa turdagi
noxolisliklar mavjud. Yuqorida tavsiflangan turlarda
bo'lgani kabi, noto'g'rilik darajasini o'lchash uchun
testlar mavjud va uni kamaytirish uchun ishlatilishi
mumkin bo'lgan strategiyalar mavjud. Oxir-oqibat,
yakuniy modelda, ayniqsa ma'lumotlar cheklovlari
mavjud bo'lganda, ma'lum miqdordagi
tarafkashlikni qabul qilish kerak bo'lishi mumkin.
Bunday holda, eng yaxshi narsa modelni taqdim
etishda muammo va uning oqibatlarini
tasvirlashdir.

You might also like