Professional Documents
Culture Documents
9 - Basit Doğrusal Regresyon
9 - Basit Doğrusal Regresyon
Y Y
X X
Y Y
X X
Copyright ©2014 Pearson Education
İlişki Tipleri
(devamı)
Kuvvetli İlişkiler Zayıf İlişkiler
Y Y
X X
Y Y
X X
Copyright ©2014 Pearson Education
İlişki Tipleri
(devamı)
İlişki yoktur
X
Copyright ©2014 Pearson Education
Basit Doğrusal Regresyon
Modeli
Popülasyon Rassal
Popülasyon Bağımsız
eğim hata
Y kesişimi değişken
katsayısı ifadesi
Bağımlı
Değişken
Yi = β0 + β1Xi + ε i
Doğrusal bileşen Rassal Hata bileşeni
Y Yi = β0 + β1Xi + ε i
Xi için Y’nin
gözlenen değeri
εi Eğim = β1
Xi için Y’nin
tahmin edilen Bu Xi değeri için
değeri rassal hata
Kesim
noktası = β0
Xi X
Copyright ©2014 Pearson Education
Basit Doğrusal Regresyon
Denklemi (Tahmin Çizgisi)
Basit doğrusal regresyon denklemi popülasyon
regresyon çizgisinin bir tahmininin yapılmasını sağlar
Regresyonun
i gözlemi için
Y eksenini
tahmin Regresyon
kesme
edilmiş Y eğiminin tahmini
noktasının
değeri
tahmini
i gözlemi için
Ŷi = b0 + b1Xi
X değeri
350
300
250
200
150
100
50
0
0 500 1000 1500 2000 2500 3000
Feet-kare
3. Regresyonu Seç
ANOVA
df SS MS F Significance F
Regression 1 18934.9348 18934.9348 11.0848 0.01039
Residual 8 13665.5652 1708.1957
Total 9 32600.5000
350 Eğim
300
= 0.10977
250
200
150
100
50
Kesim
0
noktası 0 1000 2000 3000
= 98.248 Feet-kare
350
300
250
200
150
100
50 X’in gözlemlenen
0 aralığı dışında
0 1000 2000 3000
ekstrapolasyon
Feet-Kare yapılmaya
çalışılmamalıdır
Copyright ©2014 Pearson Education
Değişim Ölçüleri
Y
Yi ∧ ∧
HKT = ∑(Yi - Yi )2 Y
_
TKT = ∑(Yi - Y)2
∧
Y ∧ _
_ RKT = ∑(Yi - Y)2 _
Y Y
Xi X
Copyright ©2014 Pearson Education
Determinasyon Katsayısı, r2
Determinasyon katsayısı, bağımlı değişkende
toplam değişimin bağımsız değişkendeki
değişim tarafından açıklanan kısmıdır
Determinasyon katsayısı r-kare olarak da
adlandırılır ve r2 olarak gösterilir.
not:
0 ≤r ≤1
2
X
r2 =1
Copyright ©2014 Pearson Education
Yaklaşık r2 Değerlerine
Örnekler
Y
0 < r2 < 1
X
Copyright ©2014 Pearson Education
Yaklaşık r2 Değerlerine
Örnekler
r2 = 0
Y
X ve Y arasında doğrusal
bir ilişki yoktur:
RKT 18934.9348
Regression Statistics
r =
2
= = 0.58082
Multiple R 0.76211 TKT 32600.5000
R Square 0.58082
Adjusted R Square 0.52842 Ev fiyatlarındaki değişimin
Standard Error 41.33032 %58.08’i ev alanındaki (feet-
Observations 10
kare) değişim ile açıklanmaktadır
ANOVA
df SS MS F Significance F
Regression 1 18934.9348 18934.9348 11.0848 0.01039
Residual 8 13665.5652 1708.1957
Total 9 32600.5000
HKT ∑ i i
(Y − Yˆ ) 2
SYX = = i =1
n−2 n−2
ANOVA
df SS MS F Significance F
Regression 1 18934.9348 18934.9348 11.0848 0.01039
Y Y
küçük SYX X X
geniş SYX
Doğrusallık
X ve Y arasındaki ilişki doğrusaldır
Hataların bağımsızlığı
Hata değerleri istatistiksel olarak bağımsızdır
Hatanın normalitesi
Hata değerleri verilen bir X değeri için normal
dağılmıştır
Eşit Sapma (homosedastisite olarak da adlandırılır)
Hata değerlerinin olasılık dağılımı sabit varyansa
sahiptir
Y Y
x x
residual
x residual x
Doğrusal
değil
Copyright ©2014 Pearson Education
Doğrusal
Bağımsızlık İçin Artık Değer
Analizi
Bağımsız değil
Bağımsız
residual
residual
X
residual
0
-3 -2 -1 0 1 2 3
Artık değer
Y Y
x x
residual
x residual x
15
Burada artık değerler, 10
rassal değil, döngüsel bir Residual 5
model gösterirler. 0
Çevrimsel modeller pozitif -5 0 2 4 6 8
n Mümkün aralık 0 ≤ D ≤ 4
∑ (e − e i i−1 ) 2
∑ i
e
i=1
2
2’den küçük D değeri pozitif
otokorelasyonun işaretidir, 2’den
büyük D değeri negatif
otokorelasyonun işaretidir.
Copyright ©2014 Pearson Education
Pozitif Otokorelasyon İçin Test
Etme
H0: pozitif otokorelasyon yoktur
H1: pozitif otokorelasyon mevcuttur
Durbin-Watson test istatistiğini = D hesapla
(Durbin-Watson İstatistiği Excel veya Minitab kullanılarak hesaplanabilir)
0 dL dU 2
Copyright ©2014 Pearson Education
Pozitif Otokorelasyon İçin Test
Etme (devamı)
140
120
100
Satışlar
80 y = 30.65 + 4.7038x
R2 = 0.8976
60
40
20
0
0 5 10 15 20 25 30
Zam an
160
n = 25 büyüklüklü örnek: 140
Excel/PHStat çıktısı:
120
100
Satışlar
Durbin-Watson Calculations 80 y = 30.65 + 4.7038x
R2 = 0.8976
60
Sum of Squared
Difference of Residuals 3296.18 40
20
Sum of Squared
Residuals 3279.98 0
0 5 10 15 20 25 30
Durbin-Watson Zam an
Statistic 1.00494
∑ (e − ei i−1 )2
3296.18
D= i= 2
n
= = 1.00494
3279.98
∑ ei
2
i=1
Copyright ©2014 Pearson Education
Pozitif Otokorelasyon İçin Test
Etme (devamı)
SYX SYX
Sb1 = =
XKT ∑ (X i − X) 2
b1 Sb1
b1 − β 1 0.10977 − 0
t STAT = = = 3.32938
Sb 0.03297
1
H0: β1 = 0
Test İstatistiği: tSTAT = 3.329 H1: β1 ≠ 0
s.d.= 10- 2 = 8
α/2=.025 α/2=.025
Karar: H0‘ı Reddet
Ev alanının (feet-kare) ev
H0 ’ı Reddet
-tα/2 0
H ’ı Reddetme H ’ı Reddet
tα/2 0
fiyatlarını etkilediği
-2.3060
0
2.3060 3.329 yönünde yeterli kanıt
mevcuttur
Copyright ©2014 Pearson Education
Eğimle İlgili Çıkarımlar:
t Testi Örneği
H0: β1 = 0
H1: β1 ≠ 0
Excel Çıktısından:
Coefficients Standard Error t Stat P-value
Intercept 98.24833 58.03348 1.69296 0.12892
Square Feet 0.10977 0.03297 3.32938 0.01039
p-değeri
Karar: p-değeri < α olduğundan H0’ı reddet
Ev alanının (feet-kare) ev fiyatlarını
etkilediği yönünde yeterli kanıt mevcuttur.
Copyright ©2014 Pearson Education
Anlamlılık İçin F Testi
RKT
MSR =
k
HKT
MSH =
n − k −1
FSTAT , k pay ve (n – k - 1) payda serbestlik derecesine sahip F
dağılımına uymaktadır
(k = regresyon modelindeki bağımsız değişkenlerin sayısı)
Regression Statistics
Multiple R 0.76211
MSR 18934.9348
R Square 0.58082 FSTAT = = = 11.0848
Adjusted R Square 0.52842 MSH 1708.1957
Standard Error 41.33032
Observations 10 1 ve 8 serbestlik F testi için
dereceleriyle p-değeri
ANOVA
df SS MS F Significance F
Regression 1 18934.9348 18934.9348 11.0848 0.01039
Residual 8 13665.5652 1708.1957
Total 9 32600.5000
Test istatistiği
r -ρ
t STAT = (n – 2 serbestlik derecesiyle)
2
1− r
n−2 r = + r 2 if b1 > 0
r = − r 2 if b1 < 0
r −ρ .762 − 0
t STAT = = = 3.329
1− r2 1 − .762 2
n−2 10 − 2
r −ρ .762 − 0 Karar:
t STAT = = = 3.329
H0’ı reddet
1− r2 1 − .762 2
n−2 10 − 2 Conclusion:
%5 önem
s.d. = 10-2 = 8
seviyesinde bir
doğrusal
α/2=.025 α/2=.025
etkileşim
olduğuna dair
H0’ı reddet H0’ı reddetme H ’ı reddet
kanıt vardır
-tα/2 tα/2 0
0
-2.3060 2.3060
3.329
Copyright ©2014 Pearson Education
Ortalama Değerlerinin Tahmini
ve Bağımsız Değerlerin Çıkarımı
Amaç: Verilen bir Xi için Y’nin değeriyle ilgili
Xi belirsizliğin aktarılması için Y etrafındaki
verildiğinde aralıkları oluşturmak
Y’nin
ortalaması
Y ∧
Y
için Güven
aralığı
∧
Y = b0+b1Xi
Xi verildiğinde,
bağımsız bir Y
değerinin tahmin
aralığı Xi X
Copyright ©2014 Pearson Education
X Verildiğinde Ortalama Y Değeri
İçin Güven Aralığı
Belirli bir Xi verildiğinde Y’nin ortalama
değeri için güven aralığı tahmini
1 (X i − X) 2
Ŷ ± t 0.025S YX + = 317.85 ± 37.12
n
∑ (X i − X) 2
1 (X i − X) 2
Ŷ ± t 0.025S YX 1 + + = 317.85 ± 102.28
n
∑ (X i − X) 2
Excel’de
PHStat | regression | simple linear regression …
sıralamasını kullan
Girdi değerleri
∧
Y