Professional Documents
Culture Documents
Bolum 7
Bolum 7
Tanım: Bir bağımlı değişkenin bir ya da birden çok bağımsız değişken ile
ilişkilendirilmesi, aralarında bağıntı kurulması, bu bağıntının çözümlenmesi
“regresyon (bağlanım)” adını alır.
Regresyon çözümlemesi,
olarak sınıflanabilir.
N sayıda x i ,yi gözlem çifti için basit doğrusal regresyon modeli aşağıdaki gibi
yazılır.
yi 0 1x i i , i 1,2, ,N
X: Bağımsız değişken
Y: Bağımlı değişken
1
Regresyon
doğrusu:
E yi 0 1x i
Tüm kitleyi gözlemek her zaman mümkün olmadığından N tane x i ,yi gözlem
çiftinden n tanesi örnekleme seçilerek “regresyon örneklemi” oluşturulur.
yi b0 b1x i ei , i 1,2, ,n
Burada,
b0 : 0 ’ın tahmini
b1 : 1 ’ın tahmini
ei : i. gözlem için artık değeri. Gözlenen değer ile kestirilen değer arasındaki
farktır ei yi y
ˆi
y
E yi 0 1xi
Örneklem bağlanım
yi doğrusu: ˆ 0 b0
ŷi ˆ 0 ˆ 1xi
i
ˆ1 b1
ŷ i
ŷ i i
ei
yi
x
2
Regresyon Varsayımları:
1. E i 0 , i 1, ,N
Eğer 0 terimi modelde yer alması gerekirken yer almıyorsa bu varsayım
sağlanmayabilir.
2. V i 2 , i 1, ,N yani hatalar sabit ve aynı varyansa sahip olmalıdır
2
1 22 N2 2
Eğer bu varsayım sağlanmazsa değişen varyanslılık sorunu ortaya çıkar.
3. Cov i , j 0, i j için. Hatalar ilişkisiz olmalıdır, bu aynı zamanda
gözlemlerin ilişkisiz olduğu anlamına gelir.
4. İstatistiksel çıkarsamalar için (güven aralıkları, hipotez testleri vb.) hatalar
normal dağılımlı olmalıdır. Yani, i ~ N 0, 2 olmalıdır.
Regresyon Parametrelerinin Tahmini (Kestirimi)-En Küçük Kareler (EKK) Yöntemi:
b0 y b1x
x y
x y i i
n
i i
ÇTxy
b1
xi
2
KTx
x i2 n
x y
ÇTxy x i yi x x yi y x i yi nxy (Çarpımlar toplamı)
i i
i
n
x
2
KTx x x i x x i2 nx 2
i 2
2
i (Kareler toplamı)
n
Örnek 1: 7 tarlaya konan gübre miktarları ile tarlalardan alınan verim miktarları
aşağıda verilmiştir. Bu veri kümesi için uygun regresyon modelini yazınız.
2800 420
Çözüm: n=7 x i 2800 y i 420 x
7
400 y
7
60
x 2
i 1.400.000 y 2
i 26350 x y
i i 184500
3
ÇTxy 16500
b1 0,059
KTx 280000
b0 y b1x 60 (0,059) 400 36,4
b0’ın yorumu: hiç gübre kullanılmadığından tarladan 36,4 birim verim alınır.
b1’in yorumu: gübre miktarındaki 1 birimlik artış, verimde 0,059 birim artışa neden
olur.
Örnek 2: Silindir sayısı ile yakıt tüketimi arasındaki saçılım grafiğini çiziniz ve
yorumlayınız. Regresyon denkleminin bir kestirimini elde ediniz.
4
Saçılım grafiği aşağıdaki biçimde ise, iki değişken arasında doğrusal bir ilişki
yoktur, doğrusal regresyon çözümlemesi yapılamaz.
36 81,7
n=6 x i 36 y i 81,7 x
6
6 y
6
13,62
x 2
i 232 y 2
i 1175,35 x yi i 520,2
ÇTxy 30
b1 1,875
KTx 16
b0 y b1x 13,62 (1,875) 6 2,37
5
b0’ın yorumu: sıfır silindirli araba olmadığından yorumu anlamsızdır.
b1’in yorumu: silindir sayısı 1 arttığında yakıt miktarında 1,875 birimlik artış olur.
Hata varyansı: V i 2
e e e y yˆ
2 2 2
AKT
V ei
ˆ 2
i
i
i i
e 0'dır.
s.d. n2 n2 n2
AKT= yi y
ˆ i : Artık Kareler Toplamı. y’deki toplam değişkenliğin bağımsız
2
BKT y
ˆ i y b1ÇTxy
2
AKT yi y
ˆi KTy BKT
2
AKT
ˆ2
AKO (AKO:Artık Kareler Ortalaması)
n2
6
BKT BKT
BKO BKO (BKO : Bağlanım Kareler Ortalaması)
bağımsız değişken sayısı 1
AKT 176,5
ˆ2
AKO 35,3
n2 5
1 x2 1 4002
ˆ2
Sbo 35,3 5
n KTx 7 280000
ˆ2
35,3
Sb1 0,0112
KTx 280000
BKT
R2
KTy
BKT 973,5
Çözüm: R2 0,85
KTy 1150
7
Verimdeki değişimin %85’i gübre miktarı ile açıklanabilmektedir.
BKT 1 BKO
Test istatistiği: F , F F;1;n2 H0 red
AKT n 2 AKO
Değişim Kaynağı sd KT KO F
Toplam n-1 KTy yi2 ny2 -
BKO BKT 1 BKO
Bağlanım 1 BKT b1ÇTxy F
AKO
Artık n-2 AKT KTy BKT AKO AKT n 2
Örnek 5: Örnek 1’deki veri için elde edilen regresyon modelinin anlamlı
olup olmadığını %5 yanılma düzeyinde hem t hem de F testi ile test ediniz.
Çözüm:
H0 : 1 0 (Doğrusal regresyon denklemi anlamlı değildir)
Hs : 1 0 (Doğrusal regresyon denklemi anlamlıdır)
Varyans çözümleme tablosu:
Değişim Kaynağı sd KT KO F
Toplam 6 1150 -
973,5
Bağlanım 1 973,5 973,5 F 27,58
35,3
Artık 5 176,5 35,3