Download as pdf or txt
Download as pdf or txt
You are on page 1of 10

12/18/2017

Regresi
Linear

Statistik

1
12/18/2017

REGRESI LEAST SQUARES


Ada dua pendekatan curve fitting:
Regresi: pendekatan “terbaik” di sekitar data yang ada tidak harus
melalui semua data.

REGRESI LINEAR
Tinjauan kasus: n-pasangan data (xi,yi) didekati dengan garis lurus
y = ao + alx + e.
Dalam pers tsb, e = kesalahan/residu = penyimpangan antara harga
yang sebenarnya dengan harga pendekatan pers garis lurus tsb.

Fitting Terbaik

2
12/18/2017

Kesalahan Pendekatan, ERROR

Transformasi
Linearisasi hubungan tak linear

3
12/18/2017

4
12/18/2017

Linear Regression
Assume n points, with each point having values of both an independent
variable x and a dependent variable y.

The values of x are x1 , x2 , x3 ,...., xn .


The values of y are y1 , y2 , y3 ,...., yn .
A best-fitting straight line equation
will have the form
y = a1 x + a0
9

Preliminary Computations
1 n
x = sample mean of the x values = ∑ xk
n k =0
1 n
y = sample mean of the y values = ∑ yk
n k =0
1 n 2
x = sample mean-square of the x values = ∑ xk
2

n k =1
1 n
xy = sample mean of the product xy = ∑ xk yk
n k =1
10

5
12/18/2017

Best-Fitting Straight Line


a1 =
( xy ) − ( x )( y )
( )
x 2
− ( x )
2

a0 =
( x ) ( y ) − ( x )( xy )
2

(x )−(x)2 2

Alternately, a0 = y − a1 x
y = a1 x + a0
11

Example 13-1. Find best fitting straight


line equation for the data shown below.
x 0 1 2 3 4 5 6 7 8 9
y 4.00 6.10 8.30 9.90 12.40 14.30 15.70 17.40 19.80 22.30

1 10 0 + 1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 45
x = ∑ xk = = = 4.50
10 k =1 10 10

1 10 4 + 6.1 + 8.3 + 9.9 + 12.4 + 14.3 + 15.7 + 17.4 + 19.8 + 22.3


y= ∑
10 k =1
yk =
10
130.2
= = 13.02
10

12

6
12/18/2017

Example 13-1. Continuation.


1 10 2
x2 = ∑ xk
10 k =1
(0) 2 + (1) 2 + (2)2 + (3)2 + (4) 2 + (5) 2 + (6) 2 + (7) 2 + (8) 2 + (9)2
=
10
285
= = 28.50
10
1 10
xy = ∑ xk yk
10 k =1
0 + 6.1 + 16.6 + 29.7 + 49.6 + 71.5 + 94.2 + 121.8 + 158.4 + 200.7
=
10
748.6
= = 74.86
10
13

Example 13-1. Continuation.


a1 =
( xy ) − ( x )( y ) = 74.86 − (4.50)(13.02)
( )
x 2
− ( x )
2
28.50 − (4.50) 2

16.27
= =1.9721
8.250
a0 = y − a1 x = 13.02 − 1.972 × 4.50 = 4.1455

y = 1.9721x + 4.1455

14

7
12/18/2017

y
25

y = 1.9721x + 4.1455
R² = 0.9973

20

15

y
Linear (y)

10

0
0 1 2 3 4 5 6 7 8 9 10
15

Example 13-1. Continuation.


>> x = 0:9;
>> yapp = 1.9721*x + 4.1455;
>> y = [the 10 values of y];
>> plot(x, yapp, x, y, 'o')

The best-fit plot and the actual points are shown on the next slide.

16

8
12/18/2017

17

18

9
12/18/2017

Koefisien determinasi

Koefisien determinasi (R 2 ) pada intinya mengukur seberapa jauh


kemampuan model dalam menerangkan variasi variabel dependen. Nilai
koefisien determinasi adalah antara nol dan satu. Nilai R2 = yang kecil
berarti kemampuan variabel-variabel independen dalam menjelaskan
variasi variabel dependen amat terbatas. Nilai yang mendekati satu
berarti variabel-variabel independen memberikan hampir semua
informasi yang dibutuhkan untuk memprediksi variasi variabel dependen.
Secara umum koefisien determinasi untuk data silang (crossection) relatif
rendah karena adanya variasi yang besar antara masing-rnasing
pengamatan, sedangkan untuk data runtun waktu (time series) biasanya
mempunyai nilai koefisien determinasi yang tinggi.

19

Kelemahan mendasar penggunaan koefisien determinasi adalah bias


terhadap jumlah variabel independen yang dimasukkan kedalam model.
Setiap tambahan satu variabel independen, maka R2 pasti meningkat
tidak perduli apakah variabel tersebut berpengaruh secara signifikan
terhadap variabel dependen. Oleh karena itu banyak peneliti
menganjurkan untuk menggunakan nilai Adjusted R2 pada saat
mengevaluasi mana model regresi terbaik. Tidak seperti R2 , nilai Adjusted
R 2 dapat naik atau turun apabila satu variabel independen ditambahkan
kedalam model. Dalam kenyataan nilai adjusted R 2 dapat bernilai negatif,
walaupun yang dikehendaki harus bernilai positif. Menurut Gujarati (2003)
jika dalam uji empiris didapat nilai adjusted R 2 negatif, maka nilai
adjusted R 2 dianggap bernilai nol. Secara matematis jika nilai R2 = 1,
maka Adjusted R2 = R2 = I sedangkan jika nilai R 2 = 0, maka adjusted R 2 =
(1 - k)/(n - k). Jika k > 1 , maka adjusted R= akan bernilai negative.

20

10

You might also like