Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 9

RESPONSI PJJ 25 APR 2022/2ST1/ANAREG P

VENY NURHAYANI/212011300/094W1TM

2022-04-25

LIBRARY
library(haven) # untuk impor data dengan ekstensi .sav

## Warning: package 'haven' was built under R version 4.1.3

library(olsrr) # untuk memperoleh beberapa ukuran dari model regresi

## Warning: package 'olsrr' was built under R version 4.1.3

##
## Attaching package: 'olsrr'

## The following object is masked from 'package:datasets':


##
## rivers

Impor data dari file SPSS (sesuai directory penyimpanan)


## # A tibble: 6 x 25
## No X1 X2 X3 X4 X5 X6 X7 X8 Y ln_Y
ZNo
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl+lb> <dbl+l> <dbl+l> <dbl> <dbl>
<dbl>
## 1 2 5.1 59 66 1.7 39 0 [Male] 0 [Non~ 0 [Non~ 403 6.00
-1.68
## 2 11 6.3 84 83 4.13 37 0 [Male] 1 [Mod~ 0 [Non~ 745 6.61
-1.39
## 3 17 6 85 28 2.98 36 1 [Fema~ 1 [Mod~ 0 [Non~ 682 6.53
-1.20
## 4 18 3.7 51 41 1.55 39 0 [Male] 0 [Non~ 0 [Non~ 205 5.32
-1.17
## 5 21 5.2 52 76 2.85 39 0 [Male] 0 [Non~ 0 [Non~ 359 5.88
-1.07
## 6 23 6.7 26 68 2.1 30 0 [Male] 0 [Non~ 1 [Hea~ 599 6.40
-1.01
## # ... with 13 more variables: ZX1 <dbl>, ZX2 <dbl>, ZX3 <dbl>, ZX4 <dbl>,
## # ZX5 <dbl>, ZY <dbl>, Zln_Y <dbl>, survival <dbl+lbl>,
## # KELOMPOK_USIA <dbl+lbl>, PRE_1 <dbl>, RES_1 <dbl>, PRE_2 <dbl>, RES_2
<dbl>

DEFINISIKAN VARIABEL DEPENDEN DAN VARIABEL INDEPENDEN


Y <- datap9$Y # Y: survival time
X1 <- datap9$X1 # X1: blood clotting score
X2 <- datap9$X2 # X2: prognostic index
X3 <- datap9$X3 # X3: enzyme function test
X4 <- datap9$X4 # X4: liver function test

FORWARD SELECTION
modelf <- lm(Y ~ X1 + X2 + X3 + X4) # membuat model lengkap
ols_step_forward_p(modelf, p = 0.05, progress = TRUE) # prosedur forward
selection

## Forward Selection Method


## ---------------------------
##
## Candidate Terms:
##
## 1. X1
## 2. X2
## 3. X3
## 4. X4
##
## We are selecting variables based on p value...
##
## Variables Entered:
##
## - X4
## - X3
## - X2
## - X1
##
##
## Final Model Output
## ------------------
##
## Model Summary
## -----------------------------------------------------------------
## R 0.843 RMSE 190.539
## R-Squared 0.711 Coef. Var 28.951
## Adj. R-Squared 0.700 MSE 36305.136
## Pred R-Squared 0.671 MAE 134.671
## -----------------------------------------------------------------
## RMSE: Root Mean Square Error
## MSE: Mean Square Error
## MAE: Mean Absolute Error
##
## ANOVA
## -------------------------------------------------------------------------
## Sum of
## Squares DF Mean Square F Sig.
## -------------------------------------------------------------------------
## Regression 9206935.916 4 2301733.979 63.4 0.0000
## Residual 3739429.001 103 36305.136
## Total 12946364.917 107
## -------------------------------------------------------------------------
##
## Parameter Estimates

##
-----------------------------------------------------------------------------
-------------------
## model Beta Std. Error Std. Beta t Sig
lower upper
##
-----------------------------------------------------------------------------
-------------------
## (Intercept) -1072.677 142.409 -7.532 0.000
-1355.112 -790.241
## X4 56.062 27.480 0.162 2.040 0.044
1.562 110.563
## X3 9.253 1.117 0.557 8.284 0.000
7.038 11.468
## X2 8.448 1.246 0.408 6.782 0.000
5.977 10.918
## X1 65.686 15.656 0.269 4.195 0.000
34.635 96.736
##
-----------------------------------------------------------------------------
-------------------

##
## Selection Summary

##
----------------------------------------------------------------------------
## Variable Adj.

## Step Entered R-Square R-Square C(p) AIC RMSE

##
----------------------------------------------------------------------------
## 1 X4 0.4610 0.4559 88.1948 1508.7087
256.5677
## 2 X3 0.5674 0.5592 52.2562 1486.9601
230.9461
## 3 X2 0.6618 0.6520 20.6021 1462.3794
205.1846
## 4 X1 0.7112 0.6999 5.0000 1447.3404
190.5391
##
----------------------------------------------------------------------------
Dari output di atas, model terbaik dengan prosedur forward selection adalah model yang
mengandung X1 (blood clotting score), X2 (prognostic index), X3 (enzyme function test),
dan X4 (liver function test).
sehingga diperoleh model regresi terbaik :
𝑌𝑖= -1072.677 + 65.686 X1 + 8.448𝑋2 + 9.253𝑋3 + 56.062 X4
Interpretasi :
2. Nilai konstanta β0 memiliki nilai negatif sebesar -1072,677. Tanda negatif artinya
menunjukkan pengaruh yang berkebalikan antara variabel independen dan variabel
dependen. Hal ini menunjukkan bahwa jika semua variabel independen yang
meliputi Promotional Expenditure (X1), Number of Active Acoount (X2), Number of
Competing (X3) bernilai 0 persen atau tidak mengalami perubahan, maka nilai sales
adalah -1072,677.
3. Nilai koefisien regresi untuk variabel blood clotting score (X1) yaitu sebesar 65,686.
Nilai tersebut menunjukkan pengaruh positif antara variabel blood clotting score
dan survival time. Hal ini artinya jika variabel blood clotting score mengalami
kenaikan sebesar 1%, maka variabel survival time akan mengalami kenaikan
sebesar 65,686. Dengan asumsi bahwa variabel lainnya tetap konstan.

4. Nilai koefisien regresi untuk variabel prognostic index (X2) yaitu sebesar 8,448.
Nilai tersebut menunjukkan pengaruh positif antara variabel prognostic index dan
survival time. Hal ini artinya jika variabel prognostic index mengalami kenaikan
sebesar 1%, maka variabel survival time akan mengalami kenaikan sebesar 8,448.
Dengan asumsi bahwa variabel lainnya tetap konstan.

5. Nilai koefisien regresi untuk variabel enzyme function test (X3) yaitu sebesar 9,253.
Nilai tersebut menunjukkan pengaruh positif antara variabel enzyme function test
dan survival time. Hal ini artinya jika variabel enzyme function test mengalami
kenaikan sebesar 1%, maka variabel survival time akan mengalami kenaikan
sebesar 9,253. Dengan asumsi bahwa variabel lainnya tetap konstan.

6. Nilai koefisien regresi untuk variabel liver function test (X4) yaitu sebesar 56,062.
Nilai tersebut menunjukkan pengaruh positif antara variabel liver function test dan
survival time. Hal ini artinya jika variabel liver function test mengalami kenaikan
sebesar 1%, maka variabel survival time akan mengalami kenaikan sebesar 56,062.
Dengan asumsi bahwa variabel lainnya tetap konstan.

BACKWARD ELIMINATION
ols_step_backward_p(modelf, prem = 0.05, progress = TRUE) # prosedur
backward selection

## Backward Elimination Method


## ---------------------------
##
## Candidate Terms:
##
## 1 . X1
## 2 . X2
## 3 . X3
## 4 . X4
##
## We are eliminating variables based on p value...
##
## Variables Removed:
##
##
## No more variables satisfy the condition of p value = 0.05
##
##
## Final Model Output
## ------------------
##
## Model Summary
## -----------------------------------------------------------------
## R 0.843 RMSE 190.539
## R-Squared 0.711 Coef. Var 28.951
## Adj. R-Squared 0.700 MSE 36305.136
## Pred R-Squared 0.671 MAE 134.671
## -----------------------------------------------------------------
## RMSE: Root Mean Square Error
## MSE: Mean Square Error
## MAE: Mean Absolute Error
##
## ANOVA
## -------------------------------------------------------------------------
## Sum of
## Squares DF Mean Square F Sig.
## -------------------------------------------------------------------------
## Regression 9206935.916 4 2301733.979 63.4 0.0000
## Residual 3739429.001 103 36305.136
## Total 12946364.917 107
## -------------------------------------------------------------------------
##
## Parameter Estimates

##
-----------------------------------------------------------------------------
-------------------
## model Beta Std. Error Std. Beta t Sig
lower upper
##
-----------------------------------------------------------------------------
-------------------
## (Intercept) -1072.677 142.409 -7.532 0.000
-1355.112 -790.241
## X1 65.686 15.656 0.269 4.195 0.000
34.635 96.736
## X2 8.448 1.246 0.408 6.782 0.000
5.977 10.918
## X3 9.253 1.117 0.557 8.284 0.000
7.038 11.468
## X4 56.062 27.480 0.162 2.040 0.044
1.562 110.563
##
-----------------------------------------------------------------------------
-------------------

## [1] "No variables have been removed from the model."

STEPWISE REGRESSION
ols_step_both_p(modelf, progress = TRUE) # prosedur stepwise regression

## Stepwise Selection Method


## ---------------------------
##
## Candidate Terms:
##
## 1. X1
## 2. X2
## 3. X3
## 4. X4
##
## We are selecting variables based on p value...
##
## Variables Entered/Removed:
##
## - X4 added
## - X3 added
## - X2 added
## - X1 added
##
##
## Final Model Output
## ------------------
##
## Model Summary
## -----------------------------------------------------------------
## R 0.843 RMSE 190.539
## R-Squared 0.711 Coef. Var 28.951
## Adj. R-Squared 0.700 MSE 36305.136
## Pred R-Squared 0.671 MAE 134.671
## -----------------------------------------------------------------
## RMSE: Root Mean Square Error
## MSE: Mean Square Error
## MAE: Mean Absolute Error
##
## ANOVA
## -------------------------------------------------------------------------
## Sum of
## Squares DF Mean Square F Sig.
## -------------------------------------------------------------------------
## Regression 9206935.916 4 2301733.979 63.4 0.0000
## Residual 3739429.001 103 36305.136
## Total 12946364.917 107
## -------------------------------------------------------------------------
##
## Parameter Estimates

##
-----------------------------------------------------------------------------
-------------------
## model Beta Std. Error Std. Beta t Sig
lower upper
##
-----------------------------------------------------------------------------
-------------------
## (Intercept) -1072.677 142.409 -7.532 0.000
-1355.112 -790.241
## X4 56.062 27.480 0.162 2.040 0.044
1.562 110.563
## X3 9.253 1.117 0.557 8.284 0.000
7.038 11.468
## X2 8.448 1.246 0.408 6.782 0.000
5.977 10.918
## X1 65.686 15.656 0.269 4.195 0.000
34.635 96.736
##
-----------------------------------------------------------------------------
-------------------

##
## Stepwise Selection Summary

##
-----------------------------------------------------------------------------
-----------
## Added/ Adj.

## Step Variable Removed R-Square R-Square C(p) AIC


RMSE
##
-----------------------------------------------------------------------------
-----------
## 1 X4 addition 0.461 0.456 88.1950
1508.7087 256.5677
## 2 X3 addition 0.567 0.559 52.2560
1486.9601 230.9461
## 3 X2 addition 0.662 0.652 20.6020
1462.3794 205.1846
## 4 X1 addition 0.711 0.700 5.0000
1447.3404 190.5391
##
-----------------------------------------------------------------------------
-----------

sama seperti metode forward selection, Dari output di atas, model terbaik dengan prosedur
backward dan stepwise selection adalah model yang mengandung X1 (blood clotting
score), X2 (prognostic index), X3 (enzyme function test), dan X4 (liver function test).
sehingga diperoleh model regresi terbaik :
𝑌𝑖= -1072.677 + 65.686 X1 + 8.448𝑋2 + 9.253𝑋3 + 56.062 X4
Interpretasi :
2. Nilai konstanta β0 memiliki nilai negatif sebesar -1072,677. Tanda negatif artinya
menunjukkan pengaruh yang berkebalikan antara variabel independen dan variabel
dependen. Hal ini menunjukkan bahwa jika semua variabel independen yang
meliputi Promotional Expenditure (X1), Number of Active Acoount (X2), Number of
Competing (X3) bernilai 0 persen atau tidak mengalami perubahan, maka nilai sales
adalah -1072,677.
3. Nilai koefisien regresi untuk variabel blood clotting score (X1) yaitu sebesar 65,686.
Nilai tersebut menunjukkan pengaruh positif antara variabel blood clotting score
dan survival time. Hal ini artinya jika variabel blood clotting score mengalami
kenaikan sebesar 1%, maka variabel survival time akan mengalami kenaikan
sebesar 65,686. Dengan asumsi bahwa variabel lainnya tetap konstan.

4. Nilai koefisien regresi untuk variabel prognostic index (X2) yaitu sebesar 8,448.
Nilai tersebut menunjukkan pengaruh positif antara variabel prognostic index dan
survival time. Hal ini artinya jika variabel prognostic index mengalami kenaikan
sebesar 1%, maka variabel survival time akan mengalami kenaikan sebesar 8,448.
Dengan asumsi bahwa variabel lainnya tetap konstan.

5. Nilai koefisien regresi untuk variabel enzyme function test (X3) yaitu sebesar 9,253.
Nilai tersebut menunjukkan pengaruh positif antara variabel enzyme function test
dan survival time. Hal ini artinya jika variabel enzyme function test mengalami
kenaikan sebesar 1%, maka variabel survival time akan mengalami kenaikan
sebesar 9,253. Dengan asumsi bahwa variabel lainnya tetap konstan.

6. Nilai koefisien regresi untuk variabel liver function test (X4) yaitu sebesar 56,062.
Nilai tersebut menunjukkan pengaruh positif antara variabel liver function test dan
survival time. Hal ini artinya jika variabel liver function test mengalami kenaikan
sebesar 1%, maka variabel survival time akan mengalami kenaikan sebesar 56,062.
Dengan asumsi bahwa variabel lainnya tetap konstan.

artinya hasil pemilihan model terbaik dari ketiga metode tersebut tidak jauh berbeda
bahkan menunjukkan hasil yang sama

You might also like