lenh trong R

You might also like

Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 2

Kiểm tra, cài đặt thư mục làm việc

> getwd() Kiểm tra thư mục hiện tại

> setwd() Cài đặt thư mục làm việc

• Import file csv vào môi trường R

> trainSet <- read.csv("credit_train.csv")

• Kiểm tra package, thêm package:

> library("caret")

> install.packages("caret")

> library("caret") load lại sau khi install để hoạt động.

• Chia nhỏ dataset, nhằm đưa ra dự báo:

> set.seed(2142) Hàm này là hàm đưa ra các con số random khi thực hiện giả lập

> trainVector <- createDataPartition(trainSet$default,p=0.8,list="FALSE")

> trainSetN <- trainSet[trainVector,]

> nrow(trainSetN) Kiểm tra cột của tệp data trainSetN mới

> testSet <- trainSet[-trainVector,]

> nrow(testSet)

> install.packages("tree")

> library(tree)

> credit_tree <- tree(default ~ .,data=trainSetN)

> plot(credit_tree)

> credit_tree

> text(credit_tree,all = T) Sau dòng lệnh này, sẽ xuất hiện biểu đồ hình cây thể hiện các biến sắp xếp theo Yes & No.

> credit_predictions<-predict(credit_tree, testSet)

> credit_predictions

Hiển thị dự báo phần trăm Yes và No, các biến sau nhằm loại trừ, và so sánh kết quả:

> c1<-rep("Yes",nrow(credit_predictions))

> for(i in 1:nrow(credit_predictions)

+{

+ if(credit_predictions[i,1]>credit_predictions[i,2])

+ c1[i]<-"No"

+}
> c2<-rep("Yes",length(testSet$default))

> for (i in 1:length(testSet$default))

+{

+ if(testSet$default[i]=="no")

+ c2[i]<-"No"

+}

> mean(c2 ==c1)

Kết quả sẽ ra là 0.7222

You might also like