Welcome to Scribd!

#Read Data

Uploaded by

0% found this document useful (0 votes)

12 views2 pages

1. The document discusses preprocessing an airline survey dataset for analysis and prediction of customer satisfaction. Random forest is used for prediction and the four most important predictors are identified. 2. K-means clustering is used to analyze the data, and the elbow method suggests K=2 clusters. A 2D plot is generated to visualize the clusters based on two selected features. 3. The clusters show that older customers are more likely to travel in higher classes, so the document recommends the airline offer different class discounts tailored to different age groups.

Original Description:

Original Title

HW3

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as pdf or txt

0% found this document useful (0 votes)

12 views2 pages

#Read Data

Uploaded by

jay Wu

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as pdf or txt

Jump to Page

You are on page 1of 2

Search inside document

資料分析前置作業處理

#Read Data
air <- read.csv('airline_survey.csv')
#Remove useless features
air <- air[,-c(1,2)]
air[is.na(air)] <- 0
#Label Encoding
air$Gender <- as.numeric(factor(air$Gender))
air$Customer.Type <- as.numeric(factor(air$Customer.Type))
air$Type.of.Travel <- as.numeric(factor(air$Type.of.Travel))
air$Class <- as.numeric(factor(air$Class))
1.第一題
#Predict satisfaction
我選擇隨機森林來預測
air$satisfaction <- factor(air$satisfaction)
library(randomForest)
rf <- randomForest(satisfaction ~.,data = air)
#Evaluation
importance(rf)
#查看各個變數的重要度
varImpPlot(rf,sort = TRUE)
取大於4000的變數，分別有Online.boarding,inflight.wifi.serivce, Type.of.Travel, Class
四個
2.第二題
我用Kmeans來分析
library(factoextra)
fviz_nbclust(air[1:5000,-23],kmeans,method = "wss",k.max = 5)

我選K=2
fviz_nbclust(air[1:5000,c(3,5)],kmeans,method = "wss",k.max = 5)
km <- kmeans(scale(air[1:5000,c(3,5)]),2)
fviz_cluster(km,data = air[1:5000,c(3,5)],
palette = c("#00AFBB","#E7B800"),
geom = "point",
ellipse.type = "convex",
ggtheme = theme_bw())

由資料可知年齡稍長的人搭乘較高等
艙等的機率得比較大，因此航空公司可以根據不同年齡層有不同艙等的優惠。

R Basics Hands On
Document4 pages
R Basics Hands On
murugan
0% (2)
Codes
Document14 pages
Codes
Arvind NANDAN SINGH
No ratings yet
Data Manipulation R
Document13 pages
Data Manipulation R
uma
No ratings yet
1.1 Loading The Data: Survival by Sex
Document6 pages
1.1 Loading The Data: Survival by Sex
k767
No ratings yet
R 1-4 Prog
Document5 pages
R 1-4 Prog
Professor
No ratings yet
Data Service Pagination
Document5 pages
Data Service Pagination
Rajiv Gandhi
No ratings yet
PySpark CheatSheet Edureka
Document1 page
PySpark CheatSheet Edureka
BL Pipas
No ratings yet
PowerCLI Reference v01
Document4 pages
PowerCLI Reference v01
diginetz
No ratings yet
CH 5
Document3 pages
CH 5
Anonymous
No ratings yet
#Factoring: #Importingtitanic
Document17 pages
#Factoring: #Importingtitanic
Sheikh Sahil Mobin
No ratings yet
Assignment 11-17-15: Michael Petzold November 19, 2015
Document4 pages
Assignment 11-17-15: Michael Petzold November 19, 2015
mikey p
No ratings yet
R Lab Programs
Document19 pages
R Lab Programs
mdqhizar1211125
No ratings yet
Copy Entire Document Content in R Studio
Document17 pages
Copy Entire Document Content in R Studio
Shashank Cooled Rana
No ratings yet
R语言基础入门指令 (tips)
Document14 pages
R语言基础入门指令 (tips)
s2000152
No ratings yet
ANZ Virtual Internship Module Model Answer For Task 1
Document7 pages
ANZ Virtual Internship Module Model Answer For Task 1
Lily Wang
No ratings yet
R Lab Program
Document21 pages
R Lab Program
Sachin Shimogha
No ratings yet
Advance Python Sheet 1696337837
Document237 pages
Advance Python Sheet 1696337837
Anjineyulu Naik
No ratings yet
Advanced Python Cheatsheet
Document200 pages
Advanced Python Cheatsheet
David EsparzaArellano
No ratings yet
R Solution
Document6 pages
R Solution
Royal Shiv
No ratings yet
R Commands
Document18 pages
R Commands
Khizra Amir
No ratings yet
Copy Entire Document Content in R Studio: R Script Compiled by Mr. Anup Sharma (Strictly To Be Used As Class Notes)
Document15 pages
Copy Entire Document Content in R Studio: R Script Compiled by Mr. Anup Sharma (Strictly To Be Used As Class Notes)
Ashish kumar Thapa
No ratings yet
RSQLML Final Slide 15 June 2019 PDF
Document196 pages
RSQLML Final Slide 15 June 2019 PDF
Thanthirat Thanwornwong
No ratings yet
R Code For Canonical Correlation Analysis
Document10 pages
R Code For Canonical Correlation Analysis
Jose Luis Jurado Zurita
No ratings yet
Awab R 2.5
Document3 pages
Awab R 2.5
silvapi1994
No ratings yet
Python Essentials - Part 2
Document10 pages
Python Essentials - Part 2
m-imran
No ratings yet
Assignment 7
Document6 pages
Assignment 7
dash
No ratings yet
Assignment
Document2 pages
Assignment
shafaq tanveer
No ratings yet
New Text Document
Document7 pages
New Text Document
Gaurav Soni
No ratings yet
R Studio
Document25 pages
R Studio
N K
No ratings yet
List of Functions
Document7 pages
List of Functions
Cyd Duque
No ratings yet
Invoke TrimarcADChecks
Document10 pages
Invoke TrimarcADChecks
krishna
No ratings yet
QR
Document2 pages
QR
Lord Jupiter
No ratings yet
Recurring Instances Macro
Document5 pages
Recurring Instances Macro
Poojitha Surisetti
No ratings yet
R Assignment
Document8 pages
R Assignment
Tuna
No ratings yet
Advance Concept of SQL
Document3 pages
Advance Concept of SQL
Hasnine Mirza
No ratings yet
Source Code Python Jemmy
Document7 pages
Source Code Python Jemmy
Fadilah Riczky
No ratings yet
Test
Document166 pages
Test
Anonymous WOFRcJh
No ratings yet
Folder Creation 04012022
Document11 pages
Folder Creation 04012022
vinitha mohanraj
No ratings yet
Untitled
Document2 pages
Untitled
Oussama Oussama
No ratings yet
Net
Document4 pages
Net
ZizoAziz
No ratings yet
Pyspark Commands
Document12 pages
Pyspark Commands
Rambabu Giduturi
No ratings yet
20BCP021 Assignment 6
Document15 pages
20BCP021 Assignment 6
chatgptplus4us
No ratings yet
R Code
Document5 pages
R Code
Sankar Susarla
No ratings yet
Issue With Matrix
Document6 pages
Issue With Matrix
Tarun
No ratings yet
AD Privileged Audit - ps1
Document24 pages
AD Privileged Audit - ps1
Adegbola Oluwaseun
No ratings yet
4eml Crud
Document2 pages
4eml Crud
sai b
No ratings yet
Import As Import As From Import Import As Matplotlib Import Import
Document5 pages
Import As Import As From Import Import As Matplotlib Import Import
Sangeetha Kaligiti
No ratings yet
Mtgainstalog 3
Document27 pages
Mtgainstalog 3
wharrgarble
No ratings yet
#Print ("/n",gain) : Len Len
Document3 pages
#Print ("/n",gain) : Len Len
ass08889
No ratings yet
Pruebas de Bondad de Ajuste Con Library Rrisk en R
Document35 pages
Pruebas de Bondad de Ajuste Con Library Rrisk en R
jrestadisticos
No ratings yet
Audit
Document7 pages
Audit
Андрей Миксонов
No ratings yet
Subset Selection Class Assignment
Document5 pages
Subset Selection Class Assignment
Aashu Nema
No ratings yet
Clase 5.2
Document4 pages
Clase 5.2
Rafexo Mamani
No ratings yet
02) Duplicating - Databse - From - Non - Rac - To - Rac
Document18 pages
02) Duplicating - Databse - From - Non - Rac - To - Rac
mnsamysuresh
No ratings yet
Statistics With R Programming For Bigdata (Autosaved)
Document41 pages
Statistics With R Programming For Bigdata (Autosaved)
rohithmahendran1305
No ratings yet
R Tutorial
Document11 pages
R Tutorial
udhai170819
No ratings yet
MLR Version2
Document6 pages
MLR Version2
Melanie Samsona
No ratings yet
AIML Lab - Ws10
Document9 pages
AIML Lab - Ws10
lucky one
No ratings yet
This Script For Azure To AWS VPN Connectinon of Win2k12 R2
Document3 pages
This Script For Azure To AWS VPN Connectinon of Win2k12 R2
Orsu Prem
No ratings yet
The Essential R Reference
From Everand
The Essential R Reference
Mark Gardener
No ratings yet
Micro Real Final S2022 Solns PDF
Document9 pages
Micro Real Final S2022 Solns PDF
jay Wu
No ratings yet
211 試玩
Document1 page
211 試玩
jay Wu
No ratings yet
110307044吳松杰財管一經濟學L3
Document7 pages
110307044吳松杰財管一經濟學L3
jay Wu
No ratings yet
吳松杰 RLAB 4
Document1 page
吳松杰 RLAB 4
jay Wu
No ratings yet