Welcome to Scribd!

R Code Cars Data

Uploaded by

0% found this document useful (0 votes)

6 views2 pages

This document connects to a local Spark cluster, loads the mtcars dataset, performs summary statistics, linear regression modeling, predictions, k-means clustering with 3 clusters, and plots the results. It loads necessary libraries, copies the mtcars data to Spark, calculates summary stats, builds a linear regression model on mpg with hp and wt as features, makes predictions, builds a k-means clustering model with 3 clusters on hp and wt, assigns clusters, and plots a scatterplot of the clustered data.

Original Description:

Original Title

R code Cars Data

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as pdf or txt

0% found this document useful (0 votes)

6 views2 pages

R Code Cars Data

Uploaded by

abu nayam muhammad Salim

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as pdf or txt

Jump to Page

You are on page 1of 2

Search inside document

system("java -version")

# Load necessary libraries

library(sparklyr)
library(dplyr)
library(ggplot2)

spark_install()

# Connect to Spark cluster

sc <- spark_connect(master = "local")

# Create a Spark DataFrame from the mtcars dataset

mtcars_spark <- copy_to(sc, mtcars, overwrite = TRUE)
mtcars_spark
# Summary statistics
summary_stats <- mtcars_spark %>%
summarize(
avg_mpg = mean(mpg),
avg_hp = mean(hp),
avg_wt = mean(wt),
max_mpg = max(mpg),
max_hp = max(hp),
max_wt = max(wt)
)

print(summary_stats, na.rm = TRUE)

# Scatter plot
mtcars_spark %>%
collect() %>%
ggplot(aes(x = hp, y = mpg)) +
geom_point() +
ggtitle("Horsepower vs. MPG") +
xlab("Horsepower") +
ylab("MPG")

# Linear regression model

linear_model <- mtcars_spark %>%
ml_linear_regression(response = "mpg", features = c("hp", "wt"))

# Model summary
summary(linear_model)

# Make predictions using the linear regression model

linear_predictions <- ml_predict(linear_model, mtcars_spark)

# Display linear regression predictions

head(linear_predictions)

#########################################
# K-means clustering model
k <- 3
kmeans_model <- mtcars_spark %>%
ml_kmeans(k = k, features = c("hp", "wt"))

# Make predictions (assign clusters)

clustered_data <- mtcars_spark %>%
ml_predict(kmeans_model) %>%
mutate(cluster = as.factor(prediction + 1)) # Adding 1 because cluster
indices start from 0 in sparklyr
# Display clustered data
head(clustered_data)

# Visualization of clusters
clustered_data %>%
collect() %>%
ggplot(aes(x = hp, y = wt, color = cluster)) +
geom_point() +
ggtitle("K-Means Clustering (k=3)") +
xlab("Horsepower") +
ylab("Weight")

# Disconnect from the Spark cluster

spark_disconnect(sc)

Notes Viz
Document79 pages
Notes Viz
Beni Djohan
100% (1)
Visualizing Big Data With Trelliscope
Document7 pages
Visualizing Big Data With Trelliscope
Octavio Flores
No ratings yet
Writing Efficient R Code
Document5 pages
Writing Efficient R Code
Octavio Flores
No ratings yet
Spark Job Dataproc
Document4 pages
Spark Job Dataproc
Denys Stolbov
No ratings yet
Final Print Py Spark
Document133 pages
Final Print Py Spark
Shivaraj K
No ratings yet
Order Tasks and Milestones Assignment
Document6 pages
Order Tasks and Milestones Assignment
saqib khattak
No ratings yet
C Make Lists
Document3 pages
C Make Lists
Doddy Indrawan
No ratings yet
Scikit Learn Cheat Sheet
Document9 pages
Scikit Learn Cheat Sheet
burhan ök
No ratings yet
Final Coding
Document6 pages
Final Coding
Sasikala Rajendran
No ratings yet
Package Automl': R Topics Documented
Document12 pages
Package Automl': R Topics Documented
LESALINAS
No ratings yet
2324 BigData Lab3
Document6 pages
2324 BigData Lab3
Elie Al Howayek
No ratings yet
R Programs
Document12 pages
R Programs
samuel sam
No ratings yet
RSQLML Final Slide 15 June 2019 PDF
Document196 pages
RSQLML Final Slide 15 June 2019 PDF
Thanthirat Thanwornwong
No ratings yet
ESTIVEN - HURTADO.SANTOS - Analytics, De, Data, No, Estructurada - Machine, Learning - ESTIVEN - HURTADO.SANTOS - Ipynb - Colaboratory
Document5 pages
ESTIVEN - HURTADO.SANTOS - Analytics, De, Data, No, Estructurada - Machine, Learning - ESTIVEN - HURTADO.SANTOS - Ipynb - Colaboratory
Estiven Hurtado Santos
No ratings yet
MTH 4407 - Group 2 (Dr. Farid Zamani) - Lecture 2
Document25 pages
MTH 4407 - Group 2 (Dr. Farid Zamani) - Lecture 2
Auni syakirah
No ratings yet
How To Statspack
Document7 pages
How To Statspack
WeiChr
No ratings yet
Python Code
Document7 pages
Python Code
Gnan Shetty
No ratings yet
8 Ejercicio - Optimización y Guardado de Modelos - Training - Microsoft Learn Ingles
Document13 pages
8 Ejercicio - Optimización y Guardado de Modelos - Training - Microsoft Learn Ingles
acxel david castillo casas
No ratings yet
Control Flow - Looping
Document18 pages
Control Flow - Looping
Nur Syazliana
No ratings yet
The Power of Logic Thought Belongs To Discrete Event Fount
Document69 pages
The Power of Logic Thought Belongs To Discrete Event Fount
ssfofo
No ratings yet
Question Bank Class 8 2015 2016 1
Document44 pages
Question Bank Class 8 2015 2016 1
18 DEY ARGHYA 6C
No ratings yet
Regression Linaire Python Tome II
Document10 pages
Regression Linaire Python Tome II
Elisée TEGUE
No ratings yet
Machine Leaarning
Document32 pages
Machine Leaarning
Luis Eduardo Calderon Canto
No ratings yet
Tree
Document7 pages
Tree
indigalakishore
No ratings yet
QB 1
Document11 pages
QB 1
ksaikrishna5601
No ratings yet
Package Inpdfr': R Topics Documented
Document29 pages
Package Inpdfr': R Topics Documented
ahrounish
No ratings yet
Time Series Analysis in Spark SQL
Document5 pages
Time Series Analysis in Spark SQL
JP Vijaykumar
No ratings yet
JAVA - Coding
Document22 pages
JAVA - Coding
Manjula OJ
No ratings yet
Lisp Align Text in Autocad
Document26 pages
Lisp Align Text in Autocad
Aasdas
No ratings yet
The Power of Logic Thought Belongs To Discrete Event Fount
Document72 pages
The Power of Logic Thought Belongs To Discrete Event Fount
ssfofo
No ratings yet
Title: To Implement Logistic Regression in R
Document4 pages
Title: To Implement Logistic Regression in R
Swapnil More
No ratings yet
R Lab Program
Document20 pages
R Lab Program
Radhiyadevi Chinnasamy
No ratings yet
C Make Lists
Document11 pages
C Make Lists
daspeperka
No ratings yet
Functions and Packages
Document7 pages
Functions and Packages
Nur Syazliana
No ratings yet
Data Mining Exercise 3
Document11 pages
Data Mining Exercise 3
Mohamed Boukhari
No ratings yet
Java Programs LAB SESSION
Document38 pages
Java Programs LAB SESSION
tejasmuradi1
No ratings yet
Advt Da
Document13 pages
Advt Da
Devendhiran Dasarathan
No ratings yet
Maxbox Starter60 Machine Learning
Document8 pages
Maxbox Starter60 Machine Learning
Max Kleiner
No ratings yet
Deep Learning For Predictive Maintenance - Artificial - Intelligence - For - Iot - Cookbook
Document27 pages
Deep Learning For Predictive Maintenance - Artificial - Intelligence - For - Iot - Cookbook
mahmoudahmed.rta
No ratings yet
Time Series Forecasting Using Deep Learning - MATLAB & Simulink
Document7 pages
Time Series Forecasting Using Deep Learning - MATLAB & Simulink
Pradeep Singla
No ratings yet
Assignment-1 80501
Document6 pages
Assignment-1 80501
rishabh7arora
No ratings yet
05 Functions
Document6 pages
05 Functions
jen
No ratings yet
CMake Lists
Document7 pages
CMake Lists
artem.matalytskij
No ratings yet
Estimatr::: Cheat Sheet
Document1 page
Estimatr::: Cheat Sheet
fcgarcia
No ratings yet
PsychoPy Python To Javascript Crib Sheet
Document23 pages
PsychoPy Python To Javascript Crib Sheet
courursula
No ratings yet
Forecast R
Document16 pages
Forecast R
hectorla03
No ratings yet
Spark
Document6 pages
Spark
sholyfila
No ratings yet
C-721 Inclass Assignment W-13 Working With R Report Progress Spatial Data Analysis: Introduction To Raster Processing
Document8 pages
C-721 Inclass Assignment W-13 Working With R Report Progress Spatial Data Analysis: Introduction To Raster Processing
ELI
No ratings yet
Connection Pooling: Objects and Will Keep Them in A Separate Base Object Called Pool Object
Document2 pages
Connection Pooling: Objects and Will Keep Them in A Separate Base Object Called Pool Object
davinder
No ratings yet
Spark Kafka Tutorial
Document6 pages
Spark Kafka Tutorial
ahmed_sft
No ratings yet
R Machine Learning PDF
Document137 pages
R Machine Learning PDF
Anonymous NoermyAEpd
No ratings yet
Pyspark File Commands and Theory
Document29 pages
Pyspark File Commands and Theory
karangole7074
No ratings yet
Library
Document1 page
Library
Eben-ezer Ayanou
No ratings yet
StingraySoftware_notebook
Document28 pages
StingraySoftware_notebook
Sumit Kumar Jaiswal
No ratings yet
Documentation Pchart
Document217 pages
Documentation Pchart
c201581
No ratings yet
Package Montecarlo': R Topics Documented
Document9 pages
Package Montecarlo': R Topics Documented
David Humphrey
No ratings yet
Final Project - Regression Models
Document35 pages
Final Project - Regression Models
Caio Henrique Konyosi Miyashiro
100% (1)
Programming With JDBC Apache Sample Programs
Document25 pages
Programming With JDBC Apache Sample Programs
Titu Abdu Ahmad
No ratings yet
Cadence To Matlab Tutorial
Document3 pages
Cadence To Matlab Tutorial
petricli
No ratings yet
Computer Engineering Laboratory Solution Primer
From Everand
Computer Engineering Laboratory Solution Primer
Karan Bhandari
No ratings yet