Welcome to Scribd!

0% found this document useful (0 votes)

39 views

Apache Spark: Dhineshkumar S K

Uploaded by

The document discusses Apache Spark, an open-source cluster computing framework that allows processing of large datasets across clusters of computers. It describes Spark's advantages over Hadoop MapReduce in terms of speed, interactive mode, and latency. The document also outlines Spark's core components, popular use cases across various industries, and examples of companies using Spark for applications such as recommendations, fraud detection, and real-time analytics.

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

CSI 4107 - Winter 2016 - Midterm
Document10 pages
CSI 4107 - Winter 2016 - Midterm
Amin Dhouib
0% (1)
Chapter 25
Document43 pages
Chapter 25
Bicycle Thief
No ratings yet
Ruta de Entrenamiento Base Cloudera Revisada
Document6 pages
Ruta de Entrenamiento Base Cloudera Revisada
thiagos25
100% (1)
A Brief Introduction To Apache Spark
Document10 pages
A Brief Introduction To Apache Spark
Venkatesh Narisetty
No ratings yet
Teradata & Abinitio
Document2 pages
Teradata & Abinitio
Atlury Jeyyadev
No ratings yet
COMP9313: Big Data Management: Course Web Site: HTTP://WWW - Cse.unsw - Edu.au/ cs9313
Document76 pages
COMP9313: Big Data Management: Course Web Site: HTTP://WWW - Cse.unsw - Edu.au/ cs9313
maithuong85
No ratings yet
Hadoop Interviews Q
Document9 pages
Hadoop Interviews Q
S K
No ratings yet
Overview
Document25 pages
Overview
sarvesh_mishra
No ratings yet
HADOOP Based Recommendation Algorithm For Micro-Video URL
Document9 pages
HADOOP Based Recommendation Algorithm For Micro-Video URL
dbpublications
No ratings yet
Hadoop Module 3.2
Document57 pages
Hadoop Module 3.2
Sainath Reddy
100% (1)
RaviKumar Gurrappagari PDF
Document8 pages
RaviKumar Gurrappagari PDF
Benedict Zander
No ratings yet
Ab Initio Tutorials
Document1 page
Ab Initio Tutorials
j_jeevan_j
No ratings yet
Hadoop Interview Questions
Document28 pages
Hadoop Interview Questions
Anand S
No ratings yet
Map Reduce With Hadoop:: Presented by ANIVESHA-126 ARITRA-128 RIA-142 Shashvat - 150 SHEKHAR-151
Document9 pages
Map Reduce With Hadoop:: Presented by ANIVESHA-126 ARITRA-128 RIA-142 Shashvat - 150 SHEKHAR-151
Aritra Banerjee
100% (1)
Hadoop Interview Questions
Document28 pages
Hadoop Interview Questions
jey011851
No ratings yet
Mining Data Streams
Document67 pages
Mining Data Streams
usha
No ratings yet
Apache Hive
Document3 pages
Apache Hive
kual21
No ratings yet
Create An Spark Streaming App: 1. Architecture and Abstraction
Document8 pages
Create An Spark Streaming App: 1. Architecture and Abstraction
Ngô Hoàng
No ratings yet
1 Apache Zookeeper
Document7 pages
1 Apache Zookeeper
atuf
No ratings yet
Kelly Hadoop Hyd May 2018
Document14 pages
Kelly Hadoop Hyd May 2018
dilip kumar
No ratings yet
Unit 4 Hadoop
Document86 pages
Unit 4 Hadoop
ShivanshuSingh
No ratings yet
Edureka Interview Questions - HDFS
Document4 pages
Edureka Interview Questions - HDFS
varunpratap
No ratings yet
Dhanush Bigdata Resume Updated
Document9 pages
Dhanush Bigdata Resume Updated
Nishant Kumar
No ratings yet
Big Data: Business Intelligence, and Analytics
Document31 pages
Big Data: Business Intelligence, and Analytics
Karthigai Selvan
No ratings yet
M.SC - BigData Syllabus
Document123 pages
M.SC - BigData Syllabus
AKASH KUMAR
No ratings yet
Resume
Document4 pages
Resume
shekhar
No ratings yet
Madhur Manchanda: Career Objective
Document2 pages
Madhur Manchanda: Career Objective
madhur manchanda
No ratings yet
6 Frequently Asked Hadoop Interview Questions and Answers: Q1.What Is Hadoop?
Document8 pages
6 Frequently Asked Hadoop Interview Questions and Answers: Q1.What Is Hadoop?
Krish Dhoom
No ratings yet
Data Science Fundamentals - Class1
Document51 pages
Data Science Fundamentals - Class1
Yashwanth Yashu
No ratings yet
Hadoop Admin Download Syllabus PDF
Document4 pages
Hadoop Admin Download Syllabus PDF
shubham phulari
No ratings yet
Traing On Hadoop
Document123 pages
Traing On Hadoop
Shubham
No ratings yet
BigData Unit 2
Document15 pages
BigData Unit 2
Sreedhar Arikatla
No ratings yet
Hadoop I/O: Jaeyong Choi
Document36 pages
Hadoop I/O: Jaeyong Choi
Manognya Reddy
No ratings yet
Srikanth Hadoop
Document4 pages
Srikanth Hadoop
Karthick Thoppan
No ratings yet
Mohit BigData 5yr
Document3 pages
Mohit BigData 5yr
shreya arun
No ratings yet
Introduction To Hadoop & Spark
Document28 pages
Introduction To Hadoop & Spark
Justin Talbot
No ratings yet
Apps DBA Interview Question
Document12 pages
Apps DBA Interview Question
Ramesh Kumar
No ratings yet
PySpark+Slides v1
Document458 pages
PySpark+Slides v1
ravikumar lanka
No ratings yet
HBase Interview Questions
Document12 pages
HBase Interview Questions
pooh06
No ratings yet
Big Data Question Bank
Document15 pages
Big Data Question Bank
kokiladevirajavelu
0% (2)
Hadoop
Document114 pages
Hadoop
asda
No ratings yet
Mining Data Streams (Part 2)
Document56 pages
Mining Data Streams (Part 2)
Haseeb Farooq
No ratings yet
Dice Resume CV SAI KARTHIK
Document4 pages
Dice Resume CV SAI KARTHIK
RAJU P
No ratings yet
Unstructured Dataload Into Hive Database Through PySpark
Document9 pages
Unstructured Dataload Into Hive Database Through PySpark
sayhi2sudarshan
No ratings yet
Apache Spark Installation
Document4 pages
Apache Spark Installation
Harshit Sinha
No ratings yet
Big Data Syllabus For Theory and Lab
Document4 pages
Big Data Syllabus For Theory and Lab
chetana tukkoji
No ratings yet
Hadoop Security S360 2015v8 PDF
Document27 pages
Hadoop Security S360 2015v8 PDF
Luis Demetrio Martinez Ruiz
No ratings yet
Hadoop Admin Interview Question and Answers
Document5 pages
Hadoop Admin Interview Question and Answers
Vivek Kushwaha
No ratings yet
Midhun BIGDATA Curicullum
Document17 pages
Midhun BIGDATA Curicullum
Fukkk
No ratings yet
Spark Training - Java
Document8 pages
Spark Training - Java
Pavan Kumar
No ratings yet
2018 02 08 Whats New in Apache Spark 2 180213220045
Document57 pages
2018 02 08 Whats New in Apache Spark 2 180213220045
shan4u4me
No ratings yet
Dzone Apache Hadoop Deployment
Document7 pages
Dzone Apache Hadoop Deployment
VernFWK
No ratings yet
Hadoop Ecosystem
Document16 pages
Hadoop Ecosystem
poojan thakkar
No ratings yet
NoSQL and MongoDB
Document47 pages
NoSQL and MongoDB
arya1017
No ratings yet
Ankit Rathi Ankit Rathi: Lead Data Architect
Document4 pages
Ankit Rathi Ankit Rathi: Lead Data Architect
Abhishek Vijayvargiya
No ratings yet
HDFS Architecture
Document47 pages
HDFS Architecture
krishan Goyal
No ratings yet
Microsoft - Practicetest.dp 201.v2020!08!07.by - Julissa.92q
Document126 pages
Microsoft - Practicetest.dp 201.v2020!08!07.by - Julissa.92q
rotty
No ratings yet
Hadoop Test
Document8 pages
Hadoop Test
big_fir
100% (1)
Cloudera A Complete Guide - 2019 Edition
From Everand
Cloudera A Complete Guide - 2019 Edition
Gerardus Blokdyk
No ratings yet
Getting Started with Big Data Query using Apache Impala
From Everand
Getting Started with Big Data Query using Apache Impala
Agus Kurniawan
No ratings yet
Computer Vision: Models, Learning and Inference
Document59 pages
Computer Vision: Models, Learning and Inference
PREM KUMAR M
No ratings yet
Data Analytics Using NoSQL
Document50 pages
Data Analytics Using NoSQL
PREM KUMAR M
0% (1)
Python Quick Guide
Document162 pages
Python Quick Guide
PREM KUMAR M
No ratings yet
CheatSheet Python 3 Complex Data Types
Document1 page
CheatSheet Python 3 Complex Data Types
erzaraptor
No ratings yet
Selection Post IX Graduation 08-02-2022 Eng
Document156 pages
Selection Post IX Graduation 08-02-2022 Eng
Vijay singh Tomar
No ratings yet
CS198 Programming Assignment 2
Document4 pages
CS198 Programming Assignment 2
shellnexus
No ratings yet
Flow of Communication: Emergency Response For Oil Spillage
Document5 pages
Flow of Communication: Emergency Response For Oil Spillage
narm n
No ratings yet
Solution of Assignment 5
Document5 pages
Solution of Assignment 5
Reza Borah
100% (1)
1001076002-HT8911 Datasheet - V1.1
Document13 pages
1001076002-HT8911 Datasheet - V1.1
Zhang Ethan
No ratings yet
Revit Programming For Beginners: Dan Mapes Senior BIM Coordinator/Developer at ME Engineers
Document17 pages
Revit Programming For Beginners: Dan Mapes Senior BIM Coordinator/Developer at ME Engineers
jean
No ratings yet
Hydraulic Cable Lugs Crimping Tools
Document6 pages
Hydraulic Cable Lugs Crimping Tools
baolifeng
No ratings yet
International Strategic Alliances 1
Document21 pages
International Strategic Alliances 1
mukesh93567
No ratings yet
Lecture 1 Part 1
Document13 pages
Lecture 1 Part 1
Marianna Klos
No ratings yet
William James - Psychologist
Document5 pages
William James - Psychologist
Cecilia Susai
No ratings yet
Modeling and Simulation of Fluid Catalytic Cracking Unit: Reviews in Chemical Engineering January 2005
Document38 pages
Modeling and Simulation of Fluid Catalytic Cracking Unit: Reviews in Chemical Engineering January 2005
Diyar Ali
No ratings yet
Simultaneous Equations O/L
Document13 pages
Simultaneous Equations O/L
Venuja De Silva
No ratings yet
Bill of Quantity
Document6 pages
Bill of Quantity
Khairoden Sangcopan
No ratings yet
Client Name: Well, Max Birthdate: AGE: 7 Years, 8 Months School: Grade: 1 Dates of Assessment: July, 2011 Date of Report: Assessed By: Flames
Document10 pages
Client Name: Well, Max Birthdate: AGE: 7 Years, 8 Months School: Grade: 1 Dates of Assessment: July, 2011 Date of Report: Assessed By: Flames
api-160674927
No ratings yet
Ultra Dense Network
Document27 pages
Ultra Dense Network
Younes
No ratings yet
900FH&1000FH Turbines
Document12 pages
900FH&1000FH Turbines
Ryan
No ratings yet
1g Rainbow Antimagic Coloring
Document9 pages
1g Rainbow Antimagic Coloring
Rosanita Nisviasari
No ratings yet
Ims555 Grouping Assignment (Ai Deepfakes)
Document23 pages
Ims555 Grouping Assignment (Ai Deepfakes)
NUR A'ISYAH AZIZI
No ratings yet
Refrigerator Freezer: Owner's Manual
Document22 pages
Refrigerator Freezer: Owner's Manual
thai
No ratings yet
Verizon Wiretapping - Comments in Support of MR Cowie's Complaint
Document8 pages
Verizon Wiretapping - Comments in Support of MR Cowie's Complaint
ireport
No ratings yet
Info
Document2 pages
Info
fukinbob
No ratings yet
Anullment CATHOLIC TRIBUNAL
Document20 pages
Anullment CATHOLIC TRIBUNAL
Mons Jr Baturiano
No ratings yet
Ball Mill Capacity Dimensions PAUL O ABBE
Document2 pages
Ball Mill Capacity Dimensions PAUL O ABBE
aghilif
No ratings yet
Statistical Methods For Spatial Data Analysis
Document3 pages
Statistical Methods For Spatial Data Analysis
sakali ali
0% (1)
13-GB 50018-2002-En
Document109 pages
13-GB 50018-2002-En
yyyy071220
100% (1)
Productivity and Leadership Skills
Document22 pages
Productivity and Leadership Skills
Dan Jezreel Esguerra
No ratings yet
Thesis PDF
Document120 pages
Thesis PDF
Prajwal Niraula
No ratings yet
Renewable Energy Sources and Methods
Document225 pages
Renewable Energy Sources and Methods
Semir Đedović
100% (1)
Interactive Physics Manual
Document13 pages
Interactive Physics Manual
Marciano Santamaría
No ratings yet
Bibby Couplings
Document25 pages
Bibby Couplings
Kemoy Johnson
No ratings yet

Apache Spark: Dhineshkumar S K

Uploaded by

PREM KUMAR M

0% found this document useful (0 votes)

39 views31 pages

Original Description:

Original Title

Apache Spark

Copyright

Available Formats

PPTX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as pptx, pdf, or txt

0% found this document useful (0 votes)

39 views31 pages

Apache Spark: Dhineshkumar S K

Uploaded by

PREM KUMAR M

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as pptx, pdf, or txt

Jump to Page

You are on page 1of 31

Search inside document

Apache Spark

DHINESHKUMAR S K
Agenda

 SPARK
 SPARK
 SPARK
What is Spark?

Criteria Spark Hadoop MapReduce

Speed 100 times faster than Equal to the speed of
MapReduce MapReduce
Interactive mode Yes No
Processing type Stream processing Batch processing
Latency Low latency due to in- High latency due to disk-
memory processing oriented processing
Apache Hadoop: Purpose

 “Framework that allows distributed processing of large data sets across clusters of
computers…
 using simple programming models.
 It is designed to scale up from single servers to thousands of machines, each offering local
computation and storage.
 Rather than rely on hardware to deliver high-availability, the library itself is designed to
detect and handle failures at the application layer, so delivering a highly-available service
on top of a cluster of computers, each of which may be prone to failures.”
Job example Driver

val log = sc.textFile(“hdfs://...”)

val errors = file.filter(_.contains(“ERROR”))
Action!
errors.cache()

errors.filter(_.contains(“I/O”)).count()
errors.filter(_.contains(“timeout”)) Worker Worker Worker
.count()
Cache1 Cache2 Cache2

Block1 Block2 Block3

Survey results

 “Why companies should use in-memory computing framework like Apache Spark?”
 91% use Apache Spark because of its performance gains.
 77% use Apache Spark as it is easy to use.
 71% use Apache Spark due to the ease of deployment.
 64% use Apache Spark to leverage advanced analytics
 52% use Apache Spark for real-time streaming.
Features

 Fast processing
 Flexibility
 In-memory computing
 Real-time processing
 Better analytics
 Compatible with Hadoop
Features
Usecases
Applications of Spark

 Spark is a highly versatile big data processing engine. Here we list some of the top applications of Spark cutting
across industry verticals.
 Providing a holistic customer service by analyzing data from multiple customer touchpoints
 Building an ecommerce recommender engine based on customer past buying habits
 Creating customized ad targeting on websites based on customer profiles
 Text analysis to identify customer sentiments on social media channels like Twitter
 Machine learning applications for supporting AI initiatives using Spark MLlib.
Usecases
Finance Industry

 Banks are using the Hadoop alternative – Spark

 financial institutions can detect fraudulent transactions in real-time, based on previous
fraud footprints.
e-commerce Industry

 Information about real time transaction can be passed to streaming clustering algorithms
like alternating least squares

 Companies Using Spark in e-commerce Industry

 Apache Spark at Alibaba
 Apache Spark at eBay
Healthcare

 hospitals prevent hospital re-admittance as they can deploy home healthcare services to
the identified patient, saving on costs for both the hospitals and patients.

 Apache Spark at MyFitnessPal

Media & Entertainment

 gaming industry to identify patterns from the real-time in-game events and respond to
them to harvest lucrative business opportunities like targeted advertising, auto adjustment
of gaming levels based on complexity, player retention and many more.
 Apache Spark at Yahoo,MSN for News Personalization
 Apache Spark at Netflix – online recomendations
 Apache Spark at Pinterest
Travel Industry

 Apache Spark at TripAdvisor

 Apache Spark at OpenTable
Real time analysis
Spark Components
 Spark Core
 Spark Streaming
 Spark SQL
 GraphX
 MLlib (Machine Learning)
Spark core

 Spark Core is the base engine for large-scale parallel and distributed data processing.
 It is responsible for:
 Memory management and fault recovery
 Scheduling, distributing and monitoring jobs on a cluster
 Interacting with storage systems
Spark Streaming

 Spark Streaming is the component of Spark which is used to process real-time streaming
data.
Spark SQL

 Spark SQL is a new module in Spark which integrates relational processing with Spark’s
functional programming API.
 The following are the four libraries of Spark SQL.
 Data Source API
 DataFrame API
 Interpreter & Optimizer
 SQL Service
GraphX

 GraphX is the Spark API for graphs and graph-parallel computation.

Machine learning

 MLlib stands for Machine Learning Library. Spark MLlib is used to perform machine
learning in Apache Spark.
Spark Applications
Popular apps

 Uber – Uses Kafka, Spark Streaming, and HDFS for building a continuous ETL pipeline.
 Pinterest – Uses Spark Streaming in order to gain deep insight into customer engagement
details.
 Conviva – The pinnacle video company Conviva deploys Spark for optimizing the videos
and handling live traffic.

CSI 4107 - Winter 2016 - Midterm
Document10 pages
CSI 4107 - Winter 2016 - Midterm
Amin Dhouib
0% (1)
Chapter 25
Document43 pages
Chapter 25
Bicycle Thief
No ratings yet
Ruta de Entrenamiento Base Cloudera Revisada
Document6 pages
Ruta de Entrenamiento Base Cloudera Revisada
thiagos25
100% (1)
A Brief Introduction To Apache Spark
Document10 pages
A Brief Introduction To Apache Spark
Venkatesh Narisetty
No ratings yet
Teradata & Abinitio
Document2 pages
Teradata & Abinitio
Atlury Jeyyadev
No ratings yet
COMP9313: Big Data Management: Course Web Site: HTTP://WWW - Cse.unsw - Edu.au/ cs9313
Document76 pages
COMP9313: Big Data Management: Course Web Site: HTTP://WWW - Cse.unsw - Edu.au/ cs9313
maithuong85
No ratings yet
Hadoop Interviews Q
Document9 pages
Hadoop Interviews Q
S K
No ratings yet
Overview
Document25 pages
Overview
sarvesh_mishra
No ratings yet
HADOOP Based Recommendation Algorithm For Micro-Video URL
Document9 pages
HADOOP Based Recommendation Algorithm For Micro-Video URL
dbpublications
No ratings yet
Hadoop Module 3.2
Document57 pages
Hadoop Module 3.2
Sainath Reddy
100% (1)
RaviKumar Gurrappagari PDF
Document8 pages
RaviKumar Gurrappagari PDF
Benedict Zander
No ratings yet
Ab Initio Tutorials
Document1 page
Ab Initio Tutorials
j_jeevan_j
No ratings yet
Hadoop Interview Questions
Document28 pages
Hadoop Interview Questions
Anand S
No ratings yet
Map Reduce With Hadoop:: Presented by ANIVESHA-126 ARITRA-128 RIA-142 Shashvat - 150 SHEKHAR-151
Document9 pages
Map Reduce With Hadoop:: Presented by ANIVESHA-126 ARITRA-128 RIA-142 Shashvat - 150 SHEKHAR-151
Aritra Banerjee
100% (1)
Hadoop Interview Questions
Document28 pages
Hadoop Interview Questions
jey011851
No ratings yet
Mining Data Streams
Document67 pages
Mining Data Streams
usha
No ratings yet
Apache Hive
Document3 pages
Apache Hive
kual21
No ratings yet
Create An Spark Streaming App: 1. Architecture and Abstraction
Document8 pages
Create An Spark Streaming App: 1. Architecture and Abstraction
Ngô Hoàng
No ratings yet
1 Apache Zookeeper
Document7 pages
1 Apache Zookeeper
atuf
No ratings yet
Kelly Hadoop Hyd May 2018
Document14 pages
Kelly Hadoop Hyd May 2018
dilip kumar
No ratings yet
Unit 4 Hadoop
Document86 pages
Unit 4 Hadoop
ShivanshuSingh
No ratings yet
Edureka Interview Questions - HDFS
Document4 pages
Edureka Interview Questions - HDFS
varunpratap
No ratings yet
Dhanush Bigdata Resume Updated
Document9 pages
Dhanush Bigdata Resume Updated
Nishant Kumar
No ratings yet
Big Data: Business Intelligence, and Analytics
Document31 pages
Big Data: Business Intelligence, and Analytics
Karthigai Selvan
No ratings yet
M.SC - BigData Syllabus
Document123 pages
M.SC - BigData Syllabus
AKASH KUMAR
No ratings yet
Resume
Document4 pages
Resume
shekhar
No ratings yet
Madhur Manchanda: Career Objective
Document2 pages
Madhur Manchanda: Career Objective
madhur manchanda
No ratings yet
6 Frequently Asked Hadoop Interview Questions and Answers: Q1.What Is Hadoop?
Document8 pages
6 Frequently Asked Hadoop Interview Questions and Answers: Q1.What Is Hadoop?
Krish Dhoom
No ratings yet
Data Science Fundamentals - Class1
Document51 pages
Data Science Fundamentals - Class1
Yashwanth Yashu
No ratings yet
Hadoop Admin Download Syllabus PDF
Document4 pages
Hadoop Admin Download Syllabus PDF
shubham phulari
No ratings yet
Traing On Hadoop
Document123 pages
Traing On Hadoop
Shubham
No ratings yet
BigData Unit 2
Document15 pages
BigData Unit 2
Sreedhar Arikatla
No ratings yet
Hadoop I/O: Jaeyong Choi
Document36 pages
Hadoop I/O: Jaeyong Choi
Manognya Reddy
No ratings yet
Srikanth Hadoop
Document4 pages
Srikanth Hadoop
Karthick Thoppan
No ratings yet
Mohit BigData 5yr
Document3 pages
Mohit BigData 5yr
shreya arun
No ratings yet
Introduction To Hadoop & Spark
Document28 pages
Introduction To Hadoop & Spark
Justin Talbot
No ratings yet
Apps DBA Interview Question
Document12 pages
Apps DBA Interview Question
Ramesh Kumar
No ratings yet
PySpark+Slides v1
Document458 pages
PySpark+Slides v1
ravikumar lanka
No ratings yet
HBase Interview Questions
Document12 pages
HBase Interview Questions
pooh06
No ratings yet
Big Data Question Bank
Document15 pages
Big Data Question Bank
kokiladevirajavelu
0% (2)
Hadoop
Document114 pages
Hadoop
asda
No ratings yet
Mining Data Streams (Part 2)
Document56 pages
Mining Data Streams (Part 2)
Haseeb Farooq
No ratings yet
Dice Resume CV SAI KARTHIK
Document4 pages
Dice Resume CV SAI KARTHIK
RAJU P
No ratings yet
Unstructured Dataload Into Hive Database Through PySpark
Document9 pages
Unstructured Dataload Into Hive Database Through PySpark
sayhi2sudarshan
No ratings yet
Apache Spark Installation
Document4 pages
Apache Spark Installation
Harshit Sinha
No ratings yet
Big Data Syllabus For Theory and Lab
Document4 pages
Big Data Syllabus For Theory and Lab
chetana tukkoji
No ratings yet
Hadoop Security S360 2015v8 PDF
Document27 pages
Hadoop Security S360 2015v8 PDF
Luis Demetrio Martinez Ruiz
No ratings yet
Hadoop Admin Interview Question and Answers
Document5 pages
Hadoop Admin Interview Question and Answers
Vivek Kushwaha
No ratings yet
Midhun BIGDATA Curicullum
Document17 pages
Midhun BIGDATA Curicullum
Fukkk
No ratings yet
Spark Training - Java
Document8 pages
Spark Training - Java
Pavan Kumar
No ratings yet
2018 02 08 Whats New in Apache Spark 2 180213220045
Document57 pages
2018 02 08 Whats New in Apache Spark 2 180213220045
shan4u4me
No ratings yet
Dzone Apache Hadoop Deployment
Document7 pages
Dzone Apache Hadoop Deployment
VernFWK
No ratings yet
Hadoop Ecosystem
Document16 pages
Hadoop Ecosystem
poojan thakkar
No ratings yet
NoSQL and MongoDB
Document47 pages
NoSQL and MongoDB
arya1017
No ratings yet
Ankit Rathi Ankit Rathi: Lead Data Architect
Document4 pages
Ankit Rathi Ankit Rathi: Lead Data Architect
Abhishek Vijayvargiya
No ratings yet
HDFS Architecture
Document47 pages
HDFS Architecture
krishan Goyal
No ratings yet
Microsoft - Practicetest.dp 201.v2020!08!07.by - Julissa.92q
Document126 pages
Microsoft - Practicetest.dp 201.v2020!08!07.by - Julissa.92q
rotty
No ratings yet
Hadoop Test
Document8 pages
Hadoop Test
big_fir
100% (1)
Cloudera A Complete Guide - 2019 Edition
From Everand
Cloudera A Complete Guide - 2019 Edition
Gerardus Blokdyk
No ratings yet
Getting Started with Big Data Query using Apache Impala
From Everand
Getting Started with Big Data Query using Apache Impala
Agus Kurniawan
No ratings yet
Computer Vision: Models, Learning and Inference
Document59 pages
Computer Vision: Models, Learning and Inference
PREM KUMAR M
No ratings yet
Data Analytics Using NoSQL
Document50 pages
Data Analytics Using NoSQL
PREM KUMAR M
0% (1)
Python Quick Guide
Document162 pages
Python Quick Guide
PREM KUMAR M
No ratings yet
CheatSheet Python 3 Complex Data Types
Document1 page
CheatSheet Python 3 Complex Data Types
erzaraptor
No ratings yet
Selection Post IX Graduation 08-02-2022 Eng
Document156 pages
Selection Post IX Graduation 08-02-2022 Eng
Vijay singh Tomar
No ratings yet
CS198 Programming Assignment 2
Document4 pages
CS198 Programming Assignment 2
shellnexus
No ratings yet
Flow of Communication: Emergency Response For Oil Spillage
Document5 pages
Flow of Communication: Emergency Response For Oil Spillage
narm n
No ratings yet
Solution of Assignment 5
Document5 pages
Solution of Assignment 5
Reza Borah
100% (1)
1001076002-HT8911 Datasheet - V1.1
Document13 pages
1001076002-HT8911 Datasheet - V1.1
Zhang Ethan
No ratings yet
Revit Programming For Beginners: Dan Mapes Senior BIM Coordinator/Developer at ME Engineers
Document17 pages
Revit Programming For Beginners: Dan Mapes Senior BIM Coordinator/Developer at ME Engineers
jean
No ratings yet
Hydraulic Cable Lugs Crimping Tools
Document6 pages
Hydraulic Cable Lugs Crimping Tools
baolifeng
No ratings yet
International Strategic Alliances 1
Document21 pages
International Strategic Alliances 1
mukesh93567
No ratings yet
Lecture 1 Part 1
Document13 pages
Lecture 1 Part 1
Marianna Klos
No ratings yet
William James - Psychologist
Document5 pages
William James - Psychologist
Cecilia Susai
No ratings yet
Modeling and Simulation of Fluid Catalytic Cracking Unit: Reviews in Chemical Engineering January 2005
Document38 pages
Modeling and Simulation of Fluid Catalytic Cracking Unit: Reviews in Chemical Engineering January 2005
Diyar Ali
No ratings yet
Simultaneous Equations O/L
Document13 pages
Simultaneous Equations O/L
Venuja De Silva
No ratings yet
Bill of Quantity
Document6 pages
Bill of Quantity
Khairoden Sangcopan
No ratings yet
Client Name: Well, Max Birthdate: AGE: 7 Years, 8 Months School: Grade: 1 Dates of Assessment: July, 2011 Date of Report: Assessed By: Flames
Document10 pages
Client Name: Well, Max Birthdate: AGE: 7 Years, 8 Months School: Grade: 1 Dates of Assessment: July, 2011 Date of Report: Assessed By: Flames
api-160674927
No ratings yet
Ultra Dense Network
Document27 pages
Ultra Dense Network
Younes
No ratings yet
900FH&1000FH Turbines
Document12 pages
900FH&1000FH Turbines
Ryan
No ratings yet
1g Rainbow Antimagic Coloring
Document9 pages
1g Rainbow Antimagic Coloring
Rosanita Nisviasari
No ratings yet
Ims555 Grouping Assignment (Ai Deepfakes)
Document23 pages
Ims555 Grouping Assignment (Ai Deepfakes)
NUR A'ISYAH AZIZI
No ratings yet
Refrigerator Freezer: Owner's Manual
Document22 pages
Refrigerator Freezer: Owner's Manual
thai
No ratings yet
Verizon Wiretapping - Comments in Support of MR Cowie's Complaint
Document8 pages
Verizon Wiretapping - Comments in Support of MR Cowie's Complaint
ireport
No ratings yet
Info
Document2 pages
Info
fukinbob
No ratings yet
Anullment CATHOLIC TRIBUNAL
Document20 pages
Anullment CATHOLIC TRIBUNAL
Mons Jr Baturiano
No ratings yet
Ball Mill Capacity Dimensions PAUL O ABBE
Document2 pages
Ball Mill Capacity Dimensions PAUL O ABBE
aghilif
No ratings yet
Statistical Methods For Spatial Data Analysis
Document3 pages
Statistical Methods For Spatial Data Analysis
sakali ali
0% (1)
13-GB 50018-2002-En
Document109 pages
13-GB 50018-2002-En
yyyy071220
100% (1)
Productivity and Leadership Skills
Document22 pages
Productivity and Leadership Skills
Dan Jezreel Esguerra
No ratings yet
Thesis PDF
Document120 pages
Thesis PDF
Prajwal Niraula
No ratings yet
Renewable Energy Sources and Methods
Document225 pages
Renewable Energy Sources and Methods
Semir Đedović
100% (1)
Interactive Physics Manual
Document13 pages
Interactive Physics Manual
Marciano Santamaría
No ratings yet
Bibby Couplings
Document25 pages
Bibby Couplings
Kemoy Johnson
No ratings yet

Apache Spark: Dhineshkumar S K

Uploaded by

Copyright:

Available Formats

You might also like

Apache Spark: Dhineshkumar S K

Uploaded by

Document Information

Original Description:

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Apache Spark: Dhineshkumar S K

Uploaded by

Copyright:

Available Formats

Apache Spark

Criteria Spark Hadoop MapReduce

val log = sc.textFile(“hdfs://...”)

Block1 Block2 Block3

 Banks are using the Hadoop alternative – Spark

 Companies Using Spark in e-commerce Industry

 Apache Spark at MyFitnessPal

 Apache Spark at TripAdvisor

 GraphX is the Spark API for graphs and graph-parallel computation.

You might also like