Welcome to Scribd!

0% found this document useful (0 votes)

1K views

DataFrame Operations Using A Json File

Uploaded by

This Python code uses Spark SQL to read employee data from a JSON file into a DataFrame. It then filters the DataFrame to only rows where the stream is "JAVA" and writes the filtered DataFrame to a new Parquet file. It first reads the JSON, displays the DataFrame, coalesces and writes it to a Parquet file. Then it reads the Parquet, filters for "JAVA" stream, displays and writes the filtered DataFrame to a new Parquet file.

Copyright:

Available Formats

Download as TXT, PDF, TXT or read online from Scribd

Flag for inappropriate content

Java 8 Innards Date and Time API
Document2 pages
Java 8 Innards Date and Time API
M.S.V.PAVAN KUMAR
33% (3)
Exercise - Descriptive Statistics - Fresco
Document1 page
Exercise - Descriptive Statistics - Fresco
Arpita Das
100% (1)
Exercise - Descriptive Statistics - Fresco
Document1 page
Exercise - Descriptive Statistics - Fresco
Arpita Das
100% (1)
Unstructtured Data Classification Fresco
Document4 pages
Unstructtured Data Classification Fresco
sujesh
100% (1)
Python Qualis - Hands On Nose
Document1 page
Python Qualis - Hands On Nose
AGDB
0% (1)
E2 String
Document2 pages
E2 String
Parwaz Rahman
0% (4)
CSS3 Hands-On &MCQ
Document14 pages
CSS3 Hands-On &MCQ
Stark
No ratings yet
Scikit
Document4 pages
Scikit
Anzal Malik
No ratings yet
Nodejs TCS Fresco Play
Document1 page
Nodejs TCS Fresco Play
raviteja naidu
80% (5)
Fresco
Document17 pages
Fresco
vinay
100% (2)
Wings1 T1 Full-Stack Application (62638)
Document4 pages
Wings1 T1 Full-Stack Application (62638)
Venky
No ratings yet
Wings1 T1 ReactJS Application (62636)
Document5 pages
Wings1 T1 ReactJS Application (62636)
Anusia Sharma
No ratings yet
Import As From Import Import: Problem 1
Document5 pages
Import As From Import Import: Problem 1
ikhwancules46
100% (1)
Digital Python Intermediate iON LX Async SP Assessment 18 21
Document1 page
Digital Python Intermediate iON LX Async SP Assessment 18 21
mahesh
No ratings yet
Py Spark Final
Document1 page
Py Spark Final
roy.scar2196
No ratings yet
DATAbase Connectivity
Document4 pages
DATAbase Connectivity
karthiyayani umashankar
100% (2)
Modules 1
Document9 pages
Modules 1
karthiyayani umashankar
No ratings yet
Bootstrap Handson
Document5 pages
Bootstrap Handson
Anzal Malik
0% (1)
HTML Final Assessment
Document5 pages
HTML Final Assessment
Karanjyot Chadha
50% (2)
This Study Resource Was
Document5 pages
This Study Resource Was
MALLUPEDDI SAI LOHITH MALLUPEDDI SAI LOHITH
No ratings yet
2nd Mini Project
Document3 pages
2nd Mini Project
vosew12190
100% (1)
Hackerrank Nodejs
Document19 pages
Hackerrank Nodejs
SHIVAM SHRIVASTAVA
67% (3)
DNN Handson
Document2 pages
DNN Handson
Vinaykumarreddy
No ratings yet
Scala Constructs: Concepts of Functional Programming
Document21 pages
Scala Constructs: Concepts of Functional Programming
Rahul S.Kumar
No ratings yet
Selenium HandsOn
Document2 pages
Selenium HandsOn
aman kumar
100% (1)
Creating A Selenium Script
Document3 pages
Creating A Selenium Script
swati sharma
No ratings yet
Angular Routes and Forms Handson
Document11 pages
Angular Routes and Forms Handson
swati sharma
No ratings yet
Machine Learning Scikit Handson
Document4 pages
Machine Learning Scikit Handson
Akshay Sharada Hanmant Suryawanshi
0% (1)
Python List Handson 1
Document2 pages
Python List Handson 1
sanskriti
No ratings yet
This Study Resource Was
Document3 pages
This Study Resource Was
M.S.V.PAVAN KUMAR
No ratings yet
Python Hands On
Document11 pages
Python Hands On
prashant pal
100% (1)
Spark SQL Hands - On
Document3 pages
Spark SQL Hands - On
pavan kumar
No ratings yet
Python Funstinos and OOPS
Document7 pages
Python Funstinos and OOPS
yipemet
No ratings yet
Angular 2 Building Blocks Handson
Document9 pages
Angular 2 Building Blocks Handson
SHIVAM SHRIVASTAVA
0% (1)
R Handson
Document3 pages
R Handson
vinodbabu24
100% (3)
Angular JS 1.x Internals Q & A
Document3 pages
Angular JS 1.x Internals Q & A
Venkatasubramani
No ratings yet
TCS Database Questions
Document23 pages
TCS Database Questions
Amandeep Punia
No ratings yet
Context
Document4 pages
Context
roy.scar2196
No ratings yet
Create A DataFrame
Document1 page
Create A DataFrame
Arpita Das
No ratings yet
ECMAScript6 Handson
Document2 pages
ECMAScript6 Handson
Rutuja Borhade
100% (1)
Props
Document1 page
Props
Venkatesh Babu
0% (3)
Grail
Document23 pages
Grail
Ashish Gupta
No ratings yet
1.try-It-Out - Function For Fibonacci Series Welcome To To Generate Fibonacci Sequence New
Document3 pages
1.try-It-Out - Function For Fibonacci Series Welcome To To Generate Fibonacci Sequence New
Stark
No ratings yet
Angular Js Hands On Solutions
Document4 pages
Angular Js Hands On Solutions
Payal Sharma
No ratings yet
Python 3 Application Programming
Document12 pages
Python 3 Application Programming
TECHer YT
No ratings yet
Dumps of SCJP
Document5 pages
Dumps of SCJP
Moiz Abdul
No ratings yet
JavaScript Worklist Handson Solution Ievolve 57714
Document3 pages
JavaScript Worklist Handson Solution Ievolve 57714
pankaj pal
No ratings yet
Python OOPs and Functions
Document6 pages
Python OOPs and Functions
yipemet
No ratings yet
E1 Fresco Prob3 Correct
Document1 page
E1 Fresco Prob3 Correct
Kaushik Raj
No ratings yet
Xplore Java HandsOn
Document16 pages
Xplore Java HandsOn
Aniruddh Kulkarni
No ratings yet
Spark Streaming - Malay
Document1 page
Spark Streaming - Malay
Mahesh VP
100% (1)
C E1 Competency Test
Document3 pages
C E1 Competency Test
Abhik Test
No ratings yet
Class N Static
Document5 pages
Class N Static
roy.scar2196
No ratings yet
Tcs EDA Question
Document5 pages
Tcs EDA Question
Vasudha
0% (1)
Nodejs Mock Test III
Document6 pages
Nodejs Mock Test III
ramanareddy
No ratings yet
Abstract Class 1
Document1 page
Abstract Class 1
Senthil Lakshmi
No ratings yet
Microservice
Document2 pages
Microservice
Aakash Mazumder
No ratings yet
Onsen UI - Course Introduction
Document19 pages
Onsen UI - Course Introduction
Mahesh VP
No ratings yet
Spark Cheat Sheet 1717838924
Document10 pages
Spark Cheat Sheet 1717838924
monachatterjee962
No ratings yet
Spark
Document1 page
Spark
Josue Rueda Garcia
No ratings yet
My Pyspark Practice Notes
Document63 pages
My Pyspark Practice Notes
Study Table
No ratings yet
23
Document5 pages
23
Arpita Das
No ratings yet
22
Document7 pages
22
Arpita Das
No ratings yet
Exercise - ANOVA - Fresco
Document1 page
Exercise - ANOVA - Fresco
Arpita Das
No ratings yet
1
Document4 pages
1
Arpita Das
No ratings yet
Exercise ANOVA Anotherone - Fresco
Document1 page
Exercise ANOVA Anotherone - Fresco
Arpita Das
No ratings yet
DataFrame Operations
Document1 page
DataFrame Operations
Arpita Das
No ratings yet
Create A DataFrame
Document1 page
Create A DataFrame
Arpita Das
No ratings yet
Give A Try - Database Connectivity
Document5 pages
Give A Try - Database Connectivity
Arpita Das
No ratings yet

DataFrame Operations Using A Json File

Uploaded by

Arpita Das

0% found this document useful (0 votes)

1K views1 page

Original Description:

Original Title

DataFrame Operations Using a Json File

Copyright

Available Formats

TXT, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as TXT, PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as txt, pdf, or txt

0% found this document useful (0 votes)

1K views1 page

DataFrame Operations Using A Json File

Uploaded by

Arpita Das

Copyright:

Available Formats

Download as TXT, PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as txt, pdf, or txt

Jump to Page

You are on page 1of 1

Search inside document

#Put your code here

from pyspark.sql import SparkSession

spark = SparkSession \
.builder \
.appName("Data Frame EMPLOYEE") \
.config("spark.some.config.option", "some-value") \
.getOrCreate()
df = spark.read.json("emp.json")
df.show()
df.coalesce(1).write.parquet("Employees")
pf = spark.read.parquet("Employees")
dfNew = pf.filter(pf.stream=='JAVA')
dfNew.show()
dfNew.coalesce(1).write.parquet("JavaEmployees")

Java 8 Innards Date and Time API
Document2 pages
Java 8 Innards Date and Time API
M.S.V.PAVAN KUMAR
33% (3)
Exercise - Descriptive Statistics - Fresco
Document1 page
Exercise - Descriptive Statistics - Fresco
Arpita Das
100% (1)
Exercise - Descriptive Statistics - Fresco
Document1 page
Exercise - Descriptive Statistics - Fresco
Arpita Das
100% (1)
Unstructtured Data Classification Fresco
Document4 pages
Unstructtured Data Classification Fresco
sujesh
100% (1)
Python Qualis - Hands On Nose
Document1 page
Python Qualis - Hands On Nose
AGDB
0% (1)
E2 String
Document2 pages
E2 String
Parwaz Rahman
0% (4)
CSS3 Hands-On &MCQ
Document14 pages
CSS3 Hands-On &MCQ
Stark
No ratings yet
Scikit
Document4 pages
Scikit
Anzal Malik
No ratings yet
Nodejs TCS Fresco Play
Document1 page
Nodejs TCS Fresco Play
raviteja naidu
80% (5)
Fresco
Document17 pages
Fresco
vinay
100% (2)
Wings1 T1 Full-Stack Application (62638)
Document4 pages
Wings1 T1 Full-Stack Application (62638)
Venky
No ratings yet
Wings1 T1 ReactJS Application (62636)
Document5 pages
Wings1 T1 ReactJS Application (62636)
Anusia Sharma
No ratings yet
Import As From Import Import: Problem 1
Document5 pages
Import As From Import Import: Problem 1
ikhwancules46
100% (1)
Digital Python Intermediate iON LX Async SP Assessment 18 21
Document1 page
Digital Python Intermediate iON LX Async SP Assessment 18 21
mahesh
No ratings yet
Py Spark Final
Document1 page
Py Spark Final
roy.scar2196
No ratings yet
DATAbase Connectivity
Document4 pages
DATAbase Connectivity
karthiyayani umashankar
100% (2)
Modules 1
Document9 pages
Modules 1
karthiyayani umashankar
No ratings yet
Bootstrap Handson
Document5 pages
Bootstrap Handson
Anzal Malik
0% (1)
HTML Final Assessment
Document5 pages
HTML Final Assessment
Karanjyot Chadha
50% (2)
This Study Resource Was
Document5 pages
This Study Resource Was
MALLUPEDDI SAI LOHITH MALLUPEDDI SAI LOHITH
No ratings yet
2nd Mini Project
Document3 pages
2nd Mini Project
vosew12190
100% (1)
Hackerrank Nodejs
Document19 pages
Hackerrank Nodejs
SHIVAM SHRIVASTAVA
67% (3)
DNN Handson
Document2 pages
DNN Handson
Vinaykumarreddy
No ratings yet
Scala Constructs: Concepts of Functional Programming
Document21 pages
Scala Constructs: Concepts of Functional Programming
Rahul S.Kumar
No ratings yet
Selenium HandsOn
Document2 pages
Selenium HandsOn
aman kumar
100% (1)
Creating A Selenium Script
Document3 pages
Creating A Selenium Script
swati sharma
No ratings yet
Angular Routes and Forms Handson
Document11 pages
Angular Routes and Forms Handson
swati sharma
No ratings yet
Machine Learning Scikit Handson
Document4 pages
Machine Learning Scikit Handson
Akshay Sharada Hanmant Suryawanshi
0% (1)
Python List Handson 1
Document2 pages
Python List Handson 1
sanskriti
No ratings yet
This Study Resource Was
Document3 pages
This Study Resource Was
M.S.V.PAVAN KUMAR
No ratings yet
Python Hands On
Document11 pages
Python Hands On
prashant pal
100% (1)
Spark SQL Hands - On
Document3 pages
Spark SQL Hands - On
pavan kumar
No ratings yet
Python Funstinos and OOPS
Document7 pages
Python Funstinos and OOPS
yipemet
No ratings yet
Angular 2 Building Blocks Handson
Document9 pages
Angular 2 Building Blocks Handson
SHIVAM SHRIVASTAVA
0% (1)
R Handson
Document3 pages
R Handson
vinodbabu24
100% (3)
Angular JS 1.x Internals Q & A
Document3 pages
Angular JS 1.x Internals Q & A
Venkatasubramani
No ratings yet
TCS Database Questions
Document23 pages
TCS Database Questions
Amandeep Punia
No ratings yet
Context
Document4 pages
Context
roy.scar2196
No ratings yet
Create A DataFrame
Document1 page
Create A DataFrame
Arpita Das
No ratings yet
ECMAScript6 Handson
Document2 pages
ECMAScript6 Handson
Rutuja Borhade
100% (1)
Props
Document1 page
Props
Venkatesh Babu
0% (3)
Grail
Document23 pages
Grail
Ashish Gupta
No ratings yet
1.try-It-Out - Function For Fibonacci Series Welcome To To Generate Fibonacci Sequence New
Document3 pages
1.try-It-Out - Function For Fibonacci Series Welcome To To Generate Fibonacci Sequence New
Stark
No ratings yet
Angular Js Hands On Solutions
Document4 pages
Angular Js Hands On Solutions
Payal Sharma
No ratings yet
Python 3 Application Programming
Document12 pages
Python 3 Application Programming
TECHer YT
No ratings yet
Dumps of SCJP
Document5 pages
Dumps of SCJP
Moiz Abdul
No ratings yet
JavaScript Worklist Handson Solution Ievolve 57714
Document3 pages
JavaScript Worklist Handson Solution Ievolve 57714
pankaj pal
No ratings yet
Python OOPs and Functions
Document6 pages
Python OOPs and Functions
yipemet
No ratings yet
E1 Fresco Prob3 Correct
Document1 page
E1 Fresco Prob3 Correct
Kaushik Raj
No ratings yet
Xplore Java HandsOn
Document16 pages
Xplore Java HandsOn
Aniruddh Kulkarni
No ratings yet
Spark Streaming - Malay
Document1 page
Spark Streaming - Malay
Mahesh VP
100% (1)
C E1 Competency Test
Document3 pages
C E1 Competency Test
Abhik Test
No ratings yet
Class N Static
Document5 pages
Class N Static
roy.scar2196
No ratings yet
Tcs EDA Question
Document5 pages
Tcs EDA Question
Vasudha
0% (1)
Nodejs Mock Test III
Document6 pages
Nodejs Mock Test III
ramanareddy
No ratings yet
Abstract Class 1
Document1 page
Abstract Class 1
Senthil Lakshmi
No ratings yet
Microservice
Document2 pages
Microservice
Aakash Mazumder
No ratings yet
Onsen UI - Course Introduction
Document19 pages
Onsen UI - Course Introduction
Mahesh VP
No ratings yet
Spark Cheat Sheet 1717838924
Document10 pages
Spark Cheat Sheet 1717838924
monachatterjee962
No ratings yet
Spark
Document1 page
Spark
Josue Rueda Garcia
No ratings yet
My Pyspark Practice Notes
Document63 pages
My Pyspark Practice Notes
Study Table
No ratings yet
23
Document5 pages
23
Arpita Das
No ratings yet
22
Document7 pages
22
Arpita Das
No ratings yet
Exercise - ANOVA - Fresco
Document1 page
Exercise - ANOVA - Fresco
Arpita Das
No ratings yet
1
Document4 pages
1
Arpita Das
No ratings yet
Exercise ANOVA Anotherone - Fresco
Document1 page
Exercise ANOVA Anotherone - Fresco
Arpita Das
No ratings yet
DataFrame Operations
Document1 page
DataFrame Operations
Arpita Das
No ratings yet
Create A DataFrame
Document1 page
Create A DataFrame
Arpita Das
No ratings yet
Give A Try - Database Connectivity
Document5 pages
Give A Try - Database Connectivity
Arpita Das
No ratings yet

DataFrame Operations Using A Json File

Uploaded by

Copyright:

Available Formats

You might also like

DataFrame Operations Using A Json File

Uploaded by

Document Information

Original Description:

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

DataFrame Operations Using A Json File

Uploaded by

Copyright:

Available Formats

#Put your code here

from pyspark.sql import SparkSession

You might also like