Eda Presentation

Uploaded by

bhatkarbharat001

0% found this document useful (0 votes)

1 views12 pages

Original Title

EDA PRESENTATION

Copyright

Available Formats

PPTX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as pptx, pdf, or txt

0% found this document useful (0 votes)

1 views12 pages

Eda Presentation

Uploaded by

bhatkarbharat001

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as pptx, pdf, or txt

Jump to Page

You are on page 1of 12

Search inside document

AMAZON SALES

DATASET
Name – SAMYAK KHANDERAO
Roll No – A-46
PRN – 22610045
INTRO TO THE DATASET
 This dataset is having the data of 1K+ Amazon Product's Ratings and
Reviews as per their details listed on the official website of Amazon

• FOLLOWING OPERATION CAN BE PERFORMED ON THE DATASET:

• Dataset Walkthrough
• Understanding Dataset Hierarchy
• Data Preprocessing
• Exploratory Data Analysis
• Data Visualization

• THIS DATA SET INCLUDES FEATURES LIKE

PRODUCT_ID,PRODUCT_NAME,USER_ID,USER_NAME,ACTUAL_COST,DISCO
UNTED_COST …….
IMPORTING LIBRARIES
• NumPy :- NumPy is commonly used
for numerical computations and
array manipulations.

• Pandas :- Pandas is widely used for

data cleaning, transformation, and analysis tasks.

• Matplotlib.pyplot :- It offers a wide range of customization options for

creating publication-quality figures. It is also for labeling the graphs.
• Seaborn :- Seaborn simplifies the process of creating complex visualizations
such as scatter plots, histograms, and heatmaps.
BASIC EDA OPERATIONS
• DATAFRAME.INFO() • DATAFRAME.DESCRIBE()
Continued…
• Dataframe.isnull().sum()
• Dataframe.describe(include='object')
Historgarm (univariate)
• Univariate Method:-

• Histogram:
Displays the distribution of a single
variable by dividing its range into
intervals (bins) and plotting the
frequency or count of observations
within each bin.
Visualize scatter plot in your dataset with maximum
no of parameters
This data is only for first 100 rows in
the data

Rating column helps in hue/color

adjustment

sns.scatterplot(data=df.head(100),
x='actual_price',
y='discounted_price',
hue='rating', size=5)
Perform Bivariate Graphical EDA on given dataset.
• Grouping the DataFrame by category and
calculate the total number of users for
each category

• category_user_counts =
df.groupby('category')
['number_of_users'].sum().reset_index()

• sns.barplot(data=category_user_counts,
x='category', y='number_of_users')
Scatterplot (bivariate)
This scatterplot shows how the
actual price of the product
varies with the discount
percentage

We can see that there are

greater discount
Rates on the product prices
below 5000 rs
skewness
Skewness: Skewness is a statistical 1]Skewness = 0: Then normally distributed.
2]Skewness > 0: Then more weight in the left
measure that describes the asymmetry of tail of the distribution.
the distribution of a dataset. 3]Skewness < 0: Then more weight in the right
tail of the distribution.
Thank You

Data Mining - Business Report: Clustering Clean - Ads
Document24 pages
Data Mining - Business Report: Clustering Clean - Ads
Ketan Sawalkar
100% (4)
Grade 6 Weekly Spelling Words
Document6 pages
Grade 6 Weekly Spelling Words
Jessie Ocado
100% (1)
Simple Data Science (R)
From Everand
Simple Data Science (R)
Narayana Nemani
Rating: 5 out of 5 stars
5/5 (1)
Assignment 2 PDF
Document25 pages
Assignment 2 PDF
Boni Halder
No ratings yet
File 5 - Module e - Monitoring & Evaluation For Ffa 20 July 2011
Document45 pages
File 5 - Module e - Monitoring & Evaluation For Ffa 20 July 2011
Juanito Sosa
100% (2)
Lecture 02 Proportion
Document25 pages
Lecture 02 Proportion
Dhruv Patel
No ratings yet
Data Cleaning: Missing Values: - For Example in Attribute Income If
Document30 pages
Data Cleaning: Missing Values: - For Example in Attribute Income If
Ashyou Youash
No ratings yet
Exp2 - Data Visualization and Cleaning and Feature Selection
Document13 pages
Exp2 - Data Visualization and Cleaning and Feature Selection
mnbatrawi
No ratings yet
Descriptive Statistics With Pandas: Data Handling Using Pandas - II
Document37 pages
Descriptive Statistics With Pandas: Data Handling Using Pandas - II
B. Jennifer
100% (1)
DM Lab Cycle 2 1
Document10 pages
DM Lab Cycle 2 1
ispclx
No ratings yet
Abhishek - 20BCS7093 - EXP 5
Document3 pages
Abhishek - 20BCS7093 - EXP 5
sameer
No ratings yet
Major Issues in Data Mining
Document9 pages
Major Issues in Data Mining
Gaurav Jaiswal
No ratings yet
Machine Learning-1
Document24 pages
Machine Learning-1
factpolice007
No ratings yet
EDA - Exploratory Data Analysis
Document16 pages
EDA - Exploratory Data Analysis
spraga1995
No ratings yet
Lecture2 DataMiningFunctionalities
Document18 pages
Lecture2 DataMiningFunctionalities
insaan
No ratings yet
DM 02 04 Data Transformation
Document52 pages
DM 02 04 Data Transformation
maneesh s
No ratings yet
Project Data Mining Tanaya Lokhande
Document58 pages
Project Data Mining Tanaya Lokhande
tanaya lokhande
No ratings yet
Data Mining Problem 2 Report
Document13 pages
Data Mining Problem 2 Report
Babu Shaikh
No ratings yet
Data Minning Problem
Document8 pages
Data Minning Problem
nilesh2306
No ratings yet
Practicals
Document42 pages
Practicals
saahil.o6o4
No ratings yet
Ch-4 Data Mining Knowledge Representation Premitives
Document16 pages
Ch-4 Data Mining Knowledge Representation Premitives
Satyam Shaw
No ratings yet
Normalization 05032024 010758pm
Document17 pages
Normalization 05032024 010758pm
Muneeba Hussain
No ratings yet
Revenue Predictor - Udit Ennam PDF
Document30 pages
Revenue Predictor - Udit Ennam PDF
Nagaraj Dan
No ratings yet
r20 DWDM Unit 2 PART 2
Document15 pages
r20 DWDM Unit 2 PART 2
Chandhu Chodisetty
No ratings yet
ML
Document49 pages
ML
getap85298
No ratings yet
Data Preprocessing
Document47 pages
Data Preprocessing
yeswanth chowdary nidamanuri
No ratings yet
Assignment 1 AI
Document6 pages
Assignment 1 AI
Raj Aryan
No ratings yet
Learneverythingai
Document14 pages
Learneverythingai
nasby18
No ratings yet
Unit - 2: Data Manipulation With R & Data Visualization in Watson Studio
Document58 pages
Unit - 2: Data Manipulation With R & Data Visualization in Watson Studio
Kundan Vanama
No ratings yet
Data Mining-2-1
Document12 pages
Data Mining-2-1
SOORAJ CHANDRAN
No ratings yet
Data Mining - Project
Document25 pages
Data Mining - Project
Abhishek Arya
100% (1)
Chapter4 3
Document37 pages
Chapter4 3
Zia Malik
No ratings yet
Jalali@mshdiua - Ac.ir Jalali - Mshdiau.ac - Ir: Machine Learning
Document35 pages
Jalali@mshdiua - Ac.ir Jalali - Mshdiau.ac - Ir: Machine Learning
Mostafa Heidary
No ratings yet
Machine Learning - Customer Segment Project. Approved by UDACITY
Document19 pages
Machine Learning - Customer Segment Project. Approved by UDACITY
Carlos Pimentel
100% (1)
Untitled
Document29 pages
Untitled
Nikhil
No ratings yet
MLA Lab 6:-Implementation of Decision Tree
Document16 pages
MLA Lab 6:-Implementation of Decision Tree
tushar3patil03
No ratings yet
Day 18 - Numpy
Document6 pages
Day 18 - Numpy
Basic Programming knowledge
No ratings yet
Data Pre-Processing: - Data Cleaning - Data Integration - Data Transformation - Data Reduction - Data Discretization
Document55 pages
Data Pre-Processing: - Data Cleaning - Data Integration - Data Transformation - Data Reduction - Data Discretization
Chanda Test
No ratings yet
Working With Data - Annotated
Document62 pages
Working With Data - Annotated
Hala M
No ratings yet
Regression Linaire Python Tome I
Document9 pages
Regression Linaire Python Tome I
Elisée TEGUE
No ratings yet
Retail Pricing Using Optimization - by Riya Kulshrestha - Analytics Vidhya - Medium
Document16 pages
Retail Pricing Using Optimization - by Riya Kulshrestha - Analytics Vidhya - Medium
smityajah
No ratings yet
DWDM 1-2
Document17 pages
DWDM 1-2
kamlesh
No ratings yet
Assignment 3 - Building A Custom Visualization
Document6 pages
Assignment 3 - Building A Custom Visualization
Tiger Yan
No ratings yet
Feature Engineering: Getting The Most Out of Data For Predictive Models
Document75 pages
Feature Engineering: Getting The Most Out of Data For Predictive Models
kishkp
No ratings yet
Normalization: Normalization Techniques at A Glance
Document5 pages
Normalization: Normalization Techniques at A Glance
Arshad Ali
No ratings yet
Business Report
Document53 pages
Business Report
Adnan Sayed
No ratings yet
Abhishek Pandey - BI Lab - Exp 5
Document4 pages
Abhishek Pandey - BI Lab - Exp 5
Anant Tripathi
No ratings yet
Engo 645
Document9 pages
Engo 645
sree vishnupriyq
No ratings yet
DWDM LAB Final Manualtest
Document134 pages
DWDM LAB Final Manualtest
Aashritha Aatipamula
No ratings yet
Data Mining Primitives, Languages and System Architecture
Document26 pages
Data Mining Primitives, Languages and System Architecture
Surya Prakash
No ratings yet
Building Good Training Sets UNIT 1 PART2
Document46 pages
Building Good Training Sets UNIT 1 PART2
Aditya Sharma
No ratings yet
Phase 2
Document17 pages
Phase 2
Harsha Varthini
No ratings yet
Aindump.70 452.v2010!11!12.by
Document71 pages
Aindump.70 452.v2010!11!12.by
vikas4cat09
No ratings yet
Data Warehouse Manual
Document15 pages
Data Warehouse Manual
karthika murugan
No ratings yet
Unit 2 ML
Document93 pages
Unit 2 ML
Siti Hariksa Amalia
No ratings yet
Data Warehouse Schemas
Document87 pages
Data Warehouse Schemas
snivas1
No ratings yet
Scikit - Notes ML
Document12 pages
Scikit - Notes ML
Vulli Leela Venkata Phanindra
100% (1)
Data Cube
Document5 pages
Data Cube
kaka_huzefa
No ratings yet
Working With Data - Annotated
Document62 pages
Working With Data - Annotated
Hala M
No ratings yet
Lab 3 - Exploratory Data Analysis - 261119 Q
Document16 pages
Lab 3 - Exploratory Data Analysis - 261119 Q
Joker Jr
No ratings yet
Jeffrey Williams (20221013) 4
Document27 pages
Jeffrey Williams (20221013) 4
JEFFREY WILLIAMS P M 20221013
No ratings yet
Statistics - A.Y. 2018-2019: BIEF - Class 22
Document22 pages
Statistics - A.Y. 2018-2019: BIEF - Class 22
ema
No ratings yet
PS261 Week 1 Lecture
Document25 pages
PS261 Week 1 Lecture
Marta ortega garcía
No ratings yet
Situations. Is The Employee Who Arrives Late Today Also The One Coworkers Say Regularly
Document2 pages
Situations. Is The Employee Who Arrives Late Today Also The One Coworkers Say Regularly
shadrack nandwa
No ratings yet
Sheet Metal Shop
Document18 pages
Sheet Metal Shop
Anand
No ratings yet
RT 4 Ip 065
Document8 pages
RT 4 Ip 065
abhinav4090ti
No ratings yet
Floppy Sprinkler Rain Irrigation Systems Overview - Digital Email Size
Document23 pages
Floppy Sprinkler Rain Irrigation Systems Overview - Digital Email Size
Dawieta Van Eeden Vermaak
No ratings yet
Dogs Breeds
Document20 pages
Dogs Breeds
donovanwick
No ratings yet
Earth Science: 2 Grading Grade 8 "Remediation"
Document11 pages
Earth Science: 2 Grading Grade 8 "Remediation"
Shane Catherine Besares
No ratings yet
IMWA2016 Coetzee 66
Document6 pages
IMWA2016 Coetzee 66
Glenn Nyirenda
No ratings yet
Go Math 9.3 HW
Document2 pages
Go Math 9.3 HW
Pronto
No ratings yet
Assignment - BPMS
Document5 pages
Assignment - BPMS
Megh Wadhawan
No ratings yet
Geneva Use
Document135 pages
Geneva Use
Mohit Sahu
60% (5)
Book - Contributor - EN (Limited) v1.1 PDF
Document6 pages
Book - Contributor - EN (Limited) v1.1 PDF
Samir2020
No ratings yet
كيمياء المعادن - تعريفات
Document2 pages
كيمياء المعادن - تعريفات
mohamed Elsayed
No ratings yet
Blue Gold Minimalist Certificate of Appreciation Certificate
Document28 pages
Blue Gold Minimalist Certificate of Appreciation Certificate
Kimverly Ganaden
No ratings yet
Rewrite
Document4 pages
Rewrite
Ochieng
No ratings yet
Climate Change Adaptation - A Green Infrastructure Planning Framew
Document243 pages
Climate Change Adaptation - A Green Infrastructure Planning Framew
Md Ibrahim
No ratings yet
Manuale Service ML Em9250 Em9350 4-119446B 05-2018 en PDF
Document50 pages
Manuale Service ML Em9250 Em9350 4-119446B 05-2018 en PDF
Juan Fernando Domínguez Tapia
No ratings yet
Establishment of Share Unit Formula For Strata Res
Document6 pages
Establishment of Share Unit Formula For Strata Res
Ramani K
No ratings yet
Patentable and Non Patentable Inventions
Document11 pages
Patentable and Non Patentable Inventions
Aniket Santra
No ratings yet
SUJ2 Datasheet
Document2 pages
SUJ2 Datasheet
Gyurmooo
No ratings yet
Bab03 Memanage Dalam Lingkungan Global
Document38 pages
Bab03 Memanage Dalam Lingkungan Global
Perbasi Sidoarjo
No ratings yet
Transient Surge Filter - TSF20A240V
Document3 pages
Transient Surge Filter - TSF20A240V
vulamtd2
No ratings yet
Simple Present Mind Map
Document1 page
Simple Present Mind Map
Nelly Lopes
No ratings yet
Abdirizak Mohamed Hassan CV
Document3 pages
Abdirizak Mohamed Hassan CV
Cabdirizaaq Hassam
No ratings yet
Chapter 3 - Perforating Methods
Document40 pages
Chapter 3 - Perforating Methods
Kamran Haider Tunio
73% (11)
Rencana Strategis Dinas Pekerjaan Umum Kabupaten Bengkulu Utara Tahun 2016-2021
Document5 pages
Rencana Strategis Dinas Pekerjaan Umum Kabupaten Bengkulu Utara Tahun 2016-2021
Tendo San
No ratings yet
1 - COMPOUND MICROSCOPE - Parts & Functions
Document7 pages
1 - COMPOUND MICROSCOPE - Parts & Functions
Michael Ritz Estillore
100% (1)
Examguide2033 202302081040
Document23 pages
Examguide2033 202302081040
Astin Suresh
No ratings yet