Exploratory Data Analysis: A First Look at The Data

Uploaded by

gunika.arora2009

0% found this document useful (0 votes)

1 views9 pages

Original Title

Eda

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as pdf or txt

0% found this document useful (0 votes)

1 views9 pages

Exploratory Data Analysis: A First Look at The Data

Uploaded by

gunika.arora2009

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as pdf or txt

Jump to Page

You are on page 1of 9

Search inside document

Exploratory Data Analysis

A first look at the data

Here are the main reasons we use EDA
- detection of mistakes
- checking of assumptions
- preliminary selection of appropriate models
- determining relationships among the explanatory variables, and
- assessing the direction and rough size of relationships between explanatory
and outcome variables
Typical data format and the types of EDA
- The data from an experiment are generally collected into a rectangular array
(e.g., spreadsheet or database)
- one row per experimental subject
- one column for each subject identifier, outcome variable, and explanatory variable
- Each column contains the numeric values for a particular quantitative variable or the levels for
a categorical variable.
- looking at numbers to be tedious, boring, and/or overwhelming
- Exploratory data analysis techniques have been devised as an aid in this
situation.
- techniques work in part by hiding certain aspects of the data while making
other aspects more clear.
Types of EDA
- Exploratory data analysis is generally cross-classified in two ways
- First, each method is either non-graphical or graphical.
- And second, each method is either univariate or multivariate (usually just bivariate)
- Non-graphical methods generally involve calculation of summary statistics
- while graphical methods obviously summarize the data in a diagrammatic or
pictorial way
-
Types of EDA
- Univariate methods look at one variable (data column) at a time
- multivariate methods look at two or more variables at a time to explore
relationship
- Usually our multivariate EDA will be bivariate
Types of EDA
- The four types of EDA are
- univariate non graphical,
- multivariate non graphical,
- univariate graphical, and
- multivariate graphical
First you must import your data into R.

Tidying your data means storing it in a consistent form that matches the
semantics of the dataset with the way it is stored.

Data is tidy, each column is a variable, and each row is an

observation.
Tidy data is important because the consistent structure lets you focus your
struggle on questions about the data, not ﬁghting to get the data into the
right form for different functions.
Once you have tidy data, a common ﬁrst step is to transform it.

Transformation includes narrowing in on observations of interest (like all

people in one city, or all data from the last year), creating new variables that
are functions of existing variables (like computing speed from distance
and time), and calculating a set of summary statistics (like counts or
means).

Together, tidying and transforming are called wrangling, because getting

your data in a form that’s natural to work with often feels like a ﬁght!
Assignment
Assignment Link:
https://drive.google.com/file/d/1iKCCXqQ10mnuKuBqEk1kd4vt8Q0ZlaFd/view

Data Analysis and Interpretation
Document14 pages
Data Analysis and Interpretation
jaysonfredmarin
88% (8)
Learn Excel Data Analysis
Document721 pages
Learn Excel Data Analysis
eBooks DPF Download
100% (5)
Simple Data Science (R)
From Everand
Simple Data Science (R)
Narayana Nemani
Rating: 5 out of 5 stars
5/5 (1)
GEF-CSO Network Membership Application Form Jan2015
Document3 pages
GEF-CSO Network Membership Application Form Jan2015
Rejus Babu
No ratings yet
Sears - IsO 9001
Document6 pages
Sears - IsO 9001
Zia Shahid
No ratings yet
Unit 3
Document47 pages
Unit 3
Sai priyadarshini S
No ratings yet
PTDLKT
Document11 pages
PTDLKT
Nguyễn Lê Phương Uyên
No ratings yet
What Is Exploratory Data Analysis (EDA) ?
Document6 pages
What Is Exploratory Data Analysis (EDA) ?
Priyadarshini Chavan
No ratings yet
Business Research Methods6
Document26 pages
Business Research Methods6
Siraj Mohammed
No ratings yet
Analyzing The Data
Document54 pages
Analyzing The Data
Magnolia Khine
No ratings yet
Unit 2
Document58 pages
Unit 2
radhikakumbhar2978
No ratings yet
Data Wrangling
Document18 pages
Data Wrangling
Ashish Ghoshal
No ratings yet
Unit-Ii: Data Analysis: Editing, Coding, Transformation of Data
Document9 pages
Unit-Ii: Data Analysis: Editing, Coding, Transformation of Data
Durga Prasad Nalla
No ratings yet
Data Mining
Document22 pages
Data Mining
vrkatevarapu
No ratings yet
Data Analysis and Interpretation
Document19 pages
Data Analysis and Interpretation
Dolly Dolly
100% (2)
UNIT 1 Exploratory Data Analysis
Document21 pages
UNIT 1 Exploratory Data Analysis
divyar674
No ratings yet
Unit 3
Document31 pages
Unit 3
Avish Khan
No ratings yet
Unit - 4 - Auto 2018
Document12 pages
Unit - 4 - Auto 2018
sharath
No ratings yet
Exploratory Data Analysis
Document62 pages
Exploratory Data Analysis
60 Vibha Shree.S
No ratings yet
Presentation of Data Analysis and Interpretation
Document31 pages
Presentation of Data Analysis and Interpretation
Lou Cabanting
100% (3)
Data Management: Quantifying Data & Planning Your Analysis
Document38 pages
Data Management: Quantifying Data & Planning Your Analysis
Winnie Sison
No ratings yet
Data Management: Quantifying Data & Planning Your Analysis
Document38 pages
Data Management: Quantifying Data & Planning Your Analysis
Saqlain Tariq
No ratings yet
Chapter 5
Document40 pages
Chapter 5
Ebisa Chemeda
No ratings yet
Eda Sandhya
Document7 pages
Eda Sandhya
rushikumar
No ratings yet
Unit I - Part I Notes
Document33 pages
Unit I - Part I Notes
Manju Ancy John Immanuel
100% (6)
Unit 3
Document77 pages
Unit 3
patilamrutak2003
No ratings yet
Different Kinds of Data and Data Sets in Research. GROUP 2
Document10 pages
Different Kinds of Data and Data Sets in Research. GROUP 2
Celyn Jasmine Gerial
No ratings yet
Unit 2 Describing Data
Document21 pages
Unit 2 Describing Data
G Ashwinn Reddy
No ratings yet
Dev Answer Key
Document17 pages
Dev Answer Key
jayapriya kce
100% (1)
DS Midterm Review - Lecture Notes
Document14 pages
DS Midterm Review - Lecture Notes
Tara Ram Mohan
No ratings yet
Activity 3 Interpreting Data
Document7 pages
Activity 3 Interpreting Data
Isa Pearl
No ratings yet
Chapter Six - Processing, Analyzing and Interpretation of Data
Document56 pages
Chapter Six - Processing, Analyzing and Interpretation of Data
Sitra Abdu
No ratings yet
Unit .......
Document45 pages
Unit .......
Rajan shah
No ratings yet
Descriptive Statistics
Document26 pages
Descriptive Statistics
Rameir Angelo Catamora
No ratings yet
Unit 3 Notes
Document5 pages
Unit 3 Notes
patilamrutak2003
No ratings yet
Analyzing The Meaning of The Data and Drawing Conclusion
Document5 pages
Analyzing The Meaning of The Data and Drawing Conclusion
Ro Ze Lle
No ratings yet
Notes Chap 1 Business Statistics
Document6 pages
Notes Chap 1 Business Statistics
Ee Jia En
No ratings yet
Unit3 Eda
Document13 pages
Unit3 Eda
RAPTER GAMING
No ratings yet
Exploratory Data Analysis in ML
Document7 pages
Exploratory Data Analysis in ML
Suresh Kumar
No ratings yet
S2-Slo1 & Slo2
Document3 pages
S2-Slo1 & Slo2
Belina V J Sara S
No ratings yet
3-2. Workflow of Data Analysis
Document18 pages
3-2. Workflow of Data Analysis
김가온
No ratings yet
1.2 - Data Processing
Document25 pages
1.2 - Data Processing
Ranveer Sehedeva
No ratings yet
Topic 8 Data Processing and Analysis PDF
Document157 pages
Topic 8 Data Processing and Analysis PDF
GWAKISA MWASONYA
No ratings yet
A Short Course in Multivariate Statistical Methods With R
Document11 pages
A Short Course in Multivariate Statistical Methods With R
qwety300
No ratings yet
Power
Document42 pages
Power
Fabio Tugonon
No ratings yet
Data Science Full
Document32 pages
Data Science Full
BCS Wala
No ratings yet
What Exactly Is Data Science
Document15 pages
What Exactly Is Data Science
s6652565
No ratings yet
DSML Notes
Document32 pages
DSML Notes
Vishnu
No ratings yet
Finding The Answers To The Research Questions Lesson 2 - Interpretation and Presentation of Results Interpreting The Data
Document6 pages
Finding The Answers To The Research Questions Lesson 2 - Interpretation and Presentation of Results Interpreting The Data
Ramien Andrea Cagampang
No ratings yet
Processing and Analyzing Data: Construction Management Chair
Document29 pages
Processing and Analyzing Data: Construction Management Chair
hayelom
No ratings yet
Quantitative Data Analysis: (Version 0.7, 1/4/05) Daniel K. Schneider, TECFA, University of Geneva
Document24 pages
Quantitative Data Analysis: (Version 0.7, 1/4/05) Daniel K. Schneider, TECFA, University of Geneva
Anirudh Bhatjiwale
No ratings yet
DEV Lecture Notes Unit I
Document72 pages
DEV Lecture Notes Unit I
prins l
No ratings yet
Chapter 8
Document2 pages
Chapter 8
mudasiramin8009112
No ratings yet
Upload 5
Document1 page
Upload 5
Anil Arora
No ratings yet
Untitled
Document15 pages
Untitled
best barbie
No ratings yet
Business Analytics (MIS171) Summary Notes
Document6 pages
Business Analytics (MIS171) Summary Notes
sneha
No ratings yet
Data Analysis and Inference - Mba - UPD DR DENARTO DENNIS
Document23 pages
Data Analysis and Inference - Mba - UPD DR DENARTO DENNIS
Victor Brown
No ratings yet
REVIEWER
Document6 pages
REVIEWER
Gallego, Rove P.
No ratings yet
Lecture 2 - Statistical Inference - EDA and DS Process - 02032023 111156am 1 - 1 27022024 012412pm
Document44 pages
Lecture 2 - Statistical Inference - EDA and DS Process - 02032023 111156am 1 - 1 27022024 012412pm
Abdul Mueed Paracha
No ratings yet
Data Science Presentation
Document113 pages
Data Science Presentation
DHEEVIKA SURESH
100% (2)
Data Science & Big Data Analysis Module 1,2,3,4,5
Document70 pages
Data Science & Big Data Analysis Module 1,2,3,4,5
ARUN PS
No ratings yet
Big Data for Beginners: Book 2 - An Introduction to the Data Analysis, Visualization, Integration, Interoperability, Governance and Ethics
From Everand
Big Data for Beginners: Book 2 - An Introduction to the Data Analysis, Visualization, Integration, Interoperability, Governance and Ethics
Brian Murray
No ratings yet
JBT Teleradial Final
Document2 pages
JBT Teleradial Final
studentsurfpro4
No ratings yet
Wa0000. 11 12
Document2 pages
Wa0000. 11 12
sayalibarhate2717
No ratings yet
Ie Delhi 23 06 2023
Document20 pages
Ie Delhi 23 06 2023
Vishal Aditya
No ratings yet
Tarea 3
Document1 page
Tarea 3
Andrea Vázquez Eslava
No ratings yet
2 2024 School Census ADVANCE Questionnaire Pre-Pri
Document18 pages
2 2024 School Census ADVANCE Questionnaire Pre-Pri
frecymile46
No ratings yet
TWPCID734277
Document9 pages
TWPCID734277
Adi Poiana
No ratings yet
GWR Track Panels in Templot
Document4 pages
GWR Track Panels in Templot
Martin Wynne
100% (1)
Bus Reservation System WebBased Apllication
Document73 pages
Bus Reservation System WebBased Apllication
Vaibhav
0% (1)
Technoguide For Pechay
Document5 pages
Technoguide For Pechay
Johann Dexter Malimban Glorioso
No ratings yet
Introduction To Matlab/Simulink Objectives
Document8 pages
Introduction To Matlab/Simulink Objectives
Fatima Saeed
No ratings yet
NLP 2 Adv
Document91 pages
NLP 2 Adv
Shamsul Bashar
No ratings yet
Juri 4
Document11 pages
Juri 4
anirudhpa21bcom
No ratings yet
Bhel My Question Paper
Document72 pages
Bhel My Question Paper
NITHYAPREMINI
No ratings yet
Field Experience B: Principal Interview 1
Document7 pages
Field Experience B: Principal Interview 1
Raymond Barton
No ratings yet
Dynea Group Annual Report 2010
Document47 pages
Dynea Group Annual Report 2010
Vistasp Major
No ratings yet
Melanieresume
Document1 page
Melanieresume
api-253574700
No ratings yet
Chemical Handling Assignment
Document49 pages
Chemical Handling Assignment
Gkou Dojku
No ratings yet
Cavitation of A Water Jet in Water
Document82 pages
Cavitation of A Water Jet in Water
Aung Kyi
No ratings yet
Feeding Norms Poultry76
Document14 pages
Feeding Norms Poultry76
Ramesh Beniwal
No ratings yet
Activity 1.2 PDF
Document2 pages
Activity 1.2 PDF
Janine Arielle Danao
No ratings yet
Factors Affecting Participation in A Civil Society Network (Nangonet) in Ngara District
Document61 pages
Factors Affecting Participation in A Civil Society Network (Nangonet) in Ngara District
Repoa Tanzania
No ratings yet
Ferreria Ormilla John Rey Filipino Filipino Gina N. Ferreria
Document3 pages
Ferreria Ormilla John Rey Filipino Filipino Gina N. Ferreria
Roc Valdez
No ratings yet
CPPG 10 As Avr+Itr: Spare Parts List
Document21 pages
CPPG 10 As Avr+Itr: Spare Parts List
Md. Fahmid Islam
No ratings yet
United States v. Demetrius N. Weddle, 11th Cir. (2016)
Document4 pages
United States v. Demetrius N. Weddle, 11th Cir. (2016)
Scribd Government Docs
No ratings yet
Astm 2017 F2773
Document4 pages
Astm 2017 F2773
iipmnpti iipm
No ratings yet
Service: FABIA 2000
Document52 pages
Service: FABIA 2000
Mantenimientos Industriales
No ratings yet
Spreadsheet - Gas Blanketed Tanks - Inbreathing Process Calculations & Control Valve Sizing - Rev2
Document26 pages
Spreadsheet - Gas Blanketed Tanks - Inbreathing Process Calculations & Control Valve Sizing - Rev2
venkatesh801
No ratings yet
Ias 1
Document59 pages
Ias 1
gaurav
No ratings yet