Lecture - 08 - Data Science Processes Part 2

Uploaded by

Hamza Abbasi

0% found this document useful (0 votes)

6 views20 pages

Original Title

Lecture_08 - Data Science Processes Part 2

Copyright

Available Formats

PPTX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as pptx, pdf, or txt

0% found this document useful (0 votes)

6 views20 pages

Lecture - 08 - Data Science Processes Part 2

Uploaded by

Hamza Abbasi

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as pptx, pdf, or txt

Jump to Page

You are on page 1of 20

Search inside document

Hope to Skills

Lecture# 16
Irfan Malik, Dr. Sheraz Naseer
Slide credits:
Irfan Malik, Dr. Sheraz Naseer
Agenda
Data Science processes

3
Data Science Processes - I

4
Data Science Processes - II

5
Data Science Processes - III

6
Data Skewness:
Data skewness is an uneven distribution of data within a dataset. It occurs
when certain values or ranges of values appear more frequently than others. This
skewness can occur in various dimensions of the dataset, such as columns,
partitions, or even individual files.

7
Distributions

8
Negative Skewness: If the mode is smaller than the mean, the data is positively
skewed.

Positive Skewness: If the mean is smaller than the mode, the data is negatively
skewed.

Symmetrical Distribution: Mean, median, and mode are all equal; distribution is
balanced.

9
Data Transformation:
● Data transformation is the process of converting, cleansing, and structuring
data into a usable format that can be analyzed to support decision making
processes, and to propel the growth of an organization.

10
Smoothing:
● Smoothing in data preprocessing refers to a set of techniques used to reduce
noise and fluctuations in data while preserving important underlying trends
and patterns. It is a crucial step in preparing data for analysis and modeling,
particularly when dealing with noisy or uneven data points.

11
Feature Engineering:
● Feature engineering is an essential step in the data science process that
involves creating and transforming raw data into features suitable for
building machine learning models.

12
Data Normalization:
Normalization is a data preprocessing technique that transforms data values to a
common scale or distribution of values. It can include adjusting the scale of
values to a similar metric or adjusting the time scales to be able to compare like
periods.

13
Scaling:
1. Min Max Scaling
2. Z-score Scaling

14
Data Visualization Charts

15
16
Model Building:
● Model building involves the process of selecting and training a machine
learning model using a dataset to learn patterns and relationships within the
data. This typically includes steps such as preprocessing the data, selecting an
appropriate algorithm, splitting the data into training and validation sets,
training the model on the training set, and evaluating its performance on the
validation set.

17
Model Validation:
● Model validation is a machine learning (ML) process that assesses how
well a model can produce predictions or outputs. It's important to validate
models before deployment to ensure they're accurate and reliable.

18
Linear Regression
Linear regression is a supervised machine learning algorithm used for predicting a
continuous output (dependent variable) based on one or more input features
(independent variables).

19
Logistic Regression
Logistic regression is a supervised machine learning algorithm that accomplishes
binary classification tasks by predicting the probability of an outcome, event, or
observation.

Internship Presentation
Document20 pages
Internship Presentation
Sanam Shrestha
78% (9)
Customer Perception and Satisfaction On Ordering Food Via: Setsethu - Hs@manipal - Eduhu.hs@manipal - Edu
Document13 pages
Customer Perception and Satisfaction On Ordering Food Via: Setsethu - Hs@manipal - Eduhu.hs@manipal - Edu
RajeshPmr
No ratings yet
Experiment-3 31
Document9 pages
Experiment-3 31
Shubham Jha
No ratings yet
Week 3 - LAQ
Document2 pages
Week 3 - LAQ
G Kishore
No ratings yet
Comparison of Data Mining and Auditing Tools: Simmi Bagga and G.N. Singh
Document3 pages
Comparison of Data Mining and Auditing Tools: Simmi Bagga and G.N. Singh
bermazer
No ratings yet
Core Data Science Concepts 1629081058
Document24 pages
Core Data Science Concepts 1629081058
Abhishek Prasoon
No ratings yet
S2-Slo1 & Slo2
Document3 pages
S2-Slo1 & Slo2
Belina V J Sara S
No ratings yet
Exporatory Data Analytics Notes ME SEM 2
Document132 pages
Exporatory Data Analytics Notes ME SEM 2
shilpamjadhav2020
No ratings yet
Unit .1
Document7 pages
Unit .1
read4free
No ratings yet
DM - MOD - 1 Part III
Document12 pages
DM - MOD - 1 Part III
sandrarajuofficial
No ratings yet
Unit 5
Document14 pages
Unit 5
aa
No ratings yet
1.3 Introduction To Data Preprocessing
Document16 pages
1.3 Introduction To Data Preprocessing
Đạt Nguyễn
No ratings yet
Chuong7 TongQuanMoHinhPhanTich
Document43 pages
Chuong7 TongQuanMoHinhPhanTich
Nguyen Chau
No ratings yet
Chapter - 2 - Data Science
Document33 pages
Chapter - 2 - Data Science
Demeke
No ratings yet
Predictive Modelling-Week-1
Document39 pages
Predictive Modelling-Week-1
prepareforexamz
No ratings yet
Module 2 - PART 1
Document50 pages
Module 2 - PART 1
PATTABHI RAMANJANEYULU
No ratings yet
Notes
Document30 pages
Notes
Saurabh Kansara
No ratings yet
TE Computer DSBDA
Document11 pages
TE Computer DSBDA
1620Chaitanya Suryavanshi
No ratings yet
Les Statistiques Descriptives Est Oujda
Document4 pages
Les Statistiques Descriptives Est Oujda
Mouhsine EL MOUDIR
No ratings yet
Data Mining
Document77 pages
Data Mining
Sandip Tiwari
No ratings yet
2 Data Science
Document27 pages
2 Data Science
kigali ac
No ratings yet
Unit 2 Data Mining
Document69 pages
Unit 2 Data Mining
Sangita Hazra
No ratings yet
Script For Data Science Presentation
Document4 pages
Script For Data Science Presentation
Hadiqa naaz
No ratings yet
Unlocking The Power of Data Science
Document10 pages
Unlocking The Power of Data Science
saniakhan8105
No ratings yet
COMPAPPABCA50150rDatrAP Data Preprocessing2 (DataMining)
Document13 pages
COMPAPPABCA50150rDatrAP Data Preprocessing2 (DataMining)
Mr Kamina
No ratings yet
Unit 3
Document104 pages
Unit 3
sachin11200111
No ratings yet
DWDM Word Docu
Document14 pages
DWDM Word Docu
Biswajit saha
No ratings yet
Data Cleaning, Integration, and Data Transformation Techniques
Document7 pages
Data Cleaning, Integration, and Data Transformation Techniques
samforresume
No ratings yet
What Is Exploratory Data Analysis (EDA)
Document13 pages
What Is Exploratory Data Analysis (EDA)
emansyed2212
No ratings yet
Presentacion de TIC 1
Document33 pages
Presentacion de TIC 1
Adrian Peran
No ratings yet
QB 10 Marker
Document19 pages
QB 10 Marker
yashpatelykp
No ratings yet
Unit 4 Basics of Feature Engineering
Document33 pages
Unit 4 Basics of Feature Engineering
Kalash Shah
100% (1)
Glossary: Business Intelligence and Tools Glossary
Document22 pages
Glossary: Business Intelligence and Tools Glossary
gaardi
No ratings yet
Unit 2
Document9 pages
Unit 2
Vishnu
No ratings yet
Bda Viva Q A
Document24 pages
Bda Viva Q A
flashmobpvpit25
No ratings yet
Machine Learning Chapter 2
Document37 pages
Machine Learning Chapter 2
Cherenet Toma
No ratings yet
Bda Viva Q&a
Document24 pages
Bda Viva Q&a
Sumeet Chauhan
No ratings yet
Data Mining Cat
Document6 pages
Data Mining Cat
mwepaka ndackia
No ratings yet
Business Data Mining Week 3
Document3 pages
Business Data Mining Week 3
pm6566
No ratings yet
Data Visualization Using Business Intelligence (MDS204) : Arti Yadav Einfach Bussiness Analytics PVT LTD
Document60 pages
Data Visualization Using Business Intelligence (MDS204) : Arti Yadav Einfach Bussiness Analytics PVT LTD
Arindam Mondal
No ratings yet
Data Warehousing Mining
Document26 pages
Data Warehousing Mining
bocadojerrylloyd
No ratings yet
Machine Learning Introduction
Document20 pages
Machine Learning Introduction
nada1914465
No ratings yet
1708443470801
Document71 pages
1708443470801
Ronald Cruz
No ratings yet
Viva EDA
Document8 pages
Viva EDA
thisisdeepakhb
No ratings yet
Business Analytics: Aviral Apurva Anureet Bansal Devansh Agarwaal Dhwani Dhingra Chirag Verma
Document49 pages
Business Analytics: Aviral Apurva Anureet Bansal Devansh Agarwaal Dhwani Dhingra Chirag Verma
GAMEBRED YT
No ratings yet
TIS - Intro To Machine Learning
Document18 pages
TIS - Intro To Machine Learning
apoorva.k2017
No ratings yet
Fundamentals of Datascience
Document80 pages
Fundamentals of Datascience
Professor
No ratings yet
AI and ML For Business Antim Prahar WITH ANSWERS
Document26 pages
AI and ML For Business Antim Prahar WITH ANSWERS
Tinku The Blogger
No ratings yet
Ba Unit 4 - Part1
Document7 pages
Ba Unit 4 - Part1
Arunim Yadav
No ratings yet
Hair EOMA 1e Chap002 PPT
Document17 pages
Hair EOMA 1e Chap002 PPT
Hadeel A Khamaiseh
No ratings yet
Week 3
Document23 pages
Week 3
Muneeba Mehmood
No ratings yet
Dmbi Assignment 3
Document5 pages
Dmbi Assignment 3
Kanishk Test
No ratings yet
Data Science
Document16 pages
Data Science
Dankmulla
No ratings yet
AI Group8
Document11 pages
AI Group8
meghana kanse
No ratings yet
Session 1 - Introduction To Business Analytics
Document7 pages
Session 1 - Introduction To Business Analytics
ritik nehra
No ratings yet
Data Preprocessing
Document9 pages
Data Preprocessing
tanishq.verma2020
No ratings yet
Adobe Scan 27-Mar-2024
Document12 pages
Adobe Scan 27-Mar-2024
hapiness1131
No ratings yet
Unit V Fds Notes
Document35 pages
Unit V Fds Notes
22ad030
No ratings yet
My Chapter Two
Document57 pages
My Chapter Two
Eweje Oluwafemi Williams
No ratings yet
MACHINE-LEARNING
Document44 pages
MACHINE-LEARNING
maparona75
No ratings yet
Chương
Document12 pages
Chương
BẢO ĐẶNG THÁI
No ratings yet
Data Scaling and Normalization
From Everand
Data Scaling and Normalization
Chuck Sherman
No ratings yet
Lecture11 Visualization
Document11 pages
Lecture11 Visualization
Hamza Abbasi
No ratings yet
Chapter#1 Software Engineering
Document32 pages
Chapter#1 Software Engineering
Hamza Abbasi
No ratings yet
Lec#2 Software Engineering
Document67 pages
Lec#2 Software Engineering
Hamza Abbasi
No ratings yet
Lec 1
Document44 pages
Lec 1
Hamza Abbasi
No ratings yet
Chapter 5
Document59 pages
Chapter 5
Hamza Abbasi
No ratings yet
Essay-Writing: Definition
Document4 pages
Essay-Writing: Definition
Hamza Abbasi
No ratings yet
Bs Computer Science Docs
Document62 pages
Bs Computer Science Docs
Hamza Abbasi
No ratings yet
Educationtechnology11 200119125929
Document17 pages
Educationtechnology11 200119125929
Hamza Abbasi
No ratings yet
CFPB Financial Well-Being Scale - 2017
Document54 pages
CFPB Financial Well-Being Scale - 2017
queenfaustinee
No ratings yet
Presentation Analysis and Interpretation of Data in Research Paper Sample
Document5 pages
Presentation Analysis and Interpretation of Data in Research Paper Sample
gvzcrpym
No ratings yet
CP CPK - PP PPK
Document8 pages
CP CPK - PP PPK
Rus Mihai
No ratings yet
THESISS
Document42 pages
THESISS
Patrick De Guzman
No ratings yet
Organizational Performance in Hospitals in Suriname. A Test of An Extended Version of DeLone and McLean S IS Success Model 2003 by DeLano Gefferie MBAIV
Document129 pages
Organizational Performance in Hospitals in Suriname. A Test of An Extended Version of DeLone and McLean S IS Success Model 2003 by DeLano Gefferie MBAIV
geffe130
No ratings yet
Exploratory Factor Analysis
Document54 pages
Exploratory Factor Analysis
soumya agrawal
No ratings yet
Cengage EBA 2e Chapter04
Document35 pages
Cengage EBA 2e Chapter04
jose
No ratings yet
Introduction To Econometrics - Stock & Watson - CH 5 Slides
Document71 pages
Introduction To Econometrics - Stock & Watson - CH 5 Slides
Antonio Alvino
100% (2)
Measures of Variability PDF
Document39 pages
Measures of Variability PDF
makoy
No ratings yet
1.1.back Ground of Study: Chapter One
Document21 pages
1.1.back Ground of Study: Chapter One
Habte Abe
No ratings yet
Refs
Document17 pages
Refs
juan camilo
No ratings yet
Continue
Document2 pages
Continue
ranjeet patil
No ratings yet
Problem Null Hypothesis Critical Value of (
Document4 pages
Problem Null Hypothesis Critical Value of (
Semaj Raviola
No ratings yet
Course Syllabus - GMU Spring 2018 - BUS 310 - Section 15 - Business Analytics II
Document7 pages
Course Syllabus - GMU Spring 2018 - BUS 310 - Section 15 - Business Analytics II
Anonymous OYqRcuae
100% (1)
What Is Data Science?: Michael L. Brodie
Document21 pages
What Is Data Science?: Michael L. Brodie
Alt Chinar
No ratings yet
HR Analytics Dashboard
Document1 page
HR Analytics Dashboard
MðuãdHåmoüsti
No ratings yet
SMJ Transparency
Document42 pages
SMJ Transparency
Jordan Davis
No ratings yet
Deposite Mobilization
Document10 pages
Deposite Mobilization
Kimberly Fuller
100% (1)
An Introduction To Business Research
Document35 pages
An Introduction To Business Research
farumas
No ratings yet
Chapter 4 Exponential Smoothening Methods
Document19 pages
Chapter 4 Exponential Smoothening Methods
Sushil Kumar
No ratings yet
Project Report 1
Document55 pages
Project Report 1
Vivek Rana
No ratings yet
Department of Mathematics & Statistics Manipal University Jaipur Assignment No. - 3, MA1202
Document2 pages
Department of Mathematics & Statistics Manipal University Jaipur Assignment No. - 3, MA1202
Anonymous E9WzTO
No ratings yet
Basic Business Statistics: 10 Edition
Document77 pages
Basic Business Statistics: 10 Edition
UTTAM KOIRALA
No ratings yet
Factsheet SAS VDD
Document4 pages
Factsheet SAS VDD
rajendra.raval
No ratings yet
Endogeneity and Instrumental Variables
Document22 pages
Endogeneity and Instrumental Variables
justin bal
No ratings yet
Lesson4 Methods of Organizing Data
Document33 pages
Lesson4 Methods of Organizing Data
Jerald Jay Catacutan
No ratings yet
3-2-9 - Soft Computing Lab
Document2 pages
3-2-9 - Soft Computing Lab
arunkumargoge
No ratings yet
Screening of Problem Behavior Syndrome in Adolescents: A. I. Corchado R. Martínez Arias
Document11 pages
Screening of Problem Behavior Syndrome in Adolescents: A. I. Corchado R. Martínez Arias
prs75
No ratings yet