Welcome to Scribd!

Skip carousel

0% found this document useful (0 votes)

2 views

Data Preprocessing Unit 2

Uploaded by

ac8198905

Copyright:

Available Formats

Download as DOCX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Low Level Design
Document22 pages
Low Level Design
PArdeep Gorla
0% (1)
Data Preprocessing in Data Mining
Document4 pages
Data Preprocessing in Data Mining
Dhananjai Saini
No ratings yet
SQLMX Vs Oracle
Document49 pages
SQLMX Vs Oracle
Paul Chin
No ratings yet
Informatica Interview Questions and Answers PDF
Document3 pages
Informatica Interview Questions and Answers PDF
Ratul Dey
100% (1)
Unit 2 DWDM
Document14 pages
Unit 2 DWDM
brijendersinghkhalsa
No ratings yet
Major Issues in Data Mining
Document5 pages
Major Issues in Data Mining
Gaurav Jaiswal
No ratings yet
Data Mining
Document5 pages
Data Mining
Namra Sarfraz
No ratings yet
Term Paper
Document5 pages
Term Paper
Akash Sudan
No ratings yet
INTRODUCTION
Document9 pages
INTRODUCTION
Ashitha Ashi
No ratings yet
Lec 2 Preparing The Data
Document4 pages
Lec 2 Preparing The Data
Alia butt
No ratings yet
Major Issues in Data Mining
Document9 pages
Major Issues in Data Mining
Gaurav Jaiswal
No ratings yet
Unit 2: Big Data Analytics
Document45 pages
Unit 2: Big Data Analytics
Prabha Joshi
No ratings yet
Module 2
Document8 pages
Module 2
Sayan Majumder
No ratings yet
Module 2
Document42 pages
Module 2
hiremathsumith99
No ratings yet
Data Preprocessing
Document3 pages
Data Preprocessing
Im' Possible
No ratings yet
Unit 2
Document6 pages
Unit 2
Dakshkohli31 Kohli
No ratings yet
DWM Module 2
Document9 pages
DWM Module 2
sandriapgot
No ratings yet
Unit-3 Data Preprocessing
Document7 pages
Unit-3 Data Preprocessing
Khal Drago
100% (1)
Datawarehousing
Document10 pages
Datawarehousing
Harshit Jain
No ratings yet
Stages in Data Mining
Document11 pages
Stages in Data Mining
Yusuf mohammed
No ratings yet
Notes - Unit01 - Data Science and Big Data Analytics
Document7 pages
Notes - Unit01 - Data Science and Big Data Analytics
Atharva Gokhare
No ratings yet
U2L1
Document11 pages
U2L1
Sangita Hazra
No ratings yet
R Programming Unit-2
Document29 pages
R Programming Unit-2
padma
No ratings yet
DM&W File
Document18 pages
DM&W File
Prerna Rawal
No ratings yet
IV-cse DM Viva Questions
Document10 pages
IV-cse DM Viva Questions
Imtiyaz Ali
No ratings yet
Lecture Notes Data Mining Data Warehousing Unit-2: Data Preprocessing
Document3 pages
Lecture Notes Data Mining Data Warehousing Unit-2: Data Preprocessing
DrArun Kumar Choudhary
No ratings yet
UNIT - 2 .DataScience 04.09.18
Document53 pages
UNIT - 2 .DataScience 04.09.18
Raghavendra Rao
No ratings yet
Ques 1.give Some Examples of Data Preprocessing Techniques?: Assignment - DWDM Submitted By-Tanya Sikka 1719210284
Document7 pages
Ques 1.give Some Examples of Data Preprocessing Techniques?: Assignment - DWDM Submitted By-Tanya Sikka 1719210284
Sachin Chauhan
No ratings yet
Unit 2
Document9 pages
Unit 2
Vishnu
No ratings yet
Chương
Document12 pages
Chương
BẢO ĐẶNG THÁI
No ratings yet
Dw&bi PR2,3
Document6 pages
Dw&bi PR2,3
Dhanraj Deore
No ratings yet
Datamining Unit 2 Part2
Document11 pages
Datamining Unit 2 Part2
Bhasutkar Mahesh
No ratings yet
Unit 3 DW
Document19 pages
Unit 3 DW
pratapshivamsid
No ratings yet
Data Mining - Unit - 3
Document62 pages
Data Mining - Unit - 3
sunil star
No ratings yet
(M3S1) Data Analytics Framework
Document12 pages
(M3S1) Data Analytics Framework
nikkitaallycosme.48
No ratings yet
Normalization
Document35 pages
Normalization
Hrithik Reigns
No ratings yet
Unit - 2 Machine Learning
Document42 pages
Unit - 2 Machine Learning
Nishtha Singh
No ratings yet
Data Preprocessing
Document3 pages
Data Preprocessing
Sajid Hussain S
No ratings yet
Data Binning
Document9 pages
Data Binning
Nithish Raj
No ratings yet
Assignment 1: Aim: Preprocess Data Using Python. Objective
Document7 pages
Assignment 1: Aim: Preprocess Data Using Python. Objective
Abhinay Surve
No ratings yet
Bi Lesson 6
Document36 pages
Bi Lesson 6
calebgaichuhie254
No ratings yet
Data Pre Processing - NG
Document43 pages
Data Pre Processing - NG
Vatesh_Pasrija_9573
No ratings yet
BDA Class1
Document33 pages
BDA Class1
Neeraj Sivadas K
No ratings yet
Week 3
Document23 pages
Week 3
Muneeba Mehmood
No ratings yet
1.data Mining Functionalities
Document14 pages
1.data Mining Functionalities
Sai Deekshith
No ratings yet
UNIT-III Data Warehouse and Minig Notes MDU
Document42 pages
UNIT-III Data Warehouse and Minig Notes MDU
neha srivastava
No ratings yet
Data Preprocessing
Document33 pages
Data Preprocessing
Stephen Paul
No ratings yet
Unit 3 Data Warehouse
Document17 pages
Unit 3 Data Warehouse
Vanshika Chauhan
No ratings yet
Data Preprocessing
Document66 pages
Data Preprocessing
TuLbig E. Winnower
No ratings yet
DWM
Document14 pages
DWM
Sakshi Kulbhaskar
No ratings yet
Data Science2
Document7 pages
Data Science2
Kaushal
No ratings yet
Data Mining Process
Document2 pages
Data Mining Process
akash
No ratings yet
Data Mining Unit-1 Lect-4
Document49 pages
Data Mining Unit-1 Lect-4
Pooja Reddy
No ratings yet
Bit
Document4 pages
Bit
nithikuttan29
No ratings yet
What Is Data Preprocessing?
Document4 pages
What Is Data Preprocessing?
Gagandeep Singh
No ratings yet
1.2 - Data Processing
Document25 pages
1.2 - Data Processing
Ranveer Sehedeva
No ratings yet
Data Reduction Techniques
Document10 pages
Data Reduction Techniques
Vinjamuri Joshi Manohar
No ratings yet
Data Prep Roc Es
Document31 pages
Data Prep Roc Es
M sindhu
No ratings yet
Assignment 2
Document5 pages
Assignment 2
Dipankar Gogoi
No ratings yet
Down 2
Document61 pages
Down 2
pavunkumar
No ratings yet
r20 DWDM Unit 2 PART 2
Document15 pages
r20 DWDM Unit 2 PART 2
Chandhu Chodisetty
No ratings yet
Knowledge Discovery in Databases
Document17 pages
Knowledge Discovery in Databases
Sarvesh Dharme
No ratings yet
Data Preprocessing: Optimizing Data Quality and Structure for Effective Analysis and Machine Learning
From Everand
Data Preprocessing: Optimizing Data Quality and Structure for Effective Analysis and Machine Learning
Brian Murray
No ratings yet
Using Oracle Database Backup Service PDF
Document41 pages
Using Oracle Database Backup Service PDF
Alphani Baziro
No ratings yet
2022 Summer Model Answer Paper (Msbte Study Resources)
Document15 pages
2022 Summer Model Answer Paper (Msbte Study Resources)
temptaccforclg
No ratings yet
CH5 Stacks
Document60 pages
CH5 Stacks
Rewina zerou
No ratings yet
Payroll Balanceinit
Document13 pages
Payroll Balanceinit
tonismarg2014
No ratings yet
Linked List
Document17 pages
Linked List
gouse5815
No ratings yet
Linux Operating System
Document32 pages
Linux Operating System
anwar kadi
No ratings yet
For DM Quiz 3 PDF
Document212 pages
For DM Quiz 3 PDF
srini.eticala2614
No ratings yet
Oracle ADF Developer Guide
Document1,296 pages
Oracle ADF Developer Guide
api-26825735
No ratings yet
Chapter 9 Searching
Document47 pages
Chapter 9 Searching
aavashdai248
No ratings yet
Z9AMCORE-20-12-2012 Prog1: Data X Type I. Data y Type I. Data Z Type I
Document47 pages
Z9AMCORE-20-12-2012 Prog1: Data X Type I. Data y Type I. Data Z Type I
Kishore Dammavalam
No ratings yet
Database Management Systems Lab Assessment-3: Name: Atharv Kugaji REG NO:19BIT0347
Document15 pages
Database Management Systems Lab Assessment-3: Name: Atharv Kugaji REG NO:19BIT0347
Atharv Kugaji
100% (1)
OpenSAP Ds1 Week 1 Transcript
Document17 pages
OpenSAP Ds1 Week 1 Transcript
qwerty_qwerty_2009
No ratings yet
Snoflake DBT Fivetran Datasheet
Document2 pages
Snoflake DBT Fivetran Datasheet
anonymous corsair
No ratings yet
2021 10 19 15 27 34211 0
Document3 pages
2021 10 19 15 27 34211 0
sarif jonayed
No ratings yet
Chap 6
Document77 pages
Chap 6
api-27259648
No ratings yet
ClimsoftV4 User Manual Feb 2022
Document109 pages
ClimsoftV4 User Manual Feb 2022
papa babacar Diagne
No ratings yet
Introduction To DB Management System
Document22 pages
Introduction To DB Management System
Wad AlMashaikhi
No ratings yet
RuleLog Monitoring On 05AUG
Document8 pages
RuleLog Monitoring On 05AUG
hari vishnu
No ratings yet
Analisis Penentuan Harga Pokok Produksi Dengan Metode Full Costing Sebagai Dasar Penetapan Harga Jual Pada CV Salwa Meubel
Document12 pages
Analisis Penentuan Harga Pokok Produksi Dengan Metode Full Costing Sebagai Dasar Penetapan Harga Jual Pada CV Salwa Meubel
fitry hasdanita
No ratings yet
Interview Preparation Part-1
Document53 pages
Interview Preparation Part-1
Abdul Mateen Ukkund
No ratings yet
In A Database, A Deadlock Is A Situation in Which
Document6 pages
In A Database, A Deadlock Is A Situation in Which
Jennifer Decker
No ratings yet
Cara Mengatasi Hardisk Yang Tidak Terbaca
Document5 pages
Cara Mengatasi Hardisk Yang Tidak Terbaca
afif_wiludin
No ratings yet
Redp 5668
Document66 pages
Redp 5668
manas
No ratings yet
SQL Server Administration PDF
Document13 pages
SQL Server Administration PDF
alex
No ratings yet
Install Hadoop-2.6.0 On Windows10
Document10 pages
Install Hadoop-2.6.0 On Windows10
Denisson Fiaes
No ratings yet
REPEAT 1 Lessons From Migrating Oracle Databases To Amazon Aurora DAT342-R1 PDF
Document41 pages
REPEAT 1 Lessons From Migrating Oracle Databases To Amazon Aurora DAT342-R1 PDF
Joselito Carreran
No ratings yet
Robocopy and A Few Examples PDF
Document10 pages
Robocopy and A Few Examples PDF
FrancesHsieh
No ratings yet

Data Preprocessing Unit 2

Uploaded by

ac8198905

0% found this document useful (0 votes)

2 views3 pages

Original Title

Data preprocessing unit 2

Copyright

Available Formats

DOCX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as DOCX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as docx, pdf, or txt

0% found this document useful (0 votes)

2 views3 pages

Data Preprocessing Unit 2

Uploaded by

ac8198905

Copyright:

Available Formats

Download as DOCX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as docx, pdf, or txt

Jump to Page

You are on page 1of 3

Search inside document

Data preprocessing is an important process of data mining.

In this process, raw

data is converted into an understandable format and made ready for further
analysis. The motive is to improve data quality and make it up to mark for
specific tasks.

Tasks in Data Preprocessing

Data cleaning

Data cleaning help us remove inaccurate, incomplete and incorrect data from
the dataset. Some techniques used in data cleaning are −

Handling missing values

This type of scenario occurs when some data is missing.

 Standard values can be used to fill up the missing values in a manual way but only for a small
dataset.
 Attribute's mean and median values can be used to replace the missing values in normal and
non-normal distribution of data respectively.
 Tuples can be ignored if the dataset is quite large and many values are missing within a tuple.
 Most appropriate value can be used while using regression or decision tree algorithms

Noisy Data

Noisy data are the data that cannot be interpreted by machine and are
containing unnecessary faulty data. Some ways to handle them are −

 Binning − This method handle noisy data to make it smooth. Data gets divided equally and
stored in form of bins and then methods are applied to smoothing or completing the tasks.
The methods are Smoothing by a bin mean method(bin values are replaced by mean values),
Smoothing by bin median(bin values are replaced by median values) and Smoothing by bin
boundary(minimum/maximum bin values are taken and replaced by closest boundary values).
 Regression − Regression functions are used to smoothen the data. Regression can be
linear(consists of one independent variable) or multiple(consists of multiple independent
variables).
 Clustering − It is used for grouping the similar data in clusters and is used for finding
outliers.

Data integration

The process of combining data from multiple sources (databases,

spreadsheets,text files) into a single dataset. Single and consistent view of data
is created in this process. Major problems during data integration are Schema
integration(Integrates set of data collected from various sources), Entity
identification(identifying entities from different databases) and detecting and
resolving data values concept.

Data transformation

In this part, change in format or structure of data in order to transform the data
suitable for mining process. Methods for data transformation are −

Normalization − Method of scaling data to represent it in a specific smaller range(

-1.0 to 1.0)
Discretization − It helps reduce the data size and make continuous data divide
into intervals.

Attribute Selection − To help the mining process, new attributes are derived from
the given attributes.

Concept Hierarchy Generation − In this, the attributes are changed from lower level
to higher level in hierarchy.

Aggregation − In this, a summary of data gets stored which depends upon quality
and quantity of data to make the result more optimal.

Data reduction

It helps in increasing storage efficiency and reducing data storage to make the
analysis easier by producing almost the same results. Analysis becomes harder
while working with huge amounts of data, so reduction is used to get rid of that.

Steps of data reduction are −

Data Compression

Data is compressed to make efficient analysis. Lossless compression is when

there is no loss of data while compression. loss compression is when
unnecessary information is removed during compression.

Numerosity Reduction

There is a reduction in volume of data i.e. only store model of data instead of
whole data, which provides smaller representation of data without any loss of
data.

Dimensionality reduction

In this, reduction of attributes or random variables are done so as to make the

data set dimension low. Attributes are combined without losing its original
characteristics

Low Level Design
Document22 pages
Low Level Design
PArdeep Gorla
0% (1)
Data Preprocessing in Data Mining
Document4 pages
Data Preprocessing in Data Mining
Dhananjai Saini
No ratings yet
SQLMX Vs Oracle
Document49 pages
SQLMX Vs Oracle
Paul Chin
No ratings yet
Informatica Interview Questions and Answers PDF
Document3 pages
Informatica Interview Questions and Answers PDF
Ratul Dey
100% (1)
Unit 2 DWDM
Document14 pages
Unit 2 DWDM
brijendersinghkhalsa
No ratings yet
Major Issues in Data Mining
Document5 pages
Major Issues in Data Mining
Gaurav Jaiswal
No ratings yet
Data Mining
Document5 pages
Data Mining
Namra Sarfraz
No ratings yet
Term Paper
Document5 pages
Term Paper
Akash Sudan
No ratings yet
INTRODUCTION
Document9 pages
INTRODUCTION
Ashitha Ashi
No ratings yet
Lec 2 Preparing The Data
Document4 pages
Lec 2 Preparing The Data
Alia butt
No ratings yet
Major Issues in Data Mining
Document9 pages
Major Issues in Data Mining
Gaurav Jaiswal
No ratings yet
Unit 2: Big Data Analytics
Document45 pages
Unit 2: Big Data Analytics
Prabha Joshi
No ratings yet
Module 2
Document8 pages
Module 2
Sayan Majumder
No ratings yet
Module 2
Document42 pages
Module 2
hiremathsumith99
No ratings yet
Data Preprocessing
Document3 pages
Data Preprocessing
Im' Possible
No ratings yet
Unit 2
Document6 pages
Unit 2
Dakshkohli31 Kohli
No ratings yet
DWM Module 2
Document9 pages
DWM Module 2
sandriapgot
No ratings yet
Unit-3 Data Preprocessing
Document7 pages
Unit-3 Data Preprocessing
Khal Drago
100% (1)
Datawarehousing
Document10 pages
Datawarehousing
Harshit Jain
No ratings yet
Stages in Data Mining
Document11 pages
Stages in Data Mining
Yusuf mohammed
No ratings yet
Notes - Unit01 - Data Science and Big Data Analytics
Document7 pages
Notes - Unit01 - Data Science and Big Data Analytics
Atharva Gokhare
No ratings yet
U2L1
Document11 pages
U2L1
Sangita Hazra
No ratings yet
R Programming Unit-2
Document29 pages
R Programming Unit-2
padma
No ratings yet
DM&W File
Document18 pages
DM&W File
Prerna Rawal
No ratings yet
IV-cse DM Viva Questions
Document10 pages
IV-cse DM Viva Questions
Imtiyaz Ali
No ratings yet
Lecture Notes Data Mining Data Warehousing Unit-2: Data Preprocessing
Document3 pages
Lecture Notes Data Mining Data Warehousing Unit-2: Data Preprocessing
DrArun Kumar Choudhary
No ratings yet
UNIT - 2 .DataScience 04.09.18
Document53 pages
UNIT - 2 .DataScience 04.09.18
Raghavendra Rao
No ratings yet
Ques 1.give Some Examples of Data Preprocessing Techniques?: Assignment - DWDM Submitted By-Tanya Sikka 1719210284
Document7 pages
Ques 1.give Some Examples of Data Preprocessing Techniques?: Assignment - DWDM Submitted By-Tanya Sikka 1719210284
Sachin Chauhan
No ratings yet
Unit 2
Document9 pages
Unit 2
Vishnu
No ratings yet
Chương
Document12 pages
Chương
BẢO ĐẶNG THÁI
No ratings yet
Dw&bi PR2,3
Document6 pages
Dw&bi PR2,3
Dhanraj Deore
No ratings yet
Datamining Unit 2 Part2
Document11 pages
Datamining Unit 2 Part2
Bhasutkar Mahesh
No ratings yet
Unit 3 DW
Document19 pages
Unit 3 DW
pratapshivamsid
No ratings yet
Data Mining - Unit - 3
Document62 pages
Data Mining - Unit - 3
sunil star
No ratings yet
(M3S1) Data Analytics Framework
Document12 pages
(M3S1) Data Analytics Framework
nikkitaallycosme.48
No ratings yet
Normalization
Document35 pages
Normalization
Hrithik Reigns
No ratings yet
Unit - 2 Machine Learning
Document42 pages
Unit - 2 Machine Learning
Nishtha Singh
No ratings yet
Data Preprocessing
Document3 pages
Data Preprocessing
Sajid Hussain S
No ratings yet
Data Binning
Document9 pages
Data Binning
Nithish Raj
No ratings yet
Assignment 1: Aim: Preprocess Data Using Python. Objective
Document7 pages
Assignment 1: Aim: Preprocess Data Using Python. Objective
Abhinay Surve
No ratings yet
Bi Lesson 6
Document36 pages
Bi Lesson 6
calebgaichuhie254
No ratings yet
Data Pre Processing - NG
Document43 pages
Data Pre Processing - NG
Vatesh_Pasrija_9573
No ratings yet
BDA Class1
Document33 pages
BDA Class1
Neeraj Sivadas K
No ratings yet
Week 3
Document23 pages
Week 3
Muneeba Mehmood
No ratings yet
1.data Mining Functionalities
Document14 pages
1.data Mining Functionalities
Sai Deekshith
No ratings yet
UNIT-III Data Warehouse and Minig Notes MDU
Document42 pages
UNIT-III Data Warehouse and Minig Notes MDU
neha srivastava
No ratings yet
Data Preprocessing
Document33 pages
Data Preprocessing
Stephen Paul
No ratings yet
Unit 3 Data Warehouse
Document17 pages
Unit 3 Data Warehouse
Vanshika Chauhan
No ratings yet
Data Preprocessing
Document66 pages
Data Preprocessing
TuLbig E. Winnower
No ratings yet
DWM
Document14 pages
DWM
Sakshi Kulbhaskar
No ratings yet
Data Science2
Document7 pages
Data Science2
Kaushal
No ratings yet
Data Mining Process
Document2 pages
Data Mining Process
akash
No ratings yet
Data Mining Unit-1 Lect-4
Document49 pages
Data Mining Unit-1 Lect-4
Pooja Reddy
No ratings yet
Bit
Document4 pages
Bit
nithikuttan29
No ratings yet
What Is Data Preprocessing?
Document4 pages
What Is Data Preprocessing?
Gagandeep Singh
No ratings yet
1.2 - Data Processing
Document25 pages
1.2 - Data Processing
Ranveer Sehedeva
No ratings yet
Data Reduction Techniques
Document10 pages
Data Reduction Techniques
Vinjamuri Joshi Manohar
No ratings yet
Data Prep Roc Es
Document31 pages
Data Prep Roc Es
M sindhu
No ratings yet
Assignment 2
Document5 pages
Assignment 2
Dipankar Gogoi
No ratings yet
Down 2
Document61 pages
Down 2
pavunkumar
No ratings yet
r20 DWDM Unit 2 PART 2
Document15 pages
r20 DWDM Unit 2 PART 2
Chandhu Chodisetty
No ratings yet
Knowledge Discovery in Databases
Document17 pages
Knowledge Discovery in Databases
Sarvesh Dharme
No ratings yet
Data Preprocessing: Optimizing Data Quality and Structure for Effective Analysis and Machine Learning
From Everand
Data Preprocessing: Optimizing Data Quality and Structure for Effective Analysis and Machine Learning
Brian Murray
No ratings yet
Using Oracle Database Backup Service PDF
Document41 pages
Using Oracle Database Backup Service PDF
Alphani Baziro
No ratings yet
2022 Summer Model Answer Paper (Msbte Study Resources)
Document15 pages
2022 Summer Model Answer Paper (Msbte Study Resources)
temptaccforclg
No ratings yet
CH5 Stacks
Document60 pages
CH5 Stacks
Rewina zerou
No ratings yet
Payroll Balanceinit
Document13 pages
Payroll Balanceinit
tonismarg2014
No ratings yet
Linked List
Document17 pages
Linked List
gouse5815
No ratings yet
Linux Operating System
Document32 pages
Linux Operating System
anwar kadi
No ratings yet
For DM Quiz 3 PDF
Document212 pages
For DM Quiz 3 PDF
srini.eticala2614
No ratings yet
Oracle ADF Developer Guide
Document1,296 pages
Oracle ADF Developer Guide
api-26825735
No ratings yet
Chapter 9 Searching
Document47 pages
Chapter 9 Searching
aavashdai248
No ratings yet
Z9AMCORE-20-12-2012 Prog1: Data X Type I. Data y Type I. Data Z Type I
Document47 pages
Z9AMCORE-20-12-2012 Prog1: Data X Type I. Data y Type I. Data Z Type I
Kishore Dammavalam
No ratings yet
Database Management Systems Lab Assessment-3: Name: Atharv Kugaji REG NO:19BIT0347
Document15 pages
Database Management Systems Lab Assessment-3: Name: Atharv Kugaji REG NO:19BIT0347
Atharv Kugaji
100% (1)
OpenSAP Ds1 Week 1 Transcript
Document17 pages
OpenSAP Ds1 Week 1 Transcript
qwerty_qwerty_2009
No ratings yet
Snoflake DBT Fivetran Datasheet
Document2 pages
Snoflake DBT Fivetran Datasheet
anonymous corsair
No ratings yet
2021 10 19 15 27 34211 0
Document3 pages
2021 10 19 15 27 34211 0
sarif jonayed
No ratings yet
Chap 6
Document77 pages
Chap 6
api-27259648
No ratings yet
ClimsoftV4 User Manual Feb 2022
Document109 pages
ClimsoftV4 User Manual Feb 2022
papa babacar Diagne
No ratings yet
Introduction To DB Management System
Document22 pages
Introduction To DB Management System
Wad AlMashaikhi
No ratings yet
RuleLog Monitoring On 05AUG
Document8 pages
RuleLog Monitoring On 05AUG
hari vishnu
No ratings yet
Analisis Penentuan Harga Pokok Produksi Dengan Metode Full Costing Sebagai Dasar Penetapan Harga Jual Pada CV Salwa Meubel
Document12 pages
Analisis Penentuan Harga Pokok Produksi Dengan Metode Full Costing Sebagai Dasar Penetapan Harga Jual Pada CV Salwa Meubel
fitry hasdanita
No ratings yet
Interview Preparation Part-1
Document53 pages
Interview Preparation Part-1
Abdul Mateen Ukkund
No ratings yet
In A Database, A Deadlock Is A Situation in Which
Document6 pages
In A Database, A Deadlock Is A Situation in Which
Jennifer Decker
No ratings yet
Cara Mengatasi Hardisk Yang Tidak Terbaca
Document5 pages
Cara Mengatasi Hardisk Yang Tidak Terbaca
afif_wiludin
No ratings yet
Redp 5668
Document66 pages
Redp 5668
manas
No ratings yet
SQL Server Administration PDF
Document13 pages
SQL Server Administration PDF
alex
No ratings yet
Install Hadoop-2.6.0 On Windows10
Document10 pages
Install Hadoop-2.6.0 On Windows10
Denisson Fiaes
No ratings yet
REPEAT 1 Lessons From Migrating Oracle Databases To Amazon Aurora DAT342-R1 PDF
Document41 pages
REPEAT 1 Lessons From Migrating Oracle Databases To Amazon Aurora DAT342-R1 PDF
Joselito Carreran
No ratings yet
Robocopy and A Few Examples PDF
Document10 pages
Robocopy and A Few Examples PDF
FrancesHsieh
No ratings yet

Data Preprocessing Unit 2

Uploaded by

Copyright:

Available Formats

You might also like

Data Preprocessing Unit 2

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Data Preprocessing Unit 2

Uploaded by

Copyright:

Available Formats

Data preprocessing is an important process of data mining.

In this process, raw

Tasks in Data Preprocessing

Handling missing values

This type of scenario occurs when some data is missing.

The process of combining data from multiple sources (databases,

Normalization − Method of scaling data to represent it in a specific smaller range(

Steps of data reduction are −

Data is compressed to make efficient analysis. Lossless compression is when

In this, reduction of attributes or random variables are done so as to make the

You might also like