Welcome to Scribd!

Data Mining Techniques: By-Priyank Yadav CSE

Uploaded by

0% found this document useful (0 votes)

19 views8 pages

Data mining techniques are used to analyze large amounts of data and extract useful information to help with decision making. Some key techniques include association, which identifies patterns between items; classification, which categorizes data into classes based on attributes; and clustering, which groups similar data together. These techniques can be applied in bioinformatics to derive rules from large biological databases by techniques like association rule mining, classification using decision trees, and clustering.

Original Description:

Original Title

Copyright

Available Formats

PPTX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as pptx, pdf, or txt

0% found this document useful (0 votes)

19 views8 pages

Data Mining Techniques: By-Priyank Yadav CSE

Uploaded by

Sudhakar Tripathi

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as pptx, pdf, or txt

Jump to Page

You are on page 1of 8

Search inside document

Data Mining

techniques
By -
Priyank Yadav
CSE
What is data mining?
• With the enormous amount of data stored in files and repositories for
analysis, interpretation of data and extraction of useful information that
can help in decision making.
• Also called knowledge discovery in databases.
• Data mining is one of the crucial steps in the iterative knowledge
discovery process
Data mining techniques:-
There are number of techniques for data mining. Some of them have
been described as follows:

1) Association:
• Association is probably the most familiar data mining technique
known.
• Here you can make a simple correlation between two or more
items, often of the same type to identify patterns.
For example, when tracking people’s buying habits, you might identify
that a person always buys cream when they buy strawberries, and
therefore suggest that the next time that they buy strawberries they
might also want to buy cream.
2) Classification

• You can classification to build up an idea of the type of customer,

item, or object by describing multiple attributes to identify a
particular class.
For example, you can easily classify cars into different types(sedan,4X4
convertible) by identifying different attributes (number of seats, car
shape, color of the car). Given a new car, you might apply it into a
particular class by comparing the attributes with our known definition.
You can also apply the same principles to customers by classifying them
into age groups, incomes etc.
3) Clustering

• By examining one or more attributes or classes, you can group individuals

pieces of data together to form a structure opinion. At a simple level
clustering is using one or more attributes as your basis for identifying a
cluster of correlating results.
• Clustering is useful to identify different information because it correlates
with other examples so you can see where the similarities and ranges
agree.
Application of data mining techniques in bio-
informatics:
• Bioinformatics, an upcoming field in today’s world which involves use of
large databases can use data mining to derive useful rules.
• Based on the type of knowledge that is mined data mining techniques can
be classified into association rules, classification using decision tress and
clustering. Until recently, biology lacked the tools to analyze the large
repository of data such as the human genome database.
• The data mining techniques are used to extract meaningful relationships
from these data. Data mining is used in microarray analysis which is used
to study the activity of different cells under different conditions.
Two algorithms under each mining techniques may been studied here:
1. Association rule mining-a) apriori b)partition
2. Clustering a) k-means b) k-mediods
3. Classification –decision tree generation using a) gini-index b)entropy value
Genetic algorithms were be applied to association ,classification techniques.
K-means clustering and DBSCAN(density based spatial clustering of
application of noise) were applied to microarray dataset and compared.
Results:
1)For smaller databases, the apriori algorithm works better than partition
algorithm but for larger database partition works better.
2)With respect to the number of interchanges the k-mediods work better
than k-means
3)The results were similar for gini-index and entropy value.
• Bioinformatics involves the manipulation, searching and data mining of
DNA sequence data.
• Evolution of techniques have also helped in other fields like string search
algorithms, machine learning and database theory.

Ignition Tags
Document176 pages
Ignition Tags
vijikesh Arunagiri
No ratings yet
Unit 1 - Big Data Technologies
Document89 pages
Unit 1 - Big Data Technologies
prakash N
No ratings yet
1.1what Is Data Mining?: Gallop
Document64 pages
1.1what Is Data Mining?: Gallop
Nelli Harshitha
No ratings yet
Data Mining Implementation
Document9 pages
Data Mining Implementation
akhmad faiz al khairi
No ratings yet
III CS Datamining - Unlocked
Document68 pages
III CS Datamining - Unlocked
Jana Jana
No ratings yet
Data Mining and Its Techniques: A Review Paper: Maria Shoukat (MS Student)
Document7 pages
Data Mining and Its Techniques: A Review Paper: Maria Shoukat (MS Student)
mariashoukat
No ratings yet
DWDM Unit 2
Document46 pages
DWDM Unit 2
sri charan
No ratings yet
BCA-404: Data Mining and Data Ware Housing
Document19 pages
BCA-404: Data Mining and Data Ware Housing
efwewef
No ratings yet
Sequential Pattern Mining: A Survey
Document27 pages
Sequential Pattern Mining: A Survey
Nengnya Kang Mas
No ratings yet
Notes Module 2
Document28 pages
Notes Module 2
Tejaswini Girish
No ratings yet
Unit 3 DW
Document19 pages
Unit 3 DW
pratapshivamsid
No ratings yet
Datamining
Document18 pages
Datamining
api-19626062
No ratings yet
Data Mining and Warehousing-1
Document43 pages
Data Mining and Warehousing-1
Vijay Kumar Saini
No ratings yet
Data Mining Questions
Document24 pages
Data Mining Questions
mahi
No ratings yet
Why We Need Data Mining?
Document39 pages
Why We Need Data Mining?
Bhanu Royce
No ratings yet
Why Data Mining
Document5 pages
Why Data Mining
Muhammad Tehseen Qureshi
No ratings yet
What Is Data Mining Again?: Unsuspected Relationships Summarize Understandable and Useful Models
Document29 pages
What Is Data Mining Again?: Unsuspected Relationships Summarize Understandable and Useful Models
Joseph Conteh
No ratings yet
DM Module1
Document15 pages
DM Module1
Shubhi Srivastava
No ratings yet
Data Mining Concepts and Applications: Six Factors Behind The Sudden Rise in Popularity of Data Mining
Document36 pages
Data Mining Concepts and Applications: Six Factors Behind The Sudden Rise in Popularity of Data Mining
Ongudi Tiberius
No ratings yet
LECTURE NOTES ON DATA MINING and DATA WA
Document84 pages
LECTURE NOTES ON DATA MINING and DATA WA
Ali Azfar
No ratings yet
Data Mining & Business Intelligence
Document69 pages
Data Mining & Business Intelligence
Aditi Anand Shetkar
No ratings yet
Unit 3 Data Mining
Document21 pages
Unit 3 Data Mining
badaltanwarr
No ratings yet
Data Mining
Document8 pages
Data Mining
Aparna Aparna
No ratings yet
Datamining With Big Data - Siva
Document69 pages
Datamining With Big Data - Siva
Venkatesh Gardas
No ratings yet
HaftamuA ArticleReview
Document39 pages
HaftamuA ArticleReview
znabugrmay20adi
No ratings yet
DMW UNIT 1 Pessondranath
Document29 pages
DMW UNIT 1 Pessondranath
2344Atharva Patil
No ratings yet
Data Mining
Document20 pages
Data Mining
NITIN KALRA
No ratings yet
Unit 1
Document14 pages
Unit 1
Ayush Joshiya
No ratings yet
Chapter 11 2 Applications and Trends in Data Mining
Document2 pages
Chapter 11 2 Applications and Trends in Data Mining
bharathimanian
No ratings yet
Whats App
Document23 pages
Whats App
Râjä Sékhãr
No ratings yet
Data Mining
Document87 pages
Data Mining
Megha Shenoy
No ratings yet
BDA Class1
Document33 pages
BDA Class1
Neeraj Sivadas K
No ratings yet
Unit 4 New Database Applications and Environments: by Bhupendra Singh Saud
Document14 pages
Unit 4 New Database Applications and Environments: by Bhupendra Singh Saud
Anoo Shrestha
No ratings yet
Data Mining Answer Key
Document10 pages
Data Mining Answer Key
Rishabh Tiwari
No ratings yet
Suni
Document104 pages
Suni
saitej
No ratings yet
Chandrakanth
Document64 pages
Chandrakanth
Suresh Dhamathoti
No ratings yet
Data Mining Questions
Document7 pages
Data Mining Questions
Pritam Saha
No ratings yet
DWDM R13 Unit 1 PDF
Document10 pages
DWDM R13 Unit 1 PDF
indira
No ratings yet
1.1 Introduction To Data Mining: 1.1.1 Moving Toward The Information Age
Document14 pages
1.1 Introduction To Data Mining: 1.1.1 Moving Toward The Information Age
Songa Sowjanya
No ratings yet
Annotating Full Document
Document48 pages
Annotating Full Document
kalyan
No ratings yet
Book Exercises NayelliAnswers
Document3 pages
Book Exercises NayelliAnswers
Nayelli Valeria Pc
No ratings yet
Soln 1
Document6 pages
Soln 1
Fritzie West
100% (1)
Recommender System - Module 2 - Data Mining Techniques in Recommender System
Document58 pages
Recommender System - Module 2 - Data Mining Techniques in Recommender System
DainikMitra
No ratings yet
Recommender System - Module 2 - Data Mining Techniques in Recommender System
Document58 pages
Recommender System - Module 2 - Data Mining Techniques in Recommender System
DainikMitra
No ratings yet
DWDM R19 Unit 1
Document27 pages
DWDM R19 Unit 1
GAYATHRI KAMMARA 19MIS7006
No ratings yet
Data Mining and Data Warehousing
Document47 pages
Data Mining and Data Warehousing
asd
No ratings yet
Chapter 3: Data Mining
Document20 pages
Chapter 3: Data Mining
shreya
No ratings yet
ML Lect1
Document51 pages
ML Lect1
physics lover
100% (1)
Intro To Data Minning
Document24 pages
Intro To Data Minning
Akshay Mathur
No ratings yet
Data Mining and Warehousing
Document29 pages
Data Mining and Warehousing
Ayesha Waris
No ratings yet
DataWarehouseMining Complete Notes
Document55 pages
DataWarehouseMining Complete Notes
Safee Khan
No ratings yet
CS2032 2 Marks & 16 Marks With Answers
Document30 pages
CS2032 2 Marks & 16 Marks With Answers
Thiyagarajan Ganesan
100% (1)
CS1004 DWM 2marks 2013
Document22 pages
CS1004 DWM 2marks 2013
karthickamsec
No ratings yet
DWDMunit 2
Document27 pages
DWDMunit 2
Gopl Kuppa
No ratings yet
DM-Model Question Paper Solutions
Document27 pages
DM-Model Question Paper Solutions
csumant94
No ratings yet
Difference Between Data Mining and Query Tools
Document6 pages
Difference Between Data Mining and Query Tools
excitekarthik
100% (1)
Unit 3: by Dr. Anand Vyas
Document20 pages
Unit 3: by Dr. Anand Vyas
Prince Singh
No ratings yet
What Is Data Mining?
Document17 pages
What Is Data Mining?
GODDU NAVVEN BABU
No ratings yet
Unit III Data Mining Techniques
Document17 pages
Unit III Data Mining Techniques
Ajit Raut
No ratings yet
Image Retrieval: Unlocking the Power of Visual Data
From Everand
Image Retrieval: Unlocking the Power of Visual Data
Fouad Sabry
No ratings yet
Image Retrieval: Fundamentals and Applications
From Everand
Image Retrieval: Fundamentals and Applications
Fouad Sabry
No ratings yet
CIS527: Data Warehousing, Filtering, and Mining: Fall 2004, CIS, Temple University
Document50 pages
CIS527: Data Warehousing, Filtering, and Mining: Fall 2004, CIS, Temple University
Sudhakar Tripathi
No ratings yet
Concepts and Techniques: Data Mining
Document58 pages
Concepts and Techniques: Data Mining
Sudhakar Tripathi
No ratings yet
Concepts and Techniques: - Chapter 3
Document63 pages
Concepts and Techniques: - Chapter 3
Sudhakar Tripathi
No ratings yet
02data (Compatibility Mode)
Document11 pages
02data (Compatibility Mode)
Sudhakar Tripathi
No ratings yet
Protein Classification Using Hybrid Feature Selection Technique
Document9 pages
Protein Classification Using Hybrid Feature Selection Technique
Sudhakar Tripathi
No ratings yet
A New Method For Key Author Analysis in Research Professionals' Collaboration Network
Document11 pages
A New Method For Key Author Analysis in Research Professionals' Collaboration Network
Sudhakar Tripathi
No ratings yet
Manasa - SQL DBA
Document6 pages
Manasa - SQL DBA
iteam INC
No ratings yet
College Information System Bca
Document91 pages
College Information System Bca
Prints Bindings
No ratings yet
c04 En2301en00en 0001
Document358 pages
c04 En2301en00en 0001
Illich Rosario
No ratings yet
"Milk Dairy Management": Project Report ON
Document35 pages
"Milk Dairy Management": Project Report ON
Ankit Bhagat
No ratings yet
Yash Agarwal: Personal Info
Document1 page
Yash Agarwal: Personal Info
Atul Avhad
No ratings yet
Akshaya - 3+ Years Exp - SQL SERVER DBA - CV
Document3 pages
Akshaya - 3+ Years Exp - SQL SERVER DBA - CV
Dhanashree Hiwase
No ratings yet
Rehema School Prefects Electorol System
Document51 pages
Rehema School Prefects Electorol System
Daniel Wachira
No ratings yet
Form Three Term 3
Document8 pages
Form Three Term 3
cmukhongo_679153453
No ratings yet
Lecture 3 - Introduction To Apache Spark - 1691899519972
Document67 pages
Lecture 3 - Introduction To Apache Spark - 1691899519972
Manish049
No ratings yet
COMP551 Fall 2020 P1
Document4 pages
COMP551 Fall 2020 P1
Alain
No ratings yet
Seminar Report Format
Document19 pages
Seminar Report Format
Shahnawaz Sheikh
No ratings yet
What Is Sub Query? Explain The Properties of Sub Query. - Google Search
Document5 pages
What Is Sub Query? Explain The Properties of Sub Query. - Google Search
shubham sharma
No ratings yet
PLSQL 14 2 SG
Document31 pages
PLSQL 14 2 SG
Andrei Vulpe
No ratings yet
Practical 1: Aim: Creating The PHP Page. Source Code
Document51 pages
Practical 1: Aim: Creating The PHP Page. Source Code
Zeba Pathan
No ratings yet
A Micro-Project Report ON: "Latest ATM Security''
Document19 pages
A Micro-Project Report ON: "Latest ATM Security''
Kashyap Pathak
No ratings yet
SqlEssentials-Learning Plan
Document6 pages
SqlEssentials-Learning Plan
JayaAdityan
No ratings yet
ERP MCQs - Module 1
Document13 pages
ERP MCQs - Module 1
MD Rehan
No ratings yet
The Definitive Guide To Data Classification
Document38 pages
The Definitive Guide To Data Classification
Teddy Sukardi
No ratings yet
CHAPTER 6 - Relational Database and SQL
Document22 pages
CHAPTER 6 - Relational Database and SQL
Marc Geoffrey Habab
No ratings yet
Informatica Best Practices
Document28 pages
Informatica Best Practices
zipzapdhoom
No ratings yet
Data Analytics Resources - Jupyter Notebook-3
Document10 pages
Data Analytics Resources - Jupyter Notebook-3
kazifaisal41
No ratings yet
M.S. Degree Examination, May 2020: Total No. of Pages
Document3 pages
M.S. Degree Examination, May 2020: Total No. of Pages
Manokaran Ramalingam
No ratings yet
BI - Lecture 3 - Kimball Concepts
Document44 pages
BI - Lecture 3 - Kimball Concepts
Shehroz Chishty
No ratings yet
Business Intelligence/Data Integration/Etl/Integration: An Introduction Presented By: Chandrashekar P
Document40 pages
Business Intelligence/Data Integration/Etl/Integration: An Introduction Presented By: Chandrashekar P
Carl Cj
No ratings yet
COMM 215 Chapter 1 COMM 215 Chapter 1
Document6 pages
COMM 215 Chapter 1 COMM 215 Chapter 1
ArianaCojocaru
No ratings yet
System Administration
Document21 pages
System Administration
souad
No ratings yet
RDB2RDF: Completed Transformation From Relational Database Into RDF Ontology
Document7 pages
RDB2RDF: Completed Transformation From Relational Database Into RDF Ontology
Pham Thi Thu Thuy
No ratings yet
International Standard: Iso/Iec 9075-2
Document28 pages
International Standard: Iso/Iec 9075-2
Carlos
No ratings yet
Building Rest Apis With Flask: Create Python Web Services With Mysql
Document10 pages
Building Rest Apis With Flask: Create Python Web Services With Mysql
Troll Troll
No ratings yet